JP2009211281A - Propagation structure extraction device, method and program, and computer-readable recording medium - Google Patents
Propagation structure extraction device, method and program, and computer-readable recording medium Download PDFInfo
- Publication number
- JP2009211281A JP2009211281A JP2008052152A JP2008052152A JP2009211281A JP 2009211281 A JP2009211281 A JP 2009211281A JP 2008052152 A JP2008052152 A JP 2008052152A JP 2008052152 A JP2008052152 A JP 2008052152A JP 2009211281 A JP2009211281 A JP 2009211281A
- Authority
- JP
- Japan
- Prior art keywords
- article
- blog
- link information
- comment
- trackback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体に係り、特に、インターネット上のブログやソーシャルネットワーキングサービス(SNS)において、個人が発信する記事がどのように閲覧者に影響を与えたか、あるいはどのように影響を受けて発信されたのか、伝播構造を提示することにより把握可能とする伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体関する。 The present invention relates to a propagation structure extraction apparatus and method, a program, and a computer-readable recording medium. In particular, in a blog or social networking service (SNS) on the Internet, how an article sent by an individual affects a viewer. The present invention relates to a propagation structure extraction apparatus and method, a program, and a computer-readable recording medium that can be grasped by presenting a propagation structure.
詳しくは、特定のキーワードを含む記事が読み手に影響を与えた伝播構造を、記事と該記事が含まれるブログサイトの他記事に送信されたコメント及びトラックバックを分析することにより抽出する伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体に関する。 Specifically, a propagation structure extraction device that extracts a propagation structure that an article including a specific keyword has influenced readers by analyzing an article and comments and trackbacks transmitted to other articles in the blog site that includes the article. And a method, a program, and a computer-readable recording medium.
ブログサービスやSNSの普及により、誰でも容易に情報発信を行えるようになってきている。発信される記事には、日々の日常生活ついての記載も多く、製品やサービスを利用した体験・評価なども含まれている。発信された記事に対して閲覧者がコメントを付与することで、記事に対する感想を発信者に知らせることができる。また、ブログサービスにおいては、ある記事を参考にして記事を書いた場合にトラックバック機能により参考にした記事へ通知をすることができる。そこで、製品やサービスについてのクチコミ情報が記載された記事に付与されたコメントやトラックバックを分析することにより、クチコミが閲覧者に与えた影響の伝播経路や範囲などを抽出することが可能となる。 With the widespread use of blog services and SNSs, anyone can easily send information. The published articles often contain descriptions of daily life and include experiences and evaluations using products and services. By giving a comment to the sent article, the viewer can be notified of the impression of the article. In the blog service, when an article is written with reference to an article, the trackback function can notify the article referred to. Therefore, by analyzing comments and trackbacks given to articles in which word-of-mouth information about products and services is described, it is possible to extract the propagation path and range of the influence of word-of-mouth on viewers.
従来技術として、ブログコミュニティを対象に、コメント、トラックバックの情報からコミュニティに関する情報を収集する技術がある(例えば、特許文献1参照)。
しかしながら、上記の従来の技術は、コメント送信元のブログに属する記事の収集、トラックバック送信元の記事の収集を順次実施するものであり、収集したデータから、記事からの伝播やブログ間の繋がりを抽出し、可視化する手法について考慮されていない。そのため、ユーザが指定した記事の影響について、記事を順に辿りながら伝播構造を抽出する必要があり、伝播構造を表示するまでに時間が掛かるという問題がある。 However, the above conventional technology sequentially collects articles belonging to the blog of the comment sender and collects articles of the trackback sender, and from the collected data, it propagates from the article and links between the blogs. It does not consider the method of extracting and visualizing. Therefore, it is necessary to extract the propagation structure while sequentially tracing the articles with respect to the influence of the article specified by the user, and there is a problem that it takes time to display the propagation structure.
また、普段から親しくコミュニケーションをしているユーザ間においては、影響を受けた記事に必ずしもコメント送信やトラックバック送信を行わない場合がある。例えば、ユーザAが「○○を購入してみたけれど、とっても使い心地がよくってお勧め!」といった○○という商品についての記事を掲載し、それを閲覧したユーザBが後日自分のブログに「先日、友人が紹介していた○○を買っちゃいました。」といった記事を書いた場合が考えられる。この場合、ユーザAの○○商品についての記事にユーザBからのコメント・トラックバックがなくても、別の記事に対してコメントやトラックバックを送信していれば、ユーザAとユーザBがコミュニケーションしていることを発見することができ、さらに、特定のキーワード○○が両者の記事に含まれていることが分かると、どちらかの記事から影響を受けた可能性を発見することができる。 In addition, among users who are in close communication with each other, comments and trackbacks may not always be sent to affected articles. For example, user A posted an article about a product called XX such as “I bought XX, but it ’s very comfortable and recommended!” And user B who viewed it posted it on his blog at a later date. You may have written an article such as “I bought a XX that my friend introduced the other day”. In this case, even if there is no comment / trackback from the user B in the article about the user A's XX product, the user A and the user B communicate with each other if a comment or trackback is transmitted to another article. In addition, if it is found that a specific keyword XX is included in both articles, the possibility of being influenced by either article can be discovered.
図16の(A)にブログサイト、記事、コメント、トラックバックの関係の例を示している。コメントは記事に対して送信される情報で、コメント送信者はブログサイトを持っている場合(ユーザBからユーザAの記事cへのコメント)と、ブログサイトを持っていない場合、あるいは、ブログサイトのURLを明記しないでコメントする場合(ユーザDからユーザAの記事dへのコメント)がある。トラックバックは記事から記事に対して送信される情報であり、ユーザCの記事aからユーザAの記事dへ送信された例が示されている。コメントはブログサイトをもっていなくとも送信できるが、トラックバックはブログサイトを持っているユーザ間でのみ発生する。 FIG. 16A shows an example of the relationship between a blog site, an article, a comment, and a trackback. A comment is information transmitted to an article, and a comment sender has a blog site (a comment from user B to user A's article c), a blog site, or a blog site There is a case of commenting without clearly specifying the URL (comment from user D to article d of user A). The trackback is information transmitted from the article to the article, and an example of the information transmitted from the article a of the user C to the article d of the user A is shown. Comments can be sent without a blog site, but trackbacks occur only between users who have blog sites.
図16(A)のような関係があった場合に、ユーザAの記事dから伝播構造を図示した例を図16(B)に示している。コメント送信を実線の矢印、トラックバック送信を点線の矢印で、キーワード○○を含む場合は梨地で示している。ここで、記事aのノードとユーザCのブログサイトのノードが別々に描かれている点に着目する。実際には記事aは、ユーザCのブログサイトに含まれる記事であるから、1つのノードとして表示されるのが望ましい。しかし、ユーザCのブログサイトとしてのみ表示すると、トラックバックを送信した記事Cの存在が隠れてしまう。トラックバックは記事間の繋がりとして大変重要な情報であるから、トラックバックを送信した記事をノードとして表示し、コメント送信を付加情報として追加する方が望ましい。コメントとトラックバックの送信者が同一であるかを調べるためには、コメント情報とトラックバック情報にブログサイトのURL等を保存し、その値が同一であるかを調べる必要がある。 FIG. 16B shows an example illustrating the propagation structure from the article d of the user A when there is a relationship as shown in FIG. Comment transmission is indicated by a solid line arrow, trackback transmission is indicated by a dotted line arrow, and keywords XX are indicated by satin. Here, attention is paid to the point that the node of the article a and the node of the blog site of the user C are drawn separately. Actually, since the article a is an article included in the blog site of the user C, it is desirable to display it as one node. However, if it is displayed only as the blog site of the user C, the existence of the article C that transmitted the trackback is hidden. Since trackback is very important information as a link between articles, it is desirable to display the article that transmitted the trackback as a node and add comment transmission as additional information. In order to check whether the comment and the trackback sender are the same, it is necessary to store the URL of the blog site in the comment information and the trackback information and check whether the values are the same.
また、コメント送信者のURLが不明でコメント送信者の名前が分かっている場合、同じブログサイト内においては、コメント送信者名が同じであれば同一人物として考えてよく、この点についても考慮してグラフを作成する必要がある。 Also, if the URL of the comment sender is unknown and the name of the comment sender is known, it may be considered as the same person within the same blog site as long as the comment sender name is the same. It is necessary to create a graph.
さらに、ユーザBは普段からユーザAとコミュニケーションがあり、記事fにおいて、キーワード○○について記載していても、記事dに対してコメントやトラックバック送信を行っていないため、繋がりを見ることができないという問題がある。 Furthermore, the user B usually communicates with the user A, and even if the keyword f is described in the article f, the connection cannot be seen because the comment or the trackback transmission is not performed on the article d. There's a problem.
本発明は、上記の点に鑑みなされたもので、ユーザから指定されたキーワードが含まれている記事の表示と含まれていない記事の表示を区別でき、また、記事からだけのつながりでは見つけることのできないユーザ間の繋がりを表示することが可能な伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体を提供することを目的とする。 The present invention has been made in view of the above points, and can distinguish between the display of an article that includes a keyword specified by the user and the display of an article that is not included, and can be found only by connection from an article. It is an object of the present invention to provide a propagation structure extraction apparatus and method, a program, and a computer-readable recording medium capable of displaying a connection between users who cannot perform the operation.
図1は、本発明の原理構成図である。 FIG. 1 is a principle configuration diagram of the present invention.
本発明(請求項1)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出装置であって、
収集された記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段11に格納し、コメントやトラックバックの情報をコメント・トラックバック記憶手段に格納する記事解析手段30と、
記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段40と、
記事からのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段14に格納する記事リンク情報抽出手段13−1と、
同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段14に格納するブログリンク情報抽出手段13−2と、
ある一つの記事を起点とした伝播構造をリンク情報記憶手段14から取得して表示する記事伝播表示手段15−1と、
ブログサイトを基点とした伝播構造をリンク情報記憶手段14から取得して表示するブログ伝播表示手段15−2と、
記事伝播表示手段15−1からブログ伝播表示手段15−2に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段15−3と、を有する。
The present invention (Claim 1) is a propagation structure extraction device that analyzes the influence of a blog on the Internet or an article of a social networking service on a viewer,
An article identifier for uniquely identifying the article by analyzing the collected article and a blog identifier for uniquely identifying the blog site to which the article belongs are assigned to the article and stored in the article information storage means 11 for comments and trackbacks. Article analysis means 30 for storing the information in the comment / trackback storage means,
A recursive collection unit that identifies a blog site as a transmission source when a comment is transmitted to an article, collects articles belonging to the blog site, and collects an article as a trackback source when a trackback is transmitted 40,
An article link information extracting unit 13-1 that extracts a comment from an article or a link (link information) by a trackback and stores it in the link
A blog link information extracting unit 13-2 that collects articles belonging to the same blog site and extracts a link (link information) by a comment or a trackback from the blog site and stores the link information in the link
Article propagation display means 15-1 for obtaining and displaying a propagation structure starting from a certain article from the link information storage means 14,
Blog propagation display means 15-2 for obtaining and displaying the propagation structure based on the blog site from the link information storage means 14,
When switching from the article propagation display means 15-1 to the blog propagation display means 15-2, there is provided a switching display means 15-3 starting from a blog site including an article starting from the article propagation display means.
また、本発明(請求項2)は、記事解析手段30において、
記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段12に格納する手段を含む。
Further, the present invention (Claim 2) is provided in the article analysis means 30.
When a comment is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, at least one of a comment sender name or a comment sender URL, If there is a comment sender URL, it is checked whether it is the URL of the blog site. If it is the URL of the blog site, a blog identifier that uniquely identifies the blog site is stored in the comment / trackback storage means 12 as comment information. Including means.
また、本発明(請求項3)は、記事解析手段30において、
記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段12に格納する手段を含む。
Further, the present invention (Claim 3) is the article analysis means 30,
When a trackback is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, an article identifier of a trackback transmission source, a blog identifier, an article URL, a blog One or more pieces of information that can be acquired in the URL and the blog title are stored in the comment /
また、本発明(請求項4)は、記事リンク情報抽出手段13−1において、
コメント・トラックバック記憶手段12に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成する手段と、
ブログURLが不明のコメント情報は、ブログ送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成する手段と、
生成した全ての記事リンク情報をリンク情報記憶手段14に格納する手段と、を含む。
The present invention (Claim 4) is the article link information extracting means 13-1,
Based on the trackback information stored in the comment / trackback storage means 12, article link information is generated with the trackback received article as the reference article, the trackback transmission article as the connected article, and the comment information set transmitted to the reference article If the blog identifier of the comment sender is included in the generated article link information, the new article link information is not generated and the number of received comments is added to the existing article link information. If not included, the article consists of the article identifier of the article that received the comment, the blog identifier, the blog identifier of the comment sender, the comment sender name and / or the URL of the comment sender, and the number of comments. Means for generating link information;
Comment information with an unknown blog URL is determined to be the same if the blog sender name is the same, and the number of comments is added to the existing article link information. Means for generating;
Means for storing all the generated article link information in the link information storage means 14.
また、本発明(請求項5)は、記事伝播表示手段15−1において、
起点となる記事とコメントまたはトラックバックを辿る段数が入力されると、リンク情報記憶手段14の記事リンク情報を参照し、入力された該段数に達するまで順次記事リンク情報を検索し、検索された全ての記事リンク情報において、記事からの伝播を表すグラフを生成し、ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む。
Further, the present invention (claim 5) is the article propagation display means 15-1,
When the starting article and the number of steps following the comment or trackback are input, the article link information in the link information storage means 14 is referred to, and the article link information is sequentially searched until the input number of stages is reached. The article link information includes a means for generating a graph representing propagation from the article and displaying the case where the node includes a specific keyword and the case where the node does not include the specific keyword.
また、本発明(請求項6)は、ブログリンク情報抽出手段13−2において、
コメント・トラックバック記憶手段12に格納されたコメント情報とトラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでブログ送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成する手段と、
生成した全てのブログリンク情報をリンク情報記憶手段に格納する手段と、を含む。
Further, the present invention (Claim 6) is the blog link information extracting means 13-2.
Based on the comment information stored in the comment / trackback storage means 12 and the blog identifier of the trackback information, two blog identifiers having at least one connection between the comment and the trackback, the number of comments transmitted and received, the number of tracksback transmitted and received If the blog identifier is the same as the blog identifier that received the comment and the blog sender name is the same, the existing blog link information A means of adding comments and generating new blog link information if it does not exist,
Means for storing all the generated blog link information in the link information storage means.
また、本発明(請求項7)は、ブログ伝播表示手段15−2において、
起点となるブログとコメントまたはトラックバックを辿る段数が入力されると、リンク情報記憶手段のブログリンク情報を参照し、入力された段数に達するまで順次ブログリンク情報を検索し、検索された全てのブログリンク情報において、ブログをノード、ブログ間のつながりをエッジとするグラフを生成し、該ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む。
Further, the present invention (Claim 7) is provided in the blog propagation display means 15-2.
When the starting blog and the number of steps to follow the comment or trackback are input, the blog link information in the link information storage means is referenced, and the blog link information is sequentially searched until the input number of steps is reached. The link information includes a means for generating a graph having a blog as a node and a connection between blogs as an edge, and displaying the node in a case where the node includes a specific keyword and a case in which the node does not include the specific keyword.
図2は、本発明の原理を説明するための図である。 FIG. 2 is a diagram for explaining the principle of the present invention.
本発明(請求項8)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する装置における伝播構造抽出方法であって、
記事解析手段が、収集された記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し(ステップ1)、コメントやトラックバックの情報をコメント・トラックバック記憶手段に格納する記事解析ステップ(ステップ2)と、
再帰収集手段が、記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップ(ステップ3)と、
記事リンク情報抽出手段が、記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップ(ステップ4)と、
記事伝播表示手段が、ある一つの記事を起点とした伝播構造をリンク情報記憶手段から取得して表示する記事伝播表示ステップ(ステップ5)と、
ブログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段に格納するブログリンク情報抽出ステップ(ステップ6)と、
ブログ伝播表示手段が、ブログサイトを基点とした伝播構造をリンク情報記憶手段から取得して表示するブログ伝播表示ステップ(ステップ7)と、
切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップ(ステップ8)と、を行う。
The present invention (Claim 8) is a method for extracting a propagation structure in an apparatus for analyzing the influence of a blog on the Internet or an article of a social networking service on a viewer,
The article analysis means analyzes the collected articles and assigns an article identifier for uniquely identifying the article and a blog identifier for uniquely identifying the blog site to which the article belongs to the article, and stores the article identifier in the article information storage means. (Step 1), an article analysis step (Step 2) for storing comments and trackback information in the comment / trackback storage means;
When a comment is transmitted to an article, the recursive collection means identifies a blog site as a transmission source, collects articles belonging to the blog site, and when a trackback is transmitted, selects the article as the trackback source. A recursive collection step (step 3) to collect;
Article link information extraction means stores an article link information extraction step (step 4) in which a link from the article or a link by link back (link information) is stored in the link information storage means;
An article propagation display step (step 5) in which the article propagation display means acquires and displays the propagation structure starting from a certain article from the link information storage means;
The blog link information extracting means extracts the links (link information) by comments or trackbacks from the blog site by collecting articles belonging to the same blog site, and stores them in the link information storage means (step 6). When,
A blog propagation display step (step 7) in which the blog propagation display means acquires and displays the propagation structure based on the blog site from the link information storage means;
When the switching display means switches from the article propagation display to the blog propagation display, a switching display step (step 8) starting from the blog site including the article starting from the article propagation display step is performed.
本発明(請求項9)は、請求項1乃至7のいずれか1項に記載の伝播構造抽出装置を構成する各手段としてコンピュータを機能させるための伝播構造抽出プログラムである。 The present invention (Claim 9) is a propagation structure extraction program for causing a computer to function as each means constituting the propagation structure extraction apparatus according to any one of Claims 1 to 7.
本発明(請求項10)は、請求項9記載の伝播構造抽出プログラムを格納したコンピュータ読み取り可能な記録媒体である。 The present invention (Claim 10) is a computer-readable recording medium storing the propagation structure extraction program according to Claim 9.
上述のように、本発明では、予め記事に対して送信されたコメント・トラックバック情報から記事リンク情報を抽出し、ブログ間のコメント・トラックバック情報を纏めたブログリンク情報を抽出し、ユーザから特定のキーワードを含む記事が指定された際に、該記事と直接的繋がり(該記事にトラックバックを送信している記事や、コメントを送信している送信者との繋がり)を一覧するグラフを素早く表示することが可能となる。 As described above, in the present invention, the article link information is extracted from the comment / trackback information transmitted in advance with respect to the article, the blog link information that summarizes the comments / trackback information between the blogs is extracted, and the user specifies the specific information. When an article that includes a keyword is specified, a graph that lists direct links to the article (articles that send trackbacks to the article and connections to senders who send comments) is quickly displayed. It becomes possible.
また、記事に直接コメントやトラックバックをしていない場合でも、ブログ間のリンク情報とキーワードの有無を同時に表示することにより、伝播の概観を掴むことができ、記事からの伝播では発見できない繋がりを見つけることが可能となる。 Even if you don't comment or track back directly on an article, you can get an overview of propagation by displaying the link information between blogs and the presence of keywords at the same time, and find connections that can't be found by propagation from articles It becomes possible.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図3は、本発明の一実施の形態における伝播構造抽出装置の構成を示す。 FIG. 3 shows the configuration of the propagation structure extraction apparatus according to an embodiment of the present invention.
伝播構造抽出装置は、記事情報蓄積部11、コメント・トラックバック蓄積部12、リンク情報抽出部13、リンク情報蓄積部14、伝播表示部15、検索部16、記事収集部20、記事解析部30、再帰収集指示部40、インタフェース部50から構成される。
The propagation structure extraction device includes an article information storage unit 11, a comment / trackback
以下、図4のシーケンスチャートに沿って、伝播構造抽出装置の各構成要素の動作を説明する。 Hereinafter, the operation of each component of the propagation structure extracting apparatus will be described with reference to the sequence chart of FIG.
記事収集部20は、収集するための記事URLのリストを入力とし、記事URLリストに記載された記事URLを順次収集し(ステップ101)、収集したHTMLテキストを出力する(ステップ102)。
The
記事解析部30は、記事収集部20から受け取ったHTMLテキストを解析し、記事を一意に識別する記事識別子と記事を含むブログサイトを一意に識別するブログ識別子を該記事に付与して、記事情報蓄積部11に格納する(ステップ103)。また、コメントが送信されている場合には、コメント情報をコメント・トラックバック蓄積部12に蓄積し、トラックバックが送信されている場合には、トラックバック情報をコメント・トラックバック蓄積部12に蓄積する(ステップ104)。解析した結果のコメント送信元のURL及びトラックバック元の記事URLを再帰収集指示部40に送る(ステップ105)。
The
再帰収集指示部40は、コメント送信元のURLを受け取ると、コメント送信元ブログの更新RSSファイルを取得し(ステップ106)、更新RSSに記載されている記事URLリストを記事収集部20へ送る(ステップ107)。更新RSSファイルは、ブログサイトに特有のURLを持ち、常に最新の記事N件のURLとその概要を記載しているファイルである。また、トラックバック送信元の記事URLを受け取ると、その記事URLを記事収集部20に送る(ステップ108)。
When the recursive
記事収集部20、記事解析部30、再帰収集指示部40では、ユーザから入力された記事URLリストの記事を再帰回数0回とし、予め設定した回数(K回)まで再帰収集を行うよう制御する。すなわち、記事収集部20では、ユーザから入力された記事URLに対して再帰回数を0回に設定し、収集したHTMLテキストと共に記事解析部30に渡す。記事解析部30は、HTMLテキストを解析し、コメント・トラックバック情報を格納した後、再帰回数がK回未満であれば、コメント送信元URLあるいはトラックバック元の記事URLに解析したHTMLテキストの再帰回数に1を加算した回数を付与して再帰収集指示部40に送る。再帰回数がK回の場合は、これ以上再帰収集を行わないように、コメント送信元URLやトラックバック元の記事URLを再帰収集指示部40に送らない。再帰収集指示部40は、コメント送信元ブログのRSSから取得した全てのURLに受け取った再帰回数を付与し、記事収集部20に送る。トラックバック元の記事URLも同様に受け取った再帰回数を付与して記事収集部20に送る。記事収集部20は、再帰収集指示部40から受け取ったURLリストに対しても記事URLの収集S101を実行する。
The
また、記事解析部30は、定期的に新たに解析が終了した記事識別子のリストを生成し、リンク情報抽出部13に送る(ステップ109)
リンク情報抽出部13は、記事解析部30から解析した記事リストを定期的に受け取り、記事からの繋がりを示す記事リンク情報と、ブログ間の繋がりを示すブログリンク情報とを生成し、リンク情報蓄積部14に格納する(ステップ110)。
Also, the
The link
インタフェース部50は、ユーザからキーワードの入力を受け(ステップ111)、キーワードを検索部16に渡す(ステップ112)。検索部16は、受け取ったキーワードに基づき、記事情報蓄積部11を検索し(ステップ113)、本文あるいはタイトルにキーワードを含む記事情報を取得し、インタフェース部50へ返送する(ステップ114)。インタフェース部50は、受け取った記事情報をユーザに提示し(ステップ115)、ユーザから記事の指定を受け付ける(ステップ116)。受け取った記事の記事識別子とキーワードを含むかどうかの情報を伝播表示部15に送る(ステップ117)。ユーザから与えられるキーワードは複数でもよく、また、システムがユーザから入力されたキーワードを元に同義語等を拡張して検索を実行してもよい。また、キーワード検索(キーワードを含む情報を検索する)に限定せず、概念検索(キーワードと概念が似ている情報を検索する)などを用いて検索してもよい。この場合、概念的に似ているか似ていないかの情報を伝播表示部15に送る。
The
伝播表示部15は、記事識別子を受け取り、当該記事識別子とつながりのあるノードをリンク情報蓄積部14から検索し、N段まで順次ノードを検索してグラフを生成する(ステップ118)。また、各ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する(ステップ119)。さらに表示された伝播構造から新たに起点となる記事をユーザに選択させ、伝播構造を表示する(ステップ120)。表示する段数は、予めシステムに設定しておいてもよいし、ユーザに指定させるように構成してもよい。
The
また、表示された記事の伝播構造から、ブログ間の繋がりを表示する指示をユーザから受け取り、現在起点となっている記事を含むブログを起点として、N段のブログリンク情報を表示する。この際も、キーワードを含むブログと含まないブログとを区別して表示することにより、伝播の可能性を発見可能とする。 Also, an instruction to display the connection between the blogs is received from the user from the propagation structure of the displayed article, and the N-stage blog link information is displayed starting from the blog including the article that is currently the starting point. Also in this case, the possibility of propagation can be found by displaying the blog including the keyword and the blog not including the keyword separately.
ここで、本発明の処理対象である記事ページについて説明する。図5は、本発明が対象とする記事ページの構成例である。ここでは、コメント集合202とトラックバック集合203がテキストとして記事ページ200に記載されている場合を示しているが、別に保存されハイパーリンクで関連付けられていてもよい。
Here, the article page which is the processing target of the present invention will be described. FIG. 5 is a configuration example of an article page targeted by the present invention. Here, a case is shown in which the comment set 202 and the trackback set 203 are described in the
記事ページ200は、記事本文201と、記事本文に対して送信されたコメント集合202とトラックバック集合203とから構成される。コメント集合202の各コメントは、コメントタイトル、コメント送信者のURL、コメント送信者名、コメント送信日時、コメント本文などから構成される。コメントタイトル、コメント送信者のURL、コメント送信者名などが送信時に入力されていない場合があり、その場合「Unknown」などシステムの設定値が記載されている場合が多い。
The
そこで、リンク情報抽出部13においては、コメント送信者のURLが同一であれば1つのノード、コメント送信者のURLが入力されていない場合、コメント送信者名が同一であれば1つのノードとする。また、記事リンク情報の抽出においては、トラックバック送信があった場合に、トラックバック送信元の記事が属するブログURLとコメント送信者のURLとが同じであれば1つのノードとする。
Therefore, in the link
図6は、本発明の一実施の形態における記事情報蓄積部の記事情報の格納例であり、図7は、本発明の一実施の形態における記事情報蓄積部のブログ情報の格納例を示す。 FIG. 6 shows an example of storing article information in the article information storage unit in one embodiment of the present invention, and FIG. 7 shows an example of storing blog information in the article information storage unit in one embodiment of the present invention.
記事情報蓄積部11に格納される記事情報としては、記事識別子41、ブログ識別子42、記事URL43、記事投稿日時44、記事タイトル45、記事本文46、コメント受信数47、トラックバック受信数48などが蓄積される。記事情報蓄積部11に格納されるブログ情報としては、ブログ識別子51、ブログサイトのURL52,ブログサイトの更新RSSのURL53、ブログサイト名54、ブログオーナーのアカウント55などが蓄積される。
As article information stored in the article information storage unit 11, an
記事解析部30は、解析された記事のURLが既に記事情報蓄積部11の記事情報に存在する場合は、既存の情報を更新し、存在しない場合は新しい記事識別子を付与して記事情報を記事情報蓄積部11に蓄積する。また、記事URLからブログURLをルールに基づいて求め、ブログURLがブログ情報に存在する場合は、ブログ識別子を取得し、存在しない場合は新しいブログ識別子を付与してブログ情報を記事情報蓄積部11に蓄積する。
The
図8は、本発明の一実施の形態におけるコメント・トラックバック蓄積部のトラックバック情報の格納例を示す。トラックバック情報は、トラックバックを受信した記事識別子61とブログ識別子62、またトラックバック送信元の記事識別子63、ブログ識別子64、記事タイトル65、記事URL66、ブログタイトル67、ブログURL68,そして送信日時69などから構成される。
FIG. 8 shows an example of storage of trackback information in the comment / trackback storage unit according to the embodiment of the present invention. The trackback information includes an
図9は、本発明の一実施の形態におけるコメント・トラックバック蓄積部のコメント情報の格納例である。 FIG. 9 is a storage example of comment information in the comment / trackback accumulating unit in the embodiment of the present invention.
コメント・トラックバック蓄積部12のコメント情報は、コメントを受信した記事の記事識別子71とブログ識別子72、また、コメント送信者のブログ識別子73、送信者名74、送信者のURL75,そしてコメント自体の情報としてコメントタイトル76、コメント本文77、コメント送信日時78などから構成される。ブログ送信者のブログ識別子73は、ブログ送信者のURLがブログサイトのURLだとして、ブログ情報を検索することで求める。ブログ情報に存在しない場合は、ブログ識別子をなしとして蓄積する。
The comment information of the comment / trackback
また、コメント送信者のURLが記載されていないコメントの場合、ブログ識別子を検索することができないため、ブログ識別子なし、コメント送信者のURLなしのコメント情報を蓄積する。送信者名74には「Unknown」も含めて蓄積する。
Further, in the case of a comment in which the URL of the comment sender is not described, the blog identifier cannot be searched, so that the comment information without the blog identifier and without the URL of the comment sender is accumulated. The
コメント情報、トラックバック情報ともに、コメントを受信した記事の記事識別子、トラックバックを受信した記事の記事識別子は、解析対象の記事であることから必ず格納される。 Both the comment information and the trackback information are always stored because the article identifier of the article that received the comment and the article identifier of the article that received the trackback are articles to be analyzed.
以下、リンク情報抽出部13の動作について詳細に説明する。
Hereinafter, the operation of the link
図10は、本発明の一実施の形態におけるリンク情報抽出部の記事リンク抽出処理のフローチャートである。図11は、本発明の一実施の形態におけるリンク情報蓄積部の記事リンク情報の格納例であり、リンク情報蓄積部14の記事リンク情報は、基準記事識別子801、基準記事が属するブログ識別子802、基準記事と繋がりを持つノードの記事識別子(ノードが記事の場合)803、基準記事と繋がりを持つノードのブログ識別子804、基準記事のURL805、基準記事がノードから受信したトラックバック数806、基準記事がノードに送信したトラックバック数807、基準記事がノードから受信したコメント数808、基準記事を含むブログがノードに送信したコメント数809、ノード所有者名810、ノードの記事URL811、ノードのブログURL812、ノードの記事タイトル(ノードが記事の場合)813、ノードが属するブログのタイトル814からなる。
FIG. 10 is a flowchart of the article link extraction process of the link information extraction unit in the embodiment of the present invention. FIG. 11 is a storage example of article link information of the link information storage unit according to the embodiment of the present invention. The article link information of the link
リンク情報生成部13は、記事解析部30から受け取った記事識別リストから、未処理の記事を選択する(ステップ201,202)。未処理の記事がある場合、コメント・トラックバック蓄積部12から選択した記事が受信したトラックバック情報を検索する。トラックバック情報が存在する場合は選択した記事を基準記事とし、トラックバック送信元の記事をつながりのあるノードとして記事リンク情報を生成する(ステップ203)。
The link
次に、基準記事が受信したコメント情報を検索し、コメント情報集合を取得する(ステップ204)。未処理のコメント情報がある場合は(ステップ205、Yes)、まず、コメント送信者のブログ識別子が処理中の記事を基準とした記事リンク情報(図11:ノードのブログ識別子804)に含まれているか調べる。既存の記事リンク情報に含まれている場合には(ステップ206、Yes)、新たな記事リンク情報は生成せず既存の記事リンク情報のコメント受信数を1加算する(ステップ207)。既存の記事リンク情報に含まれていない場合には(ステップ206、No)、コメント送信者名が処理中の記事を基準とした記事リンク情報(図11:ノードの所有者名810)に含まれているか調べる(ステップ208)。コメント送信者名が既存の記事リンク情報にある場合は(ステップ208、Yes)、既存の記事リンク情報のコメント受信数を1加算する(ステップ207)。コメント送信者名が同じ既存の記事リンク情報がない場合、基準の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは、両方と、コメント数とからなる新たな記事リンク情報を生成する(ステップ209)。
Next, the comment information received by the reference article is searched to obtain a comment information set (step 204). If there is unprocessed comment information (
生成した全ての記事リンク情報を図11に示す形態でリンク情報蓄積部14に格納する。さらに、生成した記事リンク情報の内でノードの記事識別子が存在する(すなわち、基準記事がノードからトラックバックを受信している)場合、記事リンク情報それぞれに対して、基準記事aとノードの記事識別子b(ノードが属するブログ識別子をBとする)とを入れ替えた記事リンク情報(基準記事がb、ノードの記事識別子がaの記事リンク情報)が存在するか検索し、存在する場合は検索結果の記事リンク情報のトラックバック送信数として生成した記事リンク情報のトラックバック受信数を格納する。また、基準記事が属するブログ識別子がB、ノードの記事識別子がaである記事リンク情報が存在するか検索し、存在する場合は検索結果の記事リンク情報のコメント送信数として生成した記事リンク情報のコメント受信数を格納する(ステップ210)。
All the generated article link information is stored in the link
次に、ブログ間の繋がりを示すブログリンク情報の生成処理について、図12を用いて説明する。 Next, generation processing of blog link information indicating the connection between blogs will be described with reference to FIG.
図12は、本発明の一実施の形態におけるリンク情報抽出部のブログリンク情報抽出処理のフローチャートである。図13は、本発明の一実施の形態におけるリンク情報蓄積部のブログリンク情報の格納例であり、リンク情報蓄積部14のブログリンク情報は、基準ブログ識別子901、基準ブログと繋がりを持つノードのブログ識別子902、基準ブログがノードから受信したトラックバック数903、基準ブログがノードに送信したトラックバック数904、基準ブログがノードから受信したコメント数905、基準ブログがノードに送信したコメント数906、ノード所有者名(コメント送信者名)907、ノードの記事URL908、ノードのブログのURL909、ノードの記事タイトル(ノードが記事の場合)910、ノードのブログタイトル911からなる。
FIG. 12 is a flowchart of the blog link information extraction process of the link information extraction unit in the embodiment of the present invention. FIG. 13 is a storage example of blog link information of the link information storage unit according to the embodiment of the present invention. The blog link information of the link
リンク情報生成部13は、記事解析部30から受け取った記事識別子のリストから、ブログ識別子のリストを生成して処理を開始する。
The link
まず、未処理のブログ識別子を選択する(ステップ301,302)。未処理のブログがある場合、選択したブログに属する記事が受信したトラックバック情報をコメント・トラックバック蓄積部12から検索する。トラックバック情報が存在する場合は選択したブログを基準とし、トラックバック送信元のブログ識別子をつながりのあるノードとしてブログリンク情報を生成する(ステップ303)。この際、基準ブログに属する複数記事がノードのブログに属する複数の記事から受信した全てのトラックバック数を集計し、リンク情報蓄積部14のブログリンク情報に格納する。
First, an unprocessed blog identifier is selected (
次に、基準ブログに属する複数の記事が受信したコメント情報をコメント・トラックバック蓄積部12から検索し、コメント情報集合を取得する(ステップ304)。未処理のコメント情報がある場合は(ステップ305、Yes)、まず、コメント送信者のブログ識別子が処理中のブログを基準としたブログリンク情報(図13:ノードのブログ識別子902)に含まれているか調べる。
Next, comment information received by a plurality of articles belonging to the reference blog is searched from the comment / trackback
既存のブログリンク情報に含まれている場合には(ステップ306、Yes)、新たなブログリンク情報は生成せず、既存のブログリンク情報のコメント受信数を1加算する(ステップ307)。既存のブログリンク情報に含まれていない場合には(ステップ306、No)、ブログ送信者名が処理中のブログを基準としたブログリンク情報(図13:ノードの所有者名907)に含まれているか調べる(ステップ308)。コメント送信者名が同じ既存のブログリンク情報がある場合は(ステップ308、Yes)、既存のブログリンク情報のコメント受信数を1加算する(ステップ307)。コメント送信者名が同じ既存のブログリンク情報がない場合、基準のブログ識別子とコメント送信者のブログ識別子と、コメント送信者名がコメント送信者のURLの一方、あるいは、両方と、コメント数とから新たな記事リンク情報を生成する(ステップ309)。 When it is included in the existing blog link information (step 306, Yes), new blog link information is not generated, and the number of received comments of the existing blog link information is incremented by 1 (step 307). If it is not included in the existing blog link information (step 306, No), the blog sender name is included in the blog link information based on the blog being processed (FIG. 13: node owner name 907). (Step 308). When there is existing blog link information having the same comment sender name (step 308, Yes), 1 is added to the number of comments received in the existing blog link information (step 307). If there is no existing blog link information with the same comment sender name, the reference blog identifier, the blog identifier of the comment sender, the comment sender name is one or both of the URLs of the comment sender, and the number of comments New article link information is generated (step 309).
生成した全てのブログリンク情報を図13に示す形態でリンク情報蓄積部14に格納すると共に、生成したブログリンク情報の中でノードのブログ識別子が存在するブログリンク情報それぞれに対して、基準ブログとノードとを入れ替えたブログリンク情報が存在するか検索し、存在する場合は検索結果のブログリンク情報のトラックバック送信数として生成したブログリンク情報のトラックバック受信数を格納し、検索結果のブログリンク情報のコメント送信数として生成したブログリンク情報のコメント受信数を格納する(ステップ310)。
All the generated blog link information is stored in the link
図11、図13に示したリンク情報には、ノードの記事タイトル813、910、ノードの属するブログタイトル814、ノードのブログタイトル911が含まれているが、これらは伝播構造を示すために必須ではなく、記事タイトルやブログタイトルを表示することでノードの識別を容易にすることができる項目である。
The link information shown in FIG. 11 and FIG. 13 includes the
以下、図11、図13を用いて伝播表示部15の処理を詳細に説明する。
Hereinafter, the processing of the
伝播表示部15はインタフェース部50からキーワードを含むかどうかの情報が付与された記事識別子を受け取り、該記事識別子を基準とする記事リンク情報をリンク情報蓄積部14から検索する。次に、基準記事と繋がりのあるノードの記事識別子が存在する場合、ノードを基準記事とする記事リンク情報を検索する。この処理をN段に達するまで順次実施し、記事識別子が同じ記事は1つのノードとし、記事識別子がないノードはコメント送信者名が同じであれば1つのノードとし、各ノードの繋がりをエッジとするグラフを生成する。この際、エッジの表示形態としては、コメント送信/受信とトラックバック送信/受信の各繋がりを纏めて1つのエッジとする方法、4本のエッジとする方法、送信と受信で2本とする方法などがある。また、キーワードを含むノードと含まないノードの色を変える、形を変えるなどしてキーワードを含むノードを区別して表示する。これにより、キーワードを含む記事の影響がどのように伝播したかを発見することが可能となる。
The
図14は、本発明の一実施の形態における記事からの繋がり構造の表示例であり、伝播表示部15により表示される。同図において、記事識別子の存在するノードは○、記事識別子が存在しないノードは□で表示され、キーワードを含むノードは色を黒く変えて表示している例である。また、起点となるノードaは輪郭が二重に表示し、起点であることが分かるように表示し、段数は2段までとした例である。記事からの繋がりにおいては記事識別子が存在するノードはトラックバックの送受信関係がある場合であり、ノードaにノードbとノードcからトラックバックが送信されていることを示している。また、ノードaからノードbへの矢印は、ノードaからノードbへのトラックバックか、ノードaのブログ所有者がノードbへコメントを送信したことを示している。このように1つのエッジでコメント送受信、トラックバック送受信を表示する場合には、コメントのみ、あるいはトラックバックのみといった指定をして表示するエッジを切り替える機能を用意するようにしてもよい。
FIG. 14 is a display example of a connection structure from articles in the embodiment of the present invention, and is displayed by the
このように記事からの伝播構造が表示された状態において、ユーザが特定の記事を指定して該記事からの伝播を見る指示をした場合、上記と同様に指定された該記事を起点としてN段に達するまで記事リンク情報を検索し、グラフを生成する。 In the state where the propagation structure from the article is displayed in this way, when the user designates a specific article and gives an instruction to view the propagation from the article, the N stages starting from the designated article as described above are used. Search for article link information until it reaches, and generate a graph.
また、直接記事に対して繋がりがない場合であっても記事の影響を発見する方法として、ブログ間の繋がりを表示する。ユーザによりブログ間の繋がり表示へ切り替える指示がなされると、起点となっている記事を含むブログを基準とするブログリンク情報を検索する。基準ブログとつながりのあるノードが存在する場合、ノードを基準ブログとするブログリンク情報を検索する。この処理をN段に達するまで順次実施し、ブログ識別子が同じであれば1つのノードとし、ブログ識別子がない場合はコメント送信者名が同じであれば1つのノードとし、各ノードの繋がりをエッジとするグラフを生成する。 Even if there is no direct connection to the article, the connection between the blogs is displayed as a method of discovering the influence of the article. When the user gives an instruction to switch to connection display between blogs, blog link information based on the blog including the starting article is searched. When there is a node connected to the reference blog, blog link information using the node as the reference blog is searched. This process is performed in sequence until the Nth stage is reached. If the blog identifier is the same, the node is one node. If there is no blog identifier, the comment sender name is the same node. To generate a graph.
図15は、本発明の一実施の形態におけるブログ間の繋がり構造の表示例である。同図は図14で記事からの伝播構造が表示されている際に、ブログ間の伝播構造への表示切替が指示された例を示す。図14と同様、ブログ識別子の存在するノードは○、ブログ識別子が存在しないノードは□で表示され、キーワードを含むノードは色を黒く変えて表示している。また、起点となるノードaは輪郭を二重に表示し、起点であることが分かるように表示している。記事のノードとブログのノードとは別の表示形態で示されるのが望ましいが、ここでは説明を容易にするため同じ表示形態としている。図14において記事を示していたa〜d、のノードは、図15においてはブログを示している。 FIG. 15 is a display example of a connection structure between blogs according to an embodiment of the present invention. This figure shows an example in which display switching to the propagation structure between blogs is instructed when the propagation structure from the article is displayed in FIG. As in FIG. 14, a node having a blog identifier is displayed as ◯, a node having no blog identifier is displayed as □, and a node including a keyword is displayed with a color changed to black. In addition, the node “a” that is the starting point displays a double outline so that it can be seen that it is the starting point. It is desirable that the article node and the blog node are displayed in different display forms, but here the same display form is used for ease of explanation. The nodes a to d showing articles in FIG. 14 show blogs in FIG.
ノードaがブログになったことにより、ノードgが増え、また、ノードcもブログになったことにより、ノードh、i,jが増え、より多くのつながりのあるノードを見ることが可能となる。また、ノードb、jのブログに含まれる記事中にキーワードが含まれているものは黒く表示されている。また、ノードb、gに送信されたコメントやトラックバックが表示されるようになり、より広い範囲の伝播構造を見ることが可能となる。 When node a becomes a blog, node g increases, and when node c becomes a blog, nodes h, i, and j increase, and it becomes possible to see more connected nodes. . Also, articles containing keywords in the blogs of nodes b and j are displayed in black. In addition, comments and trackbacks transmitted to the nodes b and g are displayed, and a wider range of propagation structures can be viewed.
なお、上記の図3の伝播構造抽出装置の構成要素の動作をプログラムとして構築し、伝播構造抽出装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。 The operation of the components of the propagation structure extraction apparatus shown in FIG. 3 can be constructed as a program, installed in a computer used as the propagation structure extraction apparatus, executed, or distributed via a network. is there.
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。 Further, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、インターネット上のブログサービスやSNSにおける記事の解析に適用可能である。 The present invention can be applied to blog services on the Internet and analysis of articles in SNS.
11 記事情報記憶手段
12 コメント・トラックバック記憶手段
13 リンク情報抽出部
13−1 記事リンク情報抽出手段
13−2 ブログリンク情報抽出手段
14 リンク情報記憶手段
15 伝播表示部
15−1 記事伝播表示手段
15−2 ブログ伝播表示手段
15−3 切り替え表示手段
16 検索部
20 記事収集部
30 記事解析手段、記事解析部
40 再帰収集手段、再帰収集指示部
41 記事識別子
42 ブログ識別子
43 記事URL
44 記事登録日時
45 記事タイトル
46 記事本文
47 コメント受信数
48 トラックバック受信数
50 インタフェース部
51 ブログ識別子
52 ブログサイトのURL
53 ブログサイトの更新RSSのURL
54 ブログサイト名
55 ブログオーナーのアカウント
61 トラックバックを受信した記事識別子
62 トラックバックを受信したブログ識別子
63 トラックバック送信元の記事識別子
64 トラックバック送信元の記事が属するブログ識別子
65 トラックバック送信元の記事タイトル
66 トラックバック送信元の記事URL
67 トラックバック送信元のブログタイトル
68 トラックバック送信元ブログURL
69 トラックバック送信日時
71 コメントを受信した記事識別子
72 コメントを受信したブログ識別子
73 コメント送信者のブログ識別子
74 コメント送信者名
75 コメント送信者のURL
76 コメントタイトル
77 コメント本文
78 コメント送信日時
200 記事ページ
201 記事本文
202 コメント
203 トラックバック
801 基準記事識別子
802 基準記事が属するブログ識別子
803 基準記事と繋がりを持つノードの記事識別子(ノードが記事の場合)
804 基準記事と繋がりを持つノードのブログ識別子
805 基準記事のURL
806 基準記事がノードから受信したトラックバック数
807 基準記事がノードに送信したトラックバック数
808 基準記事がノードから受信したコメント数
809 基準記事を含むブログがノードに送信したコメント数
810 ノード所有者名
811 ノードの記事URL
812 ノードのブログURL
813 ノードの記事タイトル(ノードが記事の場合)
814 ノードが属するブログのタイトル
901 基準ブログ識別子
902 基準ブログと繋がりを持つノードのブログ識別子
903 基準ブログがノードから受信したトラックバック数
904 基準ブログがノードに送信したトラックバック数
905 基準ブログがノードから受信したコメント数
906 基準ブログがノードに送信したコメント数
907 ノードの所有者(コメント送信者名)
908 ノードの記事URL
909 ノードのブログのURL
910 ノードの記事タイトル(ノードが記事の場合)
911 ノードのブログタイトル
11 article information storage means 12 comment / trackback storage means 13 link information extraction section 13-1 article link information extraction means 13-2 blog link information extraction means 14 link information storage means 15 propagation display section 15-1 article propagation display means 15- 2 Blog propagation display means 15-3 Switching display means 16
44
53 Blog site update RSS URL
54
67 Trackback
69 Trackback transmission date and
76
804
806 Number of trackbacks received by reference article from
812 Node Blog URL
813 Node article title (if node is an article)
814 The title of the blog to which the node belongs 901 The
908 Article URL of the node
URL of the 909 node blog
910 Node article title (if the node is an article)
911 Node Blog Title
Claims (10)
収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し、コメントやトラックバックの情報をコメント・トラックバック記憶手段に格納する記事解析手段と、
前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段と、
前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出手段と、
同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出手段と、
ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示手段と、
ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示手段と、
前記記事伝播表示手段から前記ブログ伝播表示手段に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段と、
を有することを特徴とする伝播構造抽出装置。 Propagation structure extraction device that analyzes the impact of Internet blogs and social networking service articles on viewers,
An article identifier for uniquely identifying the article by analyzing the collected article and a blog identifier for uniquely identifying the blog site to which the article belongs are assigned to the article and stored in the article information storage means for comment and trackback Article analysis means for storing the information in the comment / trackback storage means,
A recursive collection that identifies a blog site as a transmission source when a comment is transmitted to the article, collects articles belonging to the blog site, and collects an article as the trackback source when a trackback is transmitted Means,
Article link information extracting means for storing the link from the article or the link by the trackback (link information) in the link information storage means;
A blog link information extracting unit that collects articles belonging to the same blog site, extracts a link from the blog site or a link by linkback (link information), and stores the link information in the link information storage unit;
Article propagation display means for acquiring and displaying a propagation structure starting from a certain article from the link information storage means;
A blog propagation display means for acquiring and displaying a propagation structure based on a blog site from the link information storage means;
When switching from the article propagation display means to the blog propagation display means, a switching display means starting from a blog site that includes an article starting from the article propagation display means;
A propagation structure extracting apparatus characterized by comprising:
前記記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報として前記コメント・トラックバック記憶手段に格納する手段を含む
請求項1記載の伝播構造抽出装置。 The article analysis means includes
When a comment is transmitted to the article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies the blog site to which the article belongs, and at least one of a comment sender name and a comment sender URL If there is a comment sender URL, the URL of the blog site is checked. If it is the URL of the blog site, a blog identifier that uniquely identifies the blog site is stored as comment information in the comment / trackback storage means. The propagation structure extracting apparatus according to claim 1, further comprising:
前記記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報として前記コメント・トラックバック記憶手段に格納する手段を含む
請求項1記載の伝播構造抽出装置。 The article analysis means includes
When the trackback is transmitted to the article, the article identifier that uniquely identifies the article, the blog identifier that uniquely identifies the blog site to which the article belongs, the article identifier of the trackback transmission source, the blog identifier, the article URL, The propagation structure extracting apparatus according to claim 1, further comprising means for storing, in the comment / trackback storage means, one or more pieces of information that can be acquired in a blog URL and a blog title as trackback information.
前記コメント・トラックバック記憶手段に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成する手段と、
ブログURLが不明のコメント情報は、ブログ送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成する手段と、
生成した全ての記事リンク情報を前記リンク情報記憶手段に格納する手段と、
を含む請求項1乃至3記載の伝播構造抽出装置。 The article link information extracting means includes:
Based on the trackback information stored in the comment / trackback storage means, the link information is generated as the link back received article as the reference article, the track back transmission article as the article having connection, and the comment information set transmitted to the reference article If the blog identifier of the comment sender is included in the generated article link information, the new article link information is not generated and the number of received comments is added to the existing article link information. If not included, the article consists of the article identifier of the article that received the comment, the blog identifier, the blog identifier of the comment sender, the comment sender name and / or the URL of the comment sender, and the number of comments. Means for generating link information;
Comment information with an unknown blog URL is determined to be the same if the blog sender name is the same, and the number of comments is added to the existing article link information. Means for generating;
Means for storing all the generated article link information in the link information storage means;
The propagation structure extraction device according to claim 1, comprising:
起点となる記事とコメントまたはトラックバックを辿る段数が入力されると、前記リンク情報記憶手段の記事リンク情報を参照し、入力された該段数に達するまで順次記事リンク情報を検索し、検索された全ての記事リンク情報において、記事からの伝播を表すグラフを生成し、ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む
請求項1乃至4記載の伝播構造抽出装置。 The article propagation display means is:
When the article to be the starting point and the number of steps to follow the comment or trackback are input, the article link information in the link information storage means is referenced, and the article link information is sequentially searched until the input number of stages is reached. 5. The propagation structure extracting apparatus according to claim 1, further comprising: means for generating a graph representing propagation from an article in the article link information of the article, and displaying a case where a node includes a specific keyword and a case where the node does not include the specific keyword.
前記コメント・トラックバック記憶手段に格納された前記コメント情報と前記トラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでブログ送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成する手段と、
生成した全ての前記ブログリンク情報を前記リンク情報記憶手段に格納する手段と、
を含む請求項1乃至3記載の伝播構造抽出装置。 The blog link information extracting means includes
Based on the comment information stored in the comment / trackback storage means and the blog identifier of the trackback information, two blog identifiers having at least one connection of a comment or trackback, the number of comments transmitted and received, the number of trackback transmissions If the blog identifier of the comment sender is unknown and the blog identifier is the same as the received blog identifier and the same blog sender name exists, the existing blog link is generated. A means to add the number of comments to the information and to generate new blog link information if it does not exist,
Means for storing all the generated blog link information in the link information storage means;
The propagation structure extraction device according to claim 1, comprising:
起点となるブログとコメントまたはトラックバックを辿る段数が入力されると、前記リンク情報記憶手段のブログリンク情報を参照し、入力された前記段数に達するまで順次ブログリンク情報を検索し、検索された全てのブログリンク情報において、ブログをノード、ブログ間のつながりをエッジとするグラフを生成し、該ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む
請求項1乃至3、または6記載の伝播構造抽出装置。 The blog propagation display means
When the starting blog and the number of steps following the comment or trackback are input, the blog link information in the link information storage means is referenced, and the blog link information is sequentially searched until the input number of steps is reached. The blog link information includes a means for generating a graph having a blog as a node and a connection between blogs as an edge, and displaying the node separately when the node includes a specific keyword and when the node does not include the specific keyword. Or the propagation structure extraction device according to 6.
記事解析手段が、収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し、コメントやトラックバックの情報をコメント・トラックバック記憶手段に格納する記事解析ステップと、
再帰収集手段が、前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップと、
記事リンク情報抽出手段が、前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップと、
記事伝播表示手段が、ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示ステップと、
ブログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出ステップと、
ブログ伝播表示手段が、ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示ステップと、
切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップと、
を行うことを特徴とする伝播構造抽出方法。 A method for extracting propagation structure in a device that analyzes the influence of articles on blogs and social networking services on the Internet.
Article analysis means analyzes the collected articles and assigns an article identifier that uniquely identifies the article and a blog identifier that uniquely identifies the blog site to which the article belongs to the article and stores it in the article information storage means And an article analysis step for storing comments and trackback information in the comment / trackback storage means;
When the comment is transmitted to the article, the recursive collection means identifies the blog site of the transmission source, collects the articles belonging to the blog site, and when the trackback is transmitted, the article of the trackback source A recursive collection step to collect
Article link information extracting means stores an article link information extracting step for storing a link or link by link back (link information) from the article in the link information storage means;
An article propagation display means for acquiring and displaying a propagation structure starting from a certain article from the link information storage means; and
The blog link information extracting means extracts the links (link information) by comments or trackbacks from the blog site by collecting articles belonging to the same blog site, and stores them in the link information storage means.
A blog propagation display means for acquiring and displaying a propagation structure based on a blog site from the link information storage means;
When the switching display means switches from the article propagation display to the blog propagation display, a switching display step starting from the blog site including the article starting from the article propagation displaying step;
A method for extracting a propagation structure characterized by
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008052152A JP5022946B2 (en) | 2008-03-03 | 2008-03-03 | Propagation structure extraction device and method, program, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008052152A JP5022946B2 (en) | 2008-03-03 | 2008-03-03 | Propagation structure extraction device and method, program, and computer-readable recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009211281A true JP2009211281A (en) | 2009-09-17 |
JP5022946B2 JP5022946B2 (en) | 2012-09-12 |
Family
ID=41184368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008052152A Expired - Fee Related JP5022946B2 (en) | 2008-03-03 | 2008-03-03 | Propagation structure extraction device and method, program, and computer-readable recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5022946B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4550939B1 (en) * | 2009-09-17 | 2010-09-22 | 株式会社野村総合研究所 | Information propagation path identification device, information propagation path identification method, information propagation path identification program |
KR101193648B1 (en) * | 2012-02-03 | 2012-12-24 | 주식회사 크레아랩 | Method of display for concerning degree of internet posts |
JP2013069136A (en) * | 2011-09-22 | 2013-04-18 | Fuji Xerox Co Ltd | Searching apparatus and program |
WO2016208623A1 (en) * | 2015-06-23 | 2016-12-29 | 国立研究開発法人 産業技術総合研究所 | Experimental data management system, method, and program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006164086A (en) * | 2004-12-10 | 2006-06-22 | Nippon Telegr & Teleph Corp <Ntt> | Online knowledge search support system and online knowledge search support method |
JP2007073072A (en) * | 1997-09-08 | 2007-03-22 | Fujitsu Ltd | Related document display device |
JP2007080103A (en) * | 2005-09-15 | 2007-03-29 | Nippon Telegr & Teleph Corp <Ntt> | Information collection method and program |
JP2007193380A (en) * | 2006-01-16 | 2007-08-02 | So-Net Entertainment Corp | Information processor, information processing method and computer program |
WO2007101263A2 (en) * | 2006-02-28 | 2007-09-07 | Buzzlogic, Inc. | Social analytics system and method for analyzing conversations in social media |
-
2008
- 2008-03-03 JP JP2008052152A patent/JP5022946B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007073072A (en) * | 1997-09-08 | 2007-03-22 | Fujitsu Ltd | Related document display device |
JP2006164086A (en) * | 2004-12-10 | 2006-06-22 | Nippon Telegr & Teleph Corp <Ntt> | Online knowledge search support system and online knowledge search support method |
JP2007080103A (en) * | 2005-09-15 | 2007-03-29 | Nippon Telegr & Teleph Corp <Ntt> | Information collection method and program |
JP2007193380A (en) * | 2006-01-16 | 2007-08-02 | So-Net Entertainment Corp | Information processor, information processing method and computer program |
WO2007101263A2 (en) * | 2006-02-28 | 2007-09-07 | Buzzlogic, Inc. | Social analytics system and method for analyzing conversations in social media |
JP2009528639A (en) * | 2006-02-28 | 2009-08-06 | バズロジック, インコーポレイテッド | Social analysis system and method for analyzing conversations in social media |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4550939B1 (en) * | 2009-09-17 | 2010-09-22 | 株式会社野村総合研究所 | Information propagation path identification device, information propagation path identification method, information propagation path identification program |
JP2011086273A (en) * | 2009-09-17 | 2011-04-28 | Nomura Research Institute Ltd | Information propagation path identification device, information propagation path identification method and information propagation path identification program |
JP2013069136A (en) * | 2011-09-22 | 2013-04-18 | Fuji Xerox Co Ltd | Searching apparatus and program |
KR101193648B1 (en) * | 2012-02-03 | 2012-12-24 | 주식회사 크레아랩 | Method of display for concerning degree of internet posts |
WO2016208623A1 (en) * | 2015-06-23 | 2016-12-29 | 国立研究開発法人 産業技術総合研究所 | Experimental data management system, method, and program |
JPWO2016208623A1 (en) * | 2015-06-23 | 2018-04-12 | 国立研究開発法人産業技術総合研究所 | Experimental data management system, method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP5022946B2 (en) | 2012-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101124576B (en) | Search system and methods with integration of user annotations from a trust network | |
US8943035B2 (en) | Distributing web applications across a pre-existing web | |
JP5069730B2 (en) | Event notification function providing device, event notification function providing method, and event notification function providing program | |
US20070143300A1 (en) | System and method for monitoring evolution over time of temporal content | |
US8788342B2 (en) | Intelligent feature expansion of online text ads | |
US10652187B2 (en) | System and method for relevance-based electronic message presentation | |
US9292607B2 (en) | Using social-network data for identification and ranking of URLs | |
JP5493845B2 (en) | Search support program, search support device, and search support method | |
JP6310363B2 (en) | Information processing apparatus, information processing method, and information processing program | |
JP3896014B2 (en) | Information collection system, information collection method, and program causing computer to collect information | |
JP2010176195A (en) | Method for exhibiting connecting destination candidate of component in web application, and computer program and computer system therefor | |
JP2009116440A (en) | Information propagation extraction device and information propagation extraction method | |
JP2004362043A (en) | Project managing system | |
JP5022946B2 (en) | Propagation structure extraction device and method, program, and computer-readable recording medium | |
KR20080078930A (en) | Information providing method and system of extracting a personalized issue | |
JP2012150652A (en) | Influencer extraction device, influencer extraction method, and program | |
JP5881396B2 (en) | Identification information management support system, identification information management support method, and program | |
US9531581B1 (en) | Method and system for identifying and automatically registering domain names | |
KR101331453B1 (en) | A method of extend keyword advertisement based on associative word | |
JP2012203499A (en) | Influence rate calculating device, influence rate calculating method and program | |
JP2009140363A (en) | Information processor, information processing method, control program, and recording medium | |
JP4469818B2 (en) | Data management apparatus, data program, and data management method | |
JP6688018B2 (en) | Information sharing server and program | |
JP5588292B2 (en) | Influencer extraction apparatus, influencer extraction method and program | |
JP2009070210A (en) | Device for creating ranking by category |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111025 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120612 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120618 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |