JP5022946B2 - 伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体 - Google Patents

伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP5022946B2
JP5022946B2 JP2008052152A JP2008052152A JP5022946B2 JP 5022946 B2 JP5022946 B2 JP 5022946B2 JP 2008052152 A JP2008052152 A JP 2008052152A JP 2008052152 A JP2008052152 A JP 2008052152A JP 5022946 B2 JP5022946 B2 JP 5022946B2
Authority
JP
Japan
Prior art keywords
article
blog
comment
link information
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008052152A
Other languages
English (en)
Other versions
JP2009211281A (ja
Inventor
晴美 川島
章裕 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008052152A priority Critical patent/JP5022946B2/ja
Publication of JP2009211281A publication Critical patent/JP2009211281A/ja
Application granted granted Critical
Publication of JP5022946B2 publication Critical patent/JP5022946B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体に係り、特に、インターネット上のブログやソーシャルネットワーキングサービス(SNS)において、個人が発信する記事がどのように閲覧者に影響を与えたか、あるいはどのように影響を受けて発信されたのか、伝播構造を提示することにより把握可能とする伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体関する。
詳しくは、特定のキーワードを含む記事が読み手に影響を与えた伝播構造を、記事と該記事が含まれるブログサイトの他記事に送信されたコメント及びトラックバックを分析することにより抽出する伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体に関する。
ブログサービスやSNSの普及により、誰でも容易に情報発信を行えるようになってきている。発信される記事には、日々の日常生活ついての記載も多く、製品やサービスを利用した体験・評価なども含まれている。発信された記事に対して閲覧者がコメントを付与することで、記事に対する感想を発信者に知らせることができる。また、ブログサービスにおいては、ある記事を参考にして記事を書いた場合にトラックバック機能により参考にした記事へ通知をすることができる。そこで、製品やサービスについてのクチコミ情報が記載された記事に付与されたコメントやトラックバックを分析することにより、クチコミが閲覧者に与えた影響の伝播経路や範囲などを抽出することが可能となる。
従来技術として、ブログコミュニティを対象に、コメント、トラックバックの情報からコミュニティに関する情報を収集する技術がある(例えば、特許文献1参照)。
特開2007−80103号公報
しかしながら、上記の従来の技術は、コメント送信元のブログに属する記事の収集、トラックバック送信元の記事の収集を順次実施するものであり、収集したデータから、記事からの伝播やブログ間の繋がりを抽出し、可視化する手法について考慮されていない。そのため、ユーザが指定した記事の影響について、記事を順に辿りながら伝播構造を抽出する必要があり、伝播構造を表示するまでに時間が掛かるという問題がある。
また、普段から親しくコミュニケーションをしているユーザ間においては、影響を受けた記事に必ずしもコメント送信やトラックバック送信を行わない場合がある。例えば、ユーザAが「○○を購入してみたけれど、とっても使い心地がよくってお勧め!」といった○○という商品についての記事を掲載し、それを閲覧したユーザBが後日自分のブログに「先日、友人が紹介していた○○を買っちゃいました。」といった記事を書いた場合が考えられる。この場合、ユーザAの○○商品についての記事にユーザBからのコメント・トラックバックがなくても、別の記事に対してコメントやトラックバックを送信していれば、ユーザAとユーザBがコミュニケーションしていることを発見することができ、さらに、特定のキーワード○○が両者の記事に含まれていることが分かると、どちらかの記事から影響を受けた可能性を発見することができる。
図16の(A)にブログサイト、記事、コメント、トラックバックの関係の例を示している。コメントは記事に対して送信される情報で、コメント送信者はブログサイトを持っている場合(ユーザBからユーザAの記事cへのコメント)と、ブログサイトを持っていない場合、あるいは、ブログサイトのURLを明記しないでコメントする場合(ユーザDからユーザAの記事dへのコメント)がある。トラックバックは記事から記事に対して送信される情報であり、ユーザCの記事aからユーザAの記事dへ送信された例が示されている。コメントはブログサイトをもっていなくとも送信できるが、トラックバックはブログサイトを持っているユーザ間でのみ発生する。
図16(A)のような関係があった場合に、ユーザAの記事dから伝播構造を図示した例を図16(B)に示している。コメント送信を実線の矢印、トラックバック送信を点線の矢印で、キーワード○○を含む場合は梨地で示している。ここで、記事aのノードとユーザCのブログサイトのノードが別々に描かれている点に着目する。実際には記事aは、ユーザCのブログサイトに含まれる記事であるから、1つのノードとして表示されるのが望ましい。しかし、ユーザCのブログサイトとしてのみ表示すると、トラックバックを送信した記事Cの存在が隠れてしまう。トラックバックは記事間の繋がりとして大変重要な情報であるから、トラックバックを送信した記事をノードとして表示し、コメント送信を付加情報として追加する方が望ましい。コメントとトラックバックの送信者が同一であるかを調べるためには、コメント情報とトラックバック情報にブログサイトのURL等を保存し、その値が同一であるかを調べる必要がある。
また、コメント送信者のURLが不明でコメント送信者の名前が分かっている場合、同じブログサイト内においては、コメント送信者名が同じであれば同一人物として考えてよく、この点についても考慮してグラフを作成する必要がある。
さらに、ユーザBは普段からユーザAとコミュニケーションがあり、記事fにおいて、キーワード○○について記載していても、記事dに対してコメントやトラックバック送信を行っていないため、繋がりを見ることができないという問題がある。
本発明は、上記の点に鑑みなされたもので、ユーザから指定されたキーワードが含まれている記事の表示と含まれていない記事の表示を区別でき、また、記事からだけのつながりでは見つけることのできないユーザ間の繋がりを表示することが可能な伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体を提供することを目的とする。
図1は、本発明の原理構成図である。
本発明(請求項1)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出装置であって、
収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段11に格納し
記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段12に格納し、
記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段12に格納する記事解析手段30と、
記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段40と、
記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出手段13−1と、
同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段14に格納するブログリンク情報抽出手段13−2と、
ある一つの記事を起点とした伝播構造をリンク情報記憶手段14から取得して表示する記事伝播表示手段15−1と、
ブログサイトを基点とした伝播構造をリンク情報記憶手段14から取得して表示するブログ伝播表示手段15−2と、
記事伝播表示手段15−1からブログ伝播表示手段15−2に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段15−3と、
を有し、
記事リンク情報抽出手段13−1は、
コメント・トラックバック記憶手段12に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成する手段と、
ブログURLが不明のコメント情報は、コメント送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成する手段と、
生成した全ての記事リンク情報をリンク情報記憶手段14に格納する手段と、
を有する
また、本発明(請求項)は、記事伝播表示手段15−1において、
起点となる記事とコメントまたはトラックバックを辿る段数が入力されると、リンク情報記憶手段の記事リンク情報を参照し、入力された該段数に達するまで順次記事リンク情報を検索し、検索された全ての記事リンク情報において、記事からの伝播を表すグラフを生成し、ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む。
本発明(請求項)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出装置であって、
収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段11に格納し
記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段12に格納し、
記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段12に格納する記事解析手段30と、
記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段40と、
記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出手段13−1と、
同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段14に格納するブログリンク情報抽出手段13−2と、
ある一つの記事を起点とした伝播構造をリンク情報記憶手段14から取得して表示する記事伝播表示手段15−1と、
ブログサイトを基点とした伝播構造をリンク情報記憶手段14から取得して表示するブログ伝播表示手段15−2と、
記事伝播表示手段15−1からブログ伝播表示手段15−2に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段15−3と、
を有し、
ブログリンク情報抽出手段13−2は、
コメント・トラックバック記憶手段12に格納されたコメント情報とトラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでコメント送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成する手段と、
生成した全てのブログリンク情報をリンク情報記憶手段14に格納する手段と
を有する
また、本発明(請求項)は、ブログ伝播表示手段15−2において、
起点となるブログとコメントまたはトラックバックを辿る段数が入力されると、リンク情報記憶手段14のブログリンク情報を参照し、入力された段数に達するまで順次ブログリンク情報を検索し、検索された全てのブログリンク情報において、ブログをノード、ブログ間のつながりをエッジとするグラフを生成し、該ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む。
図2は、本発明の原理を説明するための図である。
本発明(請求項)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出方法であって、
記事解析手段が、収集された記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し(ステップ1)
記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析ステップ(ステップ2)と、
再帰収集手段が、記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップ(ステップ3)と、
記事リンク情報抽出手段が、記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップ(ステップ4)と
ログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段に格納するブログリンク情報抽出ステップ(ステップ)と、
記事伝播表示手段が、ある一つの記事を起点とした伝播構造をリンク情報記憶手段から取得して表示する記事伝播表示ステップ(ステップ6)と、
ブログ伝播表示手段が、ブログサイトを基点とした伝播構造をリンク情報記憶手段から取得して表示するブログ伝播表示ステップ(ステップ7)と、
切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップ(ステップ8)と、
を行い、
記事リンク情報抽出ステップ(ステップ4)において、
コメント・トラックバック記憶手段に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成するステップと、
ブログURLが不明のコメント情報は、コメント送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成するステップと、
生成した全ての記事リンク情報をリンク情報記憶手段に格納するステップと、
を行う
本発明(請求項)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出方法であって、
記事解析手段が、収集された記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し(ステップ1)
記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析ステップ(ステップ2)と、
再帰収集手段が、記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップ(ステップ3)と、
記事リンク情報抽出手段が、記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップ(ステップ4)と
ログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段に格納するブログリンク情報抽出ステップ(ステップ)と、
記事伝播表示手段が、ある一つの記事を起点とした伝播構造をリンク情報記憶手段から取得して表示する記事伝播表示ステップ(ステップ6)と、
ブログ伝播表示手段が、ブログサイトを基点とした伝播構造をリンク情報記憶手段から取得して表示するブログ伝播表示ステップ(ステップ7)と、
切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップ(ステップ8)と、
を行い、
ブログリンク情報抽出ステップ(ステップ5)において、
コメント・トラックバック記憶手段に格納されたコメント情報とトラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでコメント送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成するステップと、
生成した全てのブログリンク情報をリンク情報記憶手段に格納するステップと、
を行う
本発明(請求項)は、請求項1乃至のいずれか1項に記載の伝播構造抽出装置を構成する各手段としてコンピュータを機能させるための伝播構造抽出プログラムである。
本発明(請求項)は、請求項記載の伝播構造抽出プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体である。
上述のように、本発明では、予め記事に対して送信されたコメント・トラックバック情報から記事リンク情報を抽出し、ブログ間のコメント・トラックバック情報を纏めたブログリンク情報を抽出し、ユーザから特定のキーワードを含む記事が指定された際に、該記事と直接的繋がり(該記事にトラックバックを送信している記事や、コメントを送信している送信者との繋がり)を一覧するグラフを素早く表示することが可能となる。
また、記事に直接コメントやトラックバックをしていない場合でも、ブログ間のリンク情報とキーワードの有無を同時に表示することにより、伝播の概観を掴むことができ、記事からの伝播では発見できない繋がりを見つけることが可能となる。
以下、図面と共に本発明の実施の形態を説明する。
図3は、本発明の一実施の形態における伝播構造抽出装置の構成を示す。
伝播構造抽出装置は、記事情報蓄積部11、コメント・トラックバック蓄積部12、リンク情報抽出部13、リンク情報蓄積部14、伝播表示部15、検索部16、記事収集部20、記事解析部30、再帰収集指示部40、インタフェース部50から構成される。
以下、図4のシーケンスチャートに沿って、伝播構造抽出装置の各構成要素の動作を説明する。
記事収集部20は、収集するための記事URLのリストを入力とし、記事URLリストに記載された記事URLを順次収集し(ステップ101)、収集したHTMLテキストを出力する(ステップ102)。
記事解析部30は、記事収集部20から受け取ったHTMLテキストを解析し、記事を一意に識別する記事識別子と記事を含むブログサイトを一意に識別するブログ識別子を該記事に付与して、記事情報蓄積部11に格納する(ステップ103)。また、コメントが送信されている場合には、コメント情報をコメント・トラックバック蓄積部12に蓄積し、トラックバックが送信されている場合には、トラックバック情報をコメント・トラックバック蓄積部12に蓄積する(ステップ104)。解析した結果のコメント送信元のURL及びトラックバック元の記事URLを再帰収集指示部40に送る(ステップ105)。
再帰収集指示部40は、コメント送信元のURLを受け取ると、コメント送信元ブログの更新RSSファイルを取得し(ステップ106)、更新RSSに記載されている記事URLリストを記事収集部20へ送る(ステップ107)。更新RSSファイルは、ブログサイトに特有のURLを持ち、常に最新の記事N件のURLとその概要を記載しているファイルである。また、トラックバック送信元の記事URLを受け取ると、その記事URLを記事収集部20に送る(ステップ108)。
記事収集部20、記事解析部30、再帰収集指示部40では、ユーザから入力された記事URLリストの記事を再帰回数0回とし、予め設定した回数(K回)まで再帰収集を行うよう制御する。すなわち、記事収集部20では、ユーザから入力された記事URLに対して再帰回数を0回に設定し、収集したHTMLテキストと共に記事解析部30に渡す。記事解析部30は、HTMLテキストを解析し、コメント・トラックバック情報を格納した後、再帰回数がK回未満であれば、コメント送信元URLあるいはトラックバック元の記事URLに解析したHTMLテキストの再帰回数に1を加算した回数を付与して再帰収集指示部40に送る。再帰回数がK回の場合は、これ以上再帰収集を行わないように、コメント送信元URLやトラックバック元の記事URLを再帰収集指示部40に送らない。再帰収集指示部40は、コメント送信元ブログのRSSから取得した全てのURLに受け取った再帰回数を付与し、記事収集部20に送る。トラックバック元の記事URLも同様に受け取った再帰回数を付与して記事収集部20に送る。記事収集部20は、再帰収集指示部40から受け取ったURLリストに対しても記事URLの収集S101を実行する。
また、記事解析部30は、定期的に新たに解析が終了した記事識別子のリストを生成し、リンク情報抽出部13に送る(ステップ109)
リンク情報抽出部13は、記事解析部30から解析した記事リストを定期的に受け取り、記事からの繋がりを示す記事リンク情報と、ブログ間の繋がりを示すブログリンク情報とを生成し、リンク情報蓄積部14に格納する(ステップ110)。
インタフェース部50は、ユーザからキーワードの入力を受け(ステップ111)、キーワードを検索部16に渡す(ステップ112)。検索部16は、受け取ったキーワードに基づき、記事情報蓄積部11を検索し(ステップ113)、本文あるいはタイトルにキーワードを含む記事情報を取得し、インタフェース部50へ返送する(ステップ114)。インタフェース部50は、受け取った記事情報をユーザに提示し(ステップ115)、ユーザから記事の指定を受け付ける(ステップ116)。受け取った記事の記事識別子とキーワードを含むかどうかの情報を伝播表示部15に送る(ステップ117)。ユーザから与えられるキーワードは複数でもよく、また、システムがユーザから入力されたキーワードを元に同義語等を拡張して検索を実行してもよい。また、キーワード検索(キーワードを含む情報を検索する)に限定せず、概念検索(キーワードと概念が似ている情報を検索する)などを用いて検索してもよい。この場合、概念的に似ているか似ていないかの情報を伝播表示部15に送る。
伝播表示部15は、記事識別子を受け取り、当該記事識別子とつながりのあるノードをリンク情報蓄積部14から検索し、N段まで順次ノードを検索してグラフを生成する(ステップ118)。また、各ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する(ステップ119)。さらに表示された伝播構造から新たに起点となる記事をユーザに選択させ、伝播構造を表示する(ステップ120)。表示する段数は、予めシステムに設定しておいてもよいし、ユーザに指定させるように構成してもよい。
また、表示された記事の伝播構造から、ブログ間の繋がりを表示する指示をユーザから受け取り、現在起点となっている記事を含むブログを起点として、N段のブログリンク情報を表示する。この際も、キーワードを含むブログと含まないブログとを区別して表示することにより、伝播の可能性を発見可能とする。
ここで、本発明の処理対象である記事ページについて説明する。図5は、本発明が対象とする記事ページの構成例である。ここでは、コメント集合202とトラックバック集合203がテキストとして記事ページ200に記載されている場合を示しているが、別に保存されハイパーリンクで関連付けられていてもよい。
記事ページ200は、記事本文201と、記事本文に対して送信されたコメント集合202とトラックバック集合203とから構成される。コメント集合202の各コメントは、コメントタイトル、コメント送信者のURL、コメント送信者名、コメント送信日時、コメント本文などから構成される。コメントタイトル、コメント送信者のURL、コメント送信者名などが送信時に入力されていない場合があり、その場合「Unknown」などシステムの設定値が記載されている場合が多い。
そこで、リンク情報抽出部13においては、コメント送信者のURLが同一であれば1つのノード、コメント送信者のURLが入力されていない場合、コメント送信者名が同一であれば1つのノードとする。また、記事リンク情報の抽出においては、トラックバック送信があった場合に、トラックバック送信元の記事が属するブログURLとコメント送信者のURLとが同じであれば1つのノードとする。
図6は、本発明の一実施の形態における記事情報蓄積部の記事情報の格納例であり、図7は、本発明の一実施の形態における記事情報蓄積部のブログ情報の格納例を示す。
記事情報蓄積部11に格納される記事情報としては、記事識別子41、ブログ識別子42、記事URL43、記事投稿日時44、記事タイトル45、記事本文46、コメント受信数47、トラックバック受信数48などが蓄積される。記事情報蓄積部11に格納されるブログ情報としては、ブログ識別子51、ブログサイトのURL52,ブログサイトの更新RSSのURL53、ブログサイト名54、ブログオーナーのアカウント55などが蓄積される。
記事解析部30は、解析された記事のURLが既に記事情報蓄積部11の記事情報に存在する場合は、既存の情報を更新し、存在しない場合は新しい記事識別子を付与して記事情報を記事情報蓄積部11に蓄積する。また、記事URLからブログURLをルールに基づいて求め、ブログURLがブログ情報に存在する場合は、ブログ識別子を取得し、存在しない場合は新しいブログ識別子を付与してブログ情報を記事情報蓄積部11に蓄積する。
図8は、本発明の一実施の形態におけるコメント・トラックバック蓄積部のトラックバック情報の格納例を示す。トラックバック情報は、トラックバックを受信した記事識別子61とブログ識別子62、またトラックバック送信元の記事識別子63、ブログ識別子64、記事タイトル65、記事URL66、ブログタイトル67、ブログURL68,そして送信日時69などから構成される。
図9は、本発明の一実施の形態におけるコメント・トラックバック蓄積部のコメント情報の格納例である。
コメント・トラックバック蓄積部12のコメント情報は、コメントを受信した記事の記事識別子71とブログ識別子72、また、コメント送信者のブログ識別子73、送信者名74、送信者のURL75,そしてコメント自体の情報としてコメントタイトル76、コメント本文77、コメント送信日時78などから構成される。コメント送信者のブログ識別子73は、コメント送信者のURLがブログサイトのURLだとして、ブログ情報を検索することで求める。ブログ情報に存在しない場合は、ブログ識別子をなしとして蓄積する。
また、コメント送信者のURLが記載されていないコメントの場合、ブログ識別子を検索することができないため、ブログ識別子なし、コメント送信者のURLなしのコメント情報を蓄積する。送信者名74には「Unknown」も含めて蓄積する。
コメント情報、トラックバック情報ともに、コメントを受信した記事の記事識別子、トラックバックを受信した記事の記事識別子は、解析対象の記事であることから必ず格納される。
以下、リンク情報抽出部13の動作について詳細に説明する。
図10は、本発明の一実施の形態におけるリンク情報抽出部の記事リンク抽出処理のフローチャートである。図11は、本発明の一実施の形態におけるリンク情報蓄積部の記事リンク情報の格納例であり、リンク情報蓄積部14の記事リンク情報は、基準記事識別子801、基準記事が属するブログ識別子802、基準記事と繋がりを持つノードの記事識別子(ノードが記事の場合)803、基準記事と繋がりを持つノードのブログ識別子804、基準記事のURL805、基準記事がノードから受信したトラックバック数806、基準記事がノードに送信したトラックバック数807、基準記事がノードから受信したコメント数808、基準記事を含むブログがノードに送信したコメント数809、ノード所有者名810、ノードの記事URL811、ノードのブログURL812、ノードの記事タイトル(ノードが記事の場合)813、ノードが属するブログのタイトル814からなる。
リンク情報生成部13は、記事解析部30から受け取った記事識別リストから、未処理の記事を選択する(ステップ201,202)。未処理の記事がある場合、コメント・トラックバック蓄積部12から選択した記事が受信したトラックバック情報を検索する。トラックバック情報が存在する場合は選択した記事を基準記事とし、トラックバック送信元の記事をつながりのあるノードとして記事リンク情報を生成する(ステップ203)。
次に、基準記事が受信したコメント情報を検索し、コメント情報集合を取得する(ステップ204)。未処理のコメント情報がある場合は(ステップ205、Yes)、まず、コメント送信者のブログ識別子が処理中の記事を基準とした記事リンク情報(図11:ノードのブログ識別子804)に含まれているか調べる。既存の記事リンク情報に含まれている場合には(ステップ206、Yes)、新たな記事リンク情報は生成せず既存の記事リンク情報のコメント受信数を1加算する(ステップ207)。既存の記事リンク情報に含まれていない場合には(ステップ206、No)、コメント送信者名が処理中の記事を基準とした記事リンク情報(図11:ノードの所有者名810)に含まれているか調べる(ステップ208)。コメント送信者名が既存の記事リンク情報にある場合は(ステップ208、Yes)、既存の記事リンク情報のコメント受信数を1加算する(ステップ207)。コメント送信者名が同じ既存の記事リンク情報がない場合、基準の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは、両方と、コメント数とからなる新たな記事リンク情報を生成する(ステップ209)。
生成した全ての記事リンク情報を図11に示す形態でリンク情報蓄積部14に格納する。さらに、生成した記事リンク情報の内でノードの記事識別子が存在する(すなわち、基準記事がノードからトラックバックを受信している)場合、記事リンク情報それぞれに対して、基準記事aとノードの記事識別子b(ノードが属するブログ識別子をBとする)とを入れ替えた記事リンク情報(基準記事がb、ノードの記事識別子がaの記事リンク情報)が存在するか検索し、存在する場合は検索結果の記事リンク情報のトラックバック送信数として生成した記事リンク情報のトラックバック受信数を格納する。また、基準記事が属するブログ識別子がB、ノードの記事識別子がaである記事リンク情報が存在するか検索し、存在する場合は検索結果の記事リンク情報のコメント送信数として生成した記事リンク情報のコメント受信数を格納する(ステップ210)。
次に、ブログ間の繋がりを示すブログリンク情報の生成処理について、図12を用いて説明する。
図12は、本発明の一実施の形態におけるリンク情報抽出部のブログリンク情報抽出処理のフローチャートである。図13は、本発明の一実施の形態におけるリンク情報蓄積部のブログリンク情報の格納例であり、リンク情報蓄積部14のブログリンク情報は、基準ブログ識別子901、基準ブログと繋がりを持つノードのブログ識別子902、基準ブログがノードから受信したトラックバック数903、基準ブログがノードに送信したトラックバック数904、基準ブログがノードから受信したコメント数905、基準ブログがノードに送信したコメント数906、ノード所有者名(コメント送信者名)907、ノードの記事URL908、ノードのブログのURL909、ノードの記事タイトル(ノードが記事の場合)910、ノードのブログタイトル911からなる。
リンク情報生成部13は、記事解析部30から受け取った記事識別子のリストから、ブログ識別子のリストを生成して処理を開始する。
まず、未処理のブログ識別子を選択する(ステップ301,302)。未処理のブログがある場合、選択したブログに属する記事が受信したトラックバック情報をコメント・トラックバック蓄積部12から検索する。トラックバック情報が存在する場合は選択したブログを基準とし、トラックバック送信元のブログ識別子をつながりのあるノードとしてブログリンク情報を生成する(ステップ303)。この際、基準ブログに属する複数記事がノードのブログに属する複数の記事から受信した全てのトラックバック数を集計し、リンク情報蓄積部14のブログリンク情報に格納する。
次に、基準ブログに属する複数の記事が受信したコメント情報をコメント・トラックバック蓄積部12から検索し、コメント情報集合を取得する(ステップ304)。未処理のコメント情報がある場合は(ステップ305、Yes)、まず、コメント送信者のブログ識別子が処理中のブログを基準としたブログリンク情報(図13:ノードのブログ識別子902)に含まれているか調べる。
既存のブログリンク情報に含まれている場合には(ステップ306、Yes)、新たなブログリンク情報は生成せず、既存のブログリンク情報のコメント受信数を1加算する(ステップ307)。既存のブログリンク情報に含まれていない場合には(ステップ306、No)、コメント送信者名が処理中のブログを基準としたブログリンク情報(図13:ノードの所有者名907)に含まれているか調べる(ステップ308)。コメント送信者名が同じ既存のブログリンク情報がある場合は(ステップ308、Yes)、既存のブログリンク情報のコメント受信数を1加算する(ステップ307)。コメント送信者名が同じ既存のブログリンク情報がない場合、基準のブログ識別子とコメント送信者のブログ識別子と、コメント送信者名がコメント送信者のURLの一方、あるいは、両方と、コメント数とから新たな記事リンク情報を生成する(ステップ309)。
生成した全てのブログリンク情報を図13に示す形態でリンク情報蓄積部14に格納すると共に、生成したブログリンク情報の中でノードのブログ識別子が存在するブログリンク情報それぞれに対して、基準ブログとノードとを入れ替えたブログリンク情報が存在するか検索し、存在する場合は検索結果のブログリンク情報のトラックバック送信数として生成したブログリンク情報のトラックバック受信数を格納し、検索結果のブログリンク情報のコメント送信数として生成したブログリンク情報のコメント受信数を格納する(ステップ310)。
図11、図13に示したリンク情報には、ノードの記事タイトル813、910、ノードの属するブログタイトル814、ノードのブログタイトル911が含まれているが、これらは伝播構造を示すために必須ではなく、記事タイトルやブログタイトルを表示することでノードの識別を容易にすることができる項目である。
以下、図11、図13を用いて伝播表示部15の処理を詳細に説明する。
伝播表示部15はインタフェース部50からキーワードを含むかどうかの情報が付与された記事識別子を受け取り、該記事識別子を基準とする記事リンク情報をリンク情報蓄積部14から検索する。次に、基準記事と繋がりのあるノードの記事識別子が存在する場合、ノードを基準記事とする記事リンク情報を検索する。この処理をN段に達するまで順次実施し、記事識別子が同じ記事は1つのノードとし、記事識別子がないノードはコメント送信者名が同じであれば1つのノードとし、各ノードの繋がりをエッジとするグラフを生成する。この際、エッジの表示形態としては、コメント送信/受信とトラックバック送信/受信の各繋がりを纏めて1つのエッジとする方法、4本のエッジとする方法、送信と受信で2本とする方法などがある。また、キーワードを含むノードと含まないノードの色を変える、形を変えるなどしてキーワードを含むノードを区別して表示する。これにより、キーワードを含む記事の影響がどのように伝播したかを発見することが可能となる。
図14は、本発明の一実施の形態における記事からの繋がり構造の表示例であり、伝播表示部15により表示される。同図において、記事識別子の存在するノードは○、記事識別子が存在しないノードは□で表示され、キーワードを含むノードは色を黒く変えて表示している例である。また、起点となるノードaは輪郭が二重に表示し、起点であることが分かるように表示し、段数は2段までとした例である。記事からの繋がりにおいては記事識別子が存在するノードはトラックバックの送受信関係がある場合であり、ノードaにノードbとノードcからトラックバックが送信されていることを示している。また、ノードaからノードbへの矢印は、ノードaからノードbへのトラックバックか、ノードaのブログ所有者がノードbへコメントを送信したことを示している。このように1つのエッジでコメント送受信、トラックバック送受信を表示する場合には、コメントのみ、あるいはトラックバックのみといった指定をして表示するエッジを切り替える機能を用意するようにしてもよい。
このように記事からの伝播構造が表示された状態において、ユーザが特定の記事を指定して該記事からの伝播を見る指示をした場合、上記と同様に指定された該記事を起点としてN段に達するまで記事リンク情報を検索し、グラフを生成する。
また、直接記事に対して繋がりがない場合であっても記事の影響を発見する方法として、ブログ間の繋がりを表示する。ユーザによりブログ間の繋がり表示へ切り替える指示がなされると、起点となっている記事を含むブログを基準とするブログリンク情報を検索する。基準ブログとつながりのあるノードが存在する場合、ノードを基準ブログとするブログリンク情報を検索する。この処理をN段に達するまで順次実施し、ブログ識別子が同じであれば1つのノードとし、ブログ識別子がない場合はコメント送信者名が同じであれば1つのノードとし、各ノードの繋がりをエッジとするグラフを生成する。
図15は、本発明の一実施の形態におけるブログ間の繋がり構造の表示例である。同図は図14で記事からの伝播構造が表示されている際に、ブログ間の伝播構造への表示切替が指示された例を示す。図14と同様、ブログ識別子の存在するノードは○、ブログ識別子が存在しないノードは□で表示され、キーワードを含むノードは色を黒く変えて表示している。また、起点となるノードaは輪郭を二重に表示し、起点であることが分かるように表示している。記事のノードとブログのノードとは別の表示形態で示されるのが望ましいが、ここでは説明を容易にするため同じ表示形態としている。図14において記事を示していたa〜d、のノードは、図15においてはブログを示している。
ノードaがブログになったことにより、ノードgが増え、また、ノードcもブログになったことにより、ノードh、i,jが増え、より多くのつながりのあるノードを見ることが可能となる。また、ノードb、jのブログに含まれる記事中にキーワードが含まれているものは黒く表示されている。また、ノードb、gに送信されたコメントやトラックバックが表示されるようになり、より広い範囲の伝播構造を見ることが可能となる。
なお、上記の図3の伝播構造抽出装置の構成要素の動作をプログラムとして構築し、伝播構造抽出装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、インターネット上のブログサービスやSNSにおける記事の解析に適用可能である。
本発明の原理構成図である。 本発明の原理を説明するための図である。 本発明の一実施の形態における伝播構造抽出装置の構成図である。 本発明の一実施の形態における伝播構造抽出装置の動作のシーケンスチャートである。 本発明が対象とする記事ページの構成例である。 本発明の一実施の形態における記事情報蓄積部の記事情報の格納例である。 本発明の一実施の形態における記事情報蓄積部のブログ情報の格納例である。 本発明の一実施の形態におけるコメント・トラックバック蓄積部のトラックバック情報の格納例である。 本発明の一実施の形態におけるコメント・トラックバック蓄積部のコメント情報の格納例である。 本発明の一実施の形態におけるリンク情報抽出部の記事リンク情報抽出処理のフローチャートである。 本発明の一実施の形態におけるリンク情報蓄積部の記事リンク情報の格納例である。 本発明の一実施の形態におけるリンク情報抽出部のブログリク情報抽出処理のフローチャートである。 本発明の一実施の形態におけるリンク情報蓄積部のブログリンク情報の格納例である。 本発明の一実施の形態における記事からの繋がり構造の表示例である。 本発明の一実施の形態におけるブログ間の繋がり構造の表示例である。 本発明が対象とするブログサービスの構造について説明する図である。
符号の説明
11 記事情報記憶手段
12 コメント・トラックバック記憶手段
13 リンク情報抽出部
13−1 記事リンク情報抽出手段
13−2 ブログリンク情報抽出手段
14 リンク情報記憶手段
15 伝播表示部
15−1 記事伝播表示手段
15−2 ブログ伝播表示手段
15−3 切り替え表示手段
16 検索部
20 記事収集部
30 記事解析手段、記事解析部
40 再帰収集手段、再帰収集指示部
41 記事識別子
42 ブログ識別子
43 記事URL
44 記事登録日時
45 記事タイトル
46 記事本文
47 コメント受信数
48 トラックバック受信数
50 インタフェース部
51 ブログ識別子
52 ブログサイトのURL
53 ブログサイトの更新RSSのURL
54 ブログサイト名
55 ブログオーナーのアカウント
61 トラックバックを受信した記事識別子
62 トラックバックを受信したブログ識別子
63 トラックバック送信元の記事識別子
64 トラックバック送信元の記事が属するブログ識別子
65 トラックバック送信元の記事タイトル
66 トラックバック送信元の記事URL
67 トラックバック送信元のブログタイトル
68 トラックバック送信元ブログURL
69 トラックバック送信日時
71 コメントを受信した記事識別子
72 コメントを受信したブログ識別子
73 コメント送信者のブログ識別子
74 コメント送信者名
75 コメント送信者のURL
76 コメントタイトル
77 コメント本文
78 コメント送信日時
200 記事ページ
201 記事本文
202 コメント
203 トラックバック
801 基準記事識別子
802 基準記事が属するブログ識別子
803 基準記事と繋がりを持つノードの記事識別子(ノードが記事の場合)
804 基準記事と繋がりを持つノードのブログ識別子
805 基準記事のURL
806 基準記事がノードから受信したトラックバック数
807 基準記事がノードに送信したトラックバック数
808 基準記事がノードから受信したコメント数
809 基準記事を含むブログがノードに送信したコメント数
810 ノード所有者名
811 ノードの記事URL
812 ノードのブログURL
813 ノードの記事タイトル(ノードが記事の場合)
814 ノードが属するブログのタイトル
901 基準ブログ識別子
902 基準ブログと繋がりを持つノードのブログ識別子
903 基準ブログがノードから受信したトラックバック数
904 基準ブログがノードに送信したトラックバック数
905 基準ブログがノードから受信したコメント数
906 基準ブログがノードに送信したコメント数
907 ノードの所有者(コメント送信者名)
908 ノードの記事URL
909 ノードのブログのURL
910 ノードの記事タイトル(ノードが記事の場合)
911 ノードのブログタイトル

Claims (8)

  1. インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出装置であって、
    収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し
    前記記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
    前記記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析手段と、
    前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段と、
    前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出手段と、
    同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出手段と、
    ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示手段と、
    ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示手段と、
    前記記事伝播表示手段から前記ブログ伝播表示手段に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段と、
    を有し、
    前記記事リンク情報抽出手段は、
    前記コメント・トラックバック記憶手段に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成する手段と、
    ブログURLが不明のコメント情報は、コメント送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成する手段と、
    生成した全ての記事リンク情報を前記リンク情報記憶手段に格納する手段と、
    を有することを特徴とする伝播構造抽出装置。
  2. 前記記事伝播表示手段は、
    起点となる記事とコメントまたはトラックバックを辿る段数が入力されると、前記リンク情報記憶手段の記事リンク情報を参照し、入力された該段数に達するまで順次記事リンク情報を検索し、検索された全ての記事リンク情報において、記事からの伝播を表すグラフを生成し、ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む
    請求項1記載の伝播構造抽出装置。
  3. インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出装置であって、
    収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し
    前記記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
    前記記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析手段と、
    前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段と、
    前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出手段と、
    同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出手段と、
    ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示手段と、
    ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示手段と、
    前記記事伝播表示手段から前記ブログ伝播表示手段に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段と、
    を有し、
    前記ブログリンク情報抽出手段は、
    前記コメント・トラックバック記憶手段に格納された前記コメント情報と前記トラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでコメント送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成する手段と、
    生成した全ての前記ブログリンク情報を前記リンク情報記憶手段に格納する手段と、
    を有することを特徴とする伝播構造抽出装置。
  4. 前記ブログ伝播表示手段は、
    起点となるブログとコメントまたはトラックバックを辿る段数が入力されると、前記リンク情報記憶手段のブログリンク情報を参照し、入力された前記段数に達するまで順次ブログリンク情報を検索し、検索された全てのブログリンク情報において、ブログをノード、ブログ間のつながりをエッジとするグラフを生成し、該ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む
    請求項3記載の伝播構造抽出装置。
  5. インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出方法であって、
    記事解析手段が、収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し
    前記記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
    前記記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析ステップと、
    再帰収集手段が、前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップと、
    記事リンク情報抽出手段が、前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップと
    ログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出ステップと、
    記事伝播表示手段が、ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示ステップと、
    ブログ伝播表示手段が、ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示ステップと、
    切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップと、
    を行い、
    前記記事リンク情報抽出ステップにおいて、
    前記コメント・トラックバック記憶手段に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成するステップと、
    ブログURLが不明のコメント情報は、コメント送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成するステップと、
    生成した全ての記事リンク情報を前記リンク情報記憶手段に格納するステップと、
    を行うことを特徴とする伝播構造抽出方法。
  6. インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出方法であって、
    記事解析手段が、収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し
    前記記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
    前記記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析ステップと、
    再帰収集手段が、前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップと、
    記事リンク情報抽出手段が、前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップと
    ログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出ステップと、
    記事伝播表示手段が、ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示ステップと、
    ブログ伝播表示手段が、ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示ステップと、
    切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップと、
    を行い、
    前記ブログリンク情報抽出ステップにおいて、
    前記コメント・トラックバック記憶手段に格納された前記コメント情報と前記トラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでコメント送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成するステップと、
    生成した全ての前記ブログリンク情報を前記リンク情報記憶手段に格納するステップと、
    を行うことを特徴とする伝播構造抽出方法。
  7. 請求項1乃至のいずれか1項に記載の伝播構造抽出装置を構成する各手段としてコンピュータを機能させるための伝播構造抽出プログラム。
  8. 請求項記載の伝播構造抽出プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2008052152A 2008-03-03 2008-03-03 伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP5022946B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008052152A JP5022946B2 (ja) 2008-03-03 2008-03-03 伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008052152A JP5022946B2 (ja) 2008-03-03 2008-03-03 伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2009211281A JP2009211281A (ja) 2009-09-17
JP5022946B2 true JP5022946B2 (ja) 2012-09-12

Family

ID=41184368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008052152A Expired - Fee Related JP5022946B2 (ja) 2008-03-03 2008-03-03 伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP5022946B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4550939B1 (ja) * 2009-09-17 2010-09-22 株式会社野村総合研究所 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム
JP5866922B2 (ja) * 2011-09-22 2016-02-24 富士ゼロックス株式会社 検索装置及びプログラム
KR101193648B1 (ko) * 2012-02-03 2012-12-24 주식회사 크레아랩 인터넷 게시글의 관심도 표시방법
WO2016208623A1 (ja) * 2015-06-23 2016-12-29 国立研究開発法人 産業技術総合研究所 実験データ管理システム、方法、および、プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4348357B2 (ja) * 1997-09-08 2009-10-21 富士通株式会社 関連文書表示装置
JP2006164086A (ja) * 2004-12-10 2006-06-22 Nippon Telegr & Teleph Corp <Ntt> オンライン知識検索支援装置、およびオンライン知識検索支援方法
JP2007080103A (ja) * 2005-09-15 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> 情報収集方法及びプログラム
JP2007193380A (ja) * 2006-01-16 2007-08-02 So-Net Entertainment Corp 情報処理装置,情報処理方法,およびコンピュータプログラム
JP2009528639A (ja) * 2006-02-28 2009-08-06 バズロジック, インコーポレイテッド ソーシャルメディアにおける会話を分析するためのソーシャル分析システムおよび方法

Also Published As

Publication number Publication date
JP2009211281A (ja) 2009-09-17

Similar Documents

Publication Publication Date Title
US9721029B1 (en) Distributing web applications across a pre-existing web
CN101124576B (zh) 集成有来自信任网络的用户注释的搜索系统和方法
US8578328B2 (en) Method for presenting candidate for link target to component in web application, as well as computer program and computer system for the same
JP5069730B2 (ja) イベント通知機能提供装置、イベント通知機能提供方法及びイベント通知機能提供プログラム
US20070143300A1 (en) System and method for monitoring evolution over time of temporal content
US10652187B2 (en) System and method for relevance-based electronic message presentation
JP6310363B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
KR101174213B1 (ko) 인맥에 기초한 검색 결과 제공 시스템 및 방법
US20160147780A1 (en) Identifying Related Entities
JP2004362043A (ja) プロジェクト管理システム
JP5493845B2 (ja) 検索支援プログラム、検索支援装置、及び検索支援方法
JP5022946B2 (ja) 伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体
KR100856916B1 (ko) 관심사를 반영하여 추출한 정보 제공 방법 및 시스템
CN102456044A (zh) 推送信息的方法与系统
JP2012150652A (ja) インフルエンサー抽出装置、インフルエンサー抽出方法およびプログラム
JP5525470B2 (ja) 影響度算出装置、影響度算出方法およびプログラム
JP5881396B2 (ja) 識別情報管理支援システム、識別情報管理支援方法およびプログラム
KR101331453B1 (ko) 연관어를 이용한 확장 키워드 검색 광고 방법
JP2019105942A (ja) コンテンツの提示順位を制御する装置、方法、及び、プログラム
KR100676045B1 (ko) 관심사를 반영하여 추출한 정보 제공 방법 및 시스템
JP5588292B2 (ja) インフルエンサー抽出装置、インフルエンサー抽出方法およびプログラム
JP5775508B2 (ja) スパムアカウント抽出装置及びスパムアカウント抽出方法
JP2009070210A (ja) カテゴリ別ランキング作成装置
JP2010224941A (ja) 関連情報検索装置、関連情報検索方法、および関連情報検索プログラム
WO2014054309A1 (ja) 関連検索システム、検索窓口装置、データベース及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120618

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees