JP2013140535A - マイクロブログシステムから小集団を抽出し、注釈付けする装置、方法およびプログラム - Google Patents

マイクロブログシステムから小集団を抽出し、注釈付けする装置、方法およびプログラム Download PDF

Info

Publication number
JP2013140535A
JP2013140535A JP2012001027A JP2012001027A JP2013140535A JP 2013140535 A JP2013140535 A JP 2013140535A JP 2012001027 A JP2012001027 A JP 2012001027A JP 2012001027 A JP2012001027 A JP 2012001027A JP 2013140535 A JP2013140535 A JP 2013140535A
Authority
JP
Japan
Prior art keywords
small group
users
user
keyword
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012001027A
Other languages
English (en)
Inventor
Erdmann Maike
マイケ エルドマン
Tomoya Takeyoshi
朋也 武吉
Toshihiro Ono
智弘 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2012001027A priority Critical patent/JP2013140535A/ja
Publication of JP2013140535A publication Critical patent/JP2013140535A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】マイクロブログシステムから小集団を抽出し、この小集団を分類分けし、メンバ共通の興味を表すキーワードを注釈付けする装置を提供する。
【解決手段】投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、注釈付けする装置は、ネットワークから、特定の利用者に対するフォロー関係に基づいて、パーソナルネットワークを抽出し、パーソナルネットワークを、フォロー関係に基づいて小集団に分割する。この小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別し、全利用者の投稿およびプロフィールから抽出されたキーワードに、前記ニュースソースユーザであるか否かおよび小集団内の利用者との接続数に基づいて、キーワードに重み付けを行い、重み付けられたキーワードに基づいて小集団に注釈付けする。
【選択図】図1

Description

本発明は、フェイスブック(Facebook)またはツイッター(Twitter)のようなマイクロブログシステムから、小集団を抽出し、各小集団に注釈付けする装置、方法およびプログラムに関する。
ツイッターのようなオンラインのマイクロブログシステムでは、利用者はお互いに情報を共有している。利用者は、他の利用者のアカウントに署名することによって、彼らが読みたい投稿を選択することができる。利用者は、例えば家族、友人、および同僚と接続された大きいパーソナルネットワークをよく有している。このオンラインマイクロブログシステムを効果的に利用するため、さまざまなアプリケーションが利用可能である。
例えば、フォロワー(Follower)/フォロウィー(Followee)を管理するためのアプリケーションがいくつか提供されている。なお、フォロワーとは、投稿に対してフォローしている人を示し、フォロウィーとは、逆に投稿がフォローされている人を示す。非特許文献1のTweetDeckは、利用者が属している小集団に応じて、利用者のフォロウィーの投稿を配列する。また、非特許文献2のMentionMap、および非特許文献3のTwitter Browserは、マイクロブログ利用者のパーソナルネットワークを抽出し、可視化する。
また、非特許文献7のNodeXLは、マイクロブログ利用者のパーソナルネットワークを取り込み、ネットワーク解析の分野での標準アルゴリズムであるCNM(Clauset-Newman-Moore)アルゴリズム(非特許文献4、5)、またはファジーC手段(Fuzzy C-means)アルゴリズム(非特許文献6)を用いて、ネットワークを小集団に分割する。非特許文献8は、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆文書頻度)法を用いて、ソーシャルネットワークサービスからキーワードを抽出する方法を開示している。なお、TF−IDF法は、非特許文献9で言及されたDF−IDF(document frequency-inverse document frequency:文書の出現頻度−逆文書頻度)法によって置き換えることができる。非特許文献10は、CNMアルゴリズムを用いて小集団を抽出し、TF−IDFとニュースソースユーザの識別を利用して、小集団を注釈する方法を提案する。
TweetDeck, http://www.tweetdeck.com/、[平成23年12月13日検索] MentionMap, http://apps.asterisq.com/mentionmap/、[平成23年12月13日検索] Twitter Browser, http://www.neuroproductions.be/twitter_friends_network_browser/、[平成23年12月13日検索] M. E. J. Newman and M. Girvan, "Finding and evaluating community structure in networks", Physical Review E, Vol. 69, No. 2, 2004 A. Clauset, M.E.J. Newman and C. Moore, "Finding community structure in very large networks", Physical Review E, Vol.70, No.6, 2004 J. C. Bezdek, "Pattern Recognition with Fuzzy Objective Function Algorithms", Plenum Press, New York, 1981 M. Smith, N. Milic-Frayling, B. Shneiderman, E. Mendes Rodrigues, J. Leskovec, C. Dunne, "NodeXL: a free and open network overview, discovery and exploration add-in for Excel 2007/2010", http://nodexl.codeplex.com/from the Social Media Research Foundation, http://www.smrfoundation.org、[平成23年12月13日検索] Z. Li, D. Zhou, Y. Juan, J. Han, "Keyword extraction for social snippets", Proceedings of the 19th international conference on World Wide Web, pages 1143-1144, 2010 Keiji Shinzato and Kentaro Torisawa, "Acquiring Hyponymy Relations from Web Documents", Proceedings of HLT-NAACL, pages 73-80, 2004 Maike Erdmann, Tomoya Takeyoshi, Keiichiro Hoashi, Chihiro Ono, "Extraction and Annotation of Personal Cliques from Social Networks", Proceedings of Forum on Information Technology (FIT), 2011
しかしながら、利用者が、フォロワー/フォロウィーの増加のため、パーソナルネットワークを小集団(例えば、家族、友人、同僚)に分割し、分類したいと思っても、既存のアプリケーションでは、このような要求を満たすことはできないという課題があった。
TweetDeckのようなアプリケーションでは、フォロワー/フォロウィーを手動で分類することに頼っている。これは時間がかかり困難であるという問題がある。
MentionMapおよびTwitter Browserのようなネットワーク可視化のアプリケーションは、Twitter利用者の選択されたフォロワー/フォロウィーを抽出するのみであり、パーソナルネットワークから小集団を抽出する機能を有していない。
NodeXLを用いて、利用者のパーソナルネットワークを自動的に小集団に分割し、可視化することは可能である。しかし、グラフ構造の可視化は、全体を把握するのは困難である。さらに、小集団のメンバ共通の興味を示すため、小集団に自動的に注釈付けする機能を備えていない。
非特許文献4、5のCNMおよび非特許文献6のファジーC手段クラスタリングのようなクラスタリングアルゴリズムは小集団を摘出するのみで、小集団に自動的に注釈付けを行わない。
非特許文献8のTF−IDF法によるキーワードの抽出は、マイクロブログ上に投稿された文章が、「短くかつ口語体である」ため、解析が難しいという問題を有している。さらに、利用者の投稿は、多くの「意味のない無駄話」を含んでおり、キーワード抽出方法は、フィルタされるべきノイズを含む結果となる。
非特許文献10で提案されたキーワード注釈方法は、ニュースソースユーザの抽出およびキーワード抽出が単純であり、キーワードの中に多くのノイズを有している。つまり、この方法によるキーワードは小集団の共通の興味を表していない場合もある。
したがって、本発明は、マイクロブログシステムから小集団を抽出し、この小集団を分類分けし、メンバ共通の興味を表すキーワードを注釈付けする装置、方法およびプログラムを提供することを目的とする。
上記目的を実現するため本発明による小集団を抽出し、注釈付けする装置は、投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、注釈付けする装置において、前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、パーソナルネットワークを抽出するパーソナルネットワーク抽出手段と、前記パーソナルネットワークを、フォロー関係に基づいて小集団に分割する分割手段と、前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別手段と、全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出手段と、前記キーワードに、前記ニュースソースユーザであるか否かおよび前記小集団内の利用者との接続数に基づいて、該キーワードに重み付けを行う重み付け手段と、前記重み付けられたキーワードに基づいて小集団に注釈付けする注釈手段とを備える。
また、前記分割手段は、CNMアルゴリズムまたはファジーC手段クラスタリングアルゴリズムを用いて、前記パーソナルネットワークを小集団に分割することも好ましい。
また、前記区別手段は、利用者のネットワーク関係及びコミュニケーション履歴に基づいてニュースソースユーザと一般ユーザを区別することも好ましい。
また、前記区別手段は、利用者のフォロウィー数に対するフォロワー数の比または利用者のフォロウィー数が所定の閾値より大きい場合、利用者の投稿の数または投稿の平均長が所定の閾値より大きい場合、利用者の投稿毎のハイパーリンクまたはハッシュタグの平均数が所定の閾値より大きい場合、または、利用者の投稿に含まれる特定のキーワードの頻度が所定の閾値より大きい場合、該利用者をニュースソースユーザと区別することも好ましい。
また、前記キーワード抽出手段は、DF−IDF法により、全利用者の投稿およびプロフィールからキーワードを抽出することも好ましい。
また、前記注釈手段は、前記重み付けられたキーワードの最大値が所定の閾値より大きい場合、該小集団を「興味ベースの小集団」と分類し、前記重み付けられたキーワードの最大値が所定の閾値以下であり、該小集団内の利用者の通信頻度が所定の閾値より大きい場合、該小集団を「所属ベースの小集団」と分類し、上記以外の小集団を「他の小集団」と分類することも好ましい。
また、前記注釈手段は、前記分類結果と前記キーワード抽出手段から抽出されたキーワードとで前記小集団を注釈付けすることも好ましい。
上記目的を実現するため本発明による小集団を抽出し、注釈付けする方法は、投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、注釈付けする方法において、前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、パーソナルネットワークを抽出するパーソナルネットワーク抽出ステップと、前記パーソナルネットワークを、フォロー関係に基づいて小集団に分割する分割ステップと、前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別ステップと、全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出ステップと、前記キーワードに、前記ニュースソースユーザであるか否かおよび前記小集団内の利用者との接続数に基づいて、該キーワードに重み付けを行う重み付けステップと、前記重み付けられたキーワードに基づいて小集団に注釈付けする注釈ステップとを有する。
上記目的を実現するため本発明によるプログラムは、投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、注釈付けするコンピュータを、前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、パーソナルネットワークを抽出するパーソナルネットワーク抽出手段と、前記パーソナルネットワークを、フォロー関係に基づいて小集団に分割する分割手段と、前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別手段と、全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出手段と、前記キーワードに、前記ニュースソースユーザであるか否かおよび前記小集団内の利用者との接続数に基づいて、該キーワードに重み付けを行う重み付け手段と、前記重み付けられたキーワードに基づいて小集団に注釈付けする注釈手段として機能させる。
本発明によれば、マイクロブログシステムから小集団が自動的に抽出され、注釈付けされる。このため、この小集団のメンバ共通の興味を理解でき、利用者がこの小集団にうまく加わることが可能になる。さらに、本発明は、抽出したキーワードの中で、ニュースや一般的な情報を配信するニュースソースユーザのキーワード、および小集団内の利用者との接続数が多い利用者のキーワードに高い重み付けを行っているため、注釈付けの精度が向上している。
本発明の装置の機能構成図を示す。 本発明の処理フローチャートを示す。 ホップの概念図を示す。 抽出されたパーソナルネットワークの例を示す。 図4のネットワークをファジーC手段アルゴリズムで分割した例を示す。 キーワード抽出・重み付けのフローチャートを示す。 図4のネットワークでの各利用者の重み付けを示す。 抽出されたキーワードとその値の例を示す。 小集団の分類・注釈付けのフローチャートを示す。 図4のネットワークでの注釈付けの例を示す。 ニュースソースユーザ区別のフローチャートを示す。
本発明を実施するための最良の実施形態について、以下では図面を用いて詳細に説明する。図1は、本発明の装置の機能構成図を示す。本発明は、パーソナルネットワーク抽出部1、小集団分割部2、通信記録抽出部3、ニュースソースユーザ区別部4、キーワード抽出部5、キーワード重み付け部6および小集団注釈部7から構成される。
パーソナルネットワーク抽出部1は、対象となる利用者のパーソナルネットワークを、マイクロブログシステムの中で誰がフォローし、誰がフォローされたかを収集することによって抽出する。
小集団分割部2は、対象となる利用者のパーソナルネットワークをフォロー関係に基づいて小集団に分割する。例えば、非特許文献4および5のCNMアルゴリズム、または非特許文献6のファジーC手段アルゴリズムを用いて、パーソナルネットワークを小集団に分割する。
通信記録抽出部3は、小集団の利用者の投稿とプロフィールを含む全ての通信記録をプレインテキストとして抽出する。
ニュースソースユーザ区別部4は、利用者のネットワーク接続特徴と通信記録に基づいて、各小集団の利用者を「ニュースソースユーザ」と「一般ユーザ」とに区別する。
キーワード抽出部5は、通信記録抽出部3が抽出した通信記録から、DF−IDF法によりキーワードとして重要語を抽出する。
キーワード重み付け部6は、抽出されたキーワードの中で、ニュースや一般的な情報を配信するニュースソースユーザのキーワード、および小集団内の利用者との接続数が多い利用者のキーワードに高い重み付けを行う。
小集団注釈部7は、キーワードの重み付けに基づいて、小集団をカテゴリ分類する。さらに、このキーワードで小集団を注釈付けする。
図2は、本発明の処理フローチャートを示す。以下、本フローチャートに従って、本発明の処理を詳細に説明する。
ステップ1:パーソナルネットワーク抽出。対象となるオンラインマイクロブログシステムの利用者のパーソナルネットワークを、この利用者に対して誰がフォローし、誰がフォローされたかを解析することによって抽出する。この抽出では、少なくとも、対象となる利用者から、少なくとも1.5ホップ範囲以上のフォロワーおよびフォロウィーを抽出する。
図3は、ホップの概念図を示す。矢印はフォローを行ったことを示す。図3(a)では、利用者1の投稿に、利用者2がフォローしたことを示す。この場合、利用者2は、利用者1から1ホップの位置にある。図3(b)では、さらに利用者2の投稿に、利用者3がフォローしたことを示す。この場合、利用者3は、利用者1から2ホップの位置にある。図3(c)では、さらに利用者1の投稿に、利用者3がフォローしたことを示す。この場合、利用者3は、利用者1から1ホップと2ホップの両方にあるため、1.5ホップの位置にある。
図4は、抽出されたパーソナルネットワークの例を示す。ここで中心の黒点が対象となる利用者であり、その周りの白点が、このパーソナルネットワークに属するの利用者、つまり、対象となる利用者のフォロワーおよびフォロウィーである。直線は、フォロワーまたはフォロウィー関係があることを示す。
ステップ2:パーソナルネットワークを小集団に分割。パーソナルネットワークからフォロー関係に基づいて小集団を抽出する。この抽出は非特許文献4および5のCNMアルゴリズムまたは非特許文献6のファジーC手段アルゴリズムで行うことができる。本実施形態では、ファジーC手段アルゴリズムを使用する。このファジーC手段アルゴリズムでは、小集団は重なりあうことができる。つまり、利用者はいくつかの小集団に同時に存在することができる。なお、対象となる利用者は、対象となる利用者をもとの小集団から除き、人工的に空の小集団に置く。
図5は、図4のネットワークをファジーC手段アルゴリズムで分割した例を示す。ここでは、パーソナルネットワーク内の利用者は楕円で囲まれた4つの小集団に分割される。対象となる利用者はどの小集団にも含まれない。
ステップ3:利用者のキーワード抽出・重み付け。各小集団の利用者毎に利用者の投稿およびプロフィール(通信記録)から、キーワードを抽出し、キーワードに値を付与し重み付けを行う。図6は、キーワード抽出・重み付けのフローチャートを示す。
ステップ31:フォロワーとフォロウィー関係の数算出。キーワード重み付けのため、小集団内で利用者のフォロワーとフォロウィー関係の数を算出する。例えば、利用者が小集団内の他のメンバ2人と接続している場合、この利用者のキーワードに対する重み付けは2になる。この重み付けを行うことによって、小集団の重要な利用者からのキーワードを強調することができる。多くのメンバと接続する利用者のキーワードは、取るに足らない利用者のキーワードよりも、小集団のメンバの共通の興味を表しているためである。
ステップ32:ニュースソースユーザ区別。利用者がニュースソースユーザであるか一般ユーザであるか区別する。この区別は、後で詳細に説明する。利用者がニュースソースである場合、キーワードの値は2倍になる。例えば、ニュースソースユーザが小集団内の他のメンバ2人と接続している場合、この利用者のキーワードに対する重み付けは2×2=4になる。
ニュースソースユーザは、ニュースや一般的な情報を投稿するユーザであり、主に個人的な情報を投稿する一般ユーザより、意味のない無駄話等のノイズが少ないと考えられる。そのため、ニュースソースユーザから抽出した投稿に高い重み付けを割り当て、優先度を上げることで、小集団の注釈付け精度を向上させる。
図7は、図4のネットワークでの各利用者の重み付けを示す。ここでニュースソースユーザは、図で影付きで示されている。例えば、右下の小集団の一番上の利用者は、小集団の利用者とフォロワーとフォロウィー関係数は1であり、ニュースソースであるため、重み付けは2になる。なお、この利用者は右上の小集団の一番下の利用者と同一人物であるが、利用者のキーワード抽出・重み付けは、小集団毎に行われるため、小集団毎に重み付けが算出される。
ステップ33:キーワード抽出。利用者の通信記録からDF−IDF法によりキーワードとして重要なM個の語を抽出する(Mは、あらかじめ定めた1以上の整数)。なお、DF−IDF法による抽出とは、通信記録を形態素解析し、抽出された単語に対してDF−IDF値を求め、DF−IDF値が、上位M件の語をキーワードとすることである。
ステップ34:キーワード重み付け。上記で抽出されたキーワードの値に対して、上記で算出された重み付けが掛けられる。
このステップ3は、小集団の利用者全てに対して繰り返される。図8は、抽出されたキーワードとその値の例を示す。図8(a)は、1つの小集団に4人の利用者がいた場合における各利用者のキーワードとその値を示す。
ステップ4:全利用者のキーワードを結合、並べ替え。小集団の全利用者のキーワードが結合される。この際、重複したキーワードに対しては、値が加算される。このキーワードのリストを並べ替えする。図8(b)は、図8(a)のキーワードを結合し、並べ替えをした結果を示す。
ステップ5:小集団の分類・注釈付け。小集団を以下の3つのカテゴリに分類し、注釈付けする。
・興味ベースの小集団
・所属ベースの小集団
・他の小集団
図9は、小集団の分類・注釈付けのフローチャートを示す。
ステップ61:最初にキーワードの最大値を確認する。この値が所定の閾値より大きい場合、この小集団は、「興味ベースの小集団」と分類する。
ステップ62:上記最大値が所定の閾値以下である場合、小集団の利用者がどのくらい頻繁にお互いに通信しているか調べる。小集団の利用者内の通信頻度が所定の閾値より大きい場合、この小集団は「所属ベースの小集団」と分類する。
ステップ63:これ以外の小集団は「他の小集団」と分類する。
例えば、図8(b)において、キーワードの最大値は18である。所定の閾値が17以下である場合、この小集団は「興味ベースの小集団」と分類される。逆に所定の閾値が18以上である場合、小集団内の通信頻度により、「所属ベースの小集団」または「他の小集団」に分類される。
各小集団をカテゴリに分類することにより、利用者は、小集団がどのような小集団であるかを直感的に理解できる。
このステップ3からステップ6は、小集団毎に行われる。ここで求められた分類とキーワードにより、各小集団に注釈付けが行われる。図10は、図4のネットワークでの注釈付けの例を示す。下線が小集団の分類を示し、その下がキーワードを示す。
図11は、ニュースソースユーザ区別のフローチャートを示す。
ステップ321:フォロウィー数に対するフォロワー数の比(フォロワー数/フォロウィー数)または利用者のフォロウィー数が所定の閾値より大きい場合、この利用者をニュースソースユーザとする。
ステップ322:投稿の数または投稿の平均長が所定の閾値より大きい場合、この利用者をニュースソースユーザとする。
ステップ323:投稿毎のハイパーリンクまたはハッシュタグの平均数が所定の閾値より大きい場合、この利用者をニュースソースユーザとする。
ステップ324:投稿に含まれる特定のキーワード(事前に設定したキーワード)の頻度が所定の閾値より大きい場合、この利用者をニュースソースユーザとする。なお、特定のキーワードは、新聞、ニュース等で出てきた言葉であり、事前に設定される。
ステップ325:上記以外は、一般ユーザとする。
なお、上記実施形態は、フェイスブックまたはツイッターようなオンラインマイクロブログシステムの形態で説明された。しかしながら、本発明は、オンラインマイクロブログシステムだけに限定されるものではない。利用者による投稿と、この投稿に対しコメントを付与する(フォロー)関係が存在するネットワーク形態に対し適用可能である。
本発明による小集団を抽出し、注釈付けする方法は、コンピュータを、上述した各ステップを機能させるプログラムにより実現することができる。これらコンピュータプログラムは、コンピュータが読み取り可能な記憶媒体に記憶されて、又は、ネットワーク経由で配布が可能なものである。さらに、本発明は、ハードウェア及びソフトウェアの組合せによっても実現可能である。
また、以上述べた実施形態は全て本発明を例示的に示すものであって限定的に示すものではなく、本発明は他の種々の変形態様および変更態様で実施することができる。従って本発明の範囲は特許請求の範囲およびその均等範囲によってのみ規定されるものである。
1 パーソナルネットワーク抽出部
2 小集団分割部
3 通信記録抽出部
4 ニュースソースユーザ区別部
5 キーワード抽出部
6 キーワード重み付け部
7 小集団注釈部

Claims (9)

  1. 投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、注釈付けする装置において、
    前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、パーソナルネットワークを抽出するパーソナルネットワーク抽出手段と、
    前記パーソナルネットワークを、フォロー関係に基づいて小集団に分割する分割手段と、
    前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別手段と、
    全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出手段と、
    前記キーワードに、前記ニュースソースユーザであるか否かおよび前記小集団内の利用者との接続数に基づいて、該キーワードに重み付けを行う重み付け手段と、
    前記重み付けられたキーワードに基づいて小集団に注釈付けする注釈手段と、
    を備えることを特徴とする小集団を抽出し、注釈付けする装置。
  2. 前記分割手段は、CNMアルゴリズムまたはファジーC手段クラスタリングアルゴリズムを用いて、前記パーソナルネットワークを小集団に分割することを特徴とする請求項1に記載の装置。
  3. 前記区別手段は、利用者のネットワーク関係及びコミュニケーション履歴に基づいてニュースソースユーザと一般ユーザを区別することを特徴とする請求項1または2に記載の装置。
  4. 前記区別手段は、
    利用者のフォロウィー数に対するフォロワー数の比または利用者のフォロウィー数が所定の閾値より大きい場合、
    利用者の投稿の数または投稿の平均長が所定の閾値より大きい場合、
    利用者の投稿毎のハイパーリンクまたはハッシュタグの平均数が所定の閾値より大きい場合、または、
    利用者の投稿に含まれる特定のキーワードの頻度が所定の閾値より大きい場合、
    該利用者をニュースソースユーザと区別することを特徴とする請求項1または2に記載の装置。
  5. 前記キーワード抽出手段は、DF−IDF法により、全利用者の投稿およびプロフィールからキーワードを抽出することを特徴とする請求項1から4のいずれか1項に記載の装置。
  6. 前記注釈手段は、
    前記重み付けられたキーワードの最大値が所定の閾値より大きい場合、該小集団を「興味ベースの小集団」と分類し、
    前記重み付けられたキーワードの最大値が所定の閾値以下であり、該小集団内の利用者の通信頻度が所定の閾値より大きい場合、該小集団を「所属ベースの小集団」と分類し、
    上記以外の小集団を「他の小集団」と分類することを特徴とする請求項1から5のいずれか1項に記載の装置。
  7. 前記注釈手段は、前記分類結果と前記キーワード抽出手段から抽出されたキーワードとで前記小集団を注釈付けすることを特徴とする請求項6に記載の装置。
  8. 投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、注釈付けする方法において、
    前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、パーソナルネットワークを抽出するパーソナルネットワーク抽出ステップと、
    前記パーソナルネットワークを、フォロー関係に基づいて小集団に分割する分割ステップと、
    前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別ステップと、
    全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出ステップと、
    前記キーワードに、前記ニュースソースユーザであるか否かおよび前記小集団内の利用者との接続数に基づいて、該キーワードに重み付けを行う重み付けステップと、
    前記重み付けられたキーワードに基づいて小集団に注釈付けする注釈ステップと、
    を有することを特徴とする小集団を抽出し、注釈付けする方法。
  9. 投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、注釈付けするコンピュータを、
    前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、パーソナルネットワークを抽出するパーソナルネットワーク抽出手段と、
    前記パーソナルネットワークを、フォロー関係に基づいて小集団に分割する分割手段と、
    前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別手段と、
    全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出手段と、
    前記キーワードに、前記ニュースソースユーザであるか否かおよび前記小集団内の利用者との接続数に基づいて、該キーワードに重み付けを行う重み付け手段と、
    前記重み付けられたキーワードに基づいて小集団に注釈付けする注釈手段と、
    して機能させることを特徴とするプログラム。
JP2012001027A 2012-01-06 2012-01-06 マイクロブログシステムから小集団を抽出し、注釈付けする装置、方法およびプログラム Pending JP2013140535A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012001027A JP2013140535A (ja) 2012-01-06 2012-01-06 マイクロブログシステムから小集団を抽出し、注釈付けする装置、方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012001027A JP2013140535A (ja) 2012-01-06 2012-01-06 マイクロブログシステムから小集団を抽出し、注釈付けする装置、方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2013140535A true JP2013140535A (ja) 2013-07-18

Family

ID=49037900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012001027A Pending JP2013140535A (ja) 2012-01-06 2012-01-06 マイクロブログシステムから小集団を抽出し、注釈付けする装置、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2013140535A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015097025A (ja) * 2013-11-15 2015-05-21 日本電信電話株式会社 プロフィール語抽出装置、プロフィール語抽出方法およびプロフィール語抽出プログラム
JP2016062364A (ja) * 2014-09-18 2016-04-25 Kddi株式会社 ユーザ分析装置、ユーザ分析方法、およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010165097A (ja) * 2009-01-14 2010-07-29 Ntt Docomo Inc 人間関係推定装置、及び、人間関係推定方法
US20110258203A1 (en) * 2010-04-16 2011-10-20 Wouhaybi Rita H Methods and systems for relationship characterization and utilization from a user's social networks

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010165097A (ja) * 2009-01-14 2010-07-29 Ntt Docomo Inc 人間関係推定装置、及び、人間関係推定方法
US20110258203A1 (en) * 2010-04-16 2011-10-20 Wouhaybi Rita H Methods and systems for relationship characterization and utilization from a user's social networks

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
CSNG200501096005; 新里 圭司 外1名: '"HTML文書からの単語間の上位下位関係の自動獲得"' 自然言語処理 第12巻,第1号, 20050110, p.133-134, 言語処理学会 *
CSNG201100504009; 春木 良且 外2名: '"ソーシャル・プロフィールの解析と分類の試み"' 電子情報通信学会技術研究報告 第111巻,第119号, 20110630, p.43〜48, 社団法人電子情報通信学会 *
CSNJ201110057052; エルドマン マイケ 外3名: '"Extraction and Annotation of Personal Cliques from Social Networks"' FIT2011 第10回情報科学技術フォーラム 講演論文集 第1分冊 査読付き論文・一般論文 モデル , 20110822, p.239〜240, 一般社団法人情報処理学会 社団法人電子情報通信学会 *
JPN6015008097; エルドマン マイケ 外3名: '"Extraction and Annotation of Personal Cliques from Social Networks"' FIT2011 第10回情報科学技術フォーラム 講演論文集 第1分冊 査読付き論文・一般論文 モデル , 20110822, p.239〜240, 一般社団法人情報処理学会 社団法人電子情報通信学会 *
JPN6015008098; 春木 良且 外2名: '"ソーシャル・プロフィールの解析と分類の試み"' 電子情報通信学会技術研究報告 第111巻,第119号, 20110630, p.43〜48, 社団法人電子情報通信学会 *
JPN6015008099; 新里 圭司 外1名: '"HTML文書からの単語間の上位下位関係の自動獲得"' 自然言語処理 第12巻,第1号, 20050110, p.133-134, 言語処理学会 *
JPN6015008101; 高木 允 外4名: '"ブログユーザ空間からの頻出なコミュニティ抽出法"' 電子情報通信学会 第18回データ工学ワークショップ論文集 [online] , 20070601, 電子情報通信学会データ工学研究専門委員会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015097025A (ja) * 2013-11-15 2015-05-21 日本電信電話株式会社 プロフィール語抽出装置、プロフィール語抽出方法およびプロフィール語抽出プログラム
JP2016062364A (ja) * 2014-09-18 2016-04-25 Kddi株式会社 ユーザ分析装置、ユーザ分析方法、およびプログラム

Similar Documents

Publication Publication Date Title
Zhao et al. Real-time multimedia social event detection in microblog
Iqbal et al. A unified data mining solution for authorship analysis in anonymous textual communications
Del Vicario et al. News consumption during the Italian referendum: A cross-platform analysis on facebook and twitter
Barbier et al. Provenance data in social media
Lee et al. Campaign extraction from social media
Pan et al. Social media-based user embedding: A literature review
Thapen et al. The early bird catches the term: combining twitter and news data for event detection and situational awareness
Romsaiyud et al. Automated cyberbullying detection using clustering appearance patterns
Santoso et al. Early investigation of proposed hoax detection for decreasing hoax in social media
US9020863B2 (en) Information processing device, information processing method, and program
TWI254880B (en) Method for classifying electronic document analysis
Bani-Hani et al. A semantic model for context-based fake news detection on social media
Alzahrani et al. Finding organizational accounts based on structural and behavioral factors on twitter
JP5734118B2 (ja) ソーシャルネットワークから小集団を抽出し、名前付け、並びに可視化する方法およびプログラム
Rizzo et al. Shaping city neighborhoods leveraging crowd sensors
JP2013140535A (ja) マイクロブログシステムから小集団を抽出し、注釈付けする装置、方法およびプログラム
Minab et al. A new sentiment classification method based on hybrid classification in Twitter
Phuvipadawat et al. Detecting a multi-level content similarity from microblogs based on community structures and named entities
Modupe et al. Filtering of mobile short messaging service communication using latent Dirichlet allocation with social network analysis
Jayashree et al. Social network mining for predicting users’ credibility with optimal feature selection
Hoang et al. Modeling topics and behavior of microbloggers: An integrated approach
Li et al. Detection of fake-video uploaders on social media using Naive Bayesian model with social cues
López-Ramírez et al. Geographical aggregation of microblog posts for LDA topic modeling
Vasanthakumar et al. PFU: Profiling Forum users in online social networks, a knowledge driven data mining approach
Enoki et al. User community reconstruction using sampled microblogging data

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130408

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130531

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130606

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150304

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150708