JP5734118B2 - Extract the small population from a social network, named, as well as a method to visualize and program - Google Patents

Extract the small population from a social network, named, as well as a method to visualize and program Download PDF

Info

Publication number
JP5734118B2
JP5734118B2 JP2011147607A JP2011147607A JP5734118B2 JP 5734118 B2 JP5734118 B2 JP 5734118B2 JP 2011147607 A JP2011147607 A JP 2011147607A JP 2011147607 A JP2011147607 A JP 2011147607A JP 5734118 B2 JP5734118 B2 JP 5734118B2
Authority
JP
Grant status
Grant
Patent type
Prior art keywords
user
network
step
small
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011147607A
Other languages
Japanese (ja)
Other versions
JP2013015973A (en )
Inventor
エルドマン マイケ
エルドマン マイケ
広海 石先
広海 石先
朋也 武吉
朋也 武吉
Original Assignee
Kddi株式会社
Kddi株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Grant date

Links

Images

Description

本発明は、フェイスブック(Facebook)またはツイッター(Twitter)のようなオンラインソーシャルネットワーキングサービス(SNS)から、小集団を抽出し、各小集団の特徴を表すキーワードを名前付け、小集団を可視化する方法およびプログラムに関する。 The present invention relates to a method from the face book (Facebook) or Twitter online social networking services, such as the (Twitter) (SNS), to extract the small group, to visualize the naming, small group keywords that describe the characteristics of each small group and a program.

フェイスブックまたはツイッターようなオンラインのソーシャルネットワーキングサービスでは、利用者はお互いに情報を共有している。 In the face book or online social networking services such as Twitter, users share the information with each other. 利用者は、これらの情報に従って、彼らが読みたい投稿を選択している。 The user, in accordance with these information, has selected the post they want to read. ソーシャルネットワーキングサービスを効果的に利用するため、多くのアプリケーションが提供されている。 To use social networking services effectively, many applications are provided.

例えば、フォロワー(Follower)/フォロウィー(Followee)を管理するためのアプリケーションがいくつか提供されている。 For example, followers (Follower) / Forowi (followee) application for managing are provided several. なお、フォロワーとは、投稿に対してフォローしている人を示し、フォロウィーとは、逆に投稿がフォローされている人を示す。 In addition, followers and shows the people that are following to the post, the Forowi, show the people that reverse to the post have been follow-up. 非特許文献1のTweetDeckは、利用者が属している小集団に応じて、利用者のフォロウィーの投稿を配列する。 TweetDeck Non-Patent Document 1, depending on the subset to which they belong user arranges posts Forowi user. また、非特許文献2のMentionMap、および非特許文献3のTwitter Browserは、SNS利用者のパーソナルネットワークを抽出し、可視化する。 Further, in Non-Patent Document 2 MentionMap, and Twitter Browser in non-patent document 3 extracts the personal network of SNS user to visualize.

また、非特許文献5のNodeXLは、SNS利用者のパーソナルネットワークを取り込み、ネットワーク解析の分野での標準アルゴリズムであるCNM(Clauset-Newman-Moore)アルゴリズム(非特許文献4)を用いて、ネットワークを小集団に分割する。 Further, NodeXL of Non-Patent Document 5 takes a personal network of SNS user, using a standard algorithm in the field of network analysis CNM (Clauset-Newman-Moore) algorithm (non-patent document 4), the network divided into small groups. また、NodeXLは、Harel-KorenのFast Multiscaleアルゴリズム(非特許文献7)を用いて、ネットワークを可視化する。 Further, NodeXL, using the Fast Multiscale algorithm Harel-Koren (Non-Patent Document 7), a network visualization. 非特許文献6は、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)法を用いて、SNSからキーワードを抽出する方法を開示している。 Non-Patent Document 6, TF-IDF (Term Frequency - Inverse Document Frequency: word frequency - inverse document frequency) using the method, discloses a method of extracting a keyword from the SNS.

しかしながら、利用者が、フォロワー/フォロウィーの増加のため、パーソナルネットワークを小集団に分割し、分類したいと思っても、既存のアプリケーションでは、このような要求を満たすことはできないという課題があった。 However, the user, because of the increase of followers / Forowi, to divide the personal network in a small population, also want to classify, with existing applications, there is a problem that can not be met such requirements.

TweetDeckのようなアプリケーションでは、フォロワー/フォロウィーを手動で分類することに頼っている。 In applications such as TweetDeck, it relies on to classify the followers / Forowi manually. これは時間がかかり困難であるという問題がある。 This is a problem that it is time-consuming and difficult.

MentionMapおよびTwitter Browserのようなネットワーク可視化のアプリケーションは、Twitter利用者の選択されたフォロワー/フォロウィーを抽出するのみであり、、パーソナルネットワークから小集団を抽出する機能を有していない。 Applications of network visualization such as MentionMap and Twitter Browser does not have a function of extracting a subset from alone is ,, personal network to extract the selected followers / Forowi of Twitter users.

NodeXLを用いて、利用者のパーソナルネットワークを自動的に小集団に分割し、可視化することは可能である。 Using NodeXL, automatically divided into small groups personal network of the user, it is possible to visualize. しかし、グラフ構造の可視化は、全体を把握するのは困難である。 However, visualization of the structure of the graph, it is difficult to grasp the whole. さらに、小集団のメンバ共通の興味を示すため、小集団に自動的に名前付けする機能を備えていない。 In addition, in order to show the members common interests of the small group, it does not have the capability to automatically put name in small groups.

非特許文献6のTF−IDF法によるキーワードの抽出は、SNS上に投稿された文章が、「短くかつ口語体である」ため、解析が難しいという問題を有している。 Extraction of Keywords by TF-IDF method in Non-Patent Document 6, the text posted on the SNS, "a short and colloquial" Therefore, there is a problem that analysis is difficult. さらに、利用者の投稿は、多くの「意味のない無駄話」を含んでおり、キーワード抽出方法は、フィルタされるべきノイズを含む結果となる。 In addition, the post of the user, contains the "idle talk without meaning" many, keyword extraction method may result, including the noise to be filtered.

したがって、本発明は、ソーシャルネットワークから小集団を抽出し、この小集団のメンバ共通の興味を表すキーワードを名前付け、並びに可視化する方法およびプログラムを提供することを目的とする。 Accordingly, the present invention extracts a subset from a social network, named a keyword representing the members common interest of this subset, and an object of the invention to provide a method and a program to visualize.

上記目的を実現するため本発明による小集団を抽出し、名前付けする方法は、投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、名前付けする方法において、前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、 該特定の利用者と該特定の利用者から所定数ホップ範囲内のフォロワーとフォロウィーが構成するパーソナルネットワークを抽出するネットワーク抽出ステップと、前記パーソナルネットネットワークを、フォロー関係に基づいて小集団に分割する分割ステップと、前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別ステップと、前記ニュースソースユーザの投稿およびプロフィールに、一 Extract the small group according to the invention for realizing the above objects, a method of attaching the name from the possible network applying a comment on posts, to extract the small groups, a method of attaching a name, the network from, based on the follow-relation to a particular user, a network extraction step of followers Forowi within a predetermined number of hops range from the specific user and the particular user extracts the personal network configuration, the personal net network, a dividing step of dividing into small groups based on the follow-relationship, wherein the user included in the small group, and news source user to post news or general information, distinction distinguishes the other general users and the step, the post and the profile of the news source user, one ユーザの投稿およびプロフィールより高い重み付けを行い、 前記小集団に含まれる全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出ステップと、前記抽出したキーワードに基づいて、前記小集団に名前付けする名前付けステップと、前記区別ステップから前記名前付けステップを、 分割されたすべての小集団に行うステップとを含む。 Performs user posts and higher profile weighting said a keyword extraction step of extracting a keyword from the posts and profile of all users included in the small group, based on keywords that the extracted, to give names to the small group name comprising the steps with, the naming step from said distinguishing step, and performing the divided every subset.

また、前記小集団をノードとし、前記フォロー関係をエッジとして、前記パーソナルネットワークのグラフを作成するステップをさらに含むことも好ましい。 Further, the small population as nodes, the follow relations as an edge, it is also preferable to further include the step of creating a graph of the personal network.

また、前記グラフを作成するステップは、Fast Multiscaleアルゴリズムを用いて、前記特定の利用者が空の小集団におかれ、ノードの大きさが小集団の中の利用者数を表し、エッジの太さが小集団間の接続の数を表すグラフを作成することも好ましい。 Further, the step of generating the graph, using the Fast Multiscale algorithm, the specific user is placed in an empty subset represents the number of users in the magnitude subset of nodes, the edge thickness It is that it is also preferable to create a chart that represents the number of connections between subpopulations.

また、前記分割ステップは、CNMアルゴリズムを用いて、前記パーソナルネットワークを小集団に分割することも好ましい。 Further, the dividing step, using a CNM algorithm, it is also preferable to divide the personal network to small groups.

また、前記区別ステップは、利用者のネットワーク関係及びコミュニケーション履歴に基づいてニュースソースユーザと一般ユーザを区別することも好ましい。 Furthermore, the distinction step, it is preferable to distinguish between news sources and General Users based on the network relationship and communication history of the user.

また、前記区別ステップは、利用者のフォロワーとフォロウィー関係から得られる係数αを計算するステップと、利用者の投稿数から得られる係数βを計算するステップと、利用者の投稿したテキストに含まれるキーワードの頻度から得られる係数γを計算するステップとを有し、前記係数群から評価関数Sを計算し、該評価関数Sからニュースソースユーザを判別することも好ましい。 Furthermore, the distinction step includes calculating a α coefficient obtained from the user's followers and Forowi relationship, calculating a β coefficients derived from the posts of the user, the text posted by the user and a step of calculating the coefficients obtained from the frequency of the keyword gamma, the evaluation function S from the coefficient group calculated, it is also preferable to determine the news source user from the evaluation function S.

また、前記キーワード抽出ステップは、TF−IDF法により、全利用者の投稿およびプロフィールからキーワードを抽出することも好ましい。 Also, the keyword extraction step, the TF-IDF method, it is also preferable to extract keywords from the posts and profile of all users.

上記目的を実現するため本発明によるプログラムは、投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、名前付けするコンピュータを、前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、 該特定の利用者と該特定の利用者から所定数ホップ範囲内のフォロワーとフォロウィーが構成するパーソナルネットワークを抽出するネットワーク抽出手段と、前記パーソナルネットネットワークを、フォロー関係に基づいて小集団に分割する分割手段と、前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別手段と、前記ニュースソースユーザの投稿およびプロフィールに、一般ユーザの投稿およびプロフィール Program according to the present invention for achieving the above object, from the possible network applying a comment on posts, to extract the small groups, the computer name that names, from the network, follow relation to a particular user based on the network extracting means followers Forowi within a predetermined number of hops range from the specific user and the particular user extracts the personal network constituting, the personal net network, based on the follow relations small dividing means for dividing the population, said user included in the small group, and news source user to post news or general information, and distinguishes distinction means other general users, posts the news source user and in profile, the general user posts and profile 高い重み付けを行い、 前記小集団に含まれる全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出手段と、前記抽出したキーワードに基づいて、前記小集団に名前付けする名前付け手段と、前記区別手段から前記名前付け手段を、 分割されたすべての小集団に行う手段として機能させる。 Performs a high weighting Ri, said the keyword extraction means for extracting a keyword from all users of the post and the profile that is included in the small group, based on the keywords that the extracted, the naming means that give name to the small populations, said the naming means from the distinction means, to function as a means for performing the divided every subset.

本発明によれば、ソーシャルネットワークから小集団が自動的に抽出され、この小集団のメンバ共通の興味を表すキーワード(スポーツ、音楽、政治、技術など)が付与される。 According to the present invention, a small group from the social network is automatically extracted, keyword representing the members common interests of this small population (sports, music, politics, technology, etc.) is given. さらに、本発明は、ニュースや一般的な情報を配信するニュースソースユーザの投稿からのキーワードの優先度を上げているため、名前付けの精度が向上している。 In addition, the present invention is, because they raise the keyword priority from the post of the news source user to deliver the news and general information, has improved the naming of accuracy.

本発明の機能構成図を示す。 It shows a functional block diagram of the present invention. 本発明の処理フローチャートを示す。 It shows a process flow chart of the present invention. ホップの概念図を示す。 It shows a conceptual diagram of the hop. 抽出されたパーソナルネットワークの例を示す。 An example of the extracted personal network. 図3のネットワークをCNMアルゴリズムで分割した例を示す。 It shows an example of dividing by CNM algorithm the network in Figure 3. 小集団をノードとして表現した例を示す。 An example representing the small group as a node.

本発明を実施するための最良の実施形態について、以下では図面を用いて詳細に説明する。 The best mode for carrying out the present invention will be described in detail with reference to the drawings in the following. 図1は、本発明の機能構成図を示す。 Figure 1 shows a functional block diagram of the present invention. 本発明は、パーソナルネットワーク抽出部1、小集団分割部2、投稿プロフィール抽出部3、ニュースソースユーザ区別部4、小集団名前付け部5、および小集団可視化部6から構成される。 The present invention may be a personal network extraction unit 1, a small population dividing unit 2, post profile extraction section 3, news source user differentiation portion 4, and a small population naming unit 5, and a small population visualizing unit 6.

パーソナルネットワーク抽出部1は、対象となる利用者のパーソナルネットワークを、利用者に対して誰がフォローし、誰がフォローされたかを解析することによって抽出する。 Personal Network extraction unit 1, a personal network of the user of interest, who follow to the user, who is extracted by analyzing whether followers.

小集団分割部2は、対象となる利用者のパーソナルネットワークをフォロー関係に基づいて小集団に分割する。 Subpopulations dividing unit 2 divides into small groups based on the personal network of the user of interest to follow the relationship. 例えば、非特許文献4のCNMアルゴリズムを用いて、ネットワークを小集団に分割する。 For example, using a CNM algorithm in Non-Patent Document 4, to divide the network into small groups.

投稿プロフィール抽出部3は、小集団の利用者のプロフィールと全ての投稿をプレインテキストとして抽出する。 Posted profile extraction unit 3 extracts the profile and all of the post of the user of the small group as plain text. 可能ならば、利用者の通信記録も収集する。 If possible, also to collect communication record of the user.

ニュースソースユーザ区別部4は、各小集団の利用者を「ニュースソースユーザ」と「一般ユーザ」とに区別する。 News source user distinction unit 4, to distinguish the user of each of the small population and the "news source user" and "general user".

小集団名前付け部5は、キーワードで小集団を名前付けを行う。 The small group naming section 5, performed by naming a small population keyword. 利用者のプロフィールと全ての投稿のプレインテキストから、TF−IDF法によりキーワードとして重要語を抽出する。 From the user's profile and plain text of every post, to extract the important word as a keyword by the TF-IDF method. この際、ニュースソースユーザの投稿に高い重み付けを割り当て、優先度を上げる。 In this case, assign a higher weighting to the post of the news source user, increase the priority.

小集団可視化部6は、対象となる利用者を空の小集団に置き、小集団と小集団との接続関係を可視化する。 Small group visualization unit 6, place the user to be an empty subset, visualizing the connections between the subset and the subset. 可視化の際、小集団の中の利用者数でノードの大きさを変えて表示する。 During the visualization, it is displayed in a different size of the nodes in the number of users in the subset. さらに、小集団間のエッジで、フォロワー/フォロウィーの関係を示し、エッジの太さで利用者の接続の数を示す。 Further, at the edge between subpopulations, shows the relationship between the followers / Forowi indicates the number of users in connection with the thickness of the edge.

図2は、本発明の処理フローチャートを示す。 Figure 2 shows a process flow chart of the present invention. 以下、本フローチャートに従って、本発明の処理を詳細に説明する。 Hereinafter, in accordance with this flowchart, the processing of the present invention in detail.

ステップ1:パーソナルネットワーク抽出。 Step 1: personal network extraction. 対象となるオンラインソーシャルネットワーキングサービスの利用者のパーソナルネットワークを、この利用者に対して誰がフォローし、誰がフォローされたかを解析することによって抽出する。 The personal network of users of the online social networking service in question, who is to follow for this user, who will be extracted by analyzing whether the follow-up. この抽出では、対象となる利用者から、少なくとも1.5ホップ範囲以上のフォロワー/フォロウィーを抽出する。 In this extraction, from the user as the Target, extracting at least 1.5 hop range of followers / Forowi. すなわち、1.5ホップ範囲を下限として、それ以上にホップ数範囲を設定し、そのホップ数範囲内のフォロワー/フォロウィーを抽出する。 That is, the lower limit of 1.5 hops range, more in setting the hop count range, extracts a follower / Forowi in that hop frequency range.

図3は、ホップの概念図を示す。 Figure 3 is a conceptual diagram of hops. 矢印はフォローを行ったことを示す。 The arrow indicates that you have done the follow-up. 図3(a)では、利用者1の投稿に、利用者2がフォローしたことを示す。 In FIG. 3 (a), the posts of the user 1, indicating that the user 2 were followed. この場合、利用者2は、利用者1から1ホップの位置にある。 In this case, user 2 is from the user 1 to the position of the 1-hop. 図3(b)では、さらに利用者2の投稿に、利用者3がフォローしたことを示す。 In FIG. 3 (b), further of the user 2 post, indicating that the user 3 has to follow. この場合、利用者3は、利用者1から2ホップの位置にある。 In this case, the user 3, from user 1 to the position of the two-hop. 図3(c)では、さらに利用者1の投稿に、利用者3がフォローしたことを示す。 In FIG. 3 (c), further of the user 1 post, indicating that the user 3 has to follow. この場合、利用者3は、利用者1から1ホップと2ホップの両方にあるため、1.5ホップの位置にある。 In this case, the user 3, for from user 1 for both one-hop and two hops, in the position of 1.5 hops.

図4は、抽出されたパーソナルネットワークの例を示す。 Figure 4 shows an example of the extracted personal network. ここで1で示される点が対象となる利用者である。 Here the point indicated by 1 is a user of interest.

ステップ2:パーソナルネットワークを小集団に分割。 Step 2: divide the personal network in small groups. パーソナルネットワークをフォロー関係に基づいて小集団に分割する。 Divided into small groups on the basis of a personal network in follow-up relationship. 本実施形態では、非特許文献4のCNMアルゴリズムを用いて、ネットワークを小集団に分割する。 In the present embodiment, by using a CNM algorithm in Non-Patent Document 4, to divide the network into small groups. 一般に、対象となる利用者はいくつかの小集団に属する。 In general, the subject user belongs to some of the small group. しかし、CNMアルゴリズムは、ハードクラスタリングであるため、利用者は1つの小集団に属することしかできない。 However, CNM algorithm, because it is a hard clustering, the user can only belong to one of the small group. そのため、対象となる利用者をもとの小集団から除き、人工的に空の小集団に置く。 Therefore, except for the user to be from the original small group, put in artificially empty small group.

図5は、図4のネットワークをCNMアルゴリズムで分割した例を示す。 Figure 5 shows an example of dividing by CNM algorithm network of FIG. ここでは、3つの小集団に分割される。 Here is divided into three subpopulations. 対象となる利用者は一番上の小集団に含まれるが、この小集団から取り除かれる。 Although the user is included in the small group of the top of interest, it is removed from this small population.

ステップ3:利用者のプロフィールと投稿を抽出。 Step 3: Extract a post with the user's profile. 各小集団の利用者のプロフィールと全ての投稿をプレインテキストとして抽出する。 The profile and all of the post of the user of each small group is extracted as plain text. 可能ならば、利用者の通信記録も収集する。 If possible, also to collect communication record of the user.

ステップ4:利用者が「ニュースソースユーザ」であるか確認。 Step 4: Check if the user is a "news source user". 各小集団の利用者を「ニュースソースユーザ」と「一般ユーザ」とに区別する。 Distinguish the user of each of the small population and the "news source user" and "general user". 例えば、ユーザのコミュニケーションの履歴やネットワーク関係を利用してニュースソースユーザと一般ユーザを区別することが可能である。 For example, it is possible to distinguish the news source user and the general user to use the communication of history and network relationship of the user. あるユーザのフォロワー・フォロウィーの関係から算出される係数をα、投稿者IDの投稿数から算出される係数β、投稿に含まれるキーワードの出現頻度から算出される係数をγとすると、ユーザXがニュースソースユーザであるかどうかを判別する評価関数S以下のように求めることが可能である。 The coefficients to be calculated from the relationship of a follower Forowi of a user α, coefficient which is calculated from the number of posts contributor ID β, and the coefficient which is calculated from the frequency of occurrence of the keyword that is included in the post and γ, the user X It can be obtained as follows evaluation function S to determine whether a news source user.

S=α+β+γ S = α + β + γ
例えば、S>N(Nは事前に設定した閾値、N=2など)を満たす場合にユーザがニュースソースであると判別することなどが可能である。 For example, it is possible such that the user is determined to be in news sources when satisfying S> N (N is a threshold set in advance, N = 2, etc.). 尚、αは例えばフォロワー数とフォロウィー数の比を利用することが可能である。 Incidentally, alpha is able to utilize the followers and Forowi number ratio, for example. βは投稿数と平均的投稿数の比で算出することが可能である。 β is capable of calculating the ratio of average posts and posts. また、γは事前に設定したキーワードの出現頻度などで算出可能である。 In addition, γ can be calculated in such as the frequency of occurrence of keywords that are set in advance. 尚、αβγは3つに絞る必要はなく、追加で設定することも可能。 Incidentally, Arufabetaganma need not squeeze the three, it can also be set in addition. αβγの計算方法はこの限りではない。 Method of calculating the αβγ is not limited to this.

また、事前に設定されたキーワードは、新聞、ニュース等で出てきた言葉であり、事前に設定される。 In addition, the keyword that has been set in advance, the newspaper, is a word that came out in the news, etc., are set in advance.

また、ニュースソースユーザの区別として、放送局や政府関係者が使っているもので、自動的に発信するだけのアカウントをデータベースに設定しておき、このデータベースのアカウントのユーザをニュースソースユーザとすることも可能である。 In addition, as the distinction between news source user, in which broadcasters and government officials are using, have set up only of the account to automatically send to the database, the user accounts of this database as the news source user it is also possible.

ステップ5:高/通常重み付けを割り当て。 Step 5: Assign a high / normal weight. ニュースソースユーザから抽出されたテキストに、高い重み付けを割り当て、一般ユーザからの抽出されたテキストに、通常の重み付けを割り当てる。 The extracted text from the news source user, assign a higher weight, the extracted text from general users, assigning the normal weight.

ニュースソースユーザは、ニュースや一般的な情報を投稿するユーザであり、主に個人的な情報を投稿する一般ユーザより、意味のない無駄話等のノイズが少ないと考えられる。 News source user is a user to post news and general information, from general users who mainly post personal information, the noise of useless talk, such as meaningless is considered to be small. そのため、ニュースソースユーザから抽出した投稿に高い重み付けを割り当て、優先度を上げることで、小集団の名前付け精度を向上させる。 Therefore, assign a higher weight to post extracted from the news source user, by raising the priority, to improve the naming accuracy subpopulations.

ステップ6:プロフィールと投稿からキーワード抽出。 Step 6: keyword extracted from the profile and posts. 小集団に属する全ての利用者のプロフィールと投稿を結合する。 Combining the post with all of the user's profile belonging to the small group. 利用者の通信記録が収集されていた場合、これも結合する。 If the communication record of the user have been collected, which is also bound. 結合結果から、TF−IDF法によりキーワードとして重要なM個の語を抽出する(Mは、あらかじめ定めた1以上の整数)。 From binding results, it extracts the key M number of words as keywords by TF-IDF method (M is a predetermined integer of 1 or more). なお、TF−IDF法による抽出とは、結合結果を形態素解析し、抽出された単語に対してTF−IDF値を求め、TF−IDF値が、上位M件の語をキーワードとすることである。 Incidentally, according to the extraction TF-IDF method, binding results are morphological analysis determines the TF-IDF value for the extracted word, TF-IDF value is to the word of the upper M matter keywords .

ステップ7:キーワードで小集団を名前付け。 Step 7: Naming a small population keyword. 小集団は、抽出されたキーワードで名前付けられる。 Small population, attached name in the extracted keywords.

ステップ8:全小集団終了? Step 8: End all small group? 上記ステップ3からステップ7を、すべての小集団に実行し、すべての小集団に名前付けを行う。 Step 7 from step 3, run in all of the small group, do the naming to all the small group. このようにして、利用者の共通の興味に従って、各小集団を自動的に名前付けすることが可能になる。 In this way, in accordance with the common interests of the user, automatically it becomes possible to give the name of each small group.

ステップ9:小集団を可視化。 Step 9: Visualization of the small population. 小集団をノードとし、エッジをフォロワー/フォロウィーの関係として、Fast Multiscaleアルゴリズムを用いて、グラフを作成することにより、パーソナルネットワークを可視化する。 Small groups and nodes, the edges as the relationship follower / Forowi, using Fast Multiscale algorithm by creating a graph, to visualize the personal network. この場合、対象となる利用者を空の小集団とする。 In this case, the user to be an empty small groups. また、小集団の中の利用者数でノードの大きさを変えて表示し、小集団間のエッジの太さで利用者の接続の数を示す。 Also, to display by changing the size of the nodes in the number of users in a small group, the number of users in connection with the thickness of the edge between subpopulations.

図6は、小集団をノードとして表現した例を示す。 Figure 6 shows an example of expressing the small group as a node. 本例では、小集団G1に最も多くの利用者が存在し、対象となる利用者G0と最も多く接続されることが分かる。 In this example, most of the users present in the small group G1, it can be seen that the most often connected to the user G0 of interest. また、小集団G3、小集団G5にも多くの利用者が存在し、小集団G3と小集団G5間でも多くの接続があることが分かる。 Also, small group G3, there are many users in a small group G5, there can be seen that many connections between the subset G3 small group G5.

なお、上記実施形態は、フェイスブックまたはツイッターようなオンラインソーシャルネットワーキングサービスの形態で説明された。 It should be noted that the above embodiments have been described in the form of Facebook or Twitter such online social networking service. しかしながら、本発明は、オンラインソーシャルネットワーキングサービスだけに限定されるものではない。 However, the present invention is not limited only to online social networking service. 利用者による投稿と、この投稿に対しコメントを付与する(フォロー)関係が存在するネットワーク形態に対し適用可能である。 And posted by the user, it can be applied to the network form of this post for the grant Comments (follow-up) relationship exists.

本発明による小集団を抽出し、名前付け、可視化する方法は、コンピュータを、上述した各ステップを機能させるプログラムにより実現することができる。 Extract the small group according to the invention, named, a method for visualization, it can be implemented by a program that causes a respective step of a computer, described above. これらコンピュータプログラムは、コンピュータが読み取り可能な記憶媒体に記憶されて、又は、ネットワーク経由で配布が可能なものである。 These computer program, a computer is stored in a storage medium readable or those capable of distributed via a network. さらに、本発明は、ハードウェア及びソフトウェアの組合せによっても実現可能である。 Furthermore, the present invention can be realized by a combination of hardware and software.

また、以上述べた実施形態は全て本発明を例示的に示すものであって限定的に示すものではなく、本発明は他の種々の変形態様および変更態様で実施することができる。 Further, the embodiments described above is not shown in a limiting sense all there is shown a present invention illustratively, the present invention can be implemented in other various modifications and variations. 従って本発明の範囲は特許請求の範囲およびその均等範囲によってのみ規定されるものである。 Accordingly, the present invention is intended to be defined only by the claims and their equivalents.

1 パーソナルネットワーク抽出部 2 小集団分割部 3 投稿プロフィール抽出部 4 ニュースソースユーザ区別部 5 小集団名前付け部 6 小集団可視化部 1 personal network extracting unit 2 subset dividing unit 3 post profile extraction section 4 news source user discriminator 5 subpopulations naming section 6 subpopulations visualization unit

Claims (8)

  1. 投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、名前付けする方法において、 From a possible network be given a comment on the post, to extract the small groups, in how to give name,
    前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、 該特定の利用者と該特定の利用者から所定数ホップ範囲内のフォロワーとフォロウィーが構成するパーソナルネットワークを抽出するネットワーク抽出ステップと、 From the network, based on the follow-relation to a particular user, a network extraction step of followers Forowi within a predetermined number of hops range from the specific user and the particular user extracts the personal network to configure,
    前記パーソナルネットネットワークを、フォロー関係に基づいて小集団に分割する分割ステップと、 A dividing step of dividing the personal net network, a small group based on the follow-relationship,
    前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別ステップと、 The user included in the small group, and news source user to post news or general information, and distinguishing distinguishable steps other general users,
    前記ニュースソースユーザの投稿およびプロフィールに、一般ユーザの投稿およびプロフィールより高い重み付けを行い、 前記小集団に含まれる全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出ステップと、 Reviewed and profile of the news source user performs general user posts and higher profiles weighting, and a keyword extraction step of extracting a keyword from all users of the posts and profiles contained in the subset,
    前記抽出したキーワードに基づいて、前記小集団に名前付けする名前付けステップと、 Based on the keywords that the extracted, the naming step to give name to the small group,
    前記区別ステップから前記名前付けステップを、 分割されたすべての小集団に行うステップと、 And the step of performing the naming step from the distinction step, to split all of the small group,
    を含むことを特徴とする小集団を抽出し、名前付けする方法。 How to extract the small group, to give names, which comprises a.
  2. 前記小集団をノードとし、前記フォロー関係をエッジとして、前記パーソナルネットワークのグラフを作成するステップをさらに含むことを特徴とする請求項1に記載の方法。 The small groups and nodes, the follow relations as an edge, the method according to claim 1, further comprising the step of creating a graph of the personal network.
  3. 前記グラフを作成するステップは、Fast Multiscaleアルゴリズムを用いて、前記特定の利用者が空の小集団におかれ、ノードの大きさが小集団の中の利用者数を表し、エッジの太さが小集団間の接続の数を表すグラフを作成することを特徴とする請求項2に記載の方法。 The step of creating the graph, using the Fast Multiscale algorithm, the specific user is placed in the empty subset, the size of the nodes represent the number of users in a small group, the thickness of the edge the method according to claim 2, characterized in that to create a chart that represents the number of connections between subpopulations.
  4. 前記分割ステップは、CNMアルゴリズムを用いて、前記パーソナルネットワークを小集団に分割することを特徴とする請求項1から3のいずれか1項に記載の方法。 The dividing step, using a CNM algorithm A method according to any one of claims 1 to 3, characterized by dividing the personal network to small groups.
  5. 前記区別ステップは、利用者のネットワーク関係及びコミュニケーション履歴に基づいてニュースソースユーザと一般ユーザを区別することを特徴とする請求項1から4のいずれか1項に記載の方法。 The distinction The method of claimed in any one of claims 4, characterized in that to distinguish between news sources and General Users based on the network relationship and communication history of the user.
  6. 前記区別ステップは、利用者のフォロワーとフォロウィー関係から得られる係数αを計算するステップと、利用者の投稿数から得られる係数βを計算するステップと、利用者の投稿したテキストに含まれるキーワードの頻度から得られる係数γを計算するステップとを有し、前記係数群から評価関数Sを計算し、該評価関数Sからニュースソースユーザを判別することを特徴とする請求項1から4のいずれか1項に記載の方法。 The distinction step includes the steps of calculating the α coefficient obtained from the user's followers and Forowi relationship, the user calculating a resulting coefficient β from posts, the keyword included in the post text user and a step of calculating the coefficients γ obtained from the frequency, to calculate the evaluation function S from the factor group, one of the four claims 1, characterized in that to determine the news source user from the evaluation function S the method according to item 1.
  7. 前記キーワード抽出ステップは、TF−IDF法により、全利用者の投稿およびプロフィールからキーワードを抽出することを特徴とする請求項1から6のいずれか1項に記載の方法。 The keyword extraction step, the TF-IDF method, method according to any one of claims 1 to 6, characterized in that a keyword is extracted from the post and profile of all users.
  8. 投稿に対してコメントを付与することが可能なネットワークから、小集団を抽出し、名前付けするコンピュータを、 From a possible network be given a comment on the post, to extract the small population, the computer you want to give name,
    前記ネットワークから、特定の利用者に対するフォロー関係に基づいて、 該特定の利用者と該特定の利用者から所定数ホップ範囲内のフォロワーとフォロウィーが構成するパーソナルネットワークを抽出するネットワーク抽出手段と、 From the network, based on the follow-relation to a particular user, the network extracting means followers Forowi within a predetermined number of hops range from the specific user and the particular user extracts the personal network to configure,
    前記パーソナルネットネットワークを、フォロー関係に基づいて小集団に分割する分割手段と、 The personal net network, dividing means for dividing into small groups based on the follow-relationship,
    前記小集団に含まれる利用者を、ニュースまたは一般的な情報を投稿するニュースソースユーザと、それ以外の一般ユーザに区別する区別手段と、 The user included in the small group, and news source user to post news or general information, and distinguishes distinction means other general users,
    前記ニュースソースユーザの投稿およびプロフィールに、一般ユーザの投稿およびプロフィールより高い重み付けを行い、 前記小集団に含まれる全利用者の投稿およびプロフィールからキーワードを抽出するキーワード抽出手段と、 To the post and the profile of the news source user, it performs a general user of the post and the higher profile weighting, and the keyword extraction means for extracting a keyword from all users of the post and the profile that is included in the small group,
    前記抽出したキーワードに基づいて、前記小集団に名前付けする名前付け手段と、 Based on the keywords that the extracted, the naming means that give name to the small group,
    前記区別手段から前記名前付け手段を、 分割されたすべての小集団に行う手段と、 And means for performing the naming means from the distinction means, to split all of the small group,
    して機能させることを特徴とするプログラム。 Program characterized thereby to function.
JP2011147607A 2011-07-01 2011-07-01 Extract the small population from a social network, named, as well as a method to visualize and program Active JP5734118B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011147607A JP5734118B2 (en) 2011-07-01 2011-07-01 Extract the small population from a social network, named, as well as a method to visualize and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011147607A JP5734118B2 (en) 2011-07-01 2011-07-01 Extract the small population from a social network, named, as well as a method to visualize and program

Publications (2)

Publication Number Publication Date
JP2013015973A true JP2013015973A (en) 2013-01-24
JP5734118B2 true JP5734118B2 (en) 2015-06-10

Family

ID=47688618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011147607A Active JP5734118B2 (en) 2011-07-01 2011-07-01 Extract the small population from a social network, named, as well as a method to visualize and program

Country Status (1)

Country Link
JP (1) JP5734118B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6111938B2 (en) * 2013-08-29 2017-04-12 富士ゼロックス株式会社 Information processing program and an information processing apparatus
JP6066878B2 (en) * 2013-09-27 2017-01-25 Kddi株式会社 Address book automatic tagging device, the address book automatic tagging method, and program
KR101708444B1 (en) * 2015-11-16 2017-02-22 주식회사 위버플 Method for evaluating relation between keyword and asset value and Apparatus thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7958120B2 (en) * 2005-05-10 2011-06-07 Netseer, Inc. Method and apparatus for distributed community finding
KR101136730B1 (en) * 2007-12-08 2012-04-19 에스케이플래닛 주식회사 Advertising Method and SNS Advertising System
US20100241580A1 (en) * 2009-03-19 2010-09-23 Tagged, Inc. System and method of selecting a relevant user for introduction to a user in an online environment

Also Published As

Publication number Publication date Type
JP2013015973A (en) 2013-01-24 application

Similar Documents

Publication Publication Date Title
Jäschke et al. Tag recommendations in folksonomies
Gao et al. A comparative study of users’ microblogging behavior on Sina Weibo and Twitter
Barzilai-Nahon Gaps and bits: Conceptualizing measurements for digital divide/s
Shema et al. Do blog citations correlate with a higher number of future citations? Research blogs as a potential source for alternative metrics
US20140040371A1 (en) Systems and methods for identifying geographic locations of social media content collected over social networks
Ratkiewicz et al. Detecting and tracking the spread of astroturf memes in microblog streams
US20130297581A1 (en) Systems and methods for customized filtering and analysis of social media content collected over social networks
US20130297694A1 (en) Systems and methods for interactive presentation and analysis of social media content collection over social networks
US20130212059A1 (en) Social Analytics
Daas et al. Big data as a source for official statistics
CN102346766A (en) Method and device for detecting network hot topics found based on maximal clique
Lansley et al. The geography of Twitter topics in London
Zhang et al. Subject clustering analysis based on ISI category classification
US20130304726A1 (en) Methods and systems useful for identifying the most influent social media users in query-based social data streams
CN102279890A (en) Extracting collection method based on the emotional word microblogging
Zheludev et al. When can social media lead financial markets?
CN102289487A (en) Sudden hot topic network model based on event detection method
Qin Hero on Twitter, traitor on news: How social media and legacy news frame Snowden
CN102426610A (en) Microblog rank searching method and microblog searching engine
Wang et al. RiMOM results for OAEI 2010
Gu et al. Etree: Effective and efficient event modeling for real-time online social media networks
CN102890702A (en) Internet forum-oriented opinion leader mining method
US20140143346A1 (en) Identifying And Classifying Travelers Via Social Media Messages
CN103428164A (en) User social network relationship division method and system
CN1614607A (en) Filtering method and system for e-mail refuse

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130408

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130531

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140917

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150408

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150414

R150 Certificate of patent (=grant) or registration of utility model

Ref document number: 5734118

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150