JP6042188B2 - グループ抽出装置、グループ抽出方法およびプログラム - Google Patents
グループ抽出装置、グループ抽出方法およびプログラム Download PDFInfo
- Publication number
- JP6042188B2 JP6042188B2 JP2012262005A JP2012262005A JP6042188B2 JP 6042188 B2 JP6042188 B2 JP 6042188B2 JP 2012262005 A JP2012262005 A JP 2012262005A JP 2012262005 A JP2012262005 A JP 2012262005A JP 6042188 B2 JP6042188 B2 JP 6042188B2
- Authority
- JP
- Japan
- Prior art keywords
- group
- friend
- specific period
- friends
- interests
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
実施形態の詳細な説明の前に、図7を用いて、本発明の概要について説明する。
まず、グループ抽出の対象とする特定の期間内(例えば、直近1週間)と、過去〜グループ抽出期間前とを分割(図7参照)し、後者の期間に含まれるソーシャルメディア上の行動(投稿やコミュニケーション)履歴から、定常的に出現する話題語や、定常的にコミュニケーションをとる友人間を表す特徴を抽出する。
W(A、 B)=α×S(A、 B)+β×F(A、 B)+γ×P(A、 B)…(1)
ここで、α、β、γ(全て0以上)は各指標値の重みに与える影響度合いを表し、本発明をサービス、あるいはアプリケーションとして提供する際に、自由に設定可能とする。
αの影響度合いが高い:投稿内容の類似性を重視し、類似する話題を発信するグループが抽出されやすくなる。
βの影響度合いが高い:コミュニケーションの発生を重視し、コミュニケーションが活性化しやすいグループが抽出されやすくなる。
γの影響度合いが高い:プロフィールの類似性を重視し、類似・同一の勤務先や出身校である友人が所属するグループが抽出されやすくなる。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
図1から図8を用いて、本発明の実施形態について説明する。
本実施形態に係るグループ抽出装置は、図1に示すように、ソーシャルメディアと、API100と、データ収集部201と、大域特徴算出部202と、重み算出部203と、グループ抽出部204と、グループキーワード抽出部205と、プロフィールDB211と、投稿内容DB212と、コミュニケーション履歴DB213と、友人関係DB214と、表示部300とから構成されている。
図2から図6を用いて、本実施形態に係るグループ抽出装置の処理について説明する。
この図によれば、まず、大域特徴算出部202は、DB群に蓄積された各種データから、大域特徴量を算出する(図2のステップS100)。算出対象となるデータは、過去から蓄積された全データより、グループ抽出の対象となる特定の期間内のデータを除いたデータである(図7の「過去」に相当する期間、およびデータ)。ここで算出された特徴量と特定の期間内のデータの比較により、図2のステップS200において友人関係の重みを決定する。
まず、ステップS210では、友人関係の抽出を行う。具体的には、ユーザの各友人間について、ソーシャルメディア上での明示的な友人関係を友人関係DBから取得し、友人同士である友人のペアを生成する。例えば、ユーザの友人A、B、C、Dさんがいたとした場合、友人同士である下記ペアをリストアップする。(以下、下記のリストをリスト1とする)
1)AさんとBさん
2)AさんとCさん
3)BさんとCさん
まず、ステップS221では、対象友人リストの作成を行う。つまり、ステップS220で処理対象となる友人のリストを、ステップS210で取得した友人関係(友人同士であるペア)から生成する。例えば、リスト1からはA、B、Cさんを抽出し、リスト(以下、このリストをリスト2とする)を生成する。
w(i、A)= df(i、A)×idf(i)…(2)
ここで、df(i、A)は、友人Aの特定の期間内の投稿内容のうち、単語iを含む投稿数を表し、idf(i)は前述のdf(i)を用いて下記の式で算出されるInversed Document Frequencyである。
idf(i)= log{ |D|/ df(i) }…(3)
ここで、|D|は、過去のデータにおける、ユーザの友人の投稿総数である。また、df(i)=0となる可能性がある場合には、df(i)=1と読み替え、あるいは、df(i)をdf(i)+1 と置き換える。
まず、ステップS231では、ステップS232からステップS233の処理を実施していない友人関係(ペア)が存在する場合は、ステップS232へ進む。存在しない場合は本処理フローを終了する。
R(A、B)= (C(A)/G(A)) × (C(A、B)/P(B)) …(4)
F(A、B)=
( iR(A、B)× R‘(A、B)+ iR(B、A)×R’(B、 A))/2…(5)
ここで、iR(A、B) は式(4)の逆数を表し、R‘(A、B)は特定の期間内の友人の投稿のみを用いてR(A、B) を算出した値を表す。なお、式(4)と式(5)との適用に際し、分母が0となる可能性がある場合には、1と読み替え、あるいはデフォルトで1を加算して適用する。
図9から図11を用いて、本発明の実施形態について説明する。
本実施形態に係るグループ抽出装置は、図9に示すように、ソーシャルメディアと、API100と、データ収集部201と、大域特徴算出部202と、重み算出部203と、グループ抽出部204と、グループキーワード抽出部205と、グループフィルタ部206と、プロフィールDB211と、投稿内容DB212と、コミュニケーション履歴DB213と、友人関係DB214と、表示部300とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。
図10を用いて、本実施形態に係るグループ抽出装置の処理について説明する。
図12および図13を用いて、本発明の実施形態について説明する。
本実施形態に係るグループ抽出装置は、図12に示すように、ソーシャルメディアと、API100と、データ収集部201と、大域特徴算出部202と、重み算出部203と、グループ抽出部204と、グループキーワード抽出部205と、キーワードマッチング部207と、プロフィールDB211と、投稿内容DB212と、コミュニケーション履歴DB213と、友人関係DB214と、表示部300とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。
図13を用いて、本実施形態に係るグループ抽出装置の処理について説明する。
図14および図15を用いて、本発明の実施形態について説明する。
本実施形態に係るグループ抽出装置は、図14に示すように、ソーシャルメディアと、API100と、データ収集部201と、大域特徴算出部202と、重み算出部203と、グループ抽出部204と、グループキーワード抽出部205と、グループ評価部208と、プロフィールDB211と、投稿内容DB212と、コミュニケーション履歴DB213と、友人関係DB214と、表示部300とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。
図15を用いて、本実施形態に係るグループ抽出装置の処理について説明する。
201;データ収集部
202;大域特徴算出部
203;重み算出部
204;グループ抽出部
205;グループキーワード抽出部
206;グループフィルタ部
207;キーワードマッチング部
208:グループ評価部
211;プロフィールDB
212;投稿内容DB
213;コミュニケーション履歴DB
214;友人関係DB
300;表示部
Claims (4)
- ソーシャルメディア上の友人集合と友人の行動履歴から、特定の期間の興味あるいは関心が類似するグループを抽出するグループ抽出装置であって、
前記行動履歴から友人集合の定常的な特徴を算出する大域特徴算出部と、
前記定常的な特徴量と特定の期間の行動履歴とに基づいて、定常的に出現せず、特定の期間にのみ出現する特徴を算出し、前記友人集合における友人間の関係性を重み付けする重み算出部と、
前記重み付けされた友人関係から、特定の期間内の興味あるいは関心が類似する友人のグループを抽出するグループ抽出部と、
前記グループ毎に、特定の期間内の友人の投稿内容からグループを特徴付けるキーワードを抽出するグループキーワード抽出部と、
前記グループキーワードのうち、ユーザがプロフィール(属性)情報として登録する興味あるいは関心を表す単語、あるいはユーザの投稿内容から抽出された単語に合致するグループキーワードを友人毎に求めるキーワードマッチング部と、
を備えることを特徴とするグループ抽出装置。 - 前記行動履歴は、ソーシャルメディア上の友人の投稿内容あるいは、コミュニケーション履歴であり、
前記大域特徴算出部は、投稿内容に定常的に出現する単語群とその出現頻度、および定常的にコミュニケーションを行う友人の組み合わせとその頻度を抽出し、
前記重み算出部は、前記定常的に出現する単語群に比して特定の期間内で出現頻度が向上した単語を、共に投稿内容に含む友人間の重みを高く設定し、更に定常的なコミュニケーション頻度に比して特定の期間内でコミュニケーション頻度が向上した友人間の重みを高く設定することを特徴とする、請求項1に記載のグループ抽出装置。 - ソーシャルメディア上の友人集合と友人の行動履歴から、特定の期間内の興味あるいは関心が類似するグループを抽出するグループ抽出装置におけるグループ抽出方法であって、
前記行動履歴から友人集合の定常的な特徴を算出する第1のステップと、
前記定常的な特徴量と特定の期間内の行動履歴を基に、定常的には出現せず、特定の期間内に出現する特徴を算出し、前記友人集合における友人間の関係性を重み付けする第2のステップと、
前記重み付けされた友人関係から、特定の期間内の興味あるいは関心が類似する友人のグループを抽出する第3のステップと、
前記グループ毎に、特定の期間内の友人の投稿内容からグループを特徴付けるキーワードを抽出する第4のステップとを備え、
前記第4のステップにおいて、前記グループキーワードのうち、ユーザがプロフィール(属性)情報として登録する興味あるいは関心を表す単語、あるいはユーザの投稿内容から抽出された単語に合致するグループキーワードを友人毎に求めることを特徴とするグループ抽出方法。 - ソーシャルメディア上の友人集合と友人の行動履歴から、特定の期間内の興味あるいは関心が類似するグループを抽出するグループ抽出装置におけるグループ抽出方法をコンピュータに実行させるためのプログラムであって、
前記行動履歴から友人集合の定常的な特徴を算出する第1のステップと、
前記定常的な特徴量と特定の期間内の行動履歴を基に、定常的には出現せず、特定の期間内に出現する特徴を算出し、前記友人集合における友人間の関係性を重み付けする第2のステップと、
前記重み付けされた友人関係から、特定の期間内の興味あるいは関心が類似する友人のグループを抽出する第3のステップと、
前記グループ毎に、特定の期間内の友人の投稿内容からグループを特徴付けるキーワードを抽出する第4のステップとを備え、
前記第4のステップにおいて、前記グループキーワードのうち、ユーザがプロフィール(属性)情報として登録する興味あるいは関心を表す単語、あるいはユーザの投稿内容から抽出された単語に合致するグループキーワードを友人毎に求めることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012262005A JP6042188B2 (ja) | 2012-11-30 | 2012-11-30 | グループ抽出装置、グループ抽出方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012262005A JP6042188B2 (ja) | 2012-11-30 | 2012-11-30 | グループ抽出装置、グループ抽出方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014106943A JP2014106943A (ja) | 2014-06-09 |
JP6042188B2 true JP6042188B2 (ja) | 2016-12-14 |
Family
ID=51028320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012262005A Active JP6042188B2 (ja) | 2012-11-30 | 2012-11-30 | グループ抽出装置、グループ抽出方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6042188B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965878B (zh) * | 2015-06-12 | 2018-11-27 | 微梦创科网络科技(中国)有限公司 | 一种基于分组信息进行用户工作单位挖掘的方法及装置 |
JP6572691B2 (ja) | 2015-09-08 | 2019-09-11 | 富士通株式会社 | 検索方法、検索プログラムおよび検索装置 |
US11810147B2 (en) * | 2017-10-19 | 2023-11-07 | Foursquare Labs, Inc. | Automated attribution modeling and measurement |
JP7212599B2 (ja) * | 2019-09-13 | 2023-01-25 | 株式会社Nttドコモ | 情報提供システム |
JP7464346B2 (ja) | 2021-03-04 | 2024-04-09 | Kddi株式会社 | 対象属性表現を生成可能な対象属性表現生成モデル、対象属性推定装置及び方法 |
WO2023013122A1 (ja) * | 2021-08-06 | 2023-02-09 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4433326B2 (ja) * | 2007-12-04 | 2010-03-17 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
CA2616234A1 (en) * | 2007-12-21 | 2009-06-21 | Ibm Canada Limited - Ibm Canada Limitee | System and method for interaction between users of an online community |
-
2012
- 2012-11-30 JP JP2012262005A patent/JP6042188B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014106943A (ja) | 2014-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6042188B2 (ja) | グループ抽出装置、グループ抽出方法およびプログラム | |
RU2670906C9 (ru) | Самонастраивающаяся интерактивная система, способ обмена сообщениями и/или звонками между пользователями различных веб-сайтов с использованием технологии клиент-сервер и считываемый компьютером носитель | |
Van Dam et al. | Online profiling and clustering of Facebook users | |
US8332512B1 (en) | Method and system for selecting content based on a user's viral score | |
Tinati et al. | Identifying communicator roles in twitter | |
US10074094B2 (en) | Generating a user profile based on self disclosed public status information | |
US9146894B2 (en) | Objective value models for entity recommendation | |
US20130304726A1 (en) | Methods and systems useful for identifying the most influent social media users in query-based social data streams | |
Zhang et al. | Product information diffusion in a social network | |
JP4645676B2 (ja) | 情報処理装置、関連アイテムの提供方法、及びプログラム | |
US20130218862A1 (en) | System and method for customizing analytics based on users media affiliation status | |
CN107301247B (zh) | 建立点击率预估模型的方法及装置、终端、存储介质 | |
Liu et al. | The relation of culture, socio-economics, and friendship to music preferences: A large-scale, cross-country study | |
US8392431B1 (en) | System, method, and computer program for determining a level of importance of an entity | |
An et al. | Automatic generation of personas using youtube social media data | |
RU2649797C1 (ru) | Интерактивная система, способ и считываемый компьютером носитель данных представления рекламного контента | |
US10599981B2 (en) | System and method for estimating audience interest | |
KR101356948B1 (ko) | Sns에서 사회적 이웃의 관심사와 사회적 활동의 토픽을 통해 사용자 관심사를 추론하는 방법 및 그 시스템 | |
JP6059314B1 (ja) | 推定装置、推定方法及び推定プログラム | |
Gundecha et al. | A tool for collecting provenance data in social media | |
US9020863B2 (en) | Information processing device, information processing method, and program | |
US8886737B1 (en) | Identifying particular parties | |
Buente et al. | Tradition gone mobile: An exploration of# betelnut on Instagram | |
JP5813052B2 (ja) | 情報処理装置、方法及びプログラム | |
JP6036331B2 (ja) | 管理方法、管理装置および管理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150828 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160802 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6042188 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |