JPWO2013094361A1 - ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ - Google Patents

ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ Download PDF

Info

Publication number
JPWO2013094361A1
JPWO2013094361A1 JP2013550188A JP2013550188A JPWO2013094361A1 JP WO2013094361 A1 JPWO2013094361 A1 JP WO2013094361A1 JP 2013550188 A JP2013550188 A JP 2013550188A JP 2013550188 A JP2013550188 A JP 2013550188A JP WO2013094361 A1 JPWO2013094361 A1 JP WO2013094361A1
Authority
JP
Japan
Prior art keywords
message
partial
similarity
computer
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013550188A
Other languages
English (en)
Other versions
JP5893050B2 (ja
Inventor
美紀 榎
美紀 榎
ルディー・レイモンド・ハリー・プテラ
洋平 伊川
洋平 伊川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2013550188A priority Critical patent/JP5893050B2/ja
Publication of JPWO2013094361A1 publication Critical patent/JPWO2013094361A1/ja
Application granted granted Critical
Publication of JP5893050B2 publication Critical patent/JP5893050B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles

Abstract

ソーシャル・メディアにおけるコミュニティをより精度良く検出する。複数のユーザがそれぞれメッセージを発信するソーシャル・メディアにおいて、コンピュータにより、複数のユーザをクラスタリングする方法である。この方法は、メッセージ同士の関係に基づいて、複数のユーザから複数の部分コミュニティを抽出するステップと、複数の部分コミュニティのうち、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算するステップと、第一類似度が予め定められた第一閾値よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、前記両部分コミュニティ同士の類似性を示す第二類似度を演算するステップと、第二類似度が予め定められた第二閾値よりも高いことを条件に、前記両部分コミュニティ同士を統合して統合コミュニティを生成するステップとを備える。

Description

本発明は、情報処理技術に関係し、より詳しくは、ソーシャル・メディアにおけるコミュニティ(興味・関心等の属性を共通にするソーシャル・メディアのユーザの集合)をより精度良く検出する技術に係る。
ソーシャル・メディアが広範に利用されるに従い、ソーシャル・メディア上で各ユーザーが発信する情報から、コミュニティ及びその共通の興味・関心等を抽出したい、とのビジネス上の要請が存在する。ソーシャル・メディアの情報すべてを対象としては、様々なコストが高いため、ソーシャル・メディアのサンプリングされた情報から、コミュニティとその興味・関心等を抽出するのが一般的である。コミュニティとその興味・関心等を抽出する技術としては、一般に、クラスタリングの手法が用いられる。すなわち、各情報内の単語を抽出して特徴ベクトルを計算し、そのベクトルをもとにクラスタリングを行うものである。
特許第4369104号公報 特開2009−301334号公報
しかし、このような従来手法は、サンプリングされた情報であることと相まって、以下の理由により、本来なら同一コミュニティだったかもしれないノードも分断されてしまうおそれがある。すなわち、第一に、クラスタと無関係な単語が特徴ベクトルの主要部分と認定されてしまう。第二に、言い回しの異なる単語の出現頻度が少ないことから、クラスタリングへの影響少なく、拾われない可能性が高い。第三に、とりわけマイクロブログの場合は特に挨拶や日常生活などに関する記述が多く、意図した目的に一致しないも単語が特徴ベクトルに含まれる。
本発明はこのような課題に鑑みてなされたものであり、その目的の一つは、ソーシャル・メディアにおけるコミュニティをより精度良く検出することができる技術を提供することにある。
本発明は、複数のユーザがそれぞれメッセージを発信するソーシャル・メディアにおいて、コンピュータにより、前記複数のユーザをクラスタリングする方法である。この方法は、前記メッセージ同士の関係に基づいて、前記複数のユーザから複数の部分コミュニティを抽出するステップと、前記複数の部分コミュニティのうち、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算するステップと、前記第一類似度が予め定められた第一閾値よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、前記両部分コミュニティ同士の類似性を示す第二類似度を演算するステップと、前記第二類似度が予め定められた第二閾値よりも高いことを条件に、前記両部分コミュニティ同士を統合して統合コミュニティを生成するステップとを備える。
ここで、前記メッセージには、一のユーザの発信した一のメッセージに応答して他のユーザが発信する他のメッセージを含み、前記抽出するステップは、前記メッセージ同士が前記一のメッセージと前記一のメッセージに応答して発信された前記他のメッセージに該当するか否かに基づいて、前記複数のユーザから複数の部分コミュニティを抽出することができる。また、前記抽出するステップは、<強連結成分>であってもよいし、<pクリーク>であってもよい。
また、前記ソーシャル・メディアは、ユーザのプロフィール情報を記憶しており、前記第一類似度を演算するステップは、前記一の部分コミュニティに属するユーザのプロフィール情報と、前記他の部分コミュニティに属するユーザのプロフィール情報との関係に基づいて、前記第一類似度を演算することもできる。
さらに、前記ソーシャル・メディアは、ある特定のユーザが発信するある特定のユーザをフォローする機能を提供し、前記第一類似度を演算するステップは、前記一の部分コミュニティに属するユーザと、前記他の部分コミュニティに属するユーザとのフォロー及び被フォロー関係に基づいて、前記第一類似度を演算することもできる。また、前記第一類似度は、前記一の部分コミュニティに属するユーザと、前記他の部分コミュニティに属するユーザとが何人のユーザを介してフォロー及び被フォロー関係にあるかを示し、前記第二類似度を演算するステップは、前記一の部分コミュニティに属するユーザと、前記他の部分コミュニティに属するユーザとが直接フォロー及び被フォロー関係にあることを条件に、前記第二類似度を演算することもできる。
また、前記第二類似度を演算するステップは、一の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語と、他の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語とが類似するか否かに基づいて、前記第二類似度を演算することもできる。ここで、前記特徴的な用語は、コミュニティのメッセージの特徴ベクトル<tf*idf>により抽出することができる。
なお、前記メッセージは、前記ソーシャル・メディアに投稿されたメッセージから所定の条件の下にサンプリングされたメッセージとすることができる。また、前記メッセージは、前記ソーシャル・メディアに所定の期間内に投稿されたメッセージのうち、所定のキーワードを含む条件の下にサンプリングされたメッセージとすることもできる。また、前記ソーシャル・メディアがマイクロブログであってもよい。
さらに、前記ソーシャル・メディアをホストするコンピュータと、前記複数のユーザをクラスタリングするコンピュータとがネットワークを介して接続され、前記クラスタリングするコンピュータからの前記所定の条件付き要求に応答して、前記ホストするコンピュータから送信される前記メッセージを前記クラスタリングするコンピュータが受信するステップを更に備えることができる。また、前記受信した前記メッセージを、前記クラスタリングするコンピュータの記憶手段に記憶するステップを更に備えることもできる。
また、前記統合コミュニティをグラフィカル・ユーザ・インターフェイスを用いて出力するステップを更に備えることもできる。この際、前記統合コミュニティを前記特徴的な用語とともに出力することもできる。
本発明をこれらコンピュータ・プログラム、コンピュータ・システムとして把握した場合にも、上述した本発明を方法として把握した場合と実質的に同一の技術的特徴を備える事ができるのは当然である。
本発明によれば、ソーシャル・メディアにおけるコミュニティをより精度良く検出することができる。
マイクロブログのシステムを説明する概念図 マイクロブログのフォロー・被フォロー関係を説明する概念図 ユーザ端末としてのスマートフォンとその画面表示の説明図 マイクロブログ・サーバ内のハードディスク装置内に記憶されているデータのデータ構造の説明図 発信されるメッセージの種類の説明図 コンピュータのハードウェア構成を説明するブロック図 このコンピュータが実行する処理を説明するフローチャート 部分コミュニティから統合コミュニティを生成する過程の説明図
実施形態
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて(特段の断りのない限り)同じ要素には同じ番号を付している。
図1は、ソーシャル・メディアの一例として、マイクロブログのシステムを説明する概念図である。本システムは、マイクロブログ・サーバ2と、ユーザ端末とを含み、これらはインタネット4を介して互いに通信可能に接続されている。また、ユーザ端末としては、通信機能を備えたあらゆる形態のコンピュータを採用することができる。例えば、図示するスマートフォン31、タブレット32、(ノート型)パーソナル・コンピュータ33の他にも、図示しないパーソナル・データ・アシスタント(PDA、携帯情報端末)、車載コンピュータ、ネットブック等を採用することができる。
図2は、マイクロブログのフォロー・被フォロー関係を説明する概念図である。マイクロブログのユーザは、友人、知人、興味や関心の共通する他のユーザを予め登録しておくことができ、彼らの発信するメッセージを自動的に受信することができる。このような登録を“フォロー”と呼び、フォローの関係は、ユーザ同士が相互にフォローし合う関係、一のユーザが他のユーザを一方的にフォローする関係が存在する。例えば、図2における矢印は、ユーザAAAとユーザBBBとは相互にフォローし合っており、ユーザBBBはユーザCCCを一方的にフォローしており、ユーザCCCはユーザAAAを一方的にフォローしていることを示す。
図3は、一例として、ユーザ端末としてのスマートフォン31とその画面表示を説明するものである。このスマートフォン31のタッチスクリーンには、マイクロブログ・アプリケーションの画面が表示されており、当該アプリケーション画面は、上から順に、ホーム部分311、タイムライン部分312、操作部分313に分かれている。ホーム部分には、メニューボタンと、タイムライン部分312がユーザAAAのタイムラインである旨が表示されている。タイムライン部分312には、上から順に、ユーザAAAのメッセージ部分312a、312b、ユーザBBBのメッセージ部分312cが表示されている。これらのメッセージ部分312a〜cは、時系列沿って表示されている。つまり、最上部の発言部分312aが最新のメッセージに対応している。
図4は、マイクロブログ・サーバ2内のハードディスク装置20、21、22内に記憶されているデータのデータ構造を説明するものである。ハードディスク装置20に記憶されているメッセージテーブル(図4(a))には、各メッセージが発信された日時を示す発信日時(created_at)、各メッセージを特定するメッセージID(id)と、そのメッセージを発信したユーザを特定するユーザID(user_id)と、メッセージの内容であるテキスト(text)を備えている。なお、テキストには文字数制限(例えば、140文字以内等)を設けることができる。一方、ハードディスク装置21に記憶されているユーザ関係テーブル(図4(b))には、フォロー関係を登録した日時を示す登録日時(registered_at)、フォロー元のユーザを特定するフォロー元ユーザID(following_user_id)、フォロー先のユーザを特定するフォロー先ユーザID(followed_user_id)を備えている。他方、ハードディスク装置22に記憶されているプロフィールテーブル(図4(c))には、各ユーザを特定するユーザID(user_id)、各ユーザの名前(図示せず)、場所を示すロケーション情報(location)、関連するウェブページのアドレスであるURL情報(url)を備えている。
図5は、発信されるメッセージの種類を説明するものである。図5(a)は、通常のメッセージを説明するものである。ここでは、ユーザAAAが自らのタイムラインにメッセージを発信しており、ユーザAAAとユーザAAAをフォローしているユーザ(図2の例ではユーザBBB及びユーザCCC)のタイムラインにこれらのメッセージが表示される。図5(b)は、リプライメッセージを説明するものである。リプライメッセージは、特定のメッセージに対する返事であり、自分と、自分と返信先のユーザ両方をフォローしているユーザのタイムラインに表示される。ここでは、ユーザBBBが、ユーザAAAのメッセージに対する返事として、「やあ、こんにちは。」というリプライメッセージを発信し、そのリプライメッセージはユーザBBB本人の他、ユーザBBBをフォローしているユーザ(図2の例ではユーザAAA)のタイムラインに表示される。
図5(c)及び図5(d)は、いずれも転載メッセージを説明するものであり、ユーザCCCが自分のタイムラインに表示されているユーザAAAの元メッセージ「マイクロブログ始めました。」を転載メッセージとして、再発信する様子を示している。いずれの場合も、ユーザCCCをフォローしているユーザ(図2の例ではユーザBBB)のタイムラインに転載メッセージが表示されるが、図5(c)に示す第一態様の場合は、元のユーザAAAの名前でユーザCCCをフォローしているユーザのタイムラインへ表示されるが、図5(d)に示す第二態様の場合は、転送するユーザCCCの名前で表示される。図5(e)は、引用メッセージを説明するものである。ユーザCCCが自分のタイムライン表示されているユーザAAAの元メッセージ「マイクロブログ始めました。」をそのまま引用し、更に自分のコメント「ようこそ!」を入力して引用メッセージとして、再発信する様子を示している。この引用メッセージは、ユーザCCCをフォローしているユーザのタイムラインに表示される。
図6は、パーソナル・コンピュータ1のハードウェア構成を説明するブロック図である。コンピュータ1のハードウェア構成は、(低速及び高速の)バス10、バス10に接続されるCPU(演算制御装置)11、RAM(ランダム・アクセス・メモリ:記憶装置)12、ROM(リード・オンリ・メモリ:記憶装置)13、HDD(ハード・ディスク・ドライブ:記憶装置)14、通信インタフェース15、入出力インタフェース16を備えている。さらに、入出力インタフェース16に接続されるマウス17、フラット・パネル・ディスプレイ(表示装置)18、キーボード19等を備えている。なお、コンピュータ1は一般的なパーソナル・コンピュータ・アーキテクチャを採用するものとして説明したが、例えば、より高いデータ処理能力や可用性を求めて、CPU11やHDD14等を多重化することができる。また、デスクトップ型の他、様々なタイプのコンピュータ・システムを採用することができる。
このコンピュータ1のソフトウェア構成は、基本的な機能を提供するオペレーティング・システム(OS)と、OSの機能を利用するアプリケーション・ソフトウェアと、入出力装置のドライバ・ソフトウェアとを備えている。これらの各ソフトウェアは、各種データと共にRAM12上にロードされ、CPU11等により実行され、コンピュータ1は全体として、図7に示す処理を実行する。
図7は、このコンピュータ1が実行する処理を説明するフローチャートである。まずコンピュータ1からマイクロブログ・サーバ2に対して、条件を送信する(S1)。条件としては、例えば、メッセージが発信された期間を指定するものでもよいし、メッセージ中に特定のキーワードを含むものを指定するものでもよいし、リプライ、再発信されたメッセージのみを指定するものでもよいし、これらを組み合わせても良い。次に、コンピュータ1はマイクロブログ・サーバ2から上記条件に適合するメッセージ群のデータを受信する(S2)。この際、上記条件に適合するメッセージ群のデータ(図4(a)参照)の他、それらのメッセージに関連付けられるユーザのデータ(図4(b)参照)およびメッセージに関連付けられるユーザのプロフィール(図4(c)参照)を併せて受信してもよい。これら受信したデータは、コンピュータ1のHDD14に記憶される。
次に、メッセージ同士の関係に基づいて、複数のユーザから複数の部分コミュニティを抽出する(S3)。ここで、メッセージは、一のユーザの発信した一のメッセージに応答して他のユーザが発信する他のメッセージ、つまり、リプライメッセージ(図5(b))、転載メッセージ(図5(c)、図5(d))引用メッセージ(図5(e))のいずれかであるとする。そして、この抽出は、一のユーザの発信した一のメッセージと他のメッセージとの関係から定義されるユーザのネットワークから、深さ優先探索を行うことで,強連結成分となる部分ネットワークを抽出することにより行う。図8(a)は、部分ネットワークとして、G1とG2が抽出されたことを示す。各G1、G2内の丸印は個々のユーザを示し、矢印はメッセージのやり取りを示す。
次に、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算する(S4)。ここでは、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとが、何ステップのフォロー及び被フォロー関係により結びつけることが出来るか、という観点から、そのステップ数を演算し、例えば、その逆数を類似度としている。図8(b)は、部分ネットワークG1とG2とが、(一人の)第三のユーザを介して、一の部分コミュニティに属するユーザと第三のユーザとのフォロー・被フォロー関係、第三のユーザと他の部分コミュニティに属するユーザとのフォロー・被フォロー関係の2ステップで両部分コミュニティを結びつけることができることを示している。また、その類似度は(2の逆数の)1/2となる。なお、一の部分コミュニティに属するユーザのプロフィール情報と、他の部分コミュニティに属するユーザのプロフィール情報との関係に基づいて、前記第一類似度を演算してもよい。例えば、ロケーション情報が示す、国、行政区が同一であるユーザ同士の類似度をより高く設定したり、ウェブページ情報が示す、URLの一部又は全部が一致するユーザ同士の類似度をより高く設定することができる。
次に、第一類似度が予め定められた第一閾値(例えば、1/3)よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、両部分コミュニティ同士の類似性を示す第二類似度を演算する(S5)。ここでは、一の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語と、他の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語とが類似するか否かに基づいて、第二類似度を演算する。また、特徴的な用語は、深さ優先探索を行うことで,強連結成分となる部分ネットワークを抽出することにより行う。なお、さらにtf*idfを実施してもよい。
次に、第二類似度が予め定められた第二閾値よりも高いことを条件に、両部分コミュニティ同士を統合して統合コミュニティを生成する(S6)。図8(c)は、部分ネットワークG1とG2とが統合され、統合コミュニティG1G2が生成された状態を示す。なお、統合コミュニティG1G2をフラット・パネル・ディスプレイ18上にグラフィカル・ユーザ・インターフェイスを用いて出力し、併せて、特徴的な用語とともに出力することができる。
本発明は、全体がハードウェアの実施形態、全体がソフトウェアの実施形態、またはハードウェアおよびソフトウェア両方のエレメントを包含する実施形態の形を取ることができる。ある好適な実施形態において、本発明は、以下に限らないが、ファームウェア、常駐ソフトウェア、マイクロコード、構文解析ピココードなどを含めた、ソフトウェアに実装される。
さらに、本発明は、コンピュータまたは任意の命令実行システムによってまたはこれに関連させて使用するプログラム・コードを備えるコンピュータ・プログラム、コンピュータ可読媒体の形態を採ることもできる。本説明目的の上で、コンピュータ可読媒体は、任意の命令実行システム、装置、またはデバイスによってまたはこれに関連させて使用するためのプログラムを、収容、格納、通信、伝搬、または伝送できる任意の装置であり得る。具体的には、前述の構文解析制御モジュールは、この意味で命令実行システム、または「コンピュータ」を構成する。
媒体は、電子的、磁気的、光学的、電磁気的、赤外的、または半導体のシステム(もしくは装置もしくはデバイス)または伝搬媒体とすることができる。コンピュータ可読媒体の例には、半導体または固体メモリ、磁気テープ、着脱可能コンピュータ・ディスケット、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read−only memory)、剛体磁気ディスク、および光ディスクが含まれる。光ディスクの現時点での例には、コンパクト・ディスク読み取り専用メモリ(CD−ROM:compact disk read only
memory)、コンパクト・ディスク読み取り/書き込み(CD−R/W:compact disk read/write)メモリ、およびDVDが含まれる。
プログラム・コードを格納もしくは実行またはその両方を行うのに適したデータ処理システムは、システム・バスを介して直接的または間接的にメモリ・エレメントに連結された少なくとも一つのプロセッサを含み得る。このメモリ・エレメントには、プログラム・コードの実際の実行の過程で使われるローカル・メモリ、バルク記憶装置、および、実行中にバルク記憶装置から読み出さねばならない回数を低減するために、少なくとも一部のプログラム・コードに一時的保管を提供するキャッシュ・メモリを含めることができる。
直接に、あるいは仲介I/Oコントローラを介して、入力/出力またはI/Oデバイス(以下に限らないが、キーボード、ディスプレイ、ポインティング・デバイスなどを含む)をシステムに連結することができる。
また、ネットワーク・アダプタをシステムに連結し、データ処理システムが、仲介の私有または公衆ネットワークを介して、他のデータ処理システムあるいは遠隔のプリンタまたは記憶デバイスに繋がるようにすることができる。モデム、ケーブル・モデム、およびイーサネット(R)カードは、現在入手可能なネットワーク・アダプタのごく一部である。
1…パーソナル・コンピュータ、
11…CPU(演算制御装置)
12…RAM(ランダム・アクセス・メモリ:記憶装置)
13…ROM(リード・オンリ・メモリ:記憶装置)
14…HDD(ハード・ディスク・ドライブ:記憶装置)
15…通信インタフェース
16…入出力インタフェース
17…マウス
18…フラット・パネル・ディスプレイ(表示装置)
2…マイクロブログ・サーバ
20、21…ハード・ディスク・ドライブ
31…スマートフォン
32…タブレット
33…(ノート型)パーソナル・コンピュータ

Claims (17)

  1. 複数のユーザがそれぞれメッセージを発信するソーシャル・メディアにおいて、コンピュータにより、前記複数のユーザをクラスタリングする方法であり、
    前記メッセージ同士の関係に基づいて、前記複数のユーザから複数の部分コミュニティを抽出するステップと、
    前記複数の部分コミュニティのうち、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算するステップと、
    前記第一類似度が予め定められた第一閾値よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、前記両部分コミュニティ同士の類似性を示す第二類似度を演算するステップと、
    前記第二類似度が予め定められた第二閾値よりも高いことを条件に、前記両部分コミュニティ同士を統合して統合コミュニティを生成するステップと
    を備える方法。
  2. 前記メッセージには、一のユーザの発信した一のメッセージに応答して他のユーザが発信する他のメッセージを含み、
    前記抽出するステップは、前記メッセージ同士が前記一のメッセージと前記一のメッセージに応答して発信された前記他のメッセージに該当するか否かに基づいて、前記複数のユーザから複数の部分コミュニティを抽出する請求項1に記載の方法。
  3. 前記抽出するステップは、<強連結成分>である請求項1に記載の方法。
  4. 前記ソーシャル・メディアは、ユーザのプロフィール情報を記憶しており、
    前記第一類似度を演算するステップは、前記一の部分コミュニティに属するユーザのプロフィール情報と、前記他の部分コミュニティに属するユーザのプロフィール情報との関係に基づいて、前記第一類似度を演算する請求項1に記載の方法。
  5. 前記ソーシャル・メディアは、ある特定のユーザが他の特定のユーザをフォローする機能を提供し、
    前記第一類似度を演算するステップは、前記一の部分コミュニティに属するユーザと、前記他の部分コミュニティに属するユーザとのフォロー及び被フォロー関係に基づいて、前記第一類似度を演算する請求項1に記載の方法。
  6. 前記第二類似度を演算するステップは、一の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語と、他の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語とが類似するか否かに基づいて、前記第二類似度を演算する請求項1に記載の方法。
  7. 前記特徴的な用語は、メッセージの特徴ベクトル生成により抽出される請求項6に記載の方法。
  8. 前記メッセージは、前記ソーシャル・メディアに投稿されたメッセージから所定の条件の下にサンプリングされたメッセージである請求項1に記載の方法。
  9. 前記メッセージは、前記ソーシャル・メディアに所定の期間内に投稿されたメッセージのうち、所定のキーワードを含む条件の下にサンプリングされたメッセージである請求項1に記載の方法。
  10. 前記ソーシャル・メディアをホストするコンピュータと、前記複数のユーザをクラスタリングするコンピュータとがネットワークを介して接続され、
    前記クラスタリングするコンピュータからの前記所定の条件付き要求に応答して、前記ホストするコンピュータから送信される前記メッセージを前記クラスタリングするコンピュータが受信するステップを更に備える請求項8に記載の方法。
  11. 前記受信した前記メッセージを、前記クラスタリングするコンピュータの記憶手段に記憶するステップを更に備える請求項10に記載の方法。
  12. 前記ソーシャル・メディアがマイクロブログである請求項1に記載の方法。
  13. 前記統合コミュニティをグラフィカル・ユーザ・インターフェイスを用いて出力するステップを更に備える請求項1に記載の方法。
  14. 前記統合コミュニティを前記特徴的な用語とともに出力する請求項6に記載の方法。
  15. コンピュータに実行されることで、請求項1乃至14のいずれかに記載の方法のすべてのステップを前記コンピュータに実行させるコンピュータ・プログラム。
  16. 複数のユーザがそれぞれメッセージを発信するソーシャル・メディアに対し、前記複数のユーザをクラスタリングするコンピュータであり、
    前記コンピュータの記憶手段には、前記メッセージが記憶されており、
    前記コンピュータの演算制御制御手段が、
    前記メッセージ同士の関係に基づいて、前記複数のユーザから複数の部分コミュニティを抽出し、
    前記複数の部分コミュニティのうち、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算し、
    前記第一類似度が予め定められた第一閾値よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、前記両部分コミュニティ同士の類似性を示す第二類似度を演算し、
    前記第二類似度が予め定められた第二閾値よりも高いことを条件に、前記両部分コミュニティ同士を統合して統合コミュニティを生成する
    コンピュータ。
  17. 前記記憶手段に記憶されるメッセージは、前記ソーシャル・メディアに投稿されるメッセージからサンプリングされたメッセージである請求項16に記載のコンピュータ。
JP2013550188A 2011-12-19 2012-11-22 ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ Expired - Fee Related JP5893050B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013550188A JP5893050B2 (ja) 2011-12-19 2012-11-22 ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011276995 2011-12-19
JP2011276995 2011-12-19
JP2013550188A JP5893050B2 (ja) 2011-12-19 2012-11-22 ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ
PCT/JP2012/080320 WO2013094361A1 (ja) 2011-12-19 2012-11-22 ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ

Publications (2)

Publication Number Publication Date
JPWO2013094361A1 true JPWO2013094361A1 (ja) 2015-04-27
JP5893050B2 JP5893050B2 (ja) 2016-03-23

Family

ID=48668260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013550188A Expired - Fee Related JP5893050B2 (ja) 2011-12-19 2012-11-22 ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ

Country Status (5)

Country Link
US (2) US9659098B2 (ja)
JP (1) JP5893050B2 (ja)
CN (1) CN103999082B (ja)
DE (1) DE112012005307T5 (ja)
WO (1) WO2013094361A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112012005307T5 (de) 2011-12-19 2014-10-02 International Business Machines Corporation Verfahren, Computerprogramm und Computer zum Erkennen von Gemeinschaften in einem sozialen Medium
JP6182478B2 (ja) * 2014-02-28 2017-08-16 株式会社日立製作所 解析装置及び解析方法
CN106709800B (zh) * 2016-12-06 2020-08-11 中国银联股份有限公司 一种基于特征匹配网络的社团划分方法和装置
KR101810864B1 (ko) * 2017-02-06 2017-12-20 한양대학교 산학협력단 하이브리드 방식의 영향력 평가 방법 및 장치
CN110070287A (zh) * 2019-04-19 2019-07-30 西北工业大学 一种基于相似聚类及平均思想的动态任务分配方法
CN110674290B (zh) * 2019-08-09 2023-03-10 国家计算机网络与信息安全管理中心 一种用于重叠社区发现的关系预测方法、装置和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218353A (ja) * 2009-03-18 2010-09-30 Oki Electric Ind Co Ltd クラスタリング装置およびクラスタリング方法
JP2010286868A (ja) * 2009-06-09 2010-12-24 Nec Corp コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001014349A (ja) 1999-06-28 2001-01-19 Nippon Telegr & Teleph Corp <Ntt> 協調情報フィルタリング用レイティングシステム
US8117281B2 (en) * 2006-11-02 2012-02-14 Addnclick, Inc. Using internet content as a means to establish live social networks by linking internet users to each other who are simultaneously engaged in the same and/or similar content
US7644144B1 (en) * 2001-12-21 2010-01-05 Microsoft Corporation Methods, tools, and interfaces for the dynamic assignment of people to groups to enable enhanced communication and collaboration
JP4369104B2 (ja) 2002-10-07 2009-11-18 みずほ情報総研株式会社 コミュニティ形成支援システム、その端末、サーバ及びプログラム
US7406459B2 (en) 2003-05-01 2008-07-29 Microsoft Corporation Concept network
US7958120B2 (en) * 2005-05-10 2011-06-07 Netseer, Inc. Method and apparatus for distributed community finding
JP2008107867A (ja) * 2006-10-23 2008-05-08 Hitachi Ltd コミュニティ抽出方法、コミュニティ抽出処理装置
JP2008140174A (ja) 2006-12-01 2008-06-19 Tmf Create:Kk コミュニケーションサービスシステム
JP2008257512A (ja) 2007-04-05 2008-10-23 Hitachi Ltd 情報提供装置およびプログラム
BRPI0811634A2 (pt) * 2007-05-15 2017-08-08 Social Project Inc Sistema e método para criar uma comunidade online de rede de comunicação social
US9384186B2 (en) * 2008-05-20 2016-07-05 Aol Inc. Monitoring conversations to identify topics of interest
JP2009301335A (ja) 2008-06-13 2009-12-24 Ricoh Co Ltd 画像処理装置、画像処理方法及びコンピュータプログラム
JP5159451B2 (ja) 2008-06-13 2013-03-06 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワーク行動を分析する情報処理装置、分析システム、ネットワーク行動の分析方法およびプログラム
US8838601B2 (en) * 2011-08-31 2014-09-16 Comscore, Inc. Data fusion using behavioral factors
DE112012005307T5 (de) 2011-12-19 2014-10-02 International Business Machines Corporation Verfahren, Computerprogramm und Computer zum Erkennen von Gemeinschaften in einem sozialen Medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218353A (ja) * 2009-03-18 2010-09-30 Oki Electric Ind Co Ltd クラスタリング装置およびクラスタリング方法
JP2010286868A (ja) * 2009-06-09 2010-12-24 Nec Corp コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015040260; 畑本 典宣: 'マイクロブログにおけるユーザのクラスタリングとそのクラスタの特徴語抽出' 言語処理学会第17回年次大会発表論文集 チュートリアル 本会議 ワークショップ [CD-ROM] , 20110307, P.280-283, 言語処理学会 *

Also Published As

Publication number Publication date
CN103999082A (zh) 2014-08-20
WO2013094361A1 (ja) 2013-06-27
US20140337343A1 (en) 2014-11-13
DE112012005307T5 (de) 2014-10-02
JP5893050B2 (ja) 2016-03-23
CN103999082B (zh) 2017-09-12
US20170154106A1 (en) 2017-06-01
US10068009B2 (en) 2018-09-04
US9659098B2 (en) 2017-05-23

Similar Documents

Publication Publication Date Title
US10218657B2 (en) Method and system for providing private chat within a group chat
US11703999B2 (en) Changing visual aspects of a graphical user interface to bring focus to a message
US10462087B2 (en) Tags in communication environments
US8838599B2 (en) Efficient lexical trending topic detection over streams of data using a modified sequitur algorithm
US20180060312A1 (en) Providing ideogram translation
CN106375191B (zh) 新闻订阅源技术
JP5893050B2 (ja) ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ
US8788342B2 (en) Intelligent feature expansion of online text ads
US20130159847A1 (en) Dynamic Personal Dictionaries for Enhanced Collaboration
US20100114938A1 (en) Search results for a topic that include a list of messaging users that have previously searched on that topic
US9294578B2 (en) Method of virally expanding social networks
JP5961320B2 (ja) ソーシャル・メデイアにおけるユーザの分類方法、コンピュータ・プログラム及びコンピュータ
JP2016149140A (ja) 構造化された検索クエリのための文法モデル
US9596205B2 (en) System and method for mailing list identification and representation
WO2012159011A2 (en) Method to increase content relevance using insights obtained from user activity updates
TW201205307A (en) Method, apparatus and computer program product for efficiently sharing information
US11636442B2 (en) Systems and methods for future event recommendation
JP5881396B2 (ja) 識別情報管理支援システム、識別情報管理支援方法およびプログラム
WO2013094352A1 (ja) ソーシャル・メデイアにおけるトレンドを検出する方法、コンピュータ・プログラム、コンピュータ。
KR20180003932A (ko) 컨텐츠 포스팅 방법 및 포스팅 장치
US11138208B2 (en) Contextual insight system
US10873554B2 (en) Determining consensus among message participants based on message content

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160223

R150 Certificate of patent or registration of utility model

Ref document number: 5893050

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees