JP6575335B2 - ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法、コンピュータシステム、及びプログラム - Google Patents

ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法、コンピュータシステム、及びプログラム Download PDF

Info

Publication number
JP6575335B2
JP6575335B2 JP2015235792A JP2015235792A JP6575335B2 JP 6575335 B2 JP6575335 B2 JP 6575335B2 JP 2015235792 A JP2015235792 A JP 2015235792A JP 2015235792 A JP2015235792 A JP 2015235792A JP 6575335 B2 JP6575335 B2 JP 6575335B2
Authority
JP
Japan
Prior art keywords
facility
social media
facilities
media message
network graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015235792A
Other languages
English (en)
Other versions
JP2017045435A (ja
Inventor
チェン フランシーン
チェン フランシーン
ボカイ カオ
ボカイ カオ
インイン チェン
インイン チェン
ジョシ ディラジ
ジョシ ディラジ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Publication of JP2017045435A publication Critical patent/JP2017045435A/ja
Application granted granted Critical
Publication of JP6575335B2 publication Critical patent/JP6575335B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/222Monitoring or handling of messages using geographical location information, e.g. messages transmitted or received in proximity of a certain spot or area
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法、コンピュータシステム、及びプログラムに関する。
ソーシャルプラットフォーム(例えば、ツイッター)は、アクティビティ、考え及び評価を共有するためによく使用されている。ソーシャルメディアメッセージに位置情報タグを付与(例えば、物理的な位置もしくは施設とツィートとを関連付ける)することによって、アプリケーションは、位置情報に基づいてユーザの経験をパーソナライズすることができる。しかしながら、プライバシーの観点から、ソーシャルメディアメッセージを投稿する際に位置を公開することを選択するユーザの割合は少なく、多くのユーザは特別な場合にだけメッセージを投稿した位置を公開する。
明示的に位置情報タグが付与されているソーシャルメディアメッセージの割合はたいへん少ないので、他の情報(例えば、メッセージのコンテンツ)に基づくソーシャルメディアメッセージの位置の推定が有用である。例えば、ある研究によれば、位置情報タグが付与されているツィートは1%に満たない。位置情報タグが付与されていないメッセージについて、アプリケーションのいくつかは、メッセージのテキストコンテンツに基づいて位置を推定する。
「ビジネスロケーションのソーシャルメディアベースプロファイリング(Social Media-based Profiling of Business Locations)」、位置情報タグ及びマルチメディアにおけるその応用に関する第3回ACMマルチメディアワークショップ抄録(Proceedings of the 3rd ACM Multimedia Workshop on Geotagging and its Applications in Multimedia)、2014年、頁1〜6 ジャン(Zhang)、「メタパスベースマルチネットワーク集合リンク予測(Meta-path based Multi-Network Collective Link Prediction)」、2014年8月24日〜27日、頁10 ラケシュ(Rakesh)、「位置特定ツィート検出及びツィッター(登録商標)のトピック要約(Location-Specific Tweet Detection and Topic Summarization in Twitter(登録商標))」、ソーシャルネットワーク分析及びマイニングの進展に関するIEEE/ACM国際会議(IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining)、2013年8月25日〜28日、頁4
しかしながら、メッセージは、明確な位置信号を有さず、様々な日常のアクティビティ(例えば、食事、スポーツ、感情、評価)を混合し得る。さらに、多くのソーシャルメディアメッセージ(例えば、ツィート)は短く、フォーマルではない。したがって、明確な地理用語はコンテンツに全く現れないかもしれない。適切な場所の名称が含まれていたとしても、特定の位置を識別することは困難であるし、チェーン店の場合はさらに困難である。例えば、バークレイのスターバックスサイトに関連するツィートのコンテンツとスタンフォードのスターバックスサイトに関連するコンテンツとに大差はない。したがって、どちらの店舗からツィートが投稿されたか、ツィートのコンテンツから知ることは容易ではない。
位置情報タグを付与されていないソーシャルメディアメッセージの位置を推定することで、ユーザの地理コンテンツの理解を容易にすることができる。これにより、サーチクエリーの地理的意図のより適切な推定、より適切な広告の配置及びイベントに関する情報、関心点、ユーザの地理的近傍にいる人々の表示が可能となる。ソーシャルメディアメッセージに対応する地理位置を識別する従来のシステム及び方法は、位置検出に使用する技術に基づいて大きく2つのグループに分類することができる。(1)ソーシャルメディアメッセージのコンテンツ分析、及び(2)ユーザのソーシャル関係に基づく推定、である。システムのいくつかはユーザの位置を推定することに焦点を当て、他のシステムは個別のソーシャルメディアメッセージに関連する位置を推定することに焦点を当てている。
位置推定の問題の一つは、全てのソーシャルメディアメッセージが位置又は施設に関連付けられているわけではない、ということである。位置情報タグを付与されていないソーシャルメディアメッセージが与えられた場合、アプリケーションのいくつかは複数の施設の各々について確率を計算し、最も高い確率を有する一つ(もしくは複数の)正しい施設を類推する。しかしながら、この技術は、メッセージが何れの施設にも全くリンクされるべきでない場合、ソーシャルメディアメッセージと施設とを不適切に関連付けるかもしれない。
ソーシャルメディアメッセージを施設に自動的に割り当てる際に、重要な第一歩は、少なくとも1つの関心を有する施設に、位置情報タグを付与されていないメッセージが実際に「リンク」されているか否か判定することである。リンクは、メッセージが当該施設で投稿されたことを示す。次に、関心を有する少なくとも1つの施設にリンクされているメッセージだけをさらに分析する。例えば、施設は予測されてもよいし、候補施設は順位付けされてもよい。
開示の実装は、ソーシャルネットワーク分析に基づく施設リンク検出の方法を提供する。ネットワークは関心を有する施設を表すノードを含む。ネットワークは、「非施設」を表す特殊なノードも含む。リンク検出手段は、関心を有する施設で投稿されたメッセージ及び何れの施設にも関連しないメッセージに関して訓練される。訓練されたモデル及び保存されている統計値を用いて、位置情報タグを付与されていないメッセージが施設の各々にリンクされている確率を計算する。実装のいくつかにおいて、統計値は、次に、メッセージが非施設ノードにリンクされている確率を正規化するために使用される。統計値は、メッセージが施設の少なくとも1つにリンクされているか否かを判定するために使用される。
開示の実装は、ユーザによって生成されたコンテンツが施設の何れかにリンクされているか否か識別するために様々なソーシャルネットワークに適用することができる。ソーシャルネットワークは、例えば、様々なマイクロブログ及びモバイルソーシャルメディアの投稿、ユーザによって撮影された写真、及び紙媒体著作出版施設ネットワークなどを含む。
本開示の実装によるシステム及び方法は、ユーザによる他のソーシャルメッセージ(例えば、ツィート、フェイスブックの投稿など)及びユーザの属するソーシャルネットワークの他の人々によって投稿されたメッセージも利用する。実装のいくつかにおいて、構築された異種情報ネットワークに埋め込まれたソーシャルアクティビティを分析し、例えば、地理データを利用することによって、問題を解決する。
実装のいくつかは、代替的なコンテキストに同様の技術を適用する。詳細には、コンテンツが関心点(POI)で生成されたか否かを推定するために、開示の技術を適用してもよい。例えば、写真、ユーザ及び関心点のソーシャルネットワークグラフを生成することで、当該技術によれば、(位置情報タグを付与されていない)写真が関心点で生成されたか否か推定することができる。同様に、提出紙媒体、著者及び会議のソーシャルネットワークグラフを生成することで、開示の技術によれば、紙媒体が会議で生成されたか否か推定することができる。
第1実施形態は、ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法であって、少なくとも1つのプロセッサ、及び少なくとも1つの前記プロセッサによって実行される少なくとも1つのプログラムを記憶したメモリを含むコンピュータシステムが、ソーシャルメディアユーザを表すノード、前記ソーシャルメディアユーザによって生成されたメッセージを表すノード、及び施設を表すノードを含むソーシャルネットワークグラフにアクセスし、前記ソーシャルネットワークグラフに表される施設は、複数の主要施設及び非施設を含み、ソーシャルメディアメッセージノード及び非施設に対応するノードの間の前記ソーシャルネットワークグラフのリンクはソーシャルメディアメッセージが前記主要施設の何れにも対応していないことを示し、複数の訓練特徴ベクトルを構築し、訓練特徴ベクトルの各々は、ソーシャルメディアメッセージの各々及び施設の各々の間の連結性を測定するために、前記ソーシャルネットワークグラフによるパスを使用する複数の特徴の各々を含み、ソーシャルメディアメッセージが施設と関連する確率を推定するために、前記訓練特徴ベクトルを用いて分類手段を訓練し、新しいソーシャルメディアメッセージをユーザから受信し、新しい前記ソーシャルメディアメッセージの特徴ベクトルを構築し、特徴ベクトルの各々は、新しい前記ソーシャルメディアメッセージ及び非施設の間の連結性を測定するために、前記ソーシャルネットワークグラフによるパスを使用する複数の特徴を含み、新しい前記ソーシャルメディアメッセージが前記非施設と関連付けられている確率を計算するための入力として前記特徴ベクトルを用いて、訓練した前記分類手段を実行し、計算した確率が所定の閾値を越える場合、新しい前記ソーシャルメディアメッセージが前記主要施設の何れにも関連付けられていないことを判定し、計算した確率が前記所定の閾値以下である場合、新しい前記ソーシャルメディアメッセージが前記主要施設の1つと関連付けられていることを判定する。
第2実施形態は、第1実施形態の方法であって、計算した前記確率を、前記所定の閾値と比較する前に正規化する。
第3実施形態は、第2実施形態の方法であって、前記分類手段を用いて、ソーシャルメディアメッセージが施設と関連付けられている確率の中央値を計算し、計算した前記確率を正規化するために前記確率の中央値を使用する。
第4実施形態は、第1〜第3実施形態の何れかの方法であって、訓練特徴ベクトルの各々は、ソーシャルメディアメッセージの各々が施設の各々に関連付けられているか否かを示すラベルを含み、訓練特徴ベクトルの各々の少なくとも1つの特徴は、前記ソーシャルネットワークグラフによるパスのタイプの各々に基づく計測値を含む。
第5実施形態は、第4実施形態の何れかの方法であって、第1特徴は、ユーザのソーシャルメディアメッセージから施設への前記ソーシャルネットワークグラフによる直接的なパスに対応する。
第6実施形態は、第4又は第5実施形態の方法であって、第2特徴は、ユーザのソーシャルメディアメッセージから施設への前記ソーシャルネットワークグラフによるともだちの接続を介したパスに対応する。
第7実施形態は、第4〜第6実施形態の何れかの方法であって、前記ソーシャルネットワークグラフは施設カテゴリに対応するノードを含み、第3特徴は、共通施設カテゴリを共有する施設のペアを接続する前記ソーシャルネットワークグラフによるパスに対応する。
第8実施形態は、第4〜第7実施形態の何れかの方法であって、前記ソーシャルネットワークグラフは、前記ソーシャルメディアメッセージのコンテンツワードに対応するノードを含み、第4特徴は、少なくとも1つの共有コンテンツワードを有するノードのペアを接続する前記ソーシャルネットワークグラフによるパスに対応する。
第9実施形態は、第4〜第8実施形態の何れかの方法であって、複数の訓練特徴ベクトルを構築することは、ソーシャルメディアメッセージの各々と施設の各々とを接続する前記ソーシャルネットワークグラフによるパスのタイプの各々についてパスカウントを取得し、前記訓練特徴ベクトルの特徴として前記パスカウントを設定する。
第10実施形態は、第1〜第9実施形態の何れかの方法であって、訓練特徴ベクトルの第5の特徴は、施設の各々とユーザによって生成され予め位置情報タグが付与されたソーシャルメディアメッセージの物理座標との間の物理距離を計測する。
第11実施形態は、第1〜第10実施形態の何れかの方法であって、前記分類手段は、サポートベクターマシンを用いて訓練される。
第12実施形態は、第1〜第11実施形態の何れかの方法であって、前記主要施設は、所定領域、施設のタイプ、施設の名称、ユーザの嗜好、施設推定の履歴及びソーシャルメディアメッセージと関連付けられている地理座標からの距離の少なくとも1つに基づいて選択される。
第13実施形態は、第1〜第9実施形態の何れかの方法であって、新しい前記ソーシャルメディアメッセージは位置情報タグを付与されていない。
第14実施形態は、第1〜第13実施形態の何れかの方法であって、新しい前記ソーシャルメディアメッセージが前記主要施設に関連付けられていることが判定された後、前記ソーシャルメディアメッセージに対応する施設として前記主要施設の特定の第1施設を判定するために順位付けプロセスを適用することをさらに含む。
第15実施形態は、第14実施形態の方法であって、前記順位付けプロセスは、少なくとも複数の前記主要施設について確率スコアを計算し、前記ソーシャルメディアメッセージに対応する施設として最高確率スコアを有する前記主要施設の少なくとも1つを識別する、ことを含む。
第16実施形態は、ソーシャルメディアメッセージ及び施設の間のリンクを推定するコンピュータシステムであって、少なくとも1つのプロセッサと、メモリと、少なくとも1つの前記プロセッサによって実行されるように構成された前記メモリに記憶されている少なくとも1つのプログラムと、を含む。少なくとも1つの前記プログラムは、ソーシャルメディアユーザを表すノード、前記ソーシャルメディアユーザによって生成されたソーシャルメディアメッセージを表すノード、及び施設を表すノードを含むソーシャルネットワークグラフにアクセスし、前記ソーシャルネットワークグラフで表される施設は、複数の主要施設及び非施設を含み、ソーシャルメディアメッセージノード及び前記非施設に対応するノードの間の前記ソーシャルネットワークグラフのリンクはソーシャルメディアメッセージが前記主要施設の何れにも対応していないことを示し、複数の訓練特徴ベクトルを構築し、訓練特徴ベクトルの各々が、ソーシャルメディアメッセージの各々及び施設の各々の間の連結性を測定するために前記ソーシャルネットワークグラフによるパスを使用する複数の特徴の各々を含み、前記訓練特徴ベクトルを用いて、ソーシャルメディアメッセージが施設と関連付けられている確率を推定するために分類手段を訓練し、ユーザから新しいソーシャルメディアメッセージを受信し、新しい前記ソーシャルメディアメッセージについて特徴ベクトルを構築し、特徴ベクトルの各々は、新しい前記ソーシャルメディアメッセージ及び非施設の間の連結性を測定するために前記ソーシャルネットワークグラフによるパスを使用する複数の特徴を含み、新しい前記ソーシャルメディアメッセージが前記非施設と関連付けられている確率を計算するための入力として前記特徴ベクトルを使用して訓練した前記分類手段を実行し、計算した前記確率が所定の閾値よりも大きい場合、新しい前記ソーシャルメディアメッセージが前記主要施設の何れとも関連付けられていないことを判定し、計算した前記確率が前記所定の閾値以下の場合、新しい前記ソーシャルメディアメッセージが前記主要施設の1つと関連付けられていることを判定する、命令を含む。
第17実施形態は、第16実施形態のコンピュータシステムであって、計算した前記確率は、前記所定の閾値と比較する前に正規化される。
第18実施形態は、第17実施形態のコンピュータシステムであって、少なくとも1つの前記プログラムは、前記分類手段を用いて、ソーシャルメディアメッセージが施設と関連付けられている確率の中央値を計算する、命令をさらに含み、計算した前記確率を正規化することは前記確率の中央値を使用する。
第19実施形態は、第18実施形態のコンピュータシステムであって、訓練特徴ベクトルの各々は、前記ソーシャルメディアメッセージの各々が前記施設の各々に関連付けられているか否かを示すラベルを含み、訓練特徴ベクトルの各々の少なくとも1つの特徴は、前記ソーシャルネットワークグラフによるパスのタイプの各々に基づく計測値を含む。
第20実施形態は、プログラムであって、ソーシャルメディアユーザを表すノード、前記ソーシャルメディアユーザによって生成されたソーシャルメディアメッセージを表すノード、及び施設を表すノードを含むソーシャルネットワークグラフにアクセスし、前記ソーシャルネットワークグラフに示される施設は、複数の主要施設及び非施設を含み、ソーシャルメディアメッセージノード及び前記非施設に対応するノードの間の前記ソーシャルネットワークグラフのリンクは、前記ソーシャルメディアメッセージが前記主要施設の何れにも対応しないことを示し、複数の訓練特徴ベクトルを構築し、訓練特徴ベクトルの各々は、ソーシャルメディアメッセージの各々及び施設の各々の間の連結性を計測するために前記ソーシャルネットワークグラフによるパスを使用する複数の特徴の各々を含み、前記訓練特徴ベクトルを用いて、ソーシャルメディアメッセージが施設と関連付けられている確率を推定するために分類手段を訓練し、ユーザから新しいソーシャルメディアメッセージを受信し、新しい前記ソーシャルメディアメッセージについて特徴ベクトルを構築し、特徴ベクトルの各々は、新しい前記ソーシャルメディアメッセージ及び非施設の間の連結性を測定するために前記ソーシャルネットワークグラフによるパスを使用する複数の特徴を含み、新しい前記ソーシャルメディアメッセージが前記非施設と関連付けられている確率を計算するために入力として前記特徴ベクトルを用いて訓練した前記分類手段を実行し、計算した前記確率が所定の閾値より大きい場合、新しい前記ソーシャルメディアメッセージが前記主要施設の何れにも関連付けられていないことを判定し、計算した前記確率が前記所定の閾値以下である場合、前記ソーシャルメディアメッセージが前記主要施設の1つと関連付けられていることを判定する、処理をコンピュータに実行させる。
本発明によれば、ソーシャルメッセージが何れの施設にも全くリンクされるべきでない場合、ソーシャルメディアメッセージと施設とを不適切に関連付けないようにすることができる。
実装のいくつかによるソーシャルメディアメッセージの施設リンク検出システムを例示するブロック図である。 実装のいくつかによるサーバを例示するブロック図である。 実装のいくつかによるクライアントデバイスを例示するブロック図である。 実装のいくつかによるソーシャルメディアメッセージから施設を推定する方法を例示するフローチャートである。 実装のいくつかによるソーシャルメディアメッセージから施設を推定し、施設リンクを検出するソーシャルネットワークグラフの一例である。 実装のいくつかによる施設リンク検出システムのいくつかで使用されるメタパスの例である。 実装のいくつかによる地理的近接を計算するために使用する式の例である。 実装のいくつかによる地理的近接を計算するために使用する式の例である。 実装のいくつかによる訓練段階で使用される訓練特徴ベクトルの例のいくつかである。 実装のいくつかによる訓練した分類手段を使用して、ソーシャルメディアメッセージから施設を推定するプロセスである。 実装のいくつかによる施設リンク検出システムの訓練及び使用のプロセスである。 実装のいくつかによる施設リンク検出システムの訓練及び使用のプロセスである。 実装のいくつかによるソーシャルメディアメッセージが施設にリンクされているか否かを判定するために、施設リンク分類手段が出力を正規化する方法を例示する。 実装のいくつかによるソーシャルメディアメッセージが施設にリンクされているか否かを判定するために、施設リンク分類手段が出力を正規化する方法を例示する。 実装のいくつかによるソーシャルネットワークグラフに追加してもよいリンクの例である。 実装のいくつかによる非施設ノードにツィートを接続するソーシャルネットワークグラフによるメタパスのいくつかである。 実装のいくつかによる様々な施設リンク分類手段の性能を評価するデータの表である。 実装のいくつかによる施設リンクを検出するプロセスのフローチャートである。 実装のいくつかによる施設リンクを検出するプロセスのフローチャートである。 実装のいくつかによる施設リンクを検出するプロセスのフローチャートである。 実装のいくつかによる施設リンクを検出するプロセスのフローチャートである。
添付の図面に例を示す様々な実装の詳細を参照する。同様の参照符号は、全ての図面にわたって対応する要素を参照する。本発明及び実装の全体的な理解を提供するために、複数の特定の詳細を以下で説明する。しかしながら、本発明は特定の詳細を含まないで実用化され得る。他の例において、よく知られた方法、プロシージャ、構成要素及び回路は、実装の様相を不必要に不明瞭としないように、詳細には説明しない。
図1は、実装のいくつかによるサーバシステム104の部分である分類モジュール114を含む分散システム100のブロック図である。分散環境(分散システム)100は、ユーザ106(例えば、ユーザ106−1、…、106−s)によって操作される一つもしくは複数のクライアント102(例えば、クライアント102−1、…、102−r)を含む。クライアントデバイス102とユーザ106との間の対応は一対一である必要はない。サーバシステム104は、インターネットなどの一つもしくは複数の通信ネットワーク108によってクライアント102と相互に接続されている。
クライアント102(「クライアントデバイス」もしくは「クライアントコンピュータ」と呼ばれることもある)は、コンピュータもしくは同様のデバイスであってよく、クライアント102のユーザ106は、クライアント102を介して、サーバシステム104にリクエストを送信し、サーバシステム104から結果もしくはサービスを受け取る。クライアントデバイスの例は、デスクトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、モバイルフォン、PDA(personal digital assistant)、セットトップボックス、もしくはこれらの任意の組み合わせである。クライアント102は、一般的に、サーバシステム104にリクエストを送信することができるクライアントアプリケーション326(図3)を稼動する。例えば、クライアント102のいくつかは、ウェブブラウザ324(図3)もしくは、ユーザ106がサーチし、ブラウズし、及び/もしくは、通信ネットワーク108を介してサーバシステム104からアクセスされるリソース(例えば、ウェブページ及びウェブサービス)を使用するための他のタイプのアプリケーションを含む。
いくつかの例において、クライアントデバイス102は、ラップトップコンピュータもしくはスマートフォンなどのモバイルデバイスである。ユーザ106は、一般的に、メッセージング及びツイッター、フォースクエア、及びフェイスブックなどの外部サービス122とインタラクションするソーシャルメディアアプリケーションを実行するために、モバイルデバイス(クライアント)102を使用する。サーバシステム104は、メッセージ及び施設推定のための施設データを取得するために外部サービス122に接続する。
実装のいくつかにおいて、クライアントデバイス102は、ソーシャルメディアメッセージ分類システムの構成要素としてサーバシステム104の分類モジュール114と共に作動するローカル分類手段(例えば、アプリケーション326(図3))を含む。実装のいくつかにおいて、分類手段は、外部サービス122もしくはサーバシステム104に保存されている大規模ソーシャルメディアメッセージデータベースを構築し当該大規模ソーシャルメディアメッセージデータベースからソーシャル(メディア)メッセージを検索するソフトウェアアプリケーションである。実装のいくつかにおいて、ローカル分類手段はクライアント102で稼動するが、他の実装では、ローカル分類手段はサーバシステム104の分類モジュール114の一部分である。実装のいくつかにおいて、ローカル分類手段及び分類モジュール114はサーバシステム104の別個のサーバに実装されてもよい。
通信ネットワーク108は、イントラネット、エクストラネット、インターネット、もしくはこれらのネットワークの組み合わせである有線もしくは無線のローカルエリアネットワーク(LAN)及び/もしくはワイドエリアネットワーク(WAN)であってよい。
実装のいくつかにおいて、通信ネットワーク108は、TCP/IP(Transmission Control Protocol/Internet Protocol)を用いて情報を運ぶHTTP(Hyper Text Transport Protocol)を使用する。HTTPによって、クライアントコンピュータは、通信ネットワーク108を介して利用可能な様々なリソースにアクセスすることができる。用語「リソース」は、コンテンツ位置識別子(例えば、URL)を介してアクセス可能な情報及び/もしくはサービスを表し、リソースは、例えば、ウェブページ、ドキュメント、データベース、画像、計算オブジェクト、サーチエンジンもしくは他のオンライン情報サービスであってよい。
実装のいくつかにおいて、サーバシステム104はコンテンツ(例えば、施設、ソーシャルメディアメッセージ、ウェブページ、画像、デジタルフォト、ドキュメント、ファイル及び広告)を配送する。実装のいくつかにおいて、サーバシステム104は多くのファイルもしくは様々なタイプの他のデータ構造を含み、これらのファイルもしくはデータ構造は、テキスト、グラフィックス、ビデオ、音声、デジタルフォト及び他のデジタルメディアファイルを含む。
実装のいくつかにおいて、サーバシステム104は分類モジュール114を含む。分類モジュール114は、ツイッターによって保存されているツィート、フォースクエアによって保存されている施設、など既存のソーシャルメディアメッセージ及び施設の大規模集合を利用する機械学習アプリケーションである。この機械学習アプリケーションはソーシャルメディアメッセージの分類を自動化する。
実装のいくつかにおいて、サーバシステム104は、外部サービス122に接続し、外部サービス122によって収集されたソーシャルメディアメッセージ及び施設などの情報を取得する。取得された情報は、次に、サーバ104のデータベース112に保存される。実装のいくつかにおいて、データベース112はソーシャルメディアメッセージ228及び施設230(図2)を保存する。これらのデータは、ソーシャルネットワークグラフ232を構築するために使用される。このようなグラフの構築の概要を、図5及び図11Aを用いて以下に例示する。実装のいくつかにおいて、分類手段224を訓練する間、訓練特徴ベクトル226がデータベースに保存される。実装のいくつかにおいて、データベース112は他のデータも保存する。
図2は、サーバシステム104で使用されることが可能なサーバ200を例示するブロック図である。一般的なサーバシステムは、同じ場所に配置される、もしくは複数の物理的に異なる場所に配置される多くの個別のサーバ200を含む。サーバ200は、一般的に、メモリ214に保存されているモジュール、プログラム、もしくは命令を実行する一つもしくは複数のCPU(処理ユニット)202を含み、当該CPU202によってオペレーションを処理する。サーバ200は、さらに、一つもしくは複数のネットワークもしくは他の通信インターフェイス204、メモリ214、及び、これらの構成要素を相互に接続する一つもしくは複数の通信バス212を含む。通信バス212は回路(チップセットとも呼ばれる)を含むことができ、当該回路はシステム構成要素を相互に接続し、システム構成要素間の通信を制御する。実装のいくつかにおいて、サーバ200は、ユーザインターフェイス206を含み、当該ユーザインターフェイス206は表示デバイス208及び、キーボード及びマウスなどの一つもしくは複数の入力デバイス210を含む。
実装のいくつかにおいて、メモリ214はDRAM、SRAM、DDR RAMもしくは他のランダムアクセスソリッドステートメモリデバイスなどの高速ランダムアクセスメモリを含む。実装のいくつかにおいて、メモリ214は、一つもしくは複数の磁気ディスクストレージデバイス、光ディスクストレージデバイス、フラッシュメモリデバイス、もしくは他の不揮発性ソリッドステートストレージデバイスなどの不揮発性メモリを含む。実装のいくつかにおいて、メモリ214はCPU202から離れた位置に配置されている一つもしくは複数のストレージデバイスを含む。メモリ214もしくは代替的にメモリ214の不揮発性メモリデバイスは非一時的コンピュータ可読ストレージ媒体を含む。実装のいくつかにおいて、メモリ214もしくはメモリ214のコンピュータ可読ストレージ媒体は、以下のプログラム、モジュール及びデータ構造もしくはこれらのサブセットを保存する。
●オペレーティングシステム216。オペレーティングシステム216は、様々な基本システムサービスに対処し、ハードウェア依存タスクを実行するプロシージャを含む。
●通信モジュール218。通信モジュール218は、一つもしくは複数の通信(ネットワーク)インターフェイス204及びインターネット、他のワイドエリアネットワーク、ローカルエリアネットワーク、メトロポリタンネットワークなどの(有線もしくは無線の)通信ネットワーク108を介して、他のコンピュータとサーバ200とを接続するために使用される。
●ユーザインターフェイスモジュール220。ユーザインターフェイスモジュール220は、一つもしくは複数の入力デバイス210から入力を受け取り、表示デバイス208に表示されるユーザインターフェイスエレメントを生成する。
●一つもしくは複数のウェブサーバ110。ウェブサーバ110はクライアントデバイス102からリクエストを受信し、応答としてウェブページ、リソースもしくはリンクをリターンする。実装のいくつかにおいて、リクエストの各々のログはデータベース112に保存される。
●データベースアクセスモジュール222。データベースアクセスモジュール222は、データベース112に保存されているデータを読み、書き、問い合わせるプロシージャを含む。
●分類モジュール114。分類モジュール114は、図4、7、8、9及び図13A〜図13Dを用いて以下で説明するように、一つもしくは複数の分類手段224を訓練するために使用される。
●一つもしくは複数のデータベース112。データベース112は、分類モジュール114もしくは分類手段224によって使用されるデータを保存する。実装のいくつかにおいて、データベース112は、SQLなどのリレーショナルデータベースである。実装のいくつかにおいて、データベース112は、訓練ベクトルに関連する他の情報と共に訓練特徴ベクトル226を保存する。実装のいくつかにおいて、データベース112はソーシャルメディアメッセージ228及び施設230を保存する。実装のいくつかにおいて、データベース112は、地理座標などメッセージ及び施設に関連する追加的な情報を保存する。実装のいくつかにおいて、データベース112は一つもしくは複数のソーシャルネットワークグラフ232を保存する。ソーシャルネットワークグラフ232は、ユーザ106、ソーシャルメディアメッセージ228、施設230及び他の関連するエンティティの間の接続を追跡する。図5は、実装のいくつかによるソーシャルネットワークグラフ232のノード及びリンクに関する概念図500を例示する。
図2で識別された構成要素の各々は先に説明した一つもしくは複数のメモリデバイスに保存されていてもよい。実行可能なプログラム、モジュール、もしくはプロシージャは、上記機能を実行する命令セットに対応する。上記識別されたモジュールもしくはプログラム(即ち、命令セット)は、別個のソフトウェアプログラム、プロシージャ、もしくはモジュールとして実装されていなくてもよい。これらのモジュールの様々なサブセットは様々な実装において組み合わされ、もしくは再構成されてもよい。実装のいくつかにおいて、メモリ214は上記識別されたモジュール及びデータ構造のサブセットを保存する。さらに、メモリ214は、上記されていない他のモジュールもしくはデータ構造を保存してもよい。
図2はサーバ200を例示しているが、図2は、ここで説明する実装の構造的な概要ではなく、サーバシステム104で使用されるサーバで提示され得る様々な特徴の機能を例示することを意図している。実用において、当業者には理解できるように、別個に示されているアイテムは組み合わされてもよく、アイテムのいくつかは分離されてもよい。サーバシステム104においてこれらの機能を実装するためにサーバ200を実際はいくつ使用するのか及び複数のサーバ200にどのように機能を割り当てるのか、は実装毎に変動し、使用ピーク期間及び平均使用期間にシステムが対処しなければならないデータトラフィックの量に部分的に依存し得る。
図3は、実装のいくつかによるクライアントデバイス102を例示するブロック図である。クライアントデバイス102は、ラップトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、デスクトップコンピュータ、スマートフォン、PDAを含む。クライアントデバイス102は、一般的に、一つもしくは複数のCPU(処理ユニット)302、一つもしくは複数のネットワークインターフェイス304、メモリ314、ユーザインターフェイス306及び、これらの構成要素を相互に接続する一つもしくは複数の通信バス312(チップセットとも呼ばれる)を含む。ユーザインターフェイス306は、一つもしくは複数の出力デバイス308を含み、出力デバイス308は、一つもしくは複数のスピーカ及び/もしくは一つもしくは複数のビジュアル表示デバイスを含み、メディアコンテンツの提示を行うことができる。ユーザインターフェイス306は、一つもしくは複数の入力デバイス310を含み、入力デバイス310は、キーボード、マウス、音声コマンド入力ユニットもしくはマイクロフォン、タッチスクリーンディスプレイ、タッチセンシティブ入力パッド、カメラ(例えば、符号化された画像を走査する)、ジェスチャキャプチャカメラもしくは他の入力ボタンもしくはコントロールなどのユーザ入力を容易にするユーザインターフェイス構成要素を含む。さらに、クライアントデバイス102のいくつかは、キーボードと置き換えて、又はキーボードの補助として、マイクロフォン及び音声認識もしくはカメラ及びジェスチャ認識を使用する。
メモリ314は、DRAM、SRAM、DDR RAMもしくは他のランダムアクセスソリッドステートメモリデバイスなどの高速ランダムアクセスメモリを含む。実装のいくつかにおいて、メモリは、一つもしくは複数の磁気ディスクストレージデバイス、一つもしくは複数の光ディスクストレージデバイス、一つもしくは複数のフラッシュメモリデバイス、もしくは一つもしくは複数の他の不揮発性ソリッドステートストレージデバイスなどの不揮発性メモリを含む。実装のいくつかにおいて、メモリ314はCPU302から離れた位置に配置された一つもしくは複数のストレージデバイスを含む。メモリ314、もしくは代替的にメモリ314の不揮発性メモリは、非一時的コンピュータ可読ストレージ媒体を含む。実装のいくつかにおいて、メモリ314もしくはメモリ314の非一時的コンピュータ可読ストレージ媒体は、以下のプログラム、モジュール及びデータ構造もしくはこれらのサブセット又はスーパーセットを含む。
●オペレーティングシステム316。オペレーティングシステム316は、様々な基本システムサービスに対処し、ハードウェア依存タスクを実行するプロシージャを含む。
●通信モジュール318。通信モジュール318は、一つもしくは複数の通信ネットワークインターフェイス及び、インターネット、他のワイドエリアネットワーク、ローカルエリアネットワーク、メトロポリタンエリアネットワークなどの一つもしくは複数の(有線もしくは無線の)通信ネットワーク108を介して他のコンピュータ及びデバイスとクライアントデバイス102とを接続するために使用される。●表示モジュール320。表示モジュール320は、一つもしくは複数の入力デバイス310から入力を受け取り、表示デバイス308に表示するユーザインターフェイスエレメントを生成する。
●入力処理モジュール322。入力処理モジュール322は、一つもしくは複数の入力デバイス310の1つから一つもしくは複数のユーザ入力もしくはインタラクションを検出し、検出した入力もしくはインタラクションを解釈する(例えば、クライアントデバイスのカメラによって走査された符号化画像を処理する)。
●ウェブブラウザ324。ウェブブラウザ324は、(インターネットなどの)ネットワーク108を介して、ユーザと、リモートコンピュータもしくはデバイスとの通信を可能にする。
●一つもしくは複数のアプリケーション326−1〜326−u。アプリケーション326−1〜326−uはクライアントデバイス102による実行のために構成されている。様々な実装において、アプリケーション326はカメラモジュール、センサモジュール、一つもしくは複数のゲーム、アプリケーション、マーケットプレイス、支払いプラットフォーム、及び/もしくはソーシャルネットワークプラットフォームを含む。実装のいくつかにおいて、アプリケーション326の一つもしくは複数はウェブブラウザ324で稼動する。
●クライアントデータ328。クライアントデータ328はデバイス102もしくはデバイス102のユーザ106に関連する情報を含む。実装のいくつかにおいて、クライアントデータ328は一つもしくは複数のユーザプロファイル330を含み、ユーザプロファイル330は、ユーザアカウント、ユーザアカウントの各々についてのログイン証明、ユーザアカウントの各々に関連する支払いデータ(例えば、リンクされているクレジットカード情報、アプリケーションクレジット又はギフトカードの残高、請求住所、配送住所)、ユーザアカウントの各々についての顧客パラメータ(例えば、年齢、位置、趣味)及び/もしくは各々のユーザアカウントのソーシャルネットワークコンタクトを含み得る。実装のいくつかにおいて、クライアントデータ328は、クライアントデバイスにおけるユーザのアクティビティのログであるユーザデータ332を含む。
上記識別された実行可能なモジュール、アプリケーションもしくはプロシージャのセットは、先に説明したメモリデバイスの一つもしくは複数に保存されてもよいし、上記機能を実行する命令セットに対応してもよい。上記識別されたモジュールもしくはプログラム(即ち、命令セット)は別個のソフトウェアプログラム、プロシージャ又はモジュールとして実装される必要はなく、これらのモジュールの様々なサブセットは様々な実装において結合されてもよいし、再構成されてもよい。実装のいくつかにおいて、メモリ314は上記モジュール及びデータ構造のサブセットを保存してもよい。さらに、メモリ314は上記していない他のモジュール又はデータ構造を保存してもよい。
図3はクライアントデバイス102を示すが、図3は、実装の構造的概要ではなく、様々な特徴の機能を表すことを意図している。実用的には、また、当業者に理解されるように、別個に示されたアイテムは組み合わされてもよいし、アイテムのいくつかは分離されてもよい。
実装のいくつかにおいて、サーバシステム104の機能のいくつかはクライアントデバイス102によって実行され、これらの機能の対応するサブモジュールはサーバシステム104ではなく、クライアントデバイス102に配置されてもよい。反対に、実装のいくつかにおいて、クライアントデバイス102の機能のいくつかは、サーバシステム104によって実行され、これらの機能の対応するサブモジュールはクライアントデバイス102ではなく、サーバシステム104に配置されてもよい。図2及び図3に示されるサーバ200及びクライアントデバイス102は、実装のいくつかを例示する。他の構成が、ここで説明する機能を実装するために使用されてもよい。
図4は、実装のいくつかによるソーシャルメディアメッセージ228についての施設推定方法400のフローチャートである。実装のいくつかにおいて、方法400は施設推定システム100によって実行される。図4において、施設推定方法400は訓練段階460及び試験/使用段階470を含む。訓練段階460において、サーバシステム104(例えば、サーバシステムの分類モジュール114)は、一つもしくは複数の外部サービス122(例えば、フォースクエア)に保存されている位置検出済み施設404の集合にアクセスし、データベース112の施設集合230に保存する。サーバシステム104は、一つもしくは複数の外部サービス(例えば、ツイッター)に保存されている投稿集合402にアクセスし、ソーシャルメディアメッセージ集合228に保存する。位置検出済み施設404の集合及び投稿集合402は、次に、一つもしくは複数の分類手段224を訓練するために、分類モジュール114によって使用される。一つもしくは複数の訓練された分類手段224は、次に、試験段階470で、新しい投稿412が候補施設416の1つにリンクするか否か推定するために使用され得る。実装のいくつかにおいて、候補施設416の集合及び位置検出済み施設404の集合は同一である。一般的に、これらは双方ともマスター施設リスト230のサブセットである。実装のいくつかにおいて、一つもしくは複数のフィルタが位置検出済み施設に適用可能であり、これにより、候補施設416が新しい投稿に関連する可能性が高くなる。例えば、ボストンで生成されたユーザ投稿ツィートは、おそらく、ロサンゼルスの施設には関連しない。実装のいくつかにおいて、候補施設は所定の領域に基づいて選択される。実装のいくつかにおいて、候補施設は施設のタイプ(例えば、コーヒーショップ)もしくは施設の名称(例えば、マクドナルド)に基づいて選択される。実装のいくつかにおいて、候補施設はユーザの嗜好もしくは施設推定の履歴に基づいて選択される。実装のいくつかにおいて、2以上の基準が適用されて、候補施設が識別される。
上記ソーシャルメディアメッセージについての施設推定方法400は、特定の施設のメッセージの位置を識別することが可能であり、同時に、非常に細かい粒度で地理的位置及びメッセージに関連付けられている施設の名称を識別する。位置情報タグを付与されていないソーシャルメディアメッセージの位置及び施設を推定することは、ユーザの地理的コンテキストをより適切に理解することを容易にすることが可能であり、これによって、アプリケーションは、より正確に情報を提示し、サービスを推奨し、広告の対象を決定することが可能となる。さらに、施設推定システム100及び方法400は、ソーシャルメディアプラットフォームからのソーシャルメッセージ投稿及び施設の大規模データセットを用いて評価されてもよい。
図4に例示されるように、分類モジュール114は投稿402及び位置検出済み施設404を使用して、訓練段階460で、一つもしくは複数の分類手段224を訓練する。(メッセージ、施設)ペアの各々について、分類モジュール114は、メタパス及び地理座標情報に基づいて特徴を計算する。メタパスについては、図5及び図6Aを用いて以下で説明する。地理座標情報は、図6B及び図6Cを用いて以下で説明する。図7及び図8に例示されるように、特徴ベクトル226を形成するために特徴はグループ化される。特徴ベクトルの各々は関連付けられたラベルを有し、当該ラベルは、メッセージ228の各々が施設230の各々に関連付けられているか否か示す。
実装のいくつかにおいて、メタパスは、パスタイプの各々に対応する異なる特徴を有する複数のタイプに分類される。これについては、図6Aで例示される。分類モジュール114は、ソーシャルメディアメッセージが施設にリンクされるか否か分類するために分類手段224を訓練するために、特徴ベクトル及び関連付けられたラベルを使用する(408)。訓練プロセスは、分類手段224(訓練したモデル410)を(例えば、繰り返し)構築する。
訓練プロセスは様々な機械学習技術を使用することができる。実装のいくつかは、線形カーネル及びデフォルトパラメータを有するSCIKIT−LEARN7で実装されるSVMを使用する。実装のいくつかにおいて、施設毎(例えば、位置検出済み施設404毎)に別個の分類手段224が生成される。実装のいくつかにおいて、単一の分類手段が生成され、分類手段は、提供された入力に基づいて最も高い可能性を有する施設を識別するために使用される。実装のいくつかにおいて、単一の分類手段が生成され、分類手段は、単一の入力ベクトルに基づいて複数の施設についての確率を計算するために使用される。
第2段階(試験/使用)段階470において、新しいソーシャルメディアメッセージ412がサーバシステム104によって外部サービス122から受け取られる。いくつかの例において、投稿412には位置情報タグが付与されていない(即ち、地理座標が割り当てられていない)。訓練したモデル410(即ち、分類手段224)は、投稿412が候補施設416の各々にリンクされるか否か分類する(418)。分類(418)を実行するために、分類モジュール114は訓練段階について上記したように特徴ベクトルを構築する。詳細には、分類モジュール114は、訓練段階で使用される特徴に対応するメタパス特徴及び地理特徴を計算する(414)。
実装のいくつかにおいて、訓練された分類手段224は、候補施設416の各々について、新しいソーシャルメディアメッセージが候補施設にリンクされる可能性を示すスコア(例えば、確率)を計算する。スコアに基づいて、分類モジュールは、少なくとも1つの候補施設を、新しいソーシャルメディアメッセージのために推定された施設として識別し(420)、推定された施設と新しいソーシャルメディアメッセージとを関連付ける。実装のいくつかにおいて、分類モジュール114は、高い順位にランク付けされる複数の施設が存在する場合、高い可能性を有する候補施設の2つ以上を選択する(420)。選択された候補施設は推定された施設422として提供される。
実装のいくつかにおいて、特徴ベクトルのメタパスの計算には、異種ソーシャルネットワークグラフ232を使用する。グラフ232は、埋め込まれたソーシャル関係を示し、ソーシャルメディアメッセージが地理的施設と関連付けられている場合を識別するために、利用可能ではあるが限定された地理データを活用することができる。
図5に、各タイプのエンティティが、ソーシャルネットワークグラフの概念図500のあるタイプのノードとして示されている。例えば、ツイッターユーザ(Twitter User)502の各々、フォースクエアユーザ(Foursquare User)504の各々、施設(Venue)506の各々、ツィート(Tweet)508の各々及びフォースクエアチップ(Tip)510の各々について別個のノードが存在する。図5では、実際のソーシャルネットワークグラフ232において多くの個別のノードを概念的に表す要約したノードを描画している。この例において、251,660人の個別のツイッターユーザが存在する。従って、グラフ232がこの要約した形態で示されない場合、251,660のツイッターユーザのための個別のノードが存在するかもしれない。同様に、105,340人のフォースクエアユーザ、337,991の施設、10,080,973のツィート、及び400,941のフォースクエアチップが存在する。さらに、実装のいくつかは、関連する施設をグループ化するカテゴリ(Category)ノード512を有する。施設の各々は一つもしくは複数のカテゴリに割り当てられてもよい。実装のいくつかは、ツィートもしくはフォースクエアチップに現れる個別のワードであるワード(Word)ノード514も提供する。一般的に、ワードは、意味のあるコンテンツワードに限定され、冠詞、接続詞、及び前置詞などは除外される。例えば、実装のいくつかは、NLTK(http://www.ntlk.org)を用いてストップワードを取り除く。実装のいくつかは、訓練集合のソーシャルメディアメッセージの閾値(例えば、10)を越えない数のワードを取り除く。用語「ワード」は広く使用され、公開されている言語辞書に当該ワードが現れることを要求されない。例えば、ソーシャルメディアメッセージは、一般的に多くの略語、頭字語、もしくはワードとして機能する文字の他のシーケンスを含む。例えば、「lol」及び「lgtm」はワードと看做され得る(これらの2つのワードはここで必ずしも有用ではない)。
エンティティの間の関係は異なるタイプのリンクとして表される。例えば、ツイッターのともだち(friend)リンク520はともだちである2つのツイッターユーザをリンクし、フォースクエアのともだち(friend)リンク522はともだちである2つのフォースクエアユーザをリンクする。「アンカー(anchor)」リンク524は、ツイッターユーザ502が対応するフォースクエアユーザ504と同一の人物であることを示す。ツイッターを書くリンク(write)526はツイッターユーザ502とツイッターユーザが書くツィート508とを接続する。チェックイン(checkin)リンク528は特定の施設506でツイッターユーザ502がチェックインしたことを示す。メイヤー(mayor)リンク530は、特定のフォースクエアユーザ504が特定の施設506のメイヤーとして指定されたことを示す。フォースクエアを書く(write)リンク532は、フォースクエアユーザ504とフォースクエアユーザ504によって書かれたチップ510とをリンクする。フォースクエアチップ510の各々は特定の施設506に関連し、したがって、関係を示すために位置検出(locate)リンク534が存在する。
ソーシャルネットワークグラフの概念図500は施設カテゴリ512を含み、施設506がカテゴリ512に属することを示すために「属する(belong)」リンク536が存在する。単一の施設は2つ以上のカテゴリに属していてもよい。一方、いくつかの施設506は識別されたカテゴリ512の何れにも属さなくてもよい。
ソーシャルネットワークグラフの概念図500がワードノード514を含む場合、概念図500は、ツィート508が特定のワードを含む場合を示すツィートを含む(contain)リンク538を含む。同様に、フォースクエアチップ510が特定のワードを含む場合を示すチップを含む(contain)リンク540が存在する。
破線550によって示されるように、ツィート526のいくつかは施設506と関連付けられている。開示された実装は、ソーシャルネットワークグラフ232の他の情報に基づいていくつかの場合、ツィート−施設リンク550を推定することが可能である。
開示された実装は、位置情報タグが付与されていないツィート(もしくは他のソーシャルメディアメッセージ)が投稿された地理施設を推定する。以下の表1は位置情報タグが付与されたツィートの4つの例を示す。データセットの分析によれば、フォースクエアから発信されるツィートのほとんどが施設を推定することが容易な「I'm at somewhere(私は〜にいる)」との形態である。実装のいくつかにおいて、ツイッターチェックイン(checkin)リンク528は、これらのタイプのツィートに基づいて、明示的に1つのタイプのリンクとして追加される。

表1:位置情報タグを付与されたツィートの例

注:ツィートの各々のソースを[]内に示す。
実装のいくつかにおいて、ソーシャルネットワークグラフ232を構築するために使用されるデータセットはフォースクエア以外のソースからの位置情報タグを付与されたツィートを含む。フォースクエアと同様に、いくつかの他のモバイルアプリケーション(例えば、インスタグラム、パス)によって、ユーザは地理情報で投稿にタグを付与することができる。表1に示すように、シンボル「@」の後には位置情報タグを付与されたツィートの施設名が続く(例えば、t4の@walgreen)。しかしながら、シンボル「@」は他のユーザを識別するために使用されてもよい(例えば、t3の@username)。
図5に例示されるデータセットは、より大きなデータセットに含まれるツィートのサブセットを含む。ツィートの選択されたサブセットは、テキストが施設名もしくは(略語を考慮するために)少なくとも施設名のコンテンツワードの少なくとも半分を含むサブセットである。さらに、ユーザが「@」と共に記述した実際の施設を明瞭化するために、選択されたツィートの地理位置は適合する施設の近隣にあることが要求された。この例では、近隣は半径0.0008度もしくは約290フィートと定義された。これによれば、126,917のツィートの実際の施設が取得される。「@」の後に続くワードは、機械学習及びクロス検証を用いた試験のためにツィートから取り除かれた。ツィートの座標は、評価での使用を除いて、保留される。全体的に、ツィートの各々は、モデルが訓練されている場合、位置情報タグが付与されていないものとして取り扱われる。
図5の概念図500によって例示されるソーシャルネットワークグラフ232を用いて、異なるタイプのメタパスを抽出することができる。ツィートであるソーシャルメディアメッセージに施設推定を適用することは以下のように数式化できる。
位置情報タグを付与されていないツィートをtiとし、施設vpで投稿されたツィートの確率Pr(link(t|v))を推定する。ここで、最大確率を有する施設vest(t)がツィートの実際の施設vact(t)である。
ここで使用されるように、ソーシャルネットワークグラフの概念図500のメタパスはノード間の個別のリンクのシーケンスを含む。例えば、図5において、以下のメタパスはツィートから施設への複合関係を示す。

このメタパスのセマンティックな意味は、ツィート(tweet)と施設(venue)とがフォースクエアチップ(tip)を介して共通のワード(word)を共有する、ということである。リンクタイプ「contain-1」は「contain(含む)」と逆の関係を表す。メタパスを介して接続されているツィート及び施設は、メタパスなしの場合よりもリンクされている可能性が高い。
異なるメタパスは、通常、リンクされたノード間で、異なるセマンティックな意味を有する異なる関係を表す。例えば、以下のメタパスは、フォースクエア(Foursquare user)で当該施設(venue)のメイヤー(mayor)であるツイッターユーザ(Twitter user)によってツィート(tweet)が投稿されたことを示す。

以下のメタパスは、ともだち(friend)が当該施設(venue)にチェックイン(checkin)したツイッターユーザ(Twitter user)によってツィート(tweet)が投稿されたことを示す。

このように、ツィート及び施設の間の関係は、異なるセマンティックを有する異なるメタパスによって説明され得る。
図6Aは、ソーシャルネットワークグラフ232から構築され得るメタパスの4つのタイプを例示する。エゴパス(EgoPath)602は、ユーザのツィートを施設に直接的に関連付ける。ツィート−施設ペア(t,v)について、ツィートtを投稿したユーザはuで示される。リンク(t,v)の確率を推定するために、ユーザuが施設と何れかのタイプの直接的なインタラクションをもつか知ることは有用である。直接的なインタラクションの例は、施設へチェックインすること、施設に関するチップを書くこと、もしくは施設のメイヤーであること、を含む。これらは、以下、直接施設インタラクションとも呼ばれる。
以下のメタパスは、フォースクエア(Foursquare user)において当該施設(venue)vのメイヤー(mayor)であるユーザTwitter user)uによってツィート(tweet)tが投稿された場合を識別する。

からvへのメタパスが存在する場合、このような接続を有さない施設ではなく施設vにツィートtが関連付けられている可能性が高い。同様に、図6Aのエゴパスセクション602のサンプルパスによって例示されるように、他のメタパスは、ユーザuを介したツィートtと施設vとの間の相互関係を捕捉するために抽出される。
ともだちパス(FriendPath)604は、ともだちを介してユーザのツィートを施設と関連付ける。エゴパスは、ツイッターとフォースクエアとの間をつなぎ、ユーザuの明示的なソーシャルアクティビティを活用することでツィートtと施設vとの間の相互関係を表すために非常に重要であることが期待され得るが、この方法では、少数のツィートだけが推定され得ることが知られている。特に、リンク付けされたフォースクエアのアカウントをもたないユーザについては、提示されるエゴパスは非常に少ない。また、ある研究によれば、ソーシャル関係は、人の移動の約10%〜30%を説明できることが知られている。したがって、ユーザuのソーシャルアクティビティを見ることに加えて、ユーザのともだちのアクティビティを活用することもできる。ともだちuが施設vと直接施設インタラクションをもつ場合、ユーザuは、当該接続を有さない施設ではなく、施設vでツィートtを投稿した可能性が高い。例えば、以下のメタパスは、ユーザ(Twitter user)uのともだち(friend)が施設(venue)vにチェックイン(checkin)した場合を識別する。

ともだちの情報を活用するメタパスは、図6Aのサンプルパスによって例示されるように、ともだちパス604として示される。
関心パス(InterestPath)606は、ツィートと施設との間の関係を施設カテゴリ(例えば、フォースクエアカテゴリ)を介して拡張する。ユーザの関心を考慮すると、ユーザの関心を惹く類似の施設で、ユーザはツィートする傾向を有する。例えば、vがカリフォルニア州ロスアルトスのシェフチュウであり、vがカリフォルニア州マウンテンビューのクッキングパパであり、これらの施設が両方ともカテゴリ「チャイニーズレストラン」に属すると仮定する。ユーザuがvにチェックインすることで中華料理に関心があることが示され、ユーザuからのツィートtは、当該接続を有さない施設ではなく、施設vでユーザuによって投稿された可能性が高い。図5に例示されるフォースクエアから収集されたサンプルデータにおいて、施設の各々は、図5の属するリンク536によって例示されるように、429のカテゴリの一以上と関連付けられている。以下のメタパスは、同一のカテゴリ(category)を共有する施設(venue)にチェックインしたユーザ(Twitter user)によって、ツィート(tweet)tが投稿されたか否かを効率的に検出することができる。

カテゴリを使用するサンプルメタパスのいくつかが、図6Aの関心パス(INTERESTPATH)606セクションに示されている。
テキストパス(TEXTPATH)608は、施設に関してツィートされたワードをモデル化する。コンテンツ分析についてテキスト処理に焦点を当てる従来のアプローチと異なり、ワードは、図5に構築されたソーシャルネットワークグラフの概念図500のあるタイプのノードとして表される。ワードを介したメタパスは、ツィートと施設との間のテキスト類似性を表すために画定される。
例えば、以下のメタパスは、テキストパス608として画定され、ツィート(tweet)t及び施設(venue)vがフォースクエアチップ(tip)を介して共通のワード(word)を共有する場合を符号化する。

ツィートtは、当該接続を有さない施設ではなく、類似テキストコンテンツを共有する施設vと関連付けられる可能性が高い。図6Aのテキストパス608セクションは、このタイプの単一のサンプルメタパスを識別するが、実装のいくつかは他の多くのテキストパスも同様に使用する。図11Aに例示されるように、あるソーシャルネットワークグラフの概念図500は施設リンク(venue-link)1102を含む。この場合、リンクされている他のツィートに基づいて、ツィートは施設(非施設ノードなど)に接続され得る。例えば、以下のメタパスにおいて、第1のツィート(tweet1)は施設(venue)にリンクされている第2のツィート(tweet2)に含まれているワード(word)を共有する。
実装のいくつかは、4タイプのメタパス、エゴパス(EGOPATH)602、ともだちパス(FRIENDPATH)604、関心パス606及びテキストパス608を、特徴ベクトルの特徴を生成するために使用する。しかしながら、異なるメタパスもしくは追加的なメタパスが使用されてもよい。例えば、ソーシャルメディアメッセージがツィートではない場合、異なるタイプのノードを生成し、従って、異なるタイプのメタパスを生成する異なる情報が利用可能であり得る。
画定されたタイプのメタパスに基づいて、分類モジュールは、各々のタイプのメタパスについてパスカウントを計算し、特徴ベクトルの特徴として当該カウントを使用する。これらの特徴は訓練特徴ベクトル226及び新しく受信したメッセージの双方について使用される。実装のいくつかにおいて、パスカウントは、一般的なタイプのメタパスの各々について合計される(例えば、エゴパスカウントの全てが合計される)。他の実装において、特定のタイプのパスの各々について別個の特徴が存在する(例えば、エゴパスについて3個の別個の特徴が存在し、各々は図6Aに示されるエゴパスの1つに対応する。)。
実装のいくつかにおいて、分類モジュール114は、図6B及び図6Cに例示されるように地理特徴を計算する。地理特徴は、ユーザもしくはユーザのともだちの位置情報タグを付与されたツィートに含まれる利用可能な地理情報を表す。地理特徴は、特徴ベクトルの追加的な特徴として利用されてもよい。地理特徴は、施設推定が所望される新しいソーシャルメディアメッセージの地理座標ではなく、訓練プロセスで使用されたソーシャルメディアメッセージの地理座標(位置情報タグ)に基づく。(メッセージの地理座標が提供されると、施設を推定するタスクは一般的にたいへんシンプルになる。)
実装のいくつかにおいて、特徴ベクトルで使用される地理特徴の2つのタイプが存在する。第1の地理特徴は、図6Bに例示されているエゴジオ(EGOGEO)スコアである。実装のいくつかにおいて、エゴジオスコアは、分類モジュール114がユーザuによって投稿された他のツィートの地理情報を有する場合、ツィートtの施設推定を容易にするために使用される。Tはユーザuによって投稿された位置情報タグを付与されたツィートのセットを示す。実装のいくつかは、図6Bに示されるように、ツィートt及び候補施設vの間の地理相互関係エゴジオを以下のように定義する。

最も内側の引き算t−vについて、2つの要素t及びvが地理座標の2次元ベクトルであると看做される。例えば、座標は、一般的に、ツィートt及び施設vの位置情報タグに対応する緯度及び経度である。以下のL1ノルムは「マンハッタン距離」とも呼ばれ、2つの座標の差の絶対値を加算する。

実装のいくつかは、代替的な距離計算、例えば、以下のユークリッド距離など、を使用する。

以下は、式において計算された距離の最小値が採用されることを示す。

ツィートt自身に位置情報タグが付されている場合であっても、計算から除外される。
「t∈T−t」は、t∈T−{t}を表す。
最小距離はゼロ(又はゼロに近い)であるため、アンダーフローを避けるため、小項εを付加する。実装のいくつかでは、ε=10−9である。ツィートと施設との間の距離が小さいことは相互関係を有する確率が高いことを示すため、式は結果の負の対数を計算する。実装のいくつかにおいて、対数は10を底とする常用対数であるが、e又は2などの他の底を有する任意の対数を使用してもよい。実装のいくつかにおいて、(0,0)などのデフォルトの地理位置に「非施設」が割り当てられる。実装のいくつかにおいて、非施設は地理位置座標を有するとは看做されない。実装のいくつかにおいて、非施設は他の基準(例えば、ユーザが一般的に位置する領域の外側)に基づいてデフォルトの位置に割り当てられる。
エゴジオの式は、投稿したユーザの位置情報タグを付されたツィートtと候補施設vとの間の最短距離を表す。直感的に、ユーザuが施設vの近傍で一つもしくは複数の位置情報タグを投稿した場合、ツィートtは施設vに関連付けられている可能性が高い。EGOGEO(t,v)の値が高いことは、link(t,v)の確率が高いことを表す。
ともだちジオスコアはエゴジオと類似しているが、ユーザのともだちによるソーシャルメディアメッセージに付与された位置情報タグに基づいている。例えば、ユーザが新しい近傍の場所を訪問し、ソーシャルメディアメッセージを生成した場合、位置情報タグを付与されたソーシャルメディアメッセージとユーザとは無関係であるかもしれない。しかしながら、人々はともだちと共通の場所に出掛けるため、ともだちの位置情報タグを付与されたソーシャルメッセージはユーザがいる場所を示す可能性がある。いくつかの実装において、図6Cに示されるように、ツィートt及び候補vの間のともだちジオ地理相互関係は以下のように定義される。

以下は、上記したエゴジオの式(図6B)と同様の意味を有する。

ここで、Nはユーザuのともだちであるユーザのセットであり、セットNのユーザuの各々について、セットTはユーザuによるツィートを含む。即ち、ユーザuのともだちによる全ての位置情報タグを付されたツィートにわたって最小値が計算される。
ともだちジオの式は、ユーザのともだちの位置情報タグを付されたツィートと候補施設vとの間の最短距離を示す。ユーザのともだちが施設vの近傍で位置情報を付されたツィートの何れかを投稿した場合、ツィートtはそのような関係を有さない施設ではなく、施設vに関連付けられている可能性が高い。従って、link(t,v)の確率は、FRIENDGEO(t,v)と正の相互関係を有する可能性が高い。
図7は、いくつかの(ソーシャルメッセージ,施設)ペアについての特徴ベクトルを例示する。(メッセージ,施設)ペアの各々について、対応する特徴ベクトル(例えば、特徴ベクトル(Feature Vector)226−1、226−2、226−3、226−4、226−5及び226−6)は、エゴパス(Ego Path Count)702、ともだちパス(Friend Path Count)704、関心パス(Interest Path Count)706、テキストパス(Text Path Count)708などのパスカウントを含む。実装のいくつかにおいて、特徴ベクトル226の各々は、図6B及び図6Cを用いて上記したように、地理特徴を含む。実装のいくつかは、特徴ベクトルの各々について、エゴジオ(Ego Geo)特徴スコア710及びともだちジオ(Friend Geo)スコア712を含む。特徴ベクトル226の各々は、ソーシャルメディアメッセージ及び施設が関連付けられていることが既知であるか否かを示す関連ラベル(Label)720を含む。実装のいくつかにおいて、ラベル値1は、メッセージの各々及び施設が関連付けられていることを示し、ラベル値0は、メッセージの各々が施設の各々と関連付けられていないことを示す。他の実装は、1及び−1、もしくは他のユニークな値のペアなどのラベルについての代替的なコードを使用する。
図7のサンプルデータにおいて、ラベル712は第1特徴ベクトル226−1について「1」である。第1特徴ベクトル226−1は、ツィート識別子(Message Identifier)722が「918372」であるツィートが施設識別子(Venue Identifier)724が「1038」である施設と関連付けられていることを示す。対応する特徴ベクトル226−1は、エゴパス5、ともだちパス0、関心パス12及びテキストパス3を含む。さらに、特徴ベクトル226−1は、図6Bに関して上記されるように計算されるエゴジオスコア8.72326584を有する。特徴ベクトル226−1は、図6Cに関して上記されるように計算されるともだちジオスコア8.72692089を有する。
実装のいくつかにおいて、三重クロス検証の設定で実験を行うことができる。訓練データのフォールドの各々で、ツィート及び施設の間の既知のリンクの半分を正のリンクとしてサンプリングする。他の半分のリンクについて、負のlink(t,v)を形成するために、施設vをV−{v}からランダムに選択することができる。これにより、正のリンクの数と負のリンクの数とが等しい、図7に示すような釣り合いのとれたデータセットを訓練プロセスのために導出することができる。テストセットの既知のリンクを評価のために使用することができる。
図8は新しいソーシャルメッセージについての施設推定を例示する。新しいメッセージについて、N個の候補施設(Candidate)416−1、…、416−Nが存在する。これらの候補施設の各々について、分類モジュール114はエゴパス(EgoPath)810の各々を計算する。例えば、ソーシャルネットワークグラフ232がツイッター及びフォースクエアに基づいている場合、分類モジュールは図6Aで識別されたエゴパス602を使用する。分類モジュール114は、候補施設416の各々について、ともだちパス(Friend Path)812の各々、関心パス(Interest Path)814の各々、及びテキストパス(Text Path)816の各々を計算する。ツイッター/フォースクエアについて、分類モジュールは、図6Aで例示したともだちパス604、関心パス606及びテキストパス608を使用する。これらの特徴は訓練特徴ベクトル226の対応する特徴として同様の方法で計算される。実装のいくつかにおいて、分類モジュール114は、候補施設416の各々について、エゴジオスコア(Ego Geo)818及びともだちジオ(Friend Geo)スコア820を、計算する。実装のいくつかにおいて、これらは、図6B及び図6Cを用いて上記したように計算される。
候補施設416の各々の特徴は、第1候補施設416−1に対応する特徴ベクトル850−1及びN番目の候補施設416−Nに対応する第N特徴ベクトル850−Nなどの特徴ベクトル850の各々に置かれる。これらのテスト特徴ベクトル850は、図4のボックス418に例示されるように、訓練された分類手段224の入力(830)として使用される。分類手段224は、新しいメッセージが候補施設の各々にリンクされている確率を推定する(832)。実装のいくつかにおいて、候補施設は、新しいソーシャルメディアメッセージにリンク付けされている確率によって順位付けされている。
図8の例において、95%、78%、46%、5%の確率を有する候補施設1、N、2、及びN−1が、最高から最低までランク付けされる。新しいメッセージは、1個のエゴパス及び4個の関心パスによって第1候補施設416−1にリンクされる。第1施設416−1は、図8に示される他の候補施設と比較して、最高のエゴジオスコア818を有する。一方、N−1番目の候補施設はエゴパス、ともだちパス、関心パス、テキストパスを有していない。N−1番目の候補施設は、最低のエゴジオスコア818を有する。したがって、新しいメッセージは、第1候補施設416−1と関連付けられている可能性が高く、N−1番目の候補施設と関連付けられている可能性は低い。実装のいくつかにおいて、候補施設の各々についての確率は、総計が100%になるように正規化される。
上記(例えば、図4及び図8)プロセスは、候補施設の各々について確率を計算するが、新しいソーシャルメディアメッセージが施設の何れかと関連付けられているか否かという問いに対しては回答を与えない。図9A及び図9Bはこの問いに回答する2つのプロセスを例示する。
図9Aにおいて、ソーシャルメディアメッセージのセットで訓練フェーズを開始する(902)。これらの訓練メッセージの各々について、メッセージが施設に関連付けられているか否かは既知である。上記したように、ソーシャルネットワークグラフ232は、非施設ノードを含む施設の各々についてのメタパス及び地理座標に基づいて特徴を計算する(904)。非施設ノードへのリンク及びパスを図11A及び図11Bに示す。実装のいくつかにおいて、エゴパス及びともだちパスなどの地理特徴は、デフォルト地理座標を割り当てることによって、非施設ノードについて計算される。例えば、実装のいくつかは座標として(0,0)を使用する。実装のいくつかは、ユーザ及びユーザのともだちが位置する領域から離れた非施設ノードと関連付けられているデフォルト位置を割り当てる。他の実装は、北極、南極もしくは大西洋の真ん中などほとんどのユーザから離れているであろうデフォルト位置を選択する。
メタパス及び地理特徴から構築される訓練ベクトル226を用いて、分類モジュール114は、一つもしくは複数のメッセージ−施設リンク分類手段224を訓練する(906)。実装のいくつかにおいて、分類モジュール114は、非施設ノードを含む、施設の各々について、別個の分類手段224を生成する。分類手段224を用いて、分類モジュール114は、リンク確率の中央値Mを計算する(910)。一般的に、リンク確率のほとんどは小さく、所定の訓練されたモデルの値と同様である。したがって、中央値を計算することは一般的な確率の概念を取得するための方法の1つである。実装のいくつかは、最頻値など、一般的なリンク確率を推定するための代替的な技術を使用し、もしくは、異常値を除いて平均値を計算する(例えば、25番目の百分位数及び75番目の百分位数の間の確率の平均値を計算する。)。
実装のいくつかにおいて、中央値M912を施設サンプルにわたって計算する。
分類手段224を訓練し、中央値M912を計算した後、プロセスは、テストソーシャルメディアメッセージ914に適用され得る。分類モジュール114は、同一のメタパス特徴及び地理特徴を計算することによって、ソーシャルネットワークグラフ232の非施設ノードについての特徴ベクトルを形成する(916)。訓練された分類手段224は、テストメッセージが非施設ノードに関連付けられている確率Pを計算するための入力として特徴ベクトルを使用する(918)。次に、プロセスは、スコアを計算するために中央値を用いて確率Pを正規化する(920)。図10Aに例示するように、実装のいくつかは、中央値Mを引き、その結果を中央値Mで割ることによって確率を正規化し、スコアを取得する(920)。図10Aにおいて、式Pr(link(t,v)|fio)は、ペア(tv0)の特徴fioのセットに基づく、ツィートt(テストソーシャルメディアメッセージ914)及び非施設ノードvの間のリンクの確率を示す。図10Bに示されるように、実装のいくつかは中央値M912を引き、テストソーシャルメディアメッセージのリンク確率の全ての総計によって割ることによって、確率を正規化する。いくつかの場合、手法(Method)Bの分母は、実質的にソーシャルメディアメッセージに関係なく実質的に同一である。したがって、分母は一回計算すれば、再利用可能である。
正規化した確率P’を、次に、閾値θと比較する(922)。実装のいくつかにおいて、閾値θは図10Aの手法(Method)Aの式について−0.0005に設定される。実装のいくつかにおいて、図10Bの手法Bの式を使用する場合、閾値θは、−0.000001に設定される。正規化した確率が閾値より大きい場合、テストソーシャルメディアメッセージをリンクしていないソーシャルメディアメッセージとして指定する(924)。すなわち、ソーシャルメッセージが非施設ノードと関連付けられている場合、メッセージは、「現実」施設の何れとも関連付けられていない。一方、正規化した確率が閾値より小さい場合、テストソーシャルメディアメッセージをリンクしているメッセージとして指定する(926)。この場合、実装のいくつかは、最大確率値を識別するために引き続き順位付け操作を実行する(例えば、図4のテスト/使用フェーズ470で順位付け操作を実行する)。図4を用いて説明した特定の技術に代えて、もしくは特定の技術に加えて、他の施設順位付け技法を適用してもよい。
図9Bは、非施設ノードだけを用いて分類手段224を構築する代替的なプロセスを例示する。このプロセスでは、正規化を必要としない。分類手段224は、テストソーシャルメディアメッセージ914が非施設ノードと関連付けられている確率を推定する。図9Bの操作のほとんどは、図9Aの操作と同一である。したがって、説明も同様である。図9Bの特徴の計算(904’)は、非施設ノードだけを使用するため、図9Aの計算(904)とは異なる。
図11Aは、図5のソーシャルネットワークグラフの概念図がノード間の他のタイプのリンクにどのように拡張され得るかを例示する。実装のいくつかにおいて、施設の明示的な記述がツィートに存在する場合、施設リンク(venue-link)1102は、ツィート(Tweet)及び施設(Venue)の間に追加される。例えば、実装のいくつかは、非特許文献1で説明されている技術を用いる。実装のいくつかにおいて、ツィートが、実際の施設の何れかへの施設リンク1102を有さない場合、ツィート及び非施設ノードの間の施設リンク1102を生成する。実装のいくつかにおいて、ツィートが現実施設の何れにも関連付けられていないという合理的な確かさが存在する場合にのみ、ツィートと非施設ノードとの間に施設リンク1102を生成する。
実装のいくつかにおいて、ツイッターユーザ(Twitter User)502が非施設ノードにリンクするツィート(Tweet)508の何れかを書いた(write)(526)場合、ツイッターユーザ502及び非施設ノードの間に非チェックイン(non-checkin)リンク1104を生成する。実装のいくつかにおいて、閾値(例えば、10、20もしくは100)を越える非施設ノードにリンクされたツィート508を有するツイッターユーザ502についてだけ非チェックインリンク1104を生成する。実装のいくつかにおいて、ツィートの閾値は、一日、一週、一月内の非施設ノードにリンクされたツィートの最小数など、特定の時間長による。
図11Bは、ツィートを非施設ノードに接続するソーシャルネットワークグラフの概念図500によるメタパスのいくつかを例示する。例えば、図11Aを用いて上記したように、非チェックインリンク1104を用いてツィートを非施設ノードに接続する追加的なエゴパス(Ego Path)602が存在する。ユーザ(Twitter User)が施設にリンクしないツィート(tweet)を書く場合、ユーザは、施設にリンクしない他のツィートを書く可能性が高い。
図11Bは、施設にリンクしないツィートを生成するユーザのともだちに基づいて非施設ノードにツィートを接続する追加的なともだちパス(Friend Path)604を例示する。この相互関係は希薄であるが、接続の強さは分類手段の訓練プロセスに組み込まれる。非施設ノードへのともだちパス604はフォースクエアともだち関係522に基づいていてもよい。
図11Bは、フォースクエアチップ(tip)のワード(word)と相互関係を有するツィート(tweet)の1つもしくは複数のワードに基づいて、非施設(no-venue)ノードにツィートを接続する追加的なテキストパス(TextPath)608を例示する。
図12は、いくつかの代替的な施設リンク分類手段の性能を評価するデータを含む表である。この表のデータは、597万を越えるツィート及び1万9000を越える可能な施設から導出されるツィート−施設リンクのランダムサンプルへのクロス検証を実行することにより取得された。左の2つの列1202及び1204は、地理特徴が使用された場合と、無視された場合との三重クロス検証を用いて性能を比較する。この結果によれば、ツィート−施設リンク検出において地理ベース特徴を含むことは常に有用ではない。
右の2つの列1206及び1208は、10重クロス検証を用いた、より大きいサンプルでの結果を示す。これらの列は、開示した方法の一般的な性能をよりよく示している。三番目の列1206は、手法A(図10A)を用いた場合の結果を示し、四番目の列1208は、図9Bに例示したように、ツィートと非施設ノードとの間の関係だけで訓練した分類手段を用いた場合の結果を示す。
第1実験1202において、100ツィートのサンプルを使用し、特徴ベクトルには、エゴジオ及びともだちジオに対応する地理特徴及び4個のタイプのメタパスを用いた。第2実験1204において、100ツィートの他のサンプルを使用し、特徴ベクトルに地理特徴を用いなかった。これらの実験は非常に高い正確さを有していた。第3実験1206は、訓練のためにより大きなサンプルを使用し、地理特徴を用いなかった。第4実験において、非施設ノードだけを用いた。
図13A〜図13Dは、コンピュータシステムによって実行されるプロセス1300のフローチャートを示す。プロセス1300は、ソーシャルメディアメッセージと施設との間のリンクを推定する(1302)。一つもしくは複数のプロセッサ及びメモリを有するコンピュータシステムで当該方法は実行される(1304)。メモリは、一つもしくは複数のプロセッサによって実行されるように構成されている一つもしくは複数のプログラムを保存する(1304)。
プロセスは、ソーシャルメディアユーザを表すノード、ソーシャルメディアユーザによって生成されたソーシャルメディアメッセージを表すノード、及び、施設を表すノードを含むソーシャルネットワークグラフ232にアクセスする(1306)。これは、図5を用いて上記されている。ソーシャルネットワークグラフに表されている施設は、複数の主要施設及び非施設ノードを含む(1308)。主要施設は、特定のレストラン、店舗、コーヒーショップ、博物館などの実際の物理的な位置に対応する現実施設である。「非施設」ノードは物理的な施設を表さない特殊な施設ノードである。ソーシャルメディアメッセージノード及び非施設に対応するノードの間のソーシャルネットワークグラフのリンクは、ソーシャルメディアメッセージが主要施設の何れにも対応しないことを示す(1310)。実装のいくつかにおいて、主要施設は、所定の地域、施設のタイプ、施設の名称、ユーザの嗜好、施設推定の履歴、ソーシャルメディアメッセージと関連付けられている地理座標からの距離、これらの組み合わせに基づいて選択される(1312)。例えば、施設のマスターリストが合衆国の既知の施設を全て含む場合、施設の大多数は、単一の都市領域に居住するもしくは通勤する人には関連しない。
図9A及び図9Bに例示されるように、一つもしくは複数の分類手段は、訓練特徴ベクトル226のセットに基づいて構築される(1314)。訓練特徴ベクトルの各々は、ソーシャルメディアメッセージの各々及び施設の各々の間の連結性を計測するために、ソーシャルネットワークグラフによるパスを使用する複数の特徴の各々を含む。一般的なパスを図6Aに例示する。図7Aに例示するように、訓練特徴ベクトルの各々は、一般的に、ソーシャルメディアメッセージの各々が施設の各々に関連付けられているか否かを示すラベル720を含む(1316)。実装のいくつかにおいて、訓練特徴ベクトルの一つもしくは複数の特徴は、ソーシャルネットワークグラフによるパスのタイプの各々に基づく測定値を含む(1318)。
実装のいくつかにおいて、図6Aのエゴパス602によって例示されるように、第1特徴は、ソーシャルネットワークグラフ232によるユーザのソーシャルメディアメッセージから施設への直接的なパスに対応する(1320)。実装のいくつかにおいて、図6Aのともだちパス604に例示するように、第2特徴は、ソーシャルネットワークグラフ232によるユーザのソーシャルメディアメッセージから施設へのともだちとの接続を介したパスに対応する(1322)。実装のいくつかにおいて、図6Aの関心パス606に例示するように、ソーシャルネットワークグラフ232は、施設カテゴリ512に対応するノードを含み(1324)、第3特徴は共通の施設カテゴリを共有する施設のペアを接続するソーシャルネットワークグラフ232によるパスに対応する(1324)。実装のいくつかにおいて、図6Aのテキストパス608に例示するように、ソーシャルネットワークグラフ232は、ソーシャルメディアメッセージのコンテンツワードに対応するノードを含み(1326)、第4特徴は、ソーシャルネットワークグラフ232による一つもしくは複数の共有コンテンツワード514を有するノードペアを接続するパスに対応する(1326)。
実装のいくつかにおいて、プロセス1300は、ソーシャルメディアメッセージの各々を施設の各々に接続するソーシャルネットワークグラフ232によるパスのタイプの各々についてパスカウントを取得し(1328)、訓練特徴ベクトルの特徴としてパスカウントを設定する(1330)。これは、図7に上記されている。実装のいくつかにおいて、訓練ベクトルの第5特徴は、ユーザによって生成され予め位置情報タグを付与されたソーシャルメディアメッセージの物理座標及び施設の各々の間の物理距離を計測する(1332)。例えば、図6B及び図6Cを用いて説明したエゴジオ及びともだちジオの計算は、予め位置情報タグを付与されたソーシャルメディアメッセージ及び施設の間の物理距離を計測する。
プロセス1300は、次に、ソーシャルメディアメッセージが施設と関連付けられている確率を推定するために、分類手段224を訓練する(1334)ために、訓練特徴ベクトルを用いる(1334)。実装のいくつかにおいて、訓練プロセスはサポートベクターマシンを使用する(1338)。実装のいくつかにおいて、図9Aに例示するように、訓練された分類手段は、ソーシャルメディアメッセージが施設と関連付けられている確率の中央値を計算するために使用される。
プロセス1300は、次に、ユーザから新しいソーシャルメディアメッセージを受け取る(1340)。一般的に、方法1300は、新しいソーシャルメディアメッセージに位置情報タグが付与されていない場合に適用される(1342)。プロセス1300は、次に、新しいソーシャルメディアメッセージの特徴ベクトルを構築する(1344)。特徴ベクトルの各々は、新しいソーシャルメディアメッセージ及び非施設ノードの間の連結性を測定するために、ソーシャルネットワークグラフによるパスを使用する複数の特徴を含む。これらの特徴は、訓練特徴ベクトル226のために特徴を計算する方法と同一の方法で計算される。プロセスは、次に、新しいソーシャルメディアメッセージが非施設ノードと関連付けられている確率を計算するために入力として特徴ベクトルを用いて、訓練された分類手段を実行する(1346)。実装のいくつかにおいて、計算された確率は正規化される(1348)。実装のいくつかにおいて、計算された確率の正規化は計算された確率の中央値を使用する(1350)。実装のいくつかにおいて、図9Aに例示されるように、計算された確率は、計算された確率から中央値を引き、その結果を中央値によって割ることによって正規化される(1352)。
計算された確率(もしくは正規化された確率)は、次に、閾値θと比較される。計算された確率が所定の閾値より大きい場合、プロセス1300は、新しいソーシャルメディアメッセージが主要な施設の何れとも関連付けられていないことを判定する(1354)。
計算された確率が所定の閾値以下である場合、プロセス1300は、新しいソーシャルメディアメッセージが主要施設の1つと関連付けられていることを判定する(1356)。実装のいくつかにおいて、ソーシャルメディアメッセージが必要とされる全ての施設とリンクされていることが既知とされている。しかしながら、多くの場合、プロセス1300は、ソーシャルメディアメッセージに対応する、主要施設の特定の第1施設を判定するために、順位付けプロセスを適用する(1358)。ソーシャルメディアメッセージがある施設と関連付けられている十分高い確実性が存在する場合、当該施設が何であるか知るために有用である。実装のいくつかにおいて、順位付けプロセスは、少なくとも複数の主要施設の確率スコアを計算し(1360)、ソーシャルメディアメッセージに対応する、最高確率スコアを有する主要施設の少なくとも1つを識別する(1360)ことを含む。これは、図4及び図8に例示されている。実装のいくつかにおいて、代替的な順位付け技術が適用される。
用語「第1」、「第2」などを様々な構成要素を説明するために用いたが、構成要素は当該用語によって限定されない。これらの用語は1つの構成要素から他の構成要素を区別するためにだけ使用される。例えば、第1接続端子は第2接続端子であってよく、同様に、第2接続端子は第1接続端子であってよい。「第1接続端子」の全てを矛盾なく別の用語に変更し、「第2接続端子」の全てを矛盾なく別の用語に変更する場合、説明の内容も変更される。第1接続端子及び第2接続端子は双方とも接続端子であるが、同一の接続端子ではない。
ここで使用される用語は、特定の実装を説明する目的で使用され、発明を限定することを意図していない。実装の説明において、コンテキストが、単数は単数であることを明確に示していない限り、単数は複数を含む。用語「及び/もしくは」は、関連する示されたアイテムの一つもしくは複数の考えられる何れかの及び全ての組み合わせを含む。用語「含む」は、記載された特徴、ステップ、操作、及び/もしくは構成要素の存在を特定するが、他の特徴、ステップ、操作、構成要素及び/もしくはこれらのグループの一つもしくは複数の存在もしくは追加を除外しない。
本願は、米国特許出願第14/664,734に関連し、当該出願の内容を全て含む。
上記は、説明を目的とし、特定の実装を参照して記述された。しかしながら、上記の例示的な説明は、開示の詳細な形態に本発明を限定することも網羅的であることも意図していない。多くの修正及び変更が上記開示の観点から可能である。本発明の原理及び実際的な応用を最も適切に説明するために実装を選択し説明した。これにより、考えられる特定の使用に適合するように、当業者であれば、本発明及び様々な変更を含む様々な実装を最適に利用することができる。
102 クライアントデバイス
200 サーバ
202 CPU
214 メモリ
302 CPU
314 メモリ

Claims (20)

  1. 少なくとも1つのプロセッサ、及び少なくとも1つの前記プロセッサによって実行される少なくとも1つのプログラムを記憶したメモリを含むコンピュータシステムが、
    ソーシャルメディアユーザを表すノード、前記ソーシャルメディアユーザによって生成されたメッセージを表すノード、及び施設を表すノードを含むソーシャルネットワークグラフにアクセスし、
    前記ソーシャルネットワークグラフに表される施設は、複数の主要施設及び非施設を含み、
    ソーシャルメディアメッセージノード及び非施設に対応するノードの間の前記ソーシャルネットワークグラフのリンクはソーシャルメディアメッセージが前記主要施設の何れにも対応していないことを示し、
    複数の訓練特徴ベクトルを構築し、
    訓練特徴ベクトルの各々は、ソーシャルメディアメッセージの各々及び施設の各々の間の連結性を測定するために、前記ソーシャルネットワークグラフによるパスを使用する複数の特徴の各々を含み、
    ソーシャルメディアメッセージが施設と関連する確率を推定するために、前記訓練特徴ベクトルを用いて分類手段を訓練し、
    新しいソーシャルメディアメッセージをユーザから受信し、
    新しい前記ソーシャルメディアメッセージの特徴ベクトルを構築し、
    特徴ベクトルの各々は、新しい前記ソーシャルメディアメッセージ及び非施設の間の連結性を測定するために、前記ソーシャルネットワークグラフによるパスを使用する複数の特徴を含み、
    新しい前記ソーシャルメディアメッセージが前記非施設と関連付けられている確率を計算するための入力として前記特徴ベクトルを用いて、訓練した前記分類手段を実行し、
    計算した確率が所定の閾値を越える場合、新しい前記ソーシャルメディアメッセージが前記主要施設の何れにも関連付けられていないことを判定し、
    計算した確率が前記所定の閾値以下である場合、新しい前記ソーシャルメディアメッセージが前記主要施設の1つと関連付けられていることを判定する、
    ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法。
  2. 計算した前記確率を、前記所定の閾値と比較する前に正規化する、
    請求項1に記載の方法。
  3. 前記分類手段を用いて、ソーシャルメディアメッセージが施設と関連付けられている確率の中央値を計算し、
    計算した前記確率を正規化するために前記確率の中央値を使用する、
    請求項2に記載の方法。
  4. 訓練特徴ベクトルの各々は、ソーシャルメディアメッセージの各々が施設の各々に関連付けられているか否かを示すラベルを含み、
    訓練特徴ベクトルの各々の少なくとも1つの特徴は、前記ソーシャルネットワークグラフによるパスのタイプの各々に基づく計測値を含む、
    請求項1〜請求項3の何れか一項に記載の方法。
  5. 第1特徴は、ユーザのソーシャルメディアメッセージから施設への前記ソーシャルネットワークグラフによる直接的なパスに対応する、
    請求項4に記載の方法。
  6. 第2特徴は、ユーザのソーシャルメディアメッセージから施設への前記ソーシャルネットワークグラフによるともだちの接続を介したパスに対応する、
    請求項4又は請求項5に記載の方法。
  7. 前記ソーシャルネットワークグラフは施設カテゴリに対応するノードを含み、
    第3特徴は、共通施設カテゴリを共有する施設のペアを接続する前記ソーシャルネットワークグラフによるパスに対応する、
    請求項4〜請求項6の何れか一項に記載の方法。
  8. 前記ソーシャルネットワークグラフは、前記ソーシャルメディアメッセージのコンテンツワードに対応するノードを含み、
    第4特徴は、少なくとも1つの共有コンテンツワードを有するノードのペアを接続する前記ソーシャルネットワークグラフによるパスに対応する、
    請求項4〜請求項7の何れか一項に記載の方法。
  9. 複数の訓練特徴ベクトルを構築することは、
    ソーシャルメディアメッセージの各々と施設の各々とを接続する前記ソーシャルネットワークグラフによるパスのタイプの各々についてパスカウントを取得し、
    前記訓練特徴ベクトルの特徴として前記パスカウントを設定する、
    請求項4〜請求項8の何れか一項に記載の方法。
  10. 訓練特徴ベクトルの第5の特徴は、施設の各々とユーザによって生成され予め位置情報タグが付与されたソーシャルメディアメッセージの物理座標との間の物理距離を計測する、
    請求項1〜請求項9の何れか一項に記載の方法。
  11. 前記分類手段は、サポートベクターマシンを用いて訓練される、
    請求項1〜請求項10の何れか一項に記載の方法。
  12. 前記主要施設は、所定領域、施設のタイプ、施設の名称、ユーザの嗜好、施設推定の履歴及びソーシャルメディアメッセージと関連付けられている地理座標からの距離の少なくとも1つに基づいて選択される、
    請求項1〜請求項11の何れか一項に記載の方法。
  13. 新しい前記ソーシャルメディアメッセージは位置情報タグを付与されていない請求項1〜請求項9の何れか一項に記載の方法。
  14. 新しい前記ソーシャルメディアメッセージが前記主要施設に関連付けられていることが判定された後、前記ソーシャルメディアメッセージに対応する施設として前記主要施設の特定の第1施設を判定するために順位付けプロセスを適用することをさらに含む、
    請求項1〜請求項13の何れか一項に記載の方法。
  15. 前記順位付けプロセスは、
    少なくとも複数の前記主要施設について確率スコアを計算し、
    前記ソーシャルメディアメッセージに対応する施設として最高確率スコアを有する前記主要施設の少なくとも1つを識別する、
    ことを含む、
    請求項14に記載の方法。
  16. 少なくとも1つのプロセッサと、
    メモリと、
    少なくとも1つの前記プロセッサによって実行されるように構成された前記メモリに記憶されている少なくとも1つのプログラムと、
    を含み、
    少なくとも1つの前記プログラムは、
    ソーシャルメディアユーザを表すノード、前記ソーシャルメディアユーザによって生成されたソーシャルメディアメッセージを表すノード、及び施設を表すノードを含むソーシャルネットワークグラフにアクセスし、
    前記ソーシャルネットワークグラフで表される施設は、複数の主要施設及び非施設を含み、
    ソーシャルメディアメッセージノード及び前記非施設に対応するノードの間の前記ソーシャルネットワークグラフのリンクはソーシャルメディアメッセージが前記主要施設の何れにも対応していないことを示し、
    複数の訓練特徴ベクトルを構築し、
    訓練特徴ベクトルの各々が、ソーシャルメディアメッセージの各々及び施設の各々の間の連結性を測定するために前記ソーシャルネットワークグラフによるパスを使用する複数の特徴の各々を含み、
    前記訓練特徴ベクトルを用いて、ソーシャルメディアメッセージが施設と関連付けられている確率を推定するために分類手段を訓練し、
    ユーザから新しいソーシャルメディアメッセージを受信し、
    新しい前記ソーシャルメディアメッセージについて特徴ベクトルを構築し、
    特徴ベクトルの各々は、新しい前記ソーシャルメディアメッセージ及び非施設の間の連結性を測定するために前記ソーシャルネットワークグラフによるパスを使用する複数の特徴を含み、
    新しい前記ソーシャルメディアメッセージが前記非施設と関連付けられている確率を計算するための入力として前記特徴ベクトルを使用して訓練した前記分類手段を実行し、
    計算した前記確率が所定の閾値よりも大きい場合、新しい前記ソーシャルメディアメッセージが前記主要施設の何れとも関連付けられていないことを判定し、
    計算した前記確率が前記所定の閾値以下の場合、新しい前記ソーシャルメディアメッセージが前記主要施設の1つと関連付けられていることを判定する、
    命令を含む、
    ソーシャルメディアメッセージ及び施設の間のリンクを推定するコンピュータシステム。
  17. 計算した前記確率は、前記所定の閾値と比較する前に正規化される、
    請求項16に記載のコンピュータシステム。
  18. 少なくとも1つの前記プログラムは、
    前記分類手段を用いて、ソーシャルメディアメッセージが施設と関連付けられている確率の中央値を計算する、
    命令をさらに含み、
    計算した前記確率を正規化することは前記確率の中央値を使用する、
    請求項17に記載のコンピュータシステム。
  19. 訓練特徴ベクトルの各々は、前記ソーシャルメディアメッセージの各々が前記施設の各々に関連付けられているか否かを示すラベルを含み、
    訓練特徴ベクトルの各々の少なくとも1つの特徴は、前記ソーシャルネットワークグラフによるパスのタイプの各々に基づく計測値を含む、
    請求項18に記載のコンピュータシステム。
  20. ソーシャルメディアユーザを表すノード、前記ソーシャルメディアユーザによって生成されたソーシャルメディアメッセージを表すノード、及び施設を表すノードを含むソーシャルネットワークグラフにアクセスし、
    前記ソーシャルネットワークグラフに示される施設は、複数の主要施設及び非施設を含み、
    ソーシャルメディアメッセージノード及び前記非施設に対応するノードの間の前記ソーシャルネットワークグラフのリンクは、前記ソーシャルメディアメッセージが前記主要施設の何れにも対応しないことを示し、
    複数の訓練特徴ベクトルを構築し、
    訓練特徴ベクトルの各々は、ソーシャルメディアメッセージの各々及び施設の各々の間の連結性を計測するために前記ソーシャルネットワークグラフによるパスを使用する複数の特徴の各々を含み、
    前記訓練特徴ベクトルを用いて、ソーシャルメディアメッセージが施設と関連付けられている確率を推定するために分類手段を訓練し、
    ユーザから新しいソーシャルメディアメッセージを受信し、
    新しい前記ソーシャルメディアメッセージについて特徴ベクトルを構築し、
    特徴ベクトルの各々は、新しい前記ソーシャルメディアメッセージ及び非施設の間の連結性を測定するために前記ソーシャルネットワークグラフによるパスを使用する複数の特徴を含み、
    新しい前記ソーシャルメディアメッセージが前記非施設と関連付けられている確率を計算するために入力として前記特徴ベクトルを用いて訓練した前記分類手段を実行し、
    計算した前記確率が所定の閾値より大きい場合、新しい前記ソーシャルメディアメッセージが前記主要施設の何れにも関連付けられていないことを判定し、
    計算した前記確率が前記所定の閾値以下である場合、前記ソーシャルメディアメッセージが前記主要施設の1つと関連付けられていることを判定する、
    処理をコンピュータに実行させるためのプログラム。
JP2015235792A 2015-08-25 2015-12-02 ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法、コンピュータシステム、及びプログラム Expired - Fee Related JP6575335B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/835,624 US10318884B2 (en) 2015-08-25 2015-08-25 Venue link detection for social media messages
US14/835,624 2015-08-25

Publications (2)

Publication Number Publication Date
JP2017045435A JP2017045435A (ja) 2017-03-02
JP6575335B2 true JP6575335B2 (ja) 2019-09-18

Family

ID=58096347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015235792A Expired - Fee Related JP6575335B2 (ja) 2015-08-25 2015-12-02 ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法、コンピュータシステム、及びプログラム

Country Status (2)

Country Link
US (1) US10318884B2 (ja)
JP (1) JP6575335B2 (ja)

Families Citing this family (130)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8554868B2 (en) 2007-01-05 2013-10-08 Yahoo! Inc. Simultaneous sharing communication interface
EP2732383B1 (en) 2011-07-12 2018-04-04 Snap Inc. Methods and systems of providing visual content editing functions
US8972357B2 (en) 2012-02-24 2015-03-03 Placed, Inc. System and method for data collection to validate location data
US11734712B2 (en) 2012-02-24 2023-08-22 Foursquare Labs, Inc. Attributing in-store visits to media consumption based on data collected from user devices
US10155168B2 (en) 2012-05-08 2018-12-18 Snap Inc. System and method for adaptable avatars
US9628950B1 (en) 2014-01-12 2017-04-18 Investment Asset Holdings Llc Location-based messaging
US9537811B2 (en) 2014-10-02 2017-01-03 Snap Inc. Ephemeral gallery of ephemeral messages
US9396354B1 (en) 2014-05-28 2016-07-19 Snapchat, Inc. Apparatus and method for automated privacy protection in distributed images
EP2955686A1 (en) 2014-06-05 2015-12-16 Mobli Technologies 2010 Ltd. Automatic article enrichment by social media trends
US9113301B1 (en) 2014-06-13 2015-08-18 Snapchat, Inc. Geo-location based event gallery
US9225897B1 (en) 2014-07-07 2015-12-29 Snapchat, Inc. Apparatus and method for supplying content aware photo filters
US10423983B2 (en) 2014-09-16 2019-09-24 Snap Inc. Determining targeting information based on a predictive targeting model
US10824654B2 (en) 2014-09-18 2020-11-03 Snap Inc. Geolocation-based pictographs
US11216869B2 (en) 2014-09-23 2022-01-04 Snap Inc. User interface to augment an image using geolocation
US9015285B1 (en) 2014-11-12 2015-04-21 Snapchat, Inc. User interface for accessing media at a geographic location
US10311916B2 (en) 2014-12-19 2019-06-04 Snap Inc. Gallery of videos set to an audio time line
US9385983B1 (en) 2014-12-19 2016-07-05 Snapchat, Inc. Gallery of messages from individuals with a shared interest
US9754355B2 (en) 2015-01-09 2017-09-05 Snap Inc. Object recognition based photo filters
US11388226B1 (en) 2015-01-13 2022-07-12 Snap Inc. Guided personal identity based actions
US10133705B1 (en) 2015-01-19 2018-11-20 Snap Inc. Multichannel system
US9521515B2 (en) 2015-01-26 2016-12-13 Mobli Technologies 2010 Ltd. Content request by location
US10223397B1 (en) 2015-03-13 2019-03-05 Snap Inc. Social graph based co-location of network users
KR102035405B1 (ko) 2015-03-18 2019-10-22 스냅 인코포레이티드 지오-펜스 인가 프로비저닝
US9692967B1 (en) 2015-03-23 2017-06-27 Snap Inc. Systems and methods for reducing boot time and power consumption in camera systems
US10135949B1 (en) 2015-05-05 2018-11-20 Snap Inc. Systems and methods for story and sub-story navigation
US9881094B2 (en) 2015-05-05 2018-01-30 Snap Inc. Systems and methods for automated local story generation and curation
US10993069B2 (en) 2015-07-16 2021-04-27 Snap Inc. Dynamically adaptive media content delivery
US10817898B2 (en) 2015-08-13 2020-10-27 Placed, Llc Determining exposures to content presented by physical objects
US9652896B1 (en) 2015-10-30 2017-05-16 Snap Inc. Image based tracking in augmented reality systems
US9984499B1 (en) 2015-11-30 2018-05-29 Snap Inc. Image and point cloud based tracking and in augmented reality systems
US10474321B2 (en) 2015-11-30 2019-11-12 Snap Inc. Network resource location linking and visual content sharing
US10354425B2 (en) 2015-12-18 2019-07-16 Snap Inc. Method and system for providing context relevant media augmentation
US11023514B2 (en) 2016-02-26 2021-06-01 Snap Inc. Methods and systems for generation, curation, and presentation of media collections
US10285001B2 (en) 2016-02-26 2019-05-07 Snap Inc. Generation, curation, and presentation of media collections
US10679389B2 (en) 2016-02-26 2020-06-09 Snap Inc. Methods and systems for generation, curation, and presentation of media collections
US10339365B2 (en) 2016-03-31 2019-07-02 Snap Inc. Automated avatar generation
US10430838B1 (en) 2016-06-28 2019-10-01 Snap Inc. Methods and systems for generation, curation, and presentation of media collections with automated advertising
US9681265B1 (en) 2016-06-28 2017-06-13 Snap Inc. System to track engagement of media items
US10733255B1 (en) 2016-06-30 2020-08-04 Snap Inc. Systems and methods for content navigation with automated curation
US10855632B2 (en) 2016-07-19 2020-12-01 Snap Inc. Displaying customized electronic messaging graphics
WO2018045076A1 (en) 2016-08-30 2018-03-08 C3D Augmented Reality Solutions Ltd Systems and methods for simultaneous localization and mapping
US10432559B2 (en) 2016-10-24 2019-10-01 Snap Inc. Generating and displaying customized avatars in electronic messages
CN112738408B (zh) 2016-11-07 2022-09-16 斯纳普公司 图像修改器的选择性识别和排序
US10203855B2 (en) 2016-12-09 2019-02-12 Snap Inc. Customized user-controlled media overlays
US11616745B2 (en) 2017-01-09 2023-03-28 Snap Inc. Contextual generation and selection of customized media content
US10454857B1 (en) 2017-01-23 2019-10-22 Snap Inc. Customized digital avatar accessories
US10915911B2 (en) 2017-02-03 2021-02-09 Snap Inc. System to determine a price-schedule to distribute media content
US10319149B1 (en) 2017-02-17 2019-06-11 Snap Inc. Augmented reality anamorphosis system
US11250075B1 (en) 2017-02-17 2022-02-15 Snap Inc. Searching social media content
US10074381B1 (en) 2017-02-20 2018-09-11 Snap Inc. Augmented reality speech balloon system
US10565795B2 (en) 2017-03-06 2020-02-18 Snap Inc. Virtual vision system
US10523625B1 (en) 2017-03-09 2019-12-31 Snap Inc. Restricted group content collection
US10582277B2 (en) 2017-03-27 2020-03-03 Snap Inc. Generating a stitched data stream
US10581782B2 (en) 2017-03-27 2020-03-03 Snap Inc. Generating a stitched data stream
US11170393B1 (en) 2017-04-11 2021-11-09 Snap Inc. System to calculate an engagement score of location based media content
US10387730B1 (en) 2017-04-20 2019-08-20 Snap Inc. Augmented reality typography personalization system
EP4040368A1 (en) 2017-04-27 2022-08-10 Snap Inc. Low-latency delivery mechanism for map-based gui
US11893647B2 (en) 2017-04-27 2024-02-06 Snap Inc. Location-based virtual avatars
US10212541B1 (en) 2017-04-27 2019-02-19 Snap Inc. Selective location-based identity communication
US10467147B1 (en) 2017-04-28 2019-11-05 Snap Inc. Precaching unlockable data elements
US10803120B1 (en) 2017-05-31 2020-10-13 Snap Inc. Geolocation based playlists
US9980100B1 (en) 2017-08-31 2018-05-22 Snap Inc. Device location based on machine learning classifications
US11475254B1 (en) 2017-09-08 2022-10-18 Snap Inc. Multimodal entity identification
US10740974B1 (en) 2017-09-15 2020-08-11 Snap Inc. Augmented reality system
US10499191B1 (en) 2017-10-09 2019-12-03 Snap Inc. Context sensitive presentation of content
US10573043B2 (en) 2017-10-30 2020-02-25 Snap Inc. Mobile-based cartographic control of display content
US11265273B1 (en) 2017-12-01 2022-03-01 Snap, Inc. Dynamic media overlay with smart widget
US11017173B1 (en) 2017-12-22 2021-05-25 Snap Inc. Named entity recognition visual context and caption data
US11068741B2 (en) * 2017-12-28 2021-07-20 Qualcomm Incorporated Multi-resolution feature description for object recognition
US10678818B2 (en) 2018-01-03 2020-06-09 Snap Inc. Tag distribution visualization system
US11507614B1 (en) 2018-02-13 2022-11-22 Snap Inc. Icon based tagging
US11361361B2 (en) * 2018-02-20 2022-06-14 Grzegorz Malewicz Method and an apparatus for searching or comparing sites using routes or route lengths between sites and places within a transportation system
US10979752B1 (en) 2018-02-28 2021-04-13 Snap Inc. Generating media content items based on location information
US10885136B1 (en) 2018-02-28 2021-01-05 Snap Inc. Audience filtering system
US10327096B1 (en) 2018-03-06 2019-06-18 Snap Inc. Geo-fence selection system
EP3766028A1 (en) 2018-03-14 2021-01-20 Snap Inc. Generating collectible items based on location information
US11163941B1 (en) 2018-03-30 2021-11-02 Snap Inc. Annotating a collection of media content items
US10219111B1 (en) 2018-04-18 2019-02-26 Snap Inc. Visitation tracking system
US10896197B1 (en) 2018-05-22 2021-01-19 Snap Inc. Event detection system
US10679393B2 (en) 2018-07-24 2020-06-09 Snap Inc. Conditional modification of augmented reality object
US10997760B2 (en) 2018-08-31 2021-05-04 Snap Inc. Augmented reality anthropomorphization system
US10698583B2 (en) 2018-09-28 2020-06-30 Snap Inc. Collaborative achievement interface
US10778623B1 (en) 2018-10-31 2020-09-15 Snap Inc. Messaging and gaming applications communication platform
US11199957B1 (en) 2018-11-30 2021-12-14 Snap Inc. Generating customized avatars based on location information
US10939236B1 (en) 2018-11-30 2021-03-02 Snap Inc. Position service to determine relative position to map features
US11032670B1 (en) 2019-01-14 2021-06-08 Snap Inc. Destination sharing in location sharing system
US10939246B1 (en) 2019-01-16 2021-03-02 Snap Inc. Location-based context information sharing in a messaging system
US11294936B1 (en) 2019-01-30 2022-04-05 Snap Inc. Adaptive spatial density based clustering
US11972529B2 (en) 2019-02-01 2024-04-30 Snap Inc. Augmented reality system
US10936066B1 (en) 2019-02-13 2021-03-02 Snap Inc. Sleep detection in a location sharing system
US10838599B2 (en) 2019-02-25 2020-11-17 Snap Inc. Custom media overlay system
US10964082B2 (en) 2019-02-26 2021-03-30 Snap Inc. Avatar based on weather
US10852918B1 (en) 2019-03-08 2020-12-01 Snap Inc. Contextual information in chat
US11868414B1 (en) 2019-03-14 2024-01-09 Snap Inc. Graph-based prediction for contact suggestion in a location sharing system
US11852554B1 (en) 2019-03-21 2023-12-26 Snap Inc. Barometer calibration in a location sharing system
US11249614B2 (en) 2019-03-28 2022-02-15 Snap Inc. Generating personalized map interface with enhanced icons
US10810782B1 (en) 2019-04-01 2020-10-20 Snap Inc. Semantic texture mapping system
CN109992631B (zh) * 2019-04-09 2022-07-29 北京邮电大学 一种动态异质信息网络嵌入方法、装置和电子设备
CN110134883B (zh) * 2019-04-22 2023-06-06 哈尔滨英赛克信息技术有限公司 一种异构社交网络位置实体锚链接识别方法
KR102249383B1 (ko) * 2019-04-25 2021-05-07 군산대학교 산학협력단 지오 태그 사진들로부터 어트랙션 지역을 발견하는 방법 및 이를 수행하는 장치
US10560898B1 (en) 2019-05-30 2020-02-11 Snap Inc. Wearable device location systems
US10582453B1 (en) 2019-05-30 2020-03-03 Snap Inc. Wearable device location systems architecture
US10893385B1 (en) 2019-06-07 2021-01-12 Snap Inc. Detection of a physical collision between two client devices in a location sharing system
US11307747B2 (en) 2019-07-11 2022-04-19 Snap Inc. Edge gesture interface with smart interactions
US11821742B2 (en) 2019-09-26 2023-11-21 Snap Inc. Travel based notifications
US11218838B2 (en) 2019-10-31 2022-01-04 Snap Inc. Focused map-based context information surfacing
US11128715B1 (en) 2019-12-30 2021-09-21 Snap Inc. Physical friend proximity in chat
US11429618B2 (en) 2019-12-30 2022-08-30 Snap Inc. Surfacing augmented reality objects
US11169658B2 (en) 2019-12-31 2021-11-09 Snap Inc. Combined map icon with action indicator
US11343323B2 (en) 2019-12-31 2022-05-24 Snap Inc. Augmented reality objects registry
US11228551B1 (en) 2020-02-12 2022-01-18 Snap Inc. Multiple gateway message exchange
US11516167B2 (en) 2020-03-05 2022-11-29 Snap Inc. Storing data based on device location
US11619501B2 (en) 2020-03-11 2023-04-04 Snap Inc. Avatar based on trip
JP7211998B2 (ja) * 2020-03-19 2023-01-24 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
US11430091B2 (en) 2020-03-27 2022-08-30 Snap Inc. Location mapping for large scale augmented-reality
US10956743B1 (en) 2020-03-27 2021-03-23 Snap Inc. Shared augmented reality system
CN111476322B (zh) * 2020-05-22 2022-05-20 哈尔滨工程大学 一种基于特征优化的元路径挖掘方法
US11483267B2 (en) 2020-06-15 2022-10-25 Snap Inc. Location sharing using different rate-limited links
US11314776B2 (en) 2020-06-15 2022-04-26 Snap Inc. Location sharing using friend list versions
US11290851B2 (en) 2020-06-15 2022-03-29 Snap Inc. Location sharing using offline and online objects
US11503432B2 (en) 2020-06-15 2022-11-15 Snap Inc. Scalable real-time location sharing framework
US11308327B2 (en) 2020-06-29 2022-04-19 Snap Inc. Providing travel-based augmented reality content with a captured image
US11349797B2 (en) 2020-08-31 2022-05-31 Snap Inc. Co-location connection service
US11606756B2 (en) 2021-03-29 2023-03-14 Snap Inc. Scheduling requests for location data
US11645324B2 (en) 2021-03-31 2023-05-09 Snap Inc. Location-based timeline media content system
US12026362B2 (en) 2021-05-19 2024-07-02 Snap Inc. Video editing application for mobile devices
US11829834B2 (en) 2021-10-29 2023-11-28 Snap Inc. Extended QR code
US12001750B2 (en) 2022-04-20 2024-06-04 Snap Inc. Location-based shared augmented reality experience system
US12020384B2 (en) 2022-06-21 2024-06-25 Snap Inc. Integrating augmented reality experiences with other components
US12020386B2 (en) 2022-06-23 2024-06-25 Snap Inc. Applying pregenerated virtual experiences in new location

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005108230A (ja) 2003-09-25 2005-04-21 Ricoh Co Ltd オーディオ/ビデオコンテンツ認識・処理機能内蔵印刷システム
CN102667761B (zh) * 2009-06-19 2015-05-27 布雷克公司 可扩展的集群数据库
US8458154B2 (en) * 2009-08-14 2013-06-04 Buzzmetrics, Ltd. Methods and apparatus to classify text communications
US8200247B1 (en) * 2010-02-08 2012-06-12 Google Inc. Confirming a venue of user location
WO2011100307A1 (en) * 2010-02-09 2011-08-18 Google Inc. Geo-coded comments in a messaging service
CN102348050A (zh) 2010-08-03 2012-02-08 国基电子(上海)有限公司 数码照相设备及其获取地理标签的方法
US8995775B2 (en) * 2011-05-02 2015-03-31 Facebook, Inc. Reducing photo-tagging spam
US9530167B2 (en) * 2011-08-12 2016-12-27 Facebook, Inc. Coefficients attribution for different objects based on natural language processing
US8990327B2 (en) * 2012-06-04 2015-03-24 International Business Machines Corporation Location estimation of social network users
US9262438B2 (en) * 2013-08-06 2016-02-16 International Business Machines Corporation Geotagging unstructured text
US20170109615A1 (en) 2015-10-16 2017-04-20 Google Inc. Systems and Methods for Automatically Classifying Businesses from Images

Also Published As

Publication number Publication date
US10318884B2 (en) 2019-06-11
JP2017045435A (ja) 2017-03-02
US20170061308A1 (en) 2017-03-02

Similar Documents

Publication Publication Date Title
JP6575335B2 (ja) ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法、コンピュータシステム、及びプログラム
JP6759844B2 (ja) 画像を施設に対して関連付けるシステム、方法、プログラム及び装置
JP6540314B2 (ja) 施設推定方法、デバイス及びプログラム
US10936959B2 (en) Determining trustworthiness and compatibility of a person
JP6784308B2 (ja) 施設特性を更新するプログラム、施設をプロファイリングするプログラム、コンピュータ・システム、及び施設特性を更新する方法
US10402703B2 (en) Training image-recognition systems using a joint embedding model on online social networks
US10019466B2 (en) Identification of low-quality place-entities on online social networks
CN105556512B (zh) 用于分析关注实体特性的设备、系统以及方法
US20210026910A1 (en) Expert Detection in Social Networks
US10083379B2 (en) Training image-recognition systems based on search queries on online social networks
US20180144256A1 (en) Categorizing Accounts on Online Social Networks
CN112313740A (zh) 聚合语义信息以提高对用户的理解
US20140310266A1 (en) Systems and Methods for Suggesting Places for Persons to Meet
US20150169710A1 (en) Method and apparatus for providing search results
US20150149539A1 (en) Trending Data Demographics
Shin et al. A new understanding of friendships in space: Complex networks meet Twitter
US11082800B2 (en) Method and system for determining an occurrence of a visit to a venue by a user
US9529822B2 (en) Media or content tagging determined by user credibility signals
WO2017016122A1 (zh) 一种信息推送方法及装置
Cao et al. Inferring crowd-sourced venues for tweets
US9767121B2 (en) Location-based mobile search
US11080349B1 (en) Geo-encoded embeddings

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190805

R150 Certificate of patent or registration of utility model

Ref document number: 6575335

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees