JP2011222004A - 情報ストリーム中の興味深いコンテンツを推奨するためのシステムおよび方法 - Google Patents

情報ストリーム中の興味深いコンテンツを推奨するためのシステムおよび方法 Download PDF

Info

Publication number
JP2011222004A
JP2011222004A JP2011068634A JP2011068634A JP2011222004A JP 2011222004 A JP2011222004 A JP 2011222004A JP 2011068634 A JP2011068634 A JP 2011068634A JP 2011068634 A JP2011068634 A JP 2011068634A JP 2011222004 A JP2011222004 A JP 2011222004A
Authority
JP
Japan
Prior art keywords
content
profile
user
pointer
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011068634A
Other languages
English (en)
Other versions
JP5731250B2 (ja
Inventor
Chen Yiling
ジリン・チェン
Nairn Rowan
ネアン ローワン
D Nelson Lester
レスター・ディ・ネルソン
H Chee Ed
エド・エイチ・チー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2011222004A publication Critical patent/JP2011222004A/ja
Application granted granted Critical
Publication of JP5731250B2 publication Critical patent/JP5731250B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】情報ストリーム中の興味深いコンテンツを推奨する方法を提供する。
【解決手段】ユーザと関連付けられたメッセージから抽出された単語ベクトルを含むコンテンツプロファイルを入手する。1つ以上のコンテンツポインタプロファイルを入手する。前記1つ以上のコンテンツポインタプロファイルはそれぞれ、1つ以上のメッセージ内において発見されたコンテンツポインタと関連付けられた単語ベクトルを含む。前記コンテンツプロファイルと、前記コンテンツポインタプロファイルそれぞれとを比較し、ユーザ単語とコンテンツポインタ単語との間の類似度を計算することにより、前記コンテンツポインタの関連度スコアを決定する。前記関連度スコアに基づいて、前記コンテンツポインタをランク付けする。閾値を満たすコンテンツポインタを、前記ユーザとの関連が最も高い前記コンテンツポインタとして選択する。
【選択図】図3

Description

現在、多くの媒体(例えば、eメール、オンラインニュースサービス、フィード、インスタントメッセージング、テキスティング、およびソーシャルネットワーキングサイト)を通じて、通信が可能となっている。ソーシャルネットワーキングサイト(例えば、フェイスブック、ツイッター、またはグーグルリーダー)により、メッセージのストリームを通じた通信が可能となっている。メッセージは、ユーザによって作成されるかまたはユーザに送信される。ソーシャルネットワーキングサイトの多くでは、各テキスト入力における文字数が制限されるため、1つのトピックについて複数のメッセージが発生する場合がある。個人がユーザとやり取りを行うには、当該ユーザのストリームに加入するかまたはテキスト入力を当該ユーザに送信することにより、やり取りを行う。
ソーシャルネットワーキングサイトが普及するにつれて、毎日送信されるメッセージの数も増加している。例えば、ツイッター経由で送信されるツイート数は、400,000個〜1,400、000個になっている。送信されるメッセージの数に起因して、受信したメッセージ全てをユーザが読むことが難しくなっている。受信したメッセージを選別および確認することは、特に離脱期間が長い場合に、極めて時間がかかり得る。多くの受信されたメッセージは、実質的な興味深い情報にではなく、社会的局面に関連している。このようなメッセージを挙げると、写真、記事または他のウェブサイトへのリンクがあり、このようなリンクには、実質的に関連する興味深い情報が含まれ得る。しかし、メッセージ全てを確認できなかった場合、重要な情報または興味深い情報を見逃す可能性がある。
明白な社会的情報から推奨を生成する試みが、例えば、「Using Frequency−Of−Mention In Public Conversations For Social Filtering」(CSCW1996のIn Proc.)において、Hillらによって為されている。Usenetニュースグループ上の新規URLを推奨する社会的フィルタリングシステムが、提供されている。このシステムは、グループ内の世論として機能する。例えば、各コンテンツグループにおいて、「1人につき1回の投票」に基づいて、最も人気のあるURLが推奨される。あるURLについてより多くのグループ内の人が言及するほど、当該URLが推奨される確率も高くなる。しかし、Hillの場合、ニュースグループ内のメンバー間の関係については考慮していない。
そのため、情報ストリームから選択されたコンテンツ推奨を積極的にユーザに提供する必要がある。
実施形態において、情報ストリーム中の興味深いコンテンツを推奨する方法が提供される。ユーザと関連付けられたメッセージから抽出された単語ベクトルを含むコンテンツプロファイルを入手する。1つ以上のコンテンツポインタプロファイルを入手する。これら1つ以上のコンテンツポインタプロファイルはそれぞれ、単語ベクトルを含む。この単語ベクトルは、1つ以上のメッセージ内に配置されたコンテンツポインタと関連付けられる。前記コンテンツプロファイルと、前記コンテンツポインタプロファイルとのそれぞれとを比較する。当該コンテンツポインタについて、ユーザ単語と、コンテンツポインタ単語との間の類似度を計算することにより、関連度スコアを決定する。前記関連度スコアに基づいて、前記コンテンツポインタをランク付けする。閾値を適用し、前記閾値を満たすコンテンツポインタを、前記ユーザとの関連が最も高いコンテンツポインタとして選択する。
さらなる実施形態において、興味深いコンテンツを特定する方法が提供される。1つ以上の情報ストリーム内のメッセージから選択された1組の候補コンテンツポインタを生成する。ユーザの興味に基づいて、前記候補コンテンツポインタそれぞれに対する関連度スコアを決定する。前記ユーザと関連付けられた個人に基づいて、前記候補コンテンツポインタそれぞれに対する投票スコアを決定する。前記候補コンテンツポインタそれぞれに対する前記関連度スコアおよび前記投票スコアを組み合わせて、総合スコアとする。前記総合スコアに基づいて、前記候補コンテンツポインタをランク付けする。前記総合スコアに閾値を適用し、前記閾値を満たす候補コンテンツポインタを推奨物として選択する。
当業者にとって、本発明のさらに他の実施形態は、以下の詳細な説明を読めば、明らかである。以下の詳細な説明において、本発明の実施のために企図される最良の態様を示すことにより、本発明の実施形態について説明する。理解されるように、本発明について、他の実施形態および異なる実施形態が可能であり、いくつかの詳細において、本発明の意図および範囲から逸脱することなく、多様な明白な局面において改変が可能である。従って、図面および詳細な説明は、制限的なものとしてではなく、実質的に例示的なものとしみなされるべきである。
一実施形態による、情報ストリーム中の興味深いコンテンツを推奨するシステムを示すブロック図である。 興味深いコンテンツを推奨するための異なる要素組み合わせを特定するデータ構造図である。 一実施形態による、情報ストリーム中の興味深いコンテンツを推奨する方法を示すフロー図である。 コンテンツポインタにスコアを割り当てる際に用いられるプロファイルの種類を示すデータ構造図である。 プロファイルの比較によりユニフォームリソースロケータ(URL)にスコアを割り当てる方法を例示的に示すフロー図である。 セルフプロファイルを生成する方法を例示的に示すフロー図である。 ネットワークプロファイルを生成する方法を例示的に示すフロー図である。 URLプロファイルを生成する方法を例示的に示すフロー図である。 個人の近所を用いてスコアをURLに割り当てる方法を例示的に示すフロー図である。 ユーザに対する推奨物を表示するウェブページを例示的に示すスクリーンショットである。
通信媒体(例えば、ソーシャルネットワーキングサイト)においてメッセージを介して受信した情報を確認しまた遅れずについていくのは、動的に更新される大量のコンテンツに起因して、困難かつ時間がかかる場合がある。興味深いかまたは関連するユニフォームリソースロケータ(「URL」)を有するメッセージを提供することができれば、ユーザが同じ情報を見つけ出し確認するのに必要な時間を大幅に短縮することができる。
ツイッターなどのソーシャルネットワーキングサイトにおいては、メッセージは、ユーザと、フォロワーまたはフォロイーとして特定される他の個人との間で構成および送信される。フォロワーとは、別のユーザのアカウントプロファイルに登録され、その別のユーザのアカウントプロファイルをフォローする者のことである。アカウントプロファイルがフォローされているその他のユーザは、フォロイーとみなされる。フォロワーとフォロイーとの関係は、相互的または独立的であり得る。興味深いコンテンツを有するメッセージについての推奨物は、特定のユーザのフォロワーおよびフォロイーに基づいて、決定することができる。図1は、一実施形態による、情報ストリーム中の興味深いコンテンツを推奨するためのシステム10を示すブロック図である。1つ以上のユーザデバイス11〜13が、ウェブサーバ14に接続されている。前記ユーザデバイスのうち少なくとも1つは、ユーザによって制御される。前記ユーザのアカウントプロファイルが、残りのユーザデバイスが前記ユーザのフォロワーおよびフォロイーを含む他のユーザによって制御可能である状態で、推奨物を特定するために確認される。
ユーザデバイス11〜13はそれぞれ、インターネットを含む相互ネットワーク23を介して、特定のウェブページ22(例えば、ソーシャルネットワーキングページ)をウェブサーバ20からリクエストする。ウェブサーバ20に接続されたデータベース21内に、ウェブページ22が保存されている。データベース21から、前記リクエストされたウェブページが特定され、ユーザデバイス11〜13に返送される。ユーザデバイス11〜13は、前記リクエストされたウェブページ22を表示して、ユーザが確認および対話できるようにする。リクエストされたウェブページ22がソーシャルネットワーキングサイトである場合、前記ユーザは、メッセージの構成および送信と、他のユーザからのメッセージの受信、確認および応答とをすることができる。メッセージは、ネットワークサーバ24に送信されかつネットワークサーバ24によって受信される。ネットワークサーバ24は、メッセージを保存するために、データベース25に接続される。さらに、送信されたメッセージおよび受信されたメッセージを情報ストリーム内に入れて、ユーザに提供することができる。
受信されたメッセージは、ユーザのフォロワーおよびフォロイーなどの他のユーザによって生成することが可能である。フォロワーとは、別のユーザのアカウントプロファイルに加入しているユーザのことであり、その他のユーザの対話をフォローすることができる。一方フォロイーとは、フォロワーによってフォローされている個人ユーザのことである。一実施形態において、フォロワーおよびフォロイーは相互排他的ではない。例えば、AはBのフォロワーであるが、BはAのフォロワーではない。さらなる実施形態において、フォロワーおよびフォロイーは相互排他的である。例えば、AはBのフォロワーであり、BはAのフォロワーである。さらに別の実施形態において、フェイスブックなどの特定のソーシャルネットワーキングサイトにおいて、フォロイーは「友達」とみなされる場合がある。従って、推奨物をリクエストしているユーザは、その他のユーザのフォロワーである場合もあるし、その他のユーザのフォロイーである場合もある。
リクエストを受けると、推奨物サーバ14は、リクエスト元ユーザにとって興味深いかまたはリクエスト元ユーザに関連するとみなされたコンテンツポインタを用いて、当該ユーザと関連付けられたメッセージを入手して、メッセージ推奨物を特定することができる。コンテンツポインタにより、ハイパーリンク(例えば、ユニフォームリソースロケータ(URL)または添付ファイル)などを介してリクエスト元ユーザが特定のコンテンツを発見するための情報またはアクセスが得られる。以下に、推奨物の特定について、ソーシャルネットワーキング環境内において発見されたコンテンツポインタとしてのURLに関連して説明するが他の環境および社会的ポインタも可能である。従って、本明細書中用いられる、「社会的ポインタ」または「URL」について言及した場合は、本明細書中他に明記されたものを除いて、その他の用語も含めて言及している。推奨物サーバは、プロファイル生成器15と、スコアモジュール16と、選択モジュール17とを含む。プロファイル生成器15は、入手されたメッセージを分析して、コンテンツプロファイルおよびURLプロファイルを生成する。これらのプロファイルは、推奨物サーバ14に接続されたプロファイルデータベース19に保存することができる。スコアモジュール16は、プロファイルデータベース19からのプロファイルのうち1つ以上にアクセスして、前記入手されたメッセージ中において特定されている1つ以上のURLについて関連度スコアを生成する。これらの関連度スコアは、選択モジュール17に提供される。選択モジュール17は、前記関連付けられた関連度スコアに基づいてURLをランク付けし、前記ランク付けされたURLに閾値を適用する。前記閾値を満たす関連度スコアを有するURLは、ユーザデバイス11〜13上のリクエスト元ユーザに相互ネットワーク23を介して提供されるべき推奨物として選択される。
ユーザデバイス11〜13、推奨物サーバ14、ウェブサーバ20およびネットワークサーバ24はそれぞれ、汎用プログラマブルコンピューティングデバイス内に従来から見受けられるコンポーネント(例えば、中央処理装置、メモリ、入力/出力ポート、ネットワークインターフェース、および不揮発性記憶装置)を含むが、他のコンポーネントも可能である。さらに、これらのサーバの代わりのまたはこれらのサーバに加えた他の情報供給源と、前記ユーザデバイスの代わりのまたは前記ユーザデバイスに加えた他の情報消費者が可能である。
さらに、ユーザデバイス11〜13と、サーバ14、20および24とはそれぞれ、本明細書中内に開示される実施形態を実施するためのつ以上のモジュールを含み得る。これらのモジュールは、従来のプログラミング言語中のソースコードとして書かれたコンピュータプログラムまたはプロシージャとして実行することができ、オブジェクトまたはバイトコードとして中央処理装置による実行に用いられる。あるいは、これらのモジュールは、集積回路としてハードウェア内に実行してもよいし、あるいは、リードオンリーメモリコンポーネント内に焼いてもよい。多様な実行形態のソースコードおよびオブジェクトおよびバイトコードを、コンピューター可読型記憶媒体(例えば、フロッピーディスク、ハードドライブ、デジタルビデオディスク(DVD)、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)および類似の記憶媒体)上に保持することができる。他の種類のモジュールおよびモジュール機能ならびに他の物理的ハードウェアコンポーネントも可能である。
興味深いくかつ関連する情報と思われるコンテンツポインタ(例えば、URL)を有するメッセージについての推奨物をリクエスト元ユーザに提供することは、有用でありかつ時間効率の向上につながり得る。すなわち、リクエスト元ユーザは、受信されたテキスト入力およびコンテンツポインタをそれぞれ確認して、興味深くかつ関連する情報を手作業で特定する必要が無くなり得る。推奨物としてURLを特定する際には、異なる要素組み合わせが考えられ得る。図2は、興味深いコンテンツを推奨するための異なる要素組み合わせを特定するデータ構造図30である。要素34の3つのカテゴリ31〜33(例えば、候補URLセットの種類31、候補セット32中のURLの関連度ランキング、およびURLの社会的ランキング33)が考えられている。候補コンテンツポインタカテゴリ31の種類としては、近所候補セット35aまたは人気候補セット35bがある。近所候補セット35aは、リクエスト元ユーザのフォロイーと、フォロイーのフォロイー(FOF)とからのメッセージを考慮する。FOFは、前記リクエスト元ユーザのフォロイー(このフォロイーは、前記リクエスト元ユーザによってフォローされている)によってフォローされているソーシャルネットワーキング環境内にアカウントプロファイルを有する。関連度ランキングカテゴリ32は、前記リクエスト元ユーザまたは前記リクエスト元ユーザのフォロイーおよびFOFによって構成されたメッセージ内において特定される単語およびトピックの関連度に基づいて、コンテンツポインタをランク付けする。前記リクエスト元ユーザによって構成されたメッセージ内において特定される単語およびトピックの関連度は、セルフプロファイルスコア36aとして提供される。前記リクエスト元ユーザのフォロイーおよびFOFによって構成されたメッセージ内において特定される単語およびトピックの関連度は、ネットワークスコア36bによって提供される。その後、前記ランク付けされたコンテンツポインタのうち1つ以上を推奨物として選択することが可能となる。さらに、さらなる実施形態において、コンテンツポインタの関連度ランキング36cは不要である。社会的ランキングカテゴリ33は、社会的投票力37aに基づいて、コンテンツポインタのスコア付けおよびランク付けを行う。社会的投票力37aは、前記リクエスト元ユーザのFOFの信頼性と、各FOFによるメッセージ生成頻度とを考慮する。また、さらなる実施形態において、コンテンツポインタの社会的ランキング37bは不要である。
上述した要素に基づけば、前記カテゴリそれぞれから要素を選択した後に前記選択した要素を組み合わせることにより、コンテンツポインタを推奨物として特定するための少なくとも12個の異なる方法を提供することができる。例えば、これら12個の推奨方法を挙げると、人気のある候補セット−関連度ランキング無し−社会的ランキング無し、近所候補セット−関連度ランキング無し−社会的ランキング無し、人気のある候補セット−ネットワークランキング−社会的ランキング無し、人気のある候補セット−自己関連度ランキング−社会的ランキング無し、近所候補セット−ネットワークランキング−社会的ランキング無し、近所候補セット−自己関連度ランキング−社会的ランキング無し、人気のある候補セット−関連度ランキング無し−投票社会的ランキング、人気のある候補セット−近所関連度ランキング−投票社会的ランキング、近所候補セット−ネットワーク関連度ランキング−投票社会的ランキング、人気のある候補セット−自己関連度ランキング−投票社会的ランキング、および近所カテゴリセット−自己関連度ランキング−投票社会的ランキングがる。他の推奨物要素の方法または組み合わせも可能である。
興味深いコンテンツポインタ(例えば、URL)を有するメッセージを推奨物として選択するために異なる要素を用いることが可能であるが、全ての方法のシナリオに共通して、普遍的なフローを規定することができる。図3は、一実施形態による、情報ストリーム中の興味深いコンテンツを推奨する方法40を示すフロー図である。リクエスト元ユーザに提供される可能な推奨物として、コンテンツポインタ(例えば、URL)をそれぞれ含むメッセージの候補セットを生成する(ブロック41)。メッセージの候補セットは、リクエスト元ユーザの近所に基づいて、または、当該ソーシャルネットワーキングサイト内での当該URLの人気に基づいて、生成することができる。近所候補セット内のURLは、前記リクエスト元ユーザのフォロイーおよびFOFから投稿されたメッセージから選択することができる。一方、当該ソーシャルネットワーキングサイトに登録された任意のユーザに送信されたメッセージまたは当該ソーシャルネットワーキングサイトに登録された任意のユーザに送信されたメッセージから、前記メッセージの人気に基づいて、人気のある候補セット内のURLを選択することができる。URLの人気は、当該URLを含む複数のメッセージに基づいて測定することができる。当該URLを含む複数のメッセージは、図1を参照して上述した推奨物サーバ、ソーシャルネットワーキングサイトまたはサードパーティにより、決定することができる。一例において、多数回投稿されているURLの方が、1人または2人の個人からのメッセージでしか言及されていないURLよりも興味深い可能性が高い。一実施形態において、URLの人気は、所定の期間にわたってまたは絶対年代を通じて、決定することができる。例えば、期間を24時間と設定して、その24時間の期間内に最も人気があるとみなされたURLを、人気のある候補セット内に含められるものとして選択する。最も人気のあるURLは、前記24時間の期間内に各URLについて言及したメッセージの数を特定した後、前記言及されたURL全てに人気閾値を適用することにより、決定することができる。前記URLが前記閾値を満たす場合、前記URLは、前記候補セット内に含められるものとして選択される。
任意選択的に、前記期間内に言及された前記URLのうち、一時的興味に関する閾値を満たすURLのみを前記候補セット内に含めることにより、前記URLそれぞれがより確実に興味深いことを保証してもよい。前記一時的興味に関する閾値を満たさないURLは、当該URLの人気に関係無く、各URLと関連付けられたメッセージが生成された日に基づいて、興味深くなくないものとしてみなすことができる。なぜならば、興味深いトピックは、経時的に変化するからである。前記一時的興味に関する閾値を挙げると、所定の期間、絶対年代、または未定の期間(例えば、リクエスト元ユーザが最後に自身のアカウントプロファイルにログインした時刻)がある。前記一時的興味に関する閾値は、自動的に設定してもよいし、リクエスト元ユーザが設定してもよい。例えば、前記興味深い閾値を7日間とし、この7日間は、人気のあるURLが内部で発見されたメッセージが生成された日から測定される。人気のあるURLが、人気のある候補セット内に含められるものとして選択されるのは、その関連付けられたメッセージが過去7日間以内に生成された場合のみである。
特定後、各候補URLには、当該URLのリクエスト元ユーザに対する関連度に基づいて、スコアが任意選択的に割り当てられる(ブロック42)。前記関連度スコアは、リクエスト元ユーザの興味のうち少なくとも1つ当該URLの類似度、前記リクエスト元ユーザのフォロイーの興味、前記リクエスト元ユーザのフォロイーの信頼性、および前記フォロイーがメッセージを作成する頻度に基づき得る。図4はデータ構造図50であり、関連度スコア51をコンテンツポインタに割り当てる際に用いられるプロファイルの種類を示す。関連度スコアは、コンテンツポインタ(例えば、プロファイル比較をを通じたテキスト入力において発見されたURL、投稿者ベースのスコア付け、またはプロファイル比較および投稿者ベースのスコア付けの組み合わせ)に割り当てられ得る。プロファイル比較スコア付け51では、特定のURLについてのURLプロファイル53と、リクエスト元ユーザのコンテンツプロファイル52および54とを比較して、前記URLと前記リクエスト元ユーザとの間の関連度を特定する。コンテンツプロファイルを挙げると、前記リクエスト元ユーザについてのメッセージおよび前記リクエスト元ユーザからのメッセージに基づいたセルフプロファイル52、前記リクエスト元ユーザのフォロイーに基づいたネットワークプロファイル54がある。以下、セルフプロファイルおよびネットワークプロファイルの生成について、図6および図7を参照してさらに説明する。関連度は、コサイン類似度を用いて決定することができる。以下、プロファイル比較を用いた関連度スコアの割り当てについて、図5を参照してさらに説明する。
図3を参照した説明に戻って、社会的ランキングスコアは、候補URLそれぞれに任意選択的に割り当てることができる(ブロック43)。社会的ランキングスコアは、他の個人をフォローすることの多い複数のリクエスト元ユーザのフォロイーと、その他の個人がメッセージを生成する頻度とに依存する。以下、社会的ランキングスコアについて、図9を参照してさらに説明する。
決定後、前記割り当てるられたスコアに基づいて、URLをランク付けすることができる(ブロック44)。関連度ランキングスコアおよび社会的ランキングスコアがどちらともURLに割り当てられている場合、ランクは、関連度スコアと、UALの投票スコアとの組み合わせに基づく。前記ランク付けされたURLのスコアにランキング閾値を適用し、前記閾値を満たすスコアを有するURLを推奨物として選択する(ブロック45)。ランキング閾値を挙げると、絶対値、パーセントまたは有界範囲がある。例えば、4という絶対値をリンク先のURLに適用して、最も高いランキングスコアを有する4つのURLを推奨物として選択することができる。選択された推奨物は、リクエスト元ユーザが確認できるよう、リクエスト元ユーザに提供することができる。推奨物は、URLのみを含んでいてもよいし、あるいは、URLおよび付けられたメッセージを含んでいてもよい。
上述したように、コンテンツプロファイルおよびURLプロファイルに基づいて、関連度スコアをURLに割り当てることができる。図5は、プロファイルの比較によってスコアをURLに割り当てる方法60を例示的に示すフロー図である。コンテンツプロファイルを入手する(ブロック61)。このコンテンツプロファイルは、セルフプロファイルまたはネットワークプロファイルを含み得る。セルフプロファイルまたはネットワークプロファイルは、新規に生成することもできるし、更新することもできるし、あるいはデータベースからアクセスすることも可能である。各コンテンツプロファイルは、URLと関連付けられたメッセージから得られたキーワードのベクトルを含む。セルフプロファイルを生成するには、リクエスト元ユーザからのメッセージまたはリクエスト元ユーザについてのメッセージからキーワードを選択すればよく、ネットワークプロファイルについてのキーワードは、前記リクエスト元ユーザのフォロイーのセルフプロファイルから選択すればよい。以下、セルフプロファイルおよびネットワークプロファイルの生成についてそれぞれ図6および図7を参照して説明する。
次に、URLについてのプロファイルを入手する(ブロック62)。さらなる実施形態において、コンテンツプロファイルおよびURLプロファイルを同時に入手してもよいし、あるいは、URLプロファイルを入手した後にコンテンツプロファイルを入手してもよい。URLプロファイルも、新規生成、更新、またはデータベースからのアクセスが可能である。URLプロファイルは、当該URLを含むメッセージのうち1つ以上から選択されたキーワードのベクトルを含む。ショートメッセージターム展開を用いて、ごく一部のメッセージにおいて言及されているURLについてのさらなるキーワードを特定する。以下、ターム展開について、図7を参照してさらに説明する。さらに、以下、URLプロファイルについて、図8を参照してさらに説明する。
入手後、コンテンツプロファイル(これは、セルフプロファイルまたはネットワークプロファイルのいずれかである)と、前記URLプロファイルとを比較(ブロック63)して、プロファイルの類似度に基づいて、関連度ランキングスコアを生成する(ブロック64)。類似度の決定は、コサイン類似度を用いて行うことができる。しかし、他の方法での類似度決定も可能である。図3を参照して上述したように、生成された関連度ランキングスコアを、ランキングのためのURLと、推奨物としての可能な選択とに割り当てる。
コンテンツプロファイルは、リクエスト元ユーザに関するメッセージに基づいたセルフプロファイルか、または、リクエスト元ユーザのフォロイーに基づいたネットワークプロファイルを含み得る。図6はフロー図であり、リクエスト元ユーザ71についてのセルフプロファイル74を生成する方法70を例示的に示す。リクエスト元ユーザ71が作成したメッセージ72および73と、リクエスト元ユーザ71について言及しているメッセージ72および73とを全て特定する。例えば、前記リクエスト元ユーザが作成した2つのメッセージと、前記リクエスト元ユーザに関する2つのメッセージとを特定する。第1のユーザ作成メッセージは、ドッグパークにおけるサーシャとの運動についての投稿を含み、一方、第2のユーザ作成メッセージは、休暇をとりたいことについての投稿を含む。前記リクエスト元ユーザについて言及しているメッセージは、別のユーザから前記リクエスト元ユーザに向けての、休暇を取るつもりであるの旨についての第1のメッセージと、さらなるユーザから投稿された、前記リクエスト元ユーザと一緒にGreen Lakeに運動をしに行くことについての第2のメッセージとを含む。さらなる実施形態において、前記リクエスト元ユーザが作成したメッセージのみまたは前記リクエスト元ユーザについて言及しているメッセージのみを特定し、これらのメッセージを、前記リクエスト元ユーザについての推奨物を決定する際に用いる。
前記特定されたメッセージから単語を抽出し、抽出した単語を、標準的なストップワードリストを通じたフィルタリングのために収集する。一実施形態において、トークン(例えば、名詞、名詞句、および語幹)のみを特定およびフィルタリングする。さらなる実施形態において、同義語を特定およびフィルタリングすることができる。前記抽出された単語から、複数の個別の単語を特定し、これらの単語をベクトルに沿って配置して、セルフプロファイルを生成することができる。個別の単語をセルフプロファイル中に含められるものとして選択する際には、当該セルフプロファイル中で個別の単語が重複しないようにし、かつ、リクエスト元ユーザが作成したかまたはリクエスト元ユーザについて言及しているメッセージのうち1つ以上において個別の単語が特定できるように、選択を行う。
上記例に戻って、4つのメッセージ全ての中の単語を抽出し、ストップワードを除去する。ストップワードを挙げると、用いられるサーチエンジンの種類または所定のストップワードのリストによって異なり得る、一般的に用いられる単語がある。「犬」、「公園」、「休暇」、「グリーンレイク」、「運動」および「仕事」という単語が、リクエスト元ユーザのセルフプロファイル内に含められるべき個別の単語として特定される。上述したように、前記プロファイル内に含められるべきものとして選択された単語は、前記プロファイル中のその他の単語全てと異なる単語でなくてはならない。しかし、前記個別の単語を前記メッセージのうち1つ以上において用いることは可能である。
以下の式に従って、これらの個別の単語と、関連付けられた強さとを、セルフプロファイルとしてベクトルに沿って羅列する。
Figure 2011222004
ここで、mは、前記特定されたメッセージ中の個別の単語の総数であり、キーワードwに対するリクエスト元ユーザの興味の強さを示す。リクエスト元ユーザの興味の強さは、以下の等式に基づいて、単語頻度逆ユーザ頻度重み付けスキーム(tf−idf)を用いて計算することができる。
Figure 2011222004

ここで、tfu(wi)は、リクエスト元ユーザが作成したかまたは前記リクエスト元ユーザについて言及しているメッセージ内に置いて単語wが使用された回数を示す。Idfは、以下の等式に基づいて決定される。
Figure 2011222004

ここで、uは、前記リクエスト元ユーザのフォロイーの総数であり、少なくとも1つのメッセージにおいて前記単語を用いてメッセージを作成した前記ユーザのフォロイーの数である。さらなる実施形態において、uは、ソーシャルネットワーキング環境内の他のユーザの総数であり、|u(wi)|は、少なくとも1つのメッセージにおいて前記単語を用いてメッセージを作成したその他のユーザの数である。uは他の値であってもよく、例えば、前記リクエスト元ユーザと直接通信した他のユーザや、1つ以上のメッセージにおいて前記リクエスト元ユーザについて言及した他のユーザなどであってもよい。ある単語についてtf値が高い場合、これは、リクエスト元ユーザがその単語を頻繁に用いていることを示し、すなわち、高い興味を示している。一方、ある単語についてidf値が高い場合、これは、この単語を用いている他のユーザは少数であることを示し、すなわち、1人のユーザを他の個人と区別する際にその単語を良好に用いることができることを示す。上記例に戻って、ベクトルに沿って表示されている個別の単語それぞれに対し、強さ値を割り当てる。強さは、パーセントとしてまたは絶対数として測定することが可能である。他にも、強さを決定するための測定および方法がある。
前記個別のキーワードから生成されたセルフプロファイルは、前記リクエスト元ユーザから投稿されたコンテンツに基づいて、前記リクエスト元ユーザの興味をモデリングする。しかし、リクエスト元ユーザの興味が、フォロイーなどの他のユーザから投稿されたコンテンツ内にある場合もある。ネットワークプロファイルは、リクエスト元ユーザのフォロイーのセルフプロファイルに基づいて、生成することができる。図7はフロー図であり、リクエスト元ユーザ81についてのネットワークプロファイル84を生成する方法80を例示的に示す。前記リクエスト元ユーザのフォロイー82を、リクエスト元ユーザ81の加入先となっておりリクエスト元ユーザ81によってフォローされいるアカウントを有する全ての個人として特定することができる。フォロイー82それぞれと関連付けられたセルフプロファイル83を入手する。例えば、リクエスト元ユーザは、フォロイーと思われる他の4人のユーザをフォローしており、前記4人のフォロイーについてのセルフプロファイルを入手する。各フォロイーについて、当該単語に対するフォロイーの興味の関連付けられた強さに基づいて、セルフプロファイル中の個別の単語を降順にランク付けする。個別の単語のうち、関連付けられたtf−idf値によって示される興味値が最も高いものを、当該フォロイーの高興味単語として選択する。このフォロイーの高興味単語は、閾値を用いて選択することができる。閾値を挙げると、絶対値、パーセントまたは有界範囲がある。他の閾値も可能である。一実施形態において、閾値は20パーセントとして設定される。そのため、ランク付けされた順位内の個別の単語のうち上位20パーセントを高興味単語として選択し、これらの高興味単語は、ネットワークプロファイル84内に含められる。さらなる実施形態において、1人のフォロイーのみしか言及していない単語全てをネットワークプロファイルから除去する。前記フォロイーそれぞれの高興味単語を組み合わせ、そのグループのフォロイーの高興味単語を選択する。
上記例に戻って、個別の単語およびその強さを、前記4人のフォロイーそれぞれのセルフプロファイル内において特定する。各フォロイーセルフプロファイルにおいて、個別の単語のうち最も強さが大きな単語(例えば、閾値を満たす個別の単語)を、前記フォロイーの高興味単語として選択する。各フォロイーの高興味単語を組み合わせて、グループ高興味単語を生成する。このグループ高興味単語について、当該グループによる興味の強さを各単語について決定する。グループ高興味単語は、「映画」、「熱帯」、「クラブ」、「休暇」および「親友」である。しかし、「映画」という用語は、前記フォロイーのうち1人が作成したメッセージにおいてしか言及されていないため、この用語を除去した後、ネットワークプロファイルを生成する。
ネットワークプロファイルは、前記グループ高興味単語と、その関連付けられたグループ強さから生成することができる。このグループ強さは、上述したようなtf−idf重み付けスキームを用いて決定することができる。このスキームにおいて、tfu(wi)は、特定の単語wを高興味単語として有する、リクエスト元ユーザのフォロイーの数である。そのため、tfu(wi)の値が高い場合、これは、前記リクエスト元ユーザのフォロイーのうち多くの者が共通して特定の単語wを用いたメッセージを生成していることを示す。この値から、上述したような等式3に基づいて決定された単語の一般的重要性を知ることができる。
さらなる実施形態において、ネットワークプロファイルを、リクエスト元ユーザの高興味単語から生成することができる。これらのリクエスト元ユーザの高興味単語は、リクエスト元ユーザのフォロイーおよびFOFによっても用いられている。例えば、前記リクエスト元ユーザが作成したメッセージにおいて共通して用いられている単語をセルフプロファイルから選択し、前記リクエスト元ユーザのフォロイーおよびFOFによって作成されたメッセージ内において特定する。その後、前記選択された単語の強さを決定することができる。
前記リクエスト元ユーザのフォロイーそれぞれについての選択された高興味単語と、ベクトルに沿って配置された関連付けられた強さとを組み合わせることにより、ネットワークプロファイルを生成する。上記例に戻って、ベクトルに沿って配置されているグループ高興味単語である「熱帯」、「クラブ」、「休暇」および「親友」について、強さを決定することで、ネットワークプロファイルを生成する。
URLなどのコンテンツポインタをプロファイルによって表すこともできる。図8はフロー図であり、コンテンツポインタプロファイル93を生成する方法90を例示的に示す。コンテンツポインタプロファイル93は、キーワードと、ベクトルに沿って発見された興味の関連付けられた強さとを含み、これにより、URLなどのコンテンツポインタのトピックを表す。インデックス、ファイル名、検索語および添付ファイルなどの他のコンテンツポインタも可能である。前記コンテンツポインタを含むメッセージから、トピックを決定することができる。前記コンテンツポインタプロファイルは、図6を参照して説明したtf−idf重み付けスキームを用いて、コンテンツプロファイルと同様に生成される。例えば、メッセージ91を特定して、特定のコンテンツポインタ92を含むメッセージを特定する。その後、特定されたメッセージ92を分析して、各メッセージ内に含まれる単語を抽出する。これらの抽出された単語は、標準的なストップワードリストを通じてフィルタリングされて、共通の単語を除去する。一実施形態において、名詞、名詞句および語幹を含む単語トークンのみを特定し、フィルタリングする。さらなる実施形態において、同義語を特定し、フィルタリングすることができる。前記抽出された単語から複数の個別の単語を特定し、ベクトルに沿って配置して、コンテンツポインタプロファイル93を生成することができる。個別の単語が、コンテンツポインタプロファイル93内に含められるものとして選択され、これにより、前記コンテンツポインタプロファイル内において個別の単語が重複せず、かつ、前記コンテンツポインタについて言及しているメッセージのうち1つ以上内において、前記個別の単語を特定することができる。上記例に基づいて、「引き取り」、「子犬」、「サーシャ」、「猫」、「ノンニ」、「動物愛護協会」、および「ペット」という単語が、興味の関連付けられた強さと共にコンテンツポインタプロファイル内に含められるものとして、個別の単語として選択される。
各個別の単語と関連付けられた興味の強さは、当該コンテンツポインタの記述における個別の単語の使用様態に基づくことができ、上記したtf−idf重み付けスキームに基づいて決定することができる。しかしtfu(wi)の値は、関連付けられたメッセージ中でコンテンツポイントを記述するために単語が何回使用されたかを示す。一実施形態において、コンテンツポインタの記述において或る単語の使用回数が多いほど、その単語の前記コンテンツポインタに対する関連度が高くなる。さらに、前idf値から、上記したような等式3に従って決定された単語の一般的重要性が分かる。上記例に戻って、前記選択された個別の単語それぞれについての興味スコアを決定し、ベクトルに沿って配置して、コンテンツポインタプロファイルを生成する。さらなる実施形態において、少数のメッセージにしかコンテンツポインタが含まれていない場合、ショートメッセージターム展開を適用して、前記URLプロファイル内に含められるべきさらなる単語を特定する。ターム展開時において、コンテンツポインタを有するメッセージからトークン(例えば、名詞、名詞句および語幹)を抽出し、前記抽出されたトークンに基づいてクエリを生成する。このクエリを、1組の文書(例えば、ウェブベースの文書、あるいは、リモートに保存された電子文書またはローカルに保存された電子文書)に適用する。前記サーチクエリの1つ以上のトークンとマッチする文書が、検索結果として特定される。これらの検索結果を分析して、サーチエンジンを介してまたはtf−idfを用いて顕著なタームを特定する。tf−idfを適用した場合、最も高いtf−idf値を有する検索結果文書中に出現するトークンが、顕著なタームとして選択される。これらの特定された顕著なタームは、個別の単語としてコンテンツポインタプロファイルに付加され得る。ショートメッセージターム展開については、本発明の譲受人に譲渡された米国特許出願シリアル番号第12/646,810号(タイトル:「System and Method For Identifying Topics For Short Text Communications」、出願日:2009年12月23日)中にさらに記載がある。本明細書中、同文献の開示菜用を参考のため援用する。
プロファイルに基づいたスコア付けコンテンツポインタのスコア付けに加えて、投稿者ベースのスコア付け方法も用いることができる。図9はフロー図であり、投稿者ベースのスコア付けを用いてスコアをURLに割り当てる方法100を例示的に示す。リクエスト元ユーザと関連付けられた投稿者近隣を特定する(ブロック101)。投稿者近隣は、リクエスト元ユーザのフォロイーのフォロイーを含み得る(FOF)。他の種類の近隣も可能である。FOFが持っているアカウントプロファイルはリクエスト元ユーザのフォロイーによってフォローされており、リクエスト元ユーザのフォロイーは、前記リクエスト元ユーザによってフォローされている。特定のコンテンツポインタ(例えば、URL)をメッセージ中に投稿した個人FOFを特定する(ブロック102)。前記FOFの信頼性および前記FOFによって生成された複数のメッセージに基づいて、これらの特定されたFOFそれぞれに、投票スコアを割り当てる(ブロック103)。
信頼性投票スコアとしては絶対数またはパーセントがあり、当該ユーザとやり取りされた複数のメッセージ、当該ユーザと個人との間で共有されている他の複数の個人、および前記ユーザおよび前記個人が作成したメッセージコンテンツの類似度に基づき得る。他の信頼性決定法も可能である。一方、FOFによって生成されたメッセージの数は、所定の期間にわたってまたは有界の時間範囲内において計算することができる。割り当てられた投票力は、特定のFOFをフォローしているリクエスト元ユーザのフォロイーの数の対数に比例し得、かつ、前記特定のFOFによってメッセージが生成される平均時間間隔の対数にも比例する。このように、一実施形態において、より少数のメッセージを生成するFOFに対し、より高い投票力を割り当てる一方、頻繁にメッセージを生成するFOFに対し、より低い投票力を割り当てる。さらに、リクエスト元ユーザのフォロイーのうちの多くによってフォローされるFOFは、前記リクエスト元ユーザのフォロイーのうちより少数によってフォローされているFOFよりもより信頼性が高いとみなすことができる。従って、前記FOFをフォローしている前記リクエスト元ユーザのフォロイーが多いほど、より投票力が得られる。さらなる実施形態において、前記FOFのうち誰も前記特定のコンテンツポインタについて言及していない場合、投票力が最も低い単一のFOFによる言及と同等の投票スコアが割り当てられる。他の投票スコア割り当て方法が可能である。
決定後、前記FOFそれぞれの投票力を合計(ブロック104)して、前記コンテンツポインタについての投票スコア(ブロック105)を生成する。図3を参照した説明に戻って、全ての候補コンテンツポインタを関連度ランキングまたは社会的ランキングを通じてスコア付けした後、前記関連付けられたスコアに基づいて、前記コンテンツポインタをランク付けする。関連度ランキングスコアおよび社会的ランキングスコアがどちらともURLに割り当てられている場合、そのランクは、前記関連度スコアおよび前記URLの投票スコアの組み合わせに基づく。前記ランク付けされたコンテンツポインタのスコアにランク閾値を適用し、スコアが前記ランク閾値を満たしているコンテンツポインタを推奨物として選択する。選択後、前記推奨物を前記リクエスト元ユーザに提供し、確認することができる。これらの推奨物は、前記URLのみを含んでいてもよいし、あるいは、前記URLおよび関連付けられたメッセージを含んでもよい。リクエスト元ユーザに提供された推奨物は、推奨物ウェブページ上でアクセスおよび表示することができる。図10はスクリーンショット110であり、リクエスト元ユーザに対する推奨物112および113を表示するウェブページ111を例示的に示す。推奨物112および113は、単一のリストとして提供してもよいし、あるいは、推奨物の種類に応じて別個に提示してもよい。一実施形態において、これらの推奨物は、コンテンツ推奨物113または人気のある推奨物114として分類されている。コンテンツ推奨物113は、コンテンツポインタの近所候補セットに基づいている。人気のある推奨物114は、コンテンツポインタの人気のある候補セットに基づいている。図3を参照して上述したように、推奨物としての可能な選択対象としての1組の候補コンテンツポインタは、前記リクエスト元ユーザの近所またはソーシャルネットワーキング環境内におけるコンテンツの人気に基づいて、生成することができる。近所候補セットから選択された推奨物は一般的には、前記リクエスト元ユーザが既に知っているかまたは精通している情報に関し、一方、人気のある候補セットから選択された推奨物は、前記リクエスト元ユーザが受信した情報と比較してなじみが無いかまたは正反対の内容を含む傾向がある。
前記表示された推奨物はそれぞれ、関連性ボックス118を含む。リクエスト元ユーザは、関連性ボックス118に入力を行って、推奨物のコンテンツを既に知っているかまたはリクエスト元ユーザが推奨物のコンテンツに興味があるかまたは無いかについて示すことができる。関連性ボックス118は、チェックボックスまたは記入式ボックスと、リクエスト元ユーザからの情報を受け取るための他の種類のフォーマットとを含み得る。前記関連性チェックボックスを介して前記リクエスト元ユーザから得られた情報を用いて、前記リクエスト元ユーザのコンテンツプロファイルを更新し、その投票力を調節することができる。
推奨物の提示は、リクエスト元ユーザが1組の提示ツール115を介して決定してもよいし、あるいは、自動的に決定してもよい。提示ツールを挙げると、コンテンツスライディングバー116および表示チェックボックス117がある。コンテンツスライディングバー116を用いた場合、リクエスト元ユーザは、推奨物内に含まれるコンテンツの範囲をリクエストすることができる。コンテンツスライディングバーの一端では、URLのネットワーク候補セットからの全推奨物が提供される。その他端では、URLの人気のある候補セットから選択された全推奨物が提供される。その中間では、コンテンツ推奨物および人気のある推奨物をほぼ等量で混合したものが提供される。
一実施形態において、ネットワークおよび人気のある推奨物の選択に用いられるコンテンツ範囲は、単一の選択可能なスライディングバー制御部内に含まれる。しかし、ユーザが調節可能なスライディングバー制御部を別個に設けることも可能である。他の種類の制御も可能であり、例えば、回転ノブまたはギンベルノブを別個に使用するかまたは組み合わせて使用してもよいし、スライダーバー、ラジオボタンおよび他のユーザ入力機構により、t一定範囲の回転、移動または選択を介して連続的または不連続的に選択が行えるようにしてもよい。表示チェックボックス117は、トップ推奨物、全推奨物、単一の推奨物ストリーム、コンテンツおよび人気のある推奨物についての別個の推奨物リスト、各推奨物のタイトル、または各推奨物の要旨を含み得る。他の表示要素も可能である。
さらなる実施形態において、リクエスト元ユーザは、複数の推奨物ウェブページにログインすることができる。各ウェブページは、推奨物ソース(例えば、ソーシャルネットワーキングサイト、eメール、またはRSSフィード)を表し得る。他のソースも可能である。最低でも、ソースを介してユーザ、通信されているコンテンツおよび通信履歴が特定できなければならない。
さらに別の実施形態において、活性化拡散を用いて、社会的ネットワークまたは他のコンテンツポインタ環境を通じて伝播させることができる。例えば、ある環境内にいるリクエスト元ユーザに対してコンテンツポインタにより推奨物を特定する場合、その環境内の他のユーザ(例えば、FOFのフォロイー)を考慮することができる。しかし、前記リクエスト元ユーザから除去されるその他のユーザの数が多いほど、考慮時における重みが低減する。活性化拡散を用いて、その他のユーザを一般化することができる。
推奨物の特定について、ソーシャルネットワーキング環境およびURLに言及しつつ上記において説明してきたが、他の環境およびコンテンツポインタも可能である。そのような環境としては、eメールおよびデータベースがある。eメール環境においては、コンテンツポインタは添付ファイルを含み得、データベース環境においては、コンテンツポインタはファイル名またはインデックスを含み得る。eメール環境において、コンテンツプロファイルおよびコンテンツポインタプロファイルは、eメールのコンテンツに基づいて生成することができる。eメールから単語が抽出されて、プロファイルベクトルが生成され、単語強さは、リクエスト元ユーザのアドレス帳中の連絡先またはリクエスト元ユーザと直接通信したことのある連絡先に基づき得る。他の環境およびコンテンツポインタも可能である。

Claims (4)

  1. 興味深いコンテンツを推奨する方法であって、
    ユーザと関連付けられたメッセージから抽出された単語ベクトルを含むコンテンツプロファイルを入手することと、
    1つ以上のコンテンツポインタプロファイルを入手することであって、前記1つ以上のコンテンツポインタプロファイルはそれぞれ、1つ以上のメッセージ内において発見されたコンテンツポインタと関連付けられた単語ベクトルを含む、ことと、
    前記コンテンツプロファイルと、前記コンテンツポインタプロファイルそれぞれとを比較し、前記ユーザ単語と前記コンテンツポインタ単語との間の類似度を計算することにより、前記コンテンツポインタの関連度スコアを決定することと、
    前記関連度スコアに基づいて前記コンテンツポインタをランク付けすることと、
    前記コンテンツポインタに閾値を適用し、前記ユーザに最も関連するコンテンツポインタとして前記閾値を満たす前記コンテンツポインタを選択することと、
    を含む、方法。
  2. 前記コンテンツプロファイルとしてセルフプロファイルを生成することであって、
    前記当該ユーザと関連付けられたメッセージから単語を抽出し、前記抽出された単語のリストを生成することと、
    前記抽出された単語のうち1つ以上を前記セルフプロファイル内に含められるべきものとして選択し、各選択された単語の強さを決定することと、
    前記選択された単語および関連付けられた強さを前記ベクトルに沿って前記セルフプロファイルとして配置することと、
    を含むことと、
    前記コンテンツプロファイルとしてネットワークプロファイルを生成することであって、
    前記ユーザと関連付けられた個人のプロファイルを特定することであって、各プロファイルは、前記個人について、単語および関連付けられた強さを含む、ことと、
    各プロファイルに閾値を適用し、前記閾値を満たす単語を選択することと、
    各個人プロファイルからの前記選択された単語を組み合わせ、選択された単語それぞれについて強さを決定することと、
    前記選択された単語および関連付けられた強さをベクトルに沿って前記ネットワークプロファイルとして配置することと、
    を含むことと、
    のうち少なくとも1つをさらに含む、請求項1に記載の方法。
  3. 前記コンテンツポインタのうち1つについて前記コンテンツポインタプロファイルを生成することであって、
    前記コンテンツポインタが内部で発見された前記1つ以上のメッセージから単語を抽出し、前記抽出された単語のリストを生成することと、
    前記単語のうち1つ以上を前記コンテンツポインタプロファイル内に含められるべきものとして選択し、各選択された単語の強さを決定することと、
    前記選択された単語および関連付けられた強さをベクトルに沿って前記コンテンツポインタプロファイルとして配置することと、
    をさらに含む、請求項1に記載の方法。
  4. 1つ以上の個人からの前記コンテンツポインタのうち少なくとも1つを含むメッセージを特定することと、
    前記個人それぞれに対し、前記個人がメッセージを生成する頻度に応じて、構成力を割り当てることと、
    前記個人それぞれに対し、前記個人の信頼性に応じて信用力を割り当てることであって、前記信用力は、前記ユーザと前記個人との間でやり取りされる複数のメッセージ、前記ユーザと前記個人との間で共有される複数の他の個人、前記ユーザおよび前記個人によって作成されるコンテンツの類似度のうち少なくとも1つに基づく、ことと、
    前記構成力および前記信用力を組み合わせることにより、各個人の投票力を決定することと、
    前記コンテンツポインタを含むメッセージと関連付けられた前記個人の前記投票力を合計することにより、前記コンテンツポインタそれぞれの投票スコアを生成することと、
    前記少なくとも1つのコンテンツポインタについて、前記投票スコアと、前記関連度スコアとを組み合わせることと、
    をさらに含む、請求項1に記載の方法。
JP2011068634A 2010-04-09 2011-03-25 情報ストリーム中の興味深いコンテンツを推奨するためのシステムおよび方法 Active JP5731250B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/757,929 US8666979B2 (en) 2010-04-09 2010-04-09 Recommending interesting content using messages containing URLs
US12/757,929 2010-04-09

Publications (2)

Publication Number Publication Date
JP2011222004A true JP2011222004A (ja) 2011-11-04
JP5731250B2 JP5731250B2 (ja) 2015-06-10

Family

ID=44148364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011068634A Active JP5731250B2 (ja) 2010-04-09 2011-03-25 情報ストリーム中の興味深いコンテンツを推奨するためのシステムおよび方法

Country Status (3)

Country Link
US (1) US8666979B2 (ja)
EP (1) EP2375351B1 (ja)
JP (1) JP5731250B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015529888A (ja) * 2012-07-10 2015-10-08 フェイスブック,インク. ソーシャルネットワーキングシステムにおけるスポンサ付き広告のランク付けおよび価格設定
JPWO2014027415A1 (ja) * 2012-08-16 2016-07-25 株式会社Jx通信社 情報提供装置、情報提供方法、及びプログラム
JP2020086521A (ja) * 2018-11-15 2020-06-04 トヨタ自動車株式会社 情報提供装置、情報提供方法及びプログラム

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8666979B2 (en) * 2010-04-09 2014-03-04 Palo Alto Research Center Incorporated Recommending interesting content using messages containing URLs
US9183270B2 (en) 2010-05-17 2015-11-10 Wal-Mart Stores, Inc. Social genome
US8595234B2 (en) * 2010-05-17 2013-11-26 Wal-Mart Stores, Inc. Processing data feeds
US9699503B2 (en) * 2010-09-07 2017-07-04 Opentv, Inc. Smart playlist
US10210160B2 (en) * 2010-09-07 2019-02-19 Opentv, Inc. Collecting data from different sources
US8612477B2 (en) * 2010-09-24 2013-12-17 Aol Inc. Systems and methods for customized electronic communications
US9171089B2 (en) 2010-11-16 2015-10-27 John Nicholas and Kristin Gross Trust Message distribution system and method
US20150135048A1 (en) * 2011-04-20 2015-05-14 Panafold Methods, apparatus, and systems for visually representing a relative relevance of content elements to an attractor
US20120272168A1 (en) * 2011-04-20 2012-10-25 Panafold Methods, apparatus, and systems for visually representing a relative relevance of content elements to an attractor
US20140358911A1 (en) * 2011-08-31 2014-12-04 University College Dublin, National Uniaversity of Ireland Search and discovery system
US9904703B1 (en) * 2011-09-06 2018-02-27 Google Llc Determining content of interest based on social network interactions and information
US20130124644A1 (en) * 2011-11-11 2013-05-16 Mcafee, Inc. Reputation services for a social media identity
US20130129075A1 (en) * 2011-11-22 2013-05-23 Incontact, Inc. Systems and methods of using social media in contact handling systems
GB2497793A (en) * 2011-12-21 2013-06-26 Ninian Solutions Ltd Pre-emptive caching of potentially relevant content from a collaborative workspace at a client device
CN103218366B (zh) 2012-01-20 2017-09-01 腾讯科技(深圳)有限公司 下载资源推荐方法及系统
US8930392B1 (en) * 2012-06-05 2015-01-06 Google Inc. Simulated annealing in recommendation systems
US9208509B1 (en) * 2012-07-13 2015-12-08 Amdocs Software Systems Limited System, method, and computer program for personalizing content for a user based on a size of a working vocabulary of the user
US9594810B2 (en) * 2012-09-24 2017-03-14 Reunify Llc Methods and systems for transforming multiple data streams into social scoring and intelligence on individuals and groups
CN102982069B (zh) * 2012-10-25 2016-07-13 北京奇虎科技有限公司 推荐数据显示方法和装置
US9495357B1 (en) * 2013-05-02 2016-11-15 Athena Ann Smyros Text extraction
CN104424187B (zh) * 2013-08-19 2019-05-24 腾讯科技(深圳)有限公司 一种向客户端用户推荐好友的方法及装置
US10080060B2 (en) 2013-09-10 2018-09-18 Opentv, Inc. Systems and methods of displaying content
CN104636378A (zh) * 2013-11-12 2015-05-20 中兴通讯股份有限公司 应用程序的推送方法及装置
US10217058B2 (en) 2014-01-30 2019-02-26 Microsoft Technology Licensing, Llc Predicting interesting things and concepts in content
CN103838834B (zh) 2014-02-25 2020-06-19 北京智谷睿拓技术服务有限公司 一种提及推荐方法、信息处理方法及系统
US9740687B2 (en) 2014-06-11 2017-08-22 Facebook, Inc. Classifying languages for objects and entities
US9846836B2 (en) 2014-06-13 2017-12-19 Microsoft Technology Licensing, Llc Modeling interestingness with deep neural networks
US9852478B2 (en) * 2014-08-20 2017-12-26 International Business Machines Corporation Identifying influencers in computer networks
US10621250B2 (en) * 2014-09-23 2020-04-14 Google Llc Notifying users of relevant content
US9864744B2 (en) 2014-12-03 2018-01-09 Facebook, Inc. Mining multi-lingual data
US10067936B2 (en) 2014-12-30 2018-09-04 Facebook, Inc. Machine translation output reranking
US9830386B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Determining trending topics in social media
US9830404B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Analyzing language dependency structures
US9477652B2 (en) 2015-02-13 2016-10-25 Facebook, Inc. Machine learning dialect identification
US10097648B2 (en) * 2015-02-27 2018-10-09 Rovi Guides, Inc. Methods and systems for recommending media content
US10216800B2 (en) * 2015-06-18 2019-02-26 Rocket Apps, Inc. Self expiring social media
US10496716B2 (en) 2015-08-31 2019-12-03 Microsoft Technology Licensing, Llc Discovery of network based data sources for ingestion and recommendations
US9734142B2 (en) 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
CN105468723B (zh) * 2015-11-20 2019-08-20 小米科技有限责任公司 信息推荐方法及装置
CN105550207B (zh) * 2015-12-02 2021-02-09 阿里巴巴(中国)有限公司 一种信息推广方法及装置
US10133738B2 (en) 2015-12-14 2018-11-20 Facebook, Inc. Translation confidence scores
US9734143B2 (en) 2015-12-17 2017-08-15 Facebook, Inc. Multi-media context language processing
US9805029B2 (en) 2015-12-28 2017-10-31 Facebook, Inc. Predicting future translations
US10002125B2 (en) * 2015-12-28 2018-06-19 Facebook, Inc. Language model personalization
US9747283B2 (en) 2015-12-28 2017-08-29 Facebook, Inc. Predicting future translations
US10902215B1 (en) 2016-06-30 2021-01-26 Facebook, Inc. Social hash for language models
US10902221B1 (en) 2016-06-30 2021-01-26 Facebook, Inc. Social hash for language models
US10534815B2 (en) * 2016-08-30 2020-01-14 Facebook, Inc. Customized keyword query suggestions on online social networks
US9836183B1 (en) * 2016-09-14 2017-12-05 Quid, Inc. Summarized network graph for semantic similarity graphs of large corpora
CN108322316B (zh) * 2017-01-17 2021-10-19 阿里巴巴(中国)有限公司 确定信息传播热度的方法、装置及计算设备
CN109145193A (zh) * 2017-06-27 2019-01-04 阿里巴巴集团控股有限公司 一种信息推送方法及系统
US10585956B2 (en) * 2017-09-20 2020-03-10 International Business Machines Corporation Media selection and display based on conversation topics
US10380249B2 (en) 2017-10-02 2019-08-13 Facebook, Inc. Predicting future trending topics
US10489511B2 (en) * 2018-03-01 2019-11-26 Ink Content, Inc. Content editing using AI-based content modeling
US11514333B2 (en) * 2018-04-30 2022-11-29 Meta Platforms, Inc. Combining machine-learning and social data to generate personalized recommendations
CN111259249B (zh) * 2020-01-20 2023-08-22 北京百度网讯科技有限公司 数据筛选方法、装置、设备及存储介质
US11240187B2 (en) * 2020-01-28 2022-02-01 International Business Machines Corporation Cognitive attachment distribution
US11487839B2 (en) * 2020-10-12 2022-11-01 Citrix Systems, Inc. Resource link engine
US11907232B2 (en) * 2021-01-12 2024-02-20 Adobe Inc. Facilitating efficient identification of relevant data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100023506A1 (en) * 2008-07-22 2010-01-28 Yahoo! Inc. Augmenting online content with additional content relevant to user interests

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7567958B1 (en) * 2000-04-04 2009-07-28 Aol, Llc Filtering system for providing personalized information in the absence of negative data
US9141704B2 (en) * 2006-06-28 2015-09-22 Microsoft Technology Licensing, Llc Data management in social networks
GB2471432A (en) 2008-04-03 2010-12-29 Icurrent Inc Information display system based on user profile data with assisted and explicit profile modification
US8224755B2 (en) * 2008-07-07 2012-07-17 International Business Machines Corporation Socially derived, graduated access control in collaboration environments
WO2010048430A2 (en) * 2008-10-22 2010-04-29 Fwix, Inc. System and method for identifying trends in web feeds collected from various content servers
WO2010144618A1 (en) * 2009-06-09 2010-12-16 Ebh Enterprises Inc. Methods, apparatus and software for analyzing the content of micro-blog messages
US8775605B2 (en) * 2009-09-29 2014-07-08 At&T Intellectual Property I, L.P. Method and apparatus to identify outliers in social networks
WO2011050495A1 (en) * 2009-10-29 2011-05-05 Google Inc. Ranking user generated web content
WO2011053830A2 (en) * 2009-10-30 2011-05-05 Google Inc. Social search engine
US8554854B2 (en) * 2009-12-11 2013-10-08 Citizennet Inc. Systems and methods for identifying terms relevant to web pages using social network messages
US9264329B2 (en) * 2010-03-05 2016-02-16 Evan V Chrapko Calculating trust scores based on social graph statistics
US8700642B2 (en) * 2010-03-22 2014-04-15 Microsoft Corporation Software agent for monitoring content relevance
US8666979B2 (en) * 2010-04-09 2014-03-04 Palo Alto Research Center Incorporated Recommending interesting content using messages containing URLs

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100023506A1 (en) * 2008-07-22 2010-01-28 Yahoo! Inc. Augmenting online content with additional content relevant to user interests

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CSNG200700420010; 深谷 雅志: '電子掲示板における行動履歴を用いたユーザにとって興味あるスレッドの推薦手法' 電子情報通信学会技術研究報告 Vol.106 No.410, 20061130, 149-154ページ, 社団法人電子情報通信学会 *
CSNJ201010047431; 青木 志門: '情報推薦のためのブログの活用法に関する研究' 第72回(平成22年)全国大会講演論文集(1) アーキテクチャ ソフトウェア科学・工学 データベース , 20100308, 1-889〜1-890ページ, 社団法人情報処理学会 *
JPN6014050982; 深谷 雅志: '電子掲示板における行動履歴を用いたユーザにとって興味あるスレッドの推薦手法' 電子情報通信学会技術研究報告 Vol.106 No.410, 20061130, 149-154ページ, 社団法人電子情報通信学会 *
JPN6014050984; 青木 志門: '情報推薦のためのブログの活用法に関する研究' 第72回(平成22年)全国大会講演論文集(1) アーキテクチャ ソフトウェア科学・工学 データベース , 20100308, 1-889〜1-890ページ, 社団法人情報処理学会 *
JPN7014003459; Jianshu Weng: 'TwitterRank: finding topic-sensitive influential twitterers' WSDM '10 Proceedings of the third ACM international conference on Web search and data mining , 20100204, 261-270ページ, ACM *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015529888A (ja) * 2012-07-10 2015-10-08 フェイスブック,インク. ソーシャルネットワーキングシステムにおけるスポンサ付き広告のランク付けおよび価格設定
US10565598B2 (en) 2012-07-10 2020-02-18 Facebook, Inc. Sponsored advertisement ranking and pricing in a social networking system
JPWO2014027415A1 (ja) * 2012-08-16 2016-07-25 株式会社Jx通信社 情報提供装置、情報提供方法、及びプログラム
JP2020086521A (ja) * 2018-11-15 2020-06-04 トヨタ自動車株式会社 情報提供装置、情報提供方法及びプログラム
JP7074031B2 (ja) 2018-11-15 2022-05-24 トヨタ自動車株式会社 情報提供装置、情報提供方法及びプログラム

Also Published As

Publication number Publication date
EP2375351A1 (en) 2011-10-12
EP2375351B1 (en) 2013-07-03
US8666979B2 (en) 2014-03-04
US20110252027A1 (en) 2011-10-13
JP5731250B2 (ja) 2015-06-10

Similar Documents

Publication Publication Date Title
JP5731250B2 (ja) 情報ストリーム中の興味深いコンテンツを推奨するためのシステムおよび方法
US9390144B2 (en) Objective and subjective ranking of comments
US9177063B2 (en) Endorsing search results
JP5281405B2 (ja) 表示のための高品質レビューの選択
US9454586B2 (en) System and method for customizing analytics based on users media affiliation status
US20130246440A1 (en) Processing a content item with regard to an event and a location
US20120284253A9 (en) System and method for query suggestion based on real-time content stream
US10311072B2 (en) System and method for metadata transfer among search entities
US20160253428A1 (en) Searching user-created finite keyword profiles based on one keyword and metadata filters and randomness
US10380121B2 (en) System and method for query temporality analysis
WO2012174174A2 (en) System and method for user preference augmentation through social network inner-circle knowledge discovery
JP2009098964A (ja) ネットワークサービスシステム、サーバ、方法及びプログラム
US20110313988A1 (en) System and method for search of sources and targets based on relative topicality specialization of the targets
Pak News organizations’ selective link sharing as gatekeeping: A structural topic model approach
JP2015005130A (ja) 文書投稿装置、方法及びプログラム
JP2020091539A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Vasconcelos et al. Popularity dynamics of foursquare micro-reviews

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140320

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150409

R150 Certificate of patent or registration of utility model

Ref document number: 5731250

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250