Patents

Search tools Text Classification Chemistry Measure Numbers Full documents Title Abstract Claims All Any Exact Not Add AND condition These CPCs and their children These exact CPCs Add AND condition
Exact Exact Batch Similar Substructure Substructure (SMARTS) Full documents Claims only Add AND condition
Add AND condition
Application Numbers Publication Numbers Either Add AND condition

情報を管理するための方法、コンピュータプログラム、記憶媒体及びシステム

Classifications

G06Q10/10 Office automation; Time management
View 2 more classifications

Landscapes

Show more

JP6167493B2

Japan

Other languages
English
Inventor
ワン・ジュヌ
内野 寛治
寛治 内野
Current Assignee
Fujitsu Ltd

Worldwide applications
2011 US 2012 JP

Application JP2012204477A events
2017-07-26
Application granted
Expired - Fee Related
Anticipated expiration

Description

本発明は、情報の管理及び情報に基づくソーシャルネットワークに関する。
この情報化時代において、情報を自由に、迅速に且つ容易に広げる個人の能力のため、容易に入手でき且つ部分的にアクセス可能な圧倒する情報量が存在する。しばしば、人々は特定の情報に関心を持ち、特定の情報を収集することがある。ある人物が収集した全ての情報を管理して収集し続けることがその人物にとって困難となるように、時間と共に、その人物が大量の情報を収集することはまれではない。
オンライン及びオフラインの両者で入手可能及びアクセス可能な圧倒する量の情報が存在する。情報は、様々な手段又はトピックに関連し、様々な構造で編成され、様々な媒体に記憶され、様々なフォーマットで提示される。それらの必要又は目的に依存して、人々は、「情報アイテム」とも呼ばれる特定の情報に関心をもち、特定の情報を収集する。これは、研究者、開発者、ライター等のような所定の分野に従事している人々にとって特に当てはまる。係る人々は、「ナレッジワーカ“knowledge worker”」と呼ばれる。ナレッジワーカは、比較的定期的に情報と相互作用(例えば論評、発信、収集、作成、公表等)する人々である。
ナレッジワーカのような人々は、特定の情報アイテムのパーソナルコレクションを維持するのを望む場合がある。ある人物の自身のコレクションにおける情報は、必要なときは何時でもコレクションにおける特定の情報アイテムを迅速且つ容易に探して取り出すことができるように、その人物にとって特に関心があるか又は有効である(たとえばその人物が従事しているか又は従事してきたプロジェクトに関連する情報)。しかし、時間とともに、ある人物は、コレクションにおいて特定の情報アイテムを発見することが困難となるように、彼又は彼女自身の情報のコレクションについて大量の情報を次第に収集する場合がある。
特定の実施の形態は、個々のナレッジワーカのような個々の人物に関連する情報のパーソナルコレクションを管理する。情報のパーソナルコレクションを有するそれぞれの人物にとって、情報プロファイルが構築され、情報プロファイルは、例えば限定することなしに、その人物が関心のある主題、分野又はトピック、その人物にとってどのようなタイプ又は特定の情報アイテムが比較的重要でないか、どの特定の情報アイテムが互いに類似又は関連しているか等を示す。コレクションにおける個々の情報アイテムは、ランク付け及びフィルタリングされ、コレクションを見ること及びコレクションにおける特定の情報アイテムを発見することがその人物にとって容易であるやり方で対応する人物に提示される。
さらに、特定の実施の形態は、情報のパーソナルコレクションを有する人の間で、情報に基づくソーシャルネットワークを確立する。社会的つながりは、同じ又は類似の情報アイテムの幾つかを収集する2人毎の間で存在する。さらに、より多くの情報アイテムが2人の人物により共通して収集されると、二人の間の社会的つながりが強くなり、逆に、二人の間の社会的つながりが強ければ、より多くの情報アイテムが2人の人物により共通して収集される。
情報の集合及び情報に基づくソーシャルネットワークを管理する例示的なシステムを示す図である。 ある人物の情報プロファイルを生成する例示的な方法を示す図である。 ある人物の情報のコレクションを多数のトピックにクラスラリングする例示的な方法を示す図である。 人の個人情報のプロファイルにおける例示的な進化の表示を例示する図である。 人のグループの間での情報に基づくソーシャルネットワークを推定する例示的な方法を例示する図である。 人の間での共通の関心の相関の幾つかの例を示す図である。 人の間での共通の関心の相関の幾つかの例を示す図である。 人の間での共通の関心の相関の幾つかの例を示す図である。 情報に基づくソーシャルネットワークの例示的な表現を例示する図である。 例示的なネットワーク環境を例示する図である。 例示的なコンピュータシステムを例示する図である。
図1は、情報コレクション及び情報に基づくソーシャルネットワークを管理する例示的なシステムを示す。特定の実施の形態では、ナレッジワーカのような個々の人物により収集される情報は、オンライン(例えばデジタルデータ)又はオフライン(例えば本、書類等)、パブリック(例えばInternetで入手可能な情報)、又はプライベート(例えば組織、施設又は企業内のイントラネットで入手可能な情報)で、様々な情報源110から到来する。例えば限定されるものではないが、情報源110のタイプは、ウェブサイト(例えばウェブページ又はポストに含まれるコンテンツ)、データベース(例えば記憶されている文書又はファイル)、電子メール、ショートメッセージ、データフィード、企業情報(例えば組織、施設又は企業に属する情報)を含む場合がある。この開示は、任意の適用可能なタイプの情報源を想定している。
それぞれの人物は、彼又は彼女自身の情報のパーソナルコレクションを有する。特定の人物“X”が与えられると、Xの情報のパーソナルコレクションにおける任意の数の情報源110から任意の数の情報アイテムが存在する。これらの情報アイテムは、Xである彼自身又は彼女自身により作成されるか(例えばXが情報の著者である)、又は他の人物により作成される。さらに、これらの情報アイテムは、Xである彼自身又は彼女自身により明示的に識別されるか、Xに関連するとして暗黙的に推定される。例えば、Xは、ウェブサイトにブックマークを施し(Xが関心を有する所定のコンテンツを含むウェブサイト)、オンラインディスカッション(例えば特定のトピックに関するメッセージ又はつぶやき)を追跡し、記事を掲載し、又は電子メールを送出する。ウェブページ、メッセージ、記事又は電子メールは、Xの明示的なアクションに基づいて、Xの情報のパーソナルコレクションに含まれる。別の例として、Xは、Xに関連すると考えられるため、(サーバログにより示される)ウェブサイトを訪問するか、又は、Xの情報のパーソナルコレクションに含まれる電子メール、データフィード(例えばウェブ、ニュース、RSS等)、ショートメッセージを受信する。特定の実施の形態では、ある人物の情報のパーソナルコレクションは、その人物のアクティビティ(例えばオンラインアクティビティ)、関心(例えば専門的又は個人的)、好み等を反映する。
特定の実施の形態では、情報プロファイルは、それぞれの人物について自動的に生成される(120)。特定の人物“X”が与えられると、Xについて生成された情報プロファイルは、例えば限定されるものではないが、どのタイプ又は特定の情報アイテムがXの情報のパーソナルコレクションに含まれるか、Xに対するそれらの重要度の程度、互いに類似度又は相違の程度等のような、Xの情報のパーソナルコレクションを表す。
特定の実施の形態では、情報に基づくソーシャルネットワークは、情報のパーソナルコレクションをそれぞれ有する人のグループの間で自動的に推定される(130)。社会的つながりは、それぞれの情報のパーソナルコレクションにおける1以上の同じ又は類似の情報アイテムを有する2人の人物間で存在する。さらに、2人の人物がそれらそれぞれの情報のパーソナルコレクションにおいて有する同じ又は類似の情報アイテムが多くなると、2人の人物間の社会的つながりが強くなり、逆に、2人の人物間の社会的つながりが強いと、2人の人物がそれらそれぞれの情報のパーソナルコレクションにおいて有する同じ又は類似の情報アイテムが多い。
情報プロファイルの生成120及び情報に基づくソーシャルネットワークの推定130は、コンピュータソフトウェア、ハードウェア又はそれらの組み合わせとしてそれぞれ実現され、様々な機能を実現する任意の数のモジュール又はコンポーネントをそれぞれ含む。その情報プロファイルがコンピュータで実現されるシステムにより自動的に生成される人物は、システムの「ユーザ」と呼ばれる場合がある。従って、情報に基づくソーシャルネットワークは、ユーザのグループの間で推定され、それぞれ彼又は彼女の個人情報のプロファイルを有する。
図2は、ある人物の情報プロファイルを自動的に生成する例示的な方法を示す。図2におけるステップは、それぞれの人物について異なる情報プロファイルを生成するために多数の人物に同様に適用される場合がある。特定の人物“X”が与えられると、Xに関連するか又はXの個人に関すると考えられる様々なタイプの情報が存在する。情報は、様々な情報源(例えばInternet、イントラネット、サーバ、データベース等)からであり、様々な形式(例えばウェブページ、電子メール、ショートメッセージ、ポスト等)を有する。どのような特定の情報がある人物(例えばX)にとって関連するか又はX個人に関すると考慮されるかは、例えば限定されるものではないが、特定の情報に彼又は彼女が関心があることを明示的に示すその人物自身のアクション、又は情報がその人物に関連することを暗黙に示唆する特定の情報の性質又は特性のような様々な要素に依存する。
特定の実施の形態は、STEP210に示されるように、様々な適用可能な情報源からXに関連するか又はX個人に関するものであると考えられる特定の情報を表すデータを取得する。異なるタイプの情報データを取得する異なるやり方が存在する。例えば、コンピュータソフトウェアとして実現されるウェブクローラは、Xによりブックマークされたか又は最近訪問された全てのウェブページを検索するために、Internet又はイントラネットをクロールする。(Xにより送出されたか又はXに送出された)Xの電子メールは、Xの電子メールアカウントのそれぞれから取得される。Xのショートメッセージは、Xの携帯電話から取得される。Xのオンラインポストは、Xのオンラインアカウントのそれぞれから取得される。
特定の実施の形態は、STEP220に示されるように、取得された情報データを掃除し、取得された情報データから特定の情報アイテムを抽出し、所定の情報アイテムを集合させる。特定の実施の形態では、それぞれの情報は、任意の数の言葉を含むテキスト(例えば文書)の集合である。それぞれの言葉は、任意の単語を含む場合がある。取得された情報データにおいて雑音又は無関係のデータが存在する場合がある。係る雑音は、関連するコンテンツのみが抽出されるように、取得された情報データが掃除されたときに除かれ、廃棄される。例えばウェブページは、そのメインコンテンツに加えて、広告を含む場合がある。ウェブページが清掃され、ウェブページのメインコンテンツのみが抽出されるときに、広告は除去されて廃棄される場合がある。
特定の実施の形態は、それぞれのテキストのコレクション(例えば文書)における個々の言葉に索引を付す。索引付けは、文書における特定の言葉をサーチするために使用される。例えば、文書における言葉は、判定された索引付けを使用して索引付けされる場合がある。この開示は、任意の適用可能な索引付けアルゴリズムを想定する。さらに、特定の実施の形態は、それぞれの文書に関連するメタデータ(例えばタイトル、タイムスタンプ、地理的位置等)を抽出して分析する。
Xについてこのように取得された情報のコレクション(例えば文書のコレクション)が与えられると、特定の実施の形態は、個々の情報アイテムを特定のトピック又は情報の集団にクラスタリングする場合がある。図3は、ある人物(例えばX)の情報のコレクションを多数の情報トピック又はクラスタリングに自動的にクラスタリングする例示的な方法を示す。Xの情報のパーソナルコレクションにおいて任意の数の情報アイテムが存在し、任意の数の情報トピック又は集団にクラスタリングされる場合がある。特定の実施の形態では、それぞれの情報は、文書として表されるテキストの集合である。それぞれの文書は、任意の数の言葉を含み、それぞれの言葉は、任意の数の単語を含む。
Xの情報のコレクションにおいて全体でN個の文書が存在するとする。特定の実施の形態は、STEP310に示されるように、コレクションにおいて、それぞれの文書dについて重要度のスコアiScoreを決定する。ある文書の重要度のスコアは、その文書の内容のXに対する重要度を示す。それぞれの文書の重要度のスコアは、例えば限定されるものではないが、そのコンテンツ、情報源、タイプ、最近であること、原作者、又は普及のような様々な要素に基づいて決定される。この開示は、適用可能な要素を想定している、また、Xは、(特定のタイプの文書又は特定の情報源からの文書について)デフォルトのスコア値を提供する。例えば、Xは、1つの特定の情報源から取得された文書は、比較液高い重要度を受けるべきであることを指定する。これは、この情報源は、正確且つ信頼できる情報又はXが特に関心を有する情報を提供することが知られているからである。他方で、別の情報源から取得された文書は、比較的低い重要度のスコアを受けるべきである。これは、この第二の情報源は、不正確な情報又はXが特に関心のない情報を提供することがあるからである。別の例として、新たな情報は、より最新であるので、古い情報よりも高い重要度のスコアを受ける場合がある。第三の例として、所定のタイプの情報(例えばXに送出された個人の電子メール又はメッセージ、或いはXにより加入されているRSSフィード)は、他のタイプの情報(例えばInternetからダウンロードされたウェブページ)よりも高い重要度のスコアを受ける。
個々の文書について重要度のスコアの計算を更に説明するため、以下の2つの例を考える。はじめに、Xの情報のコレクションに含まれる、Xの電子メールアカウントから取得された多数の電子メールが存在すると仮定する。幾つかの実現では、ある会話に属する電子メール(Xと1以上の他の人物との間でやり取りされる一連の電子メール)は、いずれかの会話に従事しない電子メールよりも高い重要度を受ける場合がある。幾つかの実現では、特定の会話に属するそれぞれの電子メールの重要度のスコアは、以下のように計算される。
Figure 0006167493
この場合、fWは、(例えばXによる)電子メールに割り当てられるデフォルトの重み要素であり、Nconversationは、特定の会話における電子メールの全体数であり、Mは、(例えばXにより設定される)予め決定された定数である。
第二に、Xの情報のコレクションに含まれる、Internetの様々なウェブサイトから取得される多数のオンラインコンテンツ(例えばウェブページ、ポスト等)が存在すると仮定する。幾つかの実現では、Xである彼自身又は彼女自身により作成されたコンテンツは、他の人物により作成されたコンテンツよりも重要である。Xによりブックマークされたコンテンツは、(例えばクリックされたがブックマークされていない)単に閲覧されたコンテンツよりも重要である。メインストリームメディアからのコンテンツは、個人のブログ又はフォーラムからのコンテンツよりも重要である。幾つかの実現では、それぞれのオンラインコンテンツの最終的な重要度のスコアは、コンテンツが検索される情報源のXにとっての重要度を示す情報源の重要度のスコアiScoresource、コンテンツのタイプのXにとっての重要度を示すタイプの重要度のスコアiScoretype、同じ情報源から検索されたコンテンツの量を示すボリュームの重要度のスコアiScorevolumeのような幾つかの中間の重要度のスコアに依存する。それぞれのオンラインコンテンツの重要度のスコアは、以下のように計算される。
Figure 0006167493
ボリュームの重要度のスコアは、以下のように計算される。
Figure 0006167493
この場合、volumeは、このコンテンツが検索された同じ情報源から検索されたコンテンツの全体数であり、Kは、必要とされるときにボリュームの重要度を調節するために使用される定数である。
特定の実施の形態は、STEP320に示される、Xの情報のコレクションにおける、それぞれの文書dについての、ベクトル空間モデル(VSM)
(外1)
Figure 0006167493
を構築する。ベクトル空間モデルは、用語「ベクトルモデル」とも呼ばれ、索引の言葉のような、識別子のベクトルとして、テキスト文書のようなオブジェクトを表す代数モデルである。ベクトル空間モデルは、情報フィルタリング、検索、インデックス、又は関連性のランク付けのために使用されることがある。特定の実施の形態では、Xの情報のコレクションにおけるそれぞれの情報は、任意の数の固有の言葉を含む文書として表される。なお、特定の言葉は、同じ文書に任意の回数で現れる場合がある。幾つかの実現では、それぞれの文書のベクトル空間モデルは、以下に定義される。
Figure 0006167493
それぞれのtiは、この文書(ベクトル空間モデルが構築された現在の文書)において発見される固有の言葉であり、wiは、tiに関連する重みであり、nは、この文書において発見される固有の言葉の全体の数(すなわち1≦i≦n)である。それぞれの言葉に関連する重みは、以下のように計算される。
Figure 0006167493
この場合、Nは、Xの情報のコレクションにおける文書の全体の数であり、ftは、「言葉の頻度」と呼ばれ、この文書(ベクトル空間モデルが構築された現在の文書)において関連する言葉が発見される全体の回数であり、fdは、「文書の頻度」と呼ばれ、関連する言葉を含むXの情報のコレクションにおける文書の全体数である。
特定の実施の形態は、STEP330に示されるように、その文書の重要度のスコアに基づいて、Xの情報のコレクションにおける、それぞれの文書dのベクトル空間モデルを調節する。幾つかの実現では、それぞれの文書のベクトル空間モデルは、以下のように調節される。
Figure 0006167493
この場合、
(外2)
Figure 0006167493
は、この文書の調節されたベクトル空間モデルであり、それぞれのtiは、この文書において発見された固有の言葉であり、w’iは、tiに関連する調節された重みであり(例えばw’i=iScore×wi)、nは、この文書において発見される固有の言葉の全体数である。
特定の実施の形態は、STEP340に示されるように、それぞれの調節されたベクトル空間モデルを使用して、Xの情報のコレクションにおける2つの文書間の類似度を計算する。幾つかの実現では、調節されたベクトル空間モデル
(外3)
Figure 0006167493
をそれぞれ有する2つの文書d1及びd2が与えられた場合、2つの文書間の類似度は、以下のように計算される。
Figure 0006167493
この場合、n1及びn2は、d1及びd2のそれぞれにおける固有の言葉の全体数であり、それぞれのw’iは、
(外4)
Figure 0006167493
からの調節された重みであり、それぞれのw’jは、
(外5)
Figure 0006167493
からの調節された重みである。
特定の実施の形態は、STEP350に示されるように、それらのそれぞれの類似度に基づいてXの情報のコレクションを多数のトピックにクラスタリングする。それぞれのトピックは、特定の主題である。例えば、あるトピックはスポーツに関連し、別のトピックは、旅行に関連し、第三のトピックは、コンピュータプログラミングに関連する。それらの類似度の値により示されたとき、類似の文書は、同じトピックに割り当てられる。幾つかの実現において、(例えば式(4B)を使用して計算されたとき)2つの文書間の類似度の値が類似度の閾値を超えるときに、2つの文書が同じトピックに割り当てられ、さもなければこれらは異なるトピックに割り当てられるように、類似度の閾値が使用される。類似度の閾値は、クラスタリングの粒状度を制御するために選択される。例えば、スポーツに関連する全ての文書は、単一のトピックに割り当てられる。代替的に、チームスポーツ(例えばベースボール、バスケットボール、フットボール等)に関連する文書は、あるトピックに割り当てられ、個人のスポーツ(例えばテニス、ゴルフ、ボクシング等)に関連する文書は、別のトピックに割り当てられる。代替的に、それぞれのタイプのスポーツに関連する文書は、個別のトピックに割り当てられる。典型的に、高い類似度の閾値により、より粒状度の高いクラスタリングとなり、低い類似度の閾値により、より粒状度の低いクラスタリングとなる。
特定の実施の形態は、それぞれのトピック又はクラスタについて重心(セントロイド)及び1以上のキーワードを決定する。特定のトピック又はクラスタが与えられると、クラスタにおける全ての文書を表すためにその重心が使用され、そのキーワードは、クラスタにおける文書の内容を記述する。クラスタの分析又はクラスタリングの文脈において、文書のクラスタの重心は、クラスタの文書の中心又は平均である。
特定の実施の形態は、STEP240に示されるように、トピックをランク付けすることである。ランク付けは、Xがより関心のあるトピックがXが関心のないトピックよりも高くランク付けされるように、Xの個人の関心に基づく。特定の実施の形態は、文書のクラスタリングの間に発見される、それぞれのトピックTについて、ランク付けのスコアrScoreを決定する。特定のトピックのランク付けのスコアは、そのトピックの内容及び時間の両者に基づいて、そのトピックにおけるXの個人の関心を測定する。これは、ある人物の個人の関心は、時間につれて変化することがあるからである。従って、ランク付けのスコアは、「関心のスコア」と呼ばれる。これは、特定のトピックのランク付けのスコアは、Xがそのトピックにおいて有する関心のレベル又は強さを測定するからである。
幾つかの実現では、それぞれのトピックのランク付けのスコアは、以下のように定義される。
Figure 0006167493
この場合、λは、時間の影響を調節する定数要素であり、Mは、トピック又はクラスタの全体の数であり、Nは、このトピック又はクラスタ(すなわち、ランク付けスコアが計算された現在のトピック又はクラスタ)における文書の全体の数であり、tは現在の時間であり、tjは、このトピック又はクラスタ(すなわち、ランク付けスコアが計算された現在のトピック又はクラスタ)における文書jの時間である。
特定の実施の形態は、比較的高いランク付けスコアを有するトピックが比較的低いランキングスコアを有するトピックよりも高くランク付けされるように、それらそれぞれのランク付けスコアに基づいてトピック又はクラスタをランク付けする。個人の情報プロファイルは、STEP250に示されるように、ランク付けされたトピックに基づいてXについて生成される。次いで、トピックは、それらのランク付けスコアに基づいてXに提示される。幾つかの実現では、どのトピックがXにとって関心があり且つどのトピックがXにとって関心がないかを認識することがXにとって容易且つ直感的であるように、トピックは、(例えば色、サイズ、フォント、グラフィックス、配置、位置等を使用して)視覚的に区別される。例えば、トピックがランク付けされたリストで提示される場合、高くランク付けされたトピックは、低くランク付けされたトピックの前に提示される。トピックを区別するために色が使用される場合、高くランク付けされるトピックは、暗い色を使用して提示され、低くランク付けされるトピックは、明るい色を使用して提示される。トピックを区別するためにサイズが使用される場合、高くランク付けされるトピックは大きいサイズで提示され、低くランク付けされるトピックは、小さいサイズで提示される。
幾つかの実現では、異なる個人情報のプロファイルは、異なる時間でXについて生成され、アニメーション(例えば動画系列)は、時間を通してXの個人情報のプロファイルの進化又は変化を示すために使用される。例えば、Xが時間を通して絵画を学習するとき、Xが芸術に益々関心を持ち、芸術の歴史、芸術の技巧、芸術の鑑賞等に関する多くの情報を収集するとする。Xの個人の関心における進化は、時間を通して生成されるXの個人情報のプロファイルにおける進化において反映される。動画系列は、係る進化を示している。図4は、人物の個人情報のプロファイルにおける例となる進化の提示を示し、この場合、色は、個人の関心の強さ又はレベルに対応する。
特定の実施の形態は、STEP260で示されるように、Xの個人情報のプロファイルに基づいて、特定の情報アイテム(例えば文書)をXに推薦する。幾つかの実現では、特定の文書Aが入手可能であるとき、調節されたベクトル空間モデルがAについて構築され、Aが属するトピックは、Aの調節されたベクトル空間モデルに基づいて決定される。AがXが関心のあるトピック(例えば比較的高いランク付けスコアを有するトピック)に属する場合、AはXに推薦される。
個人情報のプロファイルをそれぞれ有する人のグループが与えられると、情報に基づくソーシャルネットワークが、グループにおける人物の間で自動的に推定される。一般に、ソーシャルネットワークは、個人又は組織のようなエンティティから構成される社会構造であり、エンティティは、友情関係、親族関係、共通の関心、金融取引、嫌悪、又は信頼関係、学問、又は名声のような、1以上のタイプの相互依存性又は関係により接続される。最近では、ソーシャルネットワークは、Internetを利用している。例えば、ソーシャルネットワーキングのウェブサイトの形式でInternetで存在するソーシャルネットワーキングシステムがある。係るソーシャルネットワーキングのウェブサイトは、それらのメンバが様々な社会的な活動を行うのを可能にする。
図5は、人物のグループの間の情報に基づくソーシャルネットワークを推定する例示的な方法を示す。それぞれの人物は、個人情報のプロファイルを有する。幾つかの実現では、ある人物の個人情報のプロファイルは、図3及び図4で示される方法を使用して自動的に生成される。上述されたように、ある人物の情報のプロファイルは、その人物により収集された文書をクラスタリングすることで発見又は形成された、多数のトピックを含む。重心は、そのトピックに属する文書の平均である、それぞれのトピックについて決定される。
そのグループにおける個人のそれぞれのペアについて、特定の実施の形態は、STEP510に示されるように、両方の個人により共通に関心のあるトピックを識別する。2人の特定の人物X及びYが与えられると、Xの個人情報のプロファイルが多数のトピックを含み、Yの個人情報のプロファイルが多数のトピックを含むとする。Xの個人情報のプロファイルにおけるトピックの数は、Yの個人情報のプロファイルにおけるトピックの数とは異なる。Xの個人情報のプロファイルからのトピックと、Yの個人情報のプロファイルからのトピックとからなる、トピックのそれぞれ固有のペアについて、特定の実施の形態は、2つのトピックの2つの重心間の距離を計算する。距離が十分に近い場合(例えば距離の閾値未満)、特定の実施の形態は、XとYがこのトピックのペアに関して共通の関心を共有するように、2つのトピックが同じであるか又は類似していることを考慮する。2人の人物は、任意の数の共通の関心のトピックを共有する場合がある。
1以上の共通の関心のトピックを共有する個人のそれぞれのペアについて、特定の実施の形態は、STEP520に示されるように、2人の個人間の共通の関心の相関を判定する。二人の個人(例えばX及びY)が共通の関心のトピックを共有するとき、それぞれの人物がトピックにおいて有する関心の強さ又はレベルは、同じであるか又は異なる場合がある。例えばX及びYが共に芸術に関心があるが、Xは芸術に非常に関心があり(Xが積極的に絵画を学んでいる)、Yは控えめに芸術に関心がある。他方で、X及びYは、共にスポーツに非常に関心がある。上述されたように、ある人物の情報のプロファイルにおけるそれぞれのトピックは、ランク付け又は関心のスコアrScoreを有し、このスコアは、そのトピックにおいてその人物が有する関心の強さ又はレベルを示す。したがって、X及びYにより共有される共通の関心のトピックが与えられると、Xについてトピックの1つの関心のスコアと、Yについて同じトピックの別の関心のスコアが存在する。1つがX向けで1つがY向けであるこれら2つの関心のスコアは、類似しているか又は異なる場合がある。
例として、2人の人物X及びYが5つの共通の関心のトピックA,B,C,D及びEを共有する。図6A〜図6Cは、XとYとの間の異なる共通の関心の相関の幾つかの例を示す。図6Aに示される例では、X及びYにより共有される、5つの共通の関心のトピック(TOPIC)A,B,C,D及びEのそれぞれの、1つがX向けであり1つがY向けである、2つの関心のスコア(SCORE)は類似している。言い換えれば、X及びYは、これら5つの共通の関心のトピックを共有するだけでなく、X及びYがそれぞれのトピックにおいて有する関心のレベルも同様に類似している。従って、Xの情報の関心とYの情報の関心との間で比較的近い相関が存在する。図6Bに示される例では、X及びYにより共有される5つの共通の関心のトピックのそれぞれの、共通の1つがX向けであり1つがY向けである2つの関心のスコアは、XがYのスコアよりもそれぞれのトピックにおいて高い関心のスコアを有する点で類似していない。例えば、X及びYの両者がトピックAよりもトピックBにおいて高い関心があるとしても、トピックBについてXの関心のスコアは、トピックBについてYの関心のスコアよりも非常に高い。図6Cに示される例では、X及びYにより共有される5つの共通の関心のトピックのそれぞれの、1つがX向けであり1つがY向けである、2つの関心のスコアは、図6Bに示される例よりもなおされ類似していない。例えば、トピックBについて、Xは、高い関心のスコアを有し、Yは、低い関心のスコアを有する。他方で、トピックDについて、Xは、低い関心のスコアを有し、Yは、高い関心のスコアを有する。
幾つかの実現では、2人の個人(例えばX及びY)間で共有される共通の関心のトピックの相関は、相関係数ρX,Yを使用して測定され、以下のように定義される。
Figure 0006167493
この場合、nは、XとYの間で共有される共通の関心のトピックの全体の数であり、
(外6)
Figure 0006167493
は、Xについてn個の共通の関心のトピックの平均の関心のスコアであり、xiは、共通の関心のトピックiの関心のスコアであり、
(外7)
Figure 0006167493
は、Yについてn個の共通の関心のトピックの平均の関心のスコアであり、yiは、Yについて共通の関心のトピックiの関心のスコアである。
1以上の共通の関心のトピックを共有する個人のそれぞれのペアについて、特定の実施の形態は、STEP530で示される、2人の個人間での共通の関心の強さを決定する。1以上の共通の関心のトピックを共有する2人の個人(例えばX及びY)間で、共通の関心の強さは、(例えば情報に基づくソーシャルネットワークにおける)それらの接続の強さを測定する。幾つかの実現において、共通の関心のトピックを共有する二人の個人(例えばX及びY)間の接続の強さは、以下のように定義される。
Figure 0006167493
この場合、ρX,Yは、(例えば式(6)により定義される)XとYの間の相関係数であり、nは、XとYとの間で共有される共通の関心のトピックの全体の数であり、xiは、Xについて共通の関心のトピックiの関心のスコアであり、yiは、Yについて共通の関心のトピックiの関心のスコアである。式(7)の第二の項は、n個の共通の関心のトピックにおけるそれらの関心のレベルにおけるXとYとの間の差を示す。
特定の実施の形態は、STEP540に示されるように、人物のグループの間で情報に基づくソーシャルネットワークを形成する。社会的つながりは、1以上の共通の関心のトピックを共有する各2人の個人間で確立される。さらに、1以上の共通の関心のトピックを共有する二人の個人間のつながりの強さは、式(6)及び(7)を使用して決定される。図7は、情報に基づくソーシャルネットワークの一部の例示的な表現を示す。あるラインは、2人が少なくとも1つの共通の関心のトピックを共有する場合に2人(例えば2ユーザ)を接続する。それぞれのラインの厚さは、(例えばラインが太くなると、つながりが強いといった)二人の間のつながりの強さを示す。
多くの情報は、係る情報に基づくソーシャルネットワークを分析することから決定される。例えば、全てのトピックの平均の重心は、それぞれの人物について計算され、視覚的に表現される(例えば2次元マップに投影される)。ソーシャルネットワークにおけるそれぞれの人物は、彼又は彼女の情報プロファイルに関連する。二人の間のそれぞれのつながりは、それらの間で共有される共通の関心のトピックと関連される。
ソーシャルネットワーク内の個人は、STEP550に示されるように、互いに情報をやり取りして情報を共有する。例えば、その人物と同じ情報の関心を共有する他の人々の特定の人物に対して推薦が行われる。情報は、容易に、簡単に勝つ自由にやり取りされ、類似の関心を共有する個人の間で共有される。ある人物は、その進行を追跡するためにトピック又は別の人物を選択する場合がある。個人又はトピックがランク付けされる場合がある。
特定の実施の形態は、ネットワーク環境で実現される。図8は、例示的なネットワーク環境800を示す。ネットワーク環境800は、1以上のサーバ820及び1以上のクライアント830を互いに結合するネットワーク810を含む。特定の実施の形態では、ネットワーク810は、イントラネット、エクストラネット、VPN(Virtual Private Network)、LAN(Local Area Network)、無線LAN(WLAN)、WAN(Wide Area Network)、MAN(Metropolitan Area Network)、Internetの一部、又は別のネットワーク810又は2以上の係るネットワーク810の組み合わせである。この開示は、任意の適切なネットワーク810を想定する。
1以上のリンク850は、サーバ820又はクライアント830をネットワーク810に結合する。特定の実施の形態では、1以上のリンク850のそれぞれは、1以上の有線、無線、又は光リンク850を含む。特定の実施の形態では、1以上のリンク850のそれぞれは、イントラネット、エクストラネット、VPN、LAN、WLAN、WAN、MAN、Internetの一部、又は別のリンク850又は2以上の係るリンク850の組み合わせを含む。この開示は、サーバ820及びクライアント830をネットワーク810に結合する何れかの適切なリンク850を想定する。
特定の実施の形態では、それぞれのサーバ820は、単一のサーバであるか、複数のコンピュータ又はデータセンタに及ぶ分散サーバである。サーバ820は、例えば限定されることなしに、ウェブサーバ、ニュースサーバ、メイルサーバ、メッセージサーバ、広告サーバ、ファイルサーバ、アプリケーションサーバ、交換サーバ、データベースサーバ、又はプロキシサーバのような様々なタイプからなる。特定の実施の形態では、それぞれのサーバ820は、ハードウェア、ソフトウェア、又は埋め込みロジックコンポーネント、又はサーバ820により実現又はサポートされる適切な機能を実行する2以上の係るコンポーネントの組み合わせを含む。例えば、ウェブサーバは、ウェブページ又はウェブページの特定のエレメントを含むウェブサイトを主催可能である。より詳細には、ウェブサーバは、HTMLファイル又は他のファイルタイプを主催するか、又は要求に応じてファイルを動的に作成又は構成し、それらをHTTP又はクライアント830からの他の要求に応じてクライアント830に伝達する。メイルサーバは、電子メールサービスを様々なクライアント830に提供可能である。データベースサーバは、1以上のデータストアに記憶されるデータを管理するインタフェースを一般に提供可能である。特定の実施の形態では、情報プロファイルジェネレータ822は、(例えばコンピュータソフトウェア、ハードウェア、又はこれらの組み合わせといった)1以上のサーバ820で実現される。さらに、情報に基づくソーシャルネットワーキングシステム824(例えばソーシャルネットワーキングウェブサイトとして実現される)は、1以上のサーバ820で主催される。
特定の実施の形態では、1以上のデータストレージ840は、1以上のリンク850を介して1以上のサーバ820に通信可能に接続される。特定の実施の形態では、データストレージ840は、様々なタイプの情報を記憶するために使用される。特定の実施の形態では、データストレージ840に記憶される情報は、特定のデータ構造に従って編成される。特定の実施の形態では、それぞれのデータストレージ840は、リレーショナルデータベースである。特定の実施の形態は、サーバ820又はクライアント830が、データストレージ840に記憶される情報を管理、例えば検索、変更、追加、又は削除するのを可能にするインタフェースを提供する。特定の実施の形態は、データストレージ840における情報に基づくソーシャルネットワークに関連する情報と同様に、自動的に生成された情報プロファイルを記憶する。
特定の実施の形態では、それぞれのクライアント830は、ハードウェア、ソフトウェア、又は埋め込みロジックコンポーネント、又は22以上の係るコンポーネントの組み合わせであって、クライアント830により実現又はサポートされる適切な機能を実行可能な組み合わせを含む電子装置である。例えば限定することなしに、クライアント830は、デスクトップコンピュータシステム、ノートブックコンピュータシステム、ネットブックコンピュータシステム、ハンドヘルド電子装置、又は移動電話である。この開示は、任意の適切なクライアント830を想定している。クライアント830は、クライアント830でのネットワークユーザがネットワーク830にアクセスするのを可能にする。クライアント830は、そのユーザが、他のクライアント830での他のユーザと通信するのを可能にする。
クライアント830は、MICROSOFT INTERNET EXPLORER, GOOGLE CHROME又はMOZILLA FIREFOXのようなウェブブラウザ832を有し、1以上のアッドオン、プラグイン、又はTOOLBAR又はTAHOO TOOLBARのような他の拡張を有する。クライアント830でのユーザは、URL(Uniform Resource Locator)又はウェブブラウザ832をサーバ820に向ける他のアドレスを入力し、ウェブブラウザ832は、HTTP(Hyper Text Transfer Protocol)要求を生成し、HTTP要求をサーバ820に伝達する。サーバ820は、HTTP要求を受け、HTTP要求に応じて、クライアント830に1以上のHTML(Hyper Text Markup Language)ファイルを伝達する。クライアント830は、ユーザへの提示のため、サーバ820からのHTMLファイルに基づいてウェブページをレンダリングする。この開示は、適切なウェブページファイルを想定する。例として限定されるものでないが、ウェブページは、特定の必要に従って、HTMLファイル、XHTML(Extensible HTML)ファイル、又はXML(Extensible Markup Language)ファイルからレンダリングする。係るページは、例えば限定されるものではないが、JAVASCRIPT(登録商標)、 JAVA(登録商標)、 MICROSOFT、SILVERLIGHT、AJAX(Asynchronous JAVASCRIPT及びXML)等のようなマークアップ言語とスクリプトの組み合わせ、で書かれたもののようなスクリプトを実行する。ここで、ウェブページへの参照は、(ブラウザはウェブページをレンダリングするために使用する)1以上の対応するウェブページファイルを包含し、逆に、必要に応じて、1以上の対応するウェブページファイルを包含することは、ウェブページへの参照を含む。
特定の実施の形態は、1以上のコンピュータシステムで実現される。図9は、例示的なコンピュータシステムを示す。特定の実施の形態では、1以上のコンピュータシステム900は、本実施の形態で記載又は図示される1以上の方法の1以上のステップを実行する。特定の実施の形態では、1以上のコンピュータシステム900は、本実施の形態で記載又は図示される機能を提供する。特定の実施の形態では、1以上のコンピュータシステム900で実行しているソフトウェアは、本実施の形態で記載又は図示される1以上の方法の1以上のステップを実行するか、又は本実施の形態で記載又は図示される機能を提供する。特定の実施の形態は、1以上のコンピュータシステム900の1以上の部分を含む。
この開示は、適切な数のコンピュータシステム900を想定している。この開示は、適切な形式を取るコンピュータシステム900を想定している。例として限定されるものではないが、コンピュータシステム900は、埋め込みコンピュータシステム、システムオンチップ(SOC)、(例えばコンピュータオンモジュール(COM)又はシステムオンモジュール(SOM)のような)シンボルボードコンピュータシステム(SBC)、デスクトップコンピュータシステム、ラップトップ又はノートブックコンピュータシステム、インタラクティブキオスク、メインフレーム、コンピュータシステムのメッシュ、移動電話、パーソナルデジタルアシスタント(PDA)、サーバ、又はこれら2以上の組み合わせである。必要に応じて、コンピュータシステム900は、1以上のコンピュータシステム900を含み、単一であるか又は分散されており、複数の位置に及ぶか、複数のマシンに及ぶか、又は1以上のネットワークにおける1以上のクラウドコンポーネントを含むクラウドにある。必要に応じて、1以上のコンピュータシステム900は、実質的な空間又は時間の制限なしに、本実施の形態で記載又は図示された1以上の方法の1以上のステップを実行する。例として限定されるものではないが、1以上のコンピュータシステム900は、リアルタイムモード又はバッチモードで、異なる時間又は異なる場所で、本明細書で記載又は図示された1以上の方法の1以上のステップを実行する。
特定の実施の形態では、コンピュータシステム900は、プロセッサ902、メモリ904、ストレージ906、入力/出力(I/O)インタフェース908、通信インタフェース910及びバス912を含む。この開示は、特定のアレンジメントにおいて特定の数の特定のコンポーネントを有する特定のコンピュータシステムを記載及び図示しているが、この開示は、任意の適切なアレンジメントにおいて任意の適切な数の任意の適切なコンポーネントを有する任意の適切なコンピュータシステムを想定する。
特定の実施の形態では、プロセッサ902は、コンピュータプログラムを構成する命令を実行するハードウェアを含む。例として限定されるものではないが、命令を実行するため、プロセッサ902は、内部レジスタ、内部キャッシュ、メモリ904、又はストレージ906から命令を検索(又はフェッチ)し、それらをデコード及び実行し、次いで1以上の結果を内部レジスタ、内部キャッシュ、メモリ904又はストレージ906に書き込む。特定の実施の形態では、プロセッサ902は、データ、命令又はアドレス用の1以上の内部キャッシュを含む。この開示は、必要に応じて、任意の数の任意の適切な内部キャッシュを含むプロセッサ902を想定する。例として限定されるものではないが、プロセッサ902は、1以上の命令キャッシュ、1以上のデータキャッシュ、及び1以上のTLB(Translation Lookaside buffers)を含む。命令キャッシュにおける命令は、メモリ904又はストレージ906における命令のコピーであり、命令キャッシュは、プロセッサ902による命令の検索を高速にする。データキャッシュにおけるデータは、プロセッサ902が動作を実行する命令のためのメモリ904又はストレージ906におけるデータのコピー、プロセッサ902で実行する後続の命令によるアクセス、或いはメモリ904又はストレージ906への書込みのためにプロセッサ902で実行された前の命令の結果、或いは他の適切なデータである。データキャッシュは、プロセッサ902による読取り又は書込み動作を高速にする。TLBは、プロセッサ902の仮想アドレス変換を高速にする。特定の実施の形態では、プロセッサ902は、データ、命令又はアドレス向けの1以上の内部レジスタを含む。この開示は、必要に応じて、任意の適切な数の任意の適切な内部レジスタを含むプロセッサ902を想定する。必要に応じて、プロセッサ902は、1以上の算術論理ユニット(ALU)を含むか、マルチコアプロセッサを含むか、又は1以上のプロセッサ902を含む。この開示は、特定のプロセッサを記載及び例示するが、この開示は、任意の適切なプロセッサを想定する。
特定の実施の形態では、メモリ904は、プロセッサ902が実行する命令又はプロセッサ902が処理するデータを記憶するメインメモリを含む。例として限定されるものではないが、コンピュータシステム900は、ストレージ906又は(例えば別のコンピュータのような)別のソースからメモリ904に命令をロードする。次いで、プロセッサ902は、メモリ904からの命令を内部レジスタ又は内部キャッシュにロードする。命令を実行するため、プロセッサ902は、内部レジスタ又は内部キャッシュから命令を取得し、それらをデコードする。命令の実行の間又は命令の実行の後、プロセッサ902は、(中間結果又は最終結果である)1以上の結果を内部レジスタ又は内部キャッシュに書き込む。次いで、プロセッサ902は、1以上のこれらの結果をメモリ904に書き込む。特定の実施の形態では、プロセッサ902は、(ストレージ906又はその他とは対照的に)1以上の内部レジスタ又は内部キャッシュにおける命令或いはメモリ902における命令のみを実行し、(ストレージ906又はその他とは対照的に)1以上の内部レジスタ又は内部キャッシュにおけるデータでのみ動作する。(アドレスバス及びデータバスをそれぞれ有する)1以上のメモリバスは、プロセッサ902をメモリ904に結合する。バス912は、以下に記載されるように、1以上のメモリバスを含む。特定の実施の形態では、1以上のメモリ管理ユニット(MMU)は、プロセッサ902とメモリ904との間にあり、プロセッサ902により要求されたメモリ904へのアクセスを容易にする。特定の実施の形態では、メモリ904は、ランダムアクセスメモリ(RAM)を含む。このRAMは、必要に応じて、揮発性メモリである。必要に応じて、このRAMは、ダイナミックRAM(DRAM)であるか、スタティックRAM(SRAM)である。さらに、必要に応じて、このRAMは、シングルポートRAMであるか又はマルチポートRAMである。この開示は、任意の適切なRAMを想定している。メモリ904は、必要に応じて、1以上のメモリ904を含む。この開示は特定のメモリを記載及び図示しているが、この開示は、任意の適切なメモリを想定している。
特定の実施の形態では、ストレージ906は、データ又は命令の大容量記憶を含む。例として限定されるものではないが、ストレージ906は、HDD、フロッピー(登録商標)ディスクドライブ、フラッシュメモリ、光ディスク、光磁気ディスク、磁気テープ、又はUSB(Universal Serial Bus)ドライブ、又はこれら2以上の組み合わせを含む。ストレージ906は、必要に応じて、取り外し可能又は取り外し不可能(又は固定された)媒体を含む。ストレージ906は、必要に応じて、コンピュータシステム900の内部又は外部にある。特定の実施の形態では、ストレージ906は、不揮発性、固体メモリである。特定の実施の形態では、ストレージ906は、リードオンリメモリ(ROM)を含む。必要に応じて、このROMは、マスクプログラムROM、プログラマブルROM(PROM)、消去可能なPROM(EPROM)、電気的に消去可能なPROM(EEPROM)、電気的に変更可能なROM(EAROM)、フラッシュメモリ又はこれらの2以上の組み合わせである。この開示は、任意の適切な物理的形式を取る大容量記憶906を想定している。ストレージ906は、必要に応じて、プロセッサ902とストレージ906との間の通信を容易にする1以上のストレージコントロールを含む。必要に応じて、ストレージ906は、1以上のストレージ906を含む。個の開示は特定のストレージを記載及び例示しているが、この開示は、任意の適切なストレージを想定している。
特定の実施の形態では、I/Oインタフェース908は、コンピュータシステム900と1以上のI/O装置との間の通信用の1以上のインタフェースを提供するハードウェア、ソフトウェア、又は両者を含む。コンピュータシステム900は、必要に応じて、これらI/O装置の1以上を含む。これらI/O装置の1以上は、ある人物とコンピュータシステム900との間の通信を可能にする。例として限定されるものではないが、I/O装置は、キーボード、キーパッド、マイクロフォン、モニタ、マウス、プリンタ、スキャナ、スピーカ、スチルカメラ、スタイラス、タブレット、タッチスクリーン、トラックボール、ビデオカメラ、別の適切なI/O装置又はこれら2以上の組み合わせを含む。I/O装置は、1以上のセンサを含む。この開示は、任意の適切なI/O装置、及び任意の適切なI/O装置用の任意の適切なI/Oインタフェース908を想定している。必要に応じて、I/Oインタフェース908は、プロセッサ902がこれらI/O装置の1以上を駆動するのを可能にする1以上の装置又はソフトウェアドライバを含む。I/Oインタフェース908は、必要に応じて、1以上のI/Oインタフェース908を含む。この開示は、特定のI/Oインタフェースを記載及び例示しているが、この開示は、任意の適切なI/Oインタフェースを想定している。
特定の実施の形態では、通信インタフェース910は、コンピュータシステム900と
1以上の他のコンピュータシステム900又は1以上のネットワークとの間の(例えばパケットに基づく通信のような)通信用の1以上のインタフェースを提供するハードウェア、ソフトウェア、又は両者を含む。例として限定するものではないが、通信インタフェース910は、Eithernet又は他の有線に基づくネットワークと通信するコントローラ(NIC)又はネットワークアダプタを含むか、WI-FIネットワークのような無線ネットワークと通信する無線NIC(WNIC)又はワイヤレスアダプタを含む。この開示は、任意の適切なネットワーク及び任意の適切なネットワーク用の任意の適切な通信インタフェース910を想定している。例として限定するものではないが、コンピュータシステム900は、アドホックネットワーク、パーソナルエリアネットワーク(PAN)、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、メトロポリタンエリアネットワーク(MAN)、又はInternetの1以上の部分、或いはこれらの2以上の組み合わせと通信する。これらのネットワークの1以上のうちの1以上の部分は、有線又は無線である。例として、コンピュータシステム900は、(例えばBLUETOOTH WPANのような)無線PAN、WI-FIネットワーク、WI-MAXネットワーク、(GSM(登録商標)(Global System for Mobile Communication)ネットワークのような)携帯電話網、又は他の適切な無線ネットワーク或いはこれらの2以上の組み合わせと通信する。コンピュータシステム900は、必要に応じて、これらのネットワークの何れか向けの任意の適切な通信インタフェース910を含む。通信インタフェース910は、必要に応じて、1以上の通信インタフェース910を含む。この開示は、特定の通信インタフェースを記載及び図示しているが、この開示は、任意の適切な通信インタフェースを想定している。
特定の実施の形態では、バス912は、コンピュータシステム900のコンポーネントを互いに結合するハードウェア、ソフトウェア又は両者を含む。例として限定されるものではないが、バス912は、AGP(Accelerated Graphics Port)又は他のグラフィックスバス、EISA(Enhanced Industry Standard Architecture)バス、FSB(Front Side Bus)、HT(HYPERTRANSPORT)相互接続、ISA(Industry Standard Architecture)バス、INFINIBAND相互接続、LPC(Low-Pin-Count)バス、メモリバス、MCA(Micro Channel Architecture)バス、PCI(Peripheral Component Interconnect)バス、PCI-Express(PCIe)バス、又は別の適切なバス或いはこれらの2以上の組み合わせを含む。バス912は、必要に応じて、1以上のバス912を含む。この開示は特定のバスを記載及び図示しているが、この開示は、任意の適切なバス又は相互接続を想定している。例として限定するものではないが、コンピュータ読み取り可能な記録媒体は、必要に応じて、半導体に基づく又は他の集積回路(IC)(例えばFPGA(Field Programmable Gate Array)又は特定用途向けIC(ASIC))、ハードディスク、HDD、ハイブリッドハードドライブ(HHD)、光ディスク、光ディスクドライブ(ODD)、光磁気ディスク、光磁気ドライブ、フロッピーディスク、フロッピーディスクドライブ(FDD)、磁気テープ、ホログラフィック記録媒体、固体ドライブ(SSD)、RAMドライブ、SECURE DIGITALカード、SECURE DIGITALドライブ、又は別の適切なコンピュータ読み取り可能な記録媒体、或いはこれらの2以上の組み合わせを含む。ここで、コンピュータ読み取り可能な記録媒体の参照は、35 U.S.C.§101の下で特許の保護について適格でない媒体を排除する。ここで、コンピュータ読み取り可能な記録媒体は、35 U.S.C. §101の下で特許の保護について適格でない程度に、(電気信号又は電磁信号を伝搬するような)信号の伝送の一時的な形式を排除する。コンピュータ読み取り可能な一時的でない記録媒体は、揮発性、不揮発性、又は揮発性と不揮発性との組み合わせである。
この開示は、任意の適切な記憶を実現する1以上のコンピュータ読み取り可能な記録媒体を想定する。特定の実施の形態では、コンピュータ読み取り可能な記録媒体は、必要に応じて、(例えば1以上の内部レジスタ又はキャッシュのような)プロセッサ902の1以上の部分、メモリ904の1以上の部分、ストレージ906の1以上の部分、又はこれらの組み合わせを実現する。特定の実施の形態では、コンピュータ読み取り可能な記録媒体は、RAM又はROMを実現する。特定の実施の形態では、コンピュータ読み取り可能な記録媒体は、揮発性又は永続的なメモリを実現する。特定の実施の形態では、1以上のコンピュータ読み取り可能な記録媒体は、ソフトウェアを実施する。ここで、ソフトウェアへの参照は、1以上のアプリケーション、バイトコード、1以上のコンピュータプログラム、1以上の実行ファイル、1以上の命令、ロジック、マシンコード、1以上のスクリプト、又はソースコードを包含し、逆に、1以上のアプリケーション、バイトコード、1以上のコンピュータプログラム、1以上の実行ファイル、1以上の命令、ロジック、マシンコード、1以上のスクリプト、又はソースコードは、ソフトウェアに包含される。特定の実施の形態では、ソフトウェアは、1以上のアプリケーションプログラミングインタフェース(API)を含む。この開示は、任意の適切なプログラミング言語又はプログラミング言語の組み合わせで書かれているか又はさもなければ表現される任意の適切なソフトウェアを想定する。特定の実施の形態では、ソフトウェアは、ソースコード又はオブジェクトコードとして表現される。特定の実施の形態では、ソフトウェアは、例えばC、Perl、又はそれらの適切な拡張のような高水準のプログラミング言語で表現される。特定の実施の形態では、ソフトウェアは、アセンブリ言語(又はマシンコード)のような低水準のプログラミング言語で表現される。特定の実施の形態では、ソフトウェアは、JAVA(登録商標)、C、又はC++で表現される。特定の実施の形態では、ソフトウェアは、HTML(Hyper Text Markup Language)、XML(Extensible Markup Language)、又は他の適切なマークアップ言語で表現される。
ここで、「又は」は、明示的に示唆されないか又はコンテクストによ示されな限り、包括的であって限定的ではない。従って、ここで、「A又はB」は、明示的に示唆されないか又はコンテクストにより示されない限り、「A、B又は両者」を意味する。さらに、「及び」は、明示的に示唆されないか又はコンテクストにより示唆されない限り、共同(joint and several)である。従って、本実施の形態では、「A及びB」は、明示的に示唆されないか又はコンテクストにより示唆されない限り、「AとBが共同する」を意味する。
この開示は、当業者が理解するであろう例示的な実施の形態への全ての変形、置換、変更及び修正を包含する。同様に、必要に応じて、特許請求の範囲は、当業者が理解するであろう全ての変形、置換、変更及び修正を包含する。さらに、特許請求の範囲における特定の機能を実行するために適合される、構成される、可能である、設定される、可能にされる、動作可能である、動作する装置又はシステム、或いは装置又はシステムのコンポーネントへの参照は、装置、システム、コンポーネントが、特定の機能がアクチベートされたか否かに係らず、その装置、システム又はコンポーネントが適合される、構成される、可能である、設定される、可能にされる、動作可能である、動作する限り、オンにされるか又はロックが解除されることを包含する。
800:ネットワーク環境
810:ネットワーク
820:サーバ
822:プロファイルジェネレータ
824:ソーシャルネットワーキングシステム
830:クライアント
832:ウェブブラウザ
900:コンピュータシステム
902:プロセッサ
904:メモリ
906:ストレージ
908:I/Oインタフェース
910:通信インタフェース

Claims (16)
Hide Dependent

  1. 1以上のコンピュータ装置が実行する方法であって
    ユーザに関連する複数の情報アイテムのそれぞれの情報アイテムについて、ベクトル空間モデルを構築し、前記情報アイテムの重要度のスコアにより、前記ベクトル空間モデルを調節するステップであって、前記複数の情報アイテムの各々は単語の集合である文書として表現され、前記ベクトル空間モデルは、単語と当該単語に関連する重みとのペアが複数個含まれるように構成され、 前記重要度のスコアは前記情報アイテムの前記ユーザにとっての重要さの2値化されてないレベルを示し、当該ステップは、前記重要度のスコアを前記単語に関連する重みに乗算することにより、前記ベクトル空間モデルを調節する、ステップと、
    それぞれの情報アイテムの調節されたベクトル空間モデルを使用して、前記複数の情報アイテムを1以上の情報のトピックにクラスタリングするステップと、
    前記1以上の情報のトピックのそれぞれの情報のトピックについて、前記情報のトピックにおいて前記ユーザが有する関心のレベルを示す関心のスコアを決定するステップと、
    を含む方法。
  2. 前記複数の情報アイテムのそれぞれの情報アイテムについて、前記ユーザに関する前記重要度のスコアを決定するステップを更に含む、
    請求項1記載の方法。
  3. それぞれの情報アイテムの前記重要度のスコアは、現在の時間、前記ユーザにより設定されたスコア値、前記情報アイテムに関して前記ユーザにより行われたアクション、前記情報アイテムの時間、前記情報アイテムの内容、前記情報アイテムのタイプ、前記情報アイテムの情報源、前記情報アイテムの情報源からの情報アイテムのボリューム、の1以上に基づいて決定される、
    請求項2記載の方法。
  4. 前記複数の情報アイテムを前記1以上の情報のトピックにクラスタリングするステップは、前記複数の情報アイテムにおけるそれぞれ2つの情報アイテムについて、
    それらのそれぞれの調節されたベクトル空間モデルに基づいて、2つの情報アイテム間の類似の程度を決定するステップと、
    前記類似の程度が類似の閾値を満たす場合、前記2つの情報アイテムを同じ情報トピックにグループ化するステップと、
    前記類似の程度が前記類似の閾値を満たさない場合、前記2つの情報アイテムを2つの異なる情報のトピックに分離するステップと、
    を含む請求項1記載の方法。
  5. 前記それぞれの情報のトピックの関心のスコアは、時間に影響を及ぼす要素、情報のトピックの全体の数、前記情報のトピックにおける情報アイテムの全体の数、現在の時間、及び前記情報のトピックにおけるそれぞれの情報アイテムの時間に基づいて決定される、
    請求項1記載の方法。
  6. それぞれの情報のトピックの関心のスコアに基づいて前記1以上の情報のトピックをランク付けするステップを更に含む、
    請求項1記載の方法。
  7. 前記1以上の情報のトピックのそれぞれの情報のトピックについて、前記情報のトピックにクラスタリングされる全ての情報アイテムの平均である重心を決定するステップを更に含む、
    請求項1記載の方法。
  8. 前記複数の情報アイテムは、前記ユーザにより収集される、
    請求項1記載の方法。
  9. 更なる情報アイテムを受信するステップと、
    前記更なる情報アイテムが前記1以上の情報のトピックのうちのどのトピックに属するかを判定するステップと、
    前記更なる情報アイテムが属する情報のトピックの前記関心のスコアに基づいて、前記更なる情報アイテムを前記ユーザに推薦すべきかを決定するステップと、
    を更に含む請求項1記載の方法。
  10. 請求項1に記載の方法であって、
    複数のユーザのうちの二人のユーザのペアそれぞれについて、それぞれのユーザが関心をもつ前記の1以上の情報のトピックを含むそれぞれのユーザの情報プロファイルと、前記ユーザが前記情報のトピックにおいて有する関心のレベルを示すそれぞれの情報のトピックの関心のスコアとに基づいて前記二人のユーザが共通の関心の情報のトピックを共有しているかを判定するステップと、
    少なくとも1つの共通の関心の情報のトピックを共有する前記複数のユーザのうちのそれぞれ二人のユーザの間のつながりを確立することで、前記複数のユーザの間で社会的つながりを推定するステップと、
    を含む方法。
  11. 少なくとも1つの共通の関心の情報のトピックを共有するそれぞれ2つのユーザについて、第一のユーザからの前記少なくとも1つの共通の関心の情報のトピックの平均の関心のスコア、第二のユーザからの前記少なくとも1つの共通の関心の情報のトピックの平均の関心のスコア、前記第一のユーザからの前記少なくとも1つの共通の関心の情報のトピックのそれぞれの関心のスコア、及び前記第二のユーザからの前記少なくとも1つの共通の関心の情報のトピックのそれぞれの関心のスコアに基づいて、相関係数を決定するステップを更に含む、
    請求項10記載の方法。
  12. 少なくとも1つの共通の関心の情報のトピックを共有するそれぞれ二人のユーザ間のつながりについて、前記二人のユーザの相関係数、前記第一のユーザからの前記少なくとも1つの共通の関心の情報のトピックのそれぞれの関心のスコア、及び前記第二のユーザからの前記少なくとも1つの共通の関心の情報のトピックのそれぞれの関心のスコアに基づいて、つながりの強さを決定するステップを更に含む、
    請求項11記載の方法。
  13. 前記複数のユーザのうちの特定のユーザ間の情報アイテムのやり取り及び共有を容易にするステップを更に含む、
    請求項10記載の方法。
  14. 1以上のプロセッサにより実行可能な命令を含むメモリと、
    前記メモリに結合され、前記命令を実行する前記1以上のプロセッサとを備えるシステムであって、
    前記命令は、請求項1ないし13のうち何れか1項に記載の方法を前記1以上のコンピュータ装置に実行させる、システム。
  15. 請求項1ないし13のうち何れか1項に記載の方法を前記1以上のコンピュータ装置に実行させるコンピュータプログラム。
  16. 請求項15に記載のコンピュータプログラムを記憶する記憶媒体。