JP2005251203A - 情報ノベルティ(novelty)と情報ダイナミックス(dynamics)の分析によってニュースフィード(newsfeeds)をパーソナライズ(personalizing)するための原理および方法 - Google Patents

情報ノベルティ(novelty)と情報ダイナミックス(dynamics)の分析によってニュースフィード(newsfeeds)をパーソナライズ(personalizing)するための原理および方法 Download PDF

Info

Publication number
JP2005251203A
JP2005251203A JP2005057282A JP2005057282A JP2005251203A JP 2005251203 A JP2005251203 A JP 2005251203A JP 2005057282 A JP2005057282 A JP 2005057282A JP 2005057282 A JP2005057282 A JP 2005057282A JP 2005251203 A JP2005251203 A JP 2005251203A
Authority
JP
Japan
Prior art keywords
information
news
novelty
articles
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005057282A
Other languages
English (en)
Other versions
JP2005251203A5 (ja
JP4845392B2 (ja
Inventor
Eric J Horvitz
ジェイ.ホルビッツ エリック
Evgeniy Gabrilovich
ガブリロビッチ イブジェニー
Susan T Dumais
ティー.ドメス スーザン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2005251203A publication Critical patent/JP2005251203A/ja
Publication of JP2005251203A5 publication Critical patent/JP2005251203A5/ja
Application granted granted Critical
Publication of JP4845392B2 publication Critical patent/JP4845392B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Abstract

【課題】 ニュースストーリーなど、時間的な情報ストリームを情報ノベルティの統計的測定によりフィルタリングするシステムおよび方法を提供すると。
【解決手段】 ユーザがすでに確認した情報に基づいて、個別仕様のカスタムニュースフィードまたは他の類の情報にさまざまな技術を適用できる。情報ノベルティを分析する方法と、ユーザがすでに確認したストーリーの文脈でストーリーのノベルティを識別することによって、ユーザ向けに情報をパーソナライズし、フィルタリングするシステムが提供される。このシステムには、記事を単語と名前付きのエンティティの集りとして表現するノベルティ分析アルゴリズムが採用されている。このアルゴリズムによって、情報が時間の経過とともに、記事から記事へ、および個々の記事内で、どのように進展するかを調査することにより、文書間および文書内のダイナミックスを分析する。
【選択図】 図3

Description

本発明は、一般にコンピュータシステムに関し、より詳細にはニュースなどの情報の時間的なストリームを情報ダイナミックスの自動分析によってパーソナライズするシステムおよび方法に関する。
ちょうど10年前に、ニュースフィードのように大規模な情報ストリームは、ニュースの提供を専門とする組織によって所有され、監視され、フィルタリングされていた。Webによって、ニュースフィードを管理し、関心のあるユーザ全員に周知させる上での課題や機会がもたらされてきた。「重要」な情報を見分けることは、Web検索やテキスト要約の研究において必須の要素であった。検索方法は、情報に関するユーザの強い要望を最大限に満たす文書集合を特定することに照準を合わせている。要約では、大量のテキストを簡潔な表現に圧縮しようとする。
従来の要約作業では、テキストに関連する深い意味を自動的に理解する方法がないので、通常は完結した文のレベルで機能し、最も典型的な文を組み合わせて文書の要約を作成してきた。検索と要約に関する研究では、時間の経過に伴って配信される情報コンテンツのダイナミックスをほとんど見落としてきた。
本発明のいくつかの態様について基本的な理解が得られるように、本発明の概要について以下に簡単に説明する。下記の説明は、本発明の概要を一般的に示すものではない。本発明の重要/不可欠な要素を特定したり、本発明の範囲を限定したりするものでもない。唯一の目的は、後述の実施形態に関する説明の準備として、本発明に関するいくつかの概念を簡潔に示すことである。
本発明は、情報ノベルティを特定し、時間の経過に伴って進展する情報コンテンツを管理するためにこれらの方法がどのように適用できるかについてのシステムおよび方法を提供する。文書の集合を比較する一般的なフレームワークが提供され、それによって文書がコンテンツまたはソースごとのグループに編成され、グループ間およびグループ内の相違点と共通点について分析されることが想定される。たとえば、並列する2つの文書グループは、同じトピックを扱っているが、異なるソースから発生している。つまり、世界のさまざまな地域で発生した事件に関するニュース報道によって、その状況に関する見解や全体的な解釈の興味深い相違点を明らかにすることができる。記事の静的な集合から時間の経過に伴って生成される集合に切り替えると、コンテンツの進展を調べることができる。たとえば、共通のストーリーに関するニュース記事のストリームを時間の経過に伴って調べ、真に有益な更新情報に注目し、主に「ほぼ同じ」内容を中継する大量の記事の一部を除外することができる。
複数の文書集合にわたって出現する単語に関する詳細な統計データを収集し、こうした集合間の相違点と類似点を明らかにできる。たとえば、人物、組織、地理的な場所の名前を表す名前付きエンティティを抽出することで、さまざまな単語モデルを強化できる。通常、十分な統計データがないために区別できる意味論的な特性のない句や連語とは異なり、名前付きエンティティは、多くの著者が一般的に使用する比較的安定したトークンを識別するので、これらの使用は、かなりの量の情報をもたらす。たとえば、提示されたある種の分析では、名前付きエンティティを使用して記事を表現する。分析は、ニュースまたは他のトピックのライブストリームに焦点を合わせることができる。ライブニュースストリームによって、興味をかき立てる問題や研究の機会が提示される。ニュースフィードは、膨大な量のデータに跨っており、豊富な評価や見解を表し、最新のニュースの短い更新からストーリーの進展に関する重要な要点(recaps)、何度となく報告される「同じ古い事実」の単なる繰り返しに至るまで、さまざまな形式やコンテンツを含んでいる。
追跡するストーリーに関する有意な更新を識別するアルゴリズムを開発できれば、ユーザは、さまざまなソースから配信される似かよった記事の膨大なリストをふるいにかける必要がなくなる。本発明によって提供される方法は、進展するニュースストーリーを追跡しようとするユーザに要求される時間と混乱を最小限に抑えるための、パーソナライズされたニュースポータルやニュースアラートサービスの基盤を提供する。
本発明は、情報を分析し、ユーザ向けにコンテンツをフィルタリングする構造上のさまざまなコンポーネントを提供する。まず、単語と認識された名前付きエンティティの分布を分析することによって、文書集合間の相違点を特定するためのフレームワークが提供される。このフレームワークは、個々の文書、文書集合、あるいは文書と文書集合(たとえば、特定のトピックに関する新しい記事と過去に確認された記事の集合)の比較に利用できる。第2に、ライブニュースストリーム(または他の時間的に進展するストリーム)を操作するアルゴリズムの集合によって、パーソナライズされたニュースがユーザに配信される。こうしたアルゴリズムは、News Junkie(ニュースジャンキー)と呼ばれるサンプルシステムに実装され、最大限に有益なニュースの更新情報を提供している。ユーザは、ユーザが定義した期間ごと、あるいはストーリーに関するレポートのバースト(burst)のたびに更新情報を要求できる。ユーザは、基本のストーリーに対するこうした更新の関連性を任意のレベルで調整できるので、関連のストーリーまたは類似のストーリーについてレポートする派生的な記事の配信が可能になる。さらに、1つのシード(seed)ストーリーとノベルティを評価するさまざまな測定基準によってランク付けされた記事の集合をユーザに提示し、シードストーリーのコンテキスト内でこうした集合のノベルティを加入者がどう認識するかを把握する方法も提供できる。
前述の目的と関連の目的を達成するために、ここで本発明の特定の例示的な態様について、以下の実施形態と添付の図面に関連付けながら説明する。このような態様は、本発明を実施できるさまざまな方法を示している。こうした方法は、すべて本発明の範囲に含まれるものとする。本発明のその他の利点と新しい機能は、以下に示す本発明の実施形態に添付の図面を関連付けて考察することで明らかになるであろう。
本発明は、情報ノベルティを識別し、時間の経過につれて進展する情報コンテンツを管理するシステムおよび方法に関する。1つの態様では、パーソナライズされた情報を配信するためのシステムが提供される。本システムは、2つ以上の情報アイテム間の相違点を特定するコンポーネントを備えている。アナライザは、特定された相違点に部分的に基づき、さらに情報アイテムに関連するデータが時間の経過とともに進展するにつれて、情報アイテムのサブセットを自動的に決定する。さまざまな方法も提供される。1つの態様において、パーソナライズされた情報を作成する方法には、さまざまな情報ソースから配信された文書を自動的に分析するステップと、その文書のノベルティを自動的に決定するステップとが含まれる。次に、文書のノベルティに基づいてパーソナライズされた情報フィードがユーザに提供される。
本発明のシステムおよび方法は、さまざまなアプリケーションに適用できる。現時点からの新近性(recency)の異なる期間にわたるトピックに関する現在未読のニュースストーリーを読むための理想的な読み込みシーケンスまたはパスの設計を支援するアプリケーションを含めてもよい。ニュースを理解する(catching up on)シーケンスを設計するために、アプリケーションは、最新のニュースと時間の経過に伴うニュースバーストを考慮し、読者がニュースストーリーの進展を理解し、重要な事件/更新情報によってストーリーの履歴をナビゲートするのを支援する。その他のアプリケーションには、タイムラインビューや時間におけるクラスタの概念のような他の表現などのさまざまな種類のディスプレイデザインおよびメタファーの開発が含まれる。トピック内の最新のニュースストーリーに関するデスクトップ設定およびモバイル設定の理想的なアラートに関して、1つのアプリケーションではユーザがトピックまたはキーワードを指定できるが、ユーザが読んでいるものに十分なノベルティがある場合にのみアラートを発行する。キーワードベースの方法では、キーワードに関連するニュースストーリーが表示される場合、情報ノベルティが十分に高いときにアラートが発行される。したがって、単純なキーワード中心のアラートスキーマより有益である。
本出願で使用する限り、「コンポーネント」、「オブジェクト」、「アナライザ」、「システム」などの用語は、コンピュータ関連のエンティティを表すものとし、ハードウェア、ハードウェアとソフトウェアの組み合わせ、ソフトウェア、実行中のソフトウェアのいずれでもよい。たとえば、コンポーネントは、プロセッサで実行する処理、プロセッサ、オブジェクト、実行可能ファイル、実行中のスレッド、プログラム、および/またはコンピュータのいずれでもよいが、これらに限定されない。たとえば、サーバー上で動作するアプリケーションとサーバーはいずれもコンポーネントと言える。実行中の処理および/またはスレッド内に1つまたは複数のコンポーネントが存在してもよい。また、コンポーネントは1台のコンピュータに集中、かつ/または2台またはそれ以上のコンピューに分散してもよい。さらに、こうしたコンポーネントは、さまざまなデータ構造を格納したさまざまなコンピュータ読み取り可能な媒体からも実行できる。コンポーネントは、ローカルプロセスおよび/またはリモートプロセスを介して、たとえば1つまたは複数のデータパケット(たとえば、ローカルシステム内、分散システム内の別のコンポーネント、および/またはインターネットのようにネットワークを経由した信号を介して他のシステムと対話するコンポーネントのデータ)を含む信号に従って通信できる。
まず図1を参照し、本発明の一態様による情報ダイナミックスシステム100を示す。本発明は、情報ノベルティを特定し、時間の経過に伴って進展する情報コンテンツを管理するためにこれらの方法がどのように適用できるかについてのシステムおよび方法を提供する。コンパレータ114を介して文書110の集合を比較する一般的なフレームワーク100が提供され、それによって文書がコンテンツまたはソース120ごとのグループに編成され、グループ間およびグループ内の相違点と共通点についてアナライザ130で分析する。たとえば、並列する2つ以上の文書またはファイルのグループは、同じトピックを扱っているが、2つの異なるソースから発生している。つまり、世界のさまざまな地域で発生した事件に関するニュース報道によって、その状況に関する見解や全体的な解釈の興味深い相違点を明らかにすることができる。記事の静的な集合から時間の経過に伴って生成される集合に切り替えると、コンテンツの進展を調べることができる。たとえば、共通のストーリーに関するニュース記事の流れを時間の経過に伴って調べ、真に有益な更新情報に注目し、アナライザ130と連動するフィルタ140を介して大量の記事の一部を除外し、150のパーソナライズされた情報を配信することができる。
複数の文書集合にわたって出現する単語に関する詳細な統計データを収集し、こうした集合間の相違点と類似点を明らかにできる。たとえば、人物、組織、地理的な場所の名前を表す名前付きエンティティを抽出することで、単語ベースのモデルを強化できる。通常、十分な統計データがないために区別できる意味論的なプロパティがない句や連語とは異なり、名前付きエンティティは、多くの著者が一般的に使用する比較的安定したトークンを識別するので、これらの使用は、大量の情報をもたらすことになる。提示された一種類の分析では、名前付きエンティティを使用して記事を表現する。分析は、ライブニュースストリーム、または他の時間的なデータストリームに照準を合わせてもよい。一例において、ニュースフィードは、膨大な量のデータにまたがっており、さまざまな評価や見解を表し、最新のニュースの短い更新からストーリーの進展に関する重要な要点や、何度となく報告される古い単なる事実の繰り返しに至るまで、さまざまな形式やコンテンツを含んでいる。
以下に詳説するアルゴリズムが、コンパレータ114、アナライザ130、および/またはフィルタ140に適用され、追跡するストーリーまたはストリームに関する更新を識別できるので、ユーザはさまざまなソースから配信される似かよった記事の膨大なリストをふるいにかける必要がなくなる。さまざまな方法によって、150で示すパーソナライズされたニュースポータルやニュースアラートサービスの基盤が提供される。こうしたサービスは、進展するストーリーを追跡しようとするユーザに対して時間と混乱を最小限に抑えようとするものである。本発明の1つの態様の例は、ニュースなどの情報の分析とフィルタリングに適用できるが、実質的に時間の経過に伴って進展するあらゆる情報ストリームを本発明によって処理できることを理解されたい。また、データは、ユーザのラップトップ、モバイル装置、デスクトップコンピュータなどのさまざまな情報ソースから収集でき、こうしたデータを(たとえば集中型サーバーに)キャッシングし、ユーザがすでに確認したデータに従って分析することができる。言うまでもないが、情報はたとえばインターネットまたは企業内部のイントラネットなどのローカルコンテキストなど、さまざまなソースから生成できる。
ここで図2を参照し、本発明の1つの態様に従ってテキストの集合を比較するためのフレームワーク210を示す。2つ以上のテキストコンテンツの集合が指定された場合、集合間の相違点を明らかにする方法を決定する必要がある。相違点の決定は、自動プロファイルやテキストの集合の比較、テキスト内に反映されるさまざまな見解、目的、関心の自動識別、新しい情報の自動識別を含むさまざまなアプリケーションに有益である。一般に、「相違点」のいくつかの側面は以下のように調査できる。
ブロック220における、コンテンツの相違は、いくつかの文書集合で特定の人物または事件についての記述形式の相違を識別することができる。たとえば、予め定義されたパーティションにおける相違点の分析について考察する。たとえば、さまざまな政治的問題に関する米国のレポートとヨーロッパのレポートの比較、あるいは米国東海岸と西海岸を基盤とするソースから発生するニュースで、東海岸の報道管制対象範囲の比較などがある。
ブロック230における、構造上の編成の相違は、テキストにとどまらず、Webサイトのリンク構造を考慮してもよい(たとえばIBM WebサイトとIntel Webサイトの比較)。
ブロック240における、時間の相違(すなわち、コンテンツの時間的な側面の相違)では、一連の文書における興味深いトピックの変化を表すことができる。この種の分析は、今日のニュースと1か月または1年前に配信されたニュースとの比較に使用され、サーチエンジンのクエリーログにおける時間の経過に伴う変化を追跡したり、ユーザの個人電子メールのトピックの時間的な変化を表したりできる。
時間的な相違には、ライブニュースフィードから発生するニュース記事(または他の種類の情報)の時間の経過に伴うノベルティの評価も自動的に含まれる。特に、以下の側面について考慮する。
ブロック250における、ニュースストーリーのノベルティの特徴付けによってニュース記事を順序付けることができるので、個々の記事は以前に読んだアイテムすなわち表示されたアイテム(の和集合)に最大限の情報を追加できる。
ブロック260における、トピックの進展が時間の経過に伴って分析される。これでニュース更新の重要性および妥当性を定量化できる。エンドユーザは、このようなパラメータを制御でき、パーソナライズされたニュースを受け取ることができる。
図3に、本発明の1つの態様に従ってノベルティを特徴付けるプロセスを表す方法300を示す。説明を簡単にするために、本方法は、一連の動作として図示され、説明されているが、本発明がこの動作の順序に限定されないことを理解されたい。たとえば、ある動作は、本発明に従って以下に説明するさまざまな順序で、かつ/またはここで図示され、説明される他の動作と同時に発生してもよい。たとえば、この図は相互に関連する一連の状態または事件としても(状態図のように)表現できることを当業者は理解されたい。また、本発明による方法を実装するために、図示されたすべての動作が必要なわけではない。
ブロック310に進むと、アルゴリズムのパフォーマンスを実現し、テストするためのさまざまなツールが開発されている。こうしたソフトウェアツール群の1つは「NewsJunkie(ニュースジャンキー)」と呼ばれ、アルゴリズムの集合と、テキストの集合を比較するための多くの視覚化オプションを実装している。NewsJunkieは、文書をテキストから抽出された名前付きエンティティによって強化された単語の集合として表す。このために、共通の抽出ツールを使用して人物、組織、地理的場所の名前を割り出した。
ブロック320において、文書内で比較する要素が特定される。一般に、文書グループは何らかの共通のプロパティを有する文書を含んでおり、基本的な比較の単位を構成する。こうした共通のプロパティの例には、特定のトピックまたはニュースのソース(たとえば、東海岸の通信社から発生する報道管制のストーリー)がある。グループごとにモデルを構築することによって文書グループ間の相違点について推論が導かれ、次に以下で説明するように類似性の測定基準を使用してモデルを比較する。さまざまなモデルの探索を容易にするために、NewsJunkieは文書の特徴(単語+名前付きエンティティ)をそのすべてにわたって平滑化した確率分布として、または重み付きの特徴(同じ特徴空間)のベクトルとして表す。重みは、一般的なTF.IDF関数ファミリによって割り当てられる。この種の関数では、1つの文書における用語の発生頻度と、全文書にわたる用語の発生頻度の逆数を表すコンポーネントを使用する。確率的な重み付け関数を使用してもよい。用語の重み付けの評価を改善するためのさまざまな平滑化オプションを実装してもよい。たとえば、一連のラプラスの法則、またはテキストの集合全体にわたって出現する単語の確率による線形平滑化などがある。後者のオプションは、以下に説明する実験全体を通じて使用された。システムには複数の平滑化オプションを実装できることに留意されたい。
図3のブロック330において、文書やテキストなどの情報アイテム間の相違点を明らかにするための類似性の測定基準が特定される。世界で興味深い何らかの事件が起こるという共通の状況が発生し、その事件をニュースメディアが取り上げる。公共の関心が非常に高い事件の場合は、その後の進展もニュースとして追跡する。ユーザは最初のレポートを読み、その後のある期間、そのストーリーの進展に遅れないことに関心を抱くと仮定する。数千のニュースソースを集約するインターネットサイトを前にして、ユーザの切実な情報探索の目標は、非常に熱心なニュースジャンキーでも読む時間をとれないほど大量の更新情報によってさまざまに達成できる。特定のトピックに関する大量の文書をふるいわけて真に新しい情報エレメントを識別する自動のツールは、大いに価値がある。
こうして、冗長性と重複を避けることでニュースストーリーの追跡に関連するオーバーヘッドを最小限に抑える一助となることができる。一般に、ニュースストーリーには、非常に高い冗長性が存在する。たとえば、新しい進展または調査結果が期待されるがまだ新しい情報を入手できない場合、通信社では新しい情報を入手できるまでの間、初期の進展の要点で穴を埋めることが多い。多くの通信社は、ロイターやAP通信社などの大きな多国籍コンテンツプロバイダからコンテンツの一部を取得するという事実によって、状況はさらに悪化する。ニュースサイトのユーザは、すべての情報を何度も繰り返して読みたくはない。ユーザは、基本的に新しい情報を得ることに関心を抱いている。したがって、ニュース記事をノベルティによって順序付けることは有益であると期待される。
ブロック330において、多くの文書の類似性の測定基準を用い、指定された文書集合(たとえば、以前に読んだ文書の和集合)から最もかけ離れた文書を識別できる。この場合、用語に関する距離の測定基準が定義され、文書集合から一般的に最もかけ離れた文書が求められているという事実が重視される。次のような距離測定基準を実装できる。
・ Kullback−Leibler(カルバックライブラー、KL)の発散(divergence)、古典的非対称情報理論の測定値である。文書dと文書集合R間の距離を計算すると仮定する。d(1つの文書)とR(文書集合)内の単語(およびある場合は名前付きエンティティ)の確率分布をそれぞれpおよびpで表記する。ここで
Figure 2005251203
が成り立つ。
ただし、
Figure 2005251203
を計算するには両方の分布が平滑化され、(dには出現するがRには出現しない単語、またはその逆に対応する)ゼロ値を緩和する必要があることに留意されたい。
・ Jensen−Shannon(JS)の発散、KLの発散の対称変形。前の項目の定義を使用して
Figure 2005251203
となる。ただし、
Figure 2005251203
である。
・ 生の確率のベクトルの余弦(計算には平滑化された確率を必要としない)。
・ TF.IDF機能による重み付きのベクトルの余弦。
・ 記事内にこれまでに検出されなかった名前付きエンティティの密度を測定するための数式化されたカスタム測定基準(NEと呼ぶ)。この測定基準の洞察(intuition)は、新しい情報が、人物、組織、および場所の名前などの新しい名前付きエンティティを導入することで伝わることが多いという推論に基づいている。NE測定基準は、次のように定義できる。NE(R)を、文書集合Rで検出される名前付きエンティティの集合とする。NE(R;R)を、文書集合Rでは検出されたが集合Rでは検出されない一意の名前付きエンティティの集合とする。つまり、
Figure 2005251203
である。したがって、distNE(d;R)=NEu(<d>,R)/length(d)となる。
文書の長さによる正規化は、通常、必須である。正規化しない場合、NEのスコアは、長さが増すほど高くなる傾向があるため、つまり長さは追加の名前付きエンティティが確認される確率に影響し、文書が長いほど多くの名前付きエンティティを含む確率が高くなるためである。
図3のブロック340において、距離の測定基準を用いてユーザに提示するノベルティの高い情報コンテンツを識別する。NewsJunkieアプリケーションでは、ノベルティのランク付けアルゴリズムを繰り返し使用して、読者が関心を持つ可能性のある小規模な記事集合を作成する。最長マッチを行う増分分析(greedy,incremental analysis)が採用されている。このアルゴリズムでは、まず入手できるほとんどすべての更新を、ユーザがすでに読んだシードストーリー(seed story)と比較し、最も類似性の低い記事を選択する。次に、この記事を(2つの文書を要素とするグループを形成)シードストーリーに追加し、こうした記事の組み合わせとの類似性が最も低い次の更新を探す。ランク付けアルゴリズムの擬似コードを以下のアルゴリズムRANKNEWSBYNOVELTYに概説する。
Algorithm RANKNEWSBYNOVELTY (dist, seed, D, n)
R ← seed // 初期化
for i = 1 to min(n, |D|) do
Figure 2005251203
R ← R∪{d};D ← D\{d}
ただし、distは距離の測定基準、seedはシードストーリー、Dは関連の更新の集合、nは選択する望ましい更新数、Rはノベルティによって順序付けされた記事のリストである。
前述のアルゴリズムと距離の測定基準を確認するために実験が行われ、被験者はさまざまな距離の測定基準によって順序付けられたニュース記事の集合を評価するように要求された。
ここで説明する実験では、4000以上のインターネットソースからニュース記事を集めるライブニュースフィードが使用された。他の任意のニュースまたはRSSフィードを使用できたが、Moreover Technologies社のニュースフィードが使用された。クラスタリングアルゴリズムを使用して、(続きのトピックと呼ばれる)同じ事件を扱ったストーリーを集めた。2003年9月中旬のニュースでレポートされたトピックに対応する12のクラスタが使用された。2〜9日間の期間にわたるニュースレポートを12のトピックで対応し、36から328の記事を示した。トピックには、シンガポールのSARSの新たな発生、カリフォルニア州知事のリコール、ローマ法王のスロバニア訪問などの報道が含まれる。
一般に、ノベルティの判断は、主観的な作業である。統計的に意味のある結果を得る1つの方法は、ユーザ集団の判断を平均することである。さまざまなノベルティのランク付けの測定基準を比較するために、異なる測定基準で順序付けられた複数の記事の集合を読み、どの集合が最もノベルティの高い情報を伝えているかを決定するように参加者に要求する。一般に、このシナリオでは評価者が読んだ記事を評価するまでそうした記事の集合のすべてを覚えている必要があることに留意されたい。よく知らないトピックに関するいくつもの集合の記事を覚えておくのは難しいので、実験は、次の3つの測定基準の評価に限定された。
1.魅力的な情報理論上の基盤(appealing information−theoretic basis)により、KL発散が選択された(KL)。
2.語学的に動機付けされた代替として、名前付きエンティティを数える測定基準が選択された(NE)。
3.記事の時系列の順序付けが、基準として用いられた(ORG)。
12のトピックの各々について、最初のストーリーをシードストーリーとして選択し、前述の3つの測定基準を用いて、アルゴリズムRANKNEWSBYNOVELTYを使用して、残りのストーリーをノベルティに関して順序付けた。このアルゴリズムでは、まずシードストーリーに対して最もノベルティの高い記事を選択する。さらに、この記事をシードストーリーに追加し、ユーザが知っている新しいモデルを形成し、次にノベルティの高い記事が選択される。こうして、3つの測定基準のそれぞれについて、また12トピックのそれぞれについて3つの記事が選択された。被験者は、まずトピックごとにシードストーリーを読んでトピックについての背景情報を取得するように要求された。次に、(各集合はいずれかの測定基準で選択された)3つの記事集合が提示され、被験者は最もノベルティの高いものから最もノベルティが低いものに至る集合を評価するように要求された。被験者は、シードストーリーを読んでおり、次は新しい情報を待ち望んでいる友人のために記事集合を選択するつもりでこの作業を行うように指示された。3つの測定基準によって生成された集合の表示順序は、参加者全員に対して無作為に選択された。
図4は、本発明の1つの態様によるランク付けの結果を示すグラフ400である。12のトピックに関して全体で111件のユーザの判定、1トピック当たり平均9〜10件の判定が得られた。図4は、それぞれの測定基準について最もノベルティが高い、中間、あるいは最もノベルティが低いと評価された回数を示している。グラフ400からわかるように、KL測定基準とNE測定基準で生成された集合はベースライン測定基準(ORG)で出されたものよりノベルティが高いと評価された。
Figure 2005251203
表1はトピックごとの結果を示している。終わりから2番目の3列(最新の回数)は、各々の測定基準がそれぞれのトピックについて最もノベルティの高いと評価された回数を示している。最もノベルティの高いものに1、中間に2、最もノベルティが低いものに3のランクが割り当てられると仮定し、最後の3列(平均ランク)は、測定基準の平均のランクを示している。ウィルコクソン(Wilcoxon)の符号順位テストを用いて、実験結果の統計的有意性を評価する。(図4に要約されるように)トピック全体にわたる測定基準の平均のランクを比較すると、KLとNEはいずれもp<0.001であり、ORGより優れていることが認められた。個別のトピック当たりの結果について考察すると、ORG測定基準のランクは、3つの測定基準すべての中で最低(すなわち最適)ではなかった。6つの事例(トピック2、4、5、6、9、12)では、ORGとスコアが最も低い測定基準との平均のランクの差がp<0.05で統計的に有意であり、もう1つの事例ではp=0.068で有意性がボーダーライン上にあった(トピック8)。2つの最適な測定基準(KLとNE)を比較すると、KLを有利とした差は、トピック4と6ではp<0.05で統計的に有意であり、トピック9では(p=0.083)で有意性はボーダーライン上にあった。NEを有利とした平均のランクにおける差は、トピック2と3では有意性がボーダーライン上にあった(それぞれp=0.096とp=0.057)。
図5は、本発明の1つの態様によるパーソナライズされた更新プロセス500を示す図である。前節で提示し、評価したアルゴリズムRANKNEWSBYNOVELTYは、ユーザが最初にそのストーリーを読んだ後、最新のストーリーの進展に遅れずにいたいと思うという仮定の下で機能する傾向にある。この場合、このアルゴリズムは、シードストーリーとノベルティを比較することによって新しい記事を順序付け、次にユーザは読むためにどの程度の時間を当てられるかによって、スコアの高い、いくつかの記事を読むことができる。
しかし、新しい進展が実際に起こったときに継続的に更新されることをユーザが望む場合はどうだろうか。収集サーバーなどの後方支援では、ユーザが読む記事を追跡し、ニュースフィードまたは情報フィードにおける新しい記事ストリームのノベルティを評価する。ユーザの個人的な設定、たとえばユーザがストーリーに関する更新をどの程度の頻度で取得するのに興味があるのかに基づいて、サーバーは、どの記事を表示するかを決定する。したがって、ある記事がユーザへの配信を保証するだけの十分な新しい情報を含むか否かを決めるオンライン決定メカニズムを提供できる。利点対アラート費用の一般的な分析では、ユーザのコンテキストに関する考えに基づいて、特定の記事または記事のグループの情報としての価値とユーザへの割り込み費用とのバランスを考慮する場合がある。
以下では、ユーザの情報を最新のニュースで更新するさまざまなシナリオについて説明する。ブロック510の唯一のシナリオの更新では、ユーザが定期的な更新を得ることに関心を持っていることが仮定されるが、第2のシナリオでは、ブロック520のノベルティの高い情報のバーストによって配信されるニュースを監視することで、継続的にユーザの情報を更新している。さらに、ユーザが更新を希望する記事、およびブロック530において記事の種類ごとの特徴付けとして示す、記事のノベルティの型(以下に詳説する)をユーザが制御できるメカニズムを提供できる。
ブロック510の唯一の更新では、ユーザがそのストーリーに関する定期的な更新を一度しか希望しない場合について考慮する。この目標を達成するための1つの方法は、RANKNEWSBYNOVELTYと類似のアルゴリズムを用いることである。すなわち、直前の何日かの間に受信したストーリーをすべて蓄積し、蓄積された集合からの距離を計算することによって今日到着した新しいストーリーの各々のノベルティを評価する。このアプローチの1つの問題は、蓄積されるストーリーが多いほど、新しいストーリーから蓄積されたストーリーまでの距離の有意性が低くなることである。数日分の記事が蓄積されると、大きな更新も単に新しいものとして見なされる。
このような落とし穴を避けるために、定期的な更新の選択に関する元のノベルティアルゴリズムを以下に示すように変更する。具体的な例として、1日の周期を使用したので、アルゴリズムは、ユーザ向けに毎日更新を識別する。ユーザが指定され、ユーザが追跡するトピックが選択されると、アルゴリズムPICKDAILYUPDATEは今日受信した記事を前日に受信したすべての記事の和集合と比較する。アルゴリズムは、昨日認識していた情報と比較して最も有益な更新を選択し、それをユーザに表示しようとする。ただし、その更新は十分に新しい(すなわち、ノベルティの評価はユーザのパーソナライズされた閾値を上回る)情報を伝える必要がある。こうした条件により、システムは、ユーザに有益な更新を中継し、既知の詳細な情報のみを要約した記事を除去することができる。このアルゴリズムは、1日あたりn個の最も有益な更新を識別するように一般化できる。
前日より前のすべての日を無視することにより、アルゴリズムPICKDAILYUPDATEでは、数日前に言われたことを要約する記事をノベルティが高いと見なすことが問題になる。ほとんどの記事は、以前の進展に関する背景情報に新しい情報を挿入する形で記述されるので、実際にこういう事態はめったに発生しない。言うまでもないが、特定のトピックに関連するが、その重みは時間とともに小さくなる以前の記事をすべて考慮するように、より精巧な距離の測定基準を提供してもよい。
Algorithm PICKDAILYUPDATE (dist, Bg, D, thresh)
Figure 2005251203
if dist(d, Bg) > thresh then display(d)
Bg ← D
ただし、distは距離の測定基準、Bgは背景参照集合(前日に受信した関連記事の和集合)、Dは今日受信した新しい記事集合、threshはユーザが定義した感度の閾値である。
前述の510のアルゴリズムは、予め定められた時間間隔でユーザを更新するので、主として「オフライン」の手順でもよい。強硬派の(Hardcore)ニュースジャンキーは、毎日スケジュールされたニュース更新を待つことに苛立ちを感じる可能性がある。もう少し応答性のよい分析が望ましい場合がある。
極端な事例では、システムは潜在的にほとんどすべての記事をノベルティが高いと予測するので、すべての記事と前の記事との比較は適切に機能しないことがある。代わりに、最新のニュースイベントは、図5の520で処理されるが、ここでこれまでの多くの記事を表示するスライディングウィンドウを使用して現在の記事のノベルティを判断する。記事と前の固定長のウィンドウとの距離を評価することでスコアが比較しやすくなり、記事数が20〜60のさまざまなウィンドウ長が評価されたことに留意されたい。実際、長さが約40のウィンドウが一般的に適切に機能することがわかった。
アルゴリズムPICKDAILYUPDATEとは対照的に、ここでは背景参照集合が大幅に短縮されている。すなわち1日分のコンテンツ全体でなく40記事である。したがって、ストーリーが最初にレポートされてから長い時間が経過した後の時期遅れのレポートと、それに続く要約をウィンドウに表示するには長さが不足する可能性が高くなる。そのような繰り返しの一部を除去するには、ニュースレポートの本質を理解する必要がある。
事件または重要な事件に関する情報の更新が発生すると、多くのニュースソースは新しい進展を取り上げ、非常に短い時間枠内にそれをレポートする。それぞれの記事と前のウィンドウとの距離を連続的にグラフに表示すると、こうした新しい情報の到着はグラフのピークになる。このようなピークはノベルティのバーストと呼ばれる。それぞれのバーストの始まりに、追加の記事によって新しい詳細な情報が追加される傾向があり、グラフが上昇する原因となる。時間の経過に伴って、スライディングウィンドウにはこの最新の進展を伝えるさらに多くの記事が表示される。その結果、後続の記事に同等のノベルティがなくなると、ノベルティの計算値は低下してバーストの終わりを示す。
事件の時間遅れのレポートとストーリーの要約は、異なるソース間で遅れずに相互に関連する可能性が低い。このようなレポートは、前のウィンドウに比べてノベルティが高く表示される可能性があるが、通常は分離されているので、ノベルティの急激な上昇の原因となる。こうした単独の急激な上昇を除去するために、また真の更新と認めないために、ノベルティの信号に適切なフィルタを適用する必要がある。
中央値フィルタは、信号内のノイズの量を減らすことでこの機能を提供する。フィルタは、信号内のデータポイントのそれぞれを連続的に考慮し、データポイントを周囲に合わせるように調整し、元の信号を効果的に平滑化してアウトライヤーを除去する。特に、幅wの中央値フィルタは、まず現在のポイントを中心としたウィンドウ内でw個のデータポイントをソートし、後のデータ(latter)をこうしたポイントの中央値で置き換える。
記事と前の記事を表示するスライディングウィンドウ間の距離を計算すると、結果として得られる信号が中央値フィルタを通過する。たとえば、フィルタの幅が3〜7の場合、幅5のフィルタは、ほとんどの事例で適切に機能するように見える。
Algorithm IDENTIFYBREAKINGNEWS (dist;D;l;fw;thresh)
Figure 2005251203
for i =1 + 1 to |D| do
Scoresi ← dist(di,Window)
Window ← (Window\di-1)∪di
Scoresfilt ← MedianFilter(Scores,fw)
for j=l to |Scoresfilt| do
if
Figure 2005251203
then
disp1ay(dj+i)
次のバーストの開始にスキップする
ただし、distは距離の測定基準、Dは一連の関連記事、lはスライディングウィンドウの長さ、fwは中央値フィルタの幅、threshはユーザが定義した感度の閾値である。
後続のいくつかの記事を考慮して新しいバーストの始まりを確実に検出する必要があるので、中央値フィルタを使用すると、ノベルティの高い記事のユーザへのルーティングを遅らせる可能性があることに留意されたい。ただし、そのような遅れは比較的小さく(使用された中央値フィルタの幅の半分)、フィルタの有用性はこの不都合を補って余りあることが分かった。ユーザが遅延の増大をあえて許容する場合、アルゴリズムは、バーストが検出される瞬間から、バーストを開始する記事を検出するのではなく、数十件の記事を順方向に走査して最も有益な更新を選択することができる。最新のニュースに関する初期の更新の表示(rendering)など、組み合わせのアプローチも実行可能である。さらに、情報の多いバースト分析を待って、進展に関する最適な記事を送信する。前述のアルゴリズムは、ニュースアラートのバースト分析を実装するIDENTIFYBREAKINGNEWSの擬似コードを示している。
図6に、サンプルトピックへのアルゴリズムIDENTIFYBREAKINGNEWSの適用例を示す。問題のトピックは、米国ペンシルバニア州エリーの銀行強盗事件を扱っている。配達人の訴えによれば、犯罪者グループは、ピザの配達人を捕らえ、彼の首に爆発装置を固定して地元の銀行を襲うよう強要したらしい。その男は即座に警察に逮捕されたが、まもなくその装置が爆発して死んだ。奇怪な最初のストーリーと続いて行われる捜査は、2003年9月から数週間にわたって多くのニュースソースから追跡された。図のX軸は、時間の経過に伴って到着した一連の記事に対応し、Y軸は(生で中央値フィルタをかける)前のスライディングウィンドウに表示された各記事の距離の値をプロットしたものである。実際の距離のスコアは、破線で示され、フィルタを適用したスコアは実線でプロットされる。図6のテキストボックスは、識別されたノベルティのバーストに対応する実際の事件に関する説明であり、フィルタによって除外された潜在的な誤った(spurious)ピークを示している。平滑化されたノベルティのスコアは、中央値フィルタを組み込んでいるが、ストーリーの主な進展(友人のインタビュー、武器についての詳細、2人の容疑者に関するFBI報告、模倣事件)をとらえており、同時にノベルティの見せかけのピークを除外している。
図5の530を参照すると、記事の種類とユーザ制御の特徴付けが考慮されている。一部の事例では、1つの選択基準としてノベルティのスコアのみに依存してはならない。一部の記事では、トピックの変更によってノベルティが高いと識別されるものもある。情報ノベルティの分析を強化するために、記事とシードストーリーまたは関心のあるトピックとのさまざまな関係に基づいてノベルティ型の分類が公式化される。こうした関係のクラスの例には以下のものが含まれる。
1.要約記事は関連があるが、通常はすでに報告されていることの見直しだけを提供しており、新しい情報は伝えていない。
2.解説記事は、シード記事で提示するトピックに関する新しい関連情報を追加している。
3.派生記事は、主流の議論にも関連するが、自ら追加する新しい情報はシードストーリーに報告されている情報と十分に異なり、新しい関連トピックの進展が保証される。
4.無関係の記事は、関心のあるトピックから大きく外れた記事である。こうした記事は、問題をクラスタ化または解析することで発生し得る。4カテゴリより多くを定義でき、処理できることに留意されたい。
以上のクラスの中で、タイプ2と3の関係は、トピックを追跡している場合におそらくほとんどのユーザが表示を希望する。この目標を達成するために、文書内のダイナミックスを綿密に調べる新しい種類の文書分析を提供できる。文書全体を相互に比較する従来の分析型とは対照的に、この技術では文書に「詳細な分析(zoom in)」を行って、文書の要素の関連性を評価する。
一般に、文書ごとにモデルが作成され、固定の距離の測定基準すなわちKL発散を用いる。次に、文書ごとに文書内の単語のスライディングウィンドウとシードストーリーとの距離のスコアを計算する。単語のウィンドウのスコアは、選択された測定基準を用いて文書ィンドウ内のモデルとシードストーリーのモデルとを比較することによって規定される、ウィンドウ内の各単語のシードストーリーに対するポイントごとのスコアの合計と解釈できる。いくつかの異なるウィンドウ長が考慮され、値が20のウィンドウは実際適切に機能することがわかった。
この技術の便利な特性は、よく知られている単語の範囲(proverbial bag of words)を超えて、文書の単語を元のコンテキストで考慮することである。固定長のウィンドウを使用することによって距離のスコアを直接比較できるようになるので、外見上のより魅力的なパラグラフ単位ではなく、コンテキストに関するスライディングウィンドウの使用を選択した。比較単位のもう1つの明らかな選択肢として、個々の文がある。しかし、この分析を文レベルで行うことは、情報が少なく、とり得るスコアの範囲が大きいために実用的ではないと考えられる。
図7に、文書内の分析結果のサンプルを示す。この分析のシードストーリーは、シンガポールの新しいSARSの事例のレポートだった。すでに一般的に言われてきたことを要約するハイライトは、ダイナミックレンジが非常に限定され、絶対スコアが低い。解説記事は、記事が伝える新しい情報を反映する絶対スコアが比較的高いのが普通である。このストーリーの1つの解説記事では、患者の妻が隔離されていることを報告した。さらにこの範囲に沿って、派生記事と認定できるが依然としてシードストーリーに記述された事件に留まる記事は、ダイナミックレンジが非常に広い。1つの派生記事はアジアの株式市場へのSARSの影響に焦点を合わせたストーリーであり、もう1つはSARSワクチンの進捗状況であった。いずれの派生記事も最近の事件を出発点として使用したが、まさしく関連のトピックを扱っていた。ダイナミックレンジやノベルティスコアのパターンなど、文書内のダイナミックスを分析することは、読者が追跡するさまざまな情報を識別する上で便利であると確信する。
Webは、ユーザに豊富なニュースソースを提供してきた。インターネットサーファーにとって、多くのソースを閲覧してニュースの更新情報を探索するのはきわめて容易であるが、大量のニュースを振り分けるには冗長な資料を大量に読むという作業が必要になる場合がある。ニュースフィードを分析し、ユーザが以前に読んだことがある記事のモデルが指定された場合、最もノベルティの高い情報を伝える記事を識別するアルゴリズムの集合が提示されている。このために、単語ベースの表現がテキストから抽出された名前付きエンティティで拡張されている。この表現を使用し、さまざまな距離の測定基準を使用して、それぞれのニュース記事と記事の集合(たとえば、以前に読んだストーリー)との相違点を評価する。このアルゴリズムの基盤となる技術によって、情報の配信が時間の経過とともに記事から記事へ、またコンテキストに応じた単語ウィンドウのレベルで記事ごとに、どのように進展するかを調査することにより、文書間および文書内のダイナミックスを分析する。
こうしたアルゴリズムを組み込んでいるニュースブラウザまたはサーバーベースのサービスは、ユーザにパーソナライズされたニュース配信を提供でき、ユーザは、ノベルティに関する制限を制御することによって、ニュース更新の望ましい周波数とこれらの更新のシードストーリーに対する類似性の度合いの両方を調整できる。ここで説明する基本の測定基準のいくつか、および文書内のパターンの詳細なプロファイルを組み込んだ高度な距離の測定基準も提供できる。
図8〜11は、本発明の1つの態様によるユーザインターフェイスの例を示す図である。図8では、ディスプレイウィンドウ810にニュースストーリーのリストが示されており、ニュースストーリー810から特定のトピックが選択され、ディスプレイウィンドウ820に表示される(たとえば、捜査員の捜査の手...)。ディスプレイウィンドウ810でトピックを選択すると、選択されたトピックに関連する関心のあるニュースアイテムがディスプレイウィンドウ820に表示される。ディスプレイウィンドウ830には、ディスプレイウィンドウ820においてリストから選択された特定のニュースアイテムが表示される。図9は、トピックを選択するとそのトピックがペイン910の既読のセクションの下に一覧表示されることを示している。図10は、次にノベルティの高い記事がペイン1010に表示され、さらに、ディスプレイウィンドウ1020でこの記事を調査したり参照したりする様子を示している。図11は、ディスプレイウィンドウ1020で読んだアイテムが既読の領域1110に配置される様子を示している。
図12を参照すると、本発明のさまざまな態様を実装する例示的な環境1210にはコンピュータ1212が含まれる。コンピュータ1212には、処理装置1214、システムメモリ1216、システムバス1218が含まれる。システムバス1218は、システムメモリ1216から処理装置1214までを含みこれに限定されないシステムコンポーネントを接続する。処理装置1214は、市販のさまざまなプロセッサのいずれでもよい。デュアルマイクロプロセッサやその他のマルチプロセッサアーキテクチャも処理装置1214として利用できる。
システムバス1218は、16ビットバス、ISA(Industrial Standard Architecture)、マイクロチャネルアーキテクチャ(MCA:Micro−Channel Architecture)、EISA(Extended ISA)、インテリジェントドライブエレクトロニクス(IDE:Intelligent Drive Electronics)、VESAローカルバス(VLB:VESA Local Bus)、PCI(Peripheral Component Interconnect)、ユニバーサルシリアルバス(USB:Universal Serial Bus)、アドバンストグラフィクスポート(AGP:Advanced Graphics Port)、PCMCIA(Personal Computer Memory Card International Association)バス、SCSI(Small Computer Systems Interface)などを含み、これに限定されない市販のさまざまなバスアーキテクチャを使用する、メモリバス、メモリコントローラ、周辺バス、外部バス、および/またはローカルバスを含む複数のバス構造型のいずれでもよい。
システムメモリ1216には、揮発性メモリ1220と不揮発性メモリ1222とが含まれる。コンピュータ1212内の要素間で情報を転送する起動時などの基本ルーチンを含む基本入出力システム(BIOS:basic input/output system)は、不揮発性メモリ1222に格納される。例として、不揮発性メモリ1222には、読み出し専用メモリ(ROM:read only memory)、プログラマブルROM(PROM:programmable ROM)、電気的プログラマブルROM(EPROM:electrically programmable ROM)、電気的消去可能ROM(EEPROM:electrically erasable ROM)、またはフラッシュメモリが含まれるが、これらに限定されない。揮発性メモリ1220には、外部キャッシュメモリとして動作するランダムアクセスメモリ(RAM:random access memory)が含まれる。例として、RAMは、シンクロナスRAM(SRAM:)、ダイナミックRAM(DRAM:dynamic RAM)、シンクロナスDRAM(SDRAM:synchronous RAM)、ダブルデータレートSDRAM(DDR SDRAM:double data rate SDRAM)、拡張SDRAM(ESDRAM:enhanced SDRAM)、シンクリンクDRAM(SLDRAM:Synchlink DRAM)、ダイレクトラムバスRAM(DRRAM:direct Rambus RAM)などのさまざまな形式を利用できるが、これらに限定されない。
コンピュータ1212には、取り外し可能/固定の、揮発性/不揮発性コンピュータ記憶媒体も含まれる。図12には、例としてディスク記憶1224が示されている。ディスク記憶1224には、磁気ディスクドライブ、フロッピー(登録商標)ディスクドライブ、テープドライブ、ジャズ(Jaz)ドライブ、ジップ(Zip)ドライブ、LS−100ドライブ、フラッシュメモリカード、メモリースティックなどの装置が含まれるが、これらに限定はされない。また、ディスク記憶1224には、CD−ROM(compact disk ROM)ドライブ、CD−R(CD recordable )ドライブ、CD−RW(CD rewritable)ドライブ、DVD ROM(digital versatile disk ROM)ドライブなどの光ディスクドライブを含むが、これらに限定されない記憶媒体の個別の配置も複数の記憶媒体の組み合わせも含まれる。ディスク記憶装置1224からシステムバス1218への接続を容易にするために、通常はインタフェース1226のような取り外し可能または取り外し不可能なインタフェースを使用する。
図12は、ユーザと適切な動作環境1210で記述される基本コンピュータリソースとの仲介として動作するソフトウェアとを示すことを理解されたい。こうしたソフトウェアには、オペレーティングシステム1228が含まれる。オペレーティングシステム1228は、ディスク記憶1224に格納でき、コンピュータシステム1212のリソースの制御および割り当てを行う。システムアプリケーション1230は、システムメモリ1216またはディスク記憶1224に格納されたプログラムモジュール1232とプログラムデータ1234とを使用して、オペレーティングシステム1228によるリソースの管理を利用する。本発明は、さまざまなオペレーティングシステムまたは複数のオペレーティングシステムの組み合わせで実装できることを理解されたい。
ユーザは、入力装置(1つまたは複数)1236を使用してコンピュータ1212にコマンドまたは情報を入力する。入力装置1236には、マウス、トラックボール、スタイラス、タッチパッドなどのポインティングデバイス、キーボード、マイクロフォン、ジョイスティック、ゲームパッド、衛星パラボラアンテナ、スキャナ、テレビチューナーパッド、デジタルカメラ、デジタルビデオカメラ、ウェブカメラなどが含まれるが、これらに限定されない。これらの入力装置およびその他の入力装置は、1つまたは複数のインタフェースポート1238を経由してシステムバス1218から処理装置1214に接続する。インタフェースポート1238には、たとえばシリアルポート、パラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)が含まれる。出力装置(1つまたは複数)1240は、入力装置1236と同じ種類のポートのいくつかを使用する。このように、たとえばUSBポートは、コンピュータ1212に入力を提供するため、およびコンピュータ1212からの出力情報を出力装置1240に提供するために使用できる。出力アダプタ1242は、出力装置1240の中でもモニタ、スピーカー、プリンタのように専用アダプタを必要とするものがあることを説明するために図示している。出力アダプタ1242には、例として出力装置1240とシステムバス1218の接続手段を提供するビデオカードやサウンドカードが含まれるが、これらに限定されない。他の装置および/または装置のシステムは、リモートコンピュータ(1台または複数台)1244のように入出力両方の機能を提供することに留意されたい。
コンピュータ1212は、リモートコンピュータ1244のようなリモートコンピュータ(1台または複数台)1244への論理接続を使用してネットワーク環境で動作できる。リモートコンピュータ1244は、パーソナルコンピュータ、サーバー、ルーター、ネットワークPC、ワークステーション、マイクロプロセッサベースの機器、ピア装置、または他の一般的なネットワークノードなどでもよく、通常はコンピュータ1212に関連して説明した要素の多くのまたはすべてが含まれる。簡潔にするために、リモートコンピュータ1244に伴ってメモリ記憶装置1246だけが図示されている。リモートコンピュータ1244は、ネットワークインタフェース1248を介してコンピュータ1212に論理的に接続され、さらに通信接続1250を介して物理的に接続されている。ネットワークインタフェース1248には、ローカルエリアネットワーク(LAN:local area network)、ワイドエリアネットワーク(WAN:wide area network)といった通信ネットワークが含まれる。LANの技術には、光ファイバー分散データインタフェース(FDDI:Fiber Distributed Data Interface)、より対線FDDI(CDDI:Copper Distributed Data Interface)、イーサネット(登録商標)/IEEE 1102.3、トークンリングIEEE 1102.5などが含まれる。WANの技術には、ポイントツーポイントリンク、統合サービスデジタル通信網(ISDN:Integrated Services Digital Networks)やその変形のような回路切り替えネットワーク、パケット切り替えネットワーク、デジタルサブスクライバーライン(DSL:Digital Subscriber Lines)が含まれるが、これらに限定されない。
通信接続(1つまたは複数)1250は、ネットワークインタフェース1248をバス1218に接続するために使用されるハードウェアまたはソフトウェアを意味する。通信接続1250は、コンピュータ1212の内部を明確に示すために図示しているが、コンピュータ1212の外部にあってもよい。ネットワークインタフェース1248の接続に必要なハードウェア/ソフトウェアには、例示の目的に限定して、通常電話回線モデム、ケーブルモデム、DSLモデム、ISDNアダプタ、イーサネット(登録商標)カードなどの内蔵および外付けのテクノロジーが含まれる。
図13は、本発明が対話できるサンプルコンピューティング環境1300の概略を示すブロック図である。システム1300には、クライアント(1つまたは複数)1310が含まれる。クライアント1310は、ハードウェアおよび/またはソフトウェア(たとえばスレッド、プロセス、コンピューティング装置)である。システム1300には、サーバー(1つまたは複数)1330も含まれる。サーバー1330は、ハードウェアおよび/またはソフトウェア(たとえばスレッド、プロセス、コンピューティング装置)である。サーバー1330には、たとえば本発明を使用した変形を実行するスレッドを格納できる。クライアント1310とサーバー1330の間で可能な1つの通信の例は、2つ以上のコンピュータプロセス間で送信できるデータパケットの形でもよい。システム1300は、クライアント1310とサーバ1330との間の通信を容易にするために使用できる通信フレームワーク1350を備えている。クライアント1310は、クライアント1310のローカルな情報を格納するために使用できる1つまたは複数のデータ記憶1360に接続して機能する。同様に、サーバー1330は、サーバー1330のローカルな情報を格納するために使用できる1つまたは複数のサーバーデータ記憶1340に接続して機能する。
以上の説明には、本発明の例が含まれる。本発明について説明するためにコンポーネントまたは方法のあらゆる組み合わせについて説明するのはもちろん不可能であるが、他にも本発明の多くの組み合わせや置き換えが可能であることは当業者には言うまでもない。したがって、本発明には添付の特許請求の精神と範囲に入る代替、変更、変形のすべてが含まれるものとする。さらに、発明の実施の形態と特許請求の範囲のいずれかで使用する「含む」という用語の範囲は、「備える」が特許請求の範囲で暫定的な用語として使用された場合に解釈される用語「備える」と同様に包括的な意味を表す。
本発明の1つの態様による情報ダイナミックスシステムの概略を示すブロック図である。 本発明の1つの態様によるテキストの集合を比較するためのフレームワークを示すブロック図である。 本発明の1つの態様による情報ノベルティプロセスを示す流れ図である。 本発明の1つの態様によるランク付けの結果を示す図である。 本発明の1つの態様によるパーソナライズされた更新プロセスを示す図である。 本発明の1つの態様によるノベルティ信号を示す図である。 本発明の1つの態様による記事の関係の例を示す図である。 本発明の1つの態様によるユーザインターフェイスの例を示す図である。 本発明の1つの態様によるユーザインターフェイスの例を示す図である。 本発明の1つの態様によるユーザインターフェイスの例を示す図である。 本発明の1つの態様によるユーザインターフェイスの例を示す図である。 本発明の1つの態様による適切な動作環境の概略を示すブロック図である。 本発明と対話できるサンプルコンピューティング環境の概略を示すブロック図である。
符号の説明
100 情報ダイナミックスシステム
300 ノベルティを特徴付けるプロセスを表す方法
400 ランク付けの結果を示すグラフ
810〜830 ディスプレイウィンドウ
910 ペイン
1010 ペイン
1020 ディスプレイウィンドウ
1110 既読の領域
1210 例示的な環境
1300 サンプルコンピューティング環境

Claims (40)

  1. パーソナライズされた情報を配信するためのシステムであって、
    2つ以上の情報アイテム間の相違点を決定するコンパレータと、
    前記相違点に部分的に基づき、および前記情報アイテムに関連するデータが時間の経過とともに進展するにつれて、パーソナライズされた情報として前記情報アイテムのサブセットを自動的に決定するアナライザと
    を備えたことを特徴とするシステム。
  2. すでに参照した情報の一部を除外するフィルタをさらに備えたことを特徴とする請求項1に記載のシステム。
  3. 前記情報アイテムは、ニュースストリームに関連することを特徴とする請求項1に記載のシステム。
  4. 前記アナライザでさらに処理する前記情報アイテムを収集する、少なくとも1台のサーバーをさらに備えたことを特徴とする請求項1に記載のシステム。
  5. 前記コンパレータは、複数の文書集合にわたって出現する単語に関して収集された詳細な統計データを処理し、および前記集合間の相違点と類似点を明らかにすることを特徴とする請求項1に記載のシステム。
  6. 人物、組織、地理的な場所を表す名前付きエンティティを採用する単語モデルをさらに備えたことを特徴とする請求項1に記載のシステム。
  7. ユーザに対して時間と混乱を最小限に抑えようとする、パーソナライズされたニュースポータルまたはニュースアラートサービスをさらに備えたことを特徴とする請求項1に記載のシステム。
  8. 自動プロファイルもしくはテキストの集合の比較、テキスト内に反映されるさまざまな見解、目的、および関心の自動識別、または新しい情報の自動識別を含むさまざまなアプリケーションで相違点を決定するためのフレームワークをさらに備えたことを特徴とする請求項1に記載のシステム。
  9. 前記コンパレータは、コンテンツ内の相違点、構造上の編成の相違点、時間的な相違点の少なくとも1つを決定することを特徴とする請求項1に記載のシステム。
  10. ニュースストーリーのノベルティを明らかにし、ニュース記事を順序付けて既読の記事の和集合に最大限の情報を追加できるようにするコンポーネントをさらに備えたことを特徴とする請求項9に記載のシステム。
  11. トピックの時間の経過に伴う進展を分析し、ニュース更新情報の重要性と妥当性を定量化できるようにするコンポーネントをさらに備えたことを特徴とする請求項9に記載のシステム。
  12. トピックに関するパラメータをユーザが制御できるようにすることにより、パーソナライズされたニュース配信を実現するコンポーネントをさらに備えたことを特徴とする請求項11に記載のシステム。
  13. コンピュータ読み取り可能な命令を格納し、請求項1に記載のコンポーネントを実装することを特徴とするコンピュータ読み取り可能な媒体。
  14. パーソナライズされた情報を作成する方法であって、
    さまざまな情報ソースから配信された文書を自動的に分析するステップと、
    前記文書のノベルティを自動的に特定するステップと
    前記文書の前記ノベルティに基づくパーソナライズされた情報フィードを作成するステップと
    を備えたことを特徴とする方法。
  15. 文書グループ間の相違点について、グループごとにモデルを構築することによって推論を導くステップと、類似性の測定基準を用いて前記モデルを比較するステップとをさらに備えたことを特徴とする請求項14に記載の方法。
  16. 前記モデルは、単語の特徴に関して、または同じ特徴空間の重みのベクトルとして、平滑化された確率分布を採用していることを特徴とする請求項15に記載の方法。
  17. 前記類似性の測定基準は、KL発散、JS発散、ベクトルの余弦の計算、特徴の重みベクトルの余弦、および前に検出されていない名前付きエンティティの密度の測定値の少なくとも1つをさらに含むことを特徴とする請求項15に記載の方法。
  18. 読者が関心を持つ可能性のある小規模な記事集合の作成に繰り返し適用するノベルティランク付けアルゴリズムを提供するステップをさらに備えたことを特徴とする請求項17に記載の方法。
  19. 貪欲な増分分析を提供するステップと、入手できるほとんどすべての更新をユーザがすでに読んだシードストーリーと比較して前記シードストーリーと最も類似性の低い記事を選択するステップとの少なくとも1つをさらに備えたことを特徴とする請求項18に記載の方法。
  20. アルゴリズム
    Algorithm RANKNEWSBYNOVELTY (dist, seed, D, n)
    R ← seed // 初期化
    for i = 1 to min(n, |D|) do
    Figure 2005251203
    R ← R∪{d};D ← D\{d}
    をさらに備え、ただし、distは距離の測定基準、seedはシードストーリー、Dは関連の更新の集合、nは選択する望ましい更新数、Rはノベルティによって順序付けされた記事のリストであることを特徴とする請求項19に記載の方法。
  21. 便益に対するユーザへのアラート費用の一般的な分析を提供して、ユーザの文脈に関する考えに基づいて、特定の記事または記事のグループの情報としての価値と前記ユーザへの割り込み費用との釣り合いをとるステップをさらに備えたことを特徴とする請求項19に記載の方法。
  22. 特定の期間に受信した記事を定期的に受信した記事の和集合と比較するステップをさらに備えたことを特徴とする請求項19に記載の方法。
  23. トピックに関連するが、測定基準の重みは時間とともに小さくなる、以前の記事を考慮する距離の測定基準を決定するステップをさらに備えたことを特徴とする請求項22に記載の方法。
  24. アルゴリズム
    Algorithm PICKDAILYUPDATE (dirt, Bg, D, thresh)
    Figure 2005251203
    if dist(d, Bg) > thresh then display(d)
    Bg ← D
    をさらに備え、ただし、distは距離の測定基準、Bgは直前の何日かの間に受信した関連記事の和集合を含む背景参照集合、Dは今日受信した新しい記事の集合、threshはユーザが定義した検出感度の閾値であることを特徴とする請求項19に記載の方法。
  25. ノベルティのバーストを特定するステップをさらに備えたことを特徴とする請求項19に記載の方法。
  26. 現時点を中心とするウィンドウ内でw個のデータポイントをソートする幅wの中央値フィルタを決定するステップをさらに備えたことを特徴とする請求項25に記載の方法。
  27. アルゴリズム
    Algorithm IDENTIFYBREAKINGNEWS (dist;D; l; fw; thresh)
    Figure 2005251203
    for i= l + 1 to |D| do
    Scoresi ← dist (di,Window)
    Window ← (Window\di-l)∪di
    Scoresfilt ← MedianFilter (Scores, fw)
    for j=1 to |Scoresfilt|do
    if
    Figure 2005251203
    then
    display(dj+l)
    skip to the beginning of the next burst
    をさらに備え、ただし、distは距離の測定基準、Dは一連の関連記事、lはスライディングウィンドウの長さ、fwは中央値フィルタの幅、threshはユーザが定義した検出感度の閾値であることを特徴とする請求項26に記載の方法。
  28. ハイライト記事、解説記事、派生記事、および無関係の記事の少なくとも1つを決定するステップをさらに備えたことを特徴とする請求項19に記載の方法。
  29. 文書分析を実行する方法であって、
    文書集合内の各文書に言語モデルを構築するステップと、
    前記文書を分析するための固定の距離の測定基準を決定するステップと、
    前記文書に含まれる単語に関して少なくとも1つのウィンドウをスライドするステップと
    を備えたことを特徴とする方法。
  30. シードストーリーに対する前記ウィンドウの距離のスコアをプロットするステップをさらに備えたことを特徴とする請求項29に記載の方法。
  31. 選択された測定基準を使用して、現在の文書の前記言語モデルを前記シードストーリーのモデルと比較することによって規定される各単語の前記シードストーリーに対する各ポイントのスコアの合計を決定するステップをさらに備えたことを特徴とする請求項30に記載の方法。
  32. 約20のウィンドウ長パラメータを採用するステップをさらに備えたことを特徴とする請求項31に記載の方法。
  33. 現時点からの最近の異なる期間における、1つのトピックに関する現在未読のニュースストーリーを読むための理想的な読み込みシーケンスまたはパスの設計を支援するステップをさらに備えたことを特徴とする請求項29に記載の方法。
  34. 最新のニュースと時間の経過に伴うニュースバーストとを考慮することにより、読者がニュースストーリーの進展を理解し、重要な事件/更新情報によってストーリーの履歴のナビゲートを支援するために、ニュースを理解するシーケンスを設計するステップをさらに備えたことを特徴とする請求項29に記載の方法。
  35. さまざまな種類のディスプレイデザインとメタファーとを開発するステップをさらに備えたことを特徴とする請求項29に記載の方法。
  36. 前記種類には、タイムラインビューまたは時間におけるクラスタの使用が含まれることを特徴とする請求項35に記載の方法。
  37. 1つのトピック内における最新のニュースストーリーのデスクトップ設定またはモバイル設定において、理想的なアラートを提供するステップをさらに備えたことを特徴とする請求項29に記載の方法。
  38. ユーザがトピックまたはキーワードを指定できるようにするステップと、前記ユーザが読んだ記事が指定され、十分なノベルティがある場合、前記ユーザへのアラートを発行するステップとをさらに備えたことを特徴とする請求項37に記載の方法。
  39. 前記情報ノベルティが予め定められたノベルティの閾値を超える場合、キーワードを伴うニュースストーリーが発生したときにユーザへのアラートを発行するステップをさらに備えたことを特徴とする請求項37に記載の方法。
  40. パーソナライズされた情報を作成するシステムであって、
    さまざまな情報ソースから配信された複数の文書を自動的に分析する手段と、
    前記文書の類似性を決定する手段と
    決定された前記文書の類似性における相違点に基づくパーソナライズされた情報フィードを提供する手段と
    を備えたことを特徴とするシステム。
JP2005057282A 2004-03-02 2005-03-02 情報ノベルティ(novelty)と情報ダイナミックス(dynamics)の分析によってニュースフィード(newsfeeds)をパーソナライズ(personalizing)するための原理および方法 Expired - Fee Related JP4845392B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US54937104P 2004-03-02 2004-03-02
US60/549,371 2004-03-02
US10/827,729 2004-04-20
US10/827,729 US7293019B2 (en) 2004-03-02 2004-04-20 Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics

Publications (3)

Publication Number Publication Date
JP2005251203A true JP2005251203A (ja) 2005-09-15
JP2005251203A5 JP2005251203A5 (ja) 2008-04-17
JP4845392B2 JP4845392B2 (ja) 2011-12-28

Family

ID=34915631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005057282A Expired - Fee Related JP4845392B2 (ja) 2004-03-02 2005-03-02 情報ノベルティ(novelty)と情報ダイナミックス(dynamics)の分析によってニュースフィード(newsfeeds)をパーソナライズ(personalizing)するための原理および方法

Country Status (9)

Country Link
US (1) US7293019B2 (ja)
EP (1) EP1571579A1 (ja)
JP (1) JP4845392B2 (ja)
KR (1) KR101114012B1 (ja)
CN (2) CN101256591B (ja)
AU (1) AU2005200877B2 (ja)
BR (1) BRPI0500612A (ja)
CA (1) CA2498376C (ja)
RU (1) RU2382401C2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100684160B1 (ko) 2005-12-08 2007-02-20 한국전자통신연구원 개체명 인식을 이용한 대화 분석 장치 및 방법
WO2009043041A3 (en) * 2007-09-28 2009-10-15 Microsoft Corporation Aggregating and delivering information
JP2014112367A (ja) * 2012-11-26 2014-06-19 Boeing Co 検索中に関連性のない情報を削減するシステム及び方法
JP2015232855A (ja) * 2014-06-11 2015-12-24 日本電信電話株式会社 イベント同一性判定方法、イベント同一性判定装置、イベント同一性判定プログラム
JP2016505995A (ja) * 2013-01-14 2016-02-25 ドロップボックス, インコーポレイテッド 複数のクライアントデバイスに亘る通知フィード

Families Citing this family (161)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US8793127B2 (en) 2002-10-31 2014-07-29 Promptu Systems Corporation Method and apparatus for automatically determining speaker characteristics for speech-directed advertising or other enhancement of speech-controlled devices or services
US20060240851A1 (en) * 2003-03-21 2006-10-26 Vocel, Inc. Interactive messaging system
US7599938B1 (en) 2003-07-11 2009-10-06 Harrison Jr Shelton E Social news gathering, prioritizing, tagging, searching, and syndication method
CA2475189C (en) * 2003-07-17 2009-10-06 At&T Corp. Method and apparatus for window matching in delta compressors
US7293019B2 (en) * 2004-03-02 2007-11-06 Microsoft Corporation Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics
US7865511B2 (en) * 2004-06-25 2011-01-04 Apple Inc. News feed browser
US8972444B2 (en) 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
US8392453B2 (en) * 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US20050289147A1 (en) * 2004-06-25 2005-12-29 Jessica Kahn News feed viewer
US7596571B2 (en) * 2004-06-30 2009-09-29 Technorati, Inc. Ecosystem method of aggregation and search and related techniques
NZ562583A (en) * 2005-03-16 2009-09-25 Airscape Technology Pty Ltd Method for distributing computing between server and client
US20060235885A1 (en) * 2005-04-18 2006-10-19 Virtual Reach, Inc. Selective delivery of digitally encoded news content
US20070174286A1 (en) * 2005-05-17 2007-07-26 Yahoo!, Inc. Systems and methods for providing features and user interface in network browsing applications
US9582602B2 (en) * 2005-05-17 2017-02-28 Excalibur Ip, Llc Systems and methods for improving access to syndication feeds in network browsing applications
US20060265472A1 (en) * 2005-05-17 2006-11-23 Yahoo! Inc. Systems and methods for providing short message service features and user interfaces therefor in network browsing applications
US7958446B2 (en) * 2005-05-17 2011-06-07 Yahoo! Inc. Systems and methods for language translation in network browsing applications
US20070033290A1 (en) * 2005-08-03 2007-02-08 Valen Joseph R V Iii Normalization and customization of syndication feeds
US8739020B2 (en) 2005-08-03 2014-05-27 Aol Inc. Enhanced favorites service for web browsers and web applications
US9268867B2 (en) 2005-08-03 2016-02-23 Aol Inc. Enhanced favorites service for web browsers and web applications
US7702675B1 (en) * 2005-08-03 2010-04-20 Aol Inc. Automated categorization of RSS feeds using standardized directory structures
US8190997B2 (en) * 2005-10-07 2012-05-29 Google Inc. Personalized content feed suggestions page
US8949154B2 (en) * 2005-10-07 2015-02-03 Google Inc. Content feed user interface with gallery display of same-type items
US7853485B2 (en) 2005-11-22 2010-12-14 Nec Laboratories America, Inc. Methods and systems for utilizing content, dynamic patterns, and/or relational information for data analysis
US8327297B2 (en) * 2005-12-16 2012-12-04 Aol Inc. User interface system for handheld devices
US20070143300A1 (en) * 2005-12-20 2007-06-21 Ask Jeeves, Inc. System and method for monitoring evolution over time of temporal content
US8874489B2 (en) 2006-03-17 2014-10-28 Fatdoor, Inc. Short-term residential spaces in a geo-spatial environment
US20070218900A1 (en) 2006-03-17 2007-09-20 Raj Vasant Abhyanker Map based neighborhood search and community contribution
US9459622B2 (en) 2007-01-12 2016-10-04 Legalforce, Inc. Driverless vehicle commerce network and community
JP4542993B2 (ja) * 2006-01-13 2010-09-15 株式会社東芝 構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム
US20070192401A1 (en) * 2006-02-16 2007-08-16 Gordon Weakliem System and method for synchronizing syndicated content over multiple locations
US9002754B2 (en) 2006-03-17 2015-04-07 Fatdoor, Inc. Campaign in a geo-spatial environment
US9070101B2 (en) 2007-01-12 2015-06-30 Fatdoor, Inc. Peer-to-peer neighborhood delivery multi-copter and method
US9037516B2 (en) 2006-03-17 2015-05-19 Fatdoor, Inc. Direct mailing in a geo-spatial environment
US9064288B2 (en) 2006-03-17 2015-06-23 Fatdoor, Inc. Government structures and neighborhood leads in a geo-spatial environment
US9373149B2 (en) 2006-03-17 2016-06-21 Fatdoor, Inc. Autonomous neighborhood vehicle commerce network and community
US8965409B2 (en) 2006-03-17 2015-02-24 Fatdoor, Inc. User-generated community publication in an online neighborhood social network
US9098545B2 (en) 2007-07-10 2015-08-04 Raj Abhyanker Hot news neighborhood banter in a geo-spatial social network
US8732091B1 (en) 2006-03-17 2014-05-20 Raj Abhyanker Security in a geo-spatial environment
US9071367B2 (en) 2006-03-17 2015-06-30 Fatdoor, Inc. Emergency including crime broadcast in a neighborhood social network
US20080201156A1 (en) * 2007-02-21 2008-08-21 Fatdoor, Inc. User-generated community publication in a geo-spatial environment
US8738545B2 (en) 2006-11-22 2014-05-27 Raj Abhyanker Map based neighborhood search and community contribution
US7451120B1 (en) * 2006-03-20 2008-11-11 Google Inc. Detecting novel document content
US20070265870A1 (en) * 2006-04-19 2007-11-15 Nec Laboratories America, Inc. Methods and systems for utilizing a time factor and/or asymmetric user behavior patterns for data analysis
US20070260586A1 (en) * 2006-05-03 2007-11-08 Antonio Savona Systems and methods for selecting and organizing information using temporal clustering
US8010645B2 (en) * 2006-05-12 2011-08-30 Sharp Laboratories Of America, Inc. Method and apparatus for providing feeds to users
US7831928B1 (en) 2006-06-22 2010-11-09 Digg, Inc. Content visualization
US20080005148A1 (en) * 2006-06-30 2008-01-03 Rearden Commerce, Inc. Automated knowledge base of feed tags
US7865513B2 (en) * 2006-06-30 2011-01-04 Rearden Commerce, Inc. Derivation of relationships between data sets using structured tags or schemas
US20080026742A1 (en) * 2006-07-28 2008-01-31 Sony Ericsson Mobile Communications Ab Information nugget sharing among mobile phones
US8271429B2 (en) 2006-09-11 2012-09-18 Wiredset Llc System and method for collecting and processing data
US7801901B2 (en) * 2006-09-15 2010-09-21 Microsoft Corporation Tracking storylines around a query
US8230361B2 (en) 2006-09-28 2012-07-24 Google Inc. Content feed user interface
US8645497B2 (en) * 2006-09-28 2014-02-04 Google Inc. Bookmark-based access to content feeds
US8694607B2 (en) * 2006-10-06 2014-04-08 Google Inc. Recursive subscriptions to content feeds
US7752328B2 (en) * 2006-10-16 2010-07-06 Rearden Commerce, Inc. System and method for view of transactions and events with dynamic updates
US20080091828A1 (en) * 2006-10-16 2008-04-17 Rearden Commerce, Inc. Method and system for fine and course-grained authorization of personal feed contents
US8863245B1 (en) 2006-10-19 2014-10-14 Fatdoor, Inc. Nextdoor neighborhood social network method, apparatus, and system
US7979425B2 (en) * 2006-10-25 2011-07-12 Google Inc. Server-side match
US8025220B2 (en) * 2006-11-10 2011-09-27 Fair Isaac Corporation Cardholder localization based on transaction data
US8316000B2 (en) 2006-12-07 2012-11-20 At&T Intellectual Property Ii, L.P. Method and apparatus for using tag topology
US20080155118A1 (en) * 2006-12-21 2008-06-26 International Business Machines Corporation Really simple syndication (rss) feed customization
US7562088B2 (en) * 2006-12-27 2009-07-14 Sap Ag Structure extraction from unstructured documents
US20080294663A1 (en) * 2007-05-14 2008-11-27 Heinley Brandon J Creation and management of visual timelines
US8290921B2 (en) * 2007-06-28 2012-10-16 Microsoft Corporation Identification of similar queries based on overall and partial similarity of time series
US20090030889A1 (en) * 2007-07-25 2009-01-29 Ehud Chatow Viewing of feeds
US9244968B2 (en) * 2007-08-14 2016-01-26 John Nicholas and Kristin Gross Trust Temporal document verifier and method
US8260009B2 (en) * 2007-08-15 2012-09-04 Indiana University Research And Technology Corp. System and method for measuring clarity of images used in an iris recognition system
JP5000427B2 (ja) * 2007-08-21 2012-08-15 京セラドキュメントソリューションズ株式会社 自動原稿給送装置および画像形成装置
US20090070346A1 (en) * 2007-09-06 2009-03-12 Antonio Savona Systems and methods for clustering information
US8060634B1 (en) 2007-09-26 2011-11-15 Google Inc. Determining and displaying a count of unread items in content feeds
US8024347B2 (en) 2007-09-27 2011-09-20 International Business Machines Corporation Method and apparatus for automatically differentiating between types of names stored in a data collection
US10025871B2 (en) 2007-09-27 2018-07-17 Google Llc Setting and displaying a read status for items in content feeds
US20090100031A1 (en) * 2007-10-12 2009-04-16 Tele Atlas North America, Inc. Method and System for Detecting Changes in Geographic Information
US8073682B2 (en) 2007-10-12 2011-12-06 Palo Alto Research Center Incorporated System and method for prospecting digital information
US8165985B2 (en) * 2007-10-12 2012-04-24 Palo Alto Research Center Incorporated System and method for performing discovery of digital information in a subject area
US8671104B2 (en) * 2007-10-12 2014-03-11 Palo Alto Research Center Incorporated System and method for providing orientation into digital information
US8280885B2 (en) 2007-10-29 2012-10-02 Cornell University System and method for automatically summarizing fine-grained opinions in digital text
US11263543B2 (en) 2007-11-02 2022-03-01 Ebay Inc. Node bootstrapping in a social graph
US8484142B2 (en) * 2007-11-02 2013-07-09 Ebay Inc. Integrating an internet preference learning facility into third parties
WO2009059199A2 (en) 2007-11-02 2009-05-07 Hunch Inc. Interactive machine learning advice facility
US8032480B2 (en) * 2007-11-02 2011-10-04 Hunch Inc. Interactive computing advice facility with learning based on user feedback
US8494978B2 (en) 2007-11-02 2013-07-23 Ebay Inc. Inferring user preferences from an internet based social interactive construct
US8666909B2 (en) 2007-11-02 2014-03-04 Ebay, Inc. Interestingness recommendations in a computing advice facility
US9159034B2 (en) 2007-11-02 2015-10-13 Ebay Inc. Geographically localized recommendations in a computing advice facility
US8375073B1 (en) 2007-11-12 2013-02-12 Google Inc. Identification and ranking of news stories of interest
US20090144226A1 (en) * 2007-12-03 2009-06-04 Kei Tateno Information processing device and method, and program
US7814108B2 (en) * 2007-12-21 2010-10-12 Microsoft Corporation Search engine platform
US7996379B1 (en) 2008-02-01 2011-08-09 Google Inc. Document ranking using word relationships
US7970739B2 (en) * 2008-04-30 2011-06-28 International Business Machines Corporation Method and system for maintaining profiles of information channels
US20090292688A1 (en) * 2008-05-23 2009-11-26 Yahoo! Inc. Ordering relevant content by time for determining top picks
US8725716B1 (en) * 2008-05-30 2014-05-13 Google Inc. Customized web summaries and alerts based on custom search engines
US8209616B2 (en) * 2008-08-28 2012-06-26 Palo Alto Research Center Incorporated System and method for interfacing a web browser widget with social indexing
US20100057536A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Community-Based Advertising Term Disambiguation
US20100057577A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing
US8010545B2 (en) 2008-08-28 2011-08-30 Palo Alto Research Center Incorporated System and method for providing a topic-directed search
US9411877B2 (en) * 2008-09-03 2016-08-09 International Business Machines Corporation Entity-driven logic for improved name-searching in mixed-entity lists
US8655800B2 (en) 2008-10-07 2014-02-18 Hewlett-Packard Development Company, L.P. Distance based visualization of event sequences
EP2349391B1 (en) * 2008-10-10 2016-07-27 Gambro Lundia AB Heat exchanger and method for heat exchanging
US20100094822A1 (en) * 2008-10-13 2010-04-15 Rohit Dilip Kelapure System and method for determining a file save location
US20100114887A1 (en) * 2008-10-17 2010-05-06 Google Inc. Textual Disambiguation Using Social Connections
US8549016B2 (en) * 2008-11-14 2013-10-01 Palo Alto Research Center Incorporated System and method for providing robust topic identification in social indexes
US8914359B2 (en) * 2008-12-30 2014-12-16 Microsoft Corporation Ranking documents with social tags
US8452781B2 (en) * 2009-01-27 2013-05-28 Palo Alto Research Center Incorporated System and method for using banded topic relevance and time for article prioritization
US8356044B2 (en) * 2009-01-27 2013-01-15 Palo Alto Research Center Incorporated System and method for providing default hierarchical training for social indexing
US8239397B2 (en) * 2009-01-27 2012-08-07 Palo Alto Research Center Incorporated System and method for managing user attention by detecting hot and cold topics in social indexes
US8583603B2 (en) 2009-04-02 2013-11-12 Microsoft Corporation Employing user-context in connection with backup or restore of data
KR100910718B1 (ko) * 2009-04-28 2009-08-04 황건하 동적 순위 갱신 시스템 및 그 갱신 방법
US8407212B2 (en) * 2009-05-20 2013-03-26 Genieo Innovation Ltd. System and method for generation of a customized web page based on user identifiers
US9026641B2 (en) * 2009-05-20 2015-05-05 Genieo Innovation Ltd. System and method for management of information streams delivered for use by a user
US8560575B2 (en) 2009-11-12 2013-10-15 Salesforce.Com, Inc. Methods and apparatus for selecting updates to associated records to publish on an information feed in an on-demand database service environment
US8429170B2 (en) * 2010-02-05 2013-04-23 Yahoo! Inc. System and method for discovering story trends in real time from user generated content
US20110219016A1 (en) * 2010-03-04 2011-09-08 Src, Inc. Stream Mining via State Machine and High Dimensionality Database
US8260789B2 (en) * 2010-04-01 2012-09-04 Microsoft Corporation System and method for authority value obtained by defining ranking functions related to weight and confidence value
US9031944B2 (en) 2010-04-30 2015-05-12 Palo Alto Research Center Incorporated System and method for providing multi-core and multi-level topical organization in social indexes
US9361130B2 (en) * 2010-05-03 2016-06-07 Apple Inc. Systems, methods, and computer program products providing an integrated user interface for reading content
WO2011149961A2 (en) 2010-05-24 2011-12-01 Intersect Ptp, Inc. Systems and methods for identifying intersections using content metadata
US8566348B2 (en) * 2010-05-24 2013-10-22 Intersect Ptp, Inc. Systems and methods for collaborative storytelling in a virtual space
US20110302103A1 (en) * 2010-06-08 2011-12-08 International Business Machines Corporation Popularity prediction of user-generated content
US8560554B2 (en) 2010-09-23 2013-10-15 Salesforce.Com, Inc. Methods and apparatus for selecting updates to associated records to publish on an information feed using importance weights in an on-demand database service environment
US9076146B2 (en) * 2010-10-15 2015-07-07 At&T Intellectual Property I, L.P. Personal customer care agent
US9286643B2 (en) 2011-03-01 2016-03-15 Applaud, Llc Personalized memory compilation for members of a group and collaborative method to build a memory compilation
US8615518B2 (en) * 2011-04-11 2013-12-24 Yahoo! Inc. Real time association of related breaking news stories across different content providers
EP2702481A4 (en) * 2011-04-26 2014-10-01 Hewlett Packard Development Co METHOD AND SYSTEM FOR HIERARCHICAL PREDICTION
US9195771B2 (en) 2011-08-09 2015-11-24 Christian George STRIKE System for creating and method for providing a news feed website and application
US8782042B1 (en) * 2011-10-14 2014-07-15 Firstrain, Inc. Method and system for identifying entities
US8713028B2 (en) * 2011-11-17 2014-04-29 Yahoo! Inc. Related news articles
US8572107B2 (en) * 2011-12-09 2013-10-29 International Business Machines Corporation Identifying inconsistencies in object similarities from multiple information sources
US9633118B2 (en) 2012-03-13 2017-04-25 Microsoft Technology Licensing, Llc. Editorial service supporting contrasting content
US9189473B2 (en) * 2012-05-18 2015-11-17 Xerox Corporation System and method for resolving entity coreference
US10275521B2 (en) * 2012-10-13 2019-04-30 John Angwin System and method for displaying changes in trending topics to a user
US10580243B2 (en) 2013-04-16 2020-03-03 Imageware Systems, Inc. Conditional and situational biometric authentication and enrollment
US9286528B2 (en) 2013-04-16 2016-03-15 Imageware Systems, Inc. Multi-modal biometric database searching methods
US10635732B2 (en) 2013-09-19 2020-04-28 Facebook, Inc. Selecting content items for presentation to a social networking system user in a newsfeed
WO2015056928A1 (en) * 2013-10-17 2015-04-23 Samsung Electronics Co., Ltd. Contextualizing sensor, service and device data with mobile devices
US9665828B2 (en) 2014-01-16 2017-05-30 International Business Machines Corporation Using physicochemical correlates of perceptual flavor similarity to enhance, balance and substitute flavors
US9439367B2 (en) 2014-02-07 2016-09-13 Arthi Abhyanker Network enabled gardening with a remotely controllable positioning extension
US9457901B2 (en) 2014-04-22 2016-10-04 Fatdoor, Inc. Quadcopter with a printable payload extension system and method
US9004396B1 (en) 2014-04-24 2015-04-14 Fatdoor, Inc. Skyteboard quadcopter and method
US9022324B1 (en) 2014-05-05 2015-05-05 Fatdoor, Inc. Coordination of aerial vehicles through a central server
US9971985B2 (en) 2014-06-20 2018-05-15 Raj Abhyanker Train based community
US9441981B2 (en) 2014-06-20 2016-09-13 Fatdoor, Inc. Variable bus stops across a bus route in a regional transportation network
US10601749B1 (en) 2014-07-11 2020-03-24 Twitter, Inc. Trends in a messaging platform
US10592539B1 (en) * 2014-07-11 2020-03-17 Twitter, Inc. Trends in a messaging platform
US9451020B2 (en) 2014-07-18 2016-09-20 Legalforce, Inc. Distributed communication of independent autonomous vehicles to provide redundancy and performance
US20160055164A1 (en) * 2014-08-25 2016-02-25 Tll, Llc News alert system and method
US9984166B2 (en) * 2014-10-10 2018-05-29 Salesforce.Com, Inc. Systems and methods of de-duplicating similar news feed items
US10592841B2 (en) 2014-10-10 2020-03-17 Salesforce.Com, Inc. Automatic clustering by topic and prioritizing online feed items
CN105335467A (zh) * 2015-09-25 2016-02-17 苏州天梯卓越传媒有限公司 一种用于出版行业热点选题的新颖性判断方法与系统
US11288296B2 (en) * 2015-10-07 2022-03-29 Koninklijke Philips N.V. Device, system, and method for determining information relevant to a clinician
US10372813B2 (en) * 2017-01-17 2019-08-06 International Business Machines Corporation Selective content dissemination
US10621177B2 (en) * 2017-03-23 2020-04-14 International Business Machines Corporation Leveraging extracted entity and relation data to automatically filter data streams
US20180330325A1 (en) 2017-05-12 2018-11-15 Zippy Inc. Method for indicating delivery location and software for same
US10698876B2 (en) 2017-08-11 2020-06-30 Micro Focus Llc Distinguish phrases in displayed content
US11244013B2 (en) 2018-06-01 2022-02-08 International Business Machines Corporation Tracking the evolution of topic rankings from contextual data
CN109635089B (zh) * 2018-12-14 2023-09-05 李华康 一种基于语义网络的文学作品新颖度评价系统和方法
CN111507110B (zh) * 2019-01-30 2022-10-18 国家计算机网络与信息安全管理中心 一种突发事件检测方法、装置、设备及存储介质
RU2698916C1 (ru) * 2019-03-14 2019-09-02 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Способ и система поиска релевантных новостей
CN112597269A (zh) * 2020-12-25 2021-04-02 西南电子技术研究所(中国电子科技集团公司第十研究所) 流式数据事件文本专题及检测系统
CN112668726B (zh) * 2020-12-25 2023-07-11 中山大学 一种高效通信且保护隐私的个性化联邦学习方法
CN114090771A (zh) * 2021-10-19 2022-02-25 广州数说故事信息科技有限公司 一种基于大数据的传播主张和消费者故事分析方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162639A (ja) * 2001-11-28 2003-06-06 Fujitsu Ltd 銘柄選択支援装置
US20050198056A1 (en) * 2004-03-02 2005-09-08 Microsoft Corporation Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US54130A (en) * 1866-04-24 Improvement in lever-power of windlasses
US43232A (en) * 1864-06-21 Improvement in preserving fruits
US80156A (en) * 1868-07-21 James k
US40591A (en) * 1863-11-10 Improvement in gas-heating apparatus
US44152A (en) * 1864-09-13 Improved tile-machine
US83025A (en) * 1868-10-13 Improved sofa-bedstead
US54174A (en) * 1866-04-24 Improved sad-iron
US43231A (en) * 1864-06-21 Improved tire or hoop bender
US80155A (en) * 1868-07-21 brisk ell
US46401A (en) * 1865-02-14 Improved milling-machine
US34078A (en) * 1862-01-07 Improvement in scroll-saws
US40590A (en) * 1863-11-10 Improvement in wrenches
US32689A (en) * 1861-07-02 Improvement in projectiles for ordnance
US154476A (en) * 1874-08-25 Improvement in sulky-plows
US52963A (en) * 1866-03-06 Improvement in carts
US99817A (en) * 1870-02-15 of chicago
US83158A (en) * 1868-10-20 Frank a
US87525A (en) * 1869-03-02 George tefft
US52930A (en) * 1866-02-27 Improvement in wrenches
US78204A (en) * 1868-05-26 Improved lounge
US7364A (en) * 1850-05-14 Preventing fibers from winding ob drawing rollers in spinning
US5434777A (en) * 1992-05-27 1995-07-18 Apple Computer, Inc. Method and apparatus for processing natural language
US6311157B1 (en) * 1992-12-31 2001-10-30 Apple Computer, Inc. Assigning meanings to utterances in a speech recognition system
US5384892A (en) * 1992-12-31 1995-01-24 Apple Computer, Inc. Dynamic language model for speech recognition
US5812865A (en) 1993-12-03 1998-09-22 Xerox Corporation Specifying and establishing communication data paths between particular media devices in multiple media device computing systems based on context of a user or users
US5493692A (en) 1993-12-03 1996-02-20 Xerox Corporation Selective delivery of electronic messages in a multiple computer system based on context and environment of a user
US5555376A (en) 1993-12-03 1996-09-10 Xerox Corporation Method for granting a user request having locational and contextual attributes consistent with user policies for devices having locational attributes consistent with the user request
US6035104A (en) 1996-06-28 2000-03-07 Data Link Systems Corp. Method and apparatus for managing electronic documents by alerting a subscriber at a destination other than the primary destination
GB9701866D0 (en) * 1997-01-30 1997-03-19 British Telecomm Information retrieval
US6418431B1 (en) * 1998-03-30 2002-07-09 Microsoft Corporation Information retrieval and speech recognition based on language models
US6209023B1 (en) * 1998-04-24 2001-03-27 Compaq Computer Corporation Supporting a SCSI device on a non-SCSI transport medium of a network
US6421711B1 (en) * 1998-06-29 2002-07-16 Emc Corporation Virtual ports for data transferring of a data storage system
US6470397B1 (en) * 1998-11-16 2002-10-22 Qlogic Corporation Systems and methods for network and I/O device drivers
US6812937B1 (en) 1998-12-18 2004-11-02 Tangis Corporation Supplying enhanced computer user's context data
US7080322B2 (en) 1998-12-18 2006-07-18 Tangis Corporation Thematic response to a computer user's context, such as by a wearable personal computer
US6801223B1 (en) 1998-12-18 2004-10-05 Tangis Corporation Managing interactions between computer users' context models
US7076737B2 (en) 1998-12-18 2006-07-11 Tangis Corporation Thematic response to a computer user's context, such as by a wearable personal computer
US6747675B1 (en) 1998-12-18 2004-06-08 Tangis Corporation Mediating conflicts in computer user's context data
US7055101B2 (en) 1998-12-18 2006-05-30 Tangis Corporation Thematic response to a computer user's context, such as by a wearable personal computer
US6466232B1 (en) 1998-12-18 2002-10-15 Tangis Corporation Method and system for controlling presentation of information to a user based on the user's condition
US7107539B2 (en) 1998-12-18 2006-09-12 Tangis Corporation Thematic response to a computer user's context, such as by a wearable personal computer
US6363427B1 (en) * 1998-12-18 2002-03-26 Intel Corporation Method and apparatus for a bulletin board system
US6513046B1 (en) 1999-12-15 2003-01-28 Tangis Corporation Storing and recalling information to augment human memories
US6791580B1 (en) 1998-12-18 2004-09-14 Tangis Corporation Supplying notifications related to supply and consumption of user context data
US6842877B2 (en) 1998-12-18 2005-01-11 Tangis Corporation Contextual responses based on automated learning techniques
US6389432B1 (en) * 1999-04-05 2002-05-14 Auspex Systems, Inc. Intelligent virtual volume access
WO2001075676A2 (en) 2000-04-02 2001-10-11 Tangis Corporation Soliciting information based on a computer user's context
JP3562572B2 (ja) 2000-05-02 2004-09-08 インターナショナル・ビジネス・マシーンズ・コーポレーション データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡
CN1336610A (zh) * 2000-07-27 2002-02-20 国际商业机器公司 网上商务交易的广告方法及其系统
US20020054130A1 (en) 2000-10-16 2002-05-09 Abbott Kenneth H. Dynamically displaying current status of tasks
US20030046401A1 (en) 2000-10-16 2003-03-06 Abbott Kenneth H. Dynamically determing appropriate computer user interfaces
US20020044152A1 (en) 2000-10-16 2002-04-18 Abbott Kenneth H. Dynamic integration of computer generated and real world images
GB2388738B (en) * 2001-11-03 2004-06-02 Dremedia Ltd Time ordered indexing of audio data
US6801917B2 (en) * 2001-11-13 2004-10-05 Koninklijke Philips Electronics N.V. Method and apparatus for partitioning a plurality of items into groups of similar items in a recommender of such items
JP4452012B2 (ja) 2002-07-04 2010-04-21 ヒューレット・パッカード・カンパニー 文書の特有性評価方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162639A (ja) * 2001-11-28 2003-06-06 Fujitsu Ltd 銘柄選択支援装置
US20050198056A1 (en) * 2004-03-02 2005-09-08 Microsoft Corporation Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100684160B1 (ko) 2005-12-08 2007-02-20 한국전자통신연구원 개체명 인식을 이용한 대화 분석 장치 및 방법
WO2009043041A3 (en) * 2007-09-28 2009-10-15 Microsoft Corporation Aggregating and delivering information
JP2014112367A (ja) * 2012-11-26 2014-06-19 Boeing Co 検索中に関連性のない情報を削減するシステム及び方法
JP2016505995A (ja) * 2013-01-14 2016-02-25 ドロップボックス, インコーポレイテッド 複数のクライアントデバイスに亘る通知フィード
JP2015232855A (ja) * 2014-06-11 2015-12-24 日本電信電話株式会社 イベント同一性判定方法、イベント同一性判定装置、イベント同一性判定プログラム

Also Published As

Publication number Publication date
RU2005105751A (ru) 2006-08-10
KR101114012B1 (ko) 2012-03-13
US20050198056A1 (en) 2005-09-08
CN101256591B (zh) 2011-02-23
CN1664819A (zh) 2005-09-07
KR20060043331A (ko) 2006-05-15
CA2498376C (en) 2013-10-22
EP1571579A1 (en) 2005-09-07
US7293019B2 (en) 2007-11-06
CN101256591A (zh) 2008-09-03
CA2498376A1 (en) 2005-09-02
AU2005200877A1 (en) 2005-09-22
AU2005200877B2 (en) 2011-02-03
JP4845392B2 (ja) 2011-12-28
BRPI0500612A (pt) 2005-11-08
RU2382401C2 (ru) 2010-02-20

Similar Documents

Publication Publication Date Title
JP4845392B2 (ja) 情報ノベルティ(novelty)と情報ダイナミックス(dynamics)の分析によってニュースフィード(newsfeeds)をパーソナライズ(personalizing)するための原理および方法
Gabrilovich et al. Newsjunkie: providing personalized newsfeeds via analysis of information novelty
US9542393B2 (en) Method and system for indexing and searching timed media information based upon relevance intervals
US8965893B2 (en) System and method for grouping multiple streams of data
KR101268693B1 (ko) 단문 메시지를 이용한 미디어 이벤트 구조 및 콘텍스트 식별
US7174377B2 (en) Method and apparatus for collaborative document versioning of networked documents
JP5021640B2 (ja) ユーザのアクティビティ、アテンション、および関心事のデータ活用手段の検知、格納、索引作成、および検索
US20070112719A1 (en) System and method for dynamically generating and managing an online context-driven interactive social network
US20110093459A1 (en) Incorporating Recency in Network Search Using Machine Learning
US20110289088A1 (en) System and method for ranking content interest
US20060136451A1 (en) Methods and systems for applying attention strength, activation scores and co-occurrence statistics in information management
JP5292250B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム
JP4797069B2 (ja) キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法
AU2009234120A1 (en) Search results ranking using editing distance and document information
US10467255B2 (en) Methods and systems for analyzing reading logs and documents thereof
Samory et al. Quotes reveal community structure and interaction dynamics
Badache et al. A priori relevance based on quality and diversity of social signals
JP2009211514A (ja) 関係情報取得システム、関係情報取得方法および関係情報取得用プログラム
US20060136245A1 (en) Methods and systems for applying attention strength, activation scores and co-occurrence statistics in information management
MXPA05002372A (en) Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics
Vanetik et al. Real-World Events Discovering with TWIST
JP2010061284A (ja) 辞書構築促進装置、辞書構築装置、辞書構築促進方法、辞書構築方法および辞書構築促進プログラム
SESSION Ganesh Shankaran
Joshila Grace et al. Personalised High Quality Search with in a Web Site: No User Profiling

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080303

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111004

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111011

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees