JP2010176667A - 帯域化されたトピック関連度と記事の優先順位付けのための時間を用いるためのシステム及び方法 - Google Patents

帯域化されたトピック関連度と記事の優先順位付けのための時間を用いるためのシステム及び方法 Download PDF

Info

Publication number
JP2010176667A
JP2010176667A JP2010010999A JP2010010999A JP2010176667A JP 2010176667 A JP2010176667 A JP 2010176667A JP 2010010999 A JP2010010999 A JP 2010010999A JP 2010010999 A JP2010010999 A JP 2010010999A JP 2010176667 A JP2010176667 A JP 2010176667A
Authority
JP
Japan
Prior art keywords
articles
topic
relevance
time
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010010999A
Other languages
English (en)
Inventor
Mark J Stefik
ジェイ.ステフィク マーク
Sanjay Mittal
ミッタル サンジェイ
Lance E Good
イー.グッド ランス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2010176667A publication Critical patent/JP2010176667A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • G06F16/3328Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages using graphical result space presentation or visualisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ディジタル情報検索と意味付けにおいて、帯域化されたトピック関連度と記事の優先順位付けのための時間を用いるためのコンピュータ実施方法を提供する。
【解決手段】コンピュータ実施方法150において、最初に、主題領域、トピック、及び情報源を定義し(ステップ151)、トピックごとにトピックモデルを検索し(ステップ152)、記事を収集し、この記事を、細粒度トピックモデルを用いて情報源からソーシャルインデックスへ簡潔に分類し(ステップ153)、ソーシャルインデックスに対して関連度帯域を作成し(ステップ154)、記事を特定周期に制限する時間調整を適用し(ステップ155)、最後に、関連度帯域にグループ化され時間仕分けされた記事は、時系列において最高の関連度を有する帯域からの記事を最初に提示することによって、ユーザインターフェースによって提示される(ステップ156)。
【選択図】図14

Description

本発明は、一般に、ディジタル情報検索とセンスメイキング(意味付け)に係り、より詳細には、帯域化されたトピック関連度と記事の優先順位付けのための時間を使用するためのシステム及び方法を提供する。
世界的な「“Web”(ウェブ)」は、新しい情報が連続的に公開されるオープンエンド(無制限)なリポジトリ(保存場所)である。ウェブ情報は、著者、編集者、共同製作者、及び、例えば、「“Web log”(ウェブログ)」又は「“Blog”(ブログ)」を介してコメントする外部の寄稿者を含む様々な情報源から発信される。このような多様性は、潜在的に広大なトピック(表題)インデックスを示唆し、これらのインデックスは、根底にある情報と同様に、絶え間なく、成長し変化する。また、多様性は、インデックスにおけるトピックのいくつかが、経時的に、だんだん「冷めた」、又は、トピックの中心から外れてしまった他のトピックよりタイムリーであること、即ち、「熱い」ことを示唆している。
ソーシャルインデクシング(社会索引付け)システムは、情報を提供し、それらのユーザによって構築されたインデックスのトピック別分類に応じたエバーグリーンな(常に新しい)情報を編成するサービスを検索する。例えば、その全体を参照することによって本明細書中に組み込まれている2008年8月12日付けで同一出願人により係属出願中の特許文献1に開示されているように、ウェブなどの無制限な情報源をエバーグリーンなソーシャルインデックス(社会索引)としてトピック別に編成することで、情報の発見や検索が容易になる。
ソーシャルインデックスは、エバーグリーン情報をトピック別に編成する。ユーザは、ソーシャルインデックスのためにトピックを定義し、トピックを階層的に編成する。次に、ユーザは、システムと対話して、ソーシャルインデックスのトピックにあてはまる記事を分類するために、ロバスト(堅牢)なモデルを構築する。トピックモデルは、Id.(アィディー(識別情報))において記載されているような、例えば、用例ベース訓練(example−based training)を介して、又は、例えば、その全体が参照することによって本明細書中に組み込まれている、2009年1月27日付けで出願係属中の同一出願人による特許文献2に開示されているようなデフォルト(初期設定)訓練によって、作成される。用例ベース訓練は、ポジティブな例記事にはうまく整合するが、ネガティブな例記事には整合しない有限状態パターンとして生成される細粒度トピックモデルを生成するが、デフォルト訓練は、個々のトピックラベルとツリー内のラベル場所の両方を用いて、階層的トピックツリーに基づいた自己案内方式で、トピックモデルを形成する。
更に、システムは、例えば、その全体が参照することによって本明細書中に組み込まれている、2009年1月15日付けで出願係属中の同一出願人による特許文献3に開示されているように、特徴的単語の母集サイズに基づいて粗粒度トピックモデルを構築することができる。粗粒度トピックモデルは、記事が大まかにトピックに関連しているかあるかどうかを認識するために使用される。細粒度トピックモデルに整合するが、ポジティブな訓練例の記事の基準とはかけ離れている統計的単語の用法は、「ノイズ(雑)」記事として認識される。粗粒度トピックモデルは、その全体が参照することによって本明細書中に組み込まれている2008年11月14日付けで仮出願係属中の同一出願人による特許文献4に開示されているように、「ニアミス」、即ち、単語用法が訓練例に類似しているが、例えば、好ましい細粒度トピックモデルのいずれにも整合してない記事を示唆する。
このように、ソーシャルインデクシングシステムは、ソーシャルインデックスにおける細粒度トピックモデルに応じて、トピック別に編成された主題領域内で記事を表示する。記事は、ユーザインタフェースを介して、ユーザによって選択され得る。これらのシステムのトピック別索引付けと検索の機能は、ユーザが指定するトピック情報へのすばやいアクセスに有効である。しかしながら、これらの機能は、個々のユーザのそれぞれの情報目標に最も効率よく到達するにはどうすべきかについては示唆していない。これらの情報目標は、最新「ニュース」へ注目し、数日間にわたって出現する最新トピックの記事に追いつき、又は、トピックに関する最も決定的な記事を読むことを含む。
以下に詳細に記載されるところの、オンラインニュース、ソーシャル媒体捕集、及び自動的ニュース捕集ウェブ(Web)サイトによって使用される方法は、記事の一元的な順序に依存しているため、ユーザの様々な情報目標を満たすことができない。
米国特許公開第2009−0099996A1号 米国特許出願第12/350,825号 米国特許出願第12/354,681号 米国特許仮出願第61/115,024号
トピックに含まれる記事は、「非常に関連している」、「関連している」、及び「少し関連している」等の関連度帯域別にグループ化されて表示され、最も関連度の高い帯域から開始して表示される。これらの記事は、各帯域内で時間によって仕分けされ、時間領域外の記事は、フィルタリングされて除外される。記事を提示するための論理的且つ単純な調整は、多様なユーザ情報目標を収容し、トピック寿命周期に応じて変化する関連度の一般的なパターンに適合させる。この調整は、初心者のユーザに、情報の関連度又は最新度に基づいて優先順位を決定するための複雑な検索目標の整理を要求しないという利点があった。
本発明の一つの態様は、帯域化されたトピック関連度と記事の優先順位付けのための時間を使用するためのコンピュータ実施方法であって、ディジタル情報の記事と、記事の一つ以上に各々が関連しているトピックを含む少なくとも一つのソーシャルインデックスと、を保持し、トピック毎に、ディジタル情報に整合される細粒度トピックモデルを検索し、細粒度トピックモデルを用いてトピックに含まれる記事を簡潔に仕分けし、記事が仕分けされたトピック内の記事の各々を関連度によって採点し、記事を関連度得点によって特定の帯域内へ配列し、特定の帯域内で記事を時間によって仕分けし、特定の帯域内で記事を提示することを含む。
本発明を実施するための最良の方法を例示することによって実施形態が説明されている以下の本発明の詳細な説明によって、本発明の更に他の実施の形態が適用できることを当業者は容易に理解するであろう。明確であるように、本発明の精神及び範囲から逸脱しない限り、この形式及び細部に上述及びその他の変更を加えてもよいことも理解されよう。従って、添付図面と発明を実施するための形態は、本来、例示のみを目的としており、本発明を限定するものではないことも理解されよう。
ディジタル情報のための例示的な環境を示すブロック図である。 図1の環境に使用される基本的な構成要素を示す機能ブロック図である。 ソーシャルインデクシングシステムを例示している画面図である。 ソーシャルインデックス内の二つのトピックに当てはまる記事の一例を示す画面図である。 それぞれが、「熱い」、「冷めた」、「周期的に出現する」パターンを例示しているグラフである。 それぞれが、「熱い」、「冷めた」、「周期的に出現する」パターンを例示しているグラフである。 それぞれが、「熱い」、「冷めた」、「周期的に出現する」パターンを例示しているグラフである。 「冷めてきた」トピックの記事の数及び関連度の低下を例示しているグラフである。 Reddit(レディット)ソーシャルニュースシステムの下に表示される記事の一例を示す画面図である。 Google News(グーグルニュース)アーカイブシステムの下に表示される記事の一例を示す画面図である。 Digg(ディッグ)ニュースシステムの下に表示される記事の一例を示す画面図である。 Digg(ディッグ)ニュースシステムの下に表示される記事の一例を示す画面図である。 Digg(ディッグ)ニュースシステムの下に表示される記事の一例を示す画面図である。 本発明の一実施の形態による、帯域化されたトピック関連度及び記事の優先順位付けのための時間を用いる方法を示すフローチャートである。 関連度が帯域化され、時間によって仕分けされた記事の一例を示す画面図である。 図14の方法に使用される関連度帯域を作成するためのルーチンを示すフローチャートである。 時間周期を調整せずに関連度帯域によって編成された記事数を例示しているグラフである。 図14の方法に使用される時間周期を調整するためのルーチンを示すフローチャートである。 二日間閲覧の時間周期に対して関連度帯域によって編成された記事数の一例を示すグラフである。
用語集
以下の用語は、明細書全体を通して使用され、特に注釈がなければ、以下に記載の意味を含む。
・ コーパス: 記事、ドキュメント、ウェブページ、電子ブック、又は印刷材料として入手できる他のディジタル情報(など大量の言語データ)の集まり又は集合。
・ ドキュメント(文書): コーパス内の個々の記事。ドキュメントは、書籍の章又は節、又はより大きな著作品の細目を含む。文書は様々なトピックのいくつかの引用頁を含み得る。
・ 引用頁: 頁番号などのインデックスが引用するドキュメント内の場所。引用頁は、単頁又は頁集合であってよい。引用頁において、サブトピックは、索引付けのための細粒度トピックモデルによって拡張され、頁集合は、細粒度トピックモデルに整合する全頁を含む。各引用頁は、頁全体よりはるかに小さく、例えば、細粒度トピックモデルと整合する段落などをいう。
・ 主題領域(サブジェクトエリア): エバーグリーンインデックスとこれと等価のインデックスを含むソーシャルインデックスにおけるトピックとサブトピックの集合である。
・ トピック(表題): トピック別のカテゴリを特徴付けるソーシャルインデックス内の単一エントリ。エバーグリーンインデックスにおいて、記述モデルを有し、これを伴う。
・ サブトピック: ソーシャルインデックス内のトピック下に階層的に例挙される単一エントリ。エバーグリーンインデックスにおいて、サブトピックは細粒度トピックモデルを伴う。
・ 細粒度トピックモデル: 細粒度トピックモデルは、有限状態計算に基づいており、記事が特定のトピックの範囲内に入っているかを判断するために使用される。各保存された細粒度トピックモデルは、有限状態パターンであり、クエリ(照会)に類似している。細粒度トピックモデルは、ポジティブな訓練例及びネガティブな訓練例に照らして、有限状態マシンを訓練することによって作成される。
・ 粗粒度トピックモデル: 粗粒度トピックモデルは、特徴的単語に基づき、どのトピックが照会に整合するかを判断する時に使用される。各保存された粗粒度トピックモデルは、トピックに対して重要な特徴的単語の集合であり、各特徴的単語の重要度を示すスコア(得点)である。この粗粒度トピックモデルは、ポジティブ訓練例、及びインデックス内の全てのトピックに関連している記事の基準(ベースライン)サンプルから生成される。基準サンプルは、基準単語の出現頻度を確立する。ポジティブ訓練例の単語の出現頻度と基準サンプルの単語の出現頻度が比較される。粗粒度トピックモデルはトピックのサブインデックス生成に使用される他に、広告指標化、ノイジー記事の検出、ニアミス(極めて類似している記事)の検出、及び他の目的に使用され得る。
・ 共同体: オンラインの特定の主題領域で、関心ある主要トピックを共有し、そのインタラクション(対話)の少なくとも一部に対して、コンピュータネットワークが介在している。主題領域の定義付けは多岐にわたり、ヨットレース、有機園芸などの趣味的分野から、歯科医又は内科医などの職業的関心、又は、後発性糖尿病のケアなどの医学的関心に及ぶ。
・ 拡張(オーグメント)共同体: 主題領域上にソーシャルインデックスを有する共同体。拡張共同体は、ソーシャルインデックスによって既に引用されている主題領域内でドキュメントを読出し、あるいは、投票にかけて、参加する。
・ エバーグリーンインデックス: エバーグリーンインデックスは、コーパスに対して「常に新しい状態を維持する」ソーシャルインデックスである。実施例としては、ソーシャルインデクシングシステムは、コーパスの新しいドキュメントを識別するために、RSS(アールエスエス:RDF(リソース記述枠組みの略)サイトサマリー)形式のフィード又はクロールウェブサイトをポーリング(調査)する。
・ ソーシャルインデクシング(社会索引付け)システム: ソーシャルインデックス(社会索引)を用いたオンライン情報交換。このシステムは、拡張共同体間の情報交換を容易にし、状態インジケータを提供し、関心が持たれる文書を一つの拡張共同体から他の拡張共同体へ渡すことを可能にする。拡張共同体の相互接続された集合は、共同体のソーシャルネットワークを形成する。
・ 情報ダイエット(絞込み): 情報ダイエットは、ユーザが「消費する」即ち「関心ある主題を越えて読む」情報を特徴付ける。例えば、ユーザの情報消費動作において、ユーザは、選挙関連ニュースに25%、ローカルニュースに15%、芸能関連トピックに10%、健康増進関連トピックの新しい情報に10%、特定の職業関連に20%、経済発展に10%、エコロジーや新しいエネルギ資源の開発に10%、その時間を費やしている。ソーシャルインデクシングシステムが付与されれば、ユーザは、自分の情報ダイエットにおいてユーザが関心を持つ選別された拡張共同体への参加やモニタリングを行うことができる。
ディジタル情報インフラストラクチャは、パブリック(公共)データネットワーク、例えば、インターネット、独立型コンピュータシステム、及び電子的に記録された情報の無制限なリポジトリ(保存場所)を含む。図1は、ディジタル情報に対する例示的環境10を示すブロック図であり、環境10は、ソーシャルインデクシング活動を支援するソーシャルインデクシングシステム11を含む。インターネットなどのディジタルデータ通信ネットワーク16は、ディジタル情報を交換するためのインフラストラクチャを提供する。他のネットワークインフラストラクチャ、例えば、ノンパブリック(非公共)法人企業ネットワークも利用可能である。ネットワーク16は、それぞれがディジタル情報を供給し消費する多様な分散した情報源及び消費者に対して相互接続性をもたらす。著者、編集者、共同制作者、及び外部寄稿者などが、ネットワーク16に、記事、ウェブページなどを次から次へと公開し、ウェブサーバ14a、ニュースアグリゲータ(捕集)サーバ14b、投票によるニュースサーバ14c、及び情報源として作用する他のデータリポジトリを介して、分散したデータコーパスとして保持される。これらのソースは、ウェブコンテンツ15a、ニュースコンテンツ15b、共同体の投票にかけて「選ばれた」又は「吟味された」コンテンツ15c、及び他の情報を、パソコン等のユーザ装置13a〜cのみならず、すべてが情報消費者として機能する他のサーバを介してネットワーク16にアクセスするユーザへ、供給する。サーバ及び他の非利用者(ノンユーザ)装置情報の消費者も同様に、コーパス内の情報を探索、検索、及び利用することができるが、ここでは、より簡単化するためにユーザ装置のみを取り上げて説明する。
一般に、各ユーザ装置13a〜cは、サーバ14a〜cとインターフェースして、情報交換及び検索することを支援するウェブブラウザ(“Web Browser”)又は同様のアプリケーションを実行する、ウェブ対応装置である。ユーザ装置13a〜cとサーバ14a〜cは共に、中央処理装置、メモリ、入力/出力ポート、ネットワークインターフェース、非揮発性記憶装置などの汎用のプログラマブル計算装置において従来の技術において知られている構成要素を含が、他の構成要素が使用されてもよい。更に、サーバ14a〜cに代えて又はこれに加えて他の情報源も利用可能であり、ユーザ装置13a〜cに代えて又はこれに加えて他の情報消費者も利用可能である。
ソーシャルインデクシングシステム11は、例えば、その全体が参照することによって本明細書中に組み込まれている2008年8月12日付けで同一出願人により係属出願中の米国特許公開第2009−0099996A1号に開示されているように、ソーシャルインデクシングを介してエバーグリーンインデックス下でトピック別に編成される記事を供給する。ソーシャルインデクシングシステム11は、例えば、その全体が参照することによって本明細書中に組み込まれている、2009年1月27日付けで同一出願人により係属出願中の米国特許出願第12/360,834号に開示されているように、ユーザの最新情報への要求に応じて、どのトピックが最も「熱い」か、どのトピックが「冷めた」か、を判断する。最後に、ソーシャルインデクシングシステム11は、図3を参照して、更に説明されるように、(時間によって仕分けされ時間領域によってフィルタリング(選別)される)関連度帯域別に記事をグループ化して表示する。
ユーザの観点からすると、ディジタル情報検索のための環境10は、単一情報ポータルとして出現するが、実際には、分離されているが、統合されたサービスの集合である。図2は、図1の環境10において使用される基本的な構成要素20を示す機能ブロック図である。ディジタル情報の発見、探査、方向付け、検索等の他の関連するディジタル情報動作を提供するために更なる構成要素が必要とされる場合もある。
構成要素20は、情報収集部21、ソーシャルインデクシング22、及びユーザサービス23から成る三つの基本機能モジュールへ大まかにグループ化され得る。他の機能モジュールも使用可能である。更に、機能モジュールは、同一の又は別個の計算プラットフォーム上で実施され得る。情報収集部21は、電子的に記憶された情報の分散型コーパスを集合的に形成する、ウェブサーバ14a、ニュース捕集サーバ14b、投票によるニュースサーバ14cを含む無制限な情報ソースから、ウェブコンテンツ15a、ニュースコンテンツ15b、及び「吟味された」コンテンツ15cなどの着信コンテンツ24を得る。着信コンテンツ24は、コーパスからの新しいディジタル情報を収穫するために記憶媒体収集装置によって収集される。着信コンテンツ24は、一般に、構造リポジトリに記憶されるか、又は、実際の複写を保持する代わりに、着信コンテンツのハイパーリンク又は引用を保存することによって、間接的に記憶される。
着信コンテンツ24は、情報が元から記憶されていた表現とは異なる複数の表現において記憶され得る。異なる表現が、タイトルの表示、記事要旨の提示、トピック別分類の追跡、及び、細粒度トピックモデルの導出及び使用を容易にするために使用され得る。記事における単語も、ステム(語幹化)され、トークン(文字列分割)形式、マイナス句読点、大文字などにおいて保存され得る。さらに、ソーシャルインデクシングシステム11によって作成される細粒度トピックモデルは、単語の大部分が廃棄され、主に単語の出現頻度が保持される着信コンテンツ24のかなり抽象的なバージョンを表現する。
着信コンテンツ24は、好ましくは、記憶装置25内で保持されるトピックインデックス29の下で編成される。トピックインデックス29は、全ての情報を網羅するトピックインデックスの大きい集合26の一部であってもよい。トピックインデックス29は、その全体が参照することによって本明細書中に組み込まれている2008年8月12日付けで同一出願人により係属出願中の米国特許公開第2009−0099996A1号に開示されているように、ソーシャルインデックス22を介して構築されるエバーグリーンインデックスであってもよい。エバーグリーンインデックスは、新しい情報がインデックス内のトピックの一つ以上にあてはまるか否かを試験するために用いられる有限状態パターンなどの細粒度トピックモデルを含む。ソーシャルインデクシング22は、教師有りマシン学習をブートストラップ訓練材料に適用して、トピックインデックス29のトピック及びサブトピックごとに細粒度トピックモデルを作成する。或いは、その全体が参照することによって本明細書中に組み込まれている2009年1月27日付けで同一出願人により係属出願中の米国特許出願第12/350,825号に開示されているように、ソーシャルインデックス22は、個々のトピックラベルとツリー内でのラベル場所の両方を用いて、階層的トピックツリーに基づいて、自己案内方式のトピックモデルを形成するために、デフォルト訓練を実行する。デフォルト訓練が実行されると、エバーグリーンインデックスが、新しい着信コンテンツ24を予め選択された主題領域のトピックへ自動分類するためのインデックス外挿として使用される。
ユーザサービス23は、ユーザがトピックインデックスの集合26と着信コンテンツ24にアクセスし、トピックインデックスの集合26又は単一のトピックインデックス29に対して照会検索を実行し、次に、検索結果、トピックインデックス、及び焦点が絞られたサブインデックスにアクセスできるように、ユーザ27a〜bに、フロントエンドを提供する。また更なる実施形態において、各トピックインデックス29は、「“augmented”(:拡張された)」共同体として知られるユーザの共同体につながっている。拡張共同体は、中心となる主題領域において進行中の興味を持っている。この共同体は、情報が割り当てられたトピックにおいて「投票」28をかけて引用された情報を「吟味」する。
ニュースサービスや情報検索サービスと同様に、ソーシャルインデックスは選択された記事の要約を提示する。図3は、ソーシャルインデクシングシステム41の一例を示す画面図40である。記事サマリー(要約)は、特定化されたユーザ情報の要求に応えるコンテクスト内に提示され、以下を含む:
● 様々なユーザ定義パースペクティブ(観点): 特定の目的の対象グループにしたがって情報を編成するインデックスに反映されるソーシャルインデックスは、情報に関する複数のユーザ定義観点を提供する。多様な観点は、例えば、「“Innovation”(発明)」、「“Sustainable Living(地球に優しい生活)”」、「“Venture Capital Action”(ベンチャー資本投資)」、「“Jokes” (ジョーク)」、「“USA”(アメリカ合衆国)」、及び「“World News”(ワールドニュース)」などの競合する流動的なトピック編成構造によって支持される。情報は、様々な目的のための数多くの場所で編成されたソーシャルインデックスにおいて出現する。各対象グループ内でユーザは、常に新しい編成(organization)を定義することができる。
● 細粒度トピックモデル編成: ソーシャルインデックスは、潜在的に数百万ともいわれる主題領域において編成された情報を網羅することを目的とする。情報は、ソーシャルインデックスの各主題領域内において、更に、40〜50個の細粒度トピック52へ編成される。これらの細粒度トピックは、主題領域を理解するために適した情報についての観点を提供するために予め定義されて編成される。ソーシャルインデックスに含まれる情報の細粒化された編成は、最新の情報を含むすべての情報に当てはまる。ソーシャルインデクシングシステムにおける最新情報は、各主題に適した細粒化されたトピック構造と共に、通知される。
● アーカイブ(保管)情報 対 最新ニュース: ソーシャルインデクシングシステムは、長期間にわたって情報を収集する。アーカイブ情報へのユーザアクセスを支援することは、例えば、最新ニュース、やや新しい情報、及び特定の目的としては既に古く、ともすれば時代遅れの情報などの様々な時間的領域を識別する時間的解析を必要とする。
個々のユーザが特定の情報目標を有している場合、記事が表示される順序付けが、ユーザが特定の情報に到達するまでの時間が問題となり影響を与える場合は特に、ある記事の順序付けが、他の順序付けよりも効率的に作用する場合もある。図4は、一例として、ソーシャルインデックス51内の二つのトピックに当てはまる記事を示す画面図である。記事は、定義されていない期間にわたって寄稿され、アラバマ州の犯罪者に対する裁判と判決に関して記録している。この特定の場合において、記事の記録上の順序付けは、有効に作用するが、一般に、各ユーザが多様な情報目的を有しているので、所与のトピック上の記事に関する唯一最良の順序付けというものは存在し得ない。また、たとえトピックの中心が提示されても、多様なユーザは、多様な情報目標を建て得る。例えば、多様な目標は、以下を含む:
● トピックについての最新情報を得たい(ユーザが一時間前又は一日前のニュースなどの最新の事件を辿るときに発生する)。
● 最も関連する情報(トピックの中心)をもう一度閲覧したい(トピックをもっと良く知りたいときに発生する)。
● 以上の目標を組み合わせて閲覧したい(先週到着した最も関連するニュースに追い付くなどのバリエーションを含む)。
他の情報目標も利用できる。
これらの情報の目標に応じる方法としては、時間又は関連度によって記事を仕分けできる調整を提供することである。しかしながら、この方法の欠点は、トピック寿命を考慮すると、理解できる。例えば、図5〜図7は、それぞれ、「熱い」、「冷めた」、「周期的に出てくる」トピック61、71、81のパターンを例示したグラフ60、70、80である。x軸は、現在から遠ざかっていく時間を表し、y軸は1日間にわたって数えられた記事の数を表す。まず図5を参照すると、最近の時間間隔に通常より多くの記事が届いている場合、そのトピックは「熱い」ものとなる。様々な外部要因によって、トピックは熱くなり得る。例えば、画期的な又は刺激的な製品の公表がきっかけで記事の数が著しく増加することによって、対応するトピックが熱くなり得る。同様に、嵐又は自然災害が、押し寄せる記事をもたらすこともある。記事の数に信号(例えば、ユーザの票や評判測度)を組み合わせて、トピック熱さの複合測度を作成することができる。次に図6を参照すると、そのトピックに関する記事が長期間にわたってほんの数件しか届いていない場合、或いは、記事がそのトピックの周辺にしか表示されていない場合、そのトピックは「冷めた」ものとなる。最後に図7を参照すると、トピックの中には、周期的に熱くなったり冷めたりするものもある。例えば、オリンピック大会やその他のスポーツイベントに関するニュース記事は、周期的な暦ベースで報告される。また、政府の選挙に関する記事も同様である。
トピックの寿命期間において、トピックに含まれる記事の数及び相対的な関連度は変化し得る。図8は、冷めつつあるトピックの記事の数と関連度の低下を示すグラフ90である。x軸は、現在から遠ざかっていく時間を表し、y軸は、関連度測定値としてのトピックの得点を表す。時間のスケールは、大まかに対数で表わされている。トピック点数は、トピックの中心に対する近さの測度として機能し得る線形測度であり、トピックの中心にある記事に関しては100点であって、トピックの外縁にある記事に関しては0に近づいていく。その全体が参照することによって本明細書中に組み込まれている、2009年1月15日付けで出願係属中の同一出願人による米国特許出願第12/354,681号に開示されているように、トピック点数は、特徴的な単語を用いて計算される。トピックが熱かった時の今から約一月前にはそのトピックに関する記事が集中的に押し寄せて公開された。しかしながら、現在に近づいていく単位時間当たりの記事の数は、減っていっている。また、記事のトピック関連度における目立った変化も生じている。記事数がピークのときには、記事のトピック関連度が最も高いが、次の期間では、この最高で新しい記事のトピック関連度は、低下する。また、一種の背景雑音を作り出す、記事のトピック関連度が低い一帯域もある。
記事は、クラスタA、B、C、D、E、及びFにグループ化され、これらを用いることによって、冷めつつあるトピックに対する「ニュース読者」及び「関連読者」の一般的な目的を示すことができる。これらの目的は、以下のような典型的な使用事例として表すことができる。
●熱いトピック(1ヶ月前に発生)
○事例1:ニュース読者。記事グループC、D、及びEは全て、その熱いトピックに関するごく最近の記事を含む。グループD又はEのいくつかの記事がグループCの記事よりも早かったとしても、やはり多くの読者がまずグループCの記事を見たがるであろう。グループEの記事は、トピック関連度が非常に低いので、多くの読者が全く見たがらないであろう。
○事例2:関連読者。これらの読者は、まずグループCの利用可能な記事を見たがる。これらの読者は、その熱いトピックの最新動向を把握するために頻繁にそのニュースを再閲覧している場合、グループCの最新記事から見たがるであろう。
●冷めたトピック(現在発生)
○事例3:ニュース読者。最新記事を見たがる読者もいれば、そのトピックに関する最近の記事がないため気を散らされたくない読者もいる。
○事例4:関連読者。関連読者は、まずグループCのトップ記事を見たがり、恐らくグループA又はDの類似した記事の前にグループFの記事を見たがるであろう。
●再発生トピック
○事例5:ニュース読者。これらの読者は、まず最新サイクルの記事を見たがり、恐らく古い方のサイクルにはあまり関心を持たないであろう。
○事例6:関連読者。これらの読者は、最も話題性のある記事に重点をおく。再発生パターンは話題性にばらつきがあり得るので、読者は、これらの記事がまとまったサイクルで編成されることを望む。
●2日間の閲覧(現在より開始)
○事例7:ニュース読者。グループFに最近の記事がある。グループA、B、C、D、及びEの記事は、古すぎるので表示されるべきではない。ほとんどの読者は、点数の最も低い記事には関心が低い。
○事例8:関連読者。これらの読者も2日間の閲覧を望んでいるので、グループFの記事にだけ関心がある。記事が時間で仕分けされて2日間に限定されるという点で、これらの読者の目的はニュース読者の目的に似ている。
以上の事例からいくつかのことが観察される:
● 読者の目標は、純然たるものではなく一般的に混合されている。関連度が主な中心であっても時間は考慮される。ニュースが主な中心であっても、関連度が考慮される。
● 時間が最優先される場合、時間にほんの少しの差があっても記事の順序付けがちがってくる。例えば、読者がニュース速報を追っている時は、数時間又は数分の差が読者の情報目標に影響する。時間の差は、提示の順序に反映されるべきである。
● 関連度の比較は量的より質的な比較である。関連度についての大きな差は重要であるが、小さな差は重要ではない。より大きくトピックに関連している記事が最初に出現するべきである。
● 関連度の低い記事には殆ど又は全く関心をもたないであろう。
従来、いくつかの他の方法が単一な調整によってユーザの情報要求を満たそうとするが不十分であった。ある方法は、日付又はトピックのいずれかによって記事を仕分けする調整を提供している。第2の方法は、関連度と経過時間の間の強調度を変化させる調整と一緒に、関連度と経過時間を結びつけるDOI(degree of interest(関心度))関数を使用する。また他の方法は、オンラインニュース・ウェブサイトに見られる。これらの方法は、それぞれ、上記の8つの使用事例に対して考慮されている。
ユーザの情報目標を満たす方法は、システムが、時間又は関連得点に基づいて記事を仕分けし、仕分けの際に必要な優先権をユーザに選ばせることを可能とすることである。システムが関連度が非常に低い記事を除外すると仮定した場合、この方法によって満たされるのは、8個の使用事例のうち5つだけである。
●熱いトピック
○事例1:ニュース読者。ユーザは「時間によって仕分けする」を選ぶ。この選択はユーザ目標を満足させるだろうが、記事の質が混合されるであろう。
○事例2:関連読者。ユーザは「関連度によって仕分けする」を選ぶ。この選択は、密接に関連する記事の時系列を混乱させるであろうが、ユーザの目標を部分的に満足させるであろう。
●冷めたトピック
○事例3:ニュース読者。ユーザは「時間によって仕分けする」を選ぶ。この選択はユーザ目標を満足させるだろう。
○事例4:関連読者。ユーザは「関連度によって仕分けする」を選ぶ。このシステムは、トピック記事を最初に見せるが、関連度が類似している記事に対して最も関連した記事を最初に見せない。したがって、この方法はユーザの目標を満足させない。
●再発生トピック
○事例5:ニュース読者。ユーザは「時間によって仕分けする」を選ぶ。このシステムは、最も新しい記事を最初に見せるが、古い記事も見せるであろう。
○事例6:関連読者。ユーザは「関連度によって仕分けする」を選ぶ。このシステムは、最も話題性のある記事を最初に見せるが、記事の時間的一貫性(コヒーレンス)を混乱させるであろう。したがって、この方法はユーザの目標を満足させない。
●2日間の閲覧
○事例7:ニュース読者。ユーザは「時間によって仕分けする」を選ぶ。このシステムは、正しく最も新しい記事を最初に見せるが、あまり関心のないやや古い記事も見せるであろう。
○事例8:関連読者。どの仕分け選択もユーザの目標を満足させることができないであろう。
ユーザ目標を満たす他の方法は、関連度と記事の経過時間を考えるDOI(関心度)関数を用いることである。代表的な方法は、以下のなどの得点ScoreDOIを計算するための線形関数を使用する:
ScoreDOI=C+w1×Relevance−w2×Age ....(1)
式中、Cは、記事の数を表し、Relevanceは、トピックの関連度を表し、重みw1とw2は、それぞれ、関連度と経過時間の相対的な影響度を求める。記事は、DOI得点の下降順に提示される。
一般に、DOIシステムは、スコアの優先順位を決めるために、ユーザがなんら調整を加えることなく、機能するように作られている。しかしながら、ニュース読者と関連度読者の目標が矛盾しているので、重みw1とw2に対する固定値はどれもこの両読者を同時に満足させることはできない。したがって、これらの読者の要求の各々に対して調整を行うために更なるユーザ調整が必要とされる。或いは、DOIシステムは、時間と関連度のいずれかを強調するために調整を含むことができるが、上記に説明したように、この調整は、DOIシステムを、時間と関連度の分類システムへ、効果的に変換することができる。この方法は、前の方法、時間と関連度の分類と同じ事例の場合は失敗するであろう。
ユーザの目標に合わせるための他の関連する方法は、Reddit(レディット)、Google News(グーグルニュース)アーカイブ、及びDigg(ディッグ)ウェブサイトによって提供されるように、オンラインニュースのウェブサイトに見ることができる。これらの方法は、時間周期の調整によって記事を提供する。
Reddit(レディット)ウェブサイトは、時間フィルタ調整付きの記事を提供する。図9は、レディットソーシャルニュースシステム101の下に表示される記事の一例を示す画面図100である。記事は、どれがDOI関数にみなされるかによって得点される(主に得点によって仕分けするために重み付けが設定されている)。加えて、ウェブサイトが時間周期の調整を提示している間、記事は得点によって分類されるが、時間では分類されない。更に、レディットは、ソーシャル媒体の収集ウェブサイトであるが、ソーシャルインデクシングシステムではない。これによって、レディットは、細粒度トピックへ補助的に編成された多数の主要領域ではなく、いくつかの広範囲の主要領域に含まれる記事をトピック別に編成する。また更に、記事は、自動分類システムによってではなく、人によって手動的に主題領域に追加され、主要領域における記事の採点法は、自動化されたトピック解析によるものではなく、人間による投票によっても実行される。最後に、Redditは、得点の帯域化又は帯域内での時間による仕分けを提供しない。
レディットは、拡張された時間周期における記事に対して時間的一貫性(コヒーレンス)が必要とされる使用事例に対して奏効しない。例えば、読者が最新の記事、又は、記事の時間発展を見たい場合、レディットは、使用事例1(熱いトピック、ニュース読者)に関してうまくいかないであろう。同様の理由から、レディットは、使用事例3(冷めたトピック、ニュース読者)と使用事例5(再発生トピック、ニュース読者)に関してもうまくいかないであろう。更に、使用事例1のもとで、現在時間から外れた記事を選別するために、ニュース読者は、レディットに対して、一時間前又は一日前などのタイムウィンドウを設定することもできるが、レディットが入手可能な記事があまり新しくなかった場合、記事は全く示されないであろう。これに対して、ニュース読者が時間にもっと幅を持たせてタイムウィンドウを指定した場合、最新の記事が最高得点の記事の後に列挙されるため、読者は最新の記事を手動で検索しなければならないだろう。
Google News(グーグルニュース)アーカイブのウェブサイトは、時間周期のための調整を有する照会(クエリ)に整合する記事を提示する。図10は、グーグルニュースアーカイブシステム111の下に表示される記事の一例を示す画面図110である。トピックにおいて記事が大きくばらついて表示され、記事の日付順が大きくずれており、話題性と時間の観点から、記事の提示の順序付けに一貫性がなくなっている。
グーグルニュースアーカイブの下において、記事は整合得点に基づいた順序において提示されているが、記事を時間によって仕分けしているようにみえない。加えて、レディット同様、グーグルニュースアーカイブは、ソーシャルインデクシングシステムではないため、レディットと同様の理由から、使用事例1、3、及び5に関してうまくいかないであろう。グーグルニュースアーカイブは、トピックインデックスに当てはまる記事より、ユーザ照会に整合する記事を提示している。このことから、グーグルニュースアーカイブは、得点の帯域化又は帯域内の時間による仕分けを提供しない。
最後に、Digg(ディッグ)ウェブサイトは、時間周期の調整による広い主要領域内で記事を提示する。図11〜図13は、ディッグニュースシステム121、131、141の下に表示される記事の一例を示す画面図120、130、140である。記事は、ユーザの投票によって順序付けられて表示される。記事がまったく同じ得点を有する時、ディッグは、結びついた記事を時間によって仕分けする。記事の順序付けは、トピックにおける大きなばらつきと日付の大きなずれを反映しており、話題性と時間の観点から、記事の提示の順序付けに一貫性がなくなっている。
ディッグの下には、トピックインデックスに当てはまる全ての記事ではなく、特定のユーザ照会に整合する記事のみが提示されている。加えて、レディット同様、ディッグは、ソーシャルインデクシングシステムではないため、レディットと同様の理由から、使用事例1、3、及び5に関してうまくいかないであろう。また、ディッグは、得点の帯域化を提供しないし、または、帯域における時間による仕分けも提供しない。日付による二次的な仕分けは、投票された数が同じ得点に対してのみ発生する。記事は、潜在的に数千点の投票を受け取ることができるので、結び付いた記事のグループ化が、記事をいくつかの幅広い帯域へグループ化することと同義ではない。
異なるユーザ情報の目標とトピック寿命に応じて関連度を変更する一般的なパターンとは、自動的関連度の順序付けと組み合わされた適切な時間調整を提供することによって収容される。図14は、本発明の一実施形態による、帯域化されたトピック関連度及び記事の優先順位付けのための時間を用いる方法150を示すフローチャートである。この方法は、例えば、サーバなどの汎用目的にプログラミングされたコンピュータによって実行される一連のプロセス又は方法のステップとして実行される。
まず、主要領域、主要領域内のトピック、及び情報源を定義しなければならない(ステップ151)。これらの全ては一つ以上のソーシャルインデックスによって提供される。ソーシャルインデックスは、インデックストピックを指定するために、階層的構造トピックツリーとして、ユーザによって作成され得る。各トピックのためのトピックモデルは検索される(ステップ152)。トピックモデルは、記事を認識し新しく到着する記事をトピック別に分類するために使用され、ソーシャルインデックスをエバーグリーン(常に最新)にしておく。各記事は、記事のコンテンツと公開された日付の両方、又は、最新であることの他の表示を含む。ソーシャルインデックスは、新しい情報がインデックス内のトピックの一つ以上に当てはまるかどうかを判断するために使用される、有限状態パターンなどの細粒度トピックモデルを含む。細粒度トピックモデルを補助するために、ソーシャルインデックスは粗粒度トピックモデルを任意に含むことができ、粗粒度トピックモデルは、記事が大まかに「トピックに関連している(オントピック)」か否かを認識することで、記事を大きく分類するために使用される。その後、記事が収集され、細粒度トピックモデルを用いて情報源からソーシャルインデックスに簡潔に分類される(ステップ153)。図16を参照して、以下に更に詳細に示されるように、細粒度トピックモデルに対する関連度帯域が作成される(ステップ154)。図18を参照して、以下に更に詳細に示されるように、記事を特定の期間に制限する時間調整が適用される(ステップ155)。最後に、関連度帯域にグループ化され時間仕分けされた記事は、時系列において最高の関連度を有する帯域からの記事を最初に提示することによって、ユーザインターフェースによって提示される(ステップ156)。残っている各帯域についても、除外される「非関連」帯域を除いて、以下同様に、繰り返される。
関連度帯域化及び時間仕分けの組み合わせによって、初心者のユーザに対して複雑な検索目標の統合作業を要求せずに、関連度又は最新度の優先順位を決定することができる。図15は、関連度が帯域化され時間仕分けされた記事161の一例を示す画面図160である。トピックに含まれる記事は、関連度帯域162ごとにグループ化され表示され、各帯域内で時間周期調整163を用いて時間によって仕分けされる。時間領域外の記事は、時間周期調整163を用いて各帯域内で時間によって仕分けされる。
記事は関連度帯域へ分割される。図16は、図14の方法150に使用される関連度帯域を作成するためのルーチン170を示すフローチャートである。各帯域内で、最初に、各記事はトピックの関連度によって採点される(ステップ171)、記事はそれぞれの関連度帯域へ配列される(ステップ172)。一実施形態において、得点は100点の測度で正規化され、各トピック内の記事は、「中心的に関連している」、「関連している」、「やや関連している」、及び「関連していない」などとラベル付けされる同一の関連度を有する記事のグループとして、四つの特定の帯域へ分割される。帯域は、関連度を下げることによって順序付けされる。帯域の増減はもちろん、他の採点法又は比較測度も適用可能である。最高帯域の得点は80〜100点である。次の帯域は50〜79点である。その次の帯域は30〜49点である。最低帯域は0〜29点である。帯域数の変更及び帯域の特定レベルの境界化も可能である。
各帯域内で、記事は時間によって仕分けされる(ステップ173)。図17は、時間周期調整181を行わずに、関連度帯域によって編成された記事数を例示しているグラフ180である。x軸は、現在から遠ざかっていく時間を表し、y軸は関連度の測度としてのトピック得点を表している。時間フィルタリング(選別)しない記事の順序付けは、「すべての」時間周期を選択するために時間周期調整163を設定することに対応している。
時間調整は、収集される記事を特定期間に制限する調整である。図18は、図14の方法150に使用される時間周期を調整するためのルーチン190を示すフローチャートである。動作上、ユーザによって選択される値は、時間周期制御163から得られ(ステップ191)、選択された時間領域外に出現する記事は提示されない(ステップ192)。
最も簡単なバージョンにおいて、時間周期調整163は「現在」から始まって、いくつかある周期の一つに記事を入れる。図19は、二日間の時間周期に対する関連度帯域によって編成された記事数を例示しているグラフ200である。一実施形態において、5種類の時間周期、即ち、24時間前、二日前、一週間前、一月前、及び無制限(「全ての」時間周期)が提供されている。時間周期において、最初と最後を限定したもの、又は、最初と継続期間を限定したものを含む、他の時間周期の組み合わせも利用可能である。
どちらも上記に説明されているように、仕分けを支配する調整及び関心度による優先度設定を支配する調整とは対照的に、時間周期調整163は、「関心度対時間」のトレードオフ(交換)又は概念を取り入れない。したがって、この手法が明らかに簡単であることが、結果的に情報目標を満たそうとする初心者のユーザにとって有利となる。しかも、帯域化された関連度決定と時間フィルタ調整の組み合わせによって8件全ての使用事例を満足させることが可能である。
●熱いトピック
○事例1:ニュース読者。ユーザは、「24時間」の時間周期を選択する。トピックが非常に熱い場合、高い関連度を有するトピックの多数の記事が識別されるであろう。システムは、最初に提示される日付によって仕分けされた最高のトピック関連度を有する記事を表示する。24時間の制限時間を越える記事は示されない。ユーザの目標は満たされるであろう。
○事例2:関連読者。ユーザは、「全て」の時間周期を選択する。システムは日付によって仕分けされた最高関連度帯域内の記事を最初に表示する。次に、システムは次の関連度帯域内の記事を表示する。ユーザは、関連度値のわずかの変化による順序付けの変化に殆ど反応しないので、ユーザの目標は満たされるであろう。
●冷めたトピック
○事例3:ニュース読者。ユーザは、「24時間」の時間周期を選択する。冷めたトピックにあてはまる記事は恐らく殆どないと思われる。システムは、最新の24時間以内の記事のうち、最も関連している記事を最初に表示する。大部分の記事は、恐らく同じ低関連度帯域内にあるので、時間的な順序付けでも、ユーザの目標をほぼ満足させるであろう。
○事例4:関連読者。ユーザは、「全て」の時間周期を選択する。システムは、最高関連度帯域内の記事を最初に表示し、以下、同様に表示する。全体を通してユーザの目標を満足させるであろう。
●再発生トピック
○事例5:ニュース読者。ユーザは、「24時間」の時間周期を選択する。周期的なトピックが熱い場合、この使用事例の目標は、「熱いトピック事例」へ削減される。周期的なトピックが冷めている場合、この使用事例の目標は、「冷めたトピック事例」へ削減される。いずれにしても、この事例は、ユーザの目標を満足させるであろう。
○事例6:関連読者。ユーザは、「全て」の時間周期を選択する。システムは、最高関連度帯域内の記事を最初に選択し、記事を時間によって仕分けする。使用事例は、同じ周期の記事をまとめてグループ化し、ユーザの目標を満足させるであろう。
●2日間の閲覧
○事例7:ニュース読者。ユーザは、「二日間」の時間周期を選択する。システムは、帯域化された関連度を判定するが、二日以上経過した全ての記事をフィルタリング(選別)して除外する。トピックが熱い場合、最高の関連度帯域内の記事が出現し、時間的に仕分けされる。トピックが冷めている場合、低い関連度帯域内の記事は時間的な順序で提示される。ユーザの目標が満たされる。
○事例8:関連読者。ユーザは、「二日間」の時間周期を選択する。システムは、帯域化された関連度を判定するが、二日以上経過した全ての記事をフィルタリング(選別)して除外する。トピックが熱い場合、最高の関連度帯域内の記事が出現し、時間的に仕分けされる。トピックが冷めている場合、低い関連度帯域内の記事は時間的な順序で提示される。ユーザの目標が満たされる。
更なる実施形態において、極めて少数の段階のみを用いて得点する採点法が用いられてよい。例えば、関連度の採点法は、「極めて関連している」、「高く関連している」、「関連している」、及び「関連していない」等の4段階のみで実行されてよい。これらは4段階のみであるから、帯域への削減は必要とされない。とはいっても、帯域内での仕分けには、8つの使用事例において所望される行動を展開することが必要とされる。
更なる実施形態において、方法は、ソーシャルインデクシングシステム内の一つ以上のソーシャルインデックスに適用される。トピックの帯域化は、各ソーシャルインデックスのコンテクストにおいて適用される。
本発明を特にその実施形態に関して図示及び説明してきたが、当業者には理解されるように、本発明の精神及び範囲から逸脱しない限り、この形式及び細部に上述及びその他の変更を加えてもよい。
10: 環境
11: ソーシャルインデクシングシステム
13a、13b、13c: ユーザ
14a: ウェブサーバ
15a: ウェブコンテンツ
14b: ニュース捕集サーバ
15b: ニュースコンテンツ
14c: 投票によるニュースサーバ
15c: 「吟味された」コンテンツ
16: ネットワーク

Claims (4)

  1. 帯域化されたトピック関連度と記事の優先順位付けのための時間を使用するためのコンピュータ実施方法であって、
    ディジタル情報の記事と、前記記事の一つ以上に各々が関連しているトピックを含む少なくとも一つのソーシャルインデックスと、を保持し、
    トピック毎に、前記ディジタル情報に整合される細粒度トピックモデルを検索し、
    前記細粒度トピックモデルを用いて前記トピックに含まれる記事を簡潔に仕分けし、
    前記記事が仕分けされた前記トピック内の前記記事の各々を関連度によって採点し、
    前記記事を関連度得点によって特定の帯域内へ配列し、
    前記特定の帯域内で前記記事を時間によって仕分けし、
    前記特定の帯域内で前記記事を提示すること、
    を含む、コンピュータ実施方法。
  2. 時間的な遮断期限を定義する時間周期を受容し、
    受容された前記時間周期外の前記特定の帯域内の記事を排除する
    ことを更に含む、請求項1に記載の方法。
  3. 前記時間周期が、24時間前、二日前、一週間前、一月前、及び無制限のうちの一つ以上を含む、請求項2に記載の方法。
  4. 関連度を下げることによって前記特定の帯域を順序付け、他の特定の帯域より低い関連度からなる特定の帯域の一つ以上を除外すること、を更に含む請求項1に記載の方法。
JP2010010999A 2009-01-27 2010-01-21 帯域化されたトピック関連度と記事の優先順位付けのための時間を用いるためのシステム及び方法 Pending JP2010176667A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/360,823 US8452781B2 (en) 2009-01-27 2009-01-27 System and method for using banded topic relevance and time for article prioritization

Publications (1)

Publication Number Publication Date
JP2010176667A true JP2010176667A (ja) 2010-08-12

Family

ID=42242270

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010010999A Pending JP2010176667A (ja) 2009-01-27 2010-01-21 帯域化されたトピック関連度と記事の優先順位付けのための時間を用いるためのシステム及び方法

Country Status (3)

Country Link
US (1) US8452781B2 (ja)
EP (1) EP2211281B1 (ja)
JP (1) JP2010176667A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012099001A (ja) * 2010-11-04 2012-05-24 Toshiba Corp ニュース情報分析装置
JP2015187886A (ja) * 2011-04-29 2015-10-29 グーグル インコーポレイテッド ソーシャルネットワークにおいてフィードを追跡すること

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8010545B2 (en) * 2008-08-28 2011-08-30 Palo Alto Research Center Incorporated System and method for providing a topic-directed search
US8549016B2 (en) * 2008-11-14 2013-10-01 Palo Alto Research Center Incorporated System and method for providing robust topic identification in social indexes
US8452781B2 (en) * 2009-01-27 2013-05-28 Palo Alto Research Center Incorporated System and method for using banded topic relevance and time for article prioritization
US8239397B2 (en) * 2009-01-27 2012-08-07 Palo Alto Research Center Incorporated System and method for managing user attention by detecting hot and cold topics in social indexes
US8356044B2 (en) * 2009-01-27 2013-01-15 Palo Alto Research Center Incorporated System and method for providing default hierarchical training for social indexing
US8539359B2 (en) * 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
US8566332B2 (en) * 2009-03-02 2013-10-22 Hewlett-Packard Development Company, L.P. Populating variable content slots on web pages
US8429170B2 (en) * 2010-02-05 2013-04-23 Yahoo! Inc. System and method for discovering story trends in real time from user generated content
US8786597B2 (en) 2010-06-30 2014-07-22 International Business Machines Corporation Management of a history of a meeting
US20120042263A1 (en) 2010-08-10 2012-02-16 Seymour Rapaport Social-topical adaptive networking (stan) system allowing for cooperative inter-coupling with external social networking systems and other content sources
US8687941B2 (en) 2010-10-29 2014-04-01 International Business Machines Corporation Automatic static video summarization
US20120150772A1 (en) * 2010-12-10 2012-06-14 Microsoft Corporation Social Newsfeed Triage
US10055766B1 (en) * 2011-02-14 2018-08-21 PayAsOne Intellectual Property Utilization LLC Viral marketing object oriented system and method
US8615518B2 (en) 2011-04-11 2013-12-24 Yahoo! Inc. Real time association of related breaking news stories across different content providers
US8676937B2 (en) 2011-05-12 2014-03-18 Jeffrey Alan Rapaport Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging
US9256859B2 (en) * 2011-07-26 2016-02-09 Salesforce.Com, Inc. Systems and methods for fragmenting newsfeed objects
US20130132138A1 (en) * 2011-11-23 2013-05-23 International Business Machines Corporation Identifying influence paths and expertise network in an enterprise using meeting provenance data
US9495666B2 (en) * 2011-12-15 2016-11-15 Accenture Global Services Limited End-user portal system for remote technical support
US20130179789A1 (en) * 2012-01-11 2013-07-11 International Business Machines Corporation Automatic generation of a presentation
US8826125B2 (en) * 2012-03-12 2014-09-02 Hyperion Media LLC System and method for providing news articles
US8914452B2 (en) 2012-05-31 2014-12-16 International Business Machines Corporation Automatically generating a personalized digest of meetings
KR20140047226A (ko) * 2012-10-10 2014-04-22 한국전자통신연구원 이슈 일지를 제공하는 단말기, 이슈 일지를 생성하는 서버 및 이슈 일지 제공 및 생성 방법
US20140214835A1 (en) * 2013-01-29 2014-07-31 Richard Thomas Oehrle System and method for automatically classifying documents
WO2014169259A1 (en) * 2013-04-12 2014-10-16 Palter Steven F Providing an interactive discussion platform for scientific research
US20160063122A1 (en) * 2013-04-16 2016-03-03 Hewlett-Packard Development Company, L.P. Event summarization
US9292379B2 (en) 2013-09-28 2016-03-22 Intel Corporation Apparatus and method to manage high capacity storage devices
US10055770B2 (en) 2014-04-08 2018-08-21 Bank Of America Corporation Unified product catalog data retrieval and modification
US9830640B2 (en) 2014-04-08 2017-11-28 Bank Of America Corporation Unified product catalog orders
US9824378B2 (en) * 2014-04-08 2017-11-21 Bank Of America Corporation Unified product catalog
US20170357623A1 (en) 2016-06-12 2017-12-14 Apple Inc. Arrangement of Documents In a Document Feed
US11244371B2 (en) * 2018-01-15 2022-02-08 Cimpress Schweiz Gmbh Methods and apparatus to translate and manage product data
US11244013B2 (en) * 2018-06-01 2022-02-08 International Business Machines Corporation Tracking the evolution of topic rankings from contextual data
CN116185332A (zh) * 2022-12-30 2023-05-30 药融云数字科技(成都)有限公司 用于对检索结果进行排序的文献评价方法、存储介质及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115835A (ja) * 1997-06-20 1999-01-22 Fuji Xerox Co Ltd 分類情報提示装置及び分類情報提示プログラムを記録した媒体
JP2002041544A (ja) * 2000-07-25 2002-02-08 Toshiba Corp テキスト情報分析装置
JP2006235716A (ja) * 2005-02-22 2006-09-07 Hitachi Ltd 文書フィルタリングシステム

Family Cites Families (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4081301A (en) * 1975-10-30 1978-03-28 The Procter & Gamble Company Method and apparatus for continuously attaching discrete, stretched elastic strands to predetermined isolated portions of disposable abosrbent products
DE2845342A1 (de) * 1978-10-18 1980-04-30 Hauni Werke Koerber & Co Kg Verfahren zum beeinflussen der luftdurchlaessigkeit eines poroesen huellmaterials fuer stabfoermige rauchartikel sowie maschine zum herstellen derartiger rauchartikel
US4249547A (en) * 1979-09-28 1981-02-10 Hauni-Werke Korber & Co. Kg. Method and apparatus for applying adhesive to running webs of wrapping material
DE3006510A1 (de) * 1980-02-21 1981-09-10 Hauni-Werke Körber & Co KG, 2050 Hamburg Verfahren und anordnung zum vereinigen von rauchartikeln mit mundstuecken
DE3201859A1 (de) * 1981-02-09 1982-08-26 Hauni-Werke Körber & Co KG, 2050 Hamburg Verfahren und vorrichtung zum verbinden von stabfoermigen artikeln der tabakverarbeitenden industrie mittels eines verbindungsstreifens
US5369763A (en) * 1989-02-01 1994-11-29 Kansas State University Research Foundation Data storage and retrieval system with improved data base structure
DE4008475C2 (de) * 1990-03-16 2002-10-10 Hauni Werke Koerber & Co Kg Verfahren und Vorrichtung zum Herstellen von Filterzigaretten
US5257939A (en) * 1992-10-13 1993-11-02 Robinson Don T Cultural knowledge board game
US5724567A (en) * 1994-04-25 1998-03-03 Apple Computer, Inc. System for directing relevance-ranked data objects to computer users
JP2809341B2 (ja) * 1994-11-18 1998-10-08 松下電器産業株式会社 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。
US5671342A (en) * 1994-11-30 1997-09-23 Intel Corporation Method and apparatus for displaying information relating to a story and a story indicator in a computer system
US5530852A (en) * 1994-12-20 1996-06-25 Sun Microsystems, Inc. Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics
US5680511A (en) * 1995-06-07 1997-10-21 Dragon Systems, Inc. Systems and methods for word recognition
US5907836A (en) * 1995-07-31 1999-05-25 Kabushiki Kaisha Toshiba Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore
US5778583A (en) * 1996-07-01 1998-07-14 Bedford Industries, Inc. Stretchable marking article
US6021403A (en) * 1996-07-19 2000-02-01 Microsoft Corporation Intelligent user assistance facility
US5907677A (en) * 1996-08-23 1999-05-25 Ecall Inc. Method for establishing anonymous communication links
EP0848347A1 (en) * 1996-12-11 1998-06-17 Sony Corporation Method of extracting features characterising objects
US6285987B1 (en) * 1997-01-22 2001-09-04 Engage, Inc. Internet advertising system
US5940821A (en) * 1997-05-21 1999-08-17 Oracle Corporation Information presentation in a knowledge base search and retrieval system
US6233575B1 (en) * 1997-06-24 2001-05-15 International Business Machines Corporation Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values
US6292830B1 (en) * 1997-08-08 2001-09-18 Iterations Llc System for optimizing interaction among agents acting on multiple levels
US6052657A (en) * 1997-09-09 2000-04-18 Dragon Systems, Inc. Text segmentation and identification of topic using language models
US6598045B2 (en) * 1998-04-07 2003-07-22 Intel Corporation System and method for piecemeal relevance evaluation
DE19857576A1 (de) * 1998-12-14 2000-06-15 Hauni Maschinenbau Ag Vorrichtung zum Herumwickeln von Blättchen um stabförmige Gegenstände
US7275061B1 (en) * 2000-04-13 2007-09-25 Indraweb.Com, Inc. Systems and methods for employing an orthogonal corpus for document indexing
US6269361B1 (en) * 1999-05-28 2001-07-31 Goto.Com System and method for influencing a position on a search result list generated by a computer network search engine
US6981040B1 (en) * 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US6397211B1 (en) * 2000-01-03 2002-05-28 International Business Machines Corporation System and method for identifying useless documents
JP3562572B2 (ja) * 2000-05-02 2004-09-08 インターナショナル・ビジネス・マシーンズ・コーポレーション データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡
US7062485B1 (en) * 2000-09-01 2006-06-13 Huaichuan Hubert Jin Method and apparatus for score normalization for information retrieval applications
US7185065B1 (en) * 2000-10-11 2007-02-27 Buzzmetrics Ltd System and method for scoring electronic messages
US7233940B2 (en) * 2000-11-06 2007-06-19 Answers Corporation System for processing at least partially structured data
US7200606B2 (en) * 2000-11-07 2007-04-03 The Regents Of The University Of California Method and system for selecting documents by measuring document quality
US6772120B1 (en) * 2000-11-21 2004-08-03 Hewlett-Packard Development Company, L.P. Computer method and apparatus for segmenting text streams
US7685224B2 (en) * 2001-01-11 2010-03-23 Truelocal Inc. Method for providing an attribute bounded network of computers
US20020179105A1 (en) * 2001-02-26 2002-12-05 Zawadzki Michael A. Reduced ignition propensity smoking article
US20020179106A1 (en) * 2001-03-28 2002-12-05 Zawadzki Michael A. Reduced ignition propensity smoking article with a polysaccharide treated wrapper
US20020161838A1 (en) * 2001-04-27 2002-10-31 Pickover Cilfford A. Method and apparatus for targeting information
US7092888B1 (en) * 2001-10-26 2006-08-15 Verizon Corporate Services Group Inc. Unsupervised training in natural language call routing
US7716161B2 (en) * 2002-09-24 2010-05-11 Google, Inc, Methods and apparatus for serving relevant advertisements
US7752072B2 (en) * 2002-07-16 2010-07-06 Google Inc. Method and system for providing advertising through content specific nodes over the internet
US20050226511A1 (en) * 2002-08-26 2005-10-13 Short Gordon K Apparatus and method for organizing and presenting content
US7320000B2 (en) * 2002-12-04 2008-01-15 International Business Machines Corporation Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy
US7467202B2 (en) * 2003-09-10 2008-12-16 Fidelis Security Systems High-performance network content analysis platform
GB0322600D0 (en) * 2003-09-26 2003-10-29 Univ Ulster Thematic retrieval in heterogeneous data repositories
JP2005158010A (ja) * 2003-10-31 2005-06-16 Hewlett-Packard Development Co Lp 分類評価装置・方法及びプログラム
US20070244690A1 (en) * 2003-11-21 2007-10-18 Koninklijke Philips Electronic, N.V. Clustering of Text for Structuring of Text Documents and Training of Language Models
CN1894686A (zh) * 2003-11-21 2007-01-10 皇家飞利浦电子股份有限公司 用于文档构造的文本分段和主题注释
WO2005050621A2 (en) * 2003-11-21 2005-06-02 Philips Intellectual Property & Standards Gmbh Topic specific models for text formatting and speech recognition
EP1687739A2 (en) * 2003-11-21 2006-08-09 Philips Intellectual Property & Standards GmbH Text segmentation and label assignment with user interaction by means of topic specific language models and topic-specific label statistics
US7293019B2 (en) 2004-03-02 2007-11-06 Microsoft Corporation Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics
US7426557B2 (en) * 2004-05-14 2008-09-16 International Business Machines Corporation System, method, and service for inducing a pattern of communication among various parties
US7281022B2 (en) * 2004-05-15 2007-10-09 International Business Machines Corporation System, method, and service for segmenting a topic into chatter and subtopics
JP2005352878A (ja) * 2004-06-11 2005-12-22 Hitachi Ltd 文書検索システム、検索サーバ、及び検索クライアント
US7567959B2 (en) * 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
US7496567B1 (en) * 2004-10-01 2009-02-24 Terril John Steichen System and method for document categorization
US20060167930A1 (en) * 2004-10-08 2006-07-27 George Witwer Self-organized concept search and data storage method
JP4721740B2 (ja) * 2005-03-23 2011-07-13 富士通株式会社 記事又は話題を管理するためのプログラム
US7548917B2 (en) * 2005-05-06 2009-06-16 Nelson Information Systems, Inc. Database and index organization for enhanced document retrieval
US20070050356A1 (en) * 2005-08-23 2007-03-01 Amadio William J Query construction for semantic topic indexes derived by non-negative matrix factorization
US7707206B2 (en) * 2005-09-21 2010-04-27 Praxeon, Inc. Document processing
US9069847B2 (en) 2005-10-21 2015-06-30 Battelle Memorial Institute Data visualization methods, data visualization devices, data visualization apparatuses, and articles of manufacture
US20070156622A1 (en) * 2006-01-05 2007-07-05 Akkiraju Rama K Method and system to compose software applications by combining planning with semantic reasoning
WO2007101263A2 (en) * 2006-02-28 2007-09-07 Buzzlogic, Inc. Social analytics system and method for analyzing conversations in social media
US8326686B2 (en) * 2006-03-30 2012-12-04 Google Inc. Automatically generating ads and ad-serving index
US7890485B2 (en) * 2006-04-13 2011-02-15 Tony Malandain Knowledge management tool
US7809723B2 (en) * 2006-06-26 2010-10-05 Microsoft Corporation Distributed hierarchical text classification framework
US20080040221A1 (en) * 2006-08-08 2008-02-14 Google Inc. Interest Targeting
US20080126319A1 (en) * 2006-08-25 2008-05-29 Ohad Lisral Bukai Automated short free-text scoring method and system
US20080065600A1 (en) * 2006-09-12 2008-03-13 Harold Batteram Method and apparatus for providing search results from content on a computer network
US7921092B2 (en) * 2006-12-04 2011-04-05 Yahoo! Inc. Topic-focused search result summaries
US8484083B2 (en) * 2007-02-01 2013-07-09 Sri International Method and apparatus for targeting messages to users in a social network
WO2008120030A1 (en) * 2007-04-02 2008-10-09 Sobha Renaissance Information Latent metonymical analysis and indexing [lmai]
US7818194B2 (en) * 2007-04-13 2010-10-19 Salesforce.Com, Inc. Method and system for posting ideas to a reconfigurable website
US8165985B2 (en) * 2007-10-12 2012-04-24 Palo Alto Research Center Incorporated System and method for performing discovery of digital information in a subject area
US8073682B2 (en) * 2007-10-12 2011-12-06 Palo Alto Research Center Incorporated System and method for prospecting digital information
JP5343861B2 (ja) * 2007-12-27 2013-11-13 日本電気株式会社 テキスト分割装置とテキスト分割方法およびプログラム
US20100042589A1 (en) * 2008-08-15 2010-02-18 Smyros Athena A Systems and methods for topical searching
US20100057536A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Community-Based Advertising Term Disambiguation
US8209616B2 (en) * 2008-08-28 2012-06-26 Palo Alto Research Center Incorporated System and method for interfacing a web browser widget with social indexing
US8010545B2 (en) * 2008-08-28 2011-08-30 Palo Alto Research Center Incorporated System and method for providing a topic-directed search
US20100057577A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing
US9317599B2 (en) * 2008-09-19 2016-04-19 Nokia Technologies Oy Method, apparatus and computer program product for providing relevance indication
US8549016B2 (en) * 2008-11-14 2013-10-01 Palo Alto Research Center Incorporated System and method for providing robust topic identification in social indexes
US8356044B2 (en) * 2009-01-27 2013-01-15 Palo Alto Research Center Incorporated System and method for providing default hierarchical training for social indexing
US8452781B2 (en) * 2009-01-27 2013-05-28 Palo Alto Research Center Incorporated System and method for using banded topic relevance and time for article prioritization
US8239397B2 (en) * 2009-01-27 2012-08-07 Palo Alto Research Center Incorporated System and method for managing user attention by detecting hot and cold topics in social indexes
US8201095B2 (en) * 2009-04-02 2012-06-12 International Business Machines Corporation System and method for providing an option to auto-generate a thread on a web forum in response to a change in topic
US20110047213A1 (en) * 2009-08-20 2011-02-24 Alan David Manuel Method and process for identifying trusted information of interest
US11502408B2 (en) 2019-04-25 2022-11-15 Sharp Kabushiki Kaisha Scanned antenna and liquid crystal device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115835A (ja) * 1997-06-20 1999-01-22 Fuji Xerox Co Ltd 分類情報提示装置及び分類情報提示プログラムを記録した媒体
JP2002041544A (ja) * 2000-07-25 2002-02-08 Toshiba Corp テキスト情報分析装置
JP2006235716A (ja) * 2005-02-22 2006-09-07 Hitachi Ltd 文書フィルタリングシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012099001A (ja) * 2010-11-04 2012-05-24 Toshiba Corp ニュース情報分析装置
JP2015187886A (ja) * 2011-04-29 2015-10-29 グーグル インコーポレイテッド ソーシャルネットワークにおいてフィードを追跡すること

Also Published As

Publication number Publication date
US8452781B2 (en) 2013-05-28
EP2211281A2 (en) 2010-07-28
EP2211281A3 (en) 2011-04-20
US20100191741A1 (en) 2010-07-29
EP2211281B1 (en) 2012-06-06

Similar Documents

Publication Publication Date Title
JP2010176667A (ja) 帯域化されたトピック関連度と記事の優先順位付けのための時間を用いるためのシステム及び方法
US8239397B2 (en) System and method for managing user attention by detecting hot and cold topics in social indexes
JP5563836B2 (ja) ソーシャルインデクシングのためにデフォルト階層訓練を提供するためのシステム及び方法
Campos et al. Survey of temporal information retrieval and related applications
Golder et al. The structure of collaborative tagging systems
JP5329900B2 (ja) 対象領域におけるディジタル情報開示方法
Yanbe et al. Can social bookmarking enhance search in the web?
US7610279B2 (en) Filtering context-sensitive search results
US9235646B2 (en) Method and system for a search engine for user generated content (UGC)
US7331517B2 (en) Article reader program, article management method and article reader
US8874577B2 (en) System and method for triaging of information feeds
US20140280121A1 (en) Interest graph-powered feed
EP2192500A2 (en) System and method for providing robust topic identification in social indexes
US8930388B2 (en) System and method for providing orientation into subject areas of digital information for augmented communities
US8190424B2 (en) Computer-implemented system and method for prospecting digital information through online social communities
US9043413B2 (en) System and method for extracting, collecting, enriching and ranking of email objects
US20140229487A1 (en) System and method for user preference augmentation through social network inner-circle knowledge discovery
Zeleník et al. News recommending based on text similarity and user behaviour
Garofalakis et al. Personalization techniques for web search results categorization
Bokhari et al. Retrieval effectiveness of news search engines: a theoretical framework
CN101639832A (zh) 用于管理基于文本的流式数据的方法和系统
Almarri Semantic Selection of Internet Sources through SWRL Enabled OWL Ontologies
Phelan et al. Buzzer: online real-time topical news article and source

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130528

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130823

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140205

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140210

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140507