JP2010055618A - トピックを基にした検索を提供する方法及びシステム - Google Patents

トピックを基にした検索を提供する方法及びシステム Download PDF

Info

Publication number
JP2010055618A
JP2010055618A JP2009191894A JP2009191894A JP2010055618A JP 2010055618 A JP2010055618 A JP 2010055618A JP 2009191894 A JP2009191894 A JP 2009191894A JP 2009191894 A JP2009191894 A JP 2009191894A JP 2010055618 A JP2010055618 A JP 2010055618A
Authority
JP
Japan
Prior art keywords
topic
search
index
articles
topics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009191894A
Other languages
English (en)
Inventor
Mark J Stefik
ジェイ ステフィック マーク
Lichan Hong
ホン リーチャン
Stuart K Card
ケイ カード スチュアート
Peter L Pirolli
エル ピロリ ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2010055618A publication Critical patent/JP2010055618A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】トピックに応じた検索に関する問題を解決する。
【解決手段】トピックによる検索を提供するコンピュータにより実行されるシステムであって、一以上の記事各々に関連し、両者が記憶装置に記録されるトピックを含むデジタル情報及び一以上のインデックスの前記記事と、プロセッサ及び前記プロセッサによって実行するためのコードを記録したメモリを含むコンピュータであって、トピック各々に対し、前記トピック及び特徴的な単語に割り当てられたスコアに関する記事に含まれる前記特徴的な単語を含む粗いトピックモデルを構築するトピック構築器と、前記インデックスの一つに対する検索語を含む検索クエリを実行し、スコアにより検索語と適合したトピックを選択する検索エンジンと、を含むコンピュータと、前記選択された粗いトピックモデル及び前記検索クエリに対応する記事を視覚的に表示するユーザインターフェースと、を含むことを特徴とするシステム。
【選択図】図4

Description

本出願は、概して、デジタル情報検索に関し、特に、トピックに基にした検索を提供するシステム及び方法に関する。2008年8月12日に出願した一連番号12/190,552の同一出願人による米国特許出願に記載されたように、ウェブのような際限のない情報源をトピックに応じて編成することによって、情報の発見及び検索を促進することができる。当該出願は、審査中であり、その公開公報は、参照により、本明細書に組み込まれているものとする。書籍を編集する際には、長い間、トピックのインデックスが設けられてきた。しかしながら、編集上の制約によって、書籍の大きさやページ数が制限され、それゆえ、インデックスの大きさも制限される。一方で、ウェブ上の素材には物理的な障壁がないので、対象とする主題全体を包含するような広範なトピックの編成を要求することができる。
トピックの基づく編成(topical organization)がなければ、ウェブのような際限のない情報のリポジトリを効果的に検索することは難しくなる。ユーザは、探し出された主題を知ることができないかもしれないし、利用可能な情報を認識することができないかもしれない。たとえ知ることができても、ユーザが所望の情報を正確に特定することができなかったり、単語の不規則な変形に躓いたりすることある。多くの場合、検索結果だけでは、必要なトピックの手がかりが欠けるが、たとえ、トピックに応じて編集されていた場合であっても、全ウェブトピックの全体のインデックスに対するほんの一部分だけが、与えられたテーマと密接に結びついているという場合もある。
従来のウェブ検索エンジンは、典型的には、わずかな検索語のみで構成される検索クエリに応じて、例えば、記事のような情報を検索する。コーパス(corpus)が膨大である場合、例えばウェブから集められた記事が幅広いトピックにわたる場合には、ユーザは、必要な情報を正確に特定する際に、あいまいさの問題に遭遇する。その上、ウェブ検索エンジンは多くの場合、異なるトピックに関する情報が混ざった編集されていない乱雑な情報を返す。このことによって、結果が混同し、新しいクエリを定式化することが、難しくなる。
また、従来のウェブ検索エンジンは、基本となるテーマの領域をトピックに応じて編集するためのインデックスや知識がなくても動作する。クエリ語に適した検索結果を強調するために、文脈の中にあるキーワード(“KWIC”)が利用される場合もあるが、トピックに応じた感覚は、依然として欠けている。その上、分類をした形式を採用した場合であっても、ウェブ検索エンジンは、一般には情報源によって検索結果を分離するか、検索の代表として一般的なクエリを集めるか、若しくは、クラスタリング技術を一般的なテーマに沿ったチャンネル検索結果に適用するかによるものである。その結果、検索結果は多くの場合、乱雑になり、トピック的に混ぜ合わさった記事の集まりとなる。
したがって、トピックに応じた検索には、多くの事柄が関わる問題が存在する。一つ目の問題は、検索のための入力が最小限であるということである。検索をする場合には、ユーザは、情報の要求をするために、可能な限り少ない入力ですませようとする。実験的には、多くのユーザによるクエリに含まれる語は、一つか二つである。二番目の問題は、情報の要求に対する応答は短くするが、所望の要求に対する案内も提供することである。あまりにも多くの情報を提供すると、ユーザを混乱させる。ユーザにとって必要な情報が誤って特定された場合であっても、焦点の合ったインデックスであれば、最も関連するトピックを推定しこれを選択した関連トピックと共に提供することによって、この問題に対処することができる。精度の低い要求が与えられたときに精度の高い応答を提供するという二元的な問題が、トピック検索の中心部にある。
焦点の合ったトピックのサブインデックスを提供するという一つのアプローチでは、検索エンジンのクエリ言語において用いられるような、有限の状態パターンを用いる。どのトピックが、与えられたクエリに対応するトピックのインデックスに入るかを判断するために、有限状態パターンを用いることができる。しかしながら、ほとんどのクエリは、単純にあまりにも短すぎるので、十分な“コンテンツ信号”を提供できず、トピックを特定するために適した有限状態パターンに対応させることができない。
焦点の合ったトピックのサブインデックスを創出するための別のアプローチは、言葉の類似性評価を用いることである。一般化した潜在的な意味分析及び活性伝播のような複数の技術を結び付け、言葉の使用における類似性を測定する“言葉の関連性”のスコアを計算する。単語対の共起性が、言葉の類似に対する代理(proxy)として用いられる。予め計算するものとして、単語対の存在が、コーパス全体に対するスライドウインドウ内で数えられる。共起する単語対の数が、大規模疎行列の中で保持される。次いで、この行列は、検索語に関連した単語を検索するのに用いられる。クエリ語が、行列に対応し、それらを伴って、共起する別の言葉を見つける。対応さけることによって、関連語のリストを作る。この処理は、追加したそれぞれの言葉に対して繰り返して行われ、リストにさらに追加すべき言葉を呼び起こすことができる。二以上の経路によって、加えられる単語が導かれる場合には、語の対となる存在による影響が結び付けられる。同時に、インデックスラベルを別の活性伝播プロセスに対する種として、用いることができる。クエリ語に関連する言葉のゆれが、インデックス語に関連する言葉のゆれと交差する場合には、このプロセスは、継続する。何度も繰り返した後には、ラベル語がクエリ語に関連したものとして特定されるインデックスの入力が、集められる。このプロセスの変形例では、ラベル語に関連した語を予め計算することができる。関連したインデックスの入力が、特定される場合には、ラベルとクエリ語を関連させるために十分に高いスコアを持つインデックスの入力を含むサブインデックスが作られる。これらの技術の問題は、検索時において、大きな共起行列を要求することであり、このことは、クエリ語の幅広い可能性の観点から、一般的には、実践的でない。
全てのインデックスにわたって適用される場合には、先頭のインデックス及びその先頭のトピックが、トピックによる検索クエリからの結果を編成するトピック検索を通して、提示される。インデックス内で適用される場合には、そのインデックス内にある先頭のトピックが、トピック検索を通して提示される。トピック検索は、情報だけでなく、先頭のインデックス、若しくは、情報に最も密接に関連したトピックにおいて見られる情報と結びついた焦点の合ったサブインデックスも出力する。先頭のインデックス、若しくは、焦点の合ったサブインデックスは、ユーザが自分の志向を検索結果に取り入れることを可能にする。例えば、所望の情報が、近接のトピックの下にある場合には、ユーザが、焦点の合ったサブインデックスからトピックを選択し、情報の閲覧を開始することができる。しかしながら、元の検索クエリの語が、どのトピックに対応するかあいまいである場合には、新しい検索クエリを定式化する必要なく焦点の合ったサブインデックスにおける最も関連性のあるトピックを伴う別のテーマの範囲を、ユーザは、代わりに選択することができる。
一実施形態は、トピックを基にした検索を提供するコンピュータによって実施可能なシステム及び方法を提供する。コーパスは保持され、デジタル情報の記事と、一又それ以上の記事にそれぞれ関連するトピックを含むインデックスと、を含む。それぞれのトピックに対して、粗いトピックモデルが構築される。その粗いトピックモデルは、トピックに関連する記事の中にある特徴的な単語と、特徴的な単語に割り当てられたスコアと、を含む。検索語を含む検索クエリは、インデックスに対して、実行される。検索語に対応するトピックが、スコアに応じて選択される。選択された粗いトピックモデルに対応するトピック、及び、検索クエリに対応する記事が、ユーザインターフェースを介して表示される。
トピック検索の従来の方法は、ウェブスケールで動的に変化するデータについて使用するには不適当である。これらの方法は、トピックによって分類されたコーパス内の記事に基づいた予め計算されたきめ細かいトピックモデルによって提供されるという利点を欠いている。これらの方法では、大きなメモリと計算時間とが繰り返し要求される。対照的に、トピック検索は、社会的インデックスシステムから利用可能な記事の、予め計算されたトピックの編成を利用して、高速かつ実践的なトピック検索を提供する。
本発明の別の実施形態は、後述の詳細な記載からこの分野における当業者には、容易に明らかになるであろう。この詳細な記載には、本発明を実行するために意図されたベストモードを説明するための実施形態が記載されている。ここで理解されるように、本発明が、別の実施形態及び異なる実施形態を実施すること、及び、多くの詳細が様々な明らかな観点によって変形形態を実施することは、本発明の思想及び範囲から外れることなく、すべて可能である。従って、図面及び詳細な説明は、例示目的であり、発明を制限するものとみなされるべきではない。
デジタル情報の意味付け及び情報検索のための典型的な環境を示すブロック図である。 図1の環境で用いられる主要な要素を示す機能ブロック図である。 デジタル情報及びトピック的に関連したサブインデックスの選択をするために必要なユーザインターフェースを、例として示すスクリーンショット図である。 一実施形態に適合したトピックに基づいた検索を提供する方法を示すフロー図である。 図4のルーティーンを用いる粗いトピックモデルを作るルーティーンを示すフロー図である。 図5のルーティーンを用いる特徴的な単語のスコアを調整するルーティーンを示すフロー図である。 図4の方法を用いてトピックにスコア付けするルーティーンを示すフロー図である。 図4の方法を用いてサブインデックスを表示するルーティーンを示すフロー図である。 拡張して焦点の合ったトピックのサブインデックスを提供するユーザインターフェースのスクリーンショットを、例として、示す図である。 拡張して焦点の合ったトピックのサブインデックスを提供するユーザインターフェースのスクリーンショットを、例として、示す図である。 拡張して焦点の合ったトピックのサブインデックスを提供するユーザインターフェースのスクリーンショットを、例として、示す図である。
デジタル情報の意味付けとデジタル情報の検索は、関連しているが、異なる動作である。前者は、デジタル情報のインフラストラクチャによって達成される意味付けに関連し、インターネット、単独のコンピュータシステム、及び、様々な開放したデジタル情報のリポジトリのような、公共のデータネットワークが含まれる。後者は、デジタル情報のインフラストラクチャからの情報の検索及び発掘に関連し、このインフラストラクチャは、社会的なインデックスを通して、若しくは、インデックスをつけるための別の情報源によって、トピックごとに統合される。図1は、デジタル情報の意味付け及び情報検索のための典型的な環境10を示すブロック図である。社会的なインデックスを付けるシステム11及びトピック検索システム12が、連携して機能し、社会的インデックス付け及びトピックの検索の起動の両方をサポートする。
デジタル情報は、デジタル形式で利用可能な情報のコーパスであり、例えば、記事、ウェブページ、若しくは、情報の別の項目である。情報の量に制約はなく、そのことはコーパス及びトピックの範囲が継続的に成長し、大きさやテーマに関する固定した境界が無いことを意味する。インターネットのようなデジタルデータの通信ネットワーク16は、情報源と消費者の間でデジタル情報を交換するためのインフラストラクチャを提供する。他のデジタル情報交換インフラストラクチャ、例えば私企業のネットワークであってもよい。
ネットワーク16は、多様で分散された情報源とコンシューマとの相互接続を可能にし、前者はデジタル情報を提供し、後者はこれにアクセスする。著者、編者、協力者、外部寄与者は、継続的に記事、ウェブページなどをネットワーク16に掲載する。これらは、ウェブサーバ14a、ニュースの集合サーバ14b、投票可能なニュースサーバ14c、その他の情報ソースとしての役割を果たすデータリポジトリを通して、分配されるデータのコーパスとして維持される。これらのソースは、それぞれウェブコンテンツ15a、ニュースコンテンツ15b、及び、一般によって投票され若しくは”審査”されたコンテンツ15cを、ネットワーク16にアクセスするユーザに提供する。このアクセスは、例えばパーソナルコンピュータやその他の情報コンシューマとして機能するすべてのサーバであるユーザデバイス13a−cを介して行われる。サーバその他の非ユーザデバイス情報コンシューマもが同様にコーパスコーパス内の情報を調査、検索、使用することはできるが、ここでは単純にするために、ユーザのデバイスだけを議論する。
一般に、ユーザデバイス13a−cは、ウェブブラウザ若しくは類似のアプリケーションを実行する、ウェブが利用可能なデバイスであり、サーバ14a−cに対するインターフェースをサポートするとともに、サーバ14a−cを用いて、情報の交換及び検索をサポートする。ユーザデバイス13a−c及び14a−cは、汎用目的のプログラム可能な計算デバイスに見られる中央処理装置、メモリ、入力/出力ポート、ネットワークインターフェース、及び、不揮発性ストレージ等を含むが、これら以外のものであってもよい。さらに、サーバ14a−cの代わりに、若しくは、サーバ14a−cに加えて、別の情報ソースを含んでもよいし、ユーザデバイス13a−cの代わりに、若しくは、ユーザデバイス13a−cに加えて、別の情報コンシューマを含んでいてもよい。
デジタル情報の検索は、デジタルの意味付けの重要な部分である。一実施形態においては、トピックの検索システム12は、社会的インデックス付けシステム11に統合される。社会的なインデックス付けシステム11は、トピック的に分類された記事を提供する。これは粗いトピックモデルのベースとなる。ユーザが、社会的インデックス付けシステム11におけるインデックスに基づいてトピック検索を実行すると、検索結果は、先頭のインデックス及び先頭のトピックを提供するか、あるいは単に一つに焦点の合ったサブインデックス内の先頭のトピックのみを提供する。
社会的インデックス付けシステム11によって提供されるトピックの編成は、トピック検索システム12によって、有用に利用される。ただし、別のインデックス付けのソースを用いることもできる。ユーザデバイス13a−cからの検索クエリは、インデックスの全体、あるいは焦点を合わせた単一のインデックスに対して実行され、そして、動的に焦点が合わせれ、トピック的に関連付けられた一連のインデックス及びそれらの先頭のトピック、若しくは、焦点が合わされた単一のインデックス内にある先頭のインデックスが、それぞれ、トピック検索システム12によって、サーチ結果を表示するために生成される。
デジタル情報の検索のための環境10は、ユーザからは単一の情報ポータルとして見えるが、実際には別々の、しかしながら統合された一連のサービスである。図2は、図1の環境10で用いられる主要な要素20を示す機能ブロック図である。この要素は、デジタル情報の検索に焦点を合わせたものである。発見、探査(prospecting)、適応(orienting)のような別の関連したデジタル情報を行うために、追加の要素要求してもよい。
要素20は、大まかに三つの主要な機能モジュール、つまり、情報収集21、トピック検索23及びユーザサービス26に分類でき、一つの任意の機能モジュールである社会的インデックス付け機能22を加えることができる。他の複数の機能モジュールも可能である。その上、機能モジュールは、同じ若しくは別々の計算プラットフォームによって実行することができる。情報収集21は、ウェブコンテンツ15a、ニュースコンテンツ15b及び“審査された”コンテンツ15cのような入来するコンテンツ27を、ウェブサーバ14a、ニュース集約サーバ14b及び投稿可能なニュースサーバ14cを含む、電気的に格納された情報の分配されたコーパスを集約的に形成する制約のない情報源から、得る。外から来る入来コンテンツ27は、メディアコレクタによって集められ、新しいデジタル情報をコーパスから収集する。入来コンテンツ27を、典型的には、構築されたリポジトリに格納するか、若しくは、実際のコピーを保持する代わりに、ハイパーリンク若しくは引用を入来コンテンツに確保することによって、間接的に格納することができる。
入来コンテンツ27は、初めに格納されていた表現とは異なる複数の表現で格納することができる。異なる表現を用いることによって、タイトルを表示すること、記事の要約を表現すること、トピックの分類の軌跡を維持すること、及び、きめ細かいトピックモデルを導いて利用することなどが容易になる。記事の中の言葉をせき止め、トークン形式化、マイナスの句点付け、大文字化、などをされて保存することができる。その上、社会的インデックス付けシステム11によって作成されるきめ細かいトピックのモデルは、入来コンテンツ27をかなり抽象化した変形版として表され、そこでは多くの単語が捨象され、主として単語の頻度が保持される。
入来コンテンツ27は、好ましくは少なくとも一つのトピックインデックス29の下で編集される。トピックインデックス29は、全ての情報を対象とするより大きい一連のトピックインデックス33の一部とすることができる。別の実施形態においては、同一出願人によって2008年8月12日に出願された一連番号12/190,550の米国特許公開“主題領域内のデジタル情報を発見するために実行するシステム及び方法”のように、トピックのインデックス29は、社会的インデックス22を介して作られるエバーグリーン(evergreen)インデックスの形式とすることができる。該出願は、審査中であり、その公開公報は、参照により本明細書に組み込まれているものとする。エバーグリーンインデックスは、新しい情報が、インデックスにおいて、一又はそれより大きいトピックの下に新しい情報が落ちるか否かをテストするために用いられる有限状態パターンのような、きめ細かいトピックモデルを含む。社会的インデックス22は、トレーニング教材を起動する管理された装置学習を、トピックインデックス29にそれぞれのトピック及びサブトピックに対するきめ細かいトピックモデルに適用する。トレーニングされた時点で、エバーグリーンインデックスを、インデックスの外挿法のために用いて自動的に新しい入来コンテンツ27を予め選択された主題領域のトピックに分類することができる。
図4に関連して後述するように、トピック検索23は、トピックによるサーチクエリからの結果を編集する。トピック検索23は、情報を返すだけでなく、図10に関連して後述するように、全てのインデックスの中の一連の先頭のインデックス及びそれらの先頭のトピック、あるいは図11に関連して以下に示すように焦点が合わされたサブインデックス内にある先頭のトピックのみを返す。これらはいずれもは、見いだされた情報を、その情報に最も密接に関連した、選択されたトピックと結び付ける。トピック検索23には、トピックのインデックス29の中の各トピックについて、特徴的な単語粗いトピックモデル32を作る、予め計算するモジュールが含まれる。この粗いトピックモデル32は、特徴的な単語のトピックモデルとしても知られる。トピック検索23にはまた、検索エンジン(非表示)と結びついたクエリ処理モジュール25が含まれる。クエリ処理25は、一連の先頭のインデックスをそれらのトピックと共に生成するか、特定のトピックインデックスから選択されたトピックを焦点を合わせたサブインデックスを生成する。検索結果、先頭のインデックス及びこれらの先頭のトピック、若しくは、焦点を合わせたサブインデックス内にある先頭のトピックのみを視覚的にユーザにユーザインターフェースを通して、表示する。
最終的に、それぞれのトピックインデックス29に対する粗いトピックモデル32及び一連のトピックインデックス33が、中央のストレージ28内に保持される。ユーザサービス26は、一連のトピックインデックス33及び入来するコンテンツ27にアクセスし、一連のトピックのインデックス33若しくは一つのトピックインデックス29に基づいて検索クエリを実行し、そして、検索結果、先頭のインデックス及び焦点を合わせたサブインデックスにアクセスするためのフロントエンド(front-end)を、ユーザ30a−bに提供する。さらに別の実施形態においては、それぞれのトピックインデックス29は、中心の主題領域に関心を持ち続ける“増加した(augmented)”コミュニティとして知られるユーザのコミュニティと結び付けられる。コミュニティは、その情報が割り当てられたトピック内で、投票30が引用した情報を“審査する”。
デジタル情報のコーパスは、トピックインデックス29を用いて、一又はそれより大きい階層に編成される。情報のコーパスは各トピックインデックス29に対して存在し、システムに対する完全なコーパスには、個々のインデックス29の全体に対するコーポラ(corpora, corpusの複数形)が含まれる。図3は、選択デジタル情報41及びトピック的に関連したサブインデックス42を提供するユーザインターフェース40を、例として示したスクリーンショット図である。サブインデックスとして検索中に利用可能な特定のトピックインデックス29内にある関連トピックを示すことによって、ユーザが、検索労力を集約し、必要な情報をすばやく発見することができる。
選択デジタル情報41は、ウェブ、本のページ、若しくは、トピックインデックスを通して参照する別のテキストから検索された記事であってもよい。トピック的に関係したサブインデックス42は、特定のインデックス29内で検索が実行される場合における検索クエリ語に応じてトピック検索システム12によって選択されて、表示される全体のインデックス29の部分集合である。この例においては、それぞれのサブインデックスの入力の引用は、ページ番号に沿ってテキスト内の場所を参照し、下位トピックにおいて最も重要なページが、太いタイプフェイスにするように強調して表示され、特定の重要な部分を強調する。別の方法として、表示された選択デジタル情報41において検索クエリ語がどのように用いられるかについて注意を引くように、KWICインデックスを下線を引いてテキスト内に配置することもできる。
サブインデックス42は、トピックによって検索結果を編集し、インデックス29内にある主要なカテゴリー、及び、表示された主題の構造にユーザの注意を向ける。文脈エントリーすなわちノード43は、幅広いトピックの組を、トピックの低い分解能で提供する。フォーカスエントリー(focus entry)、すなわちノード44は、サブインデックス42において表示されるそれぞれのサブトピックに対して表示されるデジタル情報41内にある特定の場所を示して、高いトピック分解能を提供する。
ユーザインターフェース40は、高いレベルの文脈ノード、低分解能のトピックインデックスの入力、及び、焦点を合わせた高分解能の文脈インデックスの登録を促進する。この高レベル文脈ノードは、サブインデックス42を表示するのに必要なスペースを大幅に増加させることなく、特定のトピックに対する幅広いガイドを提供する。ユーザにとって最も良いガイドになると考えられる情報の種類の評価に応じて、フォーカスノード及び文脈ノードに割り当てられるスペースのバランスが図られる。ユーザからの必要度があまり明確ではない場合には、文脈ノードにユーザインターフェースのうちのより大きなスペースを与えて、ユーザがすばやく一般的なトピック領域を認識し、要約して、文脈ノードに従って特定の情報に向かうのを助ける。ユーザからの必要度がより明確である場合には、ユーザインターフェースの中でフォーカスノードにより多くの情報を与え、特定の情報について絞り、充実させる。
一つの形態において、トピックを基にした検索は、トピックインデックス33の全体の中にある先頭のインデックスを、先頭のトピックと共に特定する。別の形態においては、トピックを基にした検索は、短く、焦点を合わせ、サブインデックスを作り、そのサブインデックスは、ユーザによる検索語に応答して関連性に応じて選択された、特定のインデックス内のトピックを強調表示する。図4は、一実施形態のトピックを基にした検索を提供する方法70を示すフロー図である。この方法は、一連のプロセス若しくは方法のステップとして実行され、これは例えばサーバのような汎用目的で用いられるプログラムされたコンピュータによって実行される。
方法70は、二段階で実行される。第一段階では、予め計算している段階の間において、粗いトピックモデル、すなわち、特徴的な単語のトピックモデルが、図7及び8に関連して示されるように、それぞれのトピックに応じて作られる(ステップ71)。それぞれの粗いトピックモデルは、それぞれのトピックに対して重要な言葉、及び、特定されたそれぞれの特徴的な単語に対して、相対的な重要性を示す計量若しくはスコアを特定する。
第二段階では、検索クエリが処理されている(ステップ72−75)。検索を、(1)全てのインデックスにわたって、(2)あるインデックス内で、という二つのモードで行うことができる。検索が全てのインデックスにわたって行われる場合には、クエリを、特徴的な単語のインデックスモデルと対応させ、先頭のインデックスを発見する。次いで、それぞれのインデックスごとに、クエリが特徴的な単語のトピックモデルに対して対応させ、インデックスの中から先頭のトピックを発見する。検索の結果は、先頭のインデックスを先頭のトピックと共に含む。インデックス内の検索において、クエリは、特徴的な単語のトピックモデルに対して、対応させ、インデックス内の先頭のトピックを発見する。検索の結果は、インデックス内にある先頭のトピックを含む。
両方の検索モードに対して、検索クエリをユーザから受信し、規定どおりに、トピックのインデックス33の一連全体にわたって実行するか、若しくは、特定のトピックのインデックス29内で実行する。検索クエリは、一又はそれより多くの検索語を特定することができる。全体のインデックスセット33におけるトピック、若しくは、特定のインデックス29は、検索クエリに対応して、点数付けされ(ステップ73)、図9及び図10を参照して、それぞれ以下に記載されるように、検索結果、並びに、先頭のインデックス及び先頭のトピック、若しくは、焦点を合わせたサブインデックス内にある先頭のトピックが、それぞれ、表示される(ステップ74)。そのクエリ処理段階(ステップ72−75)は、繰り返しそれぞれの連続するクエリに対して実行される(ステップ76)。
予め計算する段階を、検索クエリ処理と独立に先に実行することができる。図5は、図4のルーティーン70と共に用いる、粗いトピックモデルを作るルーティーン80を示すフロー図である。粗いトピックモデルは、特徴的な単語及び、それぞれの特徴的な単語の相対的重要性を反映したスコアを含む。
特徴的な単語は、トピックに関するテキストを区別するのに役立ち、典型的には、適切なコーパス内の記事から選択された言葉である。そのコーパスは、ウェブページ、電子書籍、若しくは、その他の印刷された素材のように利用できるデジタル情報を含むことができる。最初に一連の若しくは抽出した記事を、ランダムに適切なコーパスから選択する(ステップ81)。特徴的な単語の基準及び発生頻度は、一連の記事からランダムに抽出される(ステップ82)。インデックス29内のトピックに対する基準は、インデックス29のコーパスに応じて、判断される。一式のインデックス33に対する基準は、個別のインデックス29の全てに対するコーポラである、システム全体のコーパスにわたって計算される。待ち時間を縮めるために、基準を満たすそれぞれの特徴的な単語の存在の頻度を予め計算することができる。一実施形態においては、インデックス内にあるトピック下に存在する記事の数が、例えば一時間ごとに計測される。周期的に、記事の数が、10パーセントのように予め決められた量の差で、変化した場合には、存在の頻度が再度決定される。次に、ユーザに選択された一連のポジティブトレーニング例が得られる(ステップ83)。ポジティブトレーニング例は、前述されたように、きめ細かいトピックモデルを構築するときに管理された学習の際に用いられたものと同じ一連の記事とすることができる。別の実施形態においては、きめ細かいトピックモデルと合致する記事の例が、ポジティブトレーニング例の代わりに用いられる。特徴的な単語が、ポジティブトレーニング例から抽出されて、ポジティブトレーニング例の中にあるそれぞれの特徴的な単語の存在する頻度が、決定される(ステップ84)。計測若しくはスコアが、例えば、語頻度−逆文献頻度(TF−IDF)の重みを用いて、それぞれの特徴的な単語に割り当てられる。この語頻度−逆文献頻度(TF−IDF)の重みは、ベースライン内にあるそれぞれの特徴的な単語の出現頻度に対するポジティブトレーニング例の内にあるそれぞれの特徴的な単語の出現頻度との比を特定する(ステップ85)。それぞれの特徴的な単語のスコアを調整して(ステップ86)、トピックに対して特徴的な単語の重要性を向上させるか、若しくは、低下させることができる。最終的には、クエリ処理段階で用いるための特徴的な単語及びスコアの表が生成される(ステップ87)。特徴的な単語及びスコアをリストにして、この表を整理し、集めることができる。別の型の表も可能である。
異なる“アクター(actor)”が、粗いモデルを作るという動作を実行する。ランダムに一連の記事を選択し、ベースラインを判断するためのアクターはシステムである。ポジティブトレーニング例を選択するためのアクターは人間である、インデックス管理者である。ポジティブトレーニング例を選択する場合には、管理者は、事実上、トピックの境界を規定する。残りのステップの全てが、システムによって実行される。ポジティブトレーニング例の選択が、人間によってなされるため、前もって、ルーティーンにおけるあらゆる別のステップより先にその選択を完了することができる。つまり、ルーティーンは、入力として、コーパス内にある一連の記事、及び、ポジティブトレーニング例として指定されたコーパスから一連の記事を受け取る。ポジティブトレーニング例が、きめ細かいモデルと合致する記事である場合には、同じことが認識される。ここで、きめ細かいモデルは、トピックラベルに基づいたきめ細かいパターンを作る“初期トレーニングアルゴリズム”に由来する。きめ細かいトピックモデルを作るこれらの二つのアプローチは、“初期トピックトレーニング”及び“例に基づくトピックトレーニング”と呼ばれる。
それぞれの特徴的なスコアは、存在頻度の生の比率を反映している。図6は、図5のルーティーン80を用いる特徴的な単語のスコアを調整するルーティーン90を示すフロー図である。試行錯誤的に、それぞれの特徴的な単語のスコアを文脈に応じて多くの方法で調整することができる。例えば、めったにない言葉、つまり、コーパス、若しくは、引用した一連の素材内で最小の回数より少ない回数で現れる言葉のスコアを、例えば、25パーセント圧縮、若しくは、縮小することができる(ステップ91)。同様に、文字数の最小となる閾値より短い言葉のスコアは、同様のパーセントで圧縮することができる(ステップ92)。なぜなら、短い言葉は、トピック的に重要な意味を持たない場合が多いからである。反対に、ラベル若しくはタイトル内にある言葉は、強くトピックの内容を反映しているので、それらのスコアは、例の中に存在する言葉に比べて何倍も押し上げられて、増加する(ステップ93とステップ94それぞれ)。典型的には、全てのラベルの言葉は、特徴的な単語として含められる。最後に、ラベル語に近接して存在する言葉、つまり、近接語 及び、セットウインドウ内にあるラベル語の周囲に存在する“近隣”語のスコアは、押し上げられる(ステップ95)。規格化された閾値が、近接語及び近隣語の選択中に採用される。最大スコアの8パーセント及び15パーセントの初期の閾値がそれぞれ、近接語及び近隣語に、8語のセットウインドウの大きさを伴って、それぞれ採用される。別の代表的な閾値及び長さを用いることもできる。最終的に、特徴的な単語のスコアは、規格化される(ステップ96)。最高のスコアを持つ特徴的な単語は又、最も固有の言葉であり、そのスコアを100パーセントに設定する。残った特徴的な単語のスコアは、最高のスコアを基にして、拡大縮小される。したがって、特徴的な単語の選択を完了した時点で、インデックス内にあるそれぞれのトピックは、コーパスからサンプリングされた題材に応じて、規格化された特徴的な単語に関連して表現された粗いトピックモデルを持つ。
クエリ処理中において、ユーザインターフェースを介して受け取られた検索語は、粗いトピックモデルに照合され、コーパスに対する全インデックスからトピックを選択をガイドするために用いられる。図7は、図4の方法70を用いてトピックにスコア付けするルーティーン110を示すフロー図である。検索語は、蓄積された語を参照することを通して、粗いトピックモデルに対して照合される。
全インデックス内にあるそれぞれのトピック、及び、検索クエリ内にあるそれぞれの語が、評価される(ステップ111-119及び112−116のそれぞれ)。トピックを参照する(ステップ113)それぞれの語(ステップ112)に対して、対応する特徴的な単語のスコアが、表によって調べられ(ステップ114)、累算した合計に加えられる(ステップ115)。特徴的な単語の表が、集められた場合には、その語は、検索キーとしての役割を果たす。その合計は、それぞれの検索クエリ語ごとに累算されて(ステップ116)、その後、累算した合計が、ゼロ(ステップ117)若しくは予め決定された閾値を越えているトピックのみが保持される。トピック及びその累積した合計スコアが参加者(candidate)のトピックの整列したリストに加えられる(ステップ118)。別の実施形態においては、特定のトピックインデックス29において最も関連性のあるトピックを単に選択するのではなく、一連のトピックインデックス33における最も関連性のあるインデックスを先頭のトピックとともに選択する。
さらに別の実施形態においては、それぞれの特徴的な単語の個別のスコアが、最小の閾値に対して評価されて、一又はそれより大きいスコアが閾値を満たさなかった場合には、そのトピックは、軽視されるか、若しくは、廃棄される。例えば、高いスコアを持つ特徴的な単語の小集団が、別の低いスコアの特徴的な単語に沿ったトピックの一部に一致する場合のように、このチェックは、検索クエリ語に部分的にのみ一致するトピックを除外するのに役立つ。
検索結果として提示される情報は、変化することができる。例えば、幅広い検索クエリは、通常の場合には、一つのウェブページ上で見やすく映し出されることが可能である以上に多くの検索結果を生成するので、全体のセットの代わりに検索結果の部分集合を提示してもよい。図8は、図4の方法70を用いてサブインデックスを表示するルーティーン120を示すフロー図である。トピック及び累積した合計のスコアの整列したリストが取り出されて(ステップ121)、トピックのサブインデックスツリーが構築される(ステップ122)。それぞれのトピックの親トピックは、トピックツリーに含まれる。下位のトピックは、焦点を合わせた幹を表現するが、親のトピックは、文脈の幹を表現する。別のトピック、つまり、検索クエリ語に適合しないトピック、若しくは、親トピックではないトピックは示されない。ツリーのそれぞれの枝の下にある同種のトピックは、アルファベット順に提示されるが、別の順番も可能である。最高のスコアのトピックは、引き立たせられるか、若しくは、色、太い文字若しくは下線、によって、強調表示される。また、最低のスコアのトピックは、例えば、トピックがセット照合値を下回った場合には、省略されてもよい(ステップ123)。規格化されていないスコアに基づいて、検索結果の上位mパーセントが強調される。mは、初期値として、20パーセントにセットするが、別の制限を用いてもよい。正規化されたスコアに基づいて、例えば、60パーセントのようなスレッショルドを超えた累積合計スコアを持つトピック、若しくは、スコアが上位である特徴的な単語が検索語であるトピックを強調してもよい。検索語の強調に関して、別の形式及び基準を採用することも可能である。最終的には、サーチ結果及びサブインデックスツリーを構成する情報が表示される(ステップ124)。
サブインデックスは、推測された興味の程度に基づいて導かれたトピックの情報選択及び表示に役立つ。図9−11は、拡張して焦点を合わせたトピックのサブインデックスを提供するユーザインターフェース131、141、151のスクリーンショット130、140、150を例として示す図である。最初に図9を参照すると、ユーザは、語のリスト132を入力することによって検索クエリを特定している。検索クエリは、入力されているが実行されていない。ユーザインターフェース131内にあるパネル133は、システム内で利用できる多くのトピックインデックスを示している。
トピック検索は、情報だけでなく、一連の上位のインデックス及び上位のトピック、若しくは、情報に最も密接に関連しているトピックを伴う情報と結びついた焦点合わせされたサブインデックスも、返す。焦点合わせされたサブインデックスは、ユーザが検索結果を自分の指向に合わせることを可能にする。ユーザは、ユーザインターフェースを介して、全ての知られたインデックスにわたって、上位のインデックス及びその上位のトピックを特定することができる上位レベルの検索を実行することができる。次に、図10を参照すると、全インデックス検索が実行されて、上位のインデックス142a−e及びその上位のトピック143a−eを含む検索結果が提示される。ユーザはまた、特定のインデックス内にある全てのトピックについて検索し、上位トピックを強調するトピックツリーを表示するインデックス内検索を実行することができる。最後に、図11を参照すると、一つのインデックス検索が実行され、取得した記事のリストを示す検索結果152が表示されている。焦点合わせされたサブインデックス153は、トピックツリーとして、強調して表示された特定のトピック154を伴う検索クエリからの結果を統合している。
本発明が、特にその実施形態を参照して示されて記載されているが、本分野の当業者は、形式及び詳細において、本発明の思想及び範囲を外れることなく、既に述べたあるいはその他の変更を行うことができることを理解するであろう。
10 環境
11 システム
12 トピック検索システム
13a−c ユーザデバイス
14a ウェブサーバ
14b ニュースの集合サーバ
14c 投票可能なニュースサーバ
15a ウェブコンテンツ
15b ニュースコンテンツ
15c “審査された”コンテンツ
16 ネットワーク
20 主要な要素
21 情報収集
22 インデックス付け機能
23 トピック検索
25 クエリ処理モジュール
26 ユーザサービス
27 入来コンテンツ
28 ストレージ
29 トピックインデックス
30a−b ユーザ
32 粗いトピックモデル
33 トピックインデックス
40 ユーザインターフェース
41 デジタル情報
42 サブインデックス
43 ノード
44 ノード
70 ルーティーン
80 ルーティーン
130 スクリーンショット
131 ユーザインターフェース
132 語のリスト
133 パネル
140 スクリーンショット
141 ユーザインターフェース
142a−e 上位のインデックス
143a−e その上位のトピック(142の上位トピック)
150 スクリーンショット
151 ユーザインターフェース
152 検索結果
153 サブインデックス
154 トピック

Claims (4)

  1. トピックに基づいた検索を提供するコンピュータにより実行されるシステムであって、 デジタル情報の複数の記事、及びそれぞれが一又はそれより多い記事に関連する複数のトピックを含む1又はそれより多いインデックスであって、永続記憶装置に電子的に記録される前記記事及びインデックスと、
    プロセッサ及び前記プロセッサによって実行するためのコードを記録したメモリを含むコンピュータであって、
    それぞれのトピックに対して、前記トピック及び特徴的な単語に割り当てられたスコアに関連する記事に含まれる前記特徴的な単語を含む粗いトピックモデルを構築するトピック構築手段と、
    前記インデックスの一つに対する検索語を含む検索クエリを実行し、スコアによって検索語と適合したトピックを選択する検索エンジンと、を含むコンピュータと、
    前記選択された粗いトピックモデル及び前記検索クエリに対応する記事を視覚的に表示するユーザインターフェースと、
    を含むことを特徴とするシステム。
  2. 前記プロセッサによって実行されるコードを含むモデル構築手段であって、
    記事のランダムサンプリングを選択するランダムサンプリング手段と、
    前記ランダムサンプリング及びポジティブトレーニング例における記事に含まれる特徴的な単語の存在の頻度を判断して、前記ランダムサンプリング及び前記ポジティブトレーニング例に含まれる特徴的な単語に対する存在の頻度の比率を特定するスコアリングモジュールと、を含むモデル構築手段をさらに含み、
    前記特徴的な単語の前記比率が粗いトピックモデルのスコアとして含まれることを特徴とする請求項1に記載のシステム。
  3. 前記プロセッサによって実行されるコードを備える、前もって計算をするモニタであって、
    前記インデックスの前記トピックに備えられる多くの記事を監視するカウンタと、
    記事の数が、前もって決めれた量の変化があった場合には、前記ランダムサンプリングに含まれる前記記事に備えられた特徴的な単語の存在の頻度を周期的に再度決定する分析手段と、
    をさらに含むことを特徴とする請求項2に記載のシステム。
  4. それぞれのトピックに対してきめ細かいトピックモデルに適合する記事のサンプリングが、前記ポジティブトレーニングサンプリングの代わりに選択されることを特徴とする請求項2に記載のシステム。
JP2009191894A 2008-08-28 2009-08-21 トピックを基にした検索を提供する方法及びシステム Pending JP2010055618A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US9272708P 2008-08-28 2008-08-28
US12/354,681 US8010545B2 (en) 2008-08-28 2009-01-15 System and method for providing a topic-directed search

Publications (1)

Publication Number Publication Date
JP2010055618A true JP2010055618A (ja) 2010-03-11

Family

ID=41426832

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009191894A Pending JP2010055618A (ja) 2008-08-28 2009-08-21 トピックを基にした検索を提供する方法及びシステム

Country Status (3)

Country Link
US (1) US8010545B2 (ja)
EP (1) EP2159715B1 (ja)
JP (1) JP2010055618A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016532173A (ja) * 2013-09-29 2016-10-13 ペキン ユニバーシティ ファウンダー グループ カンパニー,リミティド 意味情報、キーワード拡張及びそれに関するキーワード検索の方法及びシステム
JP2020067830A (ja) * 2018-10-24 2020-04-30 Solize株式会社 テキスト表示方法及び、テキスト表示装置
JP2020074144A (ja) * 2017-06-01 2020-05-14 株式会社インタラクティブソリューションズ 検索用資料情報記憶装置
KR20210146834A (ko) * 2020-05-27 2021-12-06 정치훈 토픽 키워드를 이용한 문서 검색을 위한 사용자 인터페이스 제공 장치 및 방법

Families Citing this family (219)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8930331B2 (en) 2007-02-21 2015-01-06 Palantir Technologies Providing unique views of data based on changes or rules
US8209616B2 (en) * 2008-08-28 2012-06-26 Palo Alto Research Center Incorporated System and method for interfacing a web browser widget with social indexing
US9348499B2 (en) 2008-09-15 2016-05-24 Palantir Technologies, Inc. Sharing objects that rely on local resources with outside servers
US8549016B2 (en) * 2008-11-14 2013-10-01 Palo Alto Research Center Incorporated System and method for providing robust topic identification in social indexes
US8452781B2 (en) * 2009-01-27 2013-05-28 Palo Alto Research Center Incorporated System and method for using banded topic relevance and time for article prioritization
US8719249B2 (en) * 2009-05-12 2014-05-06 Microsoft Corporation Query classification
US9104695B1 (en) 2009-07-27 2015-08-11 Palantir Technologies, Inc. Geotagging structured data
US8620929B2 (en) * 2009-08-14 2013-12-31 Google Inc. Context based resource relevance
JP4637969B1 (ja) * 2009-12-31 2011-02-23 株式会社Taggy ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
WO2011111284A1 (ja) * 2010-03-12 2011-09-15 日本電気株式会社 関連情報出力装置、関連情報出力方法およびコンピュータ読み取り可能な記録媒体
US9031944B2 (en) * 2010-04-30 2015-05-12 Palo Alto Research Center Incorporated System and method for providing multi-core and multi-level topical organization in social indexes
US9177045B2 (en) 2010-06-02 2015-11-03 Microsoft Technology Licensing, Llc Topical search engines and query context models
US8874581B2 (en) 2010-07-29 2014-10-28 Microsoft Corporation Employing topic models for semantic class mining
US9262517B2 (en) * 2010-08-18 2016-02-16 At&T Intellectual Property I, L.P. Systems and methods for social media data mining
US8738617B2 (en) 2010-09-28 2014-05-27 International Business Machines Corporation Providing answers to questions using multiple models to score candidate answers
NZ589787A (en) 2010-12-08 2012-03-30 S L I Systems Inc A method for determining relevant search results
AT12229U3 (de) * 2011-02-03 2012-05-15 Evolaris Next Level Gmbh Verfahren zur erstellung einer vorschlagsbasis
CN102163229B (zh) * 2011-04-13 2013-04-17 北京百度网讯科技有限公司 一种用于生成搜索结果的摘要的方法与设备
US8799240B2 (en) 2011-06-23 2014-08-05 Palantir Technologies, Inc. System and method for investigating large amounts of data
US9547693B1 (en) 2011-06-23 2017-01-17 Palantir Technologies Inc. Periodic database search manager for multiple data sources
US9092482B2 (en) 2013-03-14 2015-07-28 Palantir Technologies, Inc. Fair scheduling for mixed-query loads
US9621406B2 (en) 2011-06-30 2017-04-11 Amazon Technologies, Inc. Remote browsing session management
US8706860B2 (en) 2011-06-30 2014-04-22 Amazon Technologies, Inc. Remote browsing session management
US8799412B2 (en) 2011-06-30 2014-08-05 Amazon Technologies, Inc. Remote browsing session management
US8577963B2 (en) 2011-06-30 2013-11-05 Amazon Technologies, Inc. Remote browsing session between client browser and network based browser
US20130013425A1 (en) * 2011-07-05 2013-01-10 Marchex, Inc. Method and system for automatically generating advertising creatives
US9037696B2 (en) 2011-08-16 2015-05-19 Amazon Technologies, Inc. Managing information associated with network resources
US8732574B2 (en) 2011-08-25 2014-05-20 Palantir Technologies, Inc. System and method for parameterizing documents for automatic workflow generation
US9195768B2 (en) 2011-08-26 2015-11-24 Amazon Technologies, Inc. Remote browsing session management
US10089403B1 (en) 2011-08-31 2018-10-02 Amazon Technologies, Inc. Managing network based storage
US8504542B2 (en) 2011-09-02 2013-08-06 Palantir Technologies, Inc. Multi-row transactions
US10693991B1 (en) 2011-09-27 2020-06-23 Amazon Technologies, Inc. Remote browsing session management
US9178955B1 (en) 2011-09-27 2015-11-03 Amazon Technologies, Inc. Managing network based content
US9641637B1 (en) 2011-09-27 2017-05-02 Amazon Technologies, Inc. Network resource optimization
US8914514B1 (en) 2011-09-27 2014-12-16 Amazon Technologies, Inc. Managing network based content
US8849802B2 (en) 2011-09-27 2014-09-30 Amazon Technologies, Inc. Historical browsing session management
US8589385B2 (en) 2011-09-27 2013-11-19 Amazon Technologies, Inc. Historical browsing session management
US9298843B1 (en) 2011-09-27 2016-03-29 Amazon Technologies, Inc. User agent information management
US9152970B1 (en) 2011-09-27 2015-10-06 Amazon Technologies, Inc. Remote co-browsing session management
US9383958B1 (en) 2011-09-27 2016-07-05 Amazon Technologies, Inc. Remote co-browsing session management
US8615431B1 (en) 2011-09-29 2013-12-24 Amazon Technologies, Inc. Network content message placement management
US9305108B2 (en) 2011-10-05 2016-04-05 Google Inc. Semantic selection and purpose facilitation
US10013152B2 (en) 2011-10-05 2018-07-03 Google Llc Content selection disambiguation
US8930393B1 (en) * 2011-10-05 2015-01-06 Google Inc. Referent based search suggestions
US9313100B1 (en) 2011-11-14 2016-04-12 Amazon Technologies, Inc. Remote browsing session management
US8972477B1 (en) 2011-12-01 2015-03-03 Amazon Technologies, Inc. Offline browsing session management
US9009334B1 (en) 2011-12-09 2015-04-14 Amazon Technologies, Inc. Remote browsing session management
US9117002B1 (en) 2011-12-09 2015-08-25 Amazon Technologies, Inc. Remote browsing session management
US9330188B1 (en) 2011-12-22 2016-05-03 Amazon Technologies, Inc. Shared browsing sessions
US8839087B1 (en) * 2012-01-26 2014-09-16 Amazon Technologies, Inc. Remote browsing and searching
US9336321B1 (en) 2012-01-26 2016-05-10 Amazon Technologies, Inc. Remote browsing and searching
US9509783B1 (en) 2012-01-26 2016-11-29 Amazon Technlogogies, Inc. Customized browser images
US8627195B1 (en) 2012-01-26 2014-01-07 Amazon Technologies, Inc. Remote browsing and searching
US9087024B1 (en) 2012-01-26 2015-07-21 Amazon Technologies, Inc. Narration of network content
US9092405B1 (en) 2012-01-26 2015-07-28 Amazon Technologies, Inc. Remote browsing and searching
US9183258B1 (en) 2012-02-10 2015-11-10 Amazon Technologies, Inc. Behavior based processing of content
US9037975B1 (en) 2012-02-10 2015-05-19 Amazon Technologies, Inc. Zooming interaction tracking and popularity determination
US9137210B1 (en) 2012-02-21 2015-09-15 Amazon Technologies, Inc. Remote browsing session management
US10296558B1 (en) 2012-02-27 2019-05-21 Amazon Technologies, Inc. Remote generation of composite content pages
US9374244B1 (en) 2012-02-27 2016-06-21 Amazon Technologies, Inc. Remote browsing session management
US9208316B1 (en) 2012-02-27 2015-12-08 Amazon Technologies, Inc. Selective disabling of content portions
US9460220B1 (en) 2012-03-26 2016-10-04 Amazon Technologies, Inc. Content selection based on target device characteristics
US9307004B1 (en) 2012-03-28 2016-04-05 Amazon Technologies, Inc. Prioritized content transmission
US20130282707A1 (en) * 2012-04-24 2013-10-24 Discovery Engine Corporation Two-step combiner for search result scores
US9772979B1 (en) 2012-08-08 2017-09-26 Amazon Technologies, Inc. Reproducing user browsing sessions
US8943197B1 (en) 2012-08-16 2015-01-27 Amazon Technologies, Inc. Automated content update notification
US9348677B2 (en) 2012-10-22 2016-05-24 Palantir Technologies Inc. System and method for batch evaluation programs
US9501507B1 (en) 2012-12-27 2016-11-22 Palantir Technologies Inc. Geo-temporal indexing and searching
US9123086B1 (en) 2013-01-31 2015-09-01 Palantir Technologies, Inc. Automatically generating event objects from images
US9934283B2 (en) * 2013-03-08 2018-04-03 Google Llc Social annotations for enhanced search results
US10037314B2 (en) 2013-03-14 2018-07-31 Palantir Technologies, Inc. Mobile reports
US8937619B2 (en) 2013-03-15 2015-01-20 Palantir Technologies Inc. Generating an object time series from data objects
US9965937B2 (en) 2013-03-15 2018-05-08 Palantir Technologies Inc. External malware data item clustering and analysis
US8818892B1 (en) 2013-03-15 2014-08-26 Palantir Technologies, Inc. Prioritizing data clusters with customizable scoring strategies
US8868486B2 (en) 2013-03-15 2014-10-21 Palantir Technologies Inc. Time-sensitive cube
US8909656B2 (en) 2013-03-15 2014-12-09 Palantir Technologies Inc. Filter chains with associated multipath views for exploring large data sets
US8917274B2 (en) 2013-03-15 2014-12-23 Palantir Technologies Inc. Event matrix based on integrated data
US10275778B1 (en) 2013-03-15 2019-04-30 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation based on automatic malfeasance clustering of related data in various data structures
US8799799B1 (en) * 2013-05-07 2014-08-05 Palantir Technologies Inc. Interactive geospatial map
US9578137B1 (en) 2013-06-13 2017-02-21 Amazon Technologies, Inc. System for enhancing script execution performance
US10152463B1 (en) 2013-06-13 2018-12-11 Amazon Technologies, Inc. System for profiling page browsing interactions
US9223773B2 (en) 2013-08-08 2015-12-29 Palatir Technologies Inc. Template system for custom document generation
US9335897B2 (en) 2013-08-08 2016-05-10 Palantir Technologies Inc. Long click display of a context menu
US8713467B1 (en) 2013-08-09 2014-04-29 Palantir Technologies, Inc. Context-sensitive views
CN104424278B (zh) * 2013-08-29 2019-02-26 腾讯科技(深圳)有限公司 一种获取热点资讯的方法及装置
US10521807B2 (en) 2013-09-05 2019-12-31 TSG Technologies, LLC Methods and systems for determining a risk of an emotional response of an audience
US9785317B2 (en) 2013-09-24 2017-10-10 Palantir Technologies Inc. Presentation and analysis of user interaction data
US8938686B1 (en) 2013-10-03 2015-01-20 Palantir Technologies Inc. Systems and methods for analyzing performance of an entity
US8812960B1 (en) 2013-10-07 2014-08-19 Palantir Technologies Inc. Cohort-based presentation of user interaction data
US9116975B2 (en) 2013-10-18 2015-08-25 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive simultaneous querying of multiple data stores
US8924872B1 (en) 2013-10-18 2014-12-30 Palantir Technologies Inc. Overview user interface of emergency call data of a law enforcement agency
CN103593410B (zh) * 2013-10-22 2017-04-12 上海交通大学 通过替换概念性词语进行搜索推荐的系统
US9021384B1 (en) 2013-11-04 2015-04-28 Palantir Technologies Inc. Interactive vehicle information map
US8868537B1 (en) 2013-11-11 2014-10-21 Palantir Technologies, Inc. Simple web search
US9105000B1 (en) 2013-12-10 2015-08-11 Palantir Technologies Inc. Aggregating data from a plurality of data sources
US9727622B2 (en) 2013-12-16 2017-08-08 Palantir Technologies, Inc. Methods and systems for analyzing entity performance
US9552615B2 (en) 2013-12-20 2017-01-24 Palantir Technologies Inc. Automated database analysis to detect malfeasance
US10356032B2 (en) 2013-12-26 2019-07-16 Palantir Technologies Inc. System and method for detecting confidential information emails
US8832832B1 (en) 2014-01-03 2014-09-09 Palantir Technologies Inc. IP reputation
US9043696B1 (en) 2014-01-03 2015-05-26 Palantir Technologies Inc. Systems and methods for visual definition of data associations
US9009827B1 (en) 2014-02-20 2015-04-14 Palantir Technologies Inc. Security sharing system
US9483162B2 (en) 2014-02-20 2016-11-01 Palantir Technologies Inc. Relationship visualizations
US9727376B1 (en) 2014-03-04 2017-08-08 Palantir Technologies, Inc. Mobile tasks
US8924429B1 (en) 2014-03-18 2014-12-30 Palantir Technologies Inc. Determining and extracting changed data from a data source
US9857958B2 (en) 2014-04-28 2018-01-02 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive access of, investigation of, and analysis of data objects stored in one or more databases
US9009171B1 (en) 2014-05-02 2015-04-14 Palantir Technologies Inc. Systems and methods for active column filtering
WO2015187126A1 (en) * 2014-06-02 2015-12-10 Hewlett-Packard Development Company, L.P. Identifying relevant topics for recommending a resource
US9635041B1 (en) 2014-06-16 2017-04-25 Amazon Technologies, Inc. Distributed split browser content inspection and analysis
US9619557B2 (en) 2014-06-30 2017-04-11 Palantir Technologies, Inc. Systems and methods for key phrase characterization of documents
US9129219B1 (en) 2014-06-30 2015-09-08 Palantir Technologies, Inc. Crime risk forecasting
US9535974B1 (en) 2014-06-30 2017-01-03 Palantir Technologies Inc. Systems and methods for identifying key phrase clusters within documents
US10572496B1 (en) 2014-07-03 2020-02-25 Palantir Technologies Inc. Distributed workflow system and database with access controls for city resiliency
US9021260B1 (en) 2014-07-03 2015-04-28 Palantir Technologies Inc. Malware data item analysis
US9256664B2 (en) 2014-07-03 2016-02-09 Palantir Technologies Inc. System and method for news events detection and visualization
US9785773B2 (en) 2014-07-03 2017-10-10 Palantir Technologies Inc. Malware data item analysis
US9202249B1 (en) 2014-07-03 2015-12-01 Palantir Technologies Inc. Data item clustering and analysis
US9454281B2 (en) 2014-09-03 2016-09-27 Palantir Technologies Inc. System for providing dynamic linked panels in user interface
US9767172B2 (en) 2014-10-03 2017-09-19 Palantir Technologies Inc. Data aggregation and analysis system
US9501851B2 (en) 2014-10-03 2016-11-22 Palantir Technologies Inc. Time-series analysis system
US9785328B2 (en) 2014-10-06 2017-10-10 Palantir Technologies Inc. Presentation of multivariate data on a graphical user interface of a computing system
US9984133B2 (en) 2014-10-16 2018-05-29 Palantir Technologies Inc. Schematic and database linking system
US9229952B1 (en) 2014-11-05 2016-01-05 Palantir Technologies, Inc. History preserving data pipeline system and method
US9043894B1 (en) 2014-11-06 2015-05-26 Palantir Technologies Inc. Malicious software detection in a computing system
US9741342B2 (en) * 2014-11-26 2017-08-22 Panasonic Intellectual Property Corporation Of America Method and apparatus for recognizing speech by lip reading
US10362133B1 (en) 2014-12-22 2019-07-23 Palantir Technologies Inc. Communication data processing architecture
US9348920B1 (en) 2014-12-22 2016-05-24 Palantir Technologies Inc. Concept indexing among database of documents using machine learning techniques
US10552994B2 (en) 2014-12-22 2020-02-04 Palantir Technologies Inc. Systems and interactive user interfaces for dynamic retrieval, analysis, and triage of data items
US9367872B1 (en) 2014-12-22 2016-06-14 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures
US9817563B1 (en) 2014-12-29 2017-11-14 Palantir Technologies Inc. System and method of generating data points from one or more data stores of data items for chart creation and manipulation
US9870205B1 (en) 2014-12-29 2018-01-16 Palantir Technologies Inc. Storing logical units of program code generated using a dynamic programming notebook user interface
US9335911B1 (en) 2014-12-29 2016-05-10 Palantir Technologies Inc. Interactive user interface for dynamic data analysis exploration and query processing
US10372879B2 (en) 2014-12-31 2019-08-06 Palantir Technologies Inc. Medical claims lead summary report generation
US10387834B2 (en) 2015-01-21 2019-08-20 Palantir Technologies Inc. Systems and methods for accessing and storing snapshots of a remote application in a document
US10475043B2 (en) 2015-01-28 2019-11-12 Intuit Inc. Method and system for pro-active detection and correction of low quality questions in a question and answer based customer support system
US9727560B2 (en) 2015-02-25 2017-08-08 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
EP3070622A1 (en) 2015-03-16 2016-09-21 Palantir Technologies, Inc. Interactive user interfaces for location-based data analysis
US9886467B2 (en) 2015-03-19 2018-02-06 Plantir Technologies Inc. System and method for comparing and visualizing data entities and data entity series
IN2015CH01424A (ja) 2015-03-20 2015-04-10 Wipro Ltd
US10083213B1 (en) 2015-04-27 2018-09-25 Intuit Inc. Method and system for routing a question based on analysis of the question content and predicted user satisfaction with answer content before the answer content is generated
US10755294B1 (en) 2015-04-28 2020-08-25 Intuit Inc. Method and system for increasing use of mobile devices to provide answer content in a question and answer based customer support system
US10134050B1 (en) 2015-04-29 2018-11-20 Intuit Inc. Method and system for facilitating the production of answer content from a mobile device for a question and answer based customer support system
US9460175B1 (en) 2015-06-03 2016-10-04 Palantir Technologies Inc. Server implemented geographic information system with graphical interface
US10447777B1 (en) 2015-06-30 2019-10-15 Intuit Inc. Method and system for providing a dynamically updated expertise and context based peer-to-peer customer support system within a software application
US10147037B1 (en) 2015-07-28 2018-12-04 Intuit Inc. Method and system for determining a level of popularity of submission content, prior to publicizing the submission content with a question and answer support system
US10475044B1 (en) 2015-07-29 2019-11-12 Intuit Inc. Method and system for question prioritization based on analysis of the question content and predicted asker engagement before answer content is generated
US9454785B1 (en) 2015-07-30 2016-09-27 Palantir Technologies Inc. Systems and user interfaces for holistic, data-driven investigation of bad actor behavior based on clustering and scoring of related data
US10268956B2 (en) 2015-07-31 2019-04-23 Intuit Inc. Method and system for applying probabilistic topic models to content in a tax environment to improve user satisfaction with a question and answer customer support system
US9996595B2 (en) 2015-08-03 2018-06-12 Palantir Technologies, Inc. Providing full data provenance visualization for versioned datasets
US9456000B1 (en) 2015-08-06 2016-09-27 Palantir Technologies Inc. Systems, methods, user interfaces, and computer-readable media for investigating potential malicious communications
US10489391B1 (en) 2015-08-17 2019-11-26 Palantir Technologies Inc. Systems and methods for grouping and enriching data items accessed from one or more databases for presentation in a user interface
US9600146B2 (en) 2015-08-17 2017-03-21 Palantir Technologies Inc. Interactive geospatial map
US10102369B2 (en) 2015-08-19 2018-10-16 Palantir Technologies Inc. Checkout system executable code monitoring, and user account compromise determination system
US10853378B1 (en) 2015-08-25 2020-12-01 Palantir Technologies Inc. Electronic note management via a connected entity graph
US11150917B2 (en) 2015-08-26 2021-10-19 Palantir Technologies Inc. System for data aggregation and analysis of data from a plurality of data sources
US9485265B1 (en) 2015-08-28 2016-11-01 Palantir Technologies Inc. Malicious activity detection system capable of efficiently processing data accessed from databases and generating alerts for display in interactive user interfaces
US10706434B1 (en) 2015-09-01 2020-07-07 Palantir Technologies Inc. Methods and systems for determining location information
US9639580B1 (en) 2015-09-04 2017-05-02 Palantir Technologies, Inc. Computer-implemented systems and methods for data management and visualization
US9576015B1 (en) 2015-09-09 2017-02-21 Palantir Technologies, Inc. Domain-specific language for dataset transformations
US10296617B1 (en) 2015-10-05 2019-05-21 Palantir Technologies Inc. Searches of highly structured data
US10394804B1 (en) 2015-10-08 2019-08-27 Intuit Inc. Method and system for increasing internet traffic to a question and answer customer support system
US10242093B2 (en) 2015-10-29 2019-03-26 Intuit Inc. Method and system for performing a probabilistic topic analysis of search queries for a customer support system
US10263908B1 (en) 2015-12-09 2019-04-16 A9.Com, Inc. Performance management for query processing
US9542446B1 (en) 2015-12-17 2017-01-10 Palantir Technologies, Inc. Automatic generation of composite datasets based on hierarchical fields
US10109094B2 (en) 2015-12-21 2018-10-23 Palantir Technologies Inc. Interface to index and display geospatial data
US9823818B1 (en) 2015-12-29 2017-11-21 Palantir Technologies Inc. Systems and interactive user interfaces for automatic generation of temporal representation of data objects
US10089289B2 (en) 2015-12-29 2018-10-02 Palantir Technologies Inc. Real-time document annotation
US11086640B2 (en) * 2015-12-30 2021-08-10 Palantir Technologies Inc. Composite graphical interface with shareable data-objects
US9612723B1 (en) * 2015-12-30 2017-04-04 Palantir Technologies Inc. Composite graphical interface with shareable data-objects
US10698938B2 (en) 2016-03-18 2020-06-30 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
US10599699B1 (en) 2016-04-08 2020-03-24 Intuit, Inc. Processing unstructured voice of customer feedback for improving content rankings in customer support systems
US10068199B1 (en) 2016-05-13 2018-09-04 Palantir Technologies Inc. System to catalogue tracking data
CN105930539A (zh) * 2016-06-27 2016-09-07 北京百度网讯科技有限公司 话题订阅方法和装置
US10162734B1 (en) 2016-07-20 2018-12-25 Intuit Inc. Method and system for crowdsourcing software quality testing and error detection in a tax return preparation system
US10719188B2 (en) 2016-07-21 2020-07-21 Palantir Technologies Inc. Cached database and synchronization system for providing dynamic linked panels in user interface
US10324609B2 (en) 2016-07-21 2019-06-18 Palantir Technologies Inc. System for providing dynamic linked panels in user interface
US10460398B1 (en) 2016-07-27 2019-10-29 Intuit Inc. Method and system for crowdsourcing the detection of usability issues in a tax return preparation system
US10467541B2 (en) 2016-07-27 2019-11-05 Intuit Inc. Method and system for improving content searching in a question and answer customer support system by using a crowd-machine learning hybrid predictive model
US9686357B1 (en) 2016-08-02 2017-06-20 Palantir Technologies Inc. Mapping content delivery
US10437840B1 (en) 2016-08-19 2019-10-08 Palantir Technologies Inc. Focused probabilistic entity resolution from multiple data sources
US10445332B2 (en) 2016-09-28 2019-10-15 Intuit Inc. Method and system for providing domain-specific incremental search results with a customer self-service system for a financial management system
US10572954B2 (en) 2016-10-14 2020-02-25 Intuit Inc. Method and system for searching for and navigating to user content and other user experience pages in a financial management system with a customer self-service system for the financial management system
US10733677B2 (en) 2016-10-18 2020-08-04 Intuit Inc. Method and system for providing domain-specific and dynamic type ahead suggestions for search query terms with a customer self-service system for a tax return preparation system
US10318630B1 (en) 2016-11-21 2019-06-11 Palantir Technologies Inc. Analysis of large bodies of textual data
US10552843B1 (en) 2016-12-05 2020-02-04 Intuit Inc. Method and system for improving search results by recency boosting customer support content for a customer self-help system associated with one or more financial management systems
US10515433B1 (en) 2016-12-13 2019-12-24 Palantir Technologies Inc. Zoom-adaptive data granularity to achieve a flexible high-performance interface for a geospatial mapping system
US10270727B2 (en) 2016-12-20 2019-04-23 Palantir Technologies, Inc. Short message communication within a mobile graphical map
US10460602B1 (en) 2016-12-28 2019-10-29 Palantir Technologies Inc. Interactive vehicle information mapping system
US10748157B1 (en) 2017-01-12 2020-08-18 Intuit Inc. Method and system for determining levels of search sophistication for users of a customer self-help system to personalize a content search user experience provided to the users and to increase a likelihood of user satisfaction with the search experience
US11573989B2 (en) 2017-02-24 2023-02-07 Microsoft Technology Licensing, Llc Corpus specific generative query completion assistant
US10579239B1 (en) 2017-03-23 2020-03-03 Palantir Technologies Inc. Systems and methods for production and display of dynamically linked slide presentations
US10895946B2 (en) 2017-05-30 2021-01-19 Palantir Technologies Inc. Systems and methods for using tiled data
US11334216B2 (en) 2017-05-30 2022-05-17 Palantir Technologies Inc. Systems and methods for visually presenting geospatial information
US10956406B2 (en) 2017-06-12 2021-03-23 Palantir Technologies Inc. Propagated deletion of database records and derived data
US10922367B2 (en) 2017-07-14 2021-02-16 Intuit Inc. Method and system for providing real time search preview personalization in data management systems
US10403011B1 (en) 2017-07-18 2019-09-03 Palantir Technologies Inc. Passing system with an interactive user interface
US11093951B1 (en) 2017-09-25 2021-08-17 Intuit Inc. System and method for responding to search queries using customer self-help systems associated with a plurality of data management systems
US10726095B1 (en) 2017-09-26 2020-07-28 Amazon Technologies, Inc. Network content layout using an intermediary system
US10664538B1 (en) 2017-09-26 2020-05-26 Amazon Technologies, Inc. Data security and data access auditing for network accessible content
US10371537B1 (en) 2017-11-29 2019-08-06 Palantir Technologies Inc. Systems and methods for flexible route planning
US11599706B1 (en) 2017-12-06 2023-03-07 Palantir Technologies Inc. Systems and methods for providing a view of geospatial information
US10698756B1 (en) 2017-12-15 2020-06-30 Palantir Technologies Inc. Linking related events for various devices and services in computer log files on a centralized server
US11436642B1 (en) 2018-01-29 2022-09-06 Intuit Inc. Method and system for generating real-time personalized advertisements in data management self-help systems
US11599369B1 (en) 2018-03-08 2023-03-07 Palantir Technologies Inc. Graphical user interface configuration system
US11269665B1 (en) 2018-03-28 2022-03-08 Intuit Inc. Method and system for user experience personalization in data management systems using machine learning
US10896234B2 (en) 2018-03-29 2021-01-19 Palantir Technologies Inc. Interactive geographical map
US10830599B2 (en) 2018-04-03 2020-11-10 Palantir Technologies Inc. Systems and methods for alternative projections of geographical information
US11585672B1 (en) 2018-04-11 2023-02-21 Palantir Technologies Inc. Three-dimensional representations of routes
US10754822B1 (en) 2018-04-18 2020-08-25 Palantir Technologies Inc. Systems and methods for ontology migration
US10885021B1 (en) 2018-05-02 2021-01-05 Palantir Technologies Inc. Interactive interpreter and graphical user interface
US10429197B1 (en) 2018-05-29 2019-10-01 Palantir Technologies Inc. Terrain analysis for automatic route determination
US11119630B1 (en) 2018-06-19 2021-09-14 Palantir Technologies Inc. Artificial intelligence assisted evaluations and user interface for same
US10467435B1 (en) 2018-10-24 2019-11-05 Palantir Technologies Inc. Approaches for managing restrictions for middleware applications
US11025672B2 (en) 2018-10-25 2021-06-01 Palantir Technologies Inc. Approaches for securing middleware data access
US20200134096A1 (en) * 2018-10-30 2020-04-30 Longsand Limited Search results based on models derived from documents
US11151167B2 (en) * 2019-05-10 2021-10-19 Georgetown University Cache optimization via topics in web search engines
US10503792B1 (en) 2019-05-10 2019-12-10 Georgetown University Cache optimization via topics in web search engines
CN110598050A (zh) * 2019-09-23 2019-12-20 东北大学 一种面向半结构化数据流的实时主题分类方法
US11526551B2 (en) * 2020-04-10 2022-12-13 Salesforce, Inc. Search query generation based on audio processing
US20230053495A1 (en) * 2021-08-17 2023-02-23 Verizon Media Inc. Comparable item identification for query items

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172691A (ja) * 1998-12-03 2000-06-23 Mitsubishi Electric Corp 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005149033A (ja) * 2003-11-13 2005-06-09 Nippon Telegr & Teleph Corp <Ntt> コンテンツ検索方法、コンテンツ更新方法、コンテンツ更新の反映方法、コンテンツ検索装置、コンテンツ更新装置、コンテンツ検索のプログラム及びコンテンツ更新のプログラム並びにそれらの記録媒体
JP2006309515A (ja) * 2005-04-28 2006-11-09 Dainippon Printing Co Ltd 情報配信方法および情報配信サーバ

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5369763A (en) * 1989-02-01 1994-11-29 Kansas State University Research Foundation Data storage and retrieval system with improved data base structure
US5257939A (en) * 1992-10-13 1993-11-02 Robinson Don T Cultural knowledge board game
US5724567A (en) * 1994-04-25 1998-03-03 Apple Computer, Inc. System for directing relevance-ranked data objects to computer users
JP2809341B2 (ja) * 1994-11-18 1998-10-08 松下電器産業株式会社 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。
US5671342A (en) * 1994-11-30 1997-09-23 Intel Corporation Method and apparatus for displaying information relating to a story and a story indicator in a computer system
US5530852A (en) * 1994-12-20 1996-06-25 Sun Microsystems, Inc. Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics
US5680511A (en) * 1995-06-07 1997-10-21 Dragon Systems, Inc. Systems and methods for word recognition
US5907836A (en) * 1995-07-31 1999-05-25 Kabushiki Kaisha Toshiba Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore
US6021403A (en) * 1996-07-19 2000-02-01 Microsoft Corporation Intelligent user assistance facility
US5907677A (en) * 1996-08-23 1999-05-25 Ecall Inc. Method for establishing anonymous communication links
EP0848347A1 (en) * 1996-12-11 1998-06-17 Sony Corporation Method of extracting features characterising objects
US6285987B1 (en) * 1997-01-22 2001-09-04 Engage, Inc. Internet advertising system
US6233575B1 (en) * 1997-06-24 2001-05-15 International Business Machines Corporation Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values
US6292830B1 (en) * 1997-08-08 2001-09-18 Iterations Llc System for optimizing interaction among agents acting on multiple levels
US6052657A (en) * 1997-09-09 2000-04-18 Dragon Systems, Inc. Text segmentation and identification of topic using language models
US6598045B2 (en) * 1998-04-07 2003-07-22 Intel Corporation System and method for piecemeal relevance evaluation
US7275061B1 (en) * 2000-04-13 2007-09-25 Indraweb.Com, Inc. Systems and methods for employing an orthogonal corpus for document indexing
US6269361B1 (en) * 1999-05-28 2001-07-31 Goto.Com System and method for influencing a position on a search result list generated by a computer network search engine
US6981040B1 (en) * 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US6397211B1 (en) * 2000-01-03 2002-05-28 International Business Machines Corporation System and method for identifying useless documents
JP3562572B2 (ja) * 2000-05-02 2004-09-08 インターナショナル・ビジネス・マシーンズ・コーポレーション データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡
US7062485B1 (en) * 2000-09-01 2006-06-13 Huaichuan Hubert Jin Method and apparatus for score normalization for information retrieval applications
US7185065B1 (en) * 2000-10-11 2007-02-27 Buzzmetrics Ltd System and method for scoring electronic messages
US7200606B2 (en) * 2000-11-07 2007-04-03 The Regents Of The University Of California Method and system for selecting documents by measuring document quality
US6772120B1 (en) * 2000-11-21 2004-08-03 Hewlett-Packard Development Company, L.P. Computer method and apparatus for segmenting text streams
US7685224B2 (en) * 2001-01-11 2010-03-23 Truelocal Inc. Method for providing an attribute bounded network of computers
US20020161838A1 (en) * 2001-04-27 2002-10-31 Pickover Cilfford A. Method and apparatus for targeting information
US7092888B1 (en) * 2001-10-26 2006-08-15 Verizon Corporate Services Group Inc. Unsupervised training in natural language call routing
US7716161B2 (en) * 2002-09-24 2010-05-11 Google, Inc, Methods and apparatus for serving relevant advertisements
US7752072B2 (en) * 2002-07-16 2010-07-06 Google Inc. Method and system for providing advertising through content specific nodes over the internet
US20050226511A1 (en) * 2002-08-26 2005-10-13 Short Gordon K Apparatus and method for organizing and presenting content
US7320000B2 (en) * 2002-12-04 2008-01-15 International Business Machines Corporation Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy
US7467202B2 (en) * 2003-09-10 2008-12-16 Fidelis Security Systems High-performance network content analysis platform
GB0322600D0 (en) * 2003-09-26 2003-10-29 Univ Ulster Thematic retrieval in heterogeneous data repositories
JP2005158010A (ja) * 2003-10-31 2005-06-16 Hewlett-Packard Development Co Lp 分類評価装置・方法及びプログラム
WO2005050621A2 (en) * 2003-11-21 2005-06-02 Philips Intellectual Property & Standards Gmbh Topic specific models for text formatting and speech recognition
US20070260564A1 (en) * 2003-11-21 2007-11-08 Koninklike Philips Electronics N.V. Text Segmentation and Topic Annotation for Document Structuring
US20070244690A1 (en) * 2003-11-21 2007-10-18 Koninklijke Philips Electronic, N.V. Clustering of Text for Structuring of Text Documents and Training of Language Models
WO2005050474A2 (en) * 2003-11-21 2005-06-02 Philips Intellectual Property & Standards Gmbh Text segmentation and label assignment with user interaction by means of topic specific language models and topic-specific label statistics
US7293019B2 (en) 2004-03-02 2007-11-06 Microsoft Corporation Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics
US7426557B2 (en) * 2004-05-14 2008-09-16 International Business Machines Corporation System, method, and service for inducing a pattern of communication among various parties
US7281022B2 (en) * 2004-05-15 2007-10-09 International Business Machines Corporation System, method, and service for segmenting a topic into chatter and subtopics
JP2005352878A (ja) * 2004-06-11 2005-12-22 Hitachi Ltd 文書検索システム、検索サーバ、及び検索クライアント
US7567959B2 (en) * 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
US7496567B1 (en) * 2004-10-01 2009-02-24 Terril John Steichen System and method for document categorization
US20060167930A1 (en) * 2004-10-08 2006-07-27 George Witwer Self-organized concept search and data storage method
US7548917B2 (en) * 2005-05-06 2009-06-16 Nelson Information Systems, Inc. Database and index organization for enhanced document retrieval
US20070050356A1 (en) * 2005-08-23 2007-03-01 Amadio William J Query construction for semantic topic indexes derived by non-negative matrix factorization
EP1941346A4 (en) * 2005-09-21 2010-10-27 Praxeon Inc DOCUMENT PROCESSING
US9069847B2 (en) 2005-10-21 2015-06-30 Battelle Memorial Institute Data visualization methods, data visualization devices, data visualization apparatuses, and articles of manufacture
US20070156622A1 (en) * 2006-01-05 2007-07-05 Akkiraju Rama K Method and system to compose software applications by combining planning with semantic reasoning
JP2009528639A (ja) * 2006-02-28 2009-08-06 バズロジック, インコーポレイテッド ソーシャルメディアにおける会話を分析するためのソーシャル分析システムおよび方法
US7890485B2 (en) * 2006-04-13 2011-02-15 Tony Malandain Knowledge management tool
US7809723B2 (en) * 2006-06-26 2010-10-05 Microsoft Corporation Distributed hierarchical text classification framework
US10460327B2 (en) * 2006-07-28 2019-10-29 Palo Alto Research Center Incorporated Systems and methods for persistent context-aware guides
US20080126319A1 (en) * 2006-08-25 2008-05-29 Ohad Lisral Bukai Automated short free-text scoring method and system
US20080065600A1 (en) * 2006-09-12 2008-03-13 Harold Batteram Method and apparatus for providing search results from content on a computer network
US7921092B2 (en) * 2006-12-04 2011-04-05 Yahoo! Inc. Topic-focused search result summaries
WO2008120030A1 (en) * 2007-04-02 2008-10-09 Sobha Renaissance Information Latent metonymical analysis and indexing [lmai]
JP5343861B2 (ja) * 2007-12-27 2013-11-13 日本電気株式会社 テキスト分割装置とテキスト分割方法およびプログラム
US20100042589A1 (en) * 2008-08-15 2010-02-18 Smyros Athena A Systems and methods for topical searching
US20100057577A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing
US8549016B2 (en) * 2008-11-14 2013-10-01 Palo Alto Research Center Incorporated System and method for providing robust topic identification in social indexes
US8452781B2 (en) * 2009-01-27 2013-05-28 Palo Alto Research Center Incorporated System and method for using banded topic relevance and time for article prioritization

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172691A (ja) * 1998-12-03 2000-06-23 Mitsubishi Electric Corp 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005149033A (ja) * 2003-11-13 2005-06-09 Nippon Telegr & Teleph Corp <Ntt> コンテンツ検索方法、コンテンツ更新方法、コンテンツ更新の反映方法、コンテンツ検索装置、コンテンツ更新装置、コンテンツ検索のプログラム及びコンテンツ更新のプログラム並びにそれらの記録媒体
JP2006309515A (ja) * 2005-04-28 2006-11-09 Dainippon Printing Co Ltd 情報配信方法および情報配信サーバ

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200600477006; 酒井 浩之 他: '交通事故事例に含まれる事故原因表現の新聞記事からの抽出' 自然言語処理 第13巻 第2号, 20060410, pp.99-123, 言語処理学会 *
JPN6013021362; 酒井 浩之 他: '交通事故事例に含まれる事故原因表現の新聞記事からの抽出' 自然言語処理 第13巻 第2号, 20060410, pp.99-123, 言語処理学会 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016532173A (ja) * 2013-09-29 2016-10-13 ペキン ユニバーシティ ファウンダー グループ カンパニー,リミティド 意味情報、キーワード拡張及びそれに関するキーワード検索の方法及びシステム
US10268758B2 (en) 2013-09-29 2019-04-23 Peking University Founder Group Co. Ltd. Method and system of acquiring semantic information, keyword expansion and keyword search thereof
JP2020074144A (ja) * 2017-06-01 2020-05-14 株式会社インタラクティブソリューションズ 検索用資料情報記憶装置
JP2020119590A (ja) * 2017-06-01 2020-08-06 株式会社インタラクティブソリューションズ 検索用資料情報記憶装置
JP2020067830A (ja) * 2018-10-24 2020-04-30 Solize株式会社 テキスト表示方法及び、テキスト表示装置
JP7403216B2 (ja) 2018-10-24 2023-12-22 Solize株式会社 テキスト表示方法及び、テキスト表示装置
KR20210146834A (ko) * 2020-05-27 2021-12-06 정치훈 토픽 키워드를 이용한 문서 검색을 위한 사용자 인터페이스 제공 장치 및 방법
KR102532863B1 (ko) 2020-05-27 2023-05-17 정치훈 토픽 키워드를 이용한 문서 검색을 위한 사용자 인터페이스 제공 장치 및 방법

Also Published As

Publication number Publication date
US8010545B2 (en) 2011-08-30
EP2159715B1 (en) 2018-10-10
EP2159715A3 (en) 2010-04-21
EP2159715A2 (en) 2010-03-03
US20100057716A1 (en) 2010-03-04

Similar Documents

Publication Publication Date Title
JP2010055618A (ja) トピックを基にした検索を提供する方法及びシステム
US9659084B1 (en) System, methods, and user interface for presenting information from unstructured data
US8135739B2 (en) Online relevance engine
JP5421737B2 (ja) コンピュータ実施方法
JP4944406B2 (ja) フレーズに基づく文書説明の生成方法
US7610279B2 (en) Filtering context-sensitive search results
US9183281B2 (en) Context-based document unit recommendation for sensemaking tasks
US7603345B2 (en) Detecting spam documents in a phrase based information retrieval system
US10387469B1 (en) System and methods for discovering, presenting, and accessing information in a collection of text contents
US20090070322A1 (en) Browsing knowledge on the basis of semantic relations
US20020073079A1 (en) Method and apparatus for searching a database and providing relevance feedback
US20080140644A1 (en) Matching and recommending relevant videos and media to individual search engine results
US20110270830A1 (en) System And Method For Providing Multi-Core And Multi-Level Topical Organization In Social Indexes
JP2011154668A (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
US7693898B2 (en) Information registry
Roy et al. Discovering and understanding word level user intent in web search queries
Kerremans et al. Using data-mining to identify and study patterns in lexical innovation on the web: The NeoCrawler
Nazemi et al. Comparison of full-text articles and abstracts for visual trend analytics through natural language processing
WO2009035871A1 (en) Browsing knowledge on the basis of semantic relations
Ayyasamy et al. Mining Wikipedia knowledge to improve document indexing and classification
Anjewierden et al. Shared conceptualisations in weblogs
JP5068304B2 (ja) 抽出装置、方法及びプログラム
KR20120014466A (ko) 용어 가중화 색인 기반의 블로그 권위 랭킹 방법
Bollegala et al. Automatic annotation of ambiguous personal names on the web
Bernardes et al. Exploring NPL: Generating Automatic Control Keywords

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120821

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130507

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130807

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140120