JP2009503751A - 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム - Google Patents

関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム Download PDF

Info

Publication number
JP2009503751A
JP2009503751A JP2008525226A JP2008525226A JP2009503751A JP 2009503751 A JP2009503751 A JP 2009503751A JP 2008525226 A JP2008525226 A JP 2008525226A JP 2008525226 A JP2008525226 A JP 2008525226A JP 2009503751 A JP2009503751 A JP 2009503751A
Authority
JP
Japan
Prior art keywords
tag
relevance
objects
term
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008525226A
Other languages
English (en)
Other versions
JP5431727B2 (ja
JP2009503751A5 (ja
Inventor
ルー、ユンシャン
タン、マイケル
Original Assignee
ウィンク テクノロジ−ズ インコ−ポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ウィンク テクノロジ−ズ インコ−ポレイテッド filed Critical ウィンク テクノロジ−ズ インコ−ポレイテッド
Publication of JP2009503751A publication Critical patent/JP2009503751A/ja
Publication of JP2009503751A5 publication Critical patent/JP2009503751A5/ja
Application granted granted Critical
Publication of JP5431727B2 publication Critical patent/JP5431727B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

検索クエリに対する複数のオブジェクトの関連性を判定する関連性判定方法は、複数のオブジェクトに複数のタグを関連付けるステップと、複数のオブジェクトをブックマークするステップとのうちの一方又は両方と、複数のオブジェクトのそれぞれと検索クエリとの関連性を判定するステップとを有する。一実施の形態では、フルテキスト関連性アルゴリズムをタグ関連性アルゴリズムに結合する。他の実施の形態は、例えば、統計的分類又はランク回帰アルゴリズム等の統計的な関連性アルゴリズムを用いる。ユーザが検索クエリを実行した場合、オブジェクトを含む結果リストが返され、オブジェクトは、例えば、関連性スコアが高い順に組織化され、又は関連性の指標が示される。タグ−オブジェクト対の関連性スコアは、好ましくは、タグ内のタームがオブジェクトに関連付けられた回数、オブジェクトに関連付けられたタグの数、タグが複数のオブジェクトに関連付けられた回数、タグにタームを含むタグ−オブジェクト対の数、オブジェクトへの参照を含むタグ−オブジェクト対の数又はこれらの任意の組合せに基づいて判定される。

Description

関連出願
本出願は、米国特許法第119条(e)項に基づき、引用によって本願に援用される、2005年8月3日に出願された継続中の米国仮特許出願番号第60/705,704号、発明の名称「タグの解析を用いて関連するドキュメントを発見するための技術(Techniques for Finding Relevant Documents Using Analysis of Tags)」の優先権を主張する。
本発明は、ドキュメントの検索に関する。詳しくは、本発明は、インターネットで情報を検索する際、複数のユーザが作成したタグを解析することによって、品質又は検索結果の関連性を向上させる検索システム及び関連性判定方法に関する。
インターネット検索エンジンは、インターネット内に存在する膨大な量の情報から、望ましい情報を発見するように設計されている。ユーザは、検索タームを含むクエリを入力することによって、自らが望む情報を記述する。検索エンジンは、ユーザが探している情報に関連する可能性が高いウェブページを特定するために、様々な関連性演算を用いて、検索タームをウェブページのインデックスと照合する。そして、検索エンジンは、最も関連性が高いと考えられたページへのリンクをリストの上位にして、ウェブページへのハイパーリンクの格付けされたリストを返す。
検索エンジンの目的は、所定のクエリに対して、最も関連性が高いウェブページを提供することである。検索エンジンは、様々な技術を用いて、例えば、各ページ内に含まれている情報、例えば、ドキュメント内でのタームの存在、密度、近接性等を考慮し、ウェブページ間のハイパーリンクに関連する情報を考慮し、又はユーザの振る舞い、例えば、クリック、閲覧、若しくは結果又はウェブページの格付け等を考慮して、ウェブページの関連性を判定する。これらの技術は、個別に用いてもよく、最良の結果を得るために様々に組合せて用いてもよい。
インターネット上のウェブページの数は膨大であり、且つ日々増加しており、ユーザのクエリを表面的に満たす多数のウェブページが存在する場合も多く、どのウェブページが最も関連性が高いかを判定する処理は、非常に難しい。更に、殆どのユーザは、適切な形式のクエリを作成し、入力する技術に通じておらず、したがって、ユーザが彼らが如何なる種類の情報を検索しているかが曖昧である場合も多い。したがって、クエリ内の単語と、ドキュメント内の単語とを比較して、クエリに最も関連性が高いドキュメントを判定する手法の精度には、限界がある。
ユーザがインターネットを閲覧又は検索する場合、ユーザは、オブジェクトへの参照を記録することによって、例えば、ウェブページ、画像、トピック、ウェブログ(「ブログ」とも呼ばれている。)又は他のオブジェクトを含む様々なオブジェクトを「ブックマーク」に追加する(本明細書では、ブックマークに記録又は追加することを「ブックマークする」ともいう)。これらのブックマークは、ユーザがオブジェクトに関連付けた1つ以上のタームを含む1つ以上の「タグ」、オブジェクトへのハイパーリンク(ユニフォームリソースロケータ又は「URL」)、関係を記録するためのメカニズム及び潜在的に他の情報を含むことができる。これらのブックマークは、ユーザがオブジェクトに再度アクセスする際の補助になり、タグは、ブックマークされたオブジェクトが何に関するものであるかをユーザに思い出させ、及び他者に通知するための補助になる。例えば、ユーザが屋根用のソーラーパネルについて説明するウェブページを発見した場合、ユーザは、このウェブページをブックマークし、ターム「太陽エネルギ」を用いて、このページに、タグを関連付けることがある。また、ユーザは、州の太陽エネルギ導入助成制度に関する別のウェブページにも、ターム「太陽エネルギ」を用いた同じタグを関連付けることがある。この結果、ターム「太陽エネルギ」を含むタグは、両方のウェブページに関連付けられる。
ユーザがタグを入力する手法は複数あり、例えば、サーバアプリケーション、ブックマークツールバーのスモールアプレット、ブラウザプラグイン又は拡張、クライアントアプリケーション又は他のアプリケーションを用いてタグを入力することができる。一旦、タグが入力されると、通常、ユーザは、これらのタグを検索して、タグに関連するウェブページを表示させることができる。現在、ユーザが、自らのタグを検索し、又は他のユーザのタグを検索することができるサービスが提供されている。
ブックマークは、ユーザが、例えば、ウェブページ等のオブジェクトに一定の評価を与えたことを示すある種の指標となり、更に、タグは、ユーザがオブジェクトに1つ以上のタームを関連付けたことを示すある種の指標となる。この情報は、ウェブページに対する実際の人間の興味の指標であり、特定のサブジェクトと関連付けられているため、検索エンジンから、クエリの結果として、そのウェブページを表示するべきであるか否かを判定する際に潜在的に有益である。
そこで、本発明の目的は、どのウェブページ、画像、ブログ又は他のオブジェクトがユーザのクエリに関連しているかを判定する際、様々なウェブページ、画像、ブログ又は他のオブジェクトに関連付けられたタグを考慮することができる検索エンジンを提供することである。
本発明の実施の形態では、検索クエリに応じて、オブジェクトのリスト(結果リスト)をユーザに提供する。結果リストは、クエリに対する各オブジェクトの関連性に基づいて組織化される。関連性は、好ましくは、オブジェクトへのタグ付け、オブジェクトへのブックマーク、及び/又はクエリに対するオブジェクトの関連性を示す他の何らかのユーザアクションに基づいて判定される。
本発明の第1の側面である関連性判定方法は、クエリに対する複数のオブジェクトの関連性を判定する関連性判定方法において、オブジェクトへの参照情報である「ブックマーク」を記録するステップ及び/又はこれらのオブジェクトに複数のタグを関連付けるステップと、複数のオブジェクトのそれぞれと検索クエリとの関連性を判定するステップとを有する。この関連性判定方法は、後に、検索クエリに応じて返される結果リスト内でオブジェクトを組織化して表示するために使用される。オブジェクトには、ウェブページへのハイパーリンク又はハイパーリンクのグループ、テキスト、画像、写真、タグ、タグのグループ、サブジェクト領域、概念、プロファイル、回答、オーディオファイル、ビデオファイル、ソフトウェア又はこれらの任意の組合せ等が含まれる。
複数のタグ内の各タグは、1つ以上のタームを含む。関連性判定方法は、更に、1つ以上のタームの各タームをオブジェクトに関連付け、1つ以上の対応するターム−オブジェクト対を定義するステップと、各ターム−オブジェクト対について、タームとオブジェクト間の関連性の度合いを示すタームスコアを判定するステップとを有していてもよい。これに代えて又はこれに加えて、関連性判定方法は、オブジェクトをブックマークするステップを更に有していてもよい。
タグ−オブジェクト対の関連性スコアは、好ましくは、タグ内の各タームのターム−オブジェクト対のタームスコアを結合することによって判定される。タームスコアの結合とは、例えば、タームスコアの総和を求める演算であってもよく、各タームスコアに重みを付け、重み付きタームスコアの総和を求める演算であってもよい。
一実施の形態においては、タグ−オブジェクト対の関連性スコアは、タグ内のタームがオブジェクトに関連付けられた回数、オブジェクトに関連付けられたタグの数、タグが複数のオブジェクトに関連付けられた回数、又はこれらの任意の組合せに基づいて判定される。タグ−オブジェクト対の関連性スコアは、タグにタームを含むタグ−オブジェクト対の数、オブジェクトへの参照を含むタグ−オブジェクト対の数又はこれらの両方に基づいて判定してもよい。
他の実施の形態においては、関連性判定方法は、第1のユーザによって、複数のオブジェクトの1つのオブジェクトにタグを関連付けるステップと、第2のユーザによって、タグ内の1つ以上のタームを含む検索クエリを実行するステップと、関連性スコアに基づく結果リスト内に複数のオブジェクトを組織化して、組織化結果リストを定義するステップと、組織化結果リストを、第2のユーザに返すステップとを更に有する。オブジェクトと検索クエリの関連性スコアは、オブジェクト内に存在する又はオブジェクトに関連付けられた検索クエリの各タームの関連性スコアに対応する。これに変えて又はこれに加えて、複数のタグ−オブジェクト対のうちの1つのタグ−オブジェクト対の関連性スコアは、第1のユーザが複数のオブジェクトの何れかに関連付けたタグの数、第1及び第2のユーザがタグに関連付けたオブジェクトの数、オブジェクトの格付け、オブジェクトへのブックマーク、又はこれらの任意の組合せから判定してもよい。
他の実施の形態においては、タグ−オブジェクト対の関連性スコアは、第1のユーザ及び第2のユーザのうちの選択された一方又は両方の信頼度のレベルから判定してもよい。信頼度のレベルは、選択されたユーザがオブジェクトに関連付けたタグの格付け、第1及び第2のユーザのブックマーク、タグ又は検索行動間の類似度メトリック、第1及び第2のユーザ間の関係メトリック、又はこれらの任意の組合せから判定してもよい。
複数のオブジェクトは、関連性スコアに基づいて並べ替えを行う(例えば、関連性が高いオブジェクトをリストの上位にする)ことによって、又は複数のオブジェクトの少なくとも1つをグラフィック要素でマーキングすることによって組織化してもよい。
タグ、ブックマーク又は格付けは、ユーザに表示された領域にタグを入力し、タグを格付けし、オブジェクトへのリンクをブロックし(「否定的な」関連付け)、タグを選択し、又はオブジェクトを選択し、ブックマークを調査し、又はタグを用いてオブジェクトの検索を実行することにによって、オブジェクトに関連付けてもよい。一実施の形態においては、タグクローラが、複数のタグのうちの少なくとも1つのタグを複数のオブジェクトのうちの少なくとも1つのオブジェクトに関連付ける。
本発明の第2の側面である情報収集方法は、結果リスト内に組織化されたオブジェクトを返すために用いられるシステムの情報を収集する情報収集方法において、複数のオブジェクトに関連付けられた複数のタグをタグデータベースに保存するステップと、複数のタグと複数のオブジェクト間の関連性スコアをインデックスデータベースに保存するステップとを有する。関連性スコアは、組織化結果リストにおいて、複数のドキュメントを組織化するために使用される。
複数のタグは、複数のタグを構成するタームをタグデータベースに保存することによって保存される。関連性スコアは、タームとオブジェクト間の関連性を示す。情報収集方法は、更に、複数のインデックスをインデックスデータベースに保存するステップを有していてもよい。このインデックスにおいて、各インデックスエントリは、複数のタームのうちの1つのターム、複数のオブジェクトに対応するオブジェクト、及びタームとオブジェクト間の対応する関連性スコアに対応する。
一実施の形態において、タームとオブジェクト間の対応する関連性スコアは、それぞれ、オブジェクトにタームを関連付けたユーザの信頼度に関連する。これに代えて又はこれに加えて、タームとオブジェクト間の各関連性スコアは、オブジェクトがブックマークされた回数又はオブジェクトに与えられた格付けの数及び値から判定してもよい。これに代えて又はこれに加えて、タームとオブジェクト間の関連性スコアは、統計的分類又はランク回帰アルゴリズム、例えば、ロジスティック回帰、サポートベクトルマシン、分類又は回帰木、及びブーステッドツリーアンサンブル(boosted tree ensemble)に基づいて判定してもよい。
情報収集方法は、タームを含む検索クエリに応じてユーザに結果リストを表示するステップと、ユーザによって、結果リストに含まれているオブジェクトにタームを関連付けるステップと、タームと上記オブジェクト間の関連性スコアを判定するステップとを更に有していてもよい。複数のオブジェクトのうちの1つのオブジェクトと、オブジェクトに関連付けられたタグ間の関連性スコアは、タグがオブジェクトに関連付けられた回数、オブジェクトに関連付けられたタグの総数、タグが複数のオブジェクトの何れかに関連付けられた回数、複数のオブジェクトの全てに関連付けられたタグの数、タグがオブジェクトに関連付けられた日時、オブジェクトがブックマークされた回数、オブジェクトに適用された格付けの値及び数、又はこれらの任意の組合せの1つ以上から判定してもよい。
本発明の第3の側面であるオブジェクト組織化方法は、結果リストに表示される複数のオブジェクトを組織化するオブジェクト組織化方法において、検索クエリ内のタームと複数のオブジェクトに関連付けられたタグとの相関を調べるステップと、相関に基づいて組織化された複数のオブジェクトを含む結果リストを返すステップとを有する。
本発明の第4の側面である検索システムは、検索クエリに応じて検索結果リストを返す検索システムにおいて、オブジェクトに関連付けられたタグを保存するタグデータベースと、タグデータベースに接続されたタグ解析器とを備える。オブジェクトには、ウェブページへのハイパーリンク又はハイパーリンクのグループ、テキスト、画像、写真、タグ、タグのグループ、サブジェクト領域、概念、プロファイル、回答、オーディオファイル、ビデオファイル、ソフトウェア又はこれらの任意の組合せ等が含まれる。オブジェクトは、好ましくは、ウェブページへのハイパーリンクである。
タグ解析器は、検索クエリに対する複数のオブジェクトの関連性スコアを判定するようにプログラムされている。一実施の形態においては、検索システムは、タグとオブジェクト間の関連性スコアを保存するオブジェクトインデックスを更に備える。
一実施の形態においては、関連性スコアは、タグを構成するタームとオブジェクトの重み付き関連性スコアを合計することによって判定される。他の実施の形態においては、タームを含む検索クエリとオブジェクト間の関連性スコアは、検索クエリ内のタームを含むタグの数、検索クエリに含まれるタグがタグデータベースに含まれている回数、オブジェクトに関連付けられたタグの数、タグと検索クエリ内で一致したタームの数、又はこれらの任意の組合せから判定してもよい。更に他の実施の形態においては、タグとオブジェクト間の関連性スコアは、オブジェクト内におけるタグの位置、オブジェクト内におけるタグの出現頻度、オブジェクト内におけるタグの密度又はこれらの任意の組合せから判定してもよい。
一実施の形態においては、タグとオブジェクト間の関連性スコアの重み付けは、オブジェクトにタグを関連付けたユーザに割り当てられた信頼度のレベル(信頼度格付け)に基づいて判定してもよい。関連性スコアは、統計的分類又はランク回帰アルゴリズム、クラスタ化解析アルゴリズム又は形態素解析アルゴリズムを用いて判定してもよい。統計的分類又はランク回帰アルゴリズムは、ロジスティック回帰、サポートベクトルマシン、分類又は回帰木、及びブーステッドツリーアンサンブルの何れかであってもよい。
他の実施の形態においては、検索システムは、オブジェクトインデックスに接続された検索エンジンを備える。検索エンジンは、タグに対応するタームを含む検索クエリを受信し、タグ−オブジェクト対の関連性スコアに基づいて、組織化結果リストを返すようにプログラムされている。また、検索システムは、検索エンジンに接続されたユーザデータベースを備えていてもよい。ユーザデータベースは、例えば、ユーザが選択したリンク、オブジェクトに関連付けられたタグ、ユーザによってブロックされたオブジェクト、又はこれらの任意の組合せを含む検索クエリに関連する情報を格納する。
本発明の実施の形態は、従来の検索エンジンとは異なり、インターネット検索を行うユーザに対し、タグ及び/又はブックマークを利用して、より関連性が高い情報を提供する。一実施の形態においては、検索エンジンは、クエリを受信し、関連するドキュメント又はドキュメントのグループのリストを判定し、ドキュメント又はドキュメントのグループに関連しているタグを解析して、関連するドキュメント又はドキュメントのグループのリストを判定し、何らかの手法で2つのリストを結合し、ユーザに結果リストを提供する確立された手法を実現する。なお、以下の具体例では、ドキュメントを検索し、結果を返す技術を開示するが、本発明は、如何なるオブジェクトを検索し、結果を返すためにも用いることができ、これらのオブジェクトとしては、以下に限定されるわけではないが、幾つかの例を挙げれば、ウェブページへのハイパーリンク又はハイパーリンクのグループ、テキスト、画像、写真、タグ、タグのグループ、サブジェクト領域、概念、プロファイル、回答、オーディオファイル、ビデオファイル、ソフトウェア又はこれらの任意の組合せ等が含まれる。
例えば、本発明では、タームXを含むクエリに対し、リストのどこかにウェブページMを含むウェブページの結果リストが返される。そして、第1のユーザが、タームXを含むタグをウェブページMに関連付ける。後に、第2のユーザが、クエリ内にタームXを用いて検索を実行した場合、第1のユーザがタグを作成する前の順位より上位にウェブページMを表示した結果リストが返される。本発明の実施の形態では、第2のユーザに示されるウェブページMの関連性の高さは、何らかの要素を解析することによって判定される。これらの要素には、以下に限定されるわけではないが、ウェブページMのためのタグにタームXが使用された回数、ウェブページMに関連付けられた全てのタグの総数、第1のユーザが作成したタグの数、各ユーザがブックマークし、又はタグ付けしたドキュメントの数、タグ全体としてタームXが使用されている頻度、全体的なタグの総数、タームXを含むタグ/ドキュメント対の数、ウェブページMへの参照、第1のユーザ及び第2のユーザ間の関係、第1及び第2のユーザ、第1のユーザ又は第2のユーザの何れかが属するグループに設定された信頼度のレベル(例えば、信頼度格付け)、及びこれらの任意の組合せが含まれる。ユーザ及びユーザが属するグループ間の関係性又は類似度、並びにユーザに帰属する信頼度のレベルは、メトリックを用いて全て定量化できる。例えば、2人のユーザ間の関係性メトリックが1である場合、これらの2人のユーザは、関係性メトリックが0.5の他の2人のユーザに比べて、類似している(例えば、同様の興味を有し、又は共通の友人を有している。)と言える。更に、タームX内に2つ以上の単語がある場合、例えば、第2のユーザによるクエリに含まれているタームXの語数、単語がフレーズとして用いられているか否か、語順、及び上述した全ての要素を含む他の要素を解析してもよく、また、この解析には、単語の異なる組合せの解析も含まれる。
本発明の他の実施の形態においては、検索エンジンは、順序を変更した結果リストを提供するのではなく、何らかのグラフィック要素によって、関連するタグを有すドキュメントを指示してもよい。
本発明の他の実施の形態では、タグは、ユーザが意図的にドキュメントに関連付けるのではなく、ユーザがブックマークを調べ、検索を実行し、又は他の行動、例えば、格付け、ブロック、保存又はクリックを実行することによって、ドキュメントに自動的に関連付けてもよい。
本発明の他の実施の形態では、タグは、単にウェブページ又はウェブページのグループのみではなく、公的又は個人的な、特定可能な如何なるデータリソースに関連付けてもよく、これらのデータリソースには、以下に限定されるわけではないが、画像、写真、他のタグ、タグのグループ、サブジェクト領域、ユーザプロファイル、概念、地図、オーディオ又はビデオファイル、ソフトウェア又は他のオブジェクトが含まれる。
以下の説明では、「検索エンジン」という用語は、クエリが入力され、電子文書又はウェブページ又はウェブを介してアクセスできるオブジェクトへのハイパーリンクの結果リストを返す装置(又は汎用コンピュータで実行されるプログラム)を意味する。検索エンジンは、コーパス内のドキュメントのインデックス、各ドキュメントの関連性を決定するコード及びアルゴリズム、及び結果リストをユーザに提供するグラフィカルユーザインタフェースを含む。
また、以下の説明において、「クエリ」という用語は、タイピングされ、発話され、既に一組の検索タームを埋め込んだ「リンク」を介して提供され、又は他の何らかのインタフェースによって、検索エンジンに提供される一組のタームを意味する。クエリは、単一の単語、複数の単語又は語句の何れであってもよい。クエリは、質問を表す語句(例えば、「自然言語」によるクエリ)、スペースで区切られたタームの組、又は構造化された論理式の何れであってもよい。実際には、クエリは、検索文字を含み又は検索文字に関連する電子文書又はウェブページを検索するために、検索エンジンで用いられるシンボル又は他の如何なる文字を含んでいてもよい。
以下の説明では、「ウェブサイト」という用語は、互いにリンクされ、ワールドワイドウェブで閲覧可能なウェブページの集合を意味する。また、「ウェブページ」という用語は、任意の数のホストからワールドワイドウェブを介してアクセス可能な情報を意味し、これらの情報は、以下に限定されるわけではないが、テキスト、ビデオ、画像、音楽及びグラフィクスを含む。
以下の説明において、「結果リスト」という用語は、ハイパーテキストトランスファープロトコル(Hypertext Transfer Protocol:HTTP)又は各リンクの他の関連する情報と共にウェブページ又は他の電子文書にアクセスするための他の何らかのプロトコルを用いてアクセスできるドキュメント、オブジェクト(上述したように、以下に限定されるものではないが、画像及び映像等)又はウェブページを参照するハイパーリンクのリスト又はハイパーリンクのグループを意味する。他の関連する情報には、例えば、ドキュメントのタイトル、ドキュメントの要約、関連付けられたタグの数又は他の関連性メトリック、関連付けられたタグのリスト、ドキュメントのキャッシングされたコピーへのリンク、ドキュメントが最後にインデックスを付され又は最後に更新された日時、ドキュメントに関連し、又はドキュメントに含まれる画像、ドキュメントから抽出された情報、ドキュメントをブックマークし又はタグ付けしたユーザ等が含まれる。
以下の説明において、「タグ」という用語は、1つ以上のターム、1つ以上の単語、アドレス指定可能なオブジェクトを参照するハイパーリンク、及び例えば、タグが生成された日時、タグを生成したユーザ等の他の情報の何れかを含む何らかのデータ構造を意味する。タグは、例えば、ウェブページ、画像、地図又はコンピュータネットワーク上の他のオブジェクトを含む様々なオブジェクトへのリンクを含んでいてもく、これらのオブジェクトは、インターネット上に存在していてもよく、ローカルコンピュータストレージ装置上に存在していてもよい。また、タグ付けには、アドレス指定可能なドキュメント又はオブジェクトへの特定のハイパーリンクにあるタームを関連付ける処理が含まれる。
本明細書において、「ブックマーク」という用語は、ハイパーリンク、ブックマークを生成したユーザの識別情報、ブックマークが生成された日時、上で定義したタグのうちの何れかを記録する何らかのデータ構造を意味する。
また、本明細書において、「ドキュメント」という用語は、広義に定義され、通常の意味に加えて、コンピュータファイル及びウェブページも包含する。「ドキュメント」という用語は、テキストを含むコンピュータファイルに限定されず、グラフィクス、オーディオ、ビデオ及び他のマルチメディアデータを含むコンピュータファイルも包含する。ユーザプロファイルは、例えば、ユーザに関する情報を含むページ又は記録であり、ユーザに関する情報としては、例えば、ユーザの興味、趣味、友人のリスト、写真、職務経験、学歴等がある。
本明細書において、「スパマ(spammer)」という用語は、検索エンジンが関連性を判定する手法を利用した様々な技術を用いて、検索エンジンに対し、検索エンジンが通常表示するよりも、より上位に又はより高い頻度で、自らの商品、ウェブページ又は他のマテリアルへのリンクを表示させようとする個人又はエンティティを意味する。
本明細書において、「プログラムされた」という表現は、コンピュータ命令を実行し、データを保存し、処理し、送信し、又は他の操作を行うために用いられるハードウェア、ソフトウェア、ファームウェア及び他の要素の如何なる組合せも含まれる。
後に詳細に説明するように、検索エンジンは、ユーザが入力したクエリを受信し、ユーザが探している情報に関連する可能性が高いウェブページを特定するために、様々な関連性演算を用いて、検索タームをドキュメントのインデックスと照合する。そして、検索エンジンは、最も関連性が高いと考えられたドキュメントへのリンクをリストの上位にして、ドキュメントへのハイパーリンクの格付けされたリストを返す。本発明では、ユーザは、ドキュメントにタームを関連付けるタグを作成することができ、検索エンジンは、ウェブページに関連するタグの解析に少なくとも部分的に基づいて、結果リストを返す。
本発明では、所定のクエリに対して、タグがドキュメントの関連性に影響を及ぼす度合いは、関連付けを行ったユーザの信頼度のレベルに応じて決定される。この信頼度のレベルは、例えば、ユーザのタグの過去の関連性、ユーザの行動と、他の一般のユーザ又はクエリを実行するユーザとの類似性、ユーザ間の関係の強さ、及び他の要素を含む要素によって決定してもよい。
図1は、本発明に基づくクエリに応じて返された結果ページ100を表示する例示的なグラフィカルユーザインタフェース(graphical user interface:GUI)の画面を示している。結果リストは、各リンクに関連付けられたタグの解析に基づいて、順位を変更し又はマークを付すことができる。
結果ページ100は、クエリタームが挿入されるボックス110、検索エンジンによって返された結果リストを含む領域120とを備える。また、領域120は、検索エンジンによって返された各結果に関連付けられたタグ150のリストを含んでいてもよい。後に詳細に説明するように、好ましい実施の形態では、領域120内の結果130の幾つか又は全ては、タグ150の解析に基づいて順位を変更してもよく、他の実施の形態では、領域120の結果の順位を変更し、又は変更せず、一部の結果にグラフィック要素140によってマークを付し、タグ及び/又はブックマーク150の解析が関連性に影響を及ぼしたことを指示してもよい。また、結果ページ100は、オブジェクトを格付け(rating)するためのメカニズム162を有している。
ユーザは、ドキュメントと、ドキュメントを説明すると考えるタームとを関連付けることができる。この処理は、上述したように、「ブックマーク」又は「タグ付け」とも呼ばれる。この処理は、ブックマークの場合、領域120内のハイパーリンク又はグラフィック要素160をクリックし、後にアクセスするためにハイパーリンクを記録するためのメカニズムをアクティブ化し、タグ付けの場合、拡張、ツールバー又はブックマークツールバー内のアプレットを用いて、新たな1つ以上のタグをドキュメントに関連付けることによって行われる。このグラフィック要素160は、テキストリンクであってもよく、例えば、ディスク又はドキュメントを「ブックマーク」し又はドキュメントに「タグ」を付すことを示唆する他の何らかの画像であってもよい。様々なドキュメントに如何なるタームを関連付けるかに関して、ユーザはそれぞれ異なる思想を有するので、豊富で変化に富んだタグの集合が生成される。本発明では、このタグの集合を解析する。
ドキュメントがクエリに関連していないとユーザが考えた場合、ユーザは、このドキュメントへのリンクを結果リストからブロックすることができる。この処理を「ブロッキング」と呼ぶ。ブロッキングは、領域120内のハイパーリンク又はグラフィック要素170をクリックし、ドキュメントへのリンクをブロックするためのメカニズムをアクティブ化することによって実行される。この要素170は、テキストリンクであってもよく、ドキュメントを「ブロッキング」又は「除外」することを示唆する他の何らかの画像(例えば、図1の170)であってもよい。ドキュメントをブロッキングすることによって、クエリ内のタームを含むドキュメントに否定的なタグが関連付けられる。様々なドキュメントに如何なるタームを関連付けるかに関して、ユーザはそれぞれ異なる思想を有するので、あるタグがドキュメントに適切であるか否かに関して、ユーザの意見が一致しない場合もある。また、スパマが、不適切なタグをドキュメントに意図的に関連付ける場合もある。後に詳細に説明するように、肯定的なタグ及び否定的なタグを用いて、意見の相違を相殺し、スパムの可能性を低減し、又は他の紛らわしいドキュメントが結果に表示される可能性を低減することができる。
また、結果ページ100は、クエリタームに関連する概念の説明を表示する領域180と、他のクエリタームにリンクする「ここも参照(see also)」リンクを含む領域190を有していてもよい。
図1の具体例に示すように、ユーザがボックス110内にクエリターム「U2」を入力し、検索を要求すると、結果ページ100がユーザに返される。領域120は、クエリターム「U2」に関連するオブジェクトへのリンクである結果のリストを含む。好ましい実施の形態では、ユーザが様々なドキュメントに関連付けたタグ150の解析に基づいて、幾つかの結果130の順位が変更される。例えば、www.atu2.comに存在する「U2ホームページ:@U2(U2 Home Page: @U2...)」のタイトルが付されたドキュメントには、タグ150のリストに示すように、ターム「U2」、「U2ファンサイト(U2 fan site)」及び「U2ファン(U2 fans)」のタグが付されている。タグの解析によって、このドキュメントは、結果リストにおいて、通常より上位に表示される。他の実施の形態においては、結果の順位を変更し及び/又はマークを付すことに代えて、又はこれらに加えて、幾つかの結果にグラフィック要素140によってマークを付し、ユーザタグ及び/又はブックマークの解析によって、複数のユーザがこれらの結果について関連性が高いと判断したこと、及びオプションとして、この判断を行ったユーザの数を示してもよい。例えば、www.u2station.comに存在する「U2ステーション(U2 Station)」のタイトルが付されたドキュメントには、ターム「U2」及び「U2ファンサイト(U2 fansite)」のタグが付されており、及び他のユーザが関連性が高いと判断したことを示す人物のグラフィック要素140によるマークが付されている。なお、関連性が他のユーザによって支持されていることをユーザに示すために、人物のアイコン以外のグラフィック要素を用いてもよい。
ユーザがドキュメント、例えば、www.u21og.comをブックマークし及び/又はタグを付すことを望んだ場合、ユーザは、グラフィック要素(アイコン)160をクリックして選択し、ブックマーク及び/又はタグの付加のためのメカニズムをアクティブ化でき、このタグは、既に存在しているタグと同じであってもよく、ボックス110の検索タームであってもよく、ユーザにとって意味のある他のタームであってもよい。ユーザが例えば、「歌詞(lyrics)」について異なる検索を実行し、ユーザは、「U2Wanderer.orgU2ディスコグラフィー及びU2歌詞サイト(U2 Wanderer.org the U2 Discography and U2 Lyrics Site)」のタイトルが付されたドキュメントが、クエリ「歌詞(lyrics)」に対してリストに含まれることが適切ではないと判定した場合、ユーザは、グラフィック要素170をクリックし、検索結果からドキュメントをブロックすることができる。この操作により、ターム「−歌詞(-lyrics)」を含むタグがドキュメントに関連付けられる。マイナス符号(「−」)は、タームとウェブページ間の関連性に対する否定的な判定を示す。
更にこの具体例において、領域180は、バンド「U2」を記述する概念と、ターム「U2」に関連した他の概念のリストとを含む。領域190は、関連するサブジェクト、例えば、「ボノ(Bono)、U2コンサート(U2 concerts)、最も売れているアーチスト(best selling music artists)、ONEキャンペーン(the ONE campaign)、ライブ8(Live 8))」への一組の「ここも参照」リンクを含む。本発明においては、ユーザがこれらのリンクの1つ、例えば、「ライブ8(Live 8)」を選択した場合、検索ターム「ライブ8(Live 8)」を用いて、クエリが実行され、結果ページ100と同様の結果ページが生成され、この結果ページでは、ボックス110内の検索タームが「ライブ8(Live 8)」であり、結果リストを含む領域120は、この検索タームに関連付けられたドキュメントへのリンクのリストであり、このリスト内のドキュメントの順位は、ドキュメントに関連付けられたタグに影響される。このように、如何なる検索においても、結果の順位は、タグ付けの影響を受ける。サブジェクト領域及び概念については、引用により本願に援用される、2006年2月27日に出願された米国特許出願番号第11/364,617号、発明の名称「ユーザ入力情報を組み込んだ検索のための方法及びシステム(Methods of and Systems for Searching by Incorporating User-Entered Information)」に詳細に開示されている。
なお、この技術は、本発明に基づいて、様々に変更できる。例えば、ユーザが生成したタグは、ユーザが端末装置に直接入力するのではなく、ファイルから読み込んでもよく、他のサービスからインポートしてもよい。更に、結果ページ100には、結果リストを含む領域120、タグ150のリスト、概念の説明を表示する領域180、概念へのリンクを含む領域190を示しているが、本発明に基づき、タグの解析により影響を受ける結果ページは、図1に示す領域に加えて又はこれらに代えて、如何なる領域の組合せを表示してもよいことは明らかである。タグ情報は、様々なページ設計要素と組み合わせて、検索結果をよりわかりやすく、正確で、有意義にするために使用される。
図2は、本発明に基づくインターネット検索アプリケーション200の動作を示すフローチャートである。インターネット検索アプリケーション200によって、ユーザは、検索エンジンにクエリを送信し、少なくとも部分的に、タグを解析することによって判定された結果を受信することができ、これにより、ユーザに、従来の技術に比べて、関連性がより高い検索結果を提供することができる。ユーザは、結果リストに示されたウェブページに訪問することができ、更に、ページの関連性が高い又は低いと判断したことを指示するために、幾つかのページを「ブックマーク」することができる。また、ユーザは、クエリタームによって、又は他の1つ以上のタームによって、これらのページにタグを付すことができる。検索エンジンは、送信されたタグを記録し、他のユーザによる将来の検索にこれらのタグを利用することができる。
ステップ210において、ユーザは、検索エンジンにクエリを送信する。そして、処理は、ステップ220及びステップ230の両方に進み、ステップ220では、検索エンジンは、最も関連性が高いドキュメントのリストを構築するために、様々なアルゴリズムを用いる様々な情報検索法を用いて、クエリと、コーパス内のオブジェクトとを照合し、ステップ230では、検索エンジンは、最も関連性が高いドキュメントのリストを構築するために、様々なドキュメントに関連付けられたタグを解析する。タグの解析は、全てのユーザに対して包括的に行ってもよく、検索を実行する個々のユーザ毎に専用に行ってもよく、又はユーザが属するグループに適合する形式で行ってもよい。処理は、ステップ220及びステップ230からステップ240に進み、ここで、より関連性が高い結果を得るために、ステップ230からの結果と、ステップ220からの結果とを結合する。そして、ステップ250において、結果ページ(例えば、図1の結果ページ100)をユーザに送信する。ユーザは、ステップ250からステップ260及びステップ270の何れに進むかを選択できる。
ステップ260において、ユーザは、1つ以上のリンクに従い、結果リスト内のドキュメントを閲覧する。これに代えて、ステップ270において、ユーザは、ドキュメントをブックマークし、及びオプションとしてタグを入力する。各タグは、結果リスト内のドキュメントの1つに、1つ以上のタームを関連付ける。タグを入力するために、ユーザは、ドキュメントにブックマーク又はタグを付すためのメカニズム(例えば、図1のグラフィック要素160)をクリックし、ユーザは、この操作によって現れるユーザインタフェースにタグを入力し、又はステップ260において、ユーザは、ブラウザにロードした「ブックマークレット(bookmarklet)」又は他の同様のメカニズムを用いて、ドキュメントをブックマークし及びタグを入力する。これに代えて、ユーザは、ステップ270において、ドキュメントがクエリに関係ないと判断し、ブロッキングのためのメカニズム(例えば、図1のグラフィック要素170)をクリックすることによって、ドキュメントをブロックすることができる。ユーザは、ステップ260において、結果リスト内のドキュメントを閲覧した後、ステップ270に進んで、タグを入力してもよく、逆に、ステップ270からステップ260に進んでもよい。ステップ260及びステップ270の両方には、ステップ280が続き、ここで、システムは、ユーザが入力したブックマーク、タグ及びレーティングを記録する。処理は、ステップ280からステップ230に戻り、後続する検索の間に解析されるタグのデータベースには、ステップ270において入力された新たなタグが含まれる。ステップ280からは、ステップ230ではなくステップ290に進むこともでき、この場合、ユーザは、検索を終了する。
図3は、本発明に基づくシステム300の構成要素を示している。システム300は、ウェブサーバ310に接続されたユーザクライアント305を備える。ウェブサーバ310は、検索エンジン320、ユーザデータベース330及びタグデータベース340に接続されている。検索エンジン320は、ドキュメントインデックス350に接続されている。検索エンジン320には、また、ユーザデータベース330も接続されている。タグデータベース340は、タグ解析器360及びタグクローラ391に接続されている。また、タグ解析器360は、ドキュメントインデックス350にも接続されており、ドキュメントインデックス350は、インデックス生成器370に接続されている。インデックス生成器370は、ウェブコンテンツデータベース380に接続されており、ウェブコンテンツデータベース380は、ウェブクローラ390に接続されている。ウェブクローラ390及びタグクローラ391は、インターネット395を介して、1つ以上のウェブサイト399に接続されている。
実際の動作では、ウェブクローラ390は、インターネット395をナビゲートし、ウェブサイト399に訪れ、アクセスしたウェブページのコンテンツをウェブコンテンツデータベース380に収集する。インデックス生成器370は、ウェブコンテンツデータベース380を用いてドキュメントインデックス350を作成する。タグクローラ391は、インターネット395をナビゲートし、ウェブサイト399に訪れ、発見したタグをタグデータベース340に収集する。
ユーザが検索を行う場合、ユーザは、ユーザクライアント305を用いてクエリを入力し、このクエリは、ウェブサーバ310に送信される。ウェブサーバ310は、検索エンジン320にクエリを送信し、検索エンジン320は、関連性アルゴリズム及び上述したタグ解析に基づく因子を用いて、ドキュメントインデックス350とを照合し、最も関連性が高いドキュメントを判定し、ウェブサーバ310に結果リストを返す。そして、ウェブサーバ310は、結果ページ(例えば、図1の結果ページ100)をユーザクライアント305に送信し、ユーザクライアント305は、これを表示する。
また、ユーザデータベース330は、クエリに応じて、例えば、結果リスト(例えば、図1の領域120)から訪問されたリンク先、ブックマーク又は格付け(例えば、メカニズム162)されたドキュメント、タグ入力メカニズム(例えば、図1のグラフィック要素160)を用いて入力されたタグ、否定的なタグの入力の効果を有するブロッキングメカニズム(例えば、図1のグラフィック要素170)を用いてブロックされたドキュメント等、ユーザの検索に関する情報を記録する。この情報は、ウェブサーバ310及び検索エンジン320によってそのユーザのための後の検索結果をカスタマイズし、そのユーザのタグの信頼度を判定するために使用される。また、クエリに応じて、ユーザがタグ入力メカニズム(例えば、図1のグラフィック要素160)を用いて入力したタグ、及びブロッキングメカニズム(例えば、図1のグラフィック要素170)を用いて入力した否定的なタグも、タグデータベース340に記録される。本発明の実施の形態では、ユーザデータベース330及びタグデータベース340に保存された情報は、2つの独立したデータベースとして存在してもよく、同じデータベース内に存在してもよい。
必ずしもこのタイミングでなくてもよいが、クエリが実行される都度、タグデータベース340に含まれたタグ情報は、タグ解析器360に送信され、タグ解析器360は、タグ情報を解析し、各ユーザによって各ドキュメントに関連付けられた様々なタグが関連性にどのような影響を及ぼすかを判定し、これに基づき、検索エンジン320は、クエリに対して最も関連性が高いウェブページを判定する。タグ解析器360は、後の検索で使用するために、このタグ関連性情報をドキュメントインデックス350に記録する。
タグデータベース340は、以下に限定されるわけではないが、クエリターム、ユーザ識別子、ドキュメントID、ドキュメントリンク、タグターム、レーティング、タイムスタンプ等の情報をタグ解析器360に送信する。また、タグ解析器360は、所定のドキュメントについて、以下に限定されるわけではないが、ドキュメント内でのタームの密度、ドキュメント内でのタームの位置、ドキュメントの様々なセクションにおけるタームの存在、タームを含むドキュメントへのハイパーリンク等の他の情報を調べることができる。また、タグ解析器360は、所定のユーザについて、以下に限定されるわけではないが、以前のタグ履歴、ブックマーク履歴、信頼度のレベル、他のユーザとの類似点(例えば、このユーザと他のユーザ間の、使用された検索ターム及び作成されたタグの類似点)、グループのメンバシップ等、他の情報を調べることができる。
タグ解析器360は、これらの特徴を用いて、異なるタグに基づき、様々なドキュメントについて、一組の関連性スコアを算出する。これらの特徴を解析する処理については、図4を用いて後に説明する。ここでは、ユーザレベルにおける関連性を算出するために又は与えられた任意のクエリ−ドキュメント対のための包括的なソリューションのためにあるメカニズムが適用される。
解析は、以前に参照されたタグデータについて実行される。包括的に言えば、あるクエリに対するあるドキュメントの関連性は、様々な因子の関数であり、これらの因子としては、以下に限定されるわけではないが、クエリ内のタームを含むタグの数、タグのコーパスにおいて、あるタグが使用されている回数、あるドキュメントを参照するタグの総数、類似するタグ−ドキュメント対の数、一致するタームの語数、ドキュメントがブックマークされた回数、ドキュメントに適用されたレーティングの値及び数等がある。更に、あるドキュメントに対する関連性のタグの予測能力は、アクセス可能であれば、タグを入力したユーザに設定された信頼度のレベルに比例する。なお、本発明に基づく関連性モデリング処理は、他の形式の解析及び他の手法を用いて実行してもよく、以下に限定されるわけではないが、何らかの統計的分類又はランク回帰アルゴリズム、例えば、ロジスティック回帰、サポートベクトルマシン、分類又は回帰木、及びブーステッドツリーアンサンブル(boosted tree ensemble)等を用いてもよい。
図4は、クエリに対するドキュメントの関連性を判定する準備のために、タグデータを準備し、解析する、本発明の一実施の形態に基づく処理を示すフローチャート400である。
図4に示すように、タグデータは、ステップ410において、ユーザがウェブクライアント及びウェブサーバ(例えば、図3のユーザクライアント305、ウェブサーバ310)を介して、又はタグクローラ(例えば、図3のタグクローラ391)によって入力され、システムによってタグデータベース(例えば、図3のタグデータベース340)に送信される(例えば、図2のステップ280)。ステップ410は、図4に示す他のステップから独立して、任意の期間、連続的に実行することができる。
ステップ420では、タグデータベース(図3のタグデータベース340)の各タグを解析する。各タグを解析する処理からは、ユーザの信頼度を算出するステップ430及び重み付きタグカウントを判定するステップ440に進む。ステップ430では、入力された各タグについて、タグを入力したユーザの信頼度のレベルを算出する。タグが参照するドキュメントの関連性にタグが影響を及ぼす度合いは、そのタグを入力したユーザの信頼度のレベルの関数である。
信頼度のレベルは、アルゴリズムによって、又はユーザ行動の統計的モデルを用いて算出でき、これらの統計的モデルには、以下に限定されるわけではないが、ブックマーク、タグ付け、クリック、格付け又はブロック、所定のターム又はサブジェクト領域についてユーザの振る舞いがユーザコミュニティの振る舞いにどれくらい密接に一致しているか、他のユーザによるユーザの評価によってそのユーザに設定された信頼度、ソーシャルネットワークにおけるそのユーザの交友関係、ユーザが入力したタグへのタグ付け又は参照等が含まれる。例えば、ユーザであるルーク(Luke)が所定のドキュメントXにタームAでタグ付けを行い、他のユーザがドキュメントXにタームD及びタームFでタグ付けを行っている場合、ドキュメントXに関連付けられたタグの完全なセットは、{a,d,f}となる。ここで、小文字ラベル「a」は、ターム「A」を用いたタグ付けの実例を表す。更に、この具体例において、他の2人のユーザであるサイモン(Simon)及びピーター(Peter)が、クエリタームAを用いて検索を実行し、それぞれがドキュメントXをブロックした場合、ドキュメントXのタグは、{a,−a,−a,d,f}となる。この結果、複数のユーザがルークのタグに異議を唱えたため、ルークの信頼度レベルは低下し、サイモンとピーターのタグが複数のユーザと一致したため、サイモンとピーターの信頼度レベルは上昇する。なお、本発明に基づき、ユーザの信頼度を決定するために他の手法を用いてもよい。ユーザが未知の場合、又はユーザの信頼度のレベルを判定できない場合、中立的な信頼度のレベル又はタグが得られたソースから継承された信頼度のレベルをタグに割り当てる。なお、ユーザ信頼度は、タグを解析する時点で算出してもよく、他のタイミングで発生する処理において算出してもよい。
ステップ440では、各タームについて、各ドキュメント又はドキュメントのグループの重み付きタグカウントを判定する。ドキュメントXがタームAを用いてn回タグ付けされている場合、タームAについてのドキュメントXの重み付きタグカウントは、i=1〜nとして、各タグaを作成した各ユーザUの信頼度レベルを考慮した、ドキュメントXを参照する肯定的及び否定的な全てのタグa〜aの総和である。更に、ユーザが多くのタグを入力している場合、そのユーザは、頻繁にドキュメントにタグ付けしていると考えられ、そのユーザによるタグの重みは、タグ付けを頻繁に行わないユーザのタグより軽くしてもよい。更に、時間的に古いタグの重みを時間的に新しいタグの重みより軽くしてもよい。なお、本発明の一部として、重み付きタグカウントを判定する際、他の要素を考慮してもよい。各タームについて各ドキュメントの重み付きタグカウントが判定されると、処理は、ステップ450に進む。
ステップ450では、コーパス内の各タームを解析し、各タームについて、各ドキュメント又はドキュメントのグループのタグスコアを確立する。各タームを解析する処理からは、各ドキュメントを解析するステップ460及び各ドキュメントのタグスコアを算出するステップ470に進む。
ステップ460では、タグスコアを算出する次のドキュメントを解析する。ここでは、そのドキュメントに関して以前に収集され又は算出された全ての情報を集め、更なる解析を実行する。ここで考慮される要素としては、以下に限定されるわけではないが、例えば、ドキュメントにおけるタームの出現又は密度、ドキュメントにおけるタームの位置、同じタグにおける複数のタームの存在、ドキュメントへのハイパーリンクのアンカテキストにおけるタームの存在、タグの作成日時又は最終変更日時、統計的解析、クラスタ化解析、形態素解析又は類似性を判定する他の何らかの形式の解析に基づくドキュメント内のタームの他のタームへの類似性等がある。ドキュメントが解析されると、処理は、タームについてドキュメントのタグスコアを算出するステップ470に進む。
ステップ470では、現在のタームについて、現在のドキュメントのタグスコアを算出する。各ドキュメントのタグスコアは、ドキュメントについて言及するタグの総数の関数であり、各タグは、上述したステップ440で判定された重み付きタグカウントとして、タグに適用された重みに基づいて、演算に貢献する。更に、タグスコアへの各タグの貢献の度合いは、上述したステップ430で判定された、タグを入力したユーザについて評価された信頼度に比例し、ステップ460で実行されたドキュメントの解析に基づいて決定される。タームAについてのドキュメントXのタグスコアSは、タグデータベース(例えば、図3のタグデータベース340)内に存在する異なるタームの総数、タグデータベース内に存在するタグの総数、タグデータベースにおけるタームAの出現頻度、ドキュメントXにタグ付けされた異なるタームの数、ドキュメントXに関連付けられたタグの総数、及びタームAでタグ付けされた異なるドキュメントの数の関数である。これらの要素の組合せに基づいて演算を行い、各ドキュメントのタグスコアに値を割り当てる。なお、本発明の一部として、他の要素を考慮して演算を行ってもよい。本発明の好ましい実施の形態では、タグスコアは、個々のユーザ又はユーザのグループ毎にカスタマイズされる。本発明の他の実施の形態においては、各ドキュメントのタグスコアは、システムの各ユーザについて同じであってもよい。ステップ470は、ステップ450に戻り、このループは、各タームについて、コーパス内の各ドキュメントにタグスコア値が割り当てられるまで続けられる。そして、処理は、ステップ480に進む。
ステップ480では、所定のタグによってタグ付けされた各ドキュメントにインデックスを付し、これにより、タグ解析によって、クエリタームに関して全てのドキュメントの関連性を判定する検索時に、簡単且つ高速に検索することができるフォーマットで、各タームについて各ドキュメントのタグスコアを記録することができる。ドキュメント及びそれらのタグスコア、並びにタグの重み及びユーザ信頼度レベルのインデックスは、タグ解析のみによって又は他の検索技術と組み合わせて、検索時にクエリタームについて各ドキュメントの関連性を算出する検索エンジン(例えば、図3の検索エンジン320)によって高速且つ容易に検索することができるドキュメントインデックス(例えば、図3のドキュメントインデックス350)に発行することができる。なお、本発明の他の実施の形態においては、フローチャート400の何れかのステップを省略してもよく、他のステップを挿入してもよく、異なる重みを適用してもよく、異なるタグスコアを算出してもよく、何れの変形例も本発明の範囲内にある。
図5は、本発明の一実施の形態に基づき、タグデータを用いて結果を算出する処理のフローチャート500である。
図5に示すように、検索エンジンは、ステップ510において、1つ以上のタームを含むクエリを処理する(例えば、図2のステップ230)。
ステップ520において、検索エンジンは、クエリの各タームに基づいて、クエリに最も関連性が高いドキュメント又はドキュメントのグループのリストを生成する。各タームに基づいて関連性を判定する処理からは、ドキュメントを特定するステップ530、タグランクを判定するステップ540及び各ドキュメントにスコアを付けるステップ550に進む。ステップ530では、ドキュメントに関連付けられたタグに基づいて、クエリ内の各タームについて、関連性があると考えられるドキュメントのリストを生成する。このリストの長さは、非常に短いリスト(例えば、5件以下)から、非常に長いリスト(例えば、1000万件以上)までの範囲に及ぶ。なお、このリストは、検索アプリケーションにおける実用的な目的で切り捨て処理を行ってもよく、特定の実施の形態の要求に応じて、ソート処理を行ってもよい。
ステップ540では、ターム又は何らかのタームのグループに関して、各ドキュメントのタグスコアを判定する。各ドキュメントのタグスコアは、インデックスにおいてそのドキュメントに割り当てられたタグスコアの関数であり、タグスコアを算出するために用いられているタグを作成したユーザの現在の信頼度レベルの影響を受け、個々のユーザ又はあるグループのメンバであるユーザについて異なっていてもよい。
ステップ550において、各ドキュメントにスコアを付け、このスコアの値によって、現在、検討しているクエリタームに関して、結果リストにおけるドキュメントの位置が決定する。クエリ内の全てのタームが検討されるまで、ステップ550からステップ520に戻るループが繰り返される。
ステップ560では、クエリ内の各タームに基づく各ドキュメントの関連性スコアを結合し、提出されたクエリ全体に対する各ドキュメントの総合的な関連性スコアを計算する。次に、ステップ570において、格付けされた結果リストを生成し、他の何らかの関連性判定処理と結合する(例えば、図2のステップ240)ために、ステップ580において、結果リストを検索エンジンに送信する。なお、本発明の他の実施の形態においては、フローチャート500の何れかのステップを省略してもよく、順序を変更してもよく、他のステップを挿入してもよく、異なる重みを適用してもよく、異なるタグスコアを算出してもよく、何れの変形例も本発明の範囲内にある。
図6は、本発明に基づき、ユーザ610が使用するインターネット検索アプリケーションシステム600のハードウェア構成を示している。インターネット検索アプリケーションシステム600は、インターネット630を介してウェブサーバ640に接続されたクライアント装置620を備える。クライアント装置620は、ウェブサーバ640にアクセスするために用いられ、以下に限定されるわけではないが、ハイパーテキストトランスファープロトコル(HyperText Transfer Protocol:HTTP)、無線アプリケーションプロトコル(Wireless Application Protocol:WAP)等のインターネットプロトコルを用いて通信を行う如何なる装置であってもよい。クライアント装置620は、好ましくは、パーソナルコンピュータであるが、以下に限定されるものではないが、ハイパーテキストマークアップ言語(Hypertext Markup Language:HTML)、ハンドヘルドデバイスマークアップ言語(Handheld Device Markup Language:HDML)、無線マークアップ言語(wireless markup language:WML)等の規格を用いて情報を提供できる携帯電話機又は携帯情報端末(personal digital assistant:PDA)等のハンドヘルド型機器を含む他の装置であってもよい。
ウェブサーバ640は、検索サーバ650及びタグデータ記憶装置660の両方に接続されている。タグデータ記憶装置660は、タグ解析サーバ670に接続されており、検索サーバ650は、インデックスデータ記憶装置680に接続されている。更に、タグ解析サーバ670は、インデックスデータ記憶装置680に接続されている。
図7は、本発明の一実施の形態に基づくドキュメントインデックス700を示している。ドキュメントインデックス700は、本発明の手法を説明するために用いられる概念構造であり、好適なドキュメントインデックスとして、この他のインデックスを使用できることは当業者にとって明らかである。ドキュメントインデックス700は、例示的な第1の行740及び第2の行750を含み、各行は、それぞれ列705、710、715、720、725にタグ−オブジェクト対及び関連情報を格納している。行740において、列705は、タグ「U2」を含み、列710は、ここでは、ウェブページ(「U2ホーム(U2 Home)」)へのハイパーリンクであるオブジェクトを含み、列715は、タグ−オブジェクト対(「U2−U2ホーム(U2-U2 Home)」)の加工されていない(例えば、重みが付けられていない)関連性スコア(95)を含み、列720は、このタグ−オブジェクト対の重みを含み、列725は、タグU2をオブジェクト「U2ホーム」に関連付けたユーザの信頼度のレベルを含む。行750は、同様に特定された情報を含む。列720のエントリ(0.6)は、このタグ−オブジェクト対においてタグ「U2」に与えられる重みを決定する。この重みは、列725におけるユーザの信頼度のレベル(0.7)と、例えば、タグがオブジェクトに関連付けられた時刻等他の信頼度の因子とを組み合わせて判定でき、ここでは、重みは0.6と判定されている。このタグ−オブジェクト対の関連性スコアは、加工されていない関連性スコア(0.95)に重み(0.6)を乗算した値に等しく、最終的な関連性スコアは、57である。同様に、行750におけるタグ−オブジェクト対の関連性スコアは、70×0.9、すなわち、63である。このように、ユーザがターム「U2」を含む検索クエリを用いて検索を行うと、行750のオブジェクトに対応するオブジェクト「ロックバンドホームページ(Rock Band Home Site)」は、返された(構築された)結果リストにおいて、行740のオブジェクト「U2」より高く格付けされ、ユーザの検索に対してより関連性が高いことが示される。
なお、ドキュメントインデックス700は、単に例示的に示しているに過ぎない。例えば、他のエントリの組合せ、他の範囲の関連性スコア、関連性スコアを判定するための他のアルゴリズム、異なる構成を用いてもよい。
添付の特許請求の範囲によって定義されている本発明の精神及び範囲から逸脱することなく、実施の形態を変更できることは、当業者にとって明らかである。
少なくとも部分的に、本発明の一実施の形態に基づくタグの解析によって導出された検索結果リストを表示するグラフィカルユーザインタフェースを示す図である。 本発明の一実施の形態に基づき、タグを用いてドキュメントを格付けするインターネット検索アプリケーションの動作を示すフローチャートである。 本発明の一実施の形態に基づくインターネット検索アプリケーションの構成を示す概略図である。 本発明の一実施の形態に基づき、タグデータを準備し、解析するために処理を示すフローチャートである。 本発明の一実施の形態に基づき、タグデータを用いて検索結果を算出する処理を示すフローチャートである。 本発明の一実施の形態に基づくインターネット検索システムの構成を示すブロック図である。 本発明の一実施の形態に基づくドキュメントインデックスを示す図である。

Claims (48)

  1. 複数のオブジェクトの検索クエリに対する関連性を判定する関連性判定方法において、
    上記複数のオブジェクトに複数のタグを関連付ける及び/又は該複数のオブジェクトをブックマークするステップと、
    上記複数のオブジェクトのそれぞれと上記検索クエリとの関連性を判定するステップとを有する関連性判定方法。
  2. 上記複数のタグの各タグは、1つ以上のタームを含み、
    上記1つ以上のタームの各タームを上記オブジェクトに関連付けて、1つ以上の対応するターム−オブジェクト対を定義するステップを更に有する請求項1記載の関連性判定方法。
  3. 上記タームと上記オブジェクト間の関連性の度合いを示す上記各ターム−オブジェクト対のタームスコアを判定するステップを更に有する請求項2記載の関連性判定方法。
  4. 上記タグ内の各タームのターム−オブジェクト対のタームスコアを結合したタグ−オブジェクト対の関連性スコアを判定するステップを更に有する請求項3記載の関連性判定方法。
  5. 上記タームスコアを結合することは、該タームスコアの総和を求めることであることを特徴とする請求項4記載の関連性判定方法。
  6. 上記タームスコアを結合することは、該各タームスコアに重みを付け、該重み付きタームスコアの総和を求めることであることを特徴とする請求項4記載の関連性判定方法。
  7. タグ内のタームがオブジェクトに関連付けられた回数、オブジェクトに関連付けられたタグの数、タグが複数のオブジェクトに関連付けられた回数、又はこれらの任意の組合せから、タグ−オブジェクト対の関連性スコアを判定することを特徴とする請求項2記載の関連性判定方法。
  8. タグにタームを含むタグ−オブジェクト対の数、オブジェクトへの参照を含むタグ−オブジェクト対の数、又はこれらの両方から、タグ−オブジェクト対の関連性スコアを判定することを特徴とする請求項2記載の関連性判定方法。
  9. 第1のユーザによって、上記複数のオブジェクトの1つのオブジェクトにタグを関連付けるステップと、
    第2のユーザによって、上記タグ内の1つ以上のタームを含む検索クエリを実行するステップと、
    上記複数のオブジェクトを、上記関連性スコアに基づく結果リスト内に組織化して、組織化結果リストを定義するステップと、
    上記組織化結果リストを、上記第2のユーザに返すステップとを更に有する請求項1記載の関連性判定方法。
  10. 上記オブジェクト内に存在する又は該オブジェクトに関連付けられた上記検索クエリの各タームの関連性スコアから、オブジェクトと検索クエリの関連性スコアを判定することを特徴とする請求項9記載の関連性判定方法。
  11. 上記第1のユーザが複数のオブジェクトの何れかに関連付けたタグの数、上記第1及び第2のユーザがタグに関連付けたオブジェクトの数、又はこれらの両方から、上記複数のタグ−オブジェクト対のうちの1つのタグ−オブジェクト対の関連性スコアを判定することを特徴とする請求項9記載の関連性判定方法。
  12. 上記第1のユーザ及び上記第2のユーザのうちの選択された一方又は両方の信頼度のレベルから、タグ−オブジェクト対の関連性スコアを判定することを特徴とする請求項9記載の関連性判定方法。
  13. 上記信頼度のレベルは、上記選択されたユーザがオブジェクトに関連付けたタグの格付け、上記第1及び第2のユーザの検索行動間の類似度メトリック、該第1及び第2のユーザ間の関係メトリック、又はこれらの任意の組合せから、判定されることを特徴とする請求項12記載の関連性判定方法。
  14. 上記複数のオブジェクトを組織化するステップでは、上記関連性スコアに基づいて該複数のオブジェクトを並べ替えることを特徴とする請求項9記載の関連性判定方法。
  15. 上記複数のオブジェクトを組織化するステップでは、該複数のオブジェクトの少なくとも1つに、グラフィック要素によってマークを付すことを特徴とする請求項9記載の関連性判定方法。
  16. 上記オブジェクトにタグを関連付けるステップでは、ユーザに表示される領域に上記タグを入力し、該タグを格付けし、該オブジェクトへのリンクをブロック化し、該タグを選択し、又は該オブジェクトを選択することを含むことを特徴とする請求項1記載の関連性判定方法。
  17. 上記オブジェクトにタグを関連付けるステップでは、上記ブックマークを調査し、又は上記タグを用いて該オブジェクトの検索を実行することを含むことを特徴とする請求項1記載の関連性判定方法。
  18. 上記複数のオブジェクトは、ウェブページへのハイパーリンク又はウェブページへのハイパーリンクのグループを含むことを特徴とする請求項1記載の関連性判定方法。
  19. 上記複数のオブジェクトは、テキスト、画像、写真、タグ、タグのグループ、サブジェクト領域、概念、ユーザプロファイル、回答、オーディオファイル、ビデオファイル、ソフトウェア、又はこれらの任意の組合せへのハイパーリンク又はハイパーリンクのグループを含むことを特徴とする請求項1記載の関連性判定方法。
  20. 上記複数のタグの少なくとも1つを、タグクローラによって上記複数のオブジェクトの少なくとも1つに関連付けることを特徴とする請求項1記載の関連性判定方法。
  21. 結果リスト内に組織化されたオブジェクトを返すために用いられるシステムの情報を収集する情報収集方法において、
    複数のオブジェクトに関連付けられた複数のタグをタグデータベースに保存するステップと、
    複数のドキュメントを組織化結果リスト内に組織化するために用いられる、上記複数のタグと上記複数のオブジェクト間の関連性スコアをインデックスデータベースに保存するステップとを有する情報収集方法。
  22. 上記複数のタグをタグデータベースに保存するステップでは、該複数のタグに含まれるタームを保存することを含み、
    上記関連性スコアをインデックスデータベースに保存するステップでは、上記タームと上記オブジェクト間の関連性を示す関連性スコアを保存することを含むことを特徴とする請求項21記載の情報収集方法。
  23. 各インデックスエントリが、上記複数のタームのうちの1つのターム、上記複数のオブジェクトの対応するオブジェクト及び上記タームとオブジェクト間の対応する関連性スコアに対応する複数のインデックスを、上記インデックスデータベースに保存するステップを更に有する請求項22記載の情報収集方法。
  24. 上記タームとオブジェクト間の対応する関連性スコアは、それぞれ、上記オブジェクトに上記タームを関連付けたユーザの信頼度に関連することを特徴とする請求項23記載の情報収集方法。
  25. 上記タームとオブジェクト間の関連性スコアは、統計的分類又はランク回帰アルゴリズムに基づいて判定されることを特徴とする請求項23記載の情報収集方法。
  26. 上記統計的分類又はランク回帰アルゴリズムは、ロジスティック回帰、サポートベクトルマシン、分類又は回帰木、及びブーステッドツリーアンサンブルの何れかであることを特徴とする請求項25記載の情報収集方法。
  27. 上記タームを含む検索クエリに応じて、上記結果リストをユーザに表示するステップと、
    上記ユーザによって、上記タームを上記結果リストに含まれているオブジェクトに関連付けるステップと、
    上記タームと上記オブジェクト間の関連性スコアを判定するステップとを更に有する請求項21記載の情報収集方法。
  28. 上記複数のオブジェクトのうちの1つのオブジェクトと該オブジェクトに関連付けられたタグ間の関連性スコアは、該タグが該オブジェクトに関連付けられた回数、該オブジェクトに関連付けられたタグの総数、該タグが該複数のオブジェクトの何れかに関連付けられた回数、該複数のオブジェクトの全てに関連付けられたタグの数、該タグが該オブジェクトに関連付けられた日時、該オブジェクトがブックマークされた回数、該オブジェクトに適用された格付けの値及び数、又はこれらの任意の組合せの1つ以上から、判定されることを特徴とする請求項27記載の情報収集方法。
  29. 結果リストに表示される複数のオブジェクトを組織化するオブジェクト組織化方法において、
    検索クエリ内のタームと上記複数のオブジェクトに関連付けられたタグとの相関を調べるステップと、
    上記相関に基づいて組織化された複数のオブジェクトを含む結果リストを返すステップとを有するオブジェクト組織化方法。
  30. 上記検索クエリを実行して、上記複数のオブジェクトの第1のリストを生成するステップと、
    上記相関に基づいて、上記複数のオブジェクトを組織化するステップとを更に有する請求項29記載のオブジェクト組織化方法。
  31. 上記複数のオブジェクトにタグを関連付けるステップを更に有する請求項30記載のオブジェクト組織化方法。
  32. 上記各相関は、関連性メトリックに対応することを特徴とする請求項30記載のオブジェクト組織化方法。
  33. 上記複数のオブジェクトに統計的分類又はランク回帰アルゴリズムを適用して、上記複数のオブジェクトと上記検索クエリ内のターム間の関連性メトリックを判定するステップを更に有する請求項29記載のオブジェクト組織化方法。
  34. 上記統計的分類又はランク回帰アルゴリズムは、ロジスティック回帰、サポートベクトルマシン、分類又は回帰木、及びブーステッドツリーアンサンブルの何れかであることを特徴とする請求項33記載のオブジェクト組織化方法。
  35. 検索クエリに応じて、検索結果リストを返す検索システムにおいて、
    オブジェクトに関連付けられたタグを保存するタグデータベースと、
    上記タグデータベースに接続され、上記検索クエリに対する複数のオブジェクトの関連性スコアを判定するようにプログラムされたタグ解析器とを備える検索システム。
  36. オブジェクトに関連付けられたタグと該オブジェクト間、ブックマークと該オブジェクト間、又はこれらの両方の関連性スコアを保存するオブジェクトインデックスを更に備える請求項35記載の検索システム。
  37. 上記関連性スコアは、上記タグを構成するタームとオブジェクトの重み付き関連性スコアを合計することによって判定されることを特徴とする請求項35記載の検索システム。
  38. 上記タームを含む検索クエリとオブジェクト間の関連性スコアは、該検索クエリ内のタームを含むタグの数、該検索クエリに含まれるタグが上記タグデータベースに含まれている回数、該オブジェクトに関連付けられたタグの数、該タグと該検索クエリ内で一致したタームの数、該オブジェクトがブックマークされた回数、該オブジェクトが格付けされた回数、又はこれらの任意の組合せから、判定されることを特徴とする請求項35記載の検索システム。
  39. 上記タグとオブジェクト間の関連性スコアは、該オブジェクト内における該タグの位置、該オブジェクト内における該タグの出現頻度、該オブジェクト内における該タグの密度又はこれらの任意の組合せに基づいていることを特徴とする請求項35記載の検索システム。
  40. 上記タグとオブジェクト間の関連性スコアの重み付けは、該オブジェクトに該タグを関連付けたユーザに割り当てられた信頼度のレベルに基づいていることを特徴とする請求項35記載の検索システム。
  41. 上記関連性スコアは、統計的分類又はランク回帰アルゴリズム、クラスタ化解析アルゴリズム又は形態素解析アルゴリズムを用いて、判定されることを特徴とする請求項35記載の検索システム。
  42. 上記統計的分類又はランク回帰アルゴリズムは、ロジスティック回帰、サポートベクトルマシン、分類又は回帰木、及びブーステッドツリーアンサンブルの何れかであることを特徴とする請求項41記載の検索システム。
  43. 上記オブジェクトインデックスに接続され、タグに対応するタームを含む検索クエリを受信し、タグ−オブジェクト対の関連性スコアに基づいて、組織化結果リストを返すようにプログラムされた検索エンジンを更に備える請求項36記載の検索システム。
  44. 上記検索エンジンに接続され、上記検索クエリに関連する情報を格納するユーザデータベースを更に備える請求項43記載の検索システム。
  45. 上記検索クエリに関連する情報は、ユーザが選択したリンク、オブジェクトに関連付けられたタグ、ユーザによってブロックされたオブジェクト、ブックマーク、又はこれらの任意の組合せを含むことを特徴とする請求項44記載の検索システム。
  46. 上記オブジェクトは、ウェブページへのハイパーリンク又はウェブページへのハイパーリンクのグループを含むことを特徴とする請求項35記載の検索システム。
  47. 上記オブジェクトは、テキスト、画像、写真、タグ、タグのグループ、サブジェクト領域、概念、ユーザプロファイル、回答、オーディオファイル、ビデオファイル、ソフトウェア又はこれらの任意の組合せへのハイパーリンク又はハイパーリンクのグループ含むことを特徴とする請求項35記載の検索システム。
  48. 上記オブジェクトに上記タグを関連付ける関連付け手段を更に備える請求項35記載の検索システム。
JP2008525226A 2005-08-03 2006-08-03 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム Active JP5431727B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US70570405P 2005-08-03 2005-08-03
US60/705,704 2005-08-03
US11/498,448 US9715542B2 (en) 2005-08-03 2006-08-02 Systems for and methods of finding relevant documents by analyzing tags
US11/498,448 2006-08-02
PCT/US2006/030443 WO2007019311A2 (en) 2005-08-03 2006-08-03 Systems for and methods of finding relevant documents by analyzing tags

Publications (3)

Publication Number Publication Date
JP2009503751A true JP2009503751A (ja) 2009-01-29
JP2009503751A5 JP2009503751A5 (ja) 2009-09-03
JP5431727B2 JP5431727B2 (ja) 2014-03-05

Family

ID=37727923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008525226A Active JP5431727B2 (ja) 2005-08-03 2006-08-03 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム

Country Status (6)

Country Link
US (3) US9715542B2 (ja)
EP (1) EP1924903A4 (ja)
JP (1) JP5431727B2 (ja)
KR (1) KR101361182B1 (ja)
CA (1) CA2617831C (ja)
WO (1) WO2007019311A2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010277543A (ja) * 2009-06-01 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 正解データベース生成装置、正解データベース生成方法、正解データベース生成プログラムおよびそのプログラムを記録した記録媒体
JP2011227633A (ja) * 2010-04-19 2011-11-10 Nippon Telegr & Teleph Corp <Ntt> コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム
WO2012118087A1 (ja) * 2011-03-03 2012-09-07 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
KR101271115B1 (ko) 2011-03-23 2013-06-04 강민수 특허 리스크 헤징 예측 정보 생성 방법, 그 방법을 실시하는 시스템, 그 방법을 실시하는 프로그램, 그 프로그램이 기록된 기록 매체
JP2014500541A (ja) * 2010-11-01 2014-01-09 アリババ・グループ・ホールディング・リミテッド オンライン取引プラットフォームのための検索方法、装置およびサーバ
JP2014525070A (ja) * 2011-06-13 2014-09-25 フェイスブック,インク. ソーシャル・ネットワーク・データに基づく検索結果のクライアント側での修正
JP2016520924A (ja) * 2013-05-10 2016-07-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文書及び/又は検索クエリの関連性を変更する方法、コンピュータ・プログラム及びシステム
JP2018513477A (ja) * 2015-05-15 2018-05-24 グーグル エルエルシー 知識パネルのコンテキスチャライジング

Families Citing this family (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092523B2 (en) 2005-02-28 2015-07-28 Search Engine Technologies, Llc Methods of and systems for searching by incorporating user-entered information
CA2601768C (en) 2005-03-18 2016-08-23 Wink Technologies, Inc. Search engine that applies feedback from users to improve search results
US8732175B2 (en) * 2005-04-21 2014-05-20 Yahoo! Inc. Interestingness ranking of media objects
US10210159B2 (en) * 2005-04-21 2019-02-19 Oath Inc. Media object metadata association and ranking
US20090164564A1 (en) * 2005-07-01 2009-06-25 Michael John Willis System and methods for mobilizing web content
US8095551B2 (en) * 2005-08-18 2012-01-10 Microsoft Corporation Annotating shared contacts with public descriptors
US20090154665A1 (en) * 2005-11-28 2009-06-18 Galvin Brian M Authenticated audiographs from voice mail
US7773731B2 (en) 2005-12-14 2010-08-10 At&T Intellectual Property I, L. P. Methods, systems, and products for dynamically-changing IVR architectures
US7577664B2 (en) 2005-12-16 2009-08-18 At&T Intellectual Property I, L.P. Methods, systems, and products for searching interactive menu prompting system architectures
WO2007092781A2 (en) * 2006-02-03 2007-08-16 Kda Research Online qualitative research system
US20070204238A1 (en) * 2006-02-27 2007-08-30 Microsoft Corporation Smart Video Presentation
JP2007272390A (ja) * 2006-03-30 2007-10-18 Sony Corp リソース管理装置、タグ候補選定方法及びタグ候補選定プログラム
US7711732B2 (en) * 2006-04-21 2010-05-04 Yahoo! Inc. Determining related terms based on link annotations of documents belonging to search result sets
GB0702587D0 (en) * 2006-05-05 2007-03-21 Omnifone Ltd Digital rights management
US9507778B2 (en) * 2006-05-19 2016-11-29 Yahoo! Inc. Summarization of media object collections
US20080016052A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Using Connections Between Users and Documents to Rank Documents in an Enterprise Search System
US7873641B2 (en) 2006-07-14 2011-01-18 Bea Systems, Inc. Using tags in an enterprise search system
US20080016061A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Using a Core Data Structure to Calculate Document Ranks
US20080016071A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Using Connections Between Users, Tags and Documents to Rank Documents in an Enterprise Search System
US20080016072A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Enterprise-Based Tag System
US20080016053A1 (en) * 2006-07-14 2008-01-17 Bea Systems, Inc. Administration Console to Select Rank Factors
US7693906B1 (en) * 2006-08-22 2010-04-06 Qurio Holdings, Inc. Methods, systems, and products for tagging files
US20080082486A1 (en) * 2006-09-29 2008-04-03 Yahoo! Inc. Platform for user discovery experience
US20080086496A1 (en) * 2006-10-05 2008-04-10 Amit Kumar Communal Tagging
US8379915B2 (en) * 2006-11-20 2013-02-19 Videosurf, Inc. Method of performing motion-based object extraction and tracking in video
US20080120328A1 (en) * 2006-11-20 2008-05-22 Rexee, Inc. Method of Performing a Weight-Based Search
US20080120291A1 (en) * 2006-11-20 2008-05-22 Rexee, Inc. Computer Program Implementing A Weight-Based Search
US8059915B2 (en) * 2006-11-20 2011-11-15 Videosurf, Inc. Apparatus for and method of robust motion estimation using line averages
US20080120290A1 (en) * 2006-11-20 2008-05-22 Rexee, Inc. Apparatus for Performing a Weight-Based Search
US8488839B2 (en) * 2006-11-20 2013-07-16 Videosurf, Inc. Computer program and apparatus for motion-based object extraction and tracking in video
US8230320B2 (en) * 2006-12-26 2012-07-24 International Business Machines Corporation Method and system for social bookmarking of resources exposed in web pages that don't follow the representational state transfer architectural style (REST)
US7953736B2 (en) * 2007-01-04 2011-05-31 Intersect Ptp, Inc. Relevancy rating of tags
US8010532B2 (en) * 2007-01-17 2011-08-30 Yahoo! Inc. System and method for automatically organizing bookmarks through the use of tag data
US8190602B1 (en) * 2007-01-30 2012-05-29 Adobe Systems Incorporated Searching a database of selected and associated resources
US20080195586A1 (en) * 2007-02-09 2008-08-14 Sap Ag Ranking search results based on human resources data
US7895515B1 (en) * 2007-02-28 2011-02-22 Trend Micro Inc Detecting indicators of misleading content in markup language coded documents using the formatting of the document
US7685200B2 (en) 2007-03-01 2010-03-23 Microsoft Corp Ranking and suggesting candidate objects
US20080222100A1 (en) * 2007-03-08 2008-09-11 Fu-Sheng Chiu Internet forum management method
US8346763B2 (en) * 2007-03-30 2013-01-01 Microsoft Corporation Ranking method using hyperlinks in blogs
KR101417769B1 (ko) 2007-04-16 2014-08-07 삼성전자주식회사 통신 단말기의 사용자 컨텐츠 관리 방법
US20080276177A1 (en) * 2007-05-03 2008-11-06 Microsoft Corporation Tag-sharing and tag-sharing application program interface
US7903899B2 (en) * 2007-05-23 2011-03-08 Videosurf, Inc. Method of geometric coarsening and segmenting of still images
US7920748B2 (en) * 2007-05-23 2011-04-05 Videosurf, Inc. Apparatus and software for geometric coarsening and segmenting of still images
US20090055267A1 (en) * 2007-08-23 2009-02-26 Robert Roker Internet advertising brokerage apparatus, systems, and methods
US8862690B2 (en) * 2007-09-28 2014-10-14 Ebay Inc. System and method for creating topic neighborhood visualizations in a networked system
US9081852B2 (en) * 2007-10-05 2015-07-14 Fujitsu Limited Recommending terms to specify ontology space
US8280892B2 (en) * 2007-10-05 2012-10-02 Fujitsu Limited Selecting tags for a document by analyzing paragraphs of the document
US8909632B2 (en) * 2007-10-17 2014-12-09 International Business Machines Corporation System and method for maintaining persistent links to information on the Internet
US20090144240A1 (en) * 2007-12-04 2009-06-04 Yahoo!, Inc. Method and systems for using community bookmark data to supplement internet search results
US8136034B2 (en) * 2007-12-18 2012-03-13 Aaron Stanton System and method for analyzing and categorizing text
US7840548B2 (en) * 2007-12-27 2010-11-23 Yahoo! Inc. System and method for adding identity to web rank
US7853583B2 (en) * 2007-12-27 2010-12-14 Yahoo! Inc. System and method for generating expertise based search results
US20090192879A1 (en) * 2008-01-21 2009-07-30 Michael Hood Lead Rating Systems
US8280886B2 (en) 2008-02-13 2012-10-02 Fujitsu Limited Determining candidate terms related to terms of a query
JP2009265754A (ja) * 2008-04-22 2009-11-12 Ntt Docomo Inc 情報提供装置、情報提供方法及び情報提供プログラム
US20090271388A1 (en) * 2008-04-23 2009-10-29 Yahoo! Inc. Annotations of third party content
US8682819B2 (en) * 2008-06-19 2014-03-25 Microsoft Corporation Machine-based learning for automatically categorizing data on per-user basis
US9251266B2 (en) * 2008-07-03 2016-02-02 International Business Machines Corporation Assisting users in searching for tagged content based on historical usage patterns
US20100010982A1 (en) * 2008-07-09 2010-01-14 Broder Andrei Z Web content characterization based on semantic folksonomies associated with user generated content
US8364660B2 (en) * 2008-07-11 2013-01-29 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
WO2010006334A1 (en) * 2008-07-11 2010-01-14 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
KR101007056B1 (ko) * 2008-07-30 2011-01-12 주식회사 메디오피아테크 연관 태그에 기반한 태그 클러스터링 장치 및 그 방법
US8024342B2 (en) * 2008-07-31 2011-09-20 Yahoo! Inc. Systems and methods for determining a tag match ratio
US7730061B2 (en) * 2008-09-12 2010-06-01 International Business Machines Corporation Fast-approximate TFIDF
US8407216B2 (en) * 2008-09-25 2013-03-26 Yahoo! Inc. Automated tagging of objects in databases
KR100993656B1 (ko) * 2008-10-08 2010-11-10 경북대학교 산학협력단 태그 적합성 피드백 시스템 및 방법
US8364718B2 (en) * 2008-10-31 2013-01-29 International Business Machines Corporation Collaborative bookmarking
US8296305B2 (en) * 2008-12-09 2012-10-23 Yahoo! Inc. Rules and method for improving image search relevance through games
US8271501B2 (en) * 2008-12-17 2012-09-18 International Business Machines Corporation Web search among rich media objects
US20100161592A1 (en) * 2008-12-22 2010-06-24 Colin Shengcai Zhao Query Intent Determination Using Social Tagging
US8914359B2 (en) * 2008-12-30 2014-12-16 Microsoft Corporation Ranking documents with social tags
US8799279B2 (en) 2008-12-31 2014-08-05 At&T Intellectual Property I, L.P. Method and apparatus for using a discriminative classifier for processing a query
KR101067851B1 (ko) * 2009-03-05 2011-09-27 이노디지털 주식회사 웹 페이지 검색 시스템
US10353967B2 (en) * 2009-06-22 2019-07-16 Microsoft Technology Licensing, Llc Assigning relevance weights based on temporal dynamics
US10944868B2 (en) * 2009-07-10 2021-03-09 Avaya Inc. Contact center interfaces
US20120130999A1 (en) * 2009-08-24 2012-05-24 Jin jian ming Method and Apparatus for Searching Electronic Documents
US9223854B2 (en) * 2009-10-14 2015-12-29 Hewlett-Packard Development Company, L.P. Document relevance determining method and computer program
US9836466B1 (en) 2009-10-29 2017-12-05 Amazon Technologies, Inc. Managing objects using tags
US20120290317A1 (en) * 2010-01-21 2012-11-15 Rajesh Nair Tool for clinical data mining and analysis
US8429098B1 (en) 2010-04-30 2013-04-23 Global Eprocure Classification confidence estimating tool
US9508011B2 (en) 2010-05-10 2016-11-29 Videosurf, Inc. Video visual and audio query
US20110296345A1 (en) * 2010-05-27 2011-12-01 Alcatel-Lucent Usa Inc. Technique For Determining And Indicating Strength Of An Item In A Weighted List Based On Tagging
US20110295859A1 (en) * 2010-05-27 2011-12-01 Alcatel-Lucent Usa Inc. Technique For Multi-Dimensionally Determining Strength Of An Item In A Weighted List Based On Tagging
KR101226712B1 (ko) * 2010-12-22 2013-01-25 한양대학교 에리카산학협력단 컨텐츠 태그의 순위 산정 장치 및 방법
US9449093B2 (en) 2011-02-10 2016-09-20 Sri International System and method for improved search experience through implicit user interaction
CN102156747B (zh) * 2011-04-21 2013-05-29 清华大学 一种引入社会化标签的协作过滤评分预测方法及装置
US8645366B1 (en) * 2011-12-30 2014-02-04 Google Inc. Generating recommendations of points of interest
US20130230248A1 (en) * 2012-03-02 2013-09-05 International Business Machines Corporation Ensuring validity of the bookmark reference in a collaborative bookmarking system
US20140195977A1 (en) * 2012-04-11 2014-07-10 Sherry S. Chang User interface content personalization system
CN103426191B (zh) * 2012-05-26 2016-04-27 百度在线网络技术(北京)有限公司 一种图片标注方法及系统
US9514186B1 (en) * 2012-05-29 2016-12-06 Google Inc. User-list management
US9449348B2 (en) * 2012-08-28 2016-09-20 Facebook, Inc. Providing a locality viewport through a social networking system
US9740765B2 (en) 2012-10-08 2017-08-22 International Business Machines Corporation Building nomenclature in a set of documents while building associative document trees
KR101270958B1 (ko) * 2013-01-02 2013-06-11 주식회사 한글과컴퓨터 전자 문서 내 이미지 검색 장치 및 방법
US10402407B2 (en) * 2013-06-17 2019-09-03 Lenovo (Singapore) Pte. Ltd. Contextual smart tags for content retrieval
US20140379706A1 (en) * 2013-06-25 2014-12-25 Sap Ag Content Management System with Chained Document Discovery
US10169686B2 (en) * 2013-08-05 2019-01-01 Facebook, Inc. Systems and methods for image classification by correlating contextual cues with images
CN104424302B (zh) * 2013-09-04 2018-09-18 阿里巴巴集团控股有限公司 一种同类数据对象的匹配方法和装置
US10241988B2 (en) * 2013-12-05 2019-03-26 Lenovo (Singapore) Pte. Ltd. Prioritizing smart tag creation
US9633083B2 (en) * 2013-12-05 2017-04-25 Lenovo (Singapore) Pte. Ltd. Organizing search results using smart tag inferences
US10482131B2 (en) * 2014-03-10 2019-11-19 Eustus Dwayne Nelson Collaborative clustering feed reader
US10482490B2 (en) 2014-04-09 2019-11-19 Sailthru, Inc. Behavioral tracking system and method in support of high-engagement communications
US10289679B2 (en) 2014-12-10 2019-05-14 International Business Machines Corporation Data relationships in a question-answering environment
KR102444518B1 (ko) 2015-03-16 2022-09-16 한화테크윈 주식회사 영상 검색 방법 및 장치
US11803918B2 (en) 2015-07-07 2023-10-31 Oracle International Corporation System and method for identifying experts on arbitrary topics in an enterprise social network
US10331747B1 (en) * 2015-09-30 2019-06-25 Open Text Corporation Method and system for creating and using persona in a content management system
CN106815273B (zh) * 2015-12-02 2020-07-31 北京国双科技有限公司 数据存储方法和装置
TWI573031B (zh) * 2015-12-04 2017-03-01 英業達股份有限公司 資料分類及搜尋方法
AU2017217236A1 (en) * 2016-02-10 2018-09-27 Clap Online Pty Ltd A data acquisition and communication system
CN106407386B (zh) * 2016-09-14 2020-04-17 广东小天才科技有限公司 提高题目搜索效率的方法和装置
US11158012B1 (en) * 2017-02-14 2021-10-26 Casepoint LLC Customizing a data discovery user interface based on artificial intelligence
WO2019094384A1 (en) 2017-11-07 2019-05-16 Jack G Conrad System and methods for concept aware searching
US10747839B2 (en) * 2018-05-07 2020-08-18 International Business Machines Corporation Intelligent bookmarking with cognitive capability
KR102120748B1 (ko) * 2018-05-17 2020-06-09 주식회사 머니브레인 대화 이해 ai 시스템에 의하여, 계층적으로 저장되어 있는 북마크에 대한 문맥기반 검색 서비스를 제공하는 방법 및 컴퓨터 판독가능 기록 매체
JP7099925B2 (ja) * 2018-09-27 2022-07-12 富士フイルム株式会社 画像処理装置、画像処理方法、プログラムおよび記録媒体
US11494832B2 (en) 2018-11-09 2022-11-08 Honeywell International Inc. Systems and methods for securely creating a listing of equipment on an equipment online marketplace platform
US11640630B2 (en) 2018-11-09 2023-05-02 Honeywell International Inc. Systems and methods for verifying identity of a user on an equipment online marketplace platform
KR102248294B1 (ko) * 2020-11-05 2021-05-04 주식회사 해시스크래퍼 동일 구조의 데이터를 추출하는 방법 및 그를 이용한 장치
US20230092628A1 (en) * 2021-09-23 2023-03-23 Change Healthcare Holdings, Llc Systems and methods for building products

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254886A (ja) * 1997-03-07 1998-09-25 Fujitsu Ltd 検索システムにおける検索結果コンテンツへの付加的情報の付加及び検索システム
JP2004013323A (ja) * 2002-06-04 2004-01-15 Nippon Telegraph & Telephone East Corp 情報検索方法、情報検索システム、情報検索プログラム、情報評価プログラム、情報検索プログラムおよび情報評価プログラムをそれぞれ記録した記録媒体
US6718365B1 (en) * 2000-04-13 2004-04-06 International Business Machines Corporation Method, system, and program for ordering search results using an importance weighting

Family Cites Families (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6029195A (en) 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
US5680511A (en) * 1995-06-07 1997-10-21 Dragon Systems, Inc. Systems and methods for word recognition
JP3284832B2 (ja) * 1995-06-22 2002-05-20 セイコーエプソン株式会社 音声認識対話処理方法および音声認識対話装置
US6314420B1 (en) 1996-04-04 2001-11-06 Lycos, Inc. Collaborative/adaptive search engine
US5848396A (en) * 1996-04-26 1998-12-08 Freedom Of Information, Inc. Method and apparatus for determining behavioral profile of a computer user
US5835712A (en) * 1996-05-03 1998-11-10 Webmate Technologies, Inc. Client-server system using embedded hypertext tags for application and database development
US6070176A (en) 1997-01-30 2000-05-30 Intel Corporation Method and apparatus for graphically representing portions of the world wide web
US6112203A (en) 1998-04-09 2000-08-29 Altavista Company Method for ranking documents in a hyperlinked environment using connectivity and selective content analysis
US6256622B1 (en) * 1998-04-21 2001-07-03 Apple Computer, Inc. Logical division of files into multiple articles for search and retrieval
US6212522B1 (en) * 1998-05-15 2001-04-03 International Business Machines Corporation Searching and conditionally serving bookmark sets based on keywords
US6006225A (en) 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6334131B2 (en) 1998-08-29 2001-12-25 International Business Machines Corporation Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
US6360215B1 (en) * 1998-11-03 2002-03-19 Inktomi Corporation Method and apparatus for retrieving documents based on information other than document content
US7032030B1 (en) 1999-03-11 2006-04-18 John David Codignotto Message publishing system and method
US6327590B1 (en) 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US7110993B2 (en) 1999-05-28 2006-09-19 Overture Services, Inc. System and method for influencing a position on a search result list generated by a computer network search engine
US6711585B1 (en) * 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
US6810395B1 (en) * 1999-11-22 2004-10-26 Hewlett-Packard Development Company, L.P. Method and apparatus for query-specific bookmarking and data collection
US6785671B1 (en) 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US7428505B1 (en) 2000-02-29 2008-09-23 Ebay, Inc. Method and system for harvesting feedback and comments regarding multiple items from users of a network-based transaction facility
JP2001350794A (ja) 2000-06-08 2001-12-21 Gram Design:Kk データベース検索用キーワードに基づくコミュニケーション装置及び方法並びに記録媒体
US6601075B1 (en) 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
US6823491B1 (en) * 2000-08-31 2004-11-23 International Business Machines Corporation System and method for a dynamically integrated search engine
TW548557B (en) 2000-09-13 2003-08-21 Intumit Inc A method and system for electronic document to have fast-search category and mutual link
JP3934325B2 (ja) 2000-10-31 2007-06-20 株式会社日立製作所 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体
US6845374B1 (en) 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US7356530B2 (en) 2001-01-10 2008-04-08 Looksmart, Ltd. Systems and methods of retrieving relevant information
US20020152033A1 (en) * 2001-02-23 2002-10-17 Beavis Ronald C. Method for evaluating the quality of database search results by means of expectation value
US6714929B1 (en) 2001-04-13 2004-03-30 Auguri Corporation Weighted preference data search system and method
US20020165856A1 (en) 2001-05-04 2002-11-07 Gilfillan Lynne E. Collaborative research systems
SE523098C2 (sv) * 2001-06-19 2004-03-30 Jan G Faeger Anordning och förfarande för att i en reell omgivning skapa en virtuell företeelse
US6728704B2 (en) 2001-08-27 2004-04-27 Verity, Inc. Method and apparatus for merging result lists from multiple search engines
US20030046098A1 (en) 2001-09-06 2003-03-06 Seong-Gon Kim Apparatus and method that modifies the ranking of the search results by the number of votes cast by end-users and advertisers
US20020156779A1 (en) 2001-09-28 2002-10-24 Elliott Margaret E. Internet search engine
US6944609B2 (en) 2001-10-18 2005-09-13 Lycos, Inc. Search results using editor feedback
TW530224B (en) 2001-12-07 2003-05-01 Inst Information Industry Relation establishment system and method for key words in search engine
US7986672B2 (en) 2002-02-25 2011-07-26 Qualcomm Incorporated Method and apparatus for channel quality feedback in a wireless communication
US20030212663A1 (en) 2002-05-08 2003-11-13 Doug Leno Neural network feedback for enhancing text search
US7188117B2 (en) * 2002-05-17 2007-03-06 Xerox Corporation Systems and methods for authoritativeness grading, estimation and sorting of documents in large heterogeneous document collections
US20040030697A1 (en) 2002-07-31 2004-02-12 American Management Systems, Inc. System and method for online feedback
US7599911B2 (en) 2002-08-05 2009-10-06 Yahoo! Inc. Method and apparatus for search ranking using human input and automated ranking
US20040024755A1 (en) 2002-08-05 2004-02-05 Rickard John Terrell System and method for indexing non-textual data
US7386554B2 (en) * 2002-09-03 2008-06-10 Infoglide Software Corporation Remote scoring and aggregating similarity search engine for use with relational databases
US6829599B2 (en) 2002-10-02 2004-12-07 Xerox Corporation System and method for improving answer relevance in meta-search engines
US20040083127A1 (en) 2002-10-29 2004-04-29 Lunsford Joseph R. Web site and method for search engine optimization by prompting, recording and displaying feedback of a web site user
US20040117354A1 (en) 2002-12-16 2004-06-17 Azzaro Steven Hector Process for tagging and measuring quality
WO2004099900A2 (en) 2002-12-20 2004-11-18 Banker Shailen V Linked information system
US20040146200A1 (en) * 2003-01-29 2004-07-29 Lockheed Martin Corporation Segmenting touching characters in an optical character recognition system to provide multiple segmentations
US20040215608A1 (en) 2003-04-25 2004-10-28 Alastair Gourlay Search engine supplemented with URL's that provide access to the search results from predefined search queries
US20050033771A1 (en) * 2003-04-30 2005-02-10 Schmitter Thomas A. Contextual advertising system
US7283997B1 (en) * 2003-05-14 2007-10-16 Apple Inc. System and method for ranking the relevance of documents retrieved by a query
US8666983B2 (en) 2003-06-13 2014-03-04 Microsoft Corporation Architecture for generating responses to search engine queries
US20050060210A1 (en) 2003-09-11 2005-03-17 Levi Ronald M. Rental system, method and apparatus
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
US7647242B2 (en) * 2003-09-30 2010-01-12 Google, Inc. Increasing a number of relevant advertisements using a relaxed match
US7523096B2 (en) 2003-12-03 2009-04-21 Google Inc. Methods and systems for personalized network searching
US7523109B2 (en) 2003-12-24 2009-04-21 Microsoft Corporation Dynamic grouping of content including captive data
US20050154723A1 (en) 2003-12-29 2005-07-14 Ping Liang Advanced search, file system, and intelligent assistant agent
US20050149499A1 (en) 2003-12-30 2005-07-07 Google Inc., A Delaware Corporation Systems and methods for improving search quality
US8375048B1 (en) * 2004-01-20 2013-02-12 Microsoft Corporation Query augmentation
US8788492B2 (en) 2004-03-15 2014-07-22 Yahoo!, Inc. Search system and methods with integration of user annotations from a trust network
US7590619B2 (en) 2004-03-22 2009-09-15 Microsoft Corporation Search system using user behavior data
US7689585B2 (en) 2004-04-15 2010-03-30 Microsoft Corporation Reinforced clustering of multi-type data objects for search term suggestion
US7231405B2 (en) 2004-05-08 2007-06-12 Doug Norman, Interchange Corp. Method and apparatus of indexing web pages of a web site for geographical searchine based on user location
US7349901B2 (en) 2004-05-21 2008-03-25 Microsoft Corporation Search engine spam detection using external data
WO2007001247A2 (en) * 2004-06-02 2007-01-04 Yahoo! Inc. Content-management system for user behavior targeting
US7788260B2 (en) 2004-06-14 2010-08-31 Facebook, Inc. Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation
US7730012B2 (en) 2004-06-25 2010-06-01 Apple Inc. Methods and systems for managing data
US20060047643A1 (en) * 2004-08-31 2006-03-02 Chirag Chaman Method and system for a personalized search engine
US8109765B2 (en) 2004-09-10 2012-02-07 Scientific Learning Corporation Intelligent tutoring feedback
US20060173880A1 (en) 2005-01-28 2006-08-03 Microsoft Corporation System and method for generating contextual survey sequence for search results
US20060170705A1 (en) * 2005-02-01 2006-08-03 Lyris Technologies, Inc. Method and system to review the display of content
US9092523B2 (en) 2005-02-28 2015-07-28 Search Engine Technologies, Llc Methods of and systems for searching by incorporating user-entered information
CA2601768C (en) 2005-03-18 2016-08-23 Wink Technologies, Inc. Search engine that applies feedback from users to improve search results
US7653302B2 (en) * 2005-03-24 2010-01-26 Syabas Technology Inc. Techniques for transmitting personal data and metadata among computing devices
US9400838B2 (en) * 2005-04-11 2016-07-26 Textdigger, Inc. System and method for searching for a query
US8732175B2 (en) * 2005-04-21 2014-05-20 Yahoo! Inc. Interestingness ranking of media objects
US7809192B2 (en) * 2005-05-09 2010-10-05 Like.Com System and method for recognizing objects from images and identifying relevancy amongst images and information
US7783135B2 (en) * 2005-05-09 2010-08-24 Like.Com System and method for providing objectified image renderings using recognition information from images
US8086605B2 (en) * 2005-06-28 2011-12-27 Yahoo! Inc. Search engine with augmented relevance ranking by community participation
US20070112758A1 (en) 2005-11-14 2007-05-17 Aol Llc Displaying User Feedback for Search Results From People Related to a User
US7668821B1 (en) * 2005-11-17 2010-02-23 Amazon Technologies, Inc. Recommendations based on item tagging activities of users
US7756855B2 (en) * 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US20090089322A1 (en) * 2007-09-28 2009-04-02 Mor Naaman Loading predicted tags onto electronic devices
US9137321B2 (en) 2013-03-15 2015-09-15 Citrix Systems, Inc. Pairing users with social media communities
US20160379074A1 (en) * 2015-06-25 2016-12-29 Appropolis Inc. System and a method for tracking mobile objects using cameras and tag devices

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254886A (ja) * 1997-03-07 1998-09-25 Fujitsu Ltd 検索システムにおける検索結果コンテンツへの付加的情報の付加及び検索システム
US6718365B1 (en) * 2000-04-13 2004-04-06 International Business Machines Corporation Method, system, and program for ordering search results using an importance weighting
JP2004013323A (ja) * 2002-06-04 2004-01-15 Nippon Telegraph & Telephone East Corp 情報検索方法、情報検索システム、情報検索プログラム、情報評価プログラム、情報検索プログラムおよび情報評価プログラムをそれぞれ記録した記録媒体

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010277543A (ja) * 2009-06-01 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 正解データベース生成装置、正解データベース生成方法、正解データベース生成プログラムおよびそのプログラムを記録した記録媒体
JP2011227633A (ja) * 2010-04-19 2011-11-10 Nippon Telegr & Teleph Corp <Ntt> コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム
JP2014500541A (ja) * 2010-11-01 2014-01-09 アリババ・グループ・ホールディング・リミテッド オンライン取引プラットフォームのための検索方法、装置およびサーバ
JP5962926B2 (ja) * 2011-03-03 2016-08-03 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
WO2012118087A1 (ja) * 2011-03-03 2012-09-07 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
JPWO2012118087A1 (ja) * 2011-03-03 2014-07-07 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
US9569499B2 (en) 2011-03-03 2017-02-14 Nec Corporation Method and apparatus for recommending content on the internet by evaluating users having similar preference tendencies
KR101271115B1 (ko) 2011-03-23 2013-06-04 강민수 특허 리스크 헤징 예측 정보 생성 방법, 그 방법을 실시하는 시스템, 그 방법을 실시하는 프로그램, 그 프로그램이 기록된 기록 매체
JP2014525070A (ja) * 2011-06-13 2014-09-25 フェイスブック,インク. ソーシャル・ネットワーク・データに基づく検索結果のクライアント側での修正
JP2016186791A (ja) * 2011-06-13 2016-10-27 フェイスブック,インク. ソーシャル・ネットワーク・データに基づく検索結果のクライアント側での修正
US10296547B2 (en) 2011-06-13 2019-05-21 Facebook, Inc. Client-side modification of search results based on social network data
JP2016520924A (ja) * 2013-05-10 2016-07-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文書及び/又は検索クエリの関連性を変更する方法、コンピュータ・プログラム及びシステム
JP2018513477A (ja) * 2015-05-15 2018-05-24 グーグル エルエルシー 知識パネルのコンテキスチャライジング
US10402410B2 (en) 2015-05-15 2019-09-03 Google Llc Contextualizing knowledge panels
US11720577B2 (en) 2015-05-15 2023-08-08 Google Llc Contextualizing knowledge panels

Also Published As

Publication number Publication date
CA2617831A1 (en) 2007-02-15
US20070185858A1 (en) 2007-08-09
KR20080031928A (ko) 2008-04-11
US9715542B2 (en) 2017-07-25
EP1924903A2 (en) 2008-05-28
US20170357723A1 (en) 2017-12-14
US10963522B2 (en) 2021-03-30
WO2007019311A2 (en) 2007-02-15
KR101361182B1 (ko) 2014-02-07
US20200311155A1 (en) 2020-10-01
JP5431727B2 (ja) 2014-03-05
EP1924903A4 (en) 2011-09-28
CA2617831C (en) 2016-08-30
WO2007019311A3 (en) 2007-08-30

Similar Documents

Publication Publication Date Title
US20200311155A1 (en) Systems for and methods of finding relevant documents by analyzing tags
TWI391834B (zh) 藉分析標籤尋找相關文件之系統及方法
JP5632124B2 (ja) 格付け方法、検索結果並び替え方法、格付けシステム及び検索結果並び替えシステム
JP5572596B2 (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
CN108763321B (zh) 一种基于大规模相关实体网络的相关实体推荐方法
US8589391B1 (en) Method and system for generating web site ratings for a user
US8990193B1 (en) Method, system, and graphical user interface for improved search result displays via user-specified annotations
US20060282413A1 (en) System and method for a search engine using reading grade level analysis
US20100306249A1 (en) Social network systems and methods
US20130226918A1 (en) Trust propagation through both explicit and implicit social networks
US20090119268A1 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US20100161592A1 (en) Query Intent Determination Using Social Tagging
JP2007507801A (ja) ウェブ検索の個人化
US20180032614A1 (en) System And Method For Compiling Search Results Using Information Regarding Length Of Time Users Spend Interacting With Individual Search Results
Šimko et al. Semantic history map: Graphs aiding web revisitation support
JP2010282403A (ja) 文書検索方法
Liu et al. Discovering business intelligence information by comparing company Web sites
Zhao et al. A Hybrid Page Ranking Algorithm Based on User Behavior
Hendriksen Extending WASP: providing context to a personal web archive
TW201411379A (zh) 搜索系統及方法
Modi et al. A Comparative Study of Various Page Ranking Algorithms
Tan et al. QueReSeek: Community-Based Web Navigation by Reverse Lookup of Search History
Nasraoui Approaches to Mining the Web
Lakers et al. Search Engine Technology
WO2011018453A1 (en) Method and apparatus for searching documents

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20081211

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20081211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20081211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090717

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111122

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111130

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111222

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120105

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120123

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121121

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121129

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121221

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130816

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131205

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5431727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250