JP2013534673A - 無限ブラウズ - Google Patents

無限ブラウズ Download PDF

Info

Publication number
JP2013534673A
JP2013534673A JP2013518385A JP2013518385A JP2013534673A JP 2013534673 A JP2013534673 A JP 2013534673A JP 2013518385 A JP2013518385 A JP 2013518385A JP 2013518385 A JP2013518385 A JP 2013518385A JP 2013534673 A JP2013534673 A JP 2013534673A
Authority
JP
Japan
Prior art keywords
entity
entities
article
supplement
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013518385A
Other languages
English (en)
Other versions
JP5608286B2 (ja
Inventor
ユーキュン キム キム
ホンジアン ジャオ
シン リ
アレクサンドラ レヴィッチ
トム チー
ミン スイ
イーホン ジャオ
マーク デイヴィス
Original Assignee
ヤフー! インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヤフー! インコーポレイテッド filed Critical ヤフー! インコーポレイテッド
Publication of JP2013534673A publication Critical patent/JP2013534673A/ja
Application granted granted Critical
Publication of JP5608286B2 publication Critical patent/JP5608286B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Abstract

オンライン記事を、記事から抽出したエンティティ及び/又は記事から抽出したエンティティに関連するエンティティを含む補足コンテンツを記事に関連して表示することにより拡張する。補足コンテンツは、エンティティの各々に関する情報をさらに含む。エンティティに関する情報は、データの1又はそれ以上の検索可能リポジトリ内でエンティティを検索することにより取得することができる。例えば、補足コンテンツは、各エンティティに関して、ビデオ、画像、ウェブ、及び/又はニュース検索結果を含むことができる。補足コンテンツは、株価情報、要約、地図、スコアなどの情報をさらに含むことができる。エンティティは、ユーザ固有の情報、時間に依存する人気傾向、文法的特徴、検索結果の品質などの文脈因子に基づく様々な分析及びランク付け技術を使用して選択される。さらに、広告に基づく収益を生み出すことなどの目的でエンティティを選択することもできる。
【選択図】 図1A

Description

実施形態は、一般にコンテンツの提示に関し、より詳細には、文脈的に関連する検索結果でコンテンツを補足するための技術に関する。
本節で説明する方法は、追求できる方法ではあるが、必ずしも以前に想到又は追求されたことのある方法ではない。従って、他に指示がない限り、本節で説明する方法を、いずれも本節に含まれているという理由だけで従来技術として見なすべきではない。
多くの場合、ニュース記事、ブログエントリ及び電子メールなどのオンラインコンテンツ記事を見る個人(以下「ユーザ」)にとっては、人々、場所、組織、トピック、製品などを含む、記事の様々な題材(以下、「エンティティ」と呼ぶ)に関するさらなる情報を取得することが有用である。これらの情報を提供するために大量の検索可能リソースを利用することができるが、ユーザは、様々な理由により、これらのリソースにおいて利用できる情報にアクセスしようとしないことが多い。例えば、ユーザは、記事内のエンティティを明示的に検索する処理を面倒に感じることがある。或いは、ユーザが、記事内の特定のエンティティを検索することによってユーザの興味を引く情報が得られることを知らない場合もある。或いは、ユーザが、記事内の関連エンティティを検索することによってユーザの興味を引く情報が得られることを知らない場合もある。或いは、ユーザが、様々な検索可能リソースの存在を知らない場合もある。
これらの及びその他の問題を克服する1つの方法は、コンテンツプロバイダが、記事内のエンティティに関する興味深い情報を手動で検索し、この情報を記事とともに含めることである。残念ながら、この方法は大きな労力を要し、コンテンツプロバイダが記事内の各エンティティに対して利用できる情報の種類に精通することに依拠する。
別の方法は、コンテンツをユーザに送信する前に事前解析し、興味を引く可能性のあるエンティティを強調表示することである。これらのエンティティは、興味を引く用語の辞書を使用して配置される。これらのエンティティは、例えばハイパーリンクを示すテキストマークアップによって強調表示することができる。ユーザがハイパーリンクをクリックすると、又はその上にカーソルを重ねると、編集情報又は検索結果などの、強調表示されたエンティティに関する情報がユーザに提示される。
興味を引くエンティティを識別するための現在の方法には、編集者が興味を引くエンティティを手動で辞書に追加する必要があるという点で限界がある。特定の記事の文脈内で、実際にその記事内のどのエンティティが興味を引く可能性があるかを編集者が一般的レベルで予想することは困難である。さらに、記事を閲覧する文脈は継続的に変化するので、どのエンティティがユーザの興味を引くかを辞書に基づいて予測することはいっそう困難になる。さらに、既存の技術では、ユーザがエンティティに関する情報を取得するために(リンクをクリックして、新たなウェブページがロードされるのを待つことなどの)不便と思われるステップを行う必要がある。エンティティに関する取得できる情報の質が確実なものでないため、ユーザは、このようなステップを行いたいと思わないことがある。さらに、多くの既存の方法は、ユーザが記事内に出現しない関連エンティティに関する情報に興味を持つ可能性を考慮していない。
米国特許出願公開第2009/0083278号明細書
同じ参照数字が同様の要素を示す添付の図面の図に、本発明を限定ではなく一例として示す。
コンテンツの記事及びこれに伴う補足コンテンツの表示を示す例示的なスクリーンショットである。 記事コンテンツとともに提示される補足の代替例を示す図である。 記事コンテンツとともに提示される補足の代替例を示す図である。 本明細書で説明する技術を実施できるシステム例を示す図である。 ユーザに補足したコンテンツの記事を提供するための技術例を示すフロー図である。 ユーザに補足したコンテンツの記事を提供するための別の方法例を示すフロー図である。 記事の補足コンテンツを生成するための技術例を示すフロー図である。 一次エンティティを選択するための技術例を示すフロー図である。 関連エンティティを選択するための技術例を示すフロー図である。 一次エンティティ、及び一次エンティティに関して識別された関連エンティティの両方を含む候補エンティティの組から最終的なエンティティの組を選択するための技術例を示すフロー図である。 本発明の実施形態を実施できるコンピュータシステムのブロック図である。
以下の説明では、本発明を完全に理解できるようにするために、説明を目的として数多くの特定の詳細を記載する。しかしながら、これらの特定の詳細を伴わずに本発明を実施できることが明らかであろう。その他の場合、本発明を不必要に曖昧にしないために、周知の構造及び装置についてはブロック図形式で示す。
本明細書では以下の概略に従って実施形態を説明する。
1.0.全体的概要
2.0.補足コンテンツの表示例
3.0.構造的概要
4.0.機能的概要
4.1.サーバ主導の補足
4.2.クライアント主導の補足
4.3.補足の生成
5.0.実装例
5.1.一次エンティティの選択
5.2.関連エンティティの選択
5.3.候補エンティティからの最終的なエンティティの組の選択
5.4.品質に基づく基準に合わせたエンティティのフィルタ処理
5.5.補足コンテンツのフォーマット
5.6.ユーザの個人化
5.7.貨幣化
5.8.サーバの最適化
5.9.時間感度
5.10.補足サーバのAPI
5.11.雑項目
6.0.実装機構−ハードウェアの概要
7.0.拡張及び代替例
1.0.全体的概要
ユーザがアクセスしたコンテンツに、ビデオ、画像、定義、地図、検索結果、関連リンクなどの文脈的に関連する又は関連性のあるコンテンツの動的に決定されたスニペットを補足することによってユーザのブラウジング体験を高めるための方法、技術及び機構を開示する。以下では「補足コンテンツ」又は「補足」と呼ぶこれらの「スニペット」は、興味を引くエンティティを識別するだけでなく、これらのエンティティに基づく検索結果から取得される、これらのエンティティに関する興味を引く情報も含む。従って、ある実施形態では、これらの補足により、検索エンジンにクエリを送信することなどの不便と思われるステップをユーザが行う必要なく、またコンテンツプロバイダに代わって編集プログラミングを行う必要なくユーザを検索体験に従事させる。
補足コンテンツは、ユーザがアクセスしたコンテンツの分析に少なくとも部分的に基づいて生成される。ある実施形態によれば、各補足は、この分析に少なくとも部分的に基づいて選択された1又はそれ以上のエンティティに関する情報を含む。各エンティティは、分析したコンテンツ内に現れる又はこれに関連する単語、用語又は語句である。1又はそれ以上のエンティティに関する情報は、1又はそれ以上の検索エンジン及び/又はデータベース内で1又はそれ以上のエンティティを検索することにより生成される。補足は、ユーザを対象とした広告などの、分析したコンテンツとは無関係のその他の情報を追加として含むこともできる。
ある実施形態によれば、各補足は、少なくとも1つの横串検索レポートを含み、この横串検索レポートは、1又はそれ以上の検索エンジン及び/又はデータベース内で1又はそれ以上のエンティティを検索することにより生成された検索結果を含む。ある実施形態では、各横串検索レポートが複数の小区分を含み、各小区分は、異なるデータカテゴリに照らした検索結果から収集された情報を含む。例えば、横串検索レポートは、1又はそれ以上のビデオリポジトリに照らした1又はそれ以上の検索結果のための小区分、1又はそれ以上の画像データのリポジトリに照らした1又はそれ以上の検索結果のための別の小区分、ニュース記事の1又はそれ以上のリポジトリに照らした1又はそれ以上の検索結果のための別の小区分、及びソーシャルメディアデータの1又はそれ以上のリポジトリに照らした1又はそれ以上の検索結果のための別の小区分を含むことができる。しかしながら、他の実施形態では、異なるリポジトリからの異なる結果を単一の小区分内に混合することもできる。
ある実施形態によれば、各補足が、記事に関して選択された異なるエンティティのために各々が生成された複数の区分を含む。各区分は、例えば、そのそれぞれのエンティティの横串検索レポートを含むことができる。例えば、ワールドカップサッカーの試合をレポートする記事に関して、サッカー、ワールドカップ、南アフリカ及び米国という4つのエンティティが識別されたと仮定する。この記事に関して生成される補足は、各々がこれら4つの識別されたエンティティのうちの異なるエンティティの異なる横串検索レポートを含む4つの異なる区分を含むことができる。
ある実施形態では、補足が、導出される元となるコンテンツの記事に関連して表示される。例えば、各補足は、その補足が生成された対象の記事と同じウェブページのサイドバー内に、記事の上部に、又は記事の下部に表示される。ある実施形態では、各補足が、補足を表示するクライアントがいかなる時でも1つのエンティティに対応する1つの区分しか表示しないようにするスクリプト、コード又はその他の命令を含む。これらの命令は、クライアントが、異なるエンティティに対応するその他の区分を見えるようにするためのタブ又はその他の制御を表示するようにすることもできる。しかしながら、他の様々な方法で補足内の情報を表示することもできる。
ある実施形態では、ある記事に関して、いくつかの分析及びランク付け処理に基づいてエンティティが選択される。例えば、記事から一次エンティティを抽出し、一次エンティティが記事の題材を反映する度合いを定量化するためのあらゆる数のアルゴリズムに従ってこれらをランク付けすることができる。別の例として、関連語のリポジトリ内で一次エンティティを検索することに基づいて関連エンティティを選択することができる。その後、一次エンティティに対する関連エンティティの関連性を測定するためのいくつかのアルゴリズムのいずれかに基づいて関連エンティティをランク付けすることができる。その後、一次エンティティ及び関連エンティティを両方ともプールし、互いに関してさらにランク付けすることができる。さらに又はこの代わりに、一部又は全部のランク付け段階において、記事に対する各エンティティの関連性の測定、ユーザに対する各エンティティの関連性の測定、最近の検索、ニュース、又はソーシャルメディアの傾向によって示される各エンティティの人気の測定、各エンティティに関して取得した検索結果の有用性の測定などを含む様々な因子に基づいてエンティティをランク付けすることもできる。一部又は全部のランク付け段階において、ランク付け処理に基づいて、補足に含めるための検討からいくつかのエンティティを除外することもできる。例えば、ランク付け段階の一部又は全部の後で、所定数のエンティティのみを選択することができる。別の例として、所定の閾値を上回る関連性スコアを有するエンティティのみを選択することもできる。
ある実施形態では、ユーザがコンテンツの記事を要求したことに応答して、ユーザの要求に応答してサーバ側又はクライアント側の命令が実行された結果として、コンテンツの特定の記事に関して動的に補足が生成される。ある実施形態では、検索プロバイダが、コンテンツ開発者、コンテンツホスター、コンテンツ表示アプリケーション、及び/又は背景アプリケーションがコンテンツの記事を提出し、これと引き換えに、このコンテンツに関する生成された補足を受け取ることができるようにする補足生成サービスを提供する。例えば、ウェブページをブラウザに戻す前にブラウザによってウェブページが要求された場合、ウェブホストプロバイダは、このプロバイダがホストするウェブページを、補足生成サービスを通じて自動的に供給することができる。これにより、ウェブホストプロバイダは、補足コンテンツのための関連情報を手動で識別する必要なく、このプロバイダがホストするあらゆるページに、文脈に依存する捕捉コンテンツを自動的に挿入できるようになる。別の例として、ユーザにブラウザツールバーを提供し、このツールバー内の制御の選択時に、ユーザが現在見ているウェブページ(又はウェブページアドレス)を補足生成サービスに送信するようにすることができる。これと引き換えに、このツールバーは、ユーザに表示するための補足コンテンツを受け取る。
他の態様では、本発明は、上述のステップを実行するように構成されたコンピュータ装置及びコンピュータ可読媒体を含む。
2.0.補足コンテンツの表示例
図1Aは、コンテンツの記事110及びこれに伴う補足120の表示100を示すスクリーンショット例である。表示100は、例えば、記事110及び補足120を埋め込んだウェブページであってもよい。コンテンツの記事110はニュース記事であり、テキスト112及び画像114を含む。補足120は、記事110の最後の部分に表示される。テキスト112は、とりわけ、一次エンティティ131(「Jay Leno」)、132(「David Letterman」)、及び135(「Conan O’Brien」)を含む。補足120を生成するために、一次エンティティ131及び132、並びに関連エンティティ133(「Ben McKenzie」)及び134(「Late Night with Jimmy Fallon」)が選択されている。従って、補足120の最上部の見出しバー内にエンティティ131〜134が表示されている。補足120の残り部分には、関連エンティティ133に関する情報の区分143が見える。しかしながら、エンティティ131、133又は134のいずれかを選択すると、区分143は、補足120の選択されたエンティティ131、133、又は134に対応する隠れている区分に置き換わる。
区分143は、各々が異なる情報リポジトリからの検索結果を反映する4つの小区分151〜154を含む。小区分151は、ニュースデータベース内で一次エンティティ133を検索することによって読み出されたニュース記事のタイトル及び要約を表示する。小区分152は、ビデオデータベース内で一次エンティティ133を検索することによって読み出されたビデオに関する情報に基づくビデオプレビュー及びタイトルを表示する。小区分153は、画像データベース内で一次エンティティ133を検索することによって読み出された画像及び画像メタデータを表示する。小区分154は、スライドショーのデータベース内で一次エンティティ133を検索することによって読み出されたスライドショープレビュー及びメタデータを表示する。
ユーザは、小区分151〜154のうちの特定の小区分の強調表示部分を例えばクリックによって選択すると、完全なビデオ、ニュース記事又はスライドショーなどのより詳細なデータに導かれるという点で、小区分151〜154の各々の一部は選択可能である。小区分151〜154の各々は、1つの検索結果のみから得られた情報を含むが、他の実施形態では、各小区分が、あらゆる数の検索結果から得られた情報を含むことができる。
補足120は、ユーザが区分143をスクロールしてさらなる情報の小区分を呼び出せるようにするナビゲーションバー129をさらに含む。
図1B及び図1Cは、記事110の補足120の代わりに提示できる代替の補足例160及び180である。図1Bには、一次エンティティ131、関連エンティティ133、134、及び一次エンティティ135といった異なるエンティティの組を含む補足160を示している。補足160では、ユーザの個人化、関連性を計算するために使用するデータの時間感度、及び金銭的要因を含む様々な理由で、一次エンティティ132の代わりに一次エンティティ135が選択されたと考えられる。
図1Bの区分163は、図1の区分143とは異なる小区分の組171〜174を含む。小区分171〜174は、画像のリポジトリ、写真のリポジトリ、ニュース記事のリポジトリ、及び一般的な検索クエリのリポジトリに照らした検索結果にそれぞれ対応する。小区分171は複数の画像を含み、小区分172はインラインビデオを含む。小区分173及び174は、各々が異なる検索結果に対応する複数のリンクを含む。小区分171〜173の各々は、これらのそれぞれのリポジトリからさらなる検索結果を取得するためのリンク165を含む。
図1Cには、図1Bの補足120と同じエンティティを含む補足180を示しているが、その区分183は、図1Aの区分143の小区分151〜154と同様の小区分191〜194を含む。小区分191〜194は、主にこれらのそれぞれの項目が作成又は修正された時間を示すタイムスタンプ195を各々が含む点で小区分151〜154とは異なる。小区分191〜194は、これらの最上位にランクされた結果がどれほど前に作成されたかによってソートされる。
図1A〜図1Cは、ユーザに補足120を提示できるほんの1つの態様を示すものにすぎない。他の実施形態では、ウェブページ内の記事110に対する異なる位置に補足120を表示してもよく、或いはポップアップウィンドウ、外部ウィンドウ、又は別個のディスプレイ内に表示してもよい。例えば、ツールバー又はデスクトップウィジェットによって補足120を表示することもできる。補足120内の情報は、あらゆる数の考えられるレイアウトで編成することができる。例えば、補足120内の追加のエンティティ区分又はエンティティ区分全てを、クリック又はスクロールせずに補足内に現れるようにすることができる。さらに、補足のために選択されたエンティティ、各エンティティに利用できる情報の種類、及び記事110を見ているユーザなどの因子によって、補足120内の情報を変更することもできる。ある実施形態では、区分143を必ずしも小区分に分割する必要はなく、ソースに関わらず最上位にランクされる検索結果を提示する単一の小区分を含むようにすることができる。
3.0.構造的概要
図2に、本明細書で説明する技術を実施できるシステム例200を示す。システム200は、クライアント210、コンテンツサーバ220、補足サーバ230、エンティティ抽出要素240、1又はそれ以上の関連エンティティ識別要素250、1又はそれ以上のエンティティランク付け要素260、1又はそれ以上の検索要素270、及び1又はそれ以上のユーザ履歴要素280を含む。本明細書で説明する技術を実施できる他のシステムは、別の構成の同様の要素及び/又は追加の要素を含むことができ、或いは要素を省略することもできる。
ユーザは、クライアント210を操作して、コンテンツサーバ220により提供されるコンテンツ222にアクセスする。例えば、クライアント210は、コンテンツ222をウェブページの形でユーザに提示するウェブブラウザであってもよく、コンテンツサーバ220は、これらのウェブページをクライアント210に送信する役割を担うウェブサーバであってもよい。クライアント210は、コンテンツサーバ220からコンテンツ222の異なる記事224をダウンロードするための要求221を送信する。記事224は、テキスト、画像及びビデオを含む、ユーザが生成したコンテンツの特定の項目である。記事224の一部又は全部は、ブログエントリ、ニュース記事、参照記事、レビュー、教育文書、電子メールなどの、完全にユーザが書いた文書であってもよい。
コンテンツサーバ220は、記事224を送信することによって要求221に応答する。ある実施形態では、各記事224が、ハイパーテキストマークアップ言語(HTML)ファイル又は拡張マークアップ言語(XML)ストリームの要素などの構造化オブジェクト内でクライアント210に送信される。各構造化オブジェクトは、記事224に加えてその他の要素を含むこともできる。これらの要素は、限定ではないが、写真又はビデオなどの、記事を示す又はこれに関連するメディアアイテム、クライアント210による記事224の提示に影響を与えるフォーマット命令、ヘッダ、フッタ及びサイドバーなどのナビゲーション要素、広告、記事メタデータ、及びクライアント210に様々な動作を行わさせるための符号化命令を含むことができる。
コンテンツサーバ220は、各記事224を構造化オブジェクトに挿入する役割を果たしてもよく、又は果たさなくてもよい。例えば、コンテンツサーバ220は、データベース又はファイルシステム内に記事224のリポジトリを維持することができる。コンテンツサーバ220は、特定の記事224が要求されると、この要求された記事224を検索し、(例えば、マークアップ命令及びナビゲーション要素を含む)適当な構造化オブジェクトを生成し、要求された記事224を構造化オブジェクトに挿入し、この構造化オブジェクトによって要求に応答する。一方、記事224が(ウェブページなどの)好適な構造化オブジェクト内にある形で既にコンテンツサーバ220に記憶されている場合には、コンテンツサーバ220は、いずれの処理も行わずに記事224をクライアント210に中継することができる。
クライアント210及びコンテンツサーバ220の一方又は両方は、補足232に対する要求231を補足サーバ230に送信する。これに応答して、補足サーバは、コンテンツ222とともに表示するための補足232を戻す。各補足232は、コンテンツ222の特定の記事224内の又はこれに関連する1又はそれ以上のエンティティに関する情報の集合である。これらの情報は、例えば、1又はそれ以上のエンティティを使用して1又はそれ以上のリポジトリに問い合わせを行うこと、又は他のあらゆる種類の検索動作を行うことによって得られた検索結果の形をとることができる。ある実施形態では、各補足232が、複数のエンティティの横串検索結果を含む。この横串検索結果は、例えば、画像、ビデオ、関連コンテンツへのリンク、参照データ、コンタクト情報、地図などを含むことができる。各補足232は、例えば、単一のデータストリーム、又は単一のHTML又はXML要素などの単一のデータ構造内で戻される。
補足サーバ230は、クライアント210又はコンテンツサーバ220から補足サーバ230にオンザフライで示される記事224に基づいて、補足232の少なくとも一部を動的に生成する。これが生成されると、補足サーバ230は、補足232を生成した対象である特定の記事224に関する将来的な補足の要求に応答して提供できるように、補足232をキャッシュすることもできる。
補足サーバ230は、補足232を生成するために様々なバックエンド要素を使用することができる。補足サーバ230は、1又はそれ以上のエンティティ抽出要素240に依拠して記事からエンティティを抽出することができる。エンティティ抽出要素240は、記事を入力して、この記事から抽出された複数のエンティティを出力できる限り、様々な形をとることができる。好適なエンティティ抽出要素の一例として、Yahoo社のContextual Analysis Platform(以下「CAP」)が挙げられる。別の例としては、Stanford Named Entity Recognizerが挙げられる。
補足サーバ230は、1又はそれ以上の関連エンティティ識別要素250にさらに依拠することができる。この場合も、1又はそれ以上の関連エンティティ識別要素250は、抽出されたエンティティ、メディアアイテム、又は記事の少なくとも一部などの入力に基づいて1又はそれ以上の関連エンティティを出力できる限り、様々な形をとることができる。ある実施形態では、1又はそれ以上の関連エンティティ識別要素250が、検索クエリログ、人間が入力した関係データ、及び記事のコーパスのコンテンツをそれぞれ分析することによって同系性を判断する少なくとも3つのシステムを含む。このようなシステムの例として、Yahoo社のSeaviewシステム、様々なタイトルの参照エントリ間の関係を定義する、人間が追加したカテゴリデータを含むWikipediaデータベース、及び米国特許出願公開第2009/0083278号に記載されるような、記事のコーパス内における様々なエンティティペアの時間減衰カテゴリ同時出現頻度を定義する社会的関心発見システムがそれぞれ挙げられ、以後、この特許出願の内容全体は、あたかもその全体が記載されているかのように全ての目的のために引用により本明細書に組み入れられる。
補足サーバ230は、1又はそれ以上のエンティティランク付け要素260にさらに依拠して、エンティティ関連性スコア又はランクを提供することができる。補足サーバ230は、これらのスコア又はランクを使用してエンティティの優先付け及びフィルタ処理を行い、補足232が、対応する記事224内の又はこれに関連するエンティティのうちの最も文脈的に関連するもののみに関する情報を含むようにすることができる。補足サーバ230は、関連エンティティの識別に使用する抽出エンティティの数を制限すること、特定の抽出エンティティに関して識別される関連エンティティの数を制限すること、及び補足232内に情報を提供する抽出エンティティ及び関連エンティティの数を制限することのうちの一部又は全部を含む様々な目的で1又はそれ以上のエンティティランク付け要素260に依拠することもできる。この1又はそれ以上のエンティティランク付け要素260の一部又は全部は、エンティティ抽出要素240又は1又はそれ以上の関連エンティティ識別要素250に論理的に統合してもよい。例えば、補足サーバ230は、CAPにより提供されるランク付け機能を利用することができる。或いは、1又はそれ以上のエンティティランク付け要素260の一部又は全部を論理的に独立させることもできる。例えば、補足サーバ230は、独自のカスタムランク付け機能を利用すること、又は上述した「コンテンツの関連性を判断するための、活動に基づくユーザの関心モデリング」に記載されるようなトレンドシステムに問い合わせを行うことができる。
1又はそれ以上のランク付け要素260は、様々なソースからのデータに依拠することができ、またあらゆる数の目的に合わせて関連性を判断するように最適化することができる。例えば、クライアント210の特定のユーザが補足232を見た時に「クリック」する検索結果をこれらのエンティティが生成する可能性がどれほどであるかに基づいて特定の補足232に関するエンティティをランク付けするように1又はそれ以上のランク付け要素260を最適化することができる。別の例として、最新のニュース又はトレンドデータにおける人気に基づいてエンティティをランク付けするように1又はそれ以上のランク付け要素260を最適化することもできる。
補足サーバ230は、補足232内に記載されるエンティティの検索結果を生成するための1又はそれ以上の検索要素270にさらに依拠することができる。1又はそれ以上の検索要素は、あらゆる数の検索エンジン、データベース、及び以下ではまとめて検索リポジトリと呼ぶその他のリポジトリを含むことができる。様々な検索リポジトリの一部又は全部は、異なる種類の検索可能データを含むことができる。例えば、各リポジトリは、ウェブ検索、画像、ビデオ、ニュースなどの「検索バーティカル」に対応することができる。ある実施形態では、各検索リポジトリが、別個の検索エンジン又はデータベースである。ある実施形態では、検索リポジトリの一部又は全部が、同じエンジン又はデータベース内の単純に別様に分類されたデータの組である。
ある実施形態では、1又はそれ以上の検索要素270が、Yahoo社のQuery Plannerなどの検索結果カスタマイズ要素をさらに含むことができる。このカスタマイズ要素は、どの検索エンジン又はデータリポジトリがエンティティに関する情報の問い合わせを行うようにするかを計画すること、横串検索結果のレイアウトを編成すること、及び指定した品質又は量の閾値を満たす検索結果をどのエンティティが生成しないかを示すことを含む様々なタスクに関与することができる。
補足サーバ230は、1又はそれ以上のユーザ履歴要素280にさらに依拠して、補足232を特定のユーザ212に適合させることができる。例えば、補足サーバ240は、ユーザ履歴要素280により提供されたデータを、1又はそれ以上のランク付け要素260により実行されるランク付け機能の特徴として利用することができる。1又はそれ以上のユーザ履歴要素280は、例えば、ユーザ検索履歴、検索セッション履歴、及び一般的なユーザブラウジング履歴を含むことができる。
ある実施形態では、コンテンツサーバ220及び補足サーバ230が異なる装置上で実行される。コンテンツサーバ220は、コンテンツ222を提供するコンテンツプロバイダ(又はコンテンツプロバイダの代わりにウェブホスティングプロバイダ)によって動作する1又はそれ以上の装置上で実行される。補足サーバ230は、コンテンツプロバイダとは異なる補足プロバイダによって動作する1又はそれ以上の装置上で実行される。ある実施形態では、補足プロバイダが、様々な要素240〜280の一部又は全部を提供する検索プロバイダでもある。従って、要素240〜280の一部又は全部を、検索プロバイダによって動作する他の装置上で実行することもでき、補足サーバ230と同じ1又はそれ以上の装置上で実行することもでき、又は補足サーバ230に論理的に統合することもできる。これらの要素は全て、検索プロバイダのバックエンドネットワーク290を介してサーバに接続することができる。ある実施形態では、補足サーバ230が依拠する要素の一部又は全部が、検索プロバイダ以外のエンティティによって提供され、従って、補足サーバ230が実行される1又はそれ以上の装置以外の装置上で実行され、ネットワーク290以外のネットワークを介して補足サーバ230に接続される。
本明細書で使用する「サーバ」という用語は、単一のコンピュータ装置で実行される単一のサーバ要素に限定されるものではなく、サーバにより提供されるものとして説明した機能をまとめて提供するために複数のコンピュータ装置で実行される複数のサーバ要素を意味することもできる。同様に、「要素」という用語は、例えば、単一のコンピュータ装置で実行される命令の単一のインスタンスを意味することも、又は複数のコンピュータ装置で実行される命令の複数のインスタンスを意味することもできる。
4.0.機能の概要
4.1.サーバ主導の補足
図3は、ユーザに補足したコンテンツの記事を提供するための技術例を示すフロー図300である。フロー図300は、補足コンテンツを提供する処理の一例を示すものにすぎない。他の処理は、同じ又は異なる順序で構成された、より多くの、より少ない、又は異なるステップを含むことができる。
ステップ310において、クライアント210などの、コンテンツを表示するクライアントが、コンテンツサーバ220などのコンテンツサーバにコンテンツの記事に対する要求を送信する。例えば、ユーザがウェブブラウザを操作して、記事を含むウェブページをウェブサーバに要求することができる。
ステップ320において、この要求に応答して、コンテンツサーバが記事を検索する。例えば、コンテンツサーバは、1又はそれ以上のデータベース又は記憶装置から記事を検索することができる。
ステップ330において、コンテンツサーバは、補足サーバ230などの補足サーバに記事の補足を要求する。例えば、補足サーバは、このような要求を受け取るためのアプリケーションプログラムインターフェイス(API)を公開することができる。このAPIに従って、コンテンツサーバは、この要求とともに、記事自体、及び/又はファイルの経路、データベース記録の識別子、又は記事を検索できる場所を示すユニフォームリソースロケータなどの記事への参照を含む、補足を要求する記事を示すデータを含めることができる。
ステップ340において、補足サーバは、ステップ330の要求に応答して、記事に基づいて補足を生成する。補足サーバは、あらゆる数の検索リポジトリに情報を求めるクエリを行うことによって部分的に補足を生成する。補足サーバは、そのクエリを、記事のコンテンツのあらゆる数の分析、ランク付け処理、及び/又はフィルタ処理の結果として選択されたエンティティに基づかせることができる。補足を生成する技術については、本開示全体を通じてより詳細に説明する。
ステップ350において、補足サーバがコンテンツサーバに補足を戻す。例えば、補足サーバは、選択されたエンティティの検索リポジトリから読み出した情報を組み込んでフォーマットするHTMLコードのスニペットの形で補足を戻すことができる。
ステップ360において、コンテンツサーバは、補足を受け取ると、少なくとも記事及び補足を含む構造化文書を生成する。記事及び補足を戻された構造化文書は、クライアントが表示するためのその他の項目、並びに構造化文書内で項目をフォーマットして表示する方法のための命令をさらに含むことができる。例えば、コンテンツサーバは、記事のコンテンツで構成されたHTML文書、補足を含むサイドバー、表示されるページの様々な態様を動的に変更するためのJavaScript(登録商標)命令、及び様々なナビゲーション又は装飾要素を生成することができる。コンテンツサーバは、例えば、記事、サイドバー、テンプレート及びその他の情報をページレンダリング要素に入力することによって構造化文書を生成することができる。
ステップ370において、コンテンツサーバは、構造化文書を生成すると、記事を含む構造化文書をクライアントに送信することによってステップ330の要求に応答する。
ステップ380において、クライアントは、ステップ370で受け取った構造化文書に基づいて記事のコンテンツ及び補足を表示する。例えば、構造化文書がウェブページである場合、クライアントは、このウェブページを解析し、マークアップ及びその他の命令に基づいて少なくとも記事及び補足をレンダリングし、クライアントを操作しているユーザに表示することができる。
4.2.クライアント主導の補足
図4は、ユーザに補足したコンテンツの記事を提供するための方法例を示すフロー図400である。フロー図400は、補足コンテンツを提供する処理の第2の例を示すものにすぎない。さらに他の処理は、同じ又は異なる順序で構成された、より多くの、より少ない、又は異なるステップを含むことができる。
ステップ410において、クライアント210などの、コンテンツを表示するクライアントが、コンテンツサーバ220などのコンテンツサーバにコンテンツの記事に対する要求を送信する。例えば、ユーザがウェブブラウザを操作してウェブサーバにウェブページを要求することができる。
ステップ420において、この要求に応答して、コンテンツサーバが記事を検索する。例えば、コンテンツサーバは、1又はそれ以上のデータベース又は記憶装置から記事を検索することができる。
ステップ430において、コンテンツサーバは、記事を検索すると、少なくともこの記事を含む構造化文書を生成する。例えば、コンテンツサーバは、ヘッダ、フッタ、サイドバー、及び/又はその他のナビゲーション又は装飾項目とともにウェブページ内に記事のコンテンツを埋め込むことができる。或いは、好適な構造化文書内に前もって記事を記憶しておいて、このステップを不要にしてもよい。
ステップ440において、コンテンツサーバは、記事を含む構造化文書をクライアントに送信することによってステップ420の要求に応答する。
ステップ450において、クライアントは、ステップ370で受け取った構造化文書に基づいて記事のコンテンツを表示する。例えば、構造化文書がウェブページである場合、クライアントは、このウェブページを解析し、マークアップ及びその他の命令に基づいて少なくとも記事をレンダリングし、クライアントを操作しているユーザに表示することができる。
ステップ460において、補足アプリケーション(クライアントアプリケーション、又はクライアントに関連して動作する別のアプリケーションのいずれか)が、補足サーバ230などの補足サーバに、記事に対する補足の要求を送信する。例えば、補足サーバは、このような要求を受け取るためのアプリケーションプログラムインターフェイス(API)を公開することができる。このAPIに従って、補足アプリケーションは、この要求とともに、記事のコンテンツ、及び/又はファイルの経路、データベース記録の識別子、又は記事を検索できる場所を示すユニフォームリソースロケータなどの記事への参照を含む、補足を要求する記事を示すデータを含めることができる。
ステップ470において、ステップ340に関連して及び本開示全体を通じて説明するように、補足サーバは、記事に基づいて補足を生成する。
ステップ480において、補足サーバは、この補足を補足アプリケーションに戻す。ある実施形態では、HTML及び/又はスクリプト命令としてフォーマットされた補足が戻される。
ステップ490において、補足アプリケーションは、記事に関連して補足を表示する。以降、ステップ490は、いつでもステップ450とともに行うことができる。
ある実施形態では、クライアント又はクライアントのプラグイン要素が、ステップ460〜490の補足アプリケーションとして機能する。例えば、クライアントは、構造化文書内からの命令に応答してこの役割を担うことができる。構造化文書は、構造化文書内の記事を識別し、補足サーバに補足要求を送信し、ページ又はポップアップウィンドウの動的にロードされた区分内に補足を表示するようにクライアントに命令するスクリプトを含むことができる。この命令は、クライアントが構造化文書をレンダリングした時に自動的に、又はウェブページ内又はクライアントのインターフェイス内のボタン又はリンクなどの制御手段のユーザ選択に応答して実行することができる。或いは、クライアント又はクライアントのプラグイン要素をハードコード化して同様の命令を実行することもできる。
ある実施形態では、クライアントと同じコンピュータ装置で実行される別のアプリケーションが、補足アプリケーションとして機能する。この別のアプリケーションは、例えば、移動体装置上で実行されるバックグラウンドアプリケーション、デスクトップコンピュータ上で実行されるウィジェット、又はその他のあらゆる好適なアプリケーションとすることができる。このアプリケーションは、クライアントと通信して、現在クライアントが表示しているコンテンツの記事を識別するように構成される。このアプリケーションは、補足の要求を補足サーバに送信する。このアプリケーションは、補足を受け取ると、この補足をコンピュータ装置の別のウィンドウ内に表示する。このウィンドウは、クライアントの記事の表示の横に表示することもでき、又はクライアントの記事の表示に完全に取って代わることもできる。このアプリケーションは、記事を識別し、補足を要求し、及び/又はユーザ入力に応答して補足を表示することができる。或いは、このアプリケーションを、クライアントが表示するコンテンツのあらゆる記事に関してこれらのステップの一部又は全部を自動的に実行するように構成することもできる。
4.3.補足の生成
図5は、コンテンツの記事に関する補足コンテンツを生成するための技術例を示すフロー図500である。フロー図500のステップを、例えば補足サーバにより実施して、図4のステップ470又は図3のステップ340に従って補足を生成することができる。フロー図500は、補足コンテンツを生成する処理の一例を示すものにすぎない。他の処理は、同じ又は異なる順序で構成された、より多くの、より少ない、又は異なるステップを含むことができる。
ステップ510において、補足サーバ230などのサーバが、記事のコンテンツ又はメタデータから複数の構成エンティティを抽出する。複数の構成エンティティの各構成エンティティは、コンテンツ又はメタデータ内に現れる異なるエンティティである。様々な技術を使用して、コンテンツからエンティティを抽出することができる。ある実施形態では、記事内の各ユニークワードが構成エンティティと考えられる。ある実施形態では、コンテンツの構文及び/又は意味分析を使用して構成エンティティを識別し、統計的に重要な単語又は語句を識別することができる。ある実施形態では、記事内の全ての固有名詞が構成エンティティとして識別される。ある実施形態では、事前に定めた関心のあるエンティティの辞書内の単語又は単語の組み合わせを検索することにより構成エンティティが識別される。その他の変形形態は、さらなる分析及び上述した実施形態の組み合わせに依拠することができる。
ステップ520において、サーバが、複数の構成エンティティから一次エンティティの組を選択する。これを行うために、サーバは、各エンティティを1又はそれ以上のランク付け処理にかけることができる。この処理により、各構成エンティティのスコア及び/又は構成エンティティのランクリストが作成される。このランクは、限定ではないが、記事内の各エンティティの位置、コンテンツ内にエンティティが現れる頻度、エンティティが現れる文の言語構造、及び例えば、人物名、組織名又は場所名などの、エンティティが属するものとして分類されるエンティティタイプを含むいくつかの因子に基づくことができる。ある実施形態では、このランクが、記事のコンテンツからエンティティを除外することによってコンテンツの主なトピック又は題材が失われるという点で、エンティティの「アバウトネス」の尺度、すなわちそのエンティティが全体として記事にどれほど関連しているかについての尺度を少なくとも部分的に示す。これに加えて又はこれの代わりに、このランクは、ユーザ又はユーザグループに対するエンティティの関連性、又は最新ニューストピックに対するエンティティの関連性などの、各エンティティの他の側面を定量化するように機能することができる。ある実施形態では、所定数の最も高くランクされた一次エンティティのみが選択される。ある実施形態では、閾値スコアよりも高くスコア付けされた一次エンティティのみが選択される。
ステップ530において、サーバは、記事に基づいて関連エンティティの組を識別する。例えば、サーバは、一次エンティティの組の各エンティティに関する関連エンティティを、関連エンティティの1又はそれ以上のデータベース内で検索することができる。別の例として、サーバは、関連エンティティ識別要素250などの1又はそれ以上の関連エンティティ識別要素に、記事全体、構成エンティティの組、又は一次エンティティの組を供給することができる。
ある実施形態では、最初に関連エンティティ候補の組を識別し、次に1又はそれ以上のランク付け処理に基づいて関連エンティティ候補の組をフィルタ処理することによって関連エンティティの組が識別される。この処理により、各関連エンティティのスコア及び/又は関連エンティティの1又はそれ以上のランクリストが作成される。この関連エンティティのランクは、本出願全体を通じて説明するようないくつかの因子に基づくことができる。ある実施形態では、各関連エンティティが、発見された対象の一次エンティティとの同系性の尺度に少なくとも部分的に基づいてランク付けされる。このような測定の因子としては、限定ではないが、一次エンティティと関連エンティティの分類、同じ検索セッションのログデータ内に両方の用語が現れる頻度、及び文書の組内の同じ文書内に両方の用語が現れる頻度を挙げることができる。ある実施形態では、各一次エンティティに対して、所定数の最も高くランクされた関連エンティティのみが選択される。ある実施形態では、閾値スコアよりも高くスコア付けされた関連エンティティのみが選択される。
ステップ540において、サーバは、1又はそれ以上の一次エンティティの組及び1又はそれ以上の関連エンティティの組をプールして、記事の補足コンテンツに含める候補である候補エンティティの組を形成する。
ステップ550において、サーバは、候補エンティティの組の各エンティティにランクを付けて、各候補エンティティのスコア及び/又は候補エンティティのランクリストを作成する。この場合も、サーバは、様々なランク付け処理に依拠することができる。ある実施形態では、サーバが、クリック率に関して最適化するためのランク付け、大きな記事の組にわたるエンティティのカバー範囲を最適化するためのランク付け、或いは広告又は検索結果からの収益を最適化するためのランク付けを含む、異なる目的のための異なるランク付け処理を利用することができる。このランク付け処理は、限定ではないが、エンティティに関連する検索の収益、一次エンティティの「アバウトネス」スコア、それぞれの一次エンティティに対するその関連エンティティの関連性ランク、特定のユーザ又はユーザグループに対する関連性、以前にサーバが提供した補足内で各エンティティの検索結果が提示及び/又はクリックされた頻度、及び検索ログ、ブラウジング履歴、及び最新ニュース又はソーシャルメディア記事内における各エンティティの出現頻度によって示される各エンティティの人気の時間依存尺度を含む様々な因子に基づくことができる。なお、これらの因子の一部は、構成エンティティ又は関連エンティティ候補にランク付けする役割を果たすこともできる。
ステップ560において、サーバは、ステップ550のランク付けに少なくとも基づいて候補エンティティの組をフィルタ処理し、最終的なエンティティの組を生成する。ある実施形態では、所定数の最も高くランクされた候補エンティティのみが、最終的なエンティティの組に選択される。ある実施形態では、閾値スコアよりも高くスコア付けされた一次エンティティのみが選択される。
ある実施形態では、最終的なエンティティの組を識別する際に追加のフィルタを使用する。例えば、サーバは、最も高くランクされた候補エンティティから開始して所定数のエンティティが選択されるまで各エンティティを処理して、特定の基準が確実に満たされるようにすることができる。エンティティが所定の基準を満たす場合、このエンティティは最終的なエンティティの組に選択される。この所定の基準としては、例えば、そのエンティティに関する得られた検索結果の質(例えば、エンティティに対する検索結果の関連性の尺度)、そのエンティティに関する得られた検索結果の数、検索結果の所定のカテゴリの組の各々に関する得られた検索結果の数(例えば、サーバは、各最終エンティティが、少なくとも1つのビデオ、2つの画像及び3つのニュース検索結果を有することを必要とすることができる)、検索結果が、特定の対象領域(例えば、ニュースの編成、高収益領域、又はユーザが好む領域)に関する少なくとも所定数のヒットを含むかどうか、及び検索が、特定の対象領域(例えば、最近の検索結果内で戻された頻度が多すぎる領域、又は低品質及び/又は悪意があるものとして識別された領域)の検索結果が多くなりすぎることを避けるかどうかを挙げることができる。
これに加えて又はこれの代わりに、ある実施形態では、一次エンティティ及び/又は関連エンティティを選択する際に上述のフィルタ処理ステップを行うことができる。
ステップ570において、サーバは、最終的なエンティティの組の各特定のエンティティに関し、この特定のエンティティを検索語として使用して、1又はそれ以上の検索リポジトリに照らした1又はそれ以上のクエリを実行する。例えば、サーバは、最終的なエンティティの組の各エンティティを、ビデオのリポジトリ、ウェブページのリポジトリ、及びWikipediaデータベース内で検索することができる。このステップに従ってサーバが検索を行えるその他の考えられるリポジトリとしては、限定ではないが、ビデオ、画像、ウェブページ、オーディオファイル、ニュース記事、ソーシャルメディア、ブログエントリ、ムービーメタデータ、イベントカレンダー、株価情報、地図、スポーツの点数、出荷追跡データ、辞書エントリ、参照エントリなどのリポジトリが挙げられる。
ある実施形態では、検索されるリポジトリが事前に定められる。ある実施形態では、サーバに補足を要求するエンティティが検索リポジトリを指定することができる。ある実施形態では、補足が生成されている対象の記事の種類又はトピックの分類に応じてリポジトリを変更することができる。ある実施形態では、エンティティ自体に応じてリポジトリが変化する。例えば、サーバは、関連性、ユーザ選択及び収益などの因子に基づいて、いくつかの事前に定めたリポジトリの中からどのリポジトリが最適な検索結果を生成するかを判断するクエリプランニング要素にエンティティを送信することができる。例えば、このクエリプランニングユニットは、「Black Eyed Peas」というエンティティに関してはビデオ、音楽及びソーシャルメディアのリポジトリの各々における検索が最適な可能性があると判断するが、「Ghana」というエンティティに関してはWikipediaのデータベース及びニュース記事のコーパスに照らした検索が最適であろうと判断することができる。
ステップ580において、サーバは、最終的なエンティティの組内のエンティティの各々に関する1又はそれ以上のクエリをサーバが実行した結果として読み出された情報の一部又は全部を編成してフォーマットすることにより補足を生成する。サーバは、各エンティティの区分を生成し、各区分は、このエンティティに関する得られた検索結果の少なくとも一部を含む。これらの区分を、例えばステップ550のランク付けに従って、最も関連性のある区分が最初にリストされ及び/又は最初に目に触れるように編成することができる。或いは、例えばユーザ選択及び/又は広告収益などの他の何らかの順序付けに基づいて区分を編成することもできる。サーバは、様々なテンプレート又はレイアウト規則に従ってフォーマットを実行し、これにより記事の補足を生成する。情報を補足としてフォーマットするための技術例については、本開示の他の節で説明している。このフォーマット処理を、例えば横串検索要素にオフロードすることもできる。
5.0.実装例
5.1.一次エンティティの選択
図6は、一次エンティティを選択するための技術例を示すフロー図600である。フロー図600のステップを、例えば1又はそれ以上のエンティティ抽出要素とともに機能する補足サーバにより実施して、図5のステップ510及び520に従って一次エンティティの識別及び選択を行うことができる。フロー図600は、一次エンティティを識別する処理の一例を示すものにすぎない。他の処理は、同じ又は異なる順序で構成された、より多くの、より少ない、又は異なるステップを含むことができる。
ステップ610において、補足サーバが、辞書ベースのエンティティ抽出要素を利用して記事から第1のエンティティの組を抽出する。このような要素の例には、上述したCAPが挙げられるが、あらゆる辞書ベースの抽出要素を使用することができる。この辞書ベースの抽出要素は、記事のコンテンツを分析して、事前に定めたエンティティのデータベースに記憶されたエンティティを検索することができる。この抽出要素は、任意にエンティティをランク付け及び/又はフィルタ処理することもできる。
ステップ620において、補足サーバは、概念名又は場所名として分類されたエンティティを第1のエンティティの組から任意に除外する。
ステップ630において、補足サーバは、名前付きエンティティ認識要素を利用して記事からさらなる第2のエンティティの組を抽出する。このような要素の例には、文法ベースのStanford Named Entity Recognizerシステムが挙げられるが、あらゆる名前付きエンティティ認識要素を使用することができる。名前付きエンティティ認識要素は、様々な自然言語処理技術に依拠して、記事のコンテンツ内の個人、組織又は場所などの「名前付きエンティティ」を認識する。名前付きエンティティ認識要素と辞書ベースのエンティティ抽出要素は、他方の要素が見逃したエンティティを捕捉できるという点で、名前付きエンティティ認識要素は、辞書ベースのエンティティ抽出要素を補完する。
ステップ640において、補足サーバは、第1のエンティティの組と第2のエンティティの組を統合して、独自の一次エンティティ候補の組を生成する。
ステップ650において、一次エンティティ候補を記事内における発生頻度によってソートし、その後、記事内の位置によってソートする。
ステップ660において、所定の閾値よりも頻度が低い全てのエンティティを一次エンティティ候補の組から除外し、これにより一次エンティティの組が生じる。例えば、一次エンティティの組は、記事内に複数回現れるエンティティのみを含むことができる。
ステップ670において、他のあらゆる数のフィルタ処理基準に基づいて、一次エンティティの組をさらにフィルタ処理することができる。例えば、図7に示すステップを通じて一次エンティティの組をフィルタ処理し、関連エンティティが識別される一次エンティティのみを含むようにすることができる。
5.2.関連エンティティの選択
図7は、関連エンティティを選択するための技術例を示すフロー図700である。フロー図700のステップを、例えば1又はそれ以上の関連エンティティ識別要素とともに機能する補足サーバにより実施して、図5のステップ530に従って関連エンティティを識別し選択することができる。フロー図700は、関連エンティティを識別する処理の一例を示すものにすぎない。他の処理は、同じ又は異なる順序で構成された、より多くの、より少ない、又は異なるステップを含むことができる。
ステップ710において、補足サーバが、関連エンティティを配置する記事から抽出したプローブエンティティの組を識別する。例えば、補足サーバは、フロー図600のステップを通じて識別された一次エンティティの組をプローブエンティティとして利用することができる。
ステップ720において、補足サーバは、1又はそれ以上の関連エンティティ識別要素を利用して、プローブエンティティの組の各エンティティの関連語候補の組を識別する。ある実施形態では、検索クエリログ、人間が入力した関係データ、及び所与の期間(例えば、最後の6カ月)にわたって収集された記事のコーパスのコンテンツにそれぞれ焦点を当てる少なくとも3つの関連エンティティ識別要素をプローブエンティティの各々に利用する。
ステップ730において、非エンティティによって生じた用語を各関連語候補の組から除外し、これによりプローブエンティティの各々の関連エンティティ候補の組が生じる。非エンティティによって生じた用語は、例えば辞書検索又はウェブ検索を通じて識別することができる。
ステップ740において、補足サーバは、プローブエンティティの組内の各プローブエンティティ、及びプローブエンティティの対応する関連エンティティ候補の組内の各関連エンティティに関し、所与の期間にわたって収集された記事のコーパス内におけるプローブエンティティと関連エンティティの対の同時出現頻度スコアを計算する。すなわち、関連エンティティを配置するプローブエンティティと同じ文書内に関連エンティティ候補が現れる回数に基づいて、各関連エンティティ候補にスコアを付ける。
ある実施形態では、記事のコーパス内の複数のカテゴリの文書の各々に関して別個のカテゴリ同時出現頻度スコアを計算する。次に、例えば上位3位までのカテゴリ同時出現頻度スコアなどの上位のカテゴリ同時出現頻度スコアに基づいて、関連エンティティ候補の全体的な同時出現頻度スコアを計算する。
ある実施形態では、最近の文書内のプローブエンティティと関連エンティティのペアの同時出現が、より古い文書内のプローブエンティティと関連エンティティのペアの同時出現よりも大きく重み付けされるという点で、時間減衰関数を使用して同時出現頻度スコアを計算することができる。
任意に、ステップ750において、補足サーバは、記事が属するカテゴリに関するカテゴリ同時出現頻度スコアが所定の閾値よりも低いあらゆる関連エンティティ候補をフィルタ除去する。ある実施形態では、記事が属するカテゴリに関するカテゴリ同時出現頻度スコアに基づいて、ステップ740における全体的同時出現頻度スコアに大きく又は完全に重み付けすることができる。
ステップ760において、ステップ740で識別された同時出現頻度スコアに基づいて各関連エンティティ候補の組をフィルタ処理し、これにより各プローブエンティティに関する関連エンティティの組が生じる。これらの組の上位集合を、例えば図5のステップ530のための関連エンティティの組として使用することができる。例えば、同時出現頻度スコアが閾値スコアよりも低い関連エンティティ候補を除外することができる。或いは、所与のプローブエンティティに関して上位2つの関連エンティティのみを選択することもできる。
ステップ770において、他のあらゆる数のフィルタ処理基準に基づいて、関連エンティティの組をさらにフィルタ処理することができる。
5.3.候補エンティティからの最終的なエンティティの組の選択
図8は、一次エンティティ、及びこの一次エンティティに関する識別された関連エンティティの両方を含む候補エンティティの組から最終的なエンティティの組を選択するための技術例を示すフロー図800である。フロー図800のステップを、例えば1又はそれ以上のエンティティランク付け要素とともに機能する補足サーバにより実行して、図5のステップ550に従ってエンティティにランク付けすることができる。これに加えて又はこれの代わりに、ある実施形態では、一次エンティティ候補又は関連エンティティ候補にランク付けする際に、フロー図800のステップの一部又は全部を行うことができる。フロー図800は、最終的なエンティティの組を選択する処理の一例を示すものにすぎない。他の処理は、同じ又は異なる順序で構成された、より多くの、より少ない、又は異なるステップを含むことができる。
ステップ810において、他の節で説明したように、「アバウトネス」スコア又は同様のランク付けスコアに従って、全ての一次エンティティ、すなわち記事内に現れる全てのエンティティにランク付けする。
ステップ820において、補足サーバが、ステップ810で最も高くランク付けされた一次エンティティ候補を識別する。或いは、ステップ820〜880の最初の反復後にステップ820を行っている場合、補足サーバは、まだ検討していない最も高くランク付けされた一次エンティティ候補を選択する。
ステップ830において、補足サーバは、一次エンティティの検索結果を取得する。
ステップ835において、ステップ830で得られた検索結果が、他の節で説明したようないくつかの所定の品質制約を満たしている場合、この一次エンティティを最終的なエンティティの組に追加する。
ステップ840において、補足サーバは、候補エンティティの組内で、ステップ820の一次エンティティに基づいて配置された関連エンティティの組を識別する。
ステップ850において、例えば前の節で説明した同時出現ランク付けアルゴリズムに基づいて、一次エンティティに関する関連エンティティの組にランク付けする。
ステップ860において、補足サーバは、以前に検討していない最も高くランク付けされた関連エンティティの検索結果を取得する。
ステップ865において、ステップ860で得られた検索結果が、他の節で説明したようないくつかの所定の品質制約を満たしている場合、この関連エンティティを最終的なエンティティの組に追加する。
ステップ870において、補足サーバは、関連エンティティの組内の所定数のエンティティが最終的なエンティティの組に追加されたかどうか、又は関連エンティティの組内の全てのエンティティが検討されたかどうかを判定する。これらの条件がいずれも満たされていない場合、フローはステップ860に戻る。いずれかが満たされている場合、フローはステップ880に進む。ある実施形態では、補足サーバが、所定の品質制約を満たす検索結果を生成するために、いずれかの所与の特定のエンティティに関する関連エンティティの検討を最初の関連エンティティのみに制限する。ある実施形態では、所定数の関連エンティティが定義されず、特定のエンティティに関連する全ての関連エンティティに対してステップ860及び865を繰り返す。
ステップ880において、補足サーバは、所定数の候補エンティティが最終的なエンティティの組に追加されたかどうか、又は全ての候補エンティティが検討されたかどうかを判定する。これらの条件がいずれも満たされていない場合、フローはステップ820に戻る。いずれかが満たされている場合、流れはステップ890に進む。例えば、補足サーバは、最終的なエンティティの組のサイズを4に制限することができる。
ステップ890において、最終的なエンティティの組が定義されたと見なされる。
5.4.品質に基づく基準に合わせたエンティティのフィルタ処理
ある実施形態によれば、ステップ865及び835、並びに本開示全体を通じて説明する検索品質制約が、全体として戻された検索結果の数、いくつかの検索バーティカル又はカテゴリ内で戻された検索結果の数、及びクエリに対する検索結果の関連性の尺度を含むあらゆる数の因子に基づくことができる。
ある実施形態では、補足サーバが、クエリプランニング要素及び1又はそれ以上の検索要素の両方を参考にして、検索結果が、又は少なくとも(単複の)上位の検索結果が関連性閾値を満たさないエンティティをフィルタ除去する。あらゆる好適な関連性ランク付けアルゴリズムを使用して、関連性尺度を生成することができる。ある実施形態では、各検索結果タイプが、関連性及び/又は異なる関連性閾値を決定するための異なるアルゴリズムを有することができる。例えば、ニュースコーパス内におけるエンティティの検索では、エンティティに対する各ニュース記事の関連性のカスタマイズした尺度に基づいて検索結果内でニュース記事にランク付けできるのに対し、標準的なウェブリポジトリ内におけるエンティティの検索では、エンティティとの関連性のより一般的な尺度によって検索結果内でウェブ文書にランク付けすることができる。いずれの場合にも、クエリプランニング要素及び/又は検索要素は、関連性尺度を補足サーバに渡し、さらにこの補足サーバが、エンティティに関する関連性尺度が最低限の関連性スコアを個別に又は全体的に満たすことを確実にする。
ある実施形態では、補足サーバがエンティティをフィルタ除去して、各選択されたエンティティが、様々な検索バックエンドから検索結果を取り出した後に、特定のカテゴリ内に所定数の検索結果を有するようにする。例えば、各エンティティが、少なくとも2つの品質画像結果、1つの品質ビデオ結果、3つの品質ニュース記事結果、及び関連するウェブ検索クエリの6つの品質結果を生成することを確実にするように補足サーバを構成することができる。補足サーバは、エンティティの二重の検索結果を無視する。
ある実施形態では、補足サーバが、エンティティの検索結果により、少なくとも1つの所定の横串結果テンプレートに追加するのに十分な検索結果が生じることを確実にする。各テンプレートは、異なる検索バーティカルに対して異なる数の結果を求めることができる。例えば、前の段落で説明した基準は、標準的なニューステンプレートの要求を反映することができる。しかしながら、エンティティは、たとえ標準的なニューステンプレートの要求に従って品質ビデオ検索結果を生成できない場合でも、異なる横串結果テンプレートによって要求されるような高品質な検索結果を参照データベース内に生成することができる。
5.5.補足コンテンツのフォーマット
ある実施形態では、各補足が、最終的なエンティティの組の各エンティティ、及び最終的なエンティティの組の各エンティティの横串検索結果を含む。各エンティティ及びその横串検索結果に対して別の区分を定義することもできる。一度に全ての区分が見えるようにすることもでき、又は最初にいくつかの区分を部分的に隠しておき、それぞれのエンティティのタイトルバーをクリックすることによって見えるようにすることもできる。この目的のために、補足は、補足をどのように表示すべきかをクライアントに指示する命令及び/又はマークアップ言語をさらに含むことができる。ある実施形態では、最も高くランク付けされたエンティティに対応する区分が最初から完全に見えるのに対し、残りの区分は、ユーザが選択するまで部分的に隠れたままである。ある実施形態では、補足にコードを含めた結果、又は補足がコードを参照した結果、眼に見える区分が、ユーザの介入を伴わずに定期的に循環する。
ある実施形態では、検索結果が、1又はそれ以上のテンプレートに従って補足内で編成される。テンプレートは、記事に対する所望の補足位置及び/又は所望のディスプレイ装置に基づいて異なることができる。例えば、標準的なウェブページのサイドバー内に表示される補足のための1つのテンプレートを定義すること、標準的なウェブページ内の記事の直下の区分内に表示されるサイドバーのための別のテンプレートを定義すること、移動体装置のウェブブラウザ内に補足を表示するための別のテンプレートを定義すること、ポップアップされる補足のための別のテンプレートを定義することなどができる。
ある実施形態では、読み出した情報に応じて、異なるレイアウトが適することがある。例えば、特定のエンティティの検索によって高品質ビデオ、画像及びブログという結果が得られた場合、サーバが生成する補足は、最も高くランク付けされたビデオを補足の左側に、3つの最も高くランク付けされた画像を補足の中央に、及びブログ記事へのリンクを補足の右側に含むことができる。一方で、特定のエンティティの検索によって株価情報、Wikipediaの要約及び高品質ニュースという結果が得られた場合、Wikipediaの要約を補足の左側に、株価情報を補足の右上に、及び説明を添えたニュース記事へのリンクを補足の右下に含むように補足を編成することができる。ある実施形態では、クエリプランニング要素及び/又は横串検索要素を利用して、各エンティティに適したレイアウトを決定する。
5.6.ユーザの個人化
ある実施形態では、補足サーバが、ユーザ固有のデータを利用して、一次エンティティ、関連エンティティ及び候補エンティティにランク付け又は再ランク付けを行う。少なくとも部分的にランク付けの基準になり得るユーザ固有のデータの種類としては、限定ではないが、検索クエリ履歴、コンテンツのブラウジング履歴、ユーザが識別した選択、及びその他のユーザ行動データが挙げられる。あらゆる好適な手段を使用してユーザの行動をモニタすることによってこのようなデータを収集し、その後、ユーザ履歴要素280に依拠することなどによってリポジトリに記憶することができる。ある実施形態では、ユーザ固有のデータに加えて又はこの代わりに、補足サーバが、ユーザをメンバとして含むユーザグループに固有の同様のデータにランク付けが少なくとも部分的に基づくようにすることができる。
従って、異なるユーザが同時に要求した記事は、個々のユーザ又は個々のユーザが属するグループに適合した異なる補足を生成することができる。例えば、異なるユーザのブラウジング履歴が異なる結果、補足に関して異なるエンティティが選択されることがある。
ある実施形態では、ユーザが存在すると思われる適当な地理座標又は領域などのロケーションベースのデータに基づいて、補足の基準となる検索結果の一部又は全部を個人化することができる。例えば、ユーザが旅行中に空港で見ている携帯電話上に表示される記事の補足は、ユーザが自宅のコンピュータで記事を見た場合に目にする補足とは異なることがある。このような情報は、GPSシステム、ネットワークアドレスを一般的な座標にマッピングするデータベース、ユーザ選択、ユーザ入力などを含む様々な機構を利用して求めることができる。
ある実施形態では、社会的共有制御を使用して検索結果の一部又は全部を提示することができる。例えば、補足の各項目は、クリック時に項目又は項目が由来する記事がユーザグループと共有されるようにする「友人と共有」ボタンを含むことができる。ある実施形態では、ユーザが、補足内の項目を例えばクリックすることによって選択した時に、項目に関するさらなる詳細を含むページに導かれる。一方で、ユーザの選択はログファイルに記録され、ユーザがこの項目を選択したことを、ユーザに関連するユーザグループに自動的に通知することができる。
5.7.貨幣化
ある実施形態では、エンティティ及び/又は検索結果を、貨幣化因子に少なくとも部分的に基づいてランク付けすることができる。例えば、あるエンティティを、このエンティティに関する検索結果が検索プロバイダにより多くの収益をもたらすという理由で、別のエンティティよりも多く選択することができる。或いは、あるエンティティを、このエンティティに基づく検索結果を補足に含める見返りに補足プロバイダに一定の金額を支払うように広告主が構成を行っているという理由で、別のエンティティよりも多く選択することができる。ある実施形態では、様々な広告主が、一定数の補足が特定のエンティティを含むことを保証されていることがある。従って、ランク付け処理により、各広告主との公約が満たされるようにエンティティの選択をバランス調整しようと試みることができる。
ある実施形態では、エンティティに関する情報を検索されるリポジトリの少なくとも1つが広告リポジトリである。広告の選択では、記事からの又は記事に関するエンティティに加えて、ユーザのオンラインショッピング履歴又はブラウジング履歴を考慮することができる。さらに、広告リポジトリから高品質の又は高収益の結果を生み出すか否かに基づいて候補エンティティをフィルタ処理することもできる。
5.8.サーバの最適化
ある実施形態では、上述した処理の様々な段階で生成されたデータをキャッシュすることにより、補足サーバを最適化することができる。例えば、図3のステップ340又は図4のステップ430などの記事の補足を生成するステップは、必ずしも記事の補足に対するあらゆる要求に応答して実行されるものではなく、むしろ記事の補足に対する最初の要求に対してステップ340を実行し、次の要求に応答するためにこの結果をキャッシュすることができる。別の例として、補足全体をキャッシュする代わりに、すでに分析した記事の一次エンティティ、関連エンティティ及び/又は最終的なエンティティをキャッシュすることができる。ある実施形態では、ユーザごと又はグループごとにデータをキャッシュすることができる。ある実施形態では、エンティティのランク付けを更新して、更新された時間依存のランク付けの特徴を反映できるように、キャッシュされたバージョンのデータが定期的に失効する。
ある実施形態では、記事のコーパス内の記事ごとに、一次エンティティ及び関連エンティティが定期的に識別されランク付けされる。これらのエンティティは、後で補足を生成する際に使用できるようにデータベースに記憶される。これらのエンティティ及びランクは、エンティティを識別してランク付けすることに依拠する様々な特徴の変化を補うために、時間とともに毎週又は毎月などの定期的に更新される。新たな記事がコーパスに追加されると、この新たな記事を自動的にエンティティに対して取り入れることができる。或いは、補足サーバは、次のスケジュールされた定期的リフレッシュ時間まで、又は補足サーバが明示的な記事の要求に応答するように求められるまで、新たな記事の分析を遅らせることもできる。
ある実施形態では、補足サーバが、補足の要求に対して1秒未満の応答時間を実現するために、異なる検索バックエンドシステムからクエリ結果を同時に取り出すための同時実行ランタイムシステムを実装する。
5.9.時間感度
ある実施形態では、エンティティをランク付けするための1又はそれ以上の因子が時間に依存することができる。例えば、様々なランク付けの特徴は、時間とともに更新されるデータに基づくことができる。或いは、エンティティの発生頻度に対して、より最近のエンティティの発生により大きな重要度が与えられるように重み付けすることもできる。
従って、ある実施形態では、記事のコンテンツが変化しなくても、同じ記事に関して異なる時点で異なる補足を生成することができる。ある記事に関して生成される補足は、そこに提示される検索結果だけでなく、提示される一次エンティティ及び/又は関連エンティティ、並びに全体的な情報の編成も含むあらゆる数の方法で、時間とともに異なることができる。
5.10.補足サーバのAPI
ある実施形態では、補足サーバが、要求者に補足全体を戻す代わりに、特定の要求者にエンティティ及び横串検索結果を戻して、要求者が独自の設定に従って補足コンテンツを編成及びフォーマットできるようにする。補足サーバは、このような要求者に対して「エンティティ結果セット」API及び「エンティティ検索結果」APIという2つの主なAPIを提供する。第1のAPIは、記事を入力として捉え、補足に関する最終的なエンティティの組を含む結果セットを戻す。第1のAPIは、最終的なエンティティの組内の最初のエンティティの単一の横串検索結果を任意に戻すことができる。第2のAPIは、エンティティを入力として捉え、このエンティティの横串検索結果を戻す。要求者は、例えば、記事に関して識別された他のエンティティをユーザが選択できるようにするメニューとともに最初のエンティティの横串検索結果を表示することができる。要求者は、別のエンティティを選択したことに応答して、選択したエンティティのさらなる横串検索結果を要求することができる。
5.11.雑項目
ある実施形態によれば、ユーザが要求したコンテンツの記事以外の入力から一次エンティティを抽出することができる。例えば、任意のテキストファイル、ユーザ選択の組、ユーザの検索履歴、ユーザのブラウジング履歴などから一次エンティティを選択することができる。その後、あらゆるコンテンツとともに、さらには単独でユーザに補足を表示することができる。
6.0.実装機構−ハードウェアの概要
1つの実施形態によれば、本明細書で説明する技術が、1又はそれ以上の専用コンピュータ装置により実施される。この専用コンピュータ装置は、これらの技術を実行するためのハードウェア組み込み型とすることもでき、或いはこれらの技術を実行するように永続的にプログラムされた1又はそれ以上の特定用途向け集積回路(ASIC)又はフィールドプログラマブルゲートアレイ(FPGA)などのデジタル電子装置を含むこともでき、或いはファームウェア、メモリ、その他の記憶装置、又はこれらの組み合わせに含まれるプログラム命令に従ってこれらの技術を実行するようにプログラムされた1又はそれ以上の汎用ハードウェアプロセッサを含むこともできる。このような専用コンピュータ装置は、カスタムハードワイヤードロジック、ASIC又はFPGAを、これらの技術を実現するためのカスタムプログラミングと組み合わせることもできる。この専用コンピュータ装置は、デスクトップコンピュータシステム、ポータブルコンピュータシステム、ハンドヘルド装置、ネットワーク装置、又はこれらの技術を実施するためのハードワイヤードロジック及び/又はプログラムロジックを組み込んだ他のいずれの装置であってもよい。
例えば、図9は、本発明の実施形態を実施できるコンピュータシステム900を示すブロック図である。コンピュータシステム900は、情報を通信するためのバス902又はその他の通信機構、及びバス902に結合された、情報を処理するためのハードウェアプロセッサ904を含む。ハードウェアプロセッサ904は、例えば汎用マイクロプロセッサであってもよい。
コンピュータシステム900は、バス902に結合された、情報及びプロセッサ904により実行される命令を記憶するためのランダムアクセスメモリ(RAM)又はその他の動的記憶装置などのメインメモリ906も含む。メインメモリ906は、プロセッサ904により実行される命令の実行中に一時的変数又はその他の中間情報を記憶するために使用することもできる。このような命令は、プロセッサ904がアクセス可能な非一時的記憶媒体に記憶された場合、コンピュータシステム900を、命令内で指示される動作を実行するようにカスタマイズされた専用機械の状態にする。
コンピュータシステム900は、バス902に結合された、静的情報及びプロセッサ904のための命令を記憶する読み出し専用メモリ(ROM)908又はその他の静的記憶装置をさらに含む。情報及び命令を記憶するための磁気ディスク又は光学ディスクなどの記憶装置910も提供され、バス902に結合される。
コンピュータシステム900は、バス902を介して、コンピュータユーザに情報を表示するためのブラウン管(CRT)などのディスプレイ912に結合することができる。バス902には、プロセッサ904に情報及びコマンド選択を通信するための英数字キー及びその他のキーを含む入力装置914も結合される。別の種類のユーザ入力装置には、プロセッサ904に方向情報及びコマンド選択を通信してディスプレイ912上のカーソルの動きを制御するためのマウス、トラックボール又はカーソル方向キーなどのカーソル制御916がある。通常、この入力装置は、第1の軸(例えば、x)と第2の軸(例えば、y)からなる2つの軸内の2つの自由度を有し、装置が平面上の位置を指定できるようにする。
コンピュータシステム900は、カスタマイズされたハードワイヤードロジック、1又はそれ以上のASIC又はFPGA、ファームウェア、及び/又はコンピュータシステムと組み合わせてコンピュータシステム900を専用機械にする、又はそのようにプログラムするプログラム論理を使用して、本明細書で説明した技術を実施することができる。1つの実施形態によれば、プロセッサ904が、メインメモリ906に含まれる1又はそれ以上の命令の1又はそれ以上のシーケンスを実行することに応答して、本明細書の技術がコンピュータシステム900により実施される。このような命令は、記憶装置910などの別の記憶媒体からメインメモリ906に読み込むことができる。メインメモリ906に含まれる命令シーケンスを実行することにより、本明細書で説明した処理ステップをプロセッサ904が実行するようになる。代替の実施形態では、ソフトウェア命令の代わりに又はこれと組み合わせてハードワイヤード回路を使用することができる。
本明細書で使用する「記憶媒体」という用語は、データ及び/又は機械を特定の方法で動作させる命令を記憶するあらゆる非一時的媒体を意味する。このような記憶媒体は、不揮発性媒体及び/又は揮発性媒体を含むことができる。不揮発性媒体は、例えば、記憶装置910などの光学又は磁気ディスクを含む。揮発性媒体は、メインメモリ906などの動的メモリを含む。一般的な記憶媒体としては、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、固体ドライブ、磁気テープ、又はその他のあらゆる磁気データ記憶媒体、CD−ROM、その他のあらゆる光学データ記憶媒体、穴のパターンを有するあらゆる物理媒体、RAM、PROM、及びEPROM、FLASH−EPROM、NVRAM、その他のあらゆるメモリチップ又はカートリッジが挙げられる。
記憶媒体は、送信媒体とは異なるが、これとともに使用することもできる。送信媒体は、記憶媒体間の情報の転送に関与する。例えば、送信媒体として、バス902を含む配線を含む、同軸ケーブル、銅線及び光ファイバが挙げられる。送信媒体は、電波及び赤外線データ通信中に生成されるような音波又は光波の形をとることもできる。
実行のためにプロセッサ904に1又はそれ以上の命令の1又はそれ以上のシーケンスを伝えることには、様々な形の媒体が関与することができる。例えば、最初に遠隔コンピュータの磁気ディスク又は固体ドライブ上で命令を伝えることができる。遠隔コンピュータは、その動的メモリに命令をロードし、モデムを使用した電話回線を介してこの命令を送信することができる。コンピュータシステム900のローカルなモデムが、電話回線上でデータを受信し、赤外線送信機を使用してデータを赤外線信号に変換することができる。この赤外線信号内で運ばれたデータを赤外線検出器が受信し、このデータを適当な回路によってバス902上に配置することができる。バス902は、このデータをメインメモリ906に運び、ここからプロセッサ904が命令を取り出して実行する。任意に、メインメモリ906が受け取った命令は、プロセッサ904による実行前又は実行後のいずれかに記憶装置910に記憶することができる。
コンピュータシステム900は、バス902に結合された通信インターフェイス918も含む。通信インターフェイス918は、ローカルネットワーク922に接続されたネットワークリンク920に結合して双方向データ通信を提供する。例えば、通信インターフェイス918は、総合デジタル通信網(ISDN)カード、ケーブルモデム、衛星モデム、又は対応する種類の電話回線へのデータ通信接続を提供するモデムとすることができる。別の例として、通信インターフェイス918を、互換性のあるLANにデータ通信接続を提供するためのローカルエリアネットワーク(LAN)カードとすることもできる。無線リンクを実現することもできる。あらゆるこのような実装において、通信インターフェイス918は、様々な種類の情報を表すデジタルデータストリームを運ぶ電気、電磁又は光学信号を送信及び受信する。
通常、ネットワークリンク920は、1又はそれ以上のネットワークを介して他のデータ装置にデータ通信を提供する。例えば、ネットワークリンク920は、ローカルネットワーク922を介したホストコンピュータ924への、又はインターネットサービスプロバイダ(ISP)926によって動作するデータ機器への接続を提供することができる。さらに、ISP926は、今では一般的に「インターネット」928と呼ばれるワールドワイドパケットデータ通信ネットワークを介してデータ通信サービスを提供する。ローカルネットワーク922及びインターネット928は、いずれもデジタルデータストリームを運ぶ電気、電磁又は光学信号を使用する。コンピュータシステム900との間でデジタルデータを運ぶ、様々なネットワークを介した信号及びネットワークリンク920上の通信インターフェイス918を介した信号は、例示的な送信媒体の形である。
コンピュータシステム900は、(単複の)ネットワーク、ネットワークリンク920及び通信インターフェイス918を介してメッセージを送信し、プログラムコードを含むデータを受信することができる。インターネットの例では、サーバ930が、インターネット928、ISP926、ローカルネットワーク922及び通信インターフェイス918を介して、アプリケーションプログラムのための要求されたコードを送信することができる。
プロセッサ904は、この受け取ったコードを受け取り時に実行することもでき、及び/又は後で実行できるように記憶装置910又はその他の不揮発性記憶装置に記憶することもできる。
7.0.拡張及び代替例
上述した明細書では、実施構成によって異なり得る数多くの特定の詳細に関連して本発明の実施形態を説明した。従って、本発明が何であるか、及び出願人が何を発明として意図しているかを示す唯一かつ排他的なものは、本出願から生じる請求項の組であり、このような請求項が生じる特定の形にはあらゆる今後の補正が含まれる。本明細書に明確に示す、このような請求項に含まれる用語のあらゆる定義は、請求項で使用される用語の意味を規定するものとする。従って、請求項に明確に記載していない限定事項、要素、特性、特徴、利点又は属性により、決してこのような請求項を限定すべきではない。従って、明細書及び図面については、限定的な意味ではなく例示的な意味でとらえるべきである。
100 ディスプレイ
110 コンテンツの記事
112 テキスト
114 画像
120 補足
129 ナビゲーションバー
131 一次エンティティ
132 一次エンティティ
133 関連エンティティ
134 関連エンティティ
135 一次エンティティ
143 区分
151 小区分
152 小区分
153 小区分
154 小区分

Claims (14)

  1. 記事から構成エンティティの組を抽出するステップと、
    前記構成エンティティの組から、前記記事を最も良く反映する一次エンティティの組を選択するステップと、
    前記一次エンティティの組に基づいて、関連エンティティの組を選択するステップと、
    前記一次エンティティの組及び前記関連エンティティの組に基づいて、候補エンティティの組を形成するステップと、
    前記候補エンティティの組をランク付けするステップと、
    前記候補エンティティの組のランク付けに基づいて、前記候補エンティティの組から該候補エンティティの組よりも小さい最終的なエンティティの組を選択するステップと、
    前記最終的なエンティティの組の各エンティティの検索結果を含む、前記記事の補足を生成するステップと、
    を含む方法であって、該方法が1又はそれ以上のコンピュータ装置により実行される、
    ことを特徴とする方法。
  2. 前記補足が、前記最終的なエンティティの組の各エンティティをさらに含む、
    ことを特徴とする請求項1に記載の方法。
  3. 前記補足が、1回目に生成される第1の補足であり、
    前記候補エンティティの組をランク付けするステップ、前記関連エンティティの組を選択するステップ、又は前記一次エンティティの組を選択するステップの1又はそれ以上が、特徴の組に少なくとも部分的に基づき、
    前記方法が、請求項1のステップを2回目に実行して第2の補足を生成するステップをさらに含み、
    前記第2の補足が、時間に依存して前記特徴の組の少なくとも1つの特徴に変化したことを受けて前記第1の補足とは異なる、
    ことを特徴とする請求項1又は請求項2に記載の方法。
  4. 前記候補エンティティの組をランク付けするステップ、前記関連エンティティの組を選択するステップ、又は前記一次エンティティの組を選択するステップの1又はそれ以上が、ユーザ固有のデータに少なくとも部分的に基づき、前記ユーザ固有のデータが、前記ユーザの検索履歴又は前記ユーザのブラウジング履歴の少なくとも一方を含む、
    ことを特徴とする請求項1から請求項3のいずれか1項に記載の方法。
  5. クライアントが、前記記事に関連してユーザに対して前記補足を表示するようにするステップをさらに含む、
    ことを特徴とする請求項1から請求項4のいずれか1項に記載の方法。
  6. クライアントが、前記記事及び前記補足を含む構造化文書内に、ユーザに対して前記補足をインラインで表示するようにするステップをさらに含む、
    ことを特徴とする請求項1から請求項5のいずれか1項に記載の方法。
  7. 前記構成エンティティの組を抽出するステップが、辞書に基づく検索及び文法に基づく認識アルゴリズムの両方を使用してエンティティを抽出するステップを含み、
    前記一次エンティティの組を選択するステップが、前記記事内に前記構成エンティティが出現する頻度に少なくとも基づいて前記構成エンティティの組をランク付けするステップを含み、
    前記関連エンティティの組を選択するステップが、
    前記一次エンティティの組の各エンティティに関して、検索クエリログのリポジトリ、人間が入力した関係データのリポジトリ、及び記事のコーパスのうちの1又はそれ以上におけるエントリ内の同時出現する関連エンティティを検索するステップと、
    前記一次エンティティの組の各エンティティに関して、前記検索ステップと、同時出現の頻度に基づくランク付け処理とに少なくとも基づいて1又はそれ以上の関連エンティティを選択するステップと、
    を含み、
    前記最終的なエンティティの組を選択するステップが、前記候補エンティティの組の各エンティティに適用されて前記最終的なエンティティの組の各エンティティの検索結果が所定の基準を満たすことを判定するランク付け関数に少なくとも基づき、前記所定の基準が、前記検索結果の品質の尺度、及び前記検索結果の特定の検索バーティカルに関連するサブセットにおけるヒット数のうちの少なくとも一方を含む、
    ことを特徴とする請求項1から請求項6のいずれか1項に記載の方法。
  8. 前記補足が、前記最終的なエンティティの組の各エンティティに関して横串検索結果の組を含み、前記横串検索結果の組の各横串検索結果が、少なくとも2つの異なる検索リポジトリに関連する少なくとも2つの検索結果の組を含む、
    ことを特徴とする請求項1から請求項7のいずれか1項に記載の方法。
  9. 少なくとも前記記事の補足を生成するステップが、前記補足に対する要求に応答して動的に行われ、前記要求が前記記事を示す、
    ことを特徴とする請求項1から請求項8のいずれか1項に記載の方法。
  10. 1又はそれ以上のコンピュータ装置による実行時に請求項1から請求項9に記載の方法のいずれか1つを実施させる命令を記憶する、
    ことを特徴とする1又はそれ以上の非一時的コンピュータ可読媒体。
  11. 請求項1から請求項9に記載の方法のいずれか1つを実施させるように構成された、
    ことを特徴とするコンピュータプログラム製品。
  12. 請求項1から請求項9に記載の方法のいずれか1つを実施するように構成された1又はそれ以上のプロセッサを備える、
    ことを特徴とする装置。
  13. 第1の1又はそれ以上のコンピュータ装置の組上で実行されるウェブサーバと、
    第2の1又はそれ以上のコンピュータ装置の組上で実行される補足サーバと、
    を備えたコンピュータシステムであって、
    前記ウェブサーバが、複数のクライアントにウェブページを提供し、
    前記ウェブサーバが、少なくともコンテンツの記事及び補足コンテンツを少なくとも第1のウェブページに埋め込み、
    前記ウェブサーバが、前記記事を示す少なくとも第1の要求を前記補足サーバに送信することによって部分的に前記補足コンテンツを生成し、
    前記補足サーバが、前記記事から一次エンティティを抽出するステップ、前記一次エンティティに基づいて関連エンティティを識別するステップ、前記一次エンティティ及び前記関連エンティティに基づいて最終的なエンティティの組を選択するステップ、及び前記最終的なエンティティの組の1又はそれ以上のエンティティの横串検索結果を生成するステップに少なくとも基づいて前記少なくとも第1の要求に応答し、
    前記補足コンテンツが、前記最終的なエンティティの組及び前記横串検索結果を含む、
    ことを特徴とするコンピュータシステム。
  14. 検索サーバを実行する1又はそれ以上のコンピュータ装置を備えたシステムであって、
    前記検索サーバが、
    コンテンツの記事を示す要求を受け取り、
    前記コンテンツの記事に基づいて、前記コンテンツの記事内に存在する複数のエンティティ、又は前記コンテンツの記事内のエンティティに関連する複数のエンティティを識別し、
    前記複数のエンティティの各エンティティに関し、該エンティティを複数の検索リポジトリ内で検索することによって横串検索結果を取得し、
    前記検索結果に基づいて、前記複数のエンティティと、前記複数のエンティティの各エンティティの横串検索結果とを含む前記記事の補足を生成し、
    前記補足によって前記要求に応答する、
    ことを特徴とするシステム。
JP2013518385A 2010-06-28 2011-04-25 無限ブラウズ Active JP5608286B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/825,304 2010-06-28
US12/825,304 US8600979B2 (en) 2010-06-28 2010-06-28 Infinite browse
PCT/US2011/033797 WO2012003034A1 (en) 2010-06-28 2011-04-25 Infinite browse

Publications (2)

Publication Number Publication Date
JP2013534673A true JP2013534673A (ja) 2013-09-05
JP5608286B2 JP5608286B2 (ja) 2014-10-15

Family

ID=45353495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013518385A Active JP5608286B2 (ja) 2010-06-28 2011-04-25 無限ブラウズ

Country Status (7)

Country Link
US (2) US8600979B2 (ja)
EP (1) EP2586008A4 (ja)
JP (1) JP5608286B2 (ja)
KR (1) KR101506380B1 (ja)
CN (1) CN102906744B (ja)
TW (2) TWI461939B (ja)
WO (1) WO2012003034A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015204103A (ja) * 2014-04-11 2015-11-16 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 対話型の検索及び推奨方法並びにその装置
JP2016136300A (ja) * 2015-01-23 2016-07-28 ヤフー株式会社 情報処理装置及び方法
JP2018147169A (ja) * 2017-03-03 2018-09-20 富士通株式会社 特徴語分類プログラム、特徴語分類方法および情報処理装置
JP6490863B1 (ja) * 2018-09-07 2019-03-27 一般社団法人ウェブ新聞社 サーバ装置、Webサーバ装置、サーバシステム、サーバ装置用プログラム、Webサーバ装置用プログラムおよびWebサーバ装置の連携方法
JP2019522852A (ja) * 2016-06-22 2019-08-15 グーグル エルエルシー 文脈情報を提供するためのシステムおよび方法
JP2020135900A (ja) * 2019-02-21 2020-08-31 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド クエリ処理方法、クエリ処理装置及びコンピュータ読み取り可能な媒体
US11030206B2 (en) 2017-05-15 2021-06-08 Fujitsu Limited Display method and display apparatus
JP2021140246A (ja) * 2020-03-02 2021-09-16 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2021149580A (ja) * 2020-03-19 2021-09-27 ヤフー株式会社 情報処理装置、情報処理方法、及びプログラム

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930438B (zh) 2009-06-19 2016-08-31 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
US9875306B2 (en) * 2010-08-30 2018-01-23 Google Inc. Navigation through a collection of electronic documents
US8615510B2 (en) * 2010-09-01 2013-12-24 Yahoo! Inc. Quick applications for search
WO2012034069A1 (en) * 2010-09-10 2012-03-15 Veveo, Inc. Method of and system for conducting personalized federated search and presentation of results therefrom
US20130145276A1 (en) * 2011-12-01 2013-06-06 Nokia Corporation Methods and apparatus for enabling context-aware and personalized web content browsing experience
US9589303B2 (en) 2012-01-09 2017-03-07 Google Inc. Selective presentation of content types and sources in search
CN104428767B (zh) * 2012-02-22 2018-02-06 谷歌公司 用于识别相关实体的方法、系统和装置
US9424353B2 (en) 2012-02-22 2016-08-23 Google Inc. Related entities
US20130254176A1 (en) * 2012-03-21 2013-09-26 Apple Inc. Systems and Methods for Generating Search Queries
CN103365839B (zh) * 2012-03-26 2017-12-12 深圳市世纪光速信息技术有限公司 一种搜索引擎的推荐搜索方法和装置
WO2013153489A2 (en) * 2012-04-09 2013-10-17 Thekkethala Pyloth Vincent Query based search engine for objects with binary characteristics
US20130298000A1 (en) * 2012-05-02 2013-11-07 Scott ZUCCARINO Socially relevant content in a news domain
US20140019126A1 (en) * 2012-07-13 2014-01-16 International Business Machines Corporation Speech-to-text recognition of non-dictionary words using location data
US20140071157A1 (en) * 2012-09-07 2014-03-13 Htc Corporation Content delivery systems with prioritized content and related methods
WO2014110048A1 (en) * 2013-01-09 2014-07-17 Amazon Technologies, Inc. Browser interface for accessing supple-mental content associated with content pages
US20140195890A1 (en) * 2013-01-09 2014-07-10 Amazon Technologies, Inc. Browser interface for accessing supplemental content associated with content pages
US9405775B1 (en) * 2013-03-15 2016-08-02 Google Inc. Ranking videos based on experimental data
US9262510B2 (en) 2013-05-10 2016-02-16 International Business Machines Corporation Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
US9646062B2 (en) * 2013-06-10 2017-05-09 Microsoft Technology Licensing, Llc News results through query expansion
US9715548B2 (en) 2013-08-02 2017-07-25 Google Inc. Surfacing user-specific data records in search
US9117280B2 (en) * 2013-08-29 2015-08-25 Microsoft Technology Licensing, Llc Determining images of article for extraction
US9251136B2 (en) 2013-10-16 2016-02-02 International Business Machines Corporation Document tagging and retrieval using entity specifiers
US9646032B2 (en) 2013-10-24 2017-05-09 Microsoft Technology Licensing, Llc Temporal user engagement features
US9235638B2 (en) 2013-11-12 2016-01-12 International Business Machines Corporation Document retrieval using internal dictionary-hierarchies to adjust per-subject match results
US9727545B1 (en) * 2013-12-04 2017-08-08 Google Inc. Selecting textual representations for entity attribute values
US20150178266A1 (en) 2013-12-20 2015-06-25 Google Inc. Entity-based summarization for electronic books
US9444797B2 (en) * 2014-07-10 2016-09-13 Empire Technology Development Llc Protection of private data
WO2016018455A1 (en) 2014-07-28 2016-02-04 Iris.Tv, Inc. Online asset recommendation system
US9965459B2 (en) 2014-08-07 2018-05-08 Accenture Global Services Limited Providing contextual information associated with a source document using information from external reference documents
CN104199885A (zh) * 2014-08-22 2014-12-10 广州三星通信技术研究有限公司 用于获取视频文件的关联内容的设备和方法
US9965474B2 (en) 2014-10-02 2018-05-08 Google Llc Dynamic summary generator
CN104268297A (zh) * 2014-10-28 2015-01-07 江苏惠居乐信息科技有限公司 一种基于新闻的大数据分析系统
US10509834B2 (en) 2015-06-05 2019-12-17 Apple Inc. Federated search results scoring
US10621189B2 (en) 2015-06-05 2020-04-14 Apple Inc. In-application history search
US10509833B2 (en) 2015-06-05 2019-12-17 Apple Inc. Proximity search scoring
US10592572B2 (en) 2015-06-05 2020-03-17 Apple Inc. Application view index and search
US10755032B2 (en) 2015-06-05 2020-08-25 Apple Inc. Indexing web pages with deep links
US10146775B2 (en) * 2015-06-07 2018-12-04 Apple Inc. Apparatus, system and method for string disambiguation and entity ranking
US10162864B2 (en) * 2015-06-07 2018-12-25 Apple Inc. Reader application system utilizing article scoring and clustering
US10051108B2 (en) * 2016-07-21 2018-08-14 Google Llc Contextual information for a notification
CN106897346A (zh) * 2016-08-04 2017-06-27 阿里巴巴集团控股有限公司 数据处理的方法及装置
KR20200033790A (ko) * 2016-09-28 2020-03-30 버튼 인크. 웹 페이지 컨텐츠에 기초한 컨텍스트 액션을 제공하는 모바일 웹 브라우저
CN106844322A (zh) * 2017-01-22 2017-06-13 百度在线网络技术(北京)有限公司 智能文章生成方法和装置
CN107193997A (zh) * 2017-06-13 2017-09-22 刘建钦 一种户外广告点位展示及广告方案制定方法
US11327984B2 (en) * 2017-10-31 2022-05-10 Yahoo Assets Llc Computerized systems and methods for query expansion using displayed objects
CN108376147B (zh) * 2018-01-24 2021-09-28 北京一览科技有限公司 一种用于获得视频的评价结果信息的方法和装置
US11030634B2 (en) 2018-01-30 2021-06-08 Walmart Apollo, Llc Personalized mechanisms to resolve explore-exploit dilemma with dynamically shared learnings
US11055742B2 (en) 2018-01-30 2021-07-06 Walmart Apollo, Llc Automated mechanisms to resolve explore-exploit dilemma with adaptive revival opportunities
US11042895B2 (en) 2018-01-30 2021-06-22 Walmart Apollo, Llc Automatic resolution of the explore-exploit decision in omnichannel settings
US11232145B2 (en) * 2018-03-20 2022-01-25 Microsoft Technology Licensing, Llc Content corpora for electronic documents
US10671267B2 (en) * 2018-05-07 2020-06-02 Google Llc Systems and methods for presentation of content items relating to a topic
RU2739554C1 (ru) * 2018-12-13 2020-12-25 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для формирования карточки объекта
GB201904167D0 (en) * 2019-03-26 2019-05-08 Benevolentai Tech Limited Name entity recognition with deep learning
EP3739491B1 (en) 2019-05-17 2022-07-06 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
US11704600B2 (en) * 2019-06-27 2023-07-18 Microsoft Technology Licensing, Llc Multistage feed ranking system with methodology providing scalable multi-objective model approximation
US11194819B2 (en) 2019-06-27 2021-12-07 Microsoft Technology Licensing, Llc Multistage feed ranking system with methodology providing scoring model optimization for scaling
US11743353B1 (en) * 2019-12-18 2023-08-29 Baby List, Inc. System, method, and computer program for providing a content feed to a user related to a registry and a registry event having an event timeline
CN114077713A (zh) * 2020-08-11 2022-02-22 华为技术有限公司 内容推荐方法、电子设备和服务器
US20220309055A1 (en) * 2021-03-23 2022-09-29 Microsoft Technology Licensing, Llc Intelligent assistant for a browser using content and structured data
US20230177058A1 (en) * 2021-12-04 2023-06-08 International Business Machines Corporation Ranking entity search results based on information density
CN114328765B (zh) * 2022-03-04 2022-05-31 四川大学 新闻传播预测方法及装置
CN115048904B (zh) * 2022-08-11 2022-11-29 北京金堤科技有限公司 一种实体展示方法、装置、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328221A (ja) * 1998-05-14 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> データ検索方法、その装置および記録媒体
JP2006079454A (ja) * 2004-09-10 2006-03-23 Fujitsu Ltd 検索キーワード分析方法、検索キーワード分析プログラムおよび検索キーワード分析装置
JP2007122513A (ja) * 2005-10-28 2007-05-17 Dainippon Printing Co Ltd コンテンツ検索方法、及び、コンテンツ検索サーバ
JP2008102174A (ja) * 2006-10-17 2008-05-01 Yafoo Japan Corp キーワードと条件に基づく広告配信方法
WO2008053516A1 (fr) * 2006-10-30 2008-05-08 Cirius Technologies, Inc. Procédé, système et programme de fourniture d'informations publicitaires et base de données
JP2009031931A (ja) * 2007-07-25 2009-02-12 Univ Waseda 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体
JP2010066870A (ja) * 2008-09-09 2010-03-25 Toshiba Corp 情報推薦装置および情報推薦方法

Family Cites Families (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5446891A (en) 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US6202058B1 (en) 1994-04-25 2001-03-13 Apple Computer, Inc. System for ranking the relevance of information objects accessed by computer users
US6029195A (en) 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
EP0718784B1 (en) 1994-12-20 2003-08-27 Sun Microsystems, Inc. Method and system for the retrieval of personalized information
US6092049A (en) 1995-06-30 2000-07-18 Microsoft Corporation Method and apparatus for efficiently recommending items using automated collaborative filtering and feature-guided automated collaborative filtering
US5734887A (en) 1995-09-29 1998-03-31 International Business Machines Corporation Method and apparatus for logical data access to a physical relational database
AU1566597A (en) 1995-12-27 1997-08-11 Gary B. Robinson Automated collaborative filtering in world wide web advertising
US5727129A (en) 1996-06-04 1998-03-10 International Business Machines Corporation Network system for profiling and actively facilitating user activities
US5890152A (en) 1996-09-09 1999-03-30 Seymour Alvin Rapaport Personal feedback browser for obtaining media files
US6128663A (en) 1997-02-11 2000-10-03 Invention Depot, Inc. Method and apparatus for customization of information content provided to a requestor over a network using demographic information yet the user remains anonymous to the server
US5895470A (en) 1997-04-09 1999-04-20 Xerox Corporation System for categorizing documents in a linked collection of documents
US5937397A (en) 1997-04-10 1999-08-10 International Business Machines Corporation Social learning inferencing engine for intelligent agent environment
US5937422A (en) * 1997-04-15 1999-08-10 The United States Of America As Represented By The National Security Agency Automatically generating a topic description for text and searching and sorting text by topic using the same
US6049776A (en) 1997-09-06 2000-04-11 Unisys Corporation Human resource management system for staffing projects
US6134532A (en) * 1997-11-14 2000-10-17 Aptex Software, Inc. System and method for optimal adaptive matching of users to most relevant entity and information in real-time
US6249740B1 (en) 1998-01-21 2001-06-19 Kabushikikaisha Equos Research Communications navigation system, and navigation base apparatus and vehicle navigation apparatus both used in the navigation system
US6018738A (en) 1998-01-22 2000-01-25 Microsft Corporation Methods and apparatus for matching entities and for predicting an attribute of an entity based on an attribute frequency value
US7050992B1 (en) 1998-03-03 2006-05-23 Amazon.Com, Inc. Identifying items relevant to a current query based on items accessed in connection with similar queries
WO1999045487A1 (en) 1998-03-03 1999-09-10 Amazon.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US6349299B1 (en) 1998-12-24 2002-02-19 International Business Machines Corporation System and method for storing electronic contact information into an electronic address book
US6598054B2 (en) 1999-01-26 2003-07-22 Xerox Corporation System and method for clustering data objects in a collection
US6941321B2 (en) 1999-01-26 2005-09-06 Xerox Corporation System and method for identifying similarities among objects in a collection
EP1200902A2 (en) 1999-07-16 2002-05-02 Agentarts, Inc. Methods and system for generating automated alternative content recommendations
CN1387653A (zh) 1999-11-02 2002-12-25 E-卡拉里蒂公司 用于高效发送和接收信息的语言分类系统
US6931397B1 (en) 2000-02-11 2005-08-16 International Business Machines Corporation System and method for automatic generation of dynamic search abstracts contain metadata by crawler
US6564209B1 (en) 2000-03-08 2003-05-13 Accenture Llp Knowledge management tool for providing abstracts of information
US20020062247A1 (en) 2000-08-29 2002-05-23 Allen Bradley P. Selecting web site content to be displayed to a web site visitor based upon a probability distribution
US20020103798A1 (en) 2001-02-01 2002-08-01 Abrol Mani S. Adaptive document ranking method based on user behavior
US6728706B2 (en) 2001-03-23 2004-04-27 International Business Machines Corporation Searching products catalogs
US20050193335A1 (en) 2001-06-22 2005-09-01 International Business Machines Corporation Method and system for personalized content conditioning
US20030040850A1 (en) 2001-08-07 2003-02-27 Amir Najmi Intelligent adaptive optimization of display navigation and data sharing
US7398201B2 (en) 2001-08-14 2008-07-08 Evri Inc. Method and system for enhanced data searching
KR100438857B1 (ko) 2001-09-26 2004-07-05 엘지전자 주식회사 사용자 선호도 기반 멀티미디어 검색 시스템
US7162522B2 (en) 2001-11-02 2007-01-09 Xerox Corporation User profile classification by web usage analysis
US7203909B1 (en) 2002-04-04 2007-04-10 Microsoft Corporation System and methods for constructing personalized context-sensitive portal pages or views by analyzing patterns of users' information access activities
EP1395056A1 (en) 2002-08-30 2004-03-03 Sony International (Europe) GmbH Methods to create a user profile and to specify a suggestion for a next selection of the user
US6947930B2 (en) 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
US7685296B2 (en) * 2003-09-25 2010-03-23 Microsoft Corporation Systems and methods for client-based web crawling
US7200638B2 (en) 2003-10-14 2007-04-03 International Business Machines Corporation System and method for automatic population of instant messenger lists
US20050108024A1 (en) 2003-11-13 2005-05-19 Fawcett John Jr. Systems and methods for retrieving data
CN100495392C (zh) * 2003-12-29 2009-06-03 西安迪戈科技有限责任公司 一种智能搜索方法
US20050216823A1 (en) * 2003-12-30 2005-09-29 Microsoft Corporation Assigning textual ads based on article history
US7483891B2 (en) * 2004-01-09 2009-01-27 Yahoo, Inc. Content presentation and management system associating base content and relevant additional content
EP2487599A1 (en) * 2004-05-04 2012-08-15 Boston Consulting Group, Inc. Method and apparatus for selecting, analyzing and visualizing related database records as a network
US8065383B2 (en) 2004-05-17 2011-11-22 Simplefeed, Inc. Customizable and measurable information feeds for personalized communication
US7958115B2 (en) 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
US8972856B2 (en) 2004-07-29 2015-03-03 Yahoo! Inc. Document modification by a client-side application
US7962465B2 (en) 2006-10-19 2011-06-14 Yahoo! Inc. Contextual syndication platform
US7856441B1 (en) 2005-01-10 2010-12-21 Yahoo! Inc. Search systems and methods using enhanced contextual queries
US7603349B1 (en) 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
JP2008521315A (ja) 2004-11-18 2008-06-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザープロファイルを更新するための装置および方法
US20060149710A1 (en) 2004-12-30 2006-07-06 Ross Koningstein Associating features with entities, such as categories of web page documents, and/or weighting such features
US7421426B2 (en) 2005-01-11 2008-09-02 International Business Machines Corporation Systems, methods, and media for utilizing electronic document usage information with search engines
US7584177B2 (en) * 2005-06-29 2009-09-01 Google Inc. Determination of a desired repository
US20070073651A1 (en) * 2005-09-23 2007-03-29 Tomasz Imielinski System and method for responding to a user query
US7835998B2 (en) 2006-03-06 2010-11-16 Veveo, Inc. Methods and systems for selecting and presenting content on a first system based on user preferences learned on a second system
US7904448B2 (en) 2006-03-29 2011-03-08 Yahoo! Inc. Incremental update of long-term and short-term user profile scores in a behavioral targeting system
US20070260597A1 (en) 2006-05-02 2007-11-08 Mark Cramer Dynamic search engine results employing user behavior
US20070266025A1 (en) 2006-05-12 2007-11-15 Microsoft Corporation Implicit tokenized result ranking
CN100530183C (zh) 2006-05-19 2009-08-19 华为技术有限公司 一种收集用户数据的系统及方法
TWI337712B (en) 2006-10-30 2011-02-21 Inst Information Industry Systems and methods for measuring behavior characteristics, and machine readable medium thereof
US7555477B2 (en) * 2006-12-05 2009-06-30 Yahoo! Inc. Paid content based on visually illustrative concepts
KR100916717B1 (ko) * 2006-12-11 2009-09-09 강민수 플레이 되고 있는 동영상 내용 맞춤형 광고 콘텐츠 제공방법 및 그 시스템
US8423565B2 (en) * 2006-12-21 2013-04-16 Digital Doors, Inc. Information life cycle search engine and method
KR100757951B1 (ko) 2007-01-02 2007-09-11 김수현 웹페이지의 형태소 분석을 통한 검색 방법
CN101004762A (zh) * 2007-01-10 2007-07-25 张百川 一种动态多维互联网网页系统
US20080201206A1 (en) 2007-02-01 2008-08-21 7 Billion People, Inc. Use of behavioral portraits in the conduct of E-commerce
US7930286B2 (en) * 2007-02-16 2011-04-19 Yahoo! Inc. Federated searches implemented across multiple search engines
CA2679094A1 (en) 2007-02-23 2008-08-28 1698413 Ontario Inc. System and method for delivering content and advertisements
US20080270151A1 (en) 2007-04-26 2008-10-30 Bd Metrics Method and system for developing an audience of buyers and obtaining their behavioral preferences to promote commerce on a communication network
US8301623B2 (en) 2007-05-22 2012-10-30 Amazon Technologies, Inc. Probabilistic recommendation system
KR20090003510A (ko) * 2007-06-14 2009-01-12 텔코웨어 주식회사 웹 페이지 링크정보 첨부 장치 및 그 방법
US20090037402A1 (en) 2007-07-31 2009-02-05 Rosie Jones System and method for predicting clickthrough rates and relevance
US20090083278A1 (en) 2007-09-26 2009-03-26 Yihong Zhao System and method for discovering and presenting social relationships between internet users and content
US7853558B2 (en) 2007-11-09 2010-12-14 Vibrant Media, Inc. Intelligent augmentation of media content
US20090171763A1 (en) 2007-12-31 2009-07-02 Yahoo! Inc. System and method for online advertising driven by predicting user interest
US7984004B2 (en) 2008-01-17 2011-07-19 Microsoft Corporation Query suggestion generation
US20090248514A1 (en) 2008-04-01 2009-10-01 Yahoo! Inc. System and method for detecting the sensitivity of web page content for serving advertisements in online advertising
US8051080B2 (en) 2008-04-16 2011-11-01 Yahoo! Inc. Contextual ranking of keywords using click data
US20090299945A1 (en) 2008-06-03 2009-12-03 Strands, Inc. Profile modeling for sharing individual user preferences
US8504558B2 (en) 2008-07-31 2013-08-06 Yahoo! Inc. Framework to evaluate content display policies
CN101359332A (zh) * 2008-09-02 2009-02-04 浙江大学 具有语义分类功能的可视化搜索界面的设计方法
US8635528B2 (en) * 2008-11-06 2014-01-21 Nexplore Technologies, Inc. System and method for dynamic search result formatting
US8244517B2 (en) 2008-11-07 2012-08-14 Yahoo! Inc. Enhanced matching through explore/exploit schemes
US8037067B1 (en) 2008-11-14 2011-10-11 United Services Automobile Association (Usaa) Systems and methods for tracking user activity at website
US8316020B1 (en) 2008-12-09 2012-11-20 Amdocs Software Systems Limited System, method, and computer program for creating a group profile based on user profile attributes and a rule
US8135739B2 (en) * 2008-12-29 2012-03-13 Microsoft Corporation Online relevance engine
CN101477557A (zh) * 2009-01-13 2009-07-08 苏州智讯科技有限公司 一种理解用户互联网浏览行为的媒体展现平台
US8301624B2 (en) 2009-03-31 2012-10-30 Yahoo! Inc. Determining user preference of items based on user ratings and user features
US8612435B2 (en) 2009-07-16 2013-12-17 Yahoo! Inc. Activity based users' interests modeling for determining content relevance

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328221A (ja) * 1998-05-14 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> データ検索方法、その装置および記録媒体
JP2006079454A (ja) * 2004-09-10 2006-03-23 Fujitsu Ltd 検索キーワード分析方法、検索キーワード分析プログラムおよび検索キーワード分析装置
JP2007122513A (ja) * 2005-10-28 2007-05-17 Dainippon Printing Co Ltd コンテンツ検索方法、及び、コンテンツ検索サーバ
JP2008102174A (ja) * 2006-10-17 2008-05-01 Yafoo Japan Corp キーワードと条件に基づく広告配信方法
WO2008053516A1 (fr) * 2006-10-30 2008-05-08 Cirius Technologies, Inc. Procédé, système et programme de fourniture d'informations publicitaires et base de données
JP2009031931A (ja) * 2007-07-25 2009-02-12 Univ Waseda 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体
JP2010066870A (ja) * 2008-09-09 2010-03-25 Toshiba Corp 情報推薦装置および情報推薦方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015204103A (ja) * 2014-04-11 2015-11-16 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 対話型の検索及び推奨方法並びにその装置
US10051030B2 (en) 2014-04-11 2018-08-14 Baidu Online Network Technology (Beijing) Co., Ltd. Interactive searching and recommanding method and apparatus
JP2016136300A (ja) * 2015-01-23 2016-07-28 ヤフー株式会社 情報処理装置及び方法
JP2019522852A (ja) * 2016-06-22 2019-08-15 グーグル エルエルシー 文脈情報を提供するためのシステムおよび方法
JP2018147169A (ja) * 2017-03-03 2018-09-20 富士通株式会社 特徴語分類プログラム、特徴語分類方法および情報処理装置
US11030206B2 (en) 2017-05-15 2021-06-08 Fujitsu Limited Display method and display apparatus
JP2020042410A (ja) * 2018-09-07 2020-03-19 一般社団法人ウェブ新聞社 サーバ装置、Webサーバ装置、サーバシステム、サーバ装置用プログラム、Webサーバ装置用プログラムおよびWebサーバ装置の連携方法
JP6490863B1 (ja) * 2018-09-07 2019-03-27 一般社団法人ウェブ新聞社 サーバ装置、Webサーバ装置、サーバシステム、サーバ装置用プログラム、Webサーバ装置用プログラムおよびWebサーバ装置の連携方法
JP2020135900A (ja) * 2019-02-21 2020-08-31 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド クエリ処理方法、クエリ処理装置及びコンピュータ読み取り可能な媒体
US11397788B2 (en) 2019-02-21 2022-07-26 Beijing Baidu Netcom Science And Technology Co., Ltd. Query processing method and device, and computer readable medium
JP2021140246A (ja) * 2020-03-02 2021-09-16 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP7354019B2 (ja) 2020-03-02 2023-10-02 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2021149580A (ja) * 2020-03-19 2021-09-27 ヤフー株式会社 情報処理装置、情報処理方法、及びプログラム
JP7323484B2 (ja) 2020-03-19 2023-08-08 ヤフー株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
US8600979B2 (en) 2013-12-03
EP2586008A4 (en) 2016-04-27
US20110320437A1 (en) 2011-12-29
WO2012003034A1 (en) 2012-01-05
TWI529549B (zh) 2016-04-11
KR20130016339A (ko) 2013-02-14
EP2586008A1 (en) 2013-05-01
CN102906744B (zh) 2016-08-24
TWI461939B (zh) 2014-11-21
KR101506380B1 (ko) 2015-03-26
US20140143243A1 (en) 2014-05-22
US9355185B2 (en) 2016-05-31
CN102906744A (zh) 2013-01-30
JP5608286B2 (ja) 2014-10-15
TW201202980A (en) 2012-01-16
TW201502824A (zh) 2015-01-16

Similar Documents

Publication Publication Date Title
JP5608286B2 (ja) 無限ブラウズ
US9361385B2 (en) Generating content for topics based on user demand
US9390144B2 (en) Objective and subjective ranking of comments
JP5571091B2 (ja) サーチ結果の提供
AU2010345063C1 (en) Information search system with real-time feedback
TWI424369B (zh) 用於決定內容相關性的活動型使用者興趣模型化
KR101475552B1 (ko) 사용자에게 컨텐츠를 제공하기 위한 방법 및 서버
US20170345053A1 (en) Slideshows in Search
CN101452453A (zh) 一种输入法网址导航的方法和一种输入法系统
US20160210300A1 (en) System and method for completing a user query and for providing a query response
KR20090006464A (ko) 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체
US20090063959A1 (en) Document creation support system
JP5313295B2 (ja) 文書探索サービス提供方法及びシステム
KR20110094633A (ko) 개인화된 폴더를 이용한 검색 방법 및 시스템과 이를 위한 프로그램 기록매체

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140829

R150 Certificate of patent or registration of utility model

Ref document number: 5608286

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350