JP2011526008A - 複合検索用のシステムと方法 - Google Patents

複合検索用のシステムと方法 Download PDF

Info

Publication number
JP2011526008A
JP2011526008A JP2010550855A JP2010550855A JP2011526008A JP 2011526008 A JP2011526008 A JP 2011526008A JP 2010550855 A JP2010550855 A JP 2010550855A JP 2010550855 A JP2010550855 A JP 2010550855A JP 2011526008 A JP2011526008 A JP 2011526008A
Authority
JP
Japan
Prior art keywords
search
results
page
server
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010550855A
Other languages
English (en)
Other versions
JP5318125B2 (ja
Inventor
ガルヴィン,ブライアン
マコード,アラン
ボーイズ,ドナルド,アール.
Original Assignee
ミチェリ キャピタル リミテッド ライアビリティ カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ミチェリ キャピタル リミテッド ライアビリティ カンパニー filed Critical ミチェリ キャピタル リミテッド ライアビリティ カンパニー
Publication of JP2011526008A publication Critical patent/JP2011526008A/ja
Application granted granted Critical
Publication of JP5318125B2 publication Critical patent/JP5318125B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

検索サービスは、ネットワーク接続されたサーバと、第1のサーバと接続されたデータリポジトリと、データリポジトリに常駐し、第1のサーバで動作するソフトウェアと、を含む。サービスはソフトウェアを介して、対話型インタフェースをユーザに提示し、ユーザとの反復的な対話を介して検索の目的を特定し、検索の検索条件を作成し、ネットワークを介してアクセス可能な1つ又は複数の標準的な検索エンジンに検索条件を入力し、ユーザの代わりに検索の結果を収集する。

Description

発明の背景
1.発明の分野
本発明は、情報テクノロジーの幅広い分野、特に従来型の小売店で買い物をする顧客に情報を提供することに関し、その情報は販売用の製品及びサービスに関する。
2.関連技術の説明
かつてないほどのペースで情報が増殖する中で、情報テクノロジーにおいて最も大きなニーズがある領域の1つが、上記で簡単に記述したように、必要な情報を見つけ出す方法であり、これは重要な1つの側面において、インターネットネットワークのWebページ等の情報をユーザが見つけ出せるようにするための検索エンジン及び関係するシステムが扱う領域である。検索システム及び検索エンジンは、本発明の実施形態で特に重きを置く点である。
ほとんどの検索エンジンの目標は、ユーザがワールドワイドウェブ(WWW)で目的のデータを簡単に見つけ出す及び/又はアクセスできるようにすることである。関連性は常に非常に重要であり、おそらく情報を検索する当事者自身が判断するのが最良であろう。
よく知られている検索エンジンの主要なサブシステムは、Webクローラとして当技術分野で知られている、Webをクロールして情報を収集するためのシステムである。Webを定期的にクロールして、そこで提供されている情報を更新しなければ、検索エンジンはすぐに古く、不適切なものになってしまう。更に、Webクローリングサブシステムは、効率的であり、比較的大規模に動作する必要がある。理想的には、このような検索エンジンは、Web自体又はクロールするサイト(ページ)を中断(disrupt)させずに動作すべきである。必要な変更を検索エンジン事業者に通知する際にコンテンツの所有者に関与を求める等のページの更新をチェックするための方法、データをキャッシュに格納し、クロールプロセスを並列処理するための方法等々、この領域の多くの技術革新が求められている。一般的に、Webクロールの結果は、100億を超えるWebページに及び、その全て又は一部のコンテンツが検索エンジンによって収集及びアーカイブされ得る、Webコンテンツのデータベースである。
クローラサブシステムによって収集されたページは、当技術分野で周知のさまざまな方法で解析され、ページの識別子とそのページへのリンクからなるインデックスが作成される。このような検索インデックスは書籍の索引とほとんど同じ目的を果たし、検索条件として入力されたいずれか1つ又は複数の用語に対して、ページのリストがそれらのページへのリンクとともに返される。更に広く見れば、Web検索インデックスの目標は、ユーザが例えば「dramatic innovations(飛躍的な技術革新)」等の検索クエリを入力したときにページのリストを返すことである。検索語自体は含まないものの、検索クエリを入力した人のニーズに関連性があるであろうページを返すことが望ましい場合もあるが、一般的に、返されるページは、その用語が単に存在するページである。例えば、検索エンジンは「dramatic innovations(飛躍的な技術革新)」という検索クエリを受け、たとえその特定の用語自体は含まれないものの、ライト兄弟の飛行機の技術革新の歴史へのリンクを返し得る。関連性は非常に重要である。Webクローラは、検索の目的を達成する手段である。クローラが収集した情報から作成されるインデックスは、検索システムの核心要素の1つである。
しかしながら、ユーザがWebを検索するのに使用できるものでなければ、インデックスはほとんど役に立たない。このため、ユーザインタフェースが必要になる。このようなインタフェースでは、当該技術分野でブラウザとして周知のアプリケーションから通常操作し、ユーザが検索クエリを入力し、通常Enterを押す。クエリは、インターネットネットワークを介して、検索サービスをホストする事業者に送信され、その中のいくつかの主要な事業者はよく知られている。次いで検索エンジンは、現在のインデックス(Webクロールの進捗に合わせてインデックスは変化し得る)を使用して、検索クエリに合致するWebページのリストを作成する。この場合もやはり、その特定のユーザに最も関連性の高い結果がリストの先頭又はその近くに表示されるように提供することが主要な課題である。
関連性の必要性が既知であることは、ページランキングアルゴリズムを開発する上での非常に重要な要因になっている。ページランキングアルゴリズム(又はノードランキングアルゴリズム)は、検索結果の表示順序を決定するランキングサブシステムである。この機能の重要性は、特に関連性の高いページほど先頭近くに表示されるように意図されているランキングシステムがあることが明白であれば、検索者が埋もれている情報を深く掘り当てるのではなく、先頭にリストされているページを見ようとすることである。更に、関連性の決定が多くのユーザにより信頼できるとみなされた場合、上位にランクされた検索結果だけを見る傾向がより顕著となり、関連性のスコアの影響が非常に大きくなる。
本願出願時において当該技術分野で最も効果的なページランキングアルゴリズムの1つは、GoogleTM,IncorporatedのPageRankアルゴリズムである。PageRankアルゴリズムの有効性は、現行技術分野において、少なくとも一部は、構造グラフ及び行列計算に関係する。構造グラフは、グラフ理論の技術分野で周知のように、ページ間のリンケージの構造を「グラフ」の形で表現したものである。PageRankシステムは、追加や変形はあるものの、基本的な動作としては、ランク付けされるページへ他のページから向けられるリンクの数を合算して、このスコアをリンキングページについて同様に算出したスコアに基づいて重み付けすることで求めたスコアを、インデックス付きのページに与えることはよく知られている。つまり、ランク付けされるページにリンクするページが5つあり、この5つのページにリンクするページが他にない場合、このページのPageRankは、それぞれが上位にランキングされているリンキングページ(これらは、多くのページがリンクしているため、上位にランキングされる)によってもたらされる5つのインリンクを持つページの場合と比べ、はるかに低くなる。あるページのスコアがリンキングページのスコアによって決まり、リンキングページのスコアは更にそのリンキングページのスコアによって決まり、そのリンキングページのスコアは更にまたそのリンキングページのスコアによって決まる等、少なくともある既定の深度までこれが繰り返されるため、ページランキングの計算は比較的複雑な数学を伴うことは明白である。
この説明から、何故グラフが必要であるのかが明白になる。現在の当該技術分野では、こうしたリンクに基づく計算を行うために、Webページに接続するリンケージの構造を理解する必要がある。
多少抽象的な意味では、WWWは巨大な点(ポイント、又はノード)の配列であり、その1つ1つの点がインターネットネットワーク上に接続されたWebページを表しているものと思い浮かべてもよい。いずれかの一時点で既存のほぼ全てのページを表わすには、おそらく1010のポイントが必要になる。当然ながら、それぞれのページはコードの集まりで、通常HTML形式(又は、DHTML、Cascading Style Sheets等、有名な拡張子のもの)であり、このコードの集まりは、通常Webブラウザを使用してユーザのコンピュータを介しページによって示され得るページコンテンツを定義し、これにはテキスト、グラフィックス、可聴の音楽や音声、ビデオ等が含まれ得る。Webのほとんど全てのページのもう1つの構成要素は、別のページへの移動を開始するための、又はつい最近では時として何らかの目的により、別のページへの移行を必要とすることなく、ユーザのコンピュータへのコードとデータの転送を開始するための、少なくとも1つのリンクである。
図1は、上記で紹介したWWWの1ページ1点(one-dot-for-a-page)を図解した非常に簡単な図である。ページ101〜105のページを表現する点がたった5つだけしか示されていないが、説明の目的には十分である。現在の目的によるリンクは、マウスを合わせるとカーソルが通常手の形になるとともに、クリックするとアドレス(Universal resource locator:URL等)がアクティブになり、ユーザを別のWebページに移す、Webページの表示における有名なナビゲーション要素であると考えられ得る。表示のリンク領域は、アイコンやテキスト、又はアニメキャラクタであってもよい。
図1では、リンクは矢印で示す。ページ105にはページ101〜104すべてへのリンクがあり、そのどれもがページ105にリンクバックしないことに留意されたい。リンク101〜104はそれぞれ、別のいずれかのページへのリンクを有する。リンクはリンクであるものの、ページ自体から見ればリンクに違いがあることを考慮することが有用である。ページの観点からすると、リンクはアウトリンク(別のページへの外向きのリンク)であるか、又はその時点のページへの別のページからのインリンクであり得る。例えば、ページ102と105からそれぞれ1つずつの合計2つのインリンクとページ104へのアウトリンクを1つ有するページ103の場合を考慮されたい。又、ページのごく限られたサブセットだけが図示されているため、この5つのページへ/からの全てのリンクが示されていない可能性があることも考慮されたい。例えば、ページ105は、図示されていないページからのインリンクを複数有する可能性がある。最先端のページランキングシステムの目的では、通常最も重要なのがインリンクである。
現在の当該技術分野では、本発明者に既知の全ての情報によれば、PageRankアルゴリズム及びその他全ての検索ランキングシステムは、上記で概要を示した、World Wide Webの静的なリンク構造に基づく。しかしながら、リンクが示された、ここに図示するランダムページグラフは、この目的にとって適切な数学モデルではない。計算効率を上げるため、より良いモデル(グラフ)を図2に示す。本発明者はこのグラフをStructural Web Graph(SWG)と称する。最初に、SWGがWWW構造のサブセットだけしか示しておらず、WWWのサイズ及び構造は絶えず変化していることを理解すべきである。このSWGコンセプトでは、WWW(又はサブセット)の各Webページはやはりポイントであるものの、ページはランダムスペースには図示されず、行と列で図示される。したがって、図2のSWGでは、行が5つあり、それぞれがページの関連付けによって識別されると共に、列も5つあり、これも同じページの関連付けによって識別される。図1と同じ5つのページを使用すると、この5つのページ及び行列の原点を有する必要性を考慮し、6×6の行列が作成される。基本的に全てのWebページにこの行列が定義されるとすると、1010行、1010列もの大きさになろう。
図2では、行と列が示され、それぞれの行及び列にページの識別子が割り当てられている。機械処理される実際的な数学的定義では、行と列は単にデータの規則において識別されるものであり、行列が表示されることはない。
図2に示す行列では、示されているそれぞれのページについて、行列に示されているそれ以外の全てのページとの行と列の交点が作成される。これが、その有用性の基礎である。現在の目的には有用性はないものの、それぞれのページについてそのページ自体との交点もあり、このような交点には図2でXというマークが付けられている。
次に、当該技術分野で周知のSWGの有用性の一例として、次の実例を考慮されたい。図2において要素201というラベルが付けられている、ページ104の行とページ102の列の交点は、ページ104と102との特定の関係を表す機会を提供するもので、このような関係はいくつかの方法で示すことができ、その1つは単純には、交点に置かれた値である。この場合の値は、規約により、102から104へインリンクがあるかどうかを表す。これがないので、値はゼロである。
交点において、列で表されるページから行で表されるページへのリンクの存在に基づく値をラベルとして交点に付与するという規約は任意であることを認識すべきであろう。要素201がページ104からページ102へのリンクを表し、このためゼロに設定される(102からページ104へのパスは間接的であり、図1では102から104へリンクがないため)という規約を容易に選択できたかもしれない。当該技術分野のほとんどの検索エンジンで利用されるSWGの主要な機能は、計算に便利な方法でページ間のこの複数のリンク関係を捕捉することである。インリンクは、自分が設計しているページから他のWebページへリンクするWebページ設計者の選択を表すため、最も便利である。大量にリンクされているページの方がより関連性が高くなる傾向があるのに対し、アウトリンクが多いページの方は関連性が高いこともそうでないこともあるということが理解されるであろう(こうしたページの設計者はもっと多くのアウトリンクを自由に追加でき、設計者は自分自身のページのコンテンツを制御するため、ページの関連性スコアを簡単に上げることができるであろう)。Webクローラは、各Webページをクロールし、そのページから他のページへのリンクに注目することで、この情報を収集し得る。図2の要素201の場合、ページ104に達すると、クローラはページ102へのリンクがないことに注目し、図2に示すように、要素201にゼロというマークを付ける。
図1をクロールすると、ページ104がページ103からリンクされている(インリンクを持っている)が、ページ102からはリンクされていないという情報が提供される。このため、201の値はゼロであるものの、104の行とページ103の列の交点の値が1になる。同じプロセスにより、図1をクロールして、それ以外のすべての交点の値が決定され、図2に示されている。
この特定例では、値が1かゼロであり、コンピュータによるシミュレーションや操作に便利であり得る。当然ながら、これ以外の値を割り当てることも可能であり、現実の世界では、単にセカンダリページからプライマリページへのインリンクがあるかどうかだけでなく、それ以外のいくつかの考慮事項で値に重み付けすることもあり得る。例えば、Structural Web Graphの全ての値の合計を1として、それぞれの値をランダムなWebサーファがあるページから次のページに推移する確率の値になるように、Structural Web Graphの値を正規化することが当該技術分野では一般的である(更に、この規約を続けると、列の値の合計は、ランダムなWebサーファが長いセッション後にその列で示されるページにいる確率を示す)。
ページランキングアルゴリズムは、多くの形態を取り得るが、原型においては、SWGを一度考慮して、ページにランクを付けるということになろう。各交点の値は1かゼロであるが、プライマリページの場合、別のページに対する各交点において1を取る可能性がある。ページ104については、行の交点にある値の合計は2である。したがって、ページ104には2つのページ(103と105)がリンクしているため、ランク値として2がページ104に付与され得る。ページ105のランク値はページ105の行の合計であり、ページ105にリンクするページがないため、ゼロとなる。図2では、105以外のすべての行は合計が2であるため、105以外のページは同じランクを有し得るか、又はアルゴリズムにタイブレーカーがあり得る。実際のケースでは、考慮しなければならない交点はこれよりもはるかに多く、1つのページが何十又は何百もの他のページからリンクされると想像し得る。
より高度な状況では、ページランキングアルゴリズムはまずページの行の合計を考慮し、その後、正の交点で各セカンダリページに対するインリンクを調べ得る。つまり、ランク付けしているページに直接リンクする各ページに、何ページがリンクインしているか、という質問の答えを求める。この質問は、その時点のページにリンクする各ページにいくつの(及びどの)リンクがあるかまで拡大適用し得る。これで、ランキングの値はより現実的で粒度が細かくなるものの、それでもWebのページに盛り込まれている構造的なリンクだけに限られている。このアプローチが、GoogleTMが開発した有名なPageRankアルゴリズムの基本である。このステップを後押しした経験則は、リンクは権威(authoritiy)に対応し、ある特定の権威の相対的なインリンクの密度がその権威の重要性をよく示すというものである。このため、少なくとも名目上の関連性は示される。
要約すると、現在の当該技術分野の検索エンジンは、Webページに関する情報を見つけ収集するWebクローラ、クローラが収集した情報から構成されるWebページのインデックス、ブラウジングしている人が入力した検索クエリに少なくとも一部分は基づきインデックス内のどのページを閲覧者に提示するか決定する検索機能、同じくクローラが取り出した情報に基づくStructural Web Graph、及びページを表示して返す順番を決定するために、Structural Web Graphとグラフの中で割り当てられている値を使用して、それぞれのページに固有のPageRankスコアを付与するPageRankアルゴリズム等、いくつかの主要な要素からなる。Lawrence Pageに発行された米国特許第6,285,999号は、このようなPageRankシステムについて説明及び特許請求している。米国特許第6,285,999号は、参照することにより本願に援用される。
検索技術に付き物の問題(その多くは前述)の多くを念頭に置くと、ネットワーク化された集まりから情報を探す人による正確且つ適切な検索条件の提供が深刻な問題であると共に、関連性のランクが付けられた情報を返すことが、MozillaTM、GoogleTM、及びYahooTMによって提供されるもののように、従来の検索システムにとって明確な課題であることは明白である。こうしたあらゆる困難を考慮し、本発明者は、明らかに必要とされるのは、従来の検索サービスを扱う人に対して、非常に強化された検索機能を提供することであると信じる。
発明の要約
現在のケースの本発明者は、従来の検索システム及び手法には重大な問題があることを突き止め、はるかに優れた結果をもたらすために独自の複合システムを開発した。1つの実施形態では、ネットワーク接続されたサーバ、第1のサーバに連結されたデータリポジトリ、及びデータリポジトリに常駐し、第1のサーバで動作するソフトウェアからなる、検索サービスが提供される。このサービスはソフトウェアを介しユーザに対話型インタフェースを提示し、ユーザとの反復的な対話を介し検索の目的を特定し、検索の検索条件を作成し、ネットワークからアクセス可能な1つ又は複数の標準的な検索エンジンにこの検索条件を入力して、ユーザの代わりに検索結果を収集する。
本発明のもう1つの別の態様では、(a)連結されたデータリポジトリからソフトウェアを実行するネットワーク接続サーバにおいて動作する対話型の検索サービスにより、ユーザに対話型インタフェースを提示するステップ、(b)ユーザとの反復的な対話を介して、サービスにより検索の目的を特定するステップ、(c)検索条件を作成するステップ、(d)作成した条件をネットワークに接続している1つ又は複数の標準的な検索エンジンに入力するステップ、及び(e)ユーザの代わりに検索結果を収集するステップからなる検索のための方法を提供する。
図面の簡単な説明
インターネットネットワークのページノードを簡単に表したものである。 Structural Web Graphを図示したものである。 本発明の実施形態における複合検索システムを描写した図である。 本発明の実施形態におけるプロセスを描写したプロセスフロー図である。
発明の詳細な説明
本発明の更にもう1つの態様では、WWWのようなネットワーク化された集まりから情報を探す人のために検索機能を強化する方法及びシステムが提供される。
図3は、本発明の実施形態における全般的な検索システムに関するアーキテクチャを描いた図である。モバイル機器301は、有名なインターネットネットワーク等の広域ネットワーク(WAN)303にアクセスするための機能を有し、市販されている検索システムを介して検索を開始し得る、多くの携帯電話、AppleTM iPhoneTM、BlackberryTMデバイス、その他携帯端末等、あらゆる種類のモバイル機器を示す。本明細書では、実施形態の説明でインターネットネットワークを使用したが、これは必ずしも本発明の実施形態で有用な唯一のネットワークではない。当該技術分野でよく見られるように、機器301はワイヤレスに対応し、局302等の基地局を介して無線で通信する。当該技術分野では、場合により、局が階層的に配置され、モバイル機器から/モバイル機器への信号を送信し得るアーキテクチャは様々ある。ここに図示した略図は、このような全てのアーキテクチャを表すことを意図する。
ラップトップコンピュータ314は、携帯電話網を介してインターネットアクティビティを行う、当該技術分野でエアカードと称されるものを使用して、基地局102を介しワイヤレスでも接続するように図示されている。ラップトップはまた、StarbucksTMやその他多くが提供するもののように、WiFiネットワークを介しても接続し得る。ラップトップはまた、固定電話システムを介したDSLによる等、モデムにより直接接続もし得る。
デスクトップコンピュータ315は、インターネットサービスプロバイダ316を介して固定電話網で接続するように図示されている。デスクトップはそれ以外の方法でも接続することもあり得る。
モバイル機器301、ラップトップコンピュータ314、及びデスクトップコンピュータ315は全て何らかの方法で回線304に接続し、回線304はインターネットネットワークの全ての相互接続を表すことを意図し、このイラストはコンピューティングデバイスがインターネット及びその他の広域ネットワークに接続し得るあらゆる手段を表す。
本発明の実施形態における関連するデータリポジトリ309からソフトウェア306を実行するインターネット接続サーバ305は、本発明の実施形態における2段階式(又はそれ以上)の検索プロセスの第1の段階を提供する。関連するデータリポジトリ310からソフトウェア308を実行するインターネット接続サーバ307、及びデータリポジトリ313からソフトウェア312を実行するインターネット接続サーバ311は、MozillaTM、GoogleTM、及びYahooTM等、商用化され、公に利用可能な検索サービスを表す。本発明の様々な実施形態では、デバイス301、314、又は315を操作する人はサーバ305に接続し、下記で詳しく説明するように、サーバ305は固有の検索サービスを提供する。
図4は、機器301、314、315のいずれか1つを操作する人によって行われる、インターネットネットワークから情報を取り出すための検索手順を図示したフローチャートである。第1のステップ401では、ソフトウェア306を実行するサーバ305によって提供される本発明のサービスのWebページにユーザが接続する。通常、このサービスは「welcome」ページをユーザに提示し、このユーザは好適な実施形態ではサービスのクライアントになる。したがって、データリポジトリ309に保管されているクライアントのプロファイルがサービスに与えられ、このサービスはクライアントを認識し、名前(又はエイリアス)でクライアントを呼ぶ(address)。
このサービスの目的は、標準的な検索サービスが抱える多くの問題に取り組むために、非常に豊かでより詳細なサービスをクライアントに提供することである。前述の問題の1つは検索条件の性質(nature)の問題、つまりほとんどの人にとって、標準的な検索エンジンに検索条件として入力する有効な語又は句をすぐに思い付くことが難しいという点である。通常、標準的な検索エンジンの対話型ページには、語、句、又は語と句の組合せを論理演算子と一緒にユーザが入力し得る1つの入力ウィンドウがある。
本発明の実施形態では、図4のステップ402に示すように、ユーザはサービスに対して所望する情報の性質を、従来の検索サービスの場合よりも詳しく、且つコンテキスト内で表現するよう指示される。1つの実施形態では、ユーザは自分の意思を引き出し、絞り込むための具体的な質問への入力が求められる。このインタフェースは通常テキスト入力ウィンドウになるものの、いくつかの実施形態では音声対応であってもよく、多項選択式の質問に回答するものであってもよい。この段階で、サービスは実施する検索の正確な性質を特定する。
サービスが検索の性質を特定し、絞り込むプロセスの例として、ユーザはおそらく次のようなパラグラフをまず入力し得る(ステップ403)。「I want information about Abraham Lincoln, and particularly details of the assassination of Lincoln, and what became of the assassins(アブラハム・リンカーンに関する情報、特にリンカーンの暗殺の詳細、及び暗殺者はどうなったのかを知りたい)」。このような入力は、標準的な検索エンジンでは条件として向かない。ユーザの入力後、サービスはその入力を解析、標準化、及び要約し、場合によっては1つ又は複数のステップでユーザにフィードバックを提供する。サービスはユーザに対して次のようにポストする。「"We determine the main focus is Abraham Lincoln" Yes/No. "A secondary focus is his assassination" Yes/No. "You want to know who were the assassins" Yes/No(「主な焦点がアブラハム・リンカーンであると結論を下しました」Yes/No。「二次的な焦点は彼の暗殺です」Yes/No。「あなたは暗殺者が誰かを知りたがっています」Yes/No)」。Yes/Noの組合せは対話式で、各レベルで選択することがユーザに求められる。このケースでは、ユーザはYes、Yes、Noを選択する。これを受け、サービスは最後の部分についてより強固に取り組み、「"You want to know the further history of the assassins" Yes/No(「あなたは暗殺者のその後の歴史を知りたがっています」Yes/No」を返す。ユーザはこれに満足し、yesを指示し得る。
次に、ステップ404で、サービスは特定された検索の性質を、標準的な検索サービス及びその作用に関する知識と一緒に、更にユーザに関するその他の知識と一緒に使用して、1つ又は複数の標準的な検索サービスに入力する具体的な検索条件を作成する。例えば、サービスは検索が極めて簡単なことであり、GoogleTMで簡単な検索だけで済み、GoogleTMの検索条件を仮定すると特定し得る。標準的な検索エンジンを1つだけ使用し得るが、2つ以上の検索が行われるのが通例である。例えば、サービスは3セットの検索条件を仮定し得る。
ステップ405で、サービスは特定された検索の性質に最適であると判断された各条件セットに対して1つずつ、合計3つのGoogleTM検索を開き、この3つの検索を開始させる。この結果、ステップ406で3つの「ページランキングされた」結果セットがサービスに返される。ステップ407でサービスはこの結果を処理する。この処理は、単にサービスに返されたページの選択とランクの再割り当てであり、これはクライアントのトランザクション履歴及びその他、返されたページのタイトル内のキーワード等の基準に基づき得る。更に、ほとんどの場合、管理できるページ数にリストが切り捨てられる。より堅調な実施形態では、クライアントへの複合レポートの一部になるように、サービスによりページの内容が選択及び「リフト」される。この実施形態において、クライアントはステップ408で、ランク付け又はランクが再割り当てされたページタイトルを入手し得る(当然ながら、標準的な検索エンジンの場合と同様、対話形式)が、更にコンテキストの解析及び要約手法により作成される複合レポートも入手し得る。これは、クライアントが何を求めているのか(暗殺のストーリー、及びその後何が行ったか)を正確に示すのに大いに役立つと期待される。
ユーザ/クライアントへの更なるサービスとして、このサービスは各クライアントに対して、クライアントの検索の履歴が記録され、クライアントによって将来検索可能であるデータリポジトリ309の特定の一部分を、提供し得る。本サービスは、時系列順の概要と、更にクライアントが自身でそれまでに検索した内容を検索でき、異なる検索内容の中及びそこから、様々な方法でデータを並べ替え、提示し得る対話式の検索インタフェースとを、定期的にクライアントに提供する。
本発明のいくつかの実施形態では、本サービスは複数の標準的な検索エンジンを使用し、それぞれについてクライアントとの対話式のプロセスで一連の検索条件を作成すると共に、クライアントが満足するまで、クライアントと対話形式で検索を絞り込み、改良し得る。したがって、いくつかの実施形態における本サービスは、クライアントと標準的な検索エンジンとの間で動作するサービスで、クライアントが本当に知りたがっていることについて可能な限り最良で非常に詳細な検索を行うのを支援すると共に、クライアントと対話しながら検索内容を明らかにしていくもので、これによりクライアントは検索のための指針を更に改良することができる。いくつかの実施形態における本サービスは、又、返されるページの情報を解析、標準化、及び要約すると共に、多くの実施形態において当初の検索の性質に基づき包括的な検索レポートを作成する。例えば、本発明の固有サービスでは、前述したようなアブラハム・リンカーンに関する情報を求めている人に対して、商用化されている従来の検索機能のように、単にランク付けされたページのWebリンクを返すのではなく、検出したあらゆる情報を、規格化及び標準化されたレポートに要約し得る。1つの実施形態では、本発明の固有サービスはまた、その情報が検出された場所のマッピングも提供し得る。即ち、要約とその要約の情報が取り込まれたページ、更にそのページのどこで情報が見つかったのかを提供し得る。
モバイル機器301の場合、全体的な対話式検索に含まれるもう1つの情報は、モバイル機器の位置であり、これは多くの場合、モバイル機器に統合された全地球位置測定システム(GPS)によって測定される。この情報は、検索の性質を特定するステップ、及びどのような内容がクライアントに対して返され、保存されるかにおいて貴重であり得る。
本発明の実施形態は、前述した実施形態及び例に限定されるものでなく、本発明の趣旨及び範囲を逸脱しない限りにおいて多くの変更及び修正を行うことができることは当業者には明らかであろう。したがって、本発明は添付の特許請求の範囲によってのみ限定される。

Claims (25)

  1. システムであって、
    ネットワーク接続されたサーバと、
    前記ネットワーク接続されたサーバと連結されたデータリポジトリと、
    前記データリポジトリに常駐し、前記ネットワーク接続されたサーバで動作するように構成されたソフトウェアと、
    を備え、
    前記ネットワーク接続されたサーバが、前記ソフトウェアの実行を介して、ネットワークに接続されたコンピューティングデバイスに対話型インタフェースを提供し、反復的な対話を介し検索の目的を特定し、前記検索の検索条件を作成し、前記ネットワークを介してアクセス可能な1つ又は複数の標準的な検索エンジンに前記検索条件を入力し、前記検索の結果を収集するように構成される、システム。
  2. 前記ネットワーク接続されたサーバが、前記収集した結果を処理し、処理した結果を、提示するために前記コンピューティングデバイスに送信するように更に構成される、請求項1に記載のシステム。
  3. 前記ネットワーク接続されたサーバが、前記検索の前記目的に対して複数の検索条件を作成し、前記複数の検索条件を異なるエントリで前記1つ又は複数の標準的な検索エンジンに入力して複数の検索を実行し、前記複数の検索の結果を集約するように構成される請求項1に記載のシステム。
  4. 前記ネットワーク接続されたサーバが、前記収集した結果を、前記1つ又は複数の標準的な検索エンジンによって返されたページのサブセットを選択することにより処理するように更に構成される請求項2に記載のシステム。
  5. 前記ネットワーク接続されたサーバが、前記収集した結果を、前記1つ又は複数の標準的な検索エンジンによってランク付けされて返されたページを再度ランク付けすることにより処理するように更に構成される請求項2に記載のシステム。
  6. 前記ネットワーク接続されたサーバが、プロファイル内の1つ又は複数の検索履歴又は情報を使用して少なくとも部分的に前記ページを再度ランク付けするように構成される請求項5に記載のシステム。
  7. 前記ネットワーク接続されたサーバが、前記収集した結果を、1つ又は複数の返されたページからコンテンツの一部分を選択し、前記コンピューティングデバイス用に、選択した部分を含むレポートを作成することにより、処理するように更に構成される請求項2に記載のシステム。
  8. 前記ネットワーク接続されたサーバが、前記検索を実行するために採用された前記コンピューティングデバイスについて識別された前記検索の結果を前記データリポジトリに格納するように構成される請求項1に記載のシステム。
  9. 前記ネットワーク接続されたサーバが、格納された検索結果の検索及び取り出しを前記コンピューティングデバイスに行わせることにより、前記格納された検索結果への対話型アクセスを提供するように構成される請求項8に記載のシステム。
  10. ネットワーク接続されたサーバと接続されたデータリポジトリ内に保持されたソフトウェアを実行する前記ネットワーク接続されたサーバから、ネットワークに接続されたコンピューティングデバイスへ、対話型インタフェースを提供するステップと、
    反復的な対話を介し検索の目的を特定するステップと、
    前記特定された検索の目的に基づいて検索条件を作成するステップと、
    前記ネットワークに接続された1つ又は複数の標準的な検索エンジンに前記作成された検索条件を入力するステップと、
    前記1つ又は複数の標準的な検索エンジンから前記検索の結果を収集するステップと、
    を含む方法。
  11. 前記1つ又は複数の標準的な検索エンジンによって返される前記結果を処理するステップと、
    処理した結果を、提示するために前記コンピューティングデバイスに送信するステップと、
    を更に含む請求項10に記載の方法。
  12. 前記特定された検索の目的に対して複数の検索条件を作成するステップと、
    複数の検索を実行するために、前記検索条件を異なるエントリで前記1つ又は複数の標準的な検索エンジンに入力するステップと、
    前記コンピューティングデバイスのために前記複数の検索から結果を集約するステップと、
    を更に含む請求項10に記載の方法。
  13. 前記処理ステップが、前記1つ又は複数の標準的な検索エンジンによって返されたページのサブセットを選択するステップを更に含む請求項11に記載の方法。
  14. 前記処理ステップが、前記1つ又は複数の標準的な検索エンジンによってランク付けされて返されたページを再ランク付けするステップを更に含む請求項11に記載の方法。
  15. 前記再ランク付けステップが、プロファイル内の1つ又は複数の検索履歴又は情報を使用して少なくとも部分的に実行される請求項14に記載の方法。
  16. 前記処理ステップが、
    1つ又は複数の返されたページからコンテンツの部分を選択するステップと、
    前記コンピューティングデバイス用に、前記選択した部分を含むレポートを作成するステップと、
    を含む請求項11に記載の方法。
  17. 検索の結果を前記データリポジトリに格納するステップと、
    前記コンピューティングデバイスと関連付けて、前記データリポジトリ内の前記格納された検索結果を識別するステップと、
    を更に含む請求項10に記載の方法。
  18. 格納された検索結果の検索及び取り出しを前記コンピューティングデバイスに行わせることにより、前記格納された検索結果への対話型アクセスを提供するステップを更に含む請求項17に記載の方法。
  19. ネットワークを介してサーバへ接続するステップと、
    前記サーバによって提供される対話型インタフェースを表示するステップと、
    反復的な対話を介して検索の性質を説明する入力を取得するステップと、
    前記サーバにおいて、前記検索の目的を特定し、前記検索の前記目的に基づいて検索条件を作成し、1つ又は複数の標準的な検索エンジンに前記検索条件を入力し、前記検索の結果を収集するために、前記サーバに前記入力を送信するステップと、
    前記サーバから前記検索の前記結果を受信するステップと、
    を含む方法。
  20. 前記入力に特有の少なくとも1つの質問の提示、及び前記少なくとも1つの質問に対する更なる入力の収集を行うことによって、前記サーバが前記検索の前記目的を特定できるように前記検索の性質を絞り込むステップを更に含む、請求項19に記載の方法。
  21. 前記サーバに接続されたデータリポジトリ内に格納されている、前に返された検索結果を、検索するステップを更に含む請求項19に記載の方法。
  22. 検索サービスを提供するネットワーク接続されたサーバに接続するように構成されるネットワークインターフェイスと、
    検索の説明に関する入力を反復的に収集して前記検索の目的を絞り込むように構成された、前記検索サービスによって供給される対話型インタフェースであって、前記検索の前記目的は、1つ又は複数の標準的な検索エンジンから検索結果を得るために採用する検索条件を決定するために前記検索サービスによって使用される、対話型インタフェースと、
    を備えるシステム。
  23. 前記対話型インタフェースが、携帯機器、ラップトップコンピュータ、又はデスクトップコンピュータの1つで提供される請求項22に記載のシステム。
  24. 前記ネットワーク接続されたサーバと接続されるデータリポジトリ内に保持された過去の検索の結果に対話形式でアクセスするよう構成される、前記検索サービスによって提供される過去検索インタフェースを更に備える請求項22に記載のシステム。
  25. ネットワーク接続されたクライアントデバイスによって開始される検索の目的を特定する手段と、
    前記検索の前記目的に基づいて少なくとも1つの標準的な検索エンジンから検索結果を取得するための手段と、
    前記ネットワーク接続されたクライアントデバイスに返す前に前記検索結果を処理する手段と、
    を備えるシステム。
JP2010550855A 2008-03-14 2009-03-12 複合検索用のシステムと方法 Active JP5318125B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/048,637 2008-03-14
US12/048,637 US7930287B2 (en) 2008-03-14 2008-03-14 Systems and methods for compound searching
PCT/US2009/036923 WO2009114672A2 (en) 2008-03-14 2009-03-12 Systems and methods for compound searching

Publications (2)

Publication Number Publication Date
JP2011526008A true JP2011526008A (ja) 2011-09-29
JP5318125B2 JP5318125B2 (ja) 2013-10-16

Family

ID=41064133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010550855A Active JP5318125B2 (ja) 2008-03-14 2009-03-12 複合検索用のシステムと方法

Country Status (5)

Country Link
US (2) US7930287B2 (ja)
EP (1) EP2263175A4 (ja)
JP (1) JP5318125B2 (ja)
CN (1) CN102405470B (ja)
WO (1) WO2009114672A2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7930287B2 (en) * 2008-03-14 2011-04-19 Michelli Capital Limited Liability Company Systems and methods for compound searching
US9251157B2 (en) * 2009-10-12 2016-02-02 Oracle International Corporation Enterprise node rank engine
US9659265B2 (en) 2009-10-12 2017-05-23 Oracle International Corporation Methods and systems for collecting and analyzing enterprise activities
JP5806451B2 (ja) 2010-07-21 2015-11-10 キヤノン株式会社 画像形成装置
KR20130035486A (ko) * 2011-09-30 2013-04-09 삼성전자주식회사 사용자 행위를 고려한 검색 장치 및 방법
CN103294777A (zh) * 2013-05-13 2013-09-11 沈文策 一种问题解答方法及系统
CN103533399A (zh) * 2013-09-30 2014-01-22 深圳创维-Rgb电子有限公司 一种视频信息显示方法和装置
US9454621B2 (en) * 2013-12-31 2016-09-27 Google Inc. Surfacing navigational search results
US10019523B2 (en) * 2014-11-21 2018-07-10 Ebay Inc. Diversifying search results
US10530714B2 (en) 2016-02-29 2020-01-07 Oracle International Corporation Conditional automatic social posts
US10503805B2 (en) * 2016-12-19 2019-12-10 Oracle International Corporation Generating feedback for a target content item based on published content items
US11003996B2 (en) * 2017-05-24 2021-05-11 Facebook, Inc. Determining navigation patterns associated with a social networking system to provide content associated with a destination page on a starting page
US11762934B2 (en) 2021-05-11 2023-09-19 Oracle International Corporation Target web and social media messaging based on event signals

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01128139A (ja) * 1987-11-12 1989-05-19 Fujitsu Ltd 手続き的知識の処理方式
JP2002334107A (ja) * 2001-03-07 2002-11-22 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置および方法と情報検索プログラムおよび該プログラムを記録した記録媒体
US20060271524A1 (en) * 2005-02-28 2006-11-30 Michael Tanne Methods of and systems for searching by incorporating user-entered information

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285999B1 (en) 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US7725307B2 (en) * 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7725525B2 (en) * 2000-05-09 2010-05-25 James Duncan Work Method and apparatus for internet-based human network brokering
US6947930B2 (en) * 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
EP1646956A1 (en) * 2003-07-23 2006-04-19 University College Dublin, National University of Ireland Dublin Information retrieval
US20050177555A1 (en) * 2004-02-11 2005-08-11 Alpert Sherman R. System and method for providing information on a set of search returned documents
WO2005114379A2 (en) * 2004-05-14 2005-12-01 Perfect Market Technologies, Inc. Personalized search engine
US20080077570A1 (en) * 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
US8694530B2 (en) * 2006-01-03 2014-04-08 Textdigger, Inc. Search system with query refinement and search method
JP2007188352A (ja) * 2006-01-13 2007-07-26 National Institute Of Information & Communication Technology ページリランキング装置、ページリランキングプログラム
KR100717387B1 (ko) * 2006-01-26 2007-05-11 삼성전자주식회사 유사곡 검색 방법 및 그 장치
US20070192179A1 (en) * 2006-02-15 2007-08-16 Van Luchene Andrew S Survey-Based Qualification of Keyword Searches
WO2008012834A2 (en) * 2006-07-25 2008-01-31 Jain Pankaj A method and a system for searching information using information device
CN101075239A (zh) * 2006-08-23 2007-11-21 腾讯科技(深圳)有限公司 一种复合搜索方法和系统
US20080141126A1 (en) * 2006-11-17 2008-06-12 Vincent Lee Johnson Method and system to aid in viewing digital content
US7555478B2 (en) * 2006-12-05 2009-06-30 Yahoo! Inc. Search results presented as visually illustrative concepts
US8244750B2 (en) * 2007-03-23 2012-08-14 Microsoft Corporation Related search queries for a webpage and their applications
US20090106233A1 (en) * 2007-08-24 2009-04-23 Veenstra John W Query engine interpreter and prioritization engine
US20090119254A1 (en) * 2007-11-07 2009-05-07 Cross Tiffany B Storing Accessible Histories of Search Results Reordered to Reflect User Interest in the Search Results
US20090138439A1 (en) * 2007-11-27 2009-05-28 Helio, Llc. Systems and methods for location based Internet search
US8145630B1 (en) * 2007-12-28 2012-03-27 Google Inc. Session-based dynamic search snippets
US7930287B2 (en) * 2008-03-14 2011-04-19 Michelli Capital Limited Liability Company Systems and methods for compound searching

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01128139A (ja) * 1987-11-12 1989-05-19 Fujitsu Ltd 手続き的知識の処理方式
JP2002334107A (ja) * 2001-03-07 2002-11-22 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置および方法と情報検索プログラムおよび該プログラムを記録した記録媒体
US20060271524A1 (en) * 2005-02-28 2006-11-30 Michael Tanne Methods of and systems for searching by incorporating user-entered information
JP2008537810A (ja) * 2005-02-28 2008-09-25 ウィンク テクノロジ−ズ インコ−ポレイテッド 検索方法及び検索システム

Also Published As

Publication number Publication date
US7930287B2 (en) 2011-04-19
CN102405470A (zh) 2012-04-04
JP5318125B2 (ja) 2013-10-16
US20110167052A1 (en) 2011-07-07
EP2263175A2 (en) 2010-12-22
EP2263175A4 (en) 2013-01-16
US20090234835A1 (en) 2009-09-17
WO2009114672A3 (en) 2011-08-18
WO2009114672A2 (en) 2009-09-17
CN102405470B (zh) 2015-06-03

Similar Documents

Publication Publication Date Title
JP5318125B2 (ja) 複合検索用のシステムと方法
US11709876B2 (en) Providing relevance-ordered categories of information
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US7194454B2 (en) Method for organizing records of database search activity by topical relevance
Kao et al. Mining web informative structures and contents based on entropy analysis
TWI391834B (zh) 藉分析標籤尋找相關文件之系統及方法
US8185545B2 (en) Task/domain segmentation in applying feedback to command control
US7499965B1 (en) Software agent for locating and analyzing virtual communities on the world wide web
US20040064447A1 (en) System and method for management of synonymic searching
US20080313171A1 (en) Cluster-Based Ranking with a Behavioral Web Graph
US20150088846A1 (en) Suggesting keywords for search engine optimization
EP1342177A1 (en) Method for structuring and searching information
US20070094250A1 (en) Using matrix representations of search engine operations to make inferences about documents in a search engine corpus
US9275145B2 (en) Electronic document retrieval system with links to external documents
Fafalios et al. Exploratory patent search with faceted search and configurable entity mining
US20140046951A1 (en) Automated substitution of terms by compound expressions during indexing of information for computerized search
US7490082B2 (en) System and method for searching internet domains
JPH10222534A (ja) 情報検索装置
Bute et al. Evaluating search effectiveness of some selected search engines
Chen Building a web‐snippet clustering system based on a mixed clustering method
KR20030082110A (ko) 앤드 연산자 및 문서 내 연관성을 이용한 색인어 검색 및정보 제공 시스템 및 방법
JP2006235928A (ja) 文書検索方法、文書検索装置および文書検索プログラムを記録した記憶媒体
Modi et al. A Comparative Study of Various Page Ranking Algorithms
Wu et al. Information Exploration on the World Wide Web
Lakers et al. Search Engine Technology

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130131

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130430

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130709

R150 Certificate of patent or registration of utility model

Ref document number: 5318125

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250