JP5147947B2 - クエリ別検索コレクション生成方法およびシステム - Google Patents

クエリ別検索コレクション生成方法およびシステム Download PDF

Info

Publication number
JP5147947B2
JP5147947B2 JP2010523931A JP2010523931A JP5147947B2 JP 5147947 B2 JP5147947 B2 JP 5147947B2 JP 2010523931 A JP2010523931 A JP 2010523931A JP 2010523931 A JP2010523931 A JP 2010523931A JP 5147947 B2 JP5147947 B2 JP 5147947B2
Authority
JP
Japan
Prior art keywords
search
query
collection
group
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010523931A
Other languages
English (en)
Other versions
JP2010538386A (ja
Inventor
ビョン ハク キム
テ ヨン カク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2010538386A publication Critical patent/JP2010538386A/ja
Application granted granted Critical
Publication of JP5147947B2 publication Critical patent/JP5147947B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、インターネットを用いた検索サービスの提供方法およびシステムに関し、より詳細には、検索過程でユーザによって入力される各クエリに応じて検索コレクションを生成する方法およびシステムに関する。
インターネットの発達および普及に伴いインターネットを用いたさまざまなサービスが提供されているが、その1つの典型例として検索サービスが挙げられる。検索サービスとは、ユーザから入力されるクエリに対して検索を行い(例えば、ユーザから入力された検索クエリを含むウェブサイト、または該当検索クエリを含むファイル名を有するイメージなど)、入力されたクエリに対応づけて生成した検索結果をユーザに提供するサービスを意味する。
一般的な検索サービスにおいて、ユーザによって入力されたクエリに対して生成された検索結果は、例えば「最新ニュース」、「イメージ」、又は「ブログ」等のように予め決められた検索コレクション別に分類され、それにより、
ユーザは検索コレクションにより分類された検索結果を提供されていた。
しかし、一般的な検索サービスを通じて生成された検索結果を提供するにあたっては、クエリの特性とは全く関係なく検索結果は予め決められた検索コレクションにより分類されている。
このような問題点を解決するために、クエリにより検索コレクションの種類と個数を調節できる方法が提案されている。この方法の場合、各クエリはまずカテゴリにより分類され、特定カテゴリに属するクエリがユーザにより入力される場合、そのカテゴリに対応した検索コレクションが提供される。この方法においても、ユーザの検索意図を反映した検索コレクションにより検索結果を提供することが困難であるという従来の問題点は相変らず存在していた。
本発明は、上記の問題点を考慮して、各クエリ別に検索コレクションを自動で生成することのできるクエリ別検索コレクション生成方法およびシステムを提供することを目的とする。
本発明は、該当クエリに対する検索リクエストを受信した場合に、該当クエリにマッピングされている検索コレクションによって表示される検索コレクションの生成方法およびシステムを提供することを他の目的とする。
また、本発明は、各クエリに対するユーザの検索意図を反映して各クエリ別の検索コレクションを生成することのできるクエリ別検索コレクション生成方法およびシステムを提供することを他の目的とする。
本発明は、さらに、ユーザの検索意図を検索コレクションに反映するために、各クエリ別の検索コレクションを所定周期ごとにアップデートすることのできるクエリ別検索コレクション生成方法およびシステムを提供することを目的とする。
上述した課題を解決しその他の優位性を達成するため、また本発明の目的に従って、ここで具体的かつ広く説明されるように、本発明の一側面に係るクエリ別検索コレクション生成方法は、ユーザ端末に接続され、当該ユーザ端末から送信されるユーザからの入力を受信するコンピュータにおけるクエリ別検索コレクション生成方法であって、前記コンピュータが、受信した第1クエリおよび前記第1クエリに対して生成された複数の検索結果リストから、ユーザからの入力によって選択された検索結果を獲得し、前記コンピュータが、獲得した前記第1クエリと前記検索結果とを互いにマッピングしてデータ格納部に格納し、前記コンピュータが、所定のタイミングで、前記第1クエリに夫々マッピングされた複数の前記検索結果を1つ以上のグループに分類し、前記コンピュータが、各グループ別に、前記第1クエリに関連する検索コレクションを生成して検索コレクション格納部に格納することを含む。
この時、前記検索結果は、前記検索結果のURL(Uniform Resource Locator)であってもよい。また、前記各検索結果に該当する各ウェブページの主題が共通する場合には、前記検索結果を分類する際に、前記検索結果は同じグループへと分類される。前記検索結果に該当する各ウェブページの主題は、前記検索結果に該当する各ウェブサイトのカテゴリ分類体系から抽出されてもよく、また、前記検索結果に該当する各ウェブページの主題は前記検索結果に該当する各ウェブページのタイトルまたはコンテンツのうち少なくとも1つから抽出されてもよい。
前記クエリ別検索コレクション生成方法は、前記検索コレクションを生成する前に、各グループによりグループ情報を生成するステップをさらに含み、前記第1クエリの前記検索コレクションは各グループによるグループ情報の使用を通じて生成される。この時、各グループによる前記グループ情報は、前記検索結果に該当する各ウェブページの主題を使用して生成される。
また、前記クエリ別検索コレクション生成方法は、ユーザから第2クエリを受信し、前記第2クエリが前記第1クエリと同一である場合に前記第2クエリに対する検索結果を前記第1クエリの前記検索コレクションによって分類して提供することを含む。また、前記クエリ別の検索コレクション生成方法は、前記第2クエリに対する検索結果を提供する前に、前記第2クエリの前記検索結果における各グループが占める比率を算出し、比率の低いグループに該当する検索コレクションよりも、比率の高いグループに該当する検索コレクションを、上位に配置する。前記各グループが占める比率は、前記検索結果の総数と前記各グループに含まれる検索結果の個数によって算出される。また、前記クエリ別検索コレクション生成方法は、前記第1クエリの検索コレクションを前記検索コレクション生成後に前記第1クエリにマッピングすることを含む。
前記クエリ別検索コレクション生成方法は、前述した各手順を所定周期ごとに繰り返し行うことによって、格納された検索コレクションを削除または変更したり、新しい検索コレクションをさらに生成して格納したりすることを含む。
本発明の他の側面に係るクエリ別検索コレクション生成システムは、第1クエリおよび前記第1クエリに対して生成された複数の検索結果リストのうちからユーザによって選択された検索結果を獲得するデータ抽出部と、前記データ抽出部が獲得した前記第1クエリとを互いにマッピングして格納するデータ格納部と、所定のタイミングで、前記第1クエリに夫々マッピングされた複数の前記検索結果を1つ以上のグループに分類する検索結果分類部と、各グループ別に前記第1クエリの検索コレクションを生成する検索コレクション生成部とを含む。
本発明についての前述の一般的な説明及び後述する詳細な説明は、いずれも例示であり説明のためのものであり、本発明の請求項についてのさらなる説明のために提供されているものであることが理解されなければならない。
本発明によるクエリ別検索コレクション生成方法及びシステムには、次のような効果がある。
各クエリ別に特定の検索コレクションを自動で生成することができる。
また、本発明は、各クエリ別に生成された検索結果リストを提供する際に、各クエリ別に生成された特定の検索コレクションを用いて検索結果リストが表示される。したがって、各クエリごとに最適化された方法によって検索結果が提供される。
各クエリに対する検索コレクションを生成する際に、各クエリに対して検索結果リストからユーザが選択した検索結果URLを用いることにより、検索コレクションにユーザの検索意図を反映することができる。
また、各クエリ別の検索コレクションが所定周期ごとにアップデートされることによって、ユーザの検索意図を検索コレクションに迅速に反映することができるという効果がある。
本発明の一実施形態に係るクエリ別検索コレクション生成システムのブロックダイアグラムである。 検索コレクション格納部に格納される各クエリ別の検索コレクションのデータ構造を示すブロックダイアグラムである。 本発明の一実施形態に係る検索機能を備えたクエリ別検索コレクション生成システムのブロックダイアグラムである。 本発明の一実施形態に係るクエリ別検索コレクション生成方法を示すフローチャートである。 図4に示す方法によって生成された検索コレクションを用いて検索結果を提供する方法を示すフローチャートである。
添付の図面を参照しながら本発明の好ましい実施形態について詳細に説明する。可能な限り、各図面を通じて同一あるいは類似の要素については同一の参照符号を用いる。
以下、本発明におけるクエリ別検索コレクション生成方法及びシステムを添付の図面を参照しつつ説明する。
図1は、本発明の一実施形態に係るクエリ別検索コレクション生成システムのブロックダイアグラムである。図1に示すように、検索コレクション生成システム10は、データ抽出部12、データ格納部13、検索結果分類部14、検索コレクション生成部16、および検索コレクション格納部18を含む。
データ抽出部12は、ユーザの検索履歴に関するログ情報についてのログ格納部(図示せず)から特定のクエリと該当クエリについての検索結果リストからユーザが選択した検索結果を獲得して、獲得したクエリと検索結果とをデータ格納部13に格納する。
本発明の一実施形態において、データ抽出部12は、前記検索結果のuniform resource locators(以下、「URL」という。)を獲得して、獲得したURLをデータ格納部13に格納する。説明の便宜のため、各クエリに対する検索結果は検索結果のURLであると仮定して記載するが、これに限定されるものではない。
データ抽出部12がクエリおよび各クエリに対する検索結果URLを獲得することを以下で例を挙げて説明する。
「スパイダーマン」という特定のクエリに対して作成された検索結果リストから、第1ユーザは「http://spiderman.sonypictures.com/」という検索結果URLを選択し、第2ユーザは「http://ultimatespidermanaame.com/」という検索結果URLを選択し、第3ユーザは「http://www.sonypictures.com/homevideo/spider−man2/」という検索結果URLを選択した場合、データ抽出部12は全てのデータがその内部に格納されたログ格納部から「スパイダーマン」というクエリとこのクエリに対して生成された検索結果リストからユーザが選択した全ての検索結果URLを獲得する。
この時、データ抽出部12は、ログ格納部に格納された全てのクエリと該当クエリに対して生成された検索結果リストからユーザが選択した検索結果URLを獲得してもよい。本発明の変形された実施形態においては、所定の回数以上ユーザのより検索されたクエリと該当クエリに対して生成された検索結果リストからユーザが選択した検索結果URLを獲得してもよい。
当該クエリと各クエリに対してユーザが選択した検索結果URLとは互いにマッピングされてデータ格納部13に格納される。また、検索結果分類部14によって生成された各グループのグループ情報及び各グループに含まれる検索結果URLがデータ格納部13に格納される。本発明の前述の実施形態においては、データ格納部13が検索コレクション生成システム10に含まれている。しかし、データ格納部13は検索コレクション生成システム10とは別に構成されてもよい。
検索結果分類部14は、データ格納部13に格納されている検索結果URLを1つ以上のグループに分類する。本発明の一実施形態において、検索結果分類部14は、各検索結果URLに該当するウェブページの主題によって検索結果URLを分類してもよい。すなわち、もし所定の検索結果URLに該当するウェブページが同一の主題を有する場合、所定の検索結果URLは同一グループに含まれる。この場合に、各検索結果URLに該当するウェブページの主題は、検索結果URLに該当するウェブサイトのカテゴリ分類体系から抽出され得る。例えば、検索結果URLに該当するウェブサイトのカテゴリが「ゲーム」に属する場合、該当検索結果URLの主題は「ゲーム」に決定される。
本発明の変形された実施形態において、各検索結果URLに該当するウェブページの主題は該当ウェブページのタイトルまたはコンテンツを用いて抽出されてもよい。より具体的には、該当ウェブページの主題は、該当ウェブページのタイトルやコンテンツ中の単語のうち、最も多く出現する単語を用いて抽出されてもよい。例えば、該当ウェブページのタイトルやコンテンツにおいて「映画」という単語が最も多く出現する場合、該当検索結果URLの主題は「映画」に決定される。
一方、共通した主題を有する検索結果URLが1つのグループに分類されると、検索結果分類部14は各グループ別にグループ情報を生成する。本発明の一実施形態において、各グループのグループ情報は、各グループの主題に決定され得る。例えば、主題が「映画」のグループのグループ情報は「映画」に決定され、主題が「ゲーム」のグループのグループ情報は「ゲーム」に決定される。
そして、検索結果分類部14は、各グループ別のグループ情報を該当クエリとマッピングして、互いにマッピングされたグループ情報と該当クエリとをデータ格納部13に格納する。
検索コレクション生成部16は、検索結果分類部14によって生成されたグループ情報を用いて各クエリ別に検索コレクションを生成して検索コレクション格納部18に格納する。ここで、検索コレクションとは、ニュース、イメージ、ブログのような検索結果を順位付けするための一基準になることのできる情報を意味する。例えば、「スパイダーマン」というクエリに対して「映画」というグループ情報を有するグループと「ゲーム」というグループ情報を有するグループが生成された時、検索コレクション生成部16は各グループのグループ情報「映画」及び「ゲーム」を「スパイダーマン」というクエリに関連する検索コレクションとして生成する。結果として、検索コレクション生成部16は各クエリごとに特定の検索コレクションを生成する。
検索コレクション生成部16によって生成された検索コレクションは、該当クエリとマッピングされて検索コレクション格納部18に格納される。図2に示されるように、検索コレクション格納部18に格納される検索コレクションのデータ構造は、クエリフィールド26と1つ以上の検索コレクションフィールド28を含む。この場合に、クエリフィールド26には該当クエリが記録され、各検索コレクションフィールド28には各検索結果URLのグループ情報を用いて生成された検索コレクションが記録される。
本発明の一実施形態において、検索コレクション生成システム10のデータ抽出部12は所定周期ごとにログ格納部からデータを獲得し、それによりデータ格納部13に格納されているデータを所定の周期ごとにアップデートする。また、検索結果分類部14はアップデートされた検索結果URLを分類することにより、既存のグループを変更または削除したり、新しいグループを生成して追加したりすることができる。さらに、検索コレクション生成部16は変更、削除、または追加されたグループのグループ情報を用いて、検索コレクションを変更、削除、または追加することにより検索コレクションをアップデートすることができる。結果として、このデータアップデート機能によって各クエリに対するユーザの検索意図を素早く反映することができる。
例えば、アップデート以前には特定のクエリに対して生成された検索結果リストからユーザが選択した検索結果URLは特定の映画に限定されていたとする。しかし、当該映画が興行的に大きな成功を収めたことにより、当該映画に関連したゲームが製作されたり本が出版された場合には、同一のクエリに対する検索結果リストが生成された後に、ユーザは当該映画のゲームや本に関する検索結果URLを選択してもよい。したがって、本発明の検索コレクション生成システムは、ログ格納部から新しくアップデートされた情報を獲得することで、特定のクエリに関連した「本」や「ゲーム」といった検索コレクションを追加することができ、これにより特定のクエリについての検索結果リストへとユーザの検索意図を素早く反映することができる。
上述した本発明の実施形態においては、検索コレクション生成システム10に含まれる検索コレクション格納部18を開示した。しかし、このような検索コレクション格納部18は検索コレクション生成システム10とは別に構成してもよい。
ユーザーが特定のクエリに対して生成された検索結果リストから所望の検索結果URLを選択した場合のユーザの利便性を実感するため、特定のクエリに応答して検索コレクションにより分類されている間、検索結果リストが表示される。このため、検索コレクション生成システムは、検索機能を行う検索システム(図示せず)と連動したり、検索機能を行うための検索部を含んだり、または検索システム内部に含まれたりしてもよい。
以下において、本発明の一実施形態に係る、検索コレクション生成システムが検索機能を行うための検索部を含む場合を説明する。
図3は、本発明の一実施形態に係る検索機能を行うための検索部を含む検索コレクション生成システムのブロックダイアグラムである。ここで、図3に示すデータ抽出部12、データ格納部13、検索結果分類部14、検索コレクション生成部16、および検索コレクション格納部18の機能は、図1に示すものと同一であるため、図3に示されたこれらの構成要素についての詳細な説明は省略する。
クエリ受信部20はユーザからのクエリを受信し、検索部22はクエリ受信部20を介して受け取ったクエリによって検索データベース23を用いて検索を行う。
検索部22は、このような検索によって検索結果URLとともに検索結果リストを生成し、生成された検索結果リストを検索結果提供部24に伝送する。
検索結果提供部24は、クエリ受信部20を介して受信したクエリが検索コレクション格納部18に格納されているかどうかを判断する。クエリ受信部20を介して受信されたクエリが検索コレクション格納部18に格納されている場合、検索結果提供部24は、該当クエリにマッピングされている検索コレクションを検索コレクション格納部18から読み出して、読み出された検索コレクションを用いて検索結果リストを分類しながら提供する。
本発明の一実施形態において、もし所定の検索結果URLが読み出された検索コレクションに含まれない場合には、その検索結果URLは追加グループとして分類して、所定の領域において別に表示し、これにより読み出された検索コレクションに含まれない所定の検索結果URLはユーザに提供される。
クエリ受信部20を介して受信したクエリが、検索コレクション格納部18に格納されていない場合、検索結果提供部24は一般的な検索コレクションを用いて分類された検索結果リストをユーザに提供する。
本発明の前述した実施形態においては、受信されたクエリが検索コレクション格納部18に格納されているか否かを検索結果提供部24が判断する。しかし、本発明の変形された実施形態においては、クエリ受信部20が受信されたクエリが検索コレクション格納部18に格納されているか否かを直接判断してその結果を検索結果提供部24に提供してもよい。
検索結果提供部24が検索結果リストをユーザに提供する際に、検索コレクションをクエリにマッピングされている各検索コレクションの重要度(weight)によりランク付けしてもよい。すなわち、重要度が高い検索コレクションが重要度の低い検索コレクションよりもより上位にランク付けされるようにしてもよい。このため、検索結果コレクション生成システム10は、該当クエリにマッピングされている検索コレクションの重要度を算出できる演算部(図示せず)を追加で含んでもよい。
演算部は、該当クエリの各グループに含まれる検索結果URLの個数を用いて各グループの比率を算出することによって、各検索コレクションの重要度を算出することができる。より具体的には、各クエリに対してマッピングされている検索結果URLの総数と特定グループに含まれている検索結果URLの個数を用いて検索結果リスト全体において各グループが占める比率を演算する。したがって、該当グループの比率に基づいて、該当グループのグループ情報とマッピングされている検索コレクションの重要度が判断される。
検索結果提供部24は、高い重要度を有する検索コレクションが低い重要度の検索コレクションよりも、より上位にランク付けられるような検索結果リストを提供する。
本発明の他の実施形態において、検索結果提供部24は、各クエリ別に生成された検索コレクションを用いる代わりに、一般的な検索コレクションを用いて検索結果リストを分類するが、これにより、最も高い重要度の検索コレクションが検索結果リストの最上位にランク付けられる。すなわち、一般的な検索コレクションに基づき検索結果リストを提供する場合、ユーザらによって最も頻繁に選ばれた検索コレクションが検索結果リストの最上位にランク付けされるようにする。したがって、当該クエリに関して最も好まれる主題についての検索コレクションが検索結果リストの最上位にランク付けされ、これによりユーザは検索結果リストの最上位に配置されている最も好まれる主題についての検索コレクションを閲覧できる。
もし、検索コレクション生成システム10が外部の検索システムと連動されることにより検索機能が提供される場合には、検索コレクション生成システム10は検索システムからユーザにより入力されたクエリを受信する。この場合に、受信したクエリが検索コレクション格納部18に格納されている場合、検索コレクション生成システム10は該当クエリに対する検索コレクションを検索システムに送信する。一方、受信したクエリが検索コレクション生成システム10に格納されていない場合、当該情報を検索システムに送信する。
検索コレクション生成システム10が外部の検索システムに含まれる場合には、検索コレクション生成システム10が検索機能を行うための検索部を含む場合と実質的に同一であるため、外部の検索システムに含まれる検索コレクション生成システム10についての詳しい説明は省略する。
以下では、図4を参照しながら本発明の一実施形態に係る検索コレクション生成方法を説明する。
まず、ステップ100において、ログ格納部からクエリと該当クエリに対して生成された検索結果リストからユーザが選択した検索結果URLを獲得してデータ格納部13に格納する。上述したように、ユーザが入力した全てのクエリと該当クエリに対して生成された検索結果リストからユーザが選択した検索結果URLをログ格納部から獲得してもよい。本発明の変形された実施形態においては、ユーザから入力される回数が基準値以上の特定のクエリ及びその特定のクエリについての検索結果URLをログ格納部から獲得される。
次に、ステップ110で、獲得された検索結果URLに該当するウェブページの主題を決定する。この場合に、各検索結果URLに該当するウェブページの主題は、検索結果URLに該当するウェブサイトのカテゴリ分類体系から抽出されるか、各URLに該当するウェブページのタイトルまたはコンテンツにより抽出されてもよい。
以後、ステップ120でウェブページの主題により検索結果URLを1つ以上のグループに分類し、それにより共通する主題を有する検索結果URLを1つのグループに分類する。そして、ステップ125において、各グループごとにグループ情報を生成する。本発明の一実施形態において、各グループのグループ情報を、各グループの主題を用いて決定してもよい。例えば、映画に関連する主題のグループ情報は映画に決定され、ゲームに関連する主題のグループ情報はゲームに決定される。
次に、ステップ130で、生成されたグループ情報を用いて各クエリ別に検索コレクションを生成する。ここで、検索コレクションとは、ニュース、イメージ、ブログのような検索結果を順位付けするための一基準となりうる情報を意味する。例えば、「スパイダーマン」というクエリに対して「映画」というグループ情報を有するグループと「ゲーム」というグループ情報を有するグループが生成された時、「スパイダーマン」というクエリに対して「映画」及び「ゲーム」の検索コレクションを生成する。このような過程を介して各々のクエリごとに特定の検索コレクションが生成されるようになる。
ステップ140において、生成された検索コレクションを該当クエリとマッピングして格納する。この時、検索コレクションは、図2に示すような構造で格納されてもよい。具体的に、クエリフィールドに該当クエリが記録され、検索コレクションフィールドに各検索結果URLのグループ情報を用いて生成された検索コレクションが記録される。
本発明の一実施形態において、前述した検索コレクション生成方法の各過程を所定周期ごとに繰り返し行うことで、所定の周期ごとに検索コレクションをアップデートすることができる。結果として、データアップデート機能を通じて、各クエリに対するユーザの検索意図を素早く反映することができる。所定の周期ごとにログ格納部からデータを獲得することで、データ格納部に格納されているデータをアップデートし、アップデートされた検索結果URLが再び分類される。したがって、変更、削除、または追加されたグループのグループ情報を用いて検索コレクションを変更、削除、または追加してもよい。
図5は、本発明の一実施形態に係るクエリ別検索コレクションにより分類された検索結果リストを提供する方法を示すフローチャートである。
上述したように、検索コレクション生成システムを、検索機能が行える検索システム(図示せず)と連動させてもよいし、検索機能を行うための検索部を検索コレクション生成システム内部に含めてもよいし、または検索コレクション生成システムを検索システムに含めてもよい。
まず、ステップ200でユーザから検索のためのクエリを受信した場合、ステップ210において、受信したクエリについて検索データベース23を用いて検索を行うことによって検索結果リストを生成する。そして、ステップ220においてユーザから受信したクエリが検索コレクション格納部18に格納されているかを判断する。ユーザから受信したクエリが検索コレクション格納部18に格納されている場合、ステップ230で、該当クエリにマッピングされている検索コレクションを検索コレクション格納部18から読み出す。
次に、ステップ240において、読み出された検索コレクションを用いてステップ210で生成された検索結果リストを分類する。そして、ステップ250で分類された検索結果リストをユーザに提供する。この場合に、読み出された検索コレクションに含まれない検索結果URLは、別グループにグループ化して所定領域において表示されることでユーザに提供されてもよい。
本発明の一実施形態においては、ユーザに検索結果リストを提供する際に、クエリにマッピングされている検索コレクションの重要度によって検索結果リストが分類される。すなわち、重要度が高い検索コレクションが検索結果の上位にランク付けされる。このため、本発明の一実施形態に係る検索コレクション生成方法は、該当クエリにマッピングされている検索コレクションの重要度を算出するステップをさらに含んでもよい。
この時、検索コレクションの重要度は、該当クエリのグループに含まれる検索結果URLの個数を用いて各グループの占める比率に基づいて算出される。より具体的には、各クエリに対してマッピングされている検索結果URLの総数と特定グループに含まれている検索結果URLの個数を用いて検索結果リスト全体において各グループが占める比率を演算する。したがって、該当グループの比率に基づいて、該当グループのグループ情報とマッピングされている検索コレクションの重要度が判断される。
一方、ステップ220でユーザから受信したクエリが検索コレクション格納部18に格納されていないと判断される場合、ステップ260において、一般的な検索コレクションを用いて検索結果リストを表示し、表示された検索結果をステップ250でユーザに提供する。
上述したクエリ別検索コレクション生成方法は、さまざまなコンピュータ手段を用いて実行されることのできるプログラムの形態によっても実行することができる。検索結果提供方法を実行するためのプログラムは、ハードディスク、CD−ROM、DVD、ROM、RAM、またはフラッシュメモリのようなコンピュータで読み取ることのできる記録媒体に格納される。
上述した本発明の実施形態においては、各検索結果URLに該当するウェブページの主題に基づいて検索結果URLが分類される。本発明の変形された実施形態においては、検索結果URLを、ウェブページの含まれたウェブサイトのタイプによって、例えば、各検索結果URLに該当するウェブページが含まれたウェブサイトがブログか、掲示板か、または一般のウェブサイトであるかによって分類してもよい。本発明の他の実施形態において、検索結果URLを、ウェブページの形式によって、例えば検索結果URLに該当するウェブページがイメージか、テキストか、または動画であるかによって分類してもよい。
本発明の属する技術分野の通常の知識を有する者であれば、本発明がその技術的思想や範囲を変更せずに、多様な変更又は変形された形態で実施できることを理解するであろう。したがって、本発明の範囲は、前記詳細な説明よりは添付の特許請求の範囲によって示され特許請求の範囲、およびその等価概念から導き出される変更または変形された形態が本発明の範囲に含まれる。

Claims (23)

  1. ユーザ端末に接続され、当該ユーザ端末から送信されるユーザからの入力を受信するコンピュータにおけるクエリ別検索コレクション生成方法であって、
    前記コンピュータが、受信した第1クエリおよび前記第1クエリに対して生成された複数の検索結果リストから、ユーザからの入力によって選択された検索結果を獲得し、
    前記コンピュータが、獲得した前記第1クエリと前記検索結果とを互いにマッピングしてデータ格納部に格納し、
    前記コンピュータが、前記第1クエリに夫々マッピングされた複数の前記検索結果を1つ以上のグループに分類し、
    前記コンピュータが、各グループ別に、前記第1クエリに関連する検索コレクションを生成して検索コレクション格納部に格納する
    ことを特徴とするクエリ別検索コレクション生成方法。
  2. 前記検索結果は、検索結果のURLである
    ことを特徴とする請求項1に記載のクエリ別検索コレクション生成方法。
  3. 前記検索結果の分類において、前記検索結果に該当する各ウェブページの主題が共通する検索結果を同一のグループに分類する
    ことを特徴とする請求項1に記載のクエリ別検索コレクション生成方法。
  4. 前記検索結果に該当する前記各ウェブページの前記主題は、前記検索結果に該当する各ウェブページのカテゴリ分類体系から抽出される
    ことを特徴とする請求項3に記載のクエリ別検索コレクション生成方法。
  5. 前記検索結果に該当する前記各ウェブページの前記主題は、前記検索結果に該当する前記各ウェブページのタイトルまたはコンテンツのうち少なくとも1つから抽出される
    ことを特徴とする請求項3に記載のクエリ別検索コレクション生成方法。
  6. 前記検索コレクションを生成する前に、さらに各グループ別にグループ情報を生成し、
    前記第1クエリの前記検索コレクションは各グループ別のグループ情報を用いて生成する
    ことを特徴とする請求項1に記載のクエリ別検索コレクション生成方法。
  7. 前記各グループ別のグループ情報は、前記検索結果に該当する前記各ウェブページの主題を用いて生成する
    ことを特徴とする請求項6に記載のクエリ別検索コレクション生成方法。
  8. さらに、前記ユーザから第2クエリを受信し、
    前記第2クエリが前記第1クエリと同一である場合、前記第1クエリの前記検索コレクションにより前記第2クエリに対する検索結果を分類して提供する
    ことを特徴とする請求項1に記載のクエリ別検索コレクション生成方法。
  9. さらに、前記第2クエリに前記検索結果を提供する前に、前記第2クエリの前記検索結果における各グループが占める比率を算出し、
    比率の高いグループに該当する前記検索コレクションを比率の低いグループに該当する前記検索コレクションよりも検索結果の上位に配置する
    ことを特徴とする請求項8に記載のクエリ別検索コレクション生成方法。
  10. 前記各グループが占める比率は、前記検索結果の総数と前記各グループに含まれる検索結果の個数によって算出される
    ことを特徴とする請求項9に記載のクエリ別検索コレクション生成方法。
  11. さらに、前記検索コレクションの生成後に、前記第1クエリの検索コレクションを前記第1クエリにマッピングする
    ことを特徴とする請求項1に記載のクエリ別検索コレクション生成方法。
  12. さらに、前述した各手順を所定周期ごとに繰り返し行うことによって、格納された検索コレクションを削除または変更したり、新しい検索コレクションをさらに生成して格納したりする
    ことを特徴とする請求項11に記載のクエリ別検索コレクション生成方法。
  13. ユーザ端末に接続され、当該ユーザ端末から送信されるユーザからの入力を受信するコンピュータに、
    前記コンピュータが受信した第1クエリおよび前記第1クエリに対して生成された複数の検索結果のリストから、ユーザからの入力によって選択された検索結果を獲得させ、
    獲得した前記第1クエリと前記検索結果とを互いにマッピングしてデータ格納部に格納させ、
    前記第1クエリに夫々マッピングされた複数の前記検索結果を1つ以上のグループに分類させ、
    各グループ別に、前記第1クエリに関連する検索コレクションを生成して検索コレクション格納部に格納させる
    クエリ別検索コレクション生成プログラムが格納されたコンピュータで読み取り可能な記録媒体。
  14. 第1クエリおよび前記第1クエリに対して生成された複数の検索結果リストのうちからユーザによって選択された検索結果を獲得するデータ抽出部と、
    前記データ抽出部が獲得した前記第1クエリとを互いにマッピングして格納するデータ格納部と、
    前記第1クエリに夫々マッピングされた複数の前記検索結果を1つ以上のグループに分類する検索結果分類部と、
    各グループ別に前記第1クエリの検索コレクションを生成する検索コレクション生成部と
    を含むことを特徴とするクエリ別検索コレクション生成システム。
  15. 前記検索結果は、検索結果のURLである
    ことを特徴とする請求項14に記載のクエリ別検索コレクション生成システム。
  16. 前記検索結果分類部は、主題が共通する前記検索結果を同一のグループに分類する
    ことを特徴とする請求項14に記載のクエリ別検索コレクション生成システム。
  17. 前記検索結果に該当する各ウェブページの前記主題は、前記検索結果に該当する各ウェブページのタイトルまたはコンテンツのうち少なくとも1つから抽出されるか、又は前記各ウェブサイトのカテゴリ分類体系から抽出される
    ことを特徴とする請求項16に記載のクエリ別検索コレクション生成システム。
  18. 前記検索結果分類部は、各グループ別にグループ情報を生成し、
    前記検索コレクション生成部は、前記各グループ別のグループ情報を用いて前記第1クエリに前記検索コレクションを生成する
    ことを特徴とする請求項14に記載のクエリ別検索コレクション生成システム。
  19. 前記検索結果分類部は、前記各グループ別のグループ情報により前記検索結果に該当する前記各ウェブページの前記主題を生成する
    ことを特徴とする請求項18に記載のクエリ別検索コレクション生成システム。
  20. 前記ユーザから第2クエリを受信するクエリ受信部と、
    前記第2クエリを用いて検索を行い、前記第2クエリに対する検索コレクションを生成する検索部と、
    前記第2クエリが前記第1クエリと同一である場合、前記第1クエリの検索コレクションにより前記第2クエリに対する検索結果を分類してユーザに提供する検索結果提供部と
    をさらに含むことを特徴とする請求項14に記載のクエリ別検索コレクション生成システム。
  21. 前記データ抽出部によって獲得された前記検索結果における各グループが占める比率を算出する演算部をさらに含み、
    前記検索結果提供部は前記比率が高いグループのグループ情報に該当する検索コレクションを前記第2クエリに対して生成される検索結果の上位に配置する
    ことを特徴とする請求項20に記載のクエリ別検索コレクション生成システム。
  22. 前記演算部は、前記索結果の総数と前記各グループに含まれる検索結果の個数を用いて前記各グループが占める比率を算出する
    ことを特徴とする請求項21に記載のクエリ別検索コレクション生成システム。
  23. 前記第1クエリの前記検索コレクションを前記第1クエリにマッピングする検索コレクション保存部をさらに含む
    ことを特徴とする請求項14に記載のクエリ別検索コレクション生成システム。
JP2010523931A 2007-09-06 2008-08-04 クエリ別検索コレクション生成方法およびシステム Active JP5147947B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2007-0090460 2007-09-06
KR1020070090460A KR100930455B1 (ko) 2007-09-06 2007-09-06 쿼리별 검색 컬렉션 생성 방법 및 시스템
PCT/KR2008/004525 WO2009031759A1 (en) 2007-09-06 2008-08-04 Method and system for generating search collection of query

Publications (2)

Publication Number Publication Date
JP2010538386A JP2010538386A (ja) 2010-12-09
JP5147947B2 true JP5147947B2 (ja) 2013-02-20

Family

ID=40429052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010523931A Active JP5147947B2 (ja) 2007-09-06 2008-08-04 クエリ別検索コレクション生成方法およびシステム

Country Status (4)

Country Link
US (1) US8463785B2 (ja)
JP (1) JP5147947B2 (ja)
KR (1) KR100930455B1 (ja)
WO (1) WO2009031759A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727454A (zh) * 2008-10-30 2010-06-09 日电(中国)有限公司 用于对象自动分类的方法和系统
CN101887437B (zh) 2009-05-12 2016-03-30 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
US8615509B2 (en) * 2009-12-11 2013-12-24 Blackberry Limited Abstracting information from a device
US8930351B1 (en) * 2010-03-31 2015-01-06 Google Inc. Grouping of users
US8639773B2 (en) * 2010-06-17 2014-01-28 Microsoft Corporation Discrepancy detection for web crawling
CN103092857A (zh) * 2011-11-01 2013-05-08 腾讯科技(深圳)有限公司 历史记录的整理方法和装置
WO2014036074A1 (en) * 2012-08-28 2014-03-06 Visa International Service Association Protecting assets on a device
CN103049497A (zh) * 2012-12-07 2013-04-17 北京奇虎科技有限公司 用于网址导航的方法和装置
US9348922B2 (en) * 2013-05-17 2016-05-24 Google Inc. Ranking channels in search
WO2015027380A1 (en) * 2013-08-26 2015-03-05 Google Inc. In-market classification for online content item placement campaigns
KR101553848B1 (ko) * 2014-02-17 2015-09-17 네이버 주식회사 검색 결과를 제공하는 방법 및 상기 방법을 수행하는 시스템
JP6132220B1 (ja) * 2016-08-18 2017-05-24 株式会社セガゲームス 情報処理装置及びプログラム
CN107657005B (zh) * 2017-09-22 2020-03-20 浪潮云信息技术有限公司 一种主题网页的检索方法及装置
JP6871208B2 (ja) * 2018-09-06 2021-05-12 ヤフー株式会社 監視装置、ショッピングサーバ、監視方法、及びプログラム

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415282B1 (en) * 1998-04-22 2002-07-02 Nec Usa, Inc. Method and apparatus for query refinement
WO2001016842A1 (en) * 1999-08-31 2001-03-08 Eliberation.Com Corporation Methods and systems for a dynamic networked commerce architecture
US7269545B2 (en) * 2001-03-30 2007-09-11 Nec Laboratories America, Inc. Method for retrieving answers from an information retrieval system
KR20030066064A (ko) * 2002-02-04 2003-08-09 야후코리아 주식회사 검색어에 따라 다른 유저 인터페이스로 검색결과를디스플레이하는 인터넷 검색 서비스 시스템 및 그 검색방법
JP2004029943A (ja) * 2002-06-21 2004-01-29 Recruit Co Ltd 検索支援方法
US7152059B2 (en) * 2002-08-30 2006-12-19 Emergency24, Inc. System and method for predicting additional search results of a computerized database search user based on an initial search query
US20060005141A1 (en) * 2002-10-09 2006-01-05 Koninklijke Philips Electronics N.V. System, method, computer program product, and storage device for enabling a user to manipulate a user interface
US7523095B2 (en) * 2003-04-29 2009-04-21 International Business Machines Corporation System and method for generating refinement categories for a set of search results
US7613687B2 (en) * 2003-05-30 2009-11-03 Truelocal Inc. Systems and methods for enhancing web-based searching
KR20030051577A (ko) * 2003-06-11 2003-06-25 진영수 검색사이트의 검색결과 표시방법
JP2005182280A (ja) * 2003-12-17 2005-07-07 Ibm Japan Ltd 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム
US20050144065A1 (en) * 2003-12-19 2005-06-30 Palo Alto Research Center Incorporated Keyword advertisement management with coordinated bidding among advertisers
US7447678B2 (en) * 2003-12-31 2008-11-04 Google Inc. Interface for a universal search engine
JP4453437B2 (ja) 2004-05-11 2010-04-21 日本電信電話株式会社 検索キーワード順位付け方法及び装置及びプログラム
US7562069B1 (en) * 2004-07-01 2009-07-14 Aol Llc Query disambiguation
JP5060020B2 (ja) * 2004-10-29 2012-10-31 株式会社エヌ・ティ・ティ・ドコモ コンテンツ発見装置
EP1854030A2 (en) * 2005-01-28 2007-11-14 Aol Llc Web query classification
WO2006107141A1 (en) * 2005-03-04 2006-10-12 Chutnoon Inc. Server, method and system for providing information search service by using sheaf of pages
KR100797041B1 (ko) * 2005-03-23 2008-01-23 조광현 분류된 웹 사이트 검색 시스템 및 방법
US20070022111A1 (en) * 2005-07-20 2007-01-25 Salam Aly A Systems, methods, and computer program products for accumulating, storing, sharing, annotating, manipulating, and combining search results
KR100721406B1 (ko) * 2005-07-27 2007-05-23 엔에이치엔(주) 카테고리별 검색 로직을 이용한 상품 검색 시스템 및 방법
IL172551A0 (en) * 2005-12-13 2006-04-10 Grois Dan Method for assigning one or more categorized scores to each document over a data network
JP2007172375A (ja) 2005-12-22 2007-07-05 Shoji Kodama 情報検索システム及び方法
US20070192293A1 (en) * 2006-02-13 2007-08-16 Bing Swen Method for presenting search results
US7571162B2 (en) * 2006-03-01 2009-08-04 Microsoft Corporation Comparative web search
US7774345B2 (en) * 2007-06-27 2010-08-10 Microsoft Corporation Lightweight list collection
US7877404B2 (en) * 2008-03-05 2011-01-25 Microsoft Corporation Query classification based on query click logs

Also Published As

Publication number Publication date
US20100257169A1 (en) 2010-10-07
KR20090025535A (ko) 2009-03-11
US8463785B2 (en) 2013-06-11
KR100930455B1 (ko) 2009-12-08
JP2010538386A (ja) 2010-12-09
WO2009031759A1 (en) 2009-03-12

Similar Documents

Publication Publication Date Title
JP5147947B2 (ja) クエリ別検索コレクション生成方法およびシステム
US20190340207A1 (en) Systems and methods for personalizing aggregated news content
US8990210B2 (en) Propagating information among web pages
JP5634067B2 (ja) 検索結果にコレクションアイテムを含めるための技術
US7761423B1 (en) System and method for indexing a network of interrelated elements
US7653623B2 (en) Information searching apparatus and method with mechanism of refining search results
US8832058B1 (en) Systems and methods for syndicating and hosting customized news content
JP5550669B2 (ja) 検索装置、検索方法およびプログラム
CN102054003A (zh) 网络信息推荐、建立网络资源索引的方法及系统
US9667505B2 (en) URL navigation page generation method, device and program
JP6185379B2 (ja) レコメンド装置およびレコメンド方法
KR101122737B1 (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
KR100636227B1 (ko) 컨텐츠 탐색을 위한 디렉토리 구조 생성 방법
JP2005056371A (ja) Web検索情報の管理方法、管理システム、コンピュータソフトウェアプログラム
KR20010095215A (ko) 사이트 정보 데이터베이스 구축을 통한 인터넷 상에서의정보 검색 방법
KR100953491B1 (ko) 최신정보 제공 방법 및 시스템
JP2006235882A (ja) 複数情報の閲覧方法およびシステム
JP2002157278A (ja) ディレクトリ編集型情報検索装置、情報検索方法及びディレクトリ編集型情報検索プログラムを格納した記録媒体
KR20100115436A (ko) 시청각 정보와 콘텐츠 정보의 교차 검색 서비스를 제공하는 방법 및 시스템
JP2002108616A (ja) プログラム記録媒体、知識管理方法及び知識入力方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121127

R150 Certificate of patent or registration of utility model

Ref document number: 5147947

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250