JP2011138248A - 検索支援プログラム、検索支援装置、及び検索支援方法 - Google Patents

検索支援プログラム、検索支援装置、及び検索支援方法 Download PDF

Info

Publication number
JP2011138248A
JP2011138248A JP2009296732A JP2009296732A JP2011138248A JP 2011138248 A JP2011138248 A JP 2011138248A JP 2009296732 A JP2009296732 A JP 2009296732A JP 2009296732 A JP2009296732 A JP 2009296732A JP 2011138248 A JP2011138248 A JP 2011138248A
Authority
JP
Japan
Prior art keywords
search
log
url
word
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009296732A
Other languages
English (en)
Other versions
JP5493845B2 (ja
Inventor
Satoko Shiga
聡子 志賀
Tomoya Iwakura
友哉 岩倉
Takehisa Ando
剛寿 安藤
Aoshi Okamoto
青史 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009296732A priority Critical patent/JP5493845B2/ja
Priority to US12/968,947 priority patent/US20110161336A1/en
Publication of JP2011138248A publication Critical patent/JP2011138248A/ja
Application granted granted Critical
Publication of JP5493845B2 publication Critical patent/JP5493845B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】追加的に付加すべき検索語をユーザの検索目的に応じて適切に選択すること。
【解決手段】コンピュータに、入力語とURLとを受付ける受付手順と、閲覧された情報のURLごとに該情報の検索に使用された検索語を含むログを記憶した検索ログ記憶手段より、前記受け付けたURLと所定の部分が共通するURLを含み、かつ、前記受け付けた入力語と所定の部分が共通する検索語を含むログを取得するログ取得手順と、前記取得されたログに含まれる検索語を出力する出力手順とを実行させる。
【選択図】図1

Description

本発明は、検索支援プログラム、検索支援装置、及び検索支援方法に関し、特に検索語の拡張を支援する検索支援プログラム、検索支援装置、及び検索支援方法に関する。
従来、インターネット上のサーチエンジン(キーワード検索機能を提供するWebサイト)では、キーワードを入力すると当該キーワードに関連する単語が追加的な付加されるキーワード(以下、「拡張語」という。)の候補として提示される。拡張語として提示すべき単語は、例えば、過去に2以上のキーワードが同時に入力された際のログに基づいて選択される。具体的には、「中華 作り方」、「中華 中原飯店」、「中華 飲茶」、「中華 歴史」等のキーワードがログとして蓄積されている場合に、「中華」がキーワードとして入力されると、「作り方」、「中原飯店」、「飲茶」、及び「歴史」等の単語が拡張語の候補とされる。
特開2004−259083号公報 特開2004−54918号公報 特開2007−133688号公報
しかしながら、キーワードとして入力される単語は、検索の目的に応じて様々な分野の単語と組み合わされる。その結果、同一のキーワードに対して様々な分野の単語と組み合わされたログが蓄積される。斯かるログに基づいて単純に拡張語の候補が選択された場合、選択された候補の中にはユーザの検索目的とは極めて関係の薄い分野に属する単語まで拡張語の候補に含まれてしまうという問題がある。具体的には、「中華」という単語をキーワードとして入力した場合、料理を作りたいのか、レストランを探しているのか、歴史を知りたいのか等の目的に応じて、追加されるべき拡張語は異なってくるはずである。それにも拘わらず、過去に「中華」と共に入力された単語であれば、あらゆる分野の単語が「中華」に対する拡張語の候補とされてしまうのは、拡張語の提示による操作性の向上といった効果を低減させてしまう。
本発明は、上記の点に鑑みてなされたものであって、追加的に付加すべき検索語をユーザの検索目的に応じて適切に選択することのできる検索支援プログラム、検索支援装置、及び検索支援方法の提供を目的とする。
そこで上記課題を解決するため、検索支援プログラムは、コンピュータに、入力語とURLとを受付ける受付手順と、閲覧された情報のURLごとに該情報の検索に使用された検索語を含むログを記憶した検索ログ記憶手段より、前記受け付けたURLと所定の部分が共通するURLを含み、かつ、前記受け付けた入力語と所定の部分が共通する検索語を含むログを取得するログ取得手順と、前記取得されたログに含まれる検索語を出力する出力手順とを実行させる。
開示された技術によれば、追加的に付加すべき検索語をユーザの検索目的に応じて適切に選択することができる。
本発明の実施の形態における検索システムの構成例を示す図である。 本発明の実施の形態における検索サーバのハードウェア構成例を示す図である。 第一の実施の形態における検索ログの記録処理の処理手順を説明するためのフローチャートである。 検索ページの表示例を示す図である。 検索結果ページの表示例を示す図である。 第一の実施の形態における検索ログ記憶部の構成例を示す図である。 第一の実施の形態における検索ログの分類処理の処理手順を説明するためのフローチャートである。 第一の実施の形態における分類済み検索ログ記憶部の構成例を示す図である。 第一の実施の形態における拡張語の選択処理の処理手順を説明するためのフローチャートである。 第一の実施の形態における拡張語の選択処理の具体例を示す図である。 第一の実施の形態における拡張語の提供方法の第一の例を説明するための図である。 第一の実施の形態における拡張語の提供方法の第二の例を説明するための図である。 第二の実施の形態における拡張語の選択処理の処理手順を説明するためのフローチャートである。 第二の実施の形態における拡張語の提供方法の例を説明するための図である。 検索範囲とする分野をユーザに選択させるためのユーザインタフェースの例を示す図である。 第三の実施の形態における検索ログ記憶部の構成例を示す図である。 第三の実施の形態における分類済み検索ログ記憶部の構成例を示す図である。 第三の実施の形態におけるグループセットの分類処理の処理手順を説明するためのフローチャートである。 セッションID・キーワード組み合わせリストの例を示す図である。 同一検索リストの例を示す図である。 グループセット判定テーブルの構成例を示す図である。 第三の実施の形態における拡張語の選択処理の処理手順を説明するためのフローチャートである。 グループセット判定処理の処理手順を説明するためのフローチャートである。
以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態における検索システムの構成例を示す図である。同図において、検索サーバ10とクライアント端末20とは、インターネット等のネットワークを介して通信可能に接続されている。
クライアント端末20は、ユーザが利用するPC(Personal Computer)又は携帯端末等の電子機器である。本実施の形態において、クライアント端末20は、検索サーバ10に対して検索要求を送信し、検索要求に応じて返信される検索結果を表示させるWebブラウザを有する。なお、クライアント端末20は、複数存在しうる。
検索サーバ10は、インターネット上においてサーチエンジンとしてのWebサイトを提供するための機能を有するコンピュータである。同図において、検索サーバ10は、検索ログ記録部11、検索ログ分類部12、検索部13、検索目的判定部14、拡張語選択部15、表示制御部16、検索ログ記憶部17、分類済み検索ログ記憶部18、及び文書情報DB19等を有する。これら各部は、検索サーバ10にインストールされたプログラムが、検索サーバ10のCPUに実行させる処理によって実現される。
検索ログ記録部11は、検索時におけるユーザの操作を示す履歴情報(以下、「検索ログ」という。)を検索ログ記憶部17に記録する。検索ログは、閲覧された情報のURL(Uniform Resource Locator)と、当該情報の検索に使用された検索語を含むデータである。換言すれば、検索ログは、入力された検索キーワード(検索語)と、検索結果の中のいずれの情報がジャンプ先又は遷移先(すなわち、閲覧対象)として選択されたかを示す情報(ジャンプ先URL)とを含む。
検索ログ記憶部17は、補助記憶装置102において検索ログを記憶する記憶領域である。検索ログ分類部12は、検索ログ記憶部17に記録された検索ログを、ジャンプ先URLの共通性に基づいて分類する。例えば、検索ログ分類部12は、ジャンプ先URLの所定の部分が共通する検索ログ同士を同一グループに分類し、分類結果を分類済み検索ログ記憶部18に記録する。分類済み検索ログ記憶部18は、補助記憶装置102において検索ログの分類結果を記憶する記憶領域である。検索部13は、検索キーワードに基づいて文書情報DB19に対する検索を実行する。文書情報DB19は、補助記憶装置102を用いて、インターネット上で公開されている情報のインデックス情報等を記憶するデータベースである。検索目的判定部14は、検索を行うユーザの目的(検索目的)を判定又は推定する。拡張語選択部15は、ユーザの検索目的に応じた拡張語の選択を行う。本実施の形態において、拡張語とは、検索キーワードとして追加的に付加される文字列(一文字も含む。)をいう。拡張語は、検索目的に応じて検索範囲を限定し、検索目的に即した検索結果を得るために利用される。表示制御部16は、検索キーワードを入力させるための画面(Webページ)や、検索結果を表示させるための画面(Webページ)等の生成及びクライアント端末20への転送等を行う。
図2は、本発明の実施の形態における検索サーバのハードウェア構成例を示す図である。図2の検索サーバ10は、それぞれバスBで相互に接続されているドライブ装置100と、補助記憶装置102と、メモリ装置103と、CPU104と、インタフェース装置105とを有する。
検索サーバ10での処理を実現するプログラムは、CD−ROM等の記録媒体101によって提供される。プログラムを記録した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って検索サーバ10に係る機能を実行する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。
以下、検索システムの処理手順について説明する。図3は、第一の実施の形態における検索ログの記録処理の処理手順を説明するためのフローチャートである。
ステップS101において、検索部13は、検索キーワードを含む検索要求をクライアント端末20のWebブラウザより受信する。検索部13は、Webブラウザとの間のセッションを識別するためのセッションIDと時間情報とに関連付けて検索キーワードをメモリ装置103に記録しておく。各Webブラウザを識別するための識別情報をセッションIDの代わりに用いてもよい。
なお、検索キーワードは、ステップS101の実行前にクライアント端末20のWebブラウザに対して検索サーバ10より提供されている検索ページを介して入力される。
図4は、検索ページの表示例を示す図である。同図において、検索ページ510は、キーワード入力領域511及び検索ボタン512等を有する。キーワード入力領域511に検索キーワードが入力され、検索ボタン512がクリックされると、Webブラウザは、入力された検索キーワードを含む検索要求を検索サーバ10に送信する。なお、検索キーワードは、一つ以上の単語を含む文字列である。例えば、複数の単語がスペース等によって区切られてキーワード入力領域に入力された場合、ステップS101では、複数の単語を含む文字列が検索キーワードとして受信される。
続いて、検索部13は、文書情報DB19に対して、検索キーワードに基づく検索を実行し、検索結果を出力する(S102)。検索結果は、例えば、インターネット上で公開されている情報ごとに当該情報のURLを含む。検索ロジックや複数の検索キーワードに含まれる複数の単語の関係(論理積か論理和か等)をどのように扱うか等に関しては、公知技術に従えばよい。
続いて、表示制御部16は、検索部13による検索結果を表示させるためのWebページ(以下、「検索結果ページ」という。)を生成し、検索結果ページをWebブラウザに返信する(S103)。その結果、クライアント端末20のWebブラウザには検索結果ページが表示される。
図5は、検索結果ページの表示例を示す図である。同図において、検索結果ページ520は、キーワード入力領域521、検索ボタン522、及び検索結果表示領域523等を有する。キーワード入力領域521には、検索ページ510のキーワード入力領域511に入力された検索キーワードが表示されている。但し、キーワード入力領域521の検索キーワードを変更し、検索ボタン522をクリックすることで、再度検索を実行させることもできる。検索結果表示領域523には、検索された情報の一覧が表示される。各情報には、当該情報のURLに対するリンク(ハイパーリンク)が貼られている。
続いて、ユーザが、検索結果ページ520上のいずれかのリンクをクリック(選択)すると、Webブラウザは、クリックされたリンクに設定されたURLによって識別される情報の取得要求を送信する。検索サーバ10の検索ログ記録部11は、当該取得要求を受信する(S104)。なお、当該取得要求が、クリックされたリンクに設定されているURL(ジャンプ先のURL)宛ではなく、検索サーバ10宛に送信されるようにするための仕組みは、公知技術に従えばよい。
続いて、検索サーバ10の検索ログ記録部11は、検索キーワードと、受信された取得要求に含まれているジャンプ先のURLとを関連付けて検索ログ記憶部17に記録する(S105)。ここで記録される検索キーワードは、当該取得要求に含まれているセッションID及び時間情報に関連付けられてRAM113に記録されているものである。
図6は、第一の実施の形態における検索ログ記憶部の構成例を示す図である。同図に示されるように、検索ログ記憶部17は、過去に行われた検索に関して、検索キーワードと、ジャンプ先URLとの組を検索ログとして記憶する。同図では、複数の単語が検索キーワードに含まれている場合、各単語はスペースによって区切られている。
続いて、検索ログ分類部12は、検索ログ記憶部17に新たに追加された検索ログに関して、分類処理を実行する(S106)。検索ログの分類処理の詳細については後述される。
なお、ステップS105及びS106の実行後、又はステップS105及びS106と並行して、ジャンプ先URL宛に対して情報の取得要求が転送される。当該取得要求に応じて、当該URLによって識別される情報(例えば、Webページ)がWebブラウザに返信される。
続いて、図3のステップS106の詳細について説明する。図7は、第一の実施の形態における検索ログの分類処理の処理手順を説明するためのフローチャートである。
ステップS201において、検索ログ分類部12は、図3のステップS105において新たに記録された検索ログのジャンプ先URL所定の部分(例えば、上位の一部分)を抽出する。ここでは、所定の部分としてホスト名が抽出されることとする。続いて、検索ログ分類部12は、抽出されたホスト名をグループ識別子として当該検索ログに付与したレコードを分類済み検索ログ記憶部18に記録する(S202)。なお、グループ識別子は、検索ログをグループ分けした場合のグループの異同を識別するための情報として利用される。インターネット上において、情報の位置はURLによって識別される。したがって、URLの共通性と情報の内容の共通性との間には強い依存関係があると考えられるからである。
図8は、第一の実施の形態における分類済み検索ログ記憶部の構成例を示す図である。同図に示されるように、分類済み検索ログ記憶部18は、検索ログ記憶部17に比較して、グループ識別子の項目(列)を更に有する。すなわち、分類済み検索ログ記憶部18においては、各検索ログのジャンプ先URLより抽出されたグループ識別子が、各検索ログに関連付けられて記録されている。各検索ログにグループ識別子が付与されることにより、各検索ログはグループに分類される。すなわち、グループ識別子が一致する(共通する)検索ログは、同一のグループに属する。なお、同図では、一つのテーブルによって示されているが、グループ識別子ごと(すなわち、グループごと)にテーブルが分けられてもよい。また、グループ識別子は、必ずしもジャンプ先URLのホスト名でなくてもよい。例えば、ホスト名+最初の「/」まで等、他の規則に基づいて決定されてもよい。また、ジャンプ先URLに対して公知のクラスタリングアルゴリズムを適用することにより、グループ識別子が決定されてもよい。
図7の処理は、図3の処理と非同期に実行されてもよい。例えば、分類済み検索ログ記憶部18は、定期的に検索ログ記憶部17を参照し、グループ識別子が付与されていない検索ログについて、図7の処理をバッチ的に実行してもよい。
続いて、新たに検索が行われる際に入力された検索キーワードに対する拡張語(の候補)を選択するための処理の処理手順について説明する。図9は、第一の実施の形態における拡張語の選択処理の処理手順を説明するためのフローチャートである。図9中、図3と同一ステップには同一ステップ番号を付し、その説明は適宜省略する。
検索結果ページ520におけるリンクに対するクリックに応じてWebブラウザより送信される情報の取得要求の受信に応じ(S104)、検索サーバ10の検索目的判定部14は、当該取得要求に含まれているジャンプ先URLの所定の部分を抽出する(S301)。当該所定の部分の抽出規則は、図7のステップS201における抽出規則と同じである。したがって、本実施の形態では、ホスト名が抽出される。検索目的判定部14によって抽出された、今回の検索結果からのジャンプ先URLの所定の部分(ホスト名)は、ユーザの今回の検索目的を判別するための識別情報として用いられる。
すなわち、続くステップS303において、拡張語選択部15は、抽出されたホスト名と一致するグループ識別子を有する検索ログ(レコード)を分類済み検索ログ記憶部18より取得する。なお、ステップS303において、抽出されたホスト名と一致するホスト名を有する検索ログが検索ログログ記憶部17より取得されてもよい。すなわち、検索ログ分類部12による検索ログの分類(検索ログに対するグループ識別子の付与)は予め行われなくてもよい。但し、分類済み検索ログ記憶部18が利用されることで、ステップS303の処理速度を向上させることができる。
続いて、拡張語選択部15は、取得された検索ログの集合から、今回の検索要求において指定された検索キーワード(以下、「基本キーワード」という。)を含む検索ログを抽出する(S305)。基本キーワードは、ステップS104の取得要求に含まれているセッションIDに関連付けられてメモリ装置103に記録されている検索キーワードである。基本キーワードは、図3において説明したように、ステップS101において検索部13によってメモリ装置103に記録される。なお、基本キーワードには、一つの単語のみが含まれていてもよいし、複数の単語が含まれていてもよい。
続いて、拡張語選択部15は、抽出された検索ログに含まれている検索キーワードより基本キーワードに含まれている単語を除去した文字列を、拡張語として選択する(S307)。拡張語選択部15は、選択された拡張語を、検索要求に含まれているセッションIDに関連付けてメモリ装置103に記録しておく。
なお、図9のステップS104以降において、図3で説明したステップS105及びS106の処理も実行される。ステップS105及びS106の実行のタイミングは、ステップS301〜S307より前でもよいし、後でもよい。
ステップS301〜S307の処理について具体例を示す。図10は、第一の実施の形態における拡張語の選択処理の具体例を示す図である。同図の説明において、基本キーワードは「自由が丘」であるとする。また、「自由が丘」による検索結果からのジャンプ先URLは、「http://gourmet.jp/3152626/」であるとする。この場合、ステップS301において、当該ジャンプ先URLより「http://gourmet.jp/」が抽出される。したがって、ステップS303では、グループ識別子として「http://gourmet.jp/」が付与されている検索ログ群L1が、分類済み検索ログ記憶部18より取得される。なお、図10中、ブロック矢印内の文字列は、図9に対応するステップ番号を示す。
続いて、検索ログ群1L1の中で、基本キーワード「自由が丘」を検索キーワードに含む検索ログ群1L2が抽出される(S305)。続いて、検索ログ群L2に含まれている検索キーワードより、基本キーワード「自由が丘」を除去した文字列群W1が拡張語として選択される。
選択された拡張語のクライアント端末20への提供方法の一例を図11〜図14に示す。図11は、第一の実施の形態における拡張語の提供方法の第一の例を説明するための図である。
図5に示される検索結果ページ520においていずれかのリンクがクリックされると、クリックされたリンクに係る情報がWebブラウザに表示される。その後、Webブラウザの「戻る」ボタン(以前に表示していた情報を表示させるためのボタン)がクリックされると、検索結果ページ520は、図11に示される態様で表示される。同図の検索結果ページ520は、更に、拡張語表示領域524を有する。拡張語表示領域524には、拡張語選択部15によって選択された各拡張語が、基本キーワードとともに表示される。各拡張語と基本キーワードとの組には、当該拡張語と基本キーワードとを含む検索キーワードに基づく検索要求を検索サーバ10に送信するためのリンクが貼られている。
なお、Webブラウザの「戻る」ボタンのクリックに応じ、基本キーワードに基づく再検索要求がWebブラウザから検索サーバ10に送信される場合は、表示制御部16は、当該再検索要求に応じて図11の検索結果ページ520を生成すればよい。この際、表示制御部16は、当該再検索要求に含まれているセッションIDに関連付けられてメモリ装置103に記録されている拡張語及び基本キーワードに基づいて拡張語表示領域524を生成すればよい。
一方、Webブラウザの「戻る」ボタンのクリックに応じ、クライアント端末20内にキャッシュされている検索結果ページ520がWebブラウザの表示対象とされてしまう場合、そのままでは、検索サーバ10が拡張語を提供するきっかけが無い。そこで、そのような場合は、例えば、検索結果ページ520の表示時に拡張語の取得要求を検索サーバ10に送信するようなスクリプト(例えば、JavaScript(登録商標))を検索結果ページ520に組み込んでおけばよい。拡張語選択部15は、拡張語の取得要求に応じ、当該取得要求に含まれているセッションIDに関連付けられている拡張語が有る場合は当該拡張語を返信する。当該セッションIDに関連付けられている拡張語が無い場合、拡張語選択部15は、拡張語は無い旨を返信する。検索結果ページ520のスクリプトは、拡張語が受信された場合は拡張語表示領域524を生成し、拡張語が受信されない場合は拡張語表示領域524の生成は行わない。
但し、図5に示される検索結果ページ520におけるいずれかのリンクのクリックに応じて新たなウィンドウ(Webブラウザ)が表示される場合は、必ずしも「戻る」ボタンのクリックは必要ではない。この場合、検索結果ページ520において上記スクリプトが組み込まれていれば、新たなウィンドウの表示中に自動的に検索結果ページ520が図11に示されるように更新されるからである。
また、図12は、第一の実施の形態における拡張語の提供方法の第二の例を説明するための図である。
同図は、検索サーバ10の専用のツールバー210がWebブラウザにプラグインされている例である。この場合、図5に示される検索結果ページ520においていずれかのリンクがクリックされ、リンク先の情報530がWebブラウザに表示されると、ツールバー210は拡張語の取得要求を検索サーバ10に送信する。拡張語選択部15は、拡張語の取得要求に応じ、当該取得要求に含まれているセッションIDに関連付けられている拡張語が有る場合は当該拡張語を返信する。当該セッションIDに関連付けられている拡張語が無い場合は拡張語は無い旨を返信する。ツールバー210は、拡張語が受信された場合、基本キーワードと拡張語とを組み合わせた検索キーワードの一覧をコンボボックス211に設定する。これによって、ユーザは、拡張語が追加された検索を行うことができる。
上述したように、第一の実施の形態の検索サーバ10は、過去の検索ログをジャンプ先のURLの共通性に基づいてグループ分けしておく。検索サーバ10は、検索が行われた際に、検索結果の中から選択されたジャンプ先のURLに基づいて、ユーザの検索目的を判定し、当該検索目的に応じたグループに分類されている検索ログに基づいて拡張語を判定する。すなわち、検索結果の中から選択されたジャンプ先のURLの所定の部分に基づいて、拡張語の取得範囲とされる検索ログが限定される。その結果、同一の検索ログを利用しつつ、ユーザの行動に応じて異なる拡張語を動的に提供することができる。したがって、ユーザの検索目的に即した拡張語が提示される可能性を高めることができる。
なお、検索結果ページ520においてクリックされたリンク先の情報がユーザの欲していた情報とは異なる分野に属するものである場合もある。したがって、例えば、ホスト名(所定の部分)が一致するURLに係るリンクが閾値以上クリックされた場合に、当該ホスト名に基づいて図9のステップS301〜S307(すなわち、拡張語の候補の選択)が実行されるようにしてもよい。この場合、検索目的判定部14は、検索結果ページ520におけるリンクのクリックに応じて受信される情報の取得要求に応じ、当該取得要求に含まれているセッションIDごと、かつ、ジャンプ先のURLのホスト名ごとに情報の取得要求の受信回数をメモリ装置103に記録する。当該受信回数が閾値以上となった場合、ステップS301以降が実行される。
又は、ジャンプ先の情報の閲覧時間が一定時間を超えた場合に、ジャンプ先のURLのホスト名に基づいて図9のステップS301〜S307が実行されてもよい。この場合、検索目的判定部14は、検索結果ページ520におけるリンクのクリックに応じて受信され第一の情報の取得要求から、同一のセッションに基づく次の情報の取得要求までの時間を第一の情報の閲覧時間と推定すればよい。
なお、ジャンプ先のURLの共通性だけでなく、検索ログの時間情報をも考慮して検索ログをグループ化してもよい。そうすることにより、例えば、昼食の時間帯に検索が行われた場合、グルメ情報に絞られた拡張語の中から、更に昼食向けの拡張語を抽出して提示することが可能となる。この場合、検索ログに、更に時間情報(検索が行われた時刻)を記録しておく。拡張語の提示の際は、ジャンプ先のURLのグループ識別子に基づいて検索ログを絞り込み、更に、現在(ジャンプ時)の時刻に基づいて、当該時刻から所定の範囲内の時間情報を有する検索ログを抽出すればよい。
続いて、第二の実施の形態について説明する。第二の実施の形態において特に言及しない点については第一の実施の形態と同様でよい。第二の実施の形態では、検索目的判定部14による検索目的の判定方法が異なる。すなわち、図9の処理は、図13の処理によって置き換えられる。
図13は、第二の実施の形態における拡張語の選択処理の処理手順を説明するためのフローチャートである。
ステップS401において、検索部13は、検索キーワードをクライアント端末20のWebブラウザより受信する。ステップS401は、図9等と同様に検索要求に基づくものであってもよいし、そうでなくてもよい。少なくとも、検索キーワードが受信されればよい。この点については後述する。
続いて、検索目的判定部14は、予め設定され補助記憶装置102に記録されているグループ識別子(ホスト名)を取得する(S402)。続いて、拡張語選択部15は、取得されたグループ識別子と一致するグループ識別子を有する検索ログ(レコード)を分類済み検索ログ記憶部18より取得する(S403)。以降、ステップS404及びS405は、ステップS305及びS307と同様である。
すなわち、第二の実施の形態では、検索結果ページ520において選択されたリンクに設定されているURLの所定の部分ではなく、予め設定されているグループ識別子が、拡張語の取得範囲を限定するための情報として用いられる。このような形態は、検索サーバ10が有る分野に特化したサーチエンジン(例えば、グルメ用検索サイト等)である場合に特に有効である。当該分野に関係するグループ識別子を設定しておくことで、当該分野に関係する拡張語を提示することが可能となるからである。
また、第二の実施の形態は、新規に専門検索サービスを構築する場合にも有効である。例えば、グルメ専門検索サービスが開始されて十分な時間がたてば、グルメ専門検索サービスにおいて記録される検索ログには、グルメ向きの検索キーワードが蓄積されていく可能性が高い。このような検索ログが蓄積された後は、第一の実施の形態を実施することができる。しかし、新規にサービスを立ち上げる際には検索ログは無い。そこで、外部の一般検索用の検索ログを持ってきて、本実施の形態の通り検索ログの分類を行うことで、グルメ検索用の拡張語を提示することができる。したがって、検索ログが蓄積されていなくてもグルメ検索サービスの提供当初から拡張語を提示することができる。
なお、予め設定されるグループ識別子は複数であってもよい。同一分野に属するURLは複数存在するのが一般的だからである。
なお、第二の実施の形態では、拡張語の選択に関して、検索結果ページ520においてクリックされたジャンプ先のURLは入力情報とされない。このことは、基本キーワードが取得された時点で、拡張語の選択(ステップS402以降の処理)の実行が可能となることを意味する。したがって、第二の実施の形態において選択された拡張語は、例えば、次のような形態でクライアント端末20へ提供することができる。
図14は、第二の実施の形態における拡張語の提供方法の例を説明するための図である。
同図では、検索ページ510において、「自由が丘」という単語がキーワード入力領域511に入力された時点で、拡張語の候補が表示される例が示されている。この場合、検索ページ510に組み込まれているスクリプトは、キーワード入力領域511に対する文字列の入力に応じて、当該文字列に対する拡張語の取得要求を検索サーバ10に送信する。検索サーバ10は、当該取得要求に応じ、図13に示される処理を実行する。この場合の拡張語の取得要求は、図13のステップS401に相当する。続いて、検索サーバ10は、選択された拡張語をスクリプトに返信する。スクリプトは、受信した拡張語を選択候補として表示させる。
なお、検索範囲とする分野(拡張語の取得範囲を限定するためのグループ識別子)は、予め一つに固定されていなくてもよい。分野が複数設定されており、例えば、ユーザに検索範囲とする分野を選択させ、選択された分野に応じたグループ識別子に基づいて、拡張語の取得範囲が限定されてもよい。
図15は、検索範囲とする分野をユーザに選択させるためのユーザインタフェースの例を示す図である。
同図において、ツールバー220は、例えば、検索サーバ10の専用のツールバーであり、Webブラウザにプラグインされている。ツールバー220は、キーワード入力領域221及び検索ボタン222に加え、分野選択領域223を有する。分野選択領域223では検索範囲とする分野の選択が可能とされている。
分野選択領域223において分野が選択されると、ツールバー220は、選択された分野の識別子を検索サーバ10に送信する。検索目的判定部14は、受信された識別子に基づいて、グループ識別子を補助記憶装置102により取得する。すなわち、補助記憶装置102には、分野の識別子とグループ識別子(URLの所定の部分)との関連付け情報(すなわち、分野とグループとの関連付け情報)が記録されている。なお、分野とグループとの関係は、多対多でよい。このように取得されたグループ識別子が、図13のステップS403で利用される。
なお、ツールバー220を採用することで、サーチエンジンの制約を緩和することもできる。具体的には、検索サーバ10以外の一般的に利用されているサーチエンジン(以下、「サーチエンジンG」という。)の利用が容易となる。すなわち、検索ボタン222の押下に応じ、ツールバー220が、検索要求を当該サーチエンジンGに送信するようにすればよい。その場合、ツールバー220によって提示された拡張語を含む検索を当該サーチエンジンGに実行させることができる。その結果、サーチエンジンGの利便性を向上させることができる。当該サーチエンジンGによる検索結果は、Webブラウザに表示される。なお、ツールバー220において他のサーチエンジンを複数の中から選択可能としてもよい。
上述したように、第二の実施の形態によれば、ユーザが一度検索を実施した後に拡張語を提示するのではなく、最初の検索語(基本キーワード)入力時から、ユーザの検索目的に即した拡張語が提示される可能性を高めることができる。
続いて、第三の実施の形態について説明する。第三の実施の形態は、第一の実施の形態の変形例である。第一の実施の形態では、ジャンプ先URLの形式的な共通性(文字列としての共通性)に基づいて検索ログのグループ分けが行われた。この場合、同一分野に属するURL同士であっても、形式的に一致する部分が無ければ異なるグループとして分類される。したがって、グループの粒度又は範囲が狭くなりすぎる可能性が有る。このことは、拡張語の取得範囲が狭くなりすぎる可能性が有ることを意味する。そこで、第三の実施の形態では、形式的に一致する部分が無いURL同士であっても、所定の条件を満たす場合は実質的に同じグループとして扱うための技術を開示する。
当該所定の条件とは、同一の検索結果ページ520に基づくジャンプ先であるとうことである。すなわち、ユーザは、検索結果ページ520に表示されたリンクをクリックしては戻り、他のリンクをクリックしては戻りといった操作を繰り返すことが多々ある。このような操作の対象とされたジャンプ先は、URLが形式的に異なっていたとしても、情報自体に共通性が認められる可能性が高い。したがって、第三の実施の形態の検索サーバ10は、同一の検索結果ページ520(同一の検索)に基づく複数のジャンプ先に係る検索ログの集合を同一のグループに分類する。なお、便宜上、第三の実施の形態においても、グループ識別子の異同に基づいて分類される検索ログの集合を「グループ」という。また、実質的に同一のグループとして扱われるグループの組み合わせを「グループセット」という。また、第三の実施の形態において、特に言及しない点については第一の実施の形態と同様でよい。
以下、第三の実施の形態における検索サーバ10の処理手順について説明する。第三の実施の形態において、検索ログの記録処理及び検索ログの分類処理の処理手順は、第一の実施の形態(図3、図7)と同様でよい。但し、検索ログ記憶部17及び分類済み検索ログ記憶部18について一部が異なる。
図16は、第三の実施の形態における検索ログ記憶部の構成例を示す図である。同図に示されるように、第三の実施の形態の検索ログ記憶部17aは、セッションIDの項目(列)を更に有する。すなわち、検索ログ記憶部17aには、検索ログごとに、当該検索ログの記録の原因となった情報の取得要求に含まれているセッションIDが記録される。セッションIDと検索キーワードとの組み合わせが同じであるということは、同一の検索結果ページ520におけるリンクのクリックに基づく情報の取得要求(ページのジャンプ)に係る検索ログであるということを意味する。したがって、同図では、上位4行の検索ログは、「ふぐ」という検索キーワードによって検索された結果を示す検索結果ページ520に基づく情報の取得要求に該当する。
また、図17は、第三の実施の形態における分類済み検索ログ記憶部の構成例を示す図である。第三の実施の形態における分類済み検索ログ記憶部18aでは、検索ログ記憶部17aにおいて記録されたセッションIDがそのまま引き継がれる。
図17に示されるような分類済み検索ログ記憶部18aの生成後、図18に示される処理が実行される。図18は、第三の実施の形態における分類済み検索ログ記憶部の構成例を示す図である。
ステップS501において、検索ログ分類部12は、分類済み検索ログ記憶部18aより、セッションID及び検索キーワードの組み合わせの全通りを抽出し、抽出結果をセッションID・キーワード組み合わせリストとしてメモリ装置103に記録する。換言すれば、分類済み検索ログ記憶部18aに記録されている検索ログについて、セッションID及び検索キーワードの組み合わせが共通する単位で一つのレコードとするリストがセッションID・キーワード組み合わせリストである。
図19は、セッションID・キーワード組み合わせリストの例を示す図である。同図のセッションID・キーワード組み合わせリストは、図17の分類済み検索ログ記憶部18aに基づいて生成された例である。すなわち、分類済み検索ログ記憶部18aにおいてセッションID及び検索キーワードが共通しているレコードの共通部分(セッションID及び検索キーワード)は、一つのレコードとしてセッションID・キーワード組み合わせレコードに記録される。
続いて、検索ログ分類部12は、セッションID・キーワード組み合わせリストより一つのレコードを取得する(S502)。例えば、セッションID・キーワード組み合わせリストにおける配列順の上位から順に一つのレコードが取得されればよい。取得されたレコードを、以下「カレントレコード」という。続いて、検索ログ分類部12は、カレントレコードとセッションID及び検索キーワードが一致する全レコードを分類済み検索ログ記憶部18aより取得し、取得結果を同一検索リストとしてメモリ装置103に記録する(S503)。
図20は、同一検索リストの例を示す図である。ある検索セッション内において、検索キーワード「ふぐ」で検索が実行された後、どの情報に対し取得要求(ページのジャンプ)がなされたかのログを全て抽出したリストである。
続いて、検索ログ分類部12は、生成された同一検索リストより、全ての検索ログのグループ識別子を取得する(S504)。したがって、図20の同一検索リストからは、「gourmet.jp」、「bishoku.com」、「taberuzo.co.jp」、及び「fuguya.com」が取得される。続いて、検索ログ分類部12は、取得されたグループ識別子を二つずつ組み合わせた場合の全ての組み合わせについて、グループセット判定テーブルにおけるカウンタに1を加算する(S505)。
図21は、グループセット判定テーブルの構成例を示す図である。同図に示されるように、グループ設定判定テーブルは、二つのグループ識別子の組み合わせごとに、カウンタを記録するためのテーブルである。ステップS505では、既にグループセット判定テーブルに登録されている組み合わせについてはカウンタに1が加算される。一方、グループセット判定テーブルに登録されていない組み合わせについては、新規にグループセット判定テーブルに登録され、カウンタに1が記録される。したがって、カウンタの値が大きいということは、当該組み合わせに係るグループ識別子を含む各URLが、同じ検索結果ページ520からのジャンプ先として選択される回数が多い(頻度が高い)ことを示す。
続いて、検索ログ分類部12は、セッションID・キーワード組み合わせリストに未処理のレコード(次のレコード)が残っている場合は(S506でYes)、ステップS502以降を繰り返す。セッションID・キーワード組み合わせリストに含まれている全てのレコードについて処理が完了すると(S506でNo)、図18の処理は終了する。
また、第三の実施の形態では、図9の代わりに図22が実行される。図22は、第三の実施の形態における拡張語の選択処理の処理手順を説明するためのフローチャートである。図22中、図9と同一ステップには同一ステップ番号を付し、その説明は省略する。
図22では、ステップS301に続いて、グループセット判定処理が実行される(S302)。グループセット判定処理では、ステップS301において抽出されたジャンプ先URLの所定の部分(ホスト名)に対応するグループセット(一又は複数のグループ識別子の集合)が判定される。
続いて、拡張語選択部15は、グループセット判定処理において判定されたグループセットに属するグループ識別子ごとに、当該グループ識別子を有する検索ログ(レコード)を分類済み検索ログ記憶部18aより取得する(S303a)。以降、ステップS305及びS307では取得された検索ログに基づいて、図9において説明した処理と同様の処理が実行される。
続いて、図22のステップS302の詳細について説明する。図23は、グループセット判定処理の処理手順を説明するためのフローチャートである。
ステップS701において、検索目的判定部14は、図22のステップS301において抽出されたジャンプ先URLの所定の部分と一致するグループ識別子を有する全てのレコードをグループセット判定テーブル(図21参照)より取得する。すなわち、「グループ識別子1」又は「グループ識別子2」のいずれか一方が、当該所定の部分と同じであるレコードが取得される。例えば、ステップS301において抽出されたジャンプ先URLの所定の部分が「gourmet.jp」である場合、図21のグループセット判定テーブルの1行目、2行目、及び4行目の3つのレコードが取得される。
続いて、検索目的判定部14は、取得されたレコードの中から、カウンタの値が閾値以上のレコードを有効レコードとして抽出する(S702)。例えば、閾値が20である場合、図21のグループセット判定テーブルより取得された3つのレコードのうち、1行目及び2行目のレコードが有効レコードとして抽出される。
続いて、検索目的判定部14は、抽出された有効レコードの「グループ識別子1」又は「グループ識別子2」に含まれている全てのグループ識別子を同一グループセットに含まれるグループ識別子として判定する(S703)。例えば、図21のグループセット判定テーブルの1行目の有効レコードのグループ識別子は、「gourmet.jp」及び「bishoku.com」である。また、2行目の有効レコードのグループ識別子は、「gourmet.jp」及び「taberuzo.co.jp」である。したがって、「gourmet.jp」、「bishoku.com」、及び「taberuzo.co.jp」の3つのグループ識別子に係るグループの集合がグループセットとして判定される。
このように、第三の実施の形態によれば、第一の実施の形態において3つのグループに分類されていた検索ログを、同一のグループセット(実質的に1つのグループ)に属するものとして扱うことができる。その結果、拡張語の取得範囲を拡大することができ、より多数の拡張語の候補を選択し、提示することが可能となる。
なお、拡張語は、基本キーワードとは別個の単語として検索キーワードに含まれる単語に限定されない。例えば、基本キーワードの末尾に続けて付加され、基本キーワードと一体となって一つの単語を形成する単語又は文字列も拡張語に含まれる。例えば、「自由が丘」という検索キーワードが、「自由が丘寿司」に拡張される場合、「寿司」の部分は拡張語に該当する。
拡張語の解釈をこのように拡大する場合、図3等のステップS305において、基本キーワードを含む検索ログを抽出する際に、拡張語選択部15は、抽出対象を拡大する。すなわち、拡張語選択部15は、基本キーワードが独立した単語として検索キーワードに含まれている検索ログだけでなく、基本キーワードと前方一致の単語を検索キーワードに含む検索ログも抽出対象とする。その結果、基本キーワードが「自由が丘」である場合、「自由が丘寿司」といったような単語も抽出対象となる。続くステップS307において、拡張語選択部15は、前方一致で抽出された検索ログに含まれる検索キーワード(例えば、「自由が丘寿司」)については、基本キーワード(例えば、「自由が丘」)を除去した残りの文字列(例えば、「寿司」)を拡張語としてメモリ装置103に記録する。なお、拡張語ごとに、基本キーワードと独立して入力されたものであるか、基本キーワードと一体的に入力されたものであるかを示す情報を付加しておくとよい。そうすることにより、拡張語を提示する際に、基本キーワードと独立した単語として提示すべきか、基本キーワードと一体的に提示すべきかを判断することができる。
以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
以上の説明に関し、更に以下の項を開示する。
(付記1)
コンピュータに、
入力語とURLとを受付ける受付手順と、
閲覧された情報のURLごとに該情報の検索に使用された検索語を含むログを記憶した検索ログ記憶手段より、前記受け付けたURLと所定の部分が共通するURLを含み、かつ、前記受け付けた入力語と所定の部分が共通する検索語を含むログを取得するログ取得手順と、
前記取得されたログに含まれる検索語を出力する出力手順とを実行させるための検索支援プログラム。
(付記2)
検索語を含む検索要求の受信に応じ、検索語に基づいて検索された情報のURLを含む検索結果を返信する検索手順を前記コンピュータに実行させ、
前記受付手順は、前記検索結果に基づいて送信される、該検索結果において選択されたURLを受付ける付記1記載の検索支援プログラム。
(付記3)
前記検索ログ記憶手段が記憶する各ログを、当該ログに含まれるURLの前記所定の部分の共通性に基づいて分類し、分類されたログを前記所定の部分と関連付けて分類済み検索ログ記憶手段に記録する検索ログ分類手順を前記コンピュータに実行させ、
前記ログ取得手順は、前記受け付けたURLと前記所定の部分が共通するURLを含む前記ログを前記分類済み検索ログ記憶手段より取得する付記1又は2記載の検索支援プログラム。
(付記4)
前記受け付けたURLの前記所定の部分が共通する回数を記録する検索目的判定手順を前記コンピュータに実行させ、
前記ログ取得手順は、前記回数が閾値以上の前記受け付けたURLと前記所定の部分が共通するURLを含む前記ログを取得する付記1乃至3いずれか一項記載の検索支援プログラム。
(付記5)
前記検索ログ記憶手段は、同一の検索に基づいて閲覧された情報に係る前記ログの集合ごとに共通の識別子を関連付けて記憶し、
前記ログ取得手順は、前記受け付けたURLと所定の部分が共通するURLを含む第一のログ、及び該第一のログと同一の前記集合に属する前記ログを取得する付記1乃至4いずれか一項記載の検索支援プログラム。
(付記6)
前記ログ取得手順は、前記第一のログ、及び該第一のログと閾値以上の数の同一の前記集合に属する前記ログを取得する付記5記載の検索支援プログラム。
(付記7)
入力語とURLとを受付ける受付手段と、
閲覧された情報のURLごとに該情報の検索に使用された検索語を含むログを記憶した検索ログ記憶手段より、前記受け付けたURLと所定の部分が共通するURLを含み、かつ、前記受け付けた入力語と所定の部分が共通する検索語を含むログを取得するログ取得手段と、
前記取得されたログに含まれる検索語を出力する出力手段とを有する検索支援装置。
(付記8)
検索語を含む検索要求の受信に応じ、検索語に基づいて検索された情報のURLを含む検索結果を返信する検索手段を有し、
前記受付手段は、前記検索結果に基づいて送信される、該検索結果において選択されたURLを受付ける付記7記載の検索支援装置。
(付記9)
前記検索ログ記憶手段が記憶する各ログを、当該ログに含まれるURLの前記所定の部分の共通性に基づいて分類し、分類されたログを前記所定の部分と関連付けて分類済み検索ログ記憶手段に記録する検索ログ分類手段を有し、
前記ログ取得手段は、前記受け付けたURLと前記所定の部分が共通するURLを含む前記ログを前記分類済み検索ログ記憶手段より取得する付記7又は8記載の検索支援装置。
(付記10)
前記受け付けたURLの前記所定の部分が共通する回数を記録する検索目的判定手段を有し、
前記ログ取得手段は、前記回数が閾値以上の前記受け付けたURLと前記所定の部分が共通するURLを含む前記ログを取得する付記7乃至9いずれか一項記載の検索支援装置。
(付記11)
前記検索ログ記憶手段は、同一の検索に基づいて閲覧された情報に係る前記ログの集合ごとに共通の識別子を関連付けて記憶し、
前記ログ取得手段は、前記受け付けたURLと所定の部分が共通するURLを含む第一のログ、及び該第一のログと同一の前記集合に属する前記ログを取得する付記7乃至10いずれか一項記載の検索支援装置。
(付記12)
前記ログ取得手段は、前記第一のログ、及び該第一のログと閾値以上の数の同一の前記集合に属する前記ログを取得する付記11記載の検索支援装置。
(付記13)
コンピュータが実行する検索支援方法であって、
入力語とURLとを受付ける受付手順と、
閲覧された情報のURLごとに該情報の検索に使用された検索語を含むログを記憶した検索ログ記憶手段より、前記受け付けたURLと所定の部分が共通するURLを含み、かつ、前記受け付けた入力語と所定の部分が共通する検索語を含むログを取得するログ取得手順と、
前記取得されたログに含まれる検索語を出力する出力手順とを有する検索支援方法。
(付記14)
検索語を含む検索要求の受信に応じ、検索語に基づいて検索された情報のURLを含む検索結果を返信する検索手順を有し、
前記受付手順は、前記検索結果に基づいて送信される、該検索結果において選択されたURLを受付ける付記13記載の検索支援方法。
(付記15)
前記検索ログ記憶手段が記憶する各ログを、当該ログに含まれるURLの前記所定の部分の共通性に基づいて分類し、分類されたログを前記所定の部分と関連付けて分類済み検索ログ記憶手段に記録する検索ログ分類手順を有し、
前記ログ取得手順は、前記受け付けたURLと前記所定の部分が共通するURLを含む前記ログを前記分類済み検索ログ記憶手段より取得する付記13又は14記載の検索支援方法。
(付記16)
前記受け付けたURLの前記所定の部分が共通する回数を記録する検索目的判定手順を有し、
前記ログ取得手順は、前記回数が閾値以上の前記受け付けたURLと前記所定の部分が共通するURLを含む前記ログを取得する付記13乃至15いずれか一項記載の検索支援方法。
(付記17)
前記検索ログ記憶手段は、同一の検索に基づいて閲覧された情報に係る前記ログの集合ごとに共通の識別子を関連付けて記憶し、
前記ログ取得手順は、前記受け付けたURLと所定の部分が共通するURLを含む第一のログ、及び該第一のログと同一の前記集合に属する前記ログを取得する付記13乃至16いずれか一項記載の検索支援方法。
(付記18)
前記ログ取得手順は、前記第一のログ、及び該第一のログと閾値以上の数の同一の前記集合に属する前記ログを取得する付記17記載の検索支援方法。
10 検索サーバ
11 検索ログ記録部
12 検索ログ分類部
13 検索部
14 検索目的判定部
15 拡張語選択部
16 表示制御部
17 検索ログ記憶部
18 分類済み検索ログ記憶部
19 文書情報DB
20 クライアント端末
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
B バス

Claims (7)

  1. コンピュータに、
    入力語とURLとを受付ける受付手順と、
    閲覧された情報のURLごとに該情報の検索に使用された検索語を含むログを記憶した検索ログ記憶手段より、前記受け付けたURLと所定の部分が共通するURLを含み、かつ、前記受け付けた入力語と所定の部分が共通する検索語を含むログを取得するログ取得手順と、
    前記取得されたログに含まれる検索語を出力する出力手順とを実行させるための検索支援プログラム。
  2. 検索語を含む検索要求の受信に応じ、検索語に基づいて検索された情報のURLを含む検索結果を返信する検索手順を前記コンピュータに実行させ、
    前記受付手順は、前記検索結果に基づいて送信される、該検索結果において選択されたURLを受付ける請求項1記載の検索支援プログラム。
  3. 前記検索ログ記憶手段が記憶する各ログを、当該ログに含まれるURLの前記所定の部分の共通性に基づいて分類し、分類されたログを前記所定の部分と関連付けて分類済み検索ログ記憶手段に記録する検索ログ分類手順を前記コンピュータに実行させ、
    前記ログ取得手順は、前記受け付けたURLと前記所定の部分が共通するURLを含む前記ログを前記分類済み検索ログ記憶手段より取得する請求項1又は2記載の検索支援プログラム。
  4. 前記受け付けたURLの前記所定の部分が共通する回数を記録する検索目的判定手順を前記コンピュータに実行させ、
    前記ログ取得手順は、前記回数が閾値以上の前記受け付けたURLと前記所定の部分が共通するURLを含む前記ログを取得する請求項1乃至3いずれか一項記載の検索支援プログラム。
  5. 前記検索ログ記憶手段は、同一の検索に基づいて閲覧された情報に係る前記ログの集合ごとに共通の識別子を関連付けて記憶し、
    前記ログ取得手順は、前記受け付けたURLと所定の部分が共通するURLを含む第一のログ、及び該第一のログと同一の前記集合に属する前記ログを取得する請求項1乃至4いずれか一項記載の検索支援プログラム。
  6. 入力語とURLとを受付ける受付手段と、
    閲覧された情報のURLごとに該情報の検索に使用された検索語を含むログを記憶した検索ログ記憶手段より、前記受け付けたURLと所定の部分が共通するURLを含み、かつ、前記受け付けた入力語と所定の部分が共通する検索語を含むログを取得するログ取得手段と、
    前記取得されたログに含まれる検索語を出力する出力手段とを有する検索支援装置。
  7. コンピュータが実行する検索支援方法であって、
    入力語とURLとを受付ける受付手順と、
    閲覧された情報のURLごとに該情報の検索に使用された検索語を含むログを記憶した検索ログ記憶手段より、前記受け付けたURLと所定の部分が共通するURLを含み、かつ、前記受け付けた入力語と所定の部分が共通する検索語を含むログを取得するログ取得手順と、
    前記取得されたログに含まれる検索語を出力する出力手順とを有する検索支援方法。
JP2009296732A 2009-12-28 2009-12-28 検索支援プログラム、検索支援装置、及び検索支援方法 Active JP5493845B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009296732A JP5493845B2 (ja) 2009-12-28 2009-12-28 検索支援プログラム、検索支援装置、及び検索支援方法
US12/968,947 US20110161336A1 (en) 2009-12-28 2010-12-15 Search supporting device and a method for search supporting

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009296732A JP5493845B2 (ja) 2009-12-28 2009-12-28 検索支援プログラム、検索支援装置、及び検索支援方法

Publications (2)

Publication Number Publication Date
JP2011138248A true JP2011138248A (ja) 2011-07-14
JP5493845B2 JP5493845B2 (ja) 2014-05-14

Family

ID=44188715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009296732A Active JP5493845B2 (ja) 2009-12-28 2009-12-28 検索支援プログラム、検索支援装置、及び検索支援方法

Country Status (2)

Country Link
US (1) US20110161336A1 (ja)
JP (1) JP5493845B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016520924A (ja) * 2013-05-10 2016-07-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文書及び/又は検索クエリの関連性を変更する方法、コンピュータ・プログラム及びシステム
JP2019057110A (ja) * 2017-09-21 2019-04-11 データ・サイエンティスト株式会社 検索目的推察支援装置、検索目的推察支援システム、及び検索目的推察支援方法
JP2019101533A (ja) * 2017-11-29 2019-06-24 株式会社日立製作所 データ活用支援装置、データ活用支援システム、及びデータ活用支援方法
JP2023516209A (ja) * 2020-04-01 2023-04-18 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8732240B1 (en) 2010-12-18 2014-05-20 Google Inc. Scoring stream items with models based on user interests
CN103365844B (zh) * 2012-03-26 2016-05-11 阿里巴巴集团控股有限公司 一种提供搜索路径的方法及装置
JP5997738B2 (ja) * 2014-09-11 2016-09-28 ヤフー株式会社 情報提供システム、情報提供サーバ、情報提供方法及びプログラム
US12034731B2 (en) * 2021-01-29 2024-07-09 Paypal, Inc. Evaluating access requests using assigned common actor identifiers
CN112883225B (zh) * 2021-02-02 2022-10-11 聚好看科技股份有限公司 一种媒体资源搜索、显示方法及设备
US12038993B1 (en) * 2023-01-31 2024-07-16 Splunk Inc. Techniques for showing matched URLs for a URL grouping rule

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334109A (ja) * 1997-05-28 1998-12-18 Nippon Telegr & Teleph Corp <Ntt> 検索利用者支援装置
JP2005309998A (ja) * 2004-04-23 2005-11-04 Fujitsu Ltd コンテンツナビゲーションプログラム、コンテンツナビゲーション方法及びコンテンツナビゲーション装置
JP2008009711A (ja) * 2006-06-29 2008-01-17 Hitachi Ltd 計算機システム、プログラム及び検索エンジン検索方法
JP2009003637A (ja) * 2007-06-20 2009-01-08 Yahoo Japan Corp マルチメディアデータ検索システム、マルチメディアデータ検索装置、マルチメディアデータ検索方法、およびプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6480837B1 (en) * 1999-12-16 2002-11-12 International Business Machines Corporation Method, system, and program for ordering search results using a popularity weighting
US20030208472A1 (en) * 2000-04-11 2003-11-06 Pham Peter Manh Method and apparatus for transparent keyword-based hyperlink
US20030084034A1 (en) * 2001-11-01 2003-05-01 Richard Fannin Web-based search system
US8676830B2 (en) * 2004-03-04 2014-03-18 Yahoo! Inc. Keyword recommendation for internet search engines
US20060106769A1 (en) * 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
US8843536B1 (en) * 2004-12-31 2014-09-23 Google Inc. Methods and systems for providing relevant advertisements or other content for inactive uniform resource locators using search queries
IL174107A0 (en) * 2006-02-01 2006-08-01 Grois Dan Method and system for advertising by means of a search engine over a data network
US8019748B1 (en) * 2007-11-14 2011-09-13 Google Inc. Web search refinement
US20090259646A1 (en) * 2008-04-09 2009-10-15 Yahoo!, Inc. Method for Calculating Score for Search Query
US9015148B2 (en) * 2009-09-21 2015-04-21 Microsoft Corporation Suggesting related search queries during web browsing
US20110119268A1 (en) * 2009-11-13 2011-05-19 Rajaram Shyam Sundar Method and system for segmenting query urls

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334109A (ja) * 1997-05-28 1998-12-18 Nippon Telegr & Teleph Corp <Ntt> 検索利用者支援装置
JP2005309998A (ja) * 2004-04-23 2005-11-04 Fujitsu Ltd コンテンツナビゲーションプログラム、コンテンツナビゲーション方法及びコンテンツナビゲーション装置
JP2008009711A (ja) * 2006-06-29 2008-01-17 Hitachi Ltd 計算機システム、プログラム及び検索エンジン検索方法
JP2009003637A (ja) * 2007-06-20 2009-01-08 Yahoo Japan Corp マルチメディアデータ検索システム、マルチメディアデータ検索装置、マルチメディアデータ検索方法、およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"WWW検索システムにおける不特定多数の操作履歴の活用", 情報処理学会研究報告「システムソフトウエアとオペレーティングシステム」, JPN6013037946, 27 February 1997 (1997-02-27), pages 61 - 66, ISSN: 0002596807 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016520924A (ja) * 2013-05-10 2016-07-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文書及び/又は検索クエリの関連性を変更する方法、コンピュータ・プログラム及びシステム
JP2019057110A (ja) * 2017-09-21 2019-04-11 データ・サイエンティスト株式会社 検索目的推察支援装置、検索目的推察支援システム、及び検索目的推察支援方法
JP2019101533A (ja) * 2017-11-29 2019-06-24 株式会社日立製作所 データ活用支援装置、データ活用支援システム、及びデータ活用支援方法
JP2023516209A (ja) * 2020-04-01 2023-04-18 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
JP7451747B2 (ja) 2020-04-01 2024-03-18 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体

Also Published As

Publication number Publication date
US20110161336A1 (en) 2011-06-30
JP5493845B2 (ja) 2014-05-14

Similar Documents

Publication Publication Date Title
JP5493845B2 (ja) 検索支援プログラム、検索支援装置、及び検索支援方法
JP5084858B2 (ja) サマリ作成装置、サマリ作成方法及びプログラム
US20130282709A1 (en) Method and system for query suggestion
US10652187B2 (en) System and method for relevance-based electronic message presentation
CN103186666B (zh) 基于收藏进行搜索的方法、装置与设备
JP2009037501A (ja) 情報検索装置、情報検索方法およびプログラム
JP4962980B2 (ja) クリックログを用いた検索結果分類装置及び方法
JP4430598B2 (ja) 情報共有システムおよび情報共有方法
JP2010128928A (ja) 検索システム及び検索方法
JP2009245179A (ja) 文書検索支援装置
JP2009003928A (ja) サーチ結果提示方法、サーチ結果を提示する機能を実現させるためのプログラム、サーチ結果提示システム
US20160117352A1 (en) Apparatus and method for supporting visualization of connection relationship
JP2010198350A (ja) 検索装置及び検索方法
JP2011100208A (ja) 行動推定装置、行動推定方法および行動推定プログラム
JP5379665B2 (ja) 辞書生成処理方法、プログラム及び装置
JP5805151B2 (ja) 検索装置、検索システムおよびプログラム
US8117205B2 (en) Technique for enhancing a set of website bookmarks by finding related bookmarks based on a latent similarity metric
JP5297295B2 (ja) WWW情報閲覧システムと方法およびWebブラウザとプログラム
JP5416023B2 (ja) 閲覧端末及び方法
JPH11134341A (ja) ハイパーメデイア記述言語による記述情報の抜粋表示シ ステム
JP5002631B2 (ja) 単語情報収集装置、単語情報収集方法および単語情報収集プログラム
JP5589009B2 (ja) 推薦クエリ抽出装置及び方法及びプログラム
JP4962973B2 (ja) 検索サーバ、方法及びプログラム
JP4827863B2 (ja) 情報検索サーバおよび情報検索システムおよび情報検索方法並びにプログラム
JP5642139B2 (ja) 広告処理装置及び広告処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140217

R150 Certificate of patent or registration of utility model

Ref document number: 5493845

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150