JP5381728B2 - 情報処理装置、情報処理プログラム、及び、情報処理方法 - Google Patents

情報処理装置、情報処理プログラム、及び、情報処理方法 Download PDF

Info

Publication number
JP5381728B2
JP5381728B2 JP2010003260A JP2010003260A JP5381728B2 JP 5381728 B2 JP5381728 B2 JP 5381728B2 JP 2010003260 A JP2010003260 A JP 2010003260A JP 2010003260 A JP2010003260 A JP 2010003260A JP 5381728 B2 JP5381728 B2 JP 5381728B2
Authority
JP
Japan
Prior art keywords
search
information
difference
result
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010003260A
Other languages
English (en)
Other versions
JP2011141838A (ja
Inventor
友哉 岩倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010003260A priority Critical patent/JP5381728B2/ja
Publication of JP2011141838A publication Critical patent/JP2011141838A/ja
Application granted granted Critical
Publication of JP5381728B2 publication Critical patent/JP5381728B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報検索の検索結果を処理する情報処理装置、情報処理プログラム、及び、情報処理方法に関する。
検索クエリによる情報検索の検索結果を処理して出力する情報処理装置がある。情報処理装置の例として、検索クエリによるウェブサイトの検索結果を処理して表示部に表示するものがある。
このような情報処理装置の1つには、検索クエリによるウェブサイトの検索結果に対して、ユーザの検索目的に適合している可能性が高いと予想されるものを上位にランキングして表示部に表示するものがある。これにより、ユーザが早く目的とするウェブサイトを選択して閲覧することが可能となる。
例えば、サイト検索キーワードによる検索で取得したウェブサイトの中からユーザが集中してアクセスしているウェブサイトを推奨ウェブサイトとして特定する。その後、同じサイト検索キーワードが投入された際、特定した推奨ウェブサイトを上位に提示する技術がある。
また、情報処理装置としては、アクセス速度が異なる複数の記憶装置を備え、アクセス頻度の高いデータを、アクセス速度が速い記憶装置に配置する記憶システムがある。
また、情報処理装置としては、画像検索において、検索クエリに相反する特徴情報を持つ画像を検索結果から除外するデータ検索装置がある。
特開2009−163663号公報 特開2008−059438号公報 特開2000−057153号公報
Yoav Freund,Raj D. Iyer,Robert E. Schapire,Yoram SingerAn Efficient Boosting Algorithm for Combining PreferencesJournal of Machine Learning Research,Volume 4,2003,pp. 933-969
しかしながら、検索結果のランキングに関して、過去のアクセス回数にのみ基づいてランキングを行うと、検索の属性、例えば、検索時期や、検索元の所属によっては、ユーザの検索目的に適合しないウェブサイトが上位にランキングされてしまう可能性がある。
例えば、「飲み会」を検索クエリとした過去の検索において、冬の時期に「ふぐ鍋」に関するウェブサイトへのアクセスが多数行われている場合を想定する。この場合、検索時期が夏であっても、夏にはユーザにより選択されることがほとんど無いような「ふぐ鍋」に関するウェブサイトが、上位にランキングされてしまう可能性がある。
このような課題は、検索時期の属性に限らず、検索元の所属等の他の属性によっても同様に生じ得る。また、このような課題は、ウェブサイトの検索に限らず、他の文書検索、画像検索、映像検索、及び、音声検索等の情報検索においても同様に生じ得る。
このような点に鑑み、ユーザの検索目的に適合している可能性が高い情報を正しく上位に配置できる情報処理装置、情報処理プログラム、及び、情報処理方法を提供することを目的とする。
上記目的を達成するために以下のような情報処理装置が提供される。
この情報処理装置は、過去の検索における、検索の属性と、検索条件と、検索条件に適合する情報の検索結果から選択された選択情報とを関連付けて記憶する検索ログ記憶手段を参照し、検索条件のそれぞれを計算対象とし、選択情報毎に、第1の属性の検索において計算対象の検索条件の検索結果から選択された回数と、第2の属性の検索において計算対象の検索条件の検索結果から選択された回数との差分を計算し、計算した差分を、計算対象の検索条件と選択情報とに関連付けて差分記憶手段に格納する差分計算手段と、第1の属性又は第2の属性の検索において入力された検索条件に適合する情報の検索結果に対して、差分記憶手段から入力された検索条件及び検索結果に含まれる情報に対応付けられた差分を抽出し、抽出した差分に基づいて検索結果に含まれる情報を並べ替える並べ替え手段と、を有する。
開示の情報処理装置、情報処理プログラム、及び、情報処理方法によれば、検索結果のランキングに関して、ユーザの検索目的に適合している可能性が高い情報を正しく上位に配置できる。
第1の実施の形態に係る情報処理装置の一例を示す図である。 第2の実施の形態に係る情報処理装置のハードウェアの一例を示すブロック図である。 第2の実施の形態に係る情報処理装置の機能の一例を示すブロック図である。 第2の実施の形態に係る差分情報テーブルの更新手順の一例を示すフローチャートである。 第2の実施の形態に係る情報処理装置のランキング動作の処理手順の一例を示すフローチャートである。 第2の実施の形態に係る情報処理装置によりモニタに表示される表示画面の遷移の一例を示す図である。 第2の実施の形態に係る検索ログ情報テーブルの一例を示す図である。 第2の実施の形態に係る集計結果情報テーブルの一例を示す図である。 第2の実施の形態に係る差分情報テーブルの一例を示す図である。 第2の実施の形態に係る検索結果情報テーブルの一例を示す図である。 第2の実施の形態に係るソート用情報テーブルの一例を示す図である。 第2の実施の形態に係るランキング結果情報テーブルの一例を示す図である。 第2の実施の形態に係る変形例1の検索ログ情報テーブルの一例を示す図である。 第2の実施の形態に係る変形例1の集計結果情報テーブルの一例を示す図である。 第2の実施の形態に係る変形例1の差分情報テーブルの一例を示す図である。 第2の実施の形態に係る変形例1の検索結果情報テーブルの一例を示す図である。 第2の実施の形態に係る変形例1のランキング結果情報テーブルの一例を示す図である。 第2の実施の形態に係る変形例2の検索ログ情報テーブルの一例を示す図である。 第2の実施の形態に係る変形例2の集計結果情報テーブルの一例を示す図である。 第3の実施の形態に係る情報処理装置の機能の一例を示すブロック図である。 第3の実施の形態に係る学習情報テーブルの一例を示す図である。 第3の実施の形態に係る学習情報テーブルの一例を示す図である。 第3の実施の形態に係るランキング規則情報テーブルの一例を示す図である。 第3の実施の形態に係る検索結果情報テーブルの一例を示す図である。 第3の実施の形態に係るランキング結果情報テーブルの一例を示す図である。
以下、実施の形態を図面を参照して説明する。
[第1の実施の形態]
図1は、第1の実施の形態に係る情報処理装置の一例を示す図である。
情報処理装置10は、検索ログ記憶手段11と、差分計算手段12と、差分記憶手段13とを有する。
検索ログ記憶手段11には、過去の情報検索における、検索の属性と、検索条件と、検索条件に適合する情報の検索結果から選択された選択情報とが関連付けられた履歴情報が格納される検索ログ情報テーブル11aが記憶される。
情報検索は、検索エンジン(図示せず)が、複数の情報が記憶されているデータベース(図示せず)から、入力された検索条件に適合する情報を発見して収集することで行われる。検索条件とは、例えば、検索キーワード等の検索クエリである。検索結果とは、その収集された情報群のことである。ここで、情報とは、例えば、文書、画像、映像、及び、音声等である。
検索の属性とは、例えば、検索の時期や、検索元の所属等、検索時に取得可能な検索目的に関連する情報である。選択情報とは、検索結果である情報群から、ユーザにより選択された情報のことである。ユーザによる情報の選択は、例えば、ユーザが、表示手段(図示せず)に表示された検索結果の一覧を閲覧し、その中から必要な情報を選択することで行われる。
例えば、検索ログ情報テーブル11aの履歴情報1aは、条件Aによる検索が行われ、この条件Aに適合する情報の検索結果から情報Aが選択されたことを示し、さらに、この検索の属性が属性(1)であることを示す。
差分計算手段12は、検索ログ記憶手段11の検索ログ情報テーブル11aに基づいて、次の計算を行う。即ち、差分計算手段12は、検索条件のそれぞれを計算対象とし、選択情報毎に、第1の属性の検索において計算対象の検索条件の検索結果から選択された回数と、第2の属性の検索において計算対象の検索条件の検索結果から選択された回数との差分を計算する。なお、第1の属性と、第2の属性とは、ユーザにより適宜、設定される。
差分記憶手段13には、差分計算手段12が計算した差分が、計算対象の検索条件と選択情報と関連付けられて格納された差分情報テーブル13aが記憶される。
例えば、差分情報テーブル13aは、第1の属性に属性(1)が設定され、第2の属性に属性(2)が設定された例を示すものである。差分情報テーブル13aの行3aは、条件Aに適合する情報の検索結果から情報Aが選択された検索のうち、属性(1)の検索によるものが「30回」であり、属性(2)の検索によるものが「10回」であることを示す。そして、属性(1)の回数から属性(2)の回数を差し引いた値が、「20」であることを示す。
差分の計算方法としては、頻度の差を用いる方法以外の方法を用いても良い。例えば、検索の属性毎に選択された確率を計算して、差分を取る等の方法でもよい。差分情報テーブル13aの例であれば、検索条件である「条件A」による検索結果のうち、選択されたのが、「情報A」、「情報B」、「情報C」だけであったとする。この場合、「条件A」による検索結果のうち、属性(1)における「情報A」が選択された確率は、30/(30+30+0)=0.5となる。属性(2)における「情報A」が選択された確率は、10/(10+20+10)=0.25となる。この場合「条件A」による検索結果から「情報A」が選択された場合の属性(1)と属性(2)の差分は、0.25(=0.5−0.25)となる。
行3bは、条件Aに適合する情報の検索結果から情報Bが選択された検索のうち、属性(1)の検索によるものが「30回」であり、属性(2)の検索によるものが「20回」であることを示す。そして、属性(1)の回数から属性(2)の回数を差し引いた値が、「10」であることを示す。
行3cは、条件Aに適合する情報の検索結果から情報Cが選択された検索のうち、属性(1)の検索によるものが「0回」であり、属性(2)の検索によるものが「10回」であることを示す。そして、属性(1)の回数から属性(2)の回数を差し引いた値が、「−10」であることを示す。
さらに、情報処理装置10は、検索結果記憶手段14と、並べ替え手段15と、並べ替え結果記憶手段16とを有する。
検索結果記憶手段14には、入力された検索条件に適合する情報の検索結果が格納される検索結果情報テーブル14aが記憶される。検索結果は、検索エンジン(図示せず)が、ユーザにより入力された検索条件に基づいてデータベース(図示せず)を検索することで得られる。
例えば、検索結果情報テーブル14aには、検索結果に含まれる各情報が、順位と共に格納される。ここでは、検索結果情報テーブル14aには、情報Cの順位が1位であり、情報Aの順位が2位であり、情報Bの順位が3位であることを示す情報が格納されている。
並べ替え手段15は、検索結果情報テーブル14aから、第1の属性又は第2の属性の検索において入力された検索条件に適合する情報の検索結果を抽出する。さらに、並べ替え手段15は、抽出した検索結果に対して、差分記憶手段13の差分情報テーブル13aから入力された検索条件及び検索結果に含まれる情報に対応付けられた差分を抽出する。
さらに、並べ替え手段15は、抽出した差分に基づいて検索結果に含まれる情報を並べ替える。即ち、並べ替え手段15は、検索結果情報テーブル14aに格納された情報群に対して、差分の値が高い情報を上位に配置する。
例えば、検索結果情報テーブル14aの情報Aは、差分情報テーブル13aの行3aに該当し、対応する差分は「20」となる。検索結果情報テーブル14aの情報Bは、差分情報テーブル13aの行3bに該当し、対応する差分は「10」となる。検索結果情報テーブル14aの情報Cは、差分情報テーブル13aの行3cに該当し、対応する差分は「−10」となる。このため、並べ替え手段15は、情報Aの順位が1位となり、情報Bの順位が2位となり、情報Cの順位が3位となるように情報の並べ替えを行う。
並べ替え結果記憶手段16には、並べ替え手段15で並べ替えられた情報と、その順位が関連付けられて格納される並べ替え結果情報テーブル16aが記憶される。ここでは、並べ替え結果情報テーブル16aには、情報Aの順位が1位であり、情報Bの順位が2位であり、情報Cの順位が3位であることを示す情報が格納されている。
並べ替え結果情報テーブル16aに格納された各情報は、例えば、表示手段(図示せず)に表示される。このとき、各情報は、順位が高いものが表示画面の上位に位置するように表示される。
次に、情報処理装置10の差分情報テーブル13aの更新手順について説明する。
まず、差分計算手段12が、検索ログ記憶手段11の検索ログ情報テーブル11aに基づいて、次の計算を行う。即ち、差分計算手段12が、検索条件のそれぞれを計算対象とし、選択情報毎に、第1の属性の検索において計算対象の検索条件の検索結果から選択された回数と、第2の属性の検索において計算対象の検索条件の検索結果から選択された回数との差分を計算する。
次に、差分計算手段12が、計算した差分と、計算対象の検索条件と選択情報とを関連付けて、差分記憶手段13の差分情報テーブル13aに格納して処理を終了する。
次に、情報処理装置10の並べ替え動作の処理手順について説明する。
なお、差分記憶手段13には、予め差分情報テーブル13aが記憶されているものとする。
まず、検索条件が入力されて検索が行われ、検索結果が検索結果記憶手段14の検索結果情報テーブル14aに格納される。
次に、並べ替え手段15が、検索結果情報テーブル14aから、第1の属性又は第2の属性の検索において入力された検索条件に適合する情報の検索結果を抽出する。
次に、並べ替え手段15が、抽出した検索結果に対して、差分記憶手段13の差分情報テーブル13aから入力された検索条件及び検索結果に含まれる情報に対応付けられた差分を抽出し、抽出した差分に基づいて検索結果に含まれる情報を並べ替える。
次に、並べ替え手段15が、並べ替えた結果を並べ替え結果情報テーブル16aに格納して処理を終了する。
なお、並べ替え結果情報テーブル16aに格納された各情報は、例えば、順位が高いものが上位に位置するように表示手段(図示せず)に表示される。
ユーザは、表示手段に表示された情報の一覧を閲覧し、要求する情報を選択して内容を閲覧する。なお、ユーザが選択した情報は、対応する検索の属性と検索条件と共に、履歴情報として検索ログ記憶手段11の検索ログ情報テーブル11aに格納される。
以上のように、情報処理装置10では、並べ替え手段15が、第1の属性又は第2の属性の検索において入力された検索条件に適合する情報の検索結果に対して、差分記憶手段13から入力された検索条件及び検索結果に含まれる情報に対応付けられた差分を抽出する。そして、並べ替え手段15は、抽出した差分に基づいて検索結果に含まれる情報を並べ替える。この差分は、選択情報が第1の属性の検索において計算対象の検索条件の検索結果から選択された回数と、選択情報が第2の属性の検索において計算対象の検索条件の検索結果から選択された回数との差分である。
これにより、情報処理装置10では、第1の属性の検索における選択回数が第2の属性の検索における選択回数と比較して際だって多い情報を、上位に配置することが可能となる。従って、例えば、ユーザが行う検索に関連性が高い属性を第1の属性とし、ユーザが行う検索に第1の属性よりも関連性が低い属性を第2の属性として指定することで、ユーザの検索目的に適合している可能性が高い情報を正しく上位に配置できる。
なお、ここで、ユーザの検索目的に適合する情報とは、ユーザが閲覧を希望する情報を指す。即ち、検索結果からユーザが選択した情報は、検索目的に適合した情報であり、検索結果からユーザが選択しない情報は、検索目的に適合しない情報である。
次に、情報処理装置10をウェブサイト検索に適用した例を、第2の実施の形態として説明する。
[第2の実施の形態]
まず、第2の実施の形態に係る情報処理装置のハードウェアについて説明する。図2は、第2の実施の形態に係る情報処理装置のハードウェアの一例を示すブロック図である。
情報処理装置100は、CPU(Central Processing Unit)101によって装置全体が制御される。CPU101には、バス107を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理部104、入力インタフェース105、及び通信インタフェース106が接続される。
RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションのプログラム、各種データが格納される。グラフィック処理部104には、モニタ108が接続されており、CPU101からの命令に従って画像をモニタ108の画面に表示させる。
入力インタフェース105には、キーボード109aやマウス109b等の入力デバイスが接続されており、キーボード109aやマウス109bから送られてくる信号を、バス107を介してCPU101に送信する。通信インタフェース106は、ネットワーク110に接続されており、ネットワーク110を介して外部から情報を取得する。
このようなハードウェアによって、情報処理装置100の処理機能を実現することができる。
次に、情報処理装置100の機能について説明する。図3は、第2の実施の形態に係る情報処理装置の機能の一例を示すブロック図である。
情報処理装置100は、検索クエリ入力部260と、検索結果取得部120と、検索エンジン130と、検索結果DB(Data Base)140とを有する。
検索クエリ入力部260には、ユーザにより、検索したいウェブサイトに関連する検索クエリが入力される。検索クエリには、キーワード等により検索条件が定義されている。
検索結果取得部120は、検索クエリ入力部260に入力された検索クエリに基づいて、検索エンジン130にウェブサイトの検索を実行させ、その検索結果を取得する。
検索エンジン130は、例えば、図2に示したネットワーク110を介して閲覧可能なウェブサイトから、検索クエリに適合するウェブサイトを発見してそのタイトルとURL(Uniform Resource Locator)とを含む文書を収集する。そして、検索エンジン130は、それに順位付けを行ったものを検索結果として出力する。なお、検索エンジン130は、ここでは、情報処理装置100の一部としているが、情報処理装置100の外部に設けられてもよい。この場合、検索エンジン130は、情報処理装置100と、例えば、ネットワーク110を介して接続される。
検索結果DB140は、検索結果取得部120が取得した検索結果が格納された検索結果情報テーブルを記憶する。
さらに、情報処理装置100は、検索ログ収集部250と、検索ログDB150と、集計部160と、集計結果DB170と、差分計算部180と、計算対象指定部190と、差分DB200とを有する。
検索ログ収集部250は、検索エンジン130によるウェブサイト検索を監視し、検索の時期と、検索クエリと、検索クエリに適合するウェブサイトの検索結果からユーザにより選択されたウェブサイトのURLとを収集する。
検索ログDB150には、検索ログ収集部250が収集した過去のウェブサイト検索における次の情報が記憶される。即ち、検索ログDB150には、検索の時期と、検索クエリと、検索クエリに適合するウェブサイトの検索結果からユーザにより選択されたウェブサイトのURLとが関連付けられた履歴情報が格納される検索ログ情報テーブルが記憶される。
集計部160は、検索ログDB150の検索ログ情報テーブルに基づいて、検索クエリのそれぞれを集計対象とし、URL毎に、集計対象の検索クエリの検索結果から選択された回数を、検索の時期毎に集計する。
集計結果DB170には、集計部160が集計した回数と、集計対象の検索クエリとURLと検索の時期とが関連付けられて格納される集計結果情報テーブルが記憶される。
差分計算部180は、集計結果DB170の集計結果情報テーブルに基づいて、次の計算を行う。即ち、差分計算部180は、検索クエリのそれぞれを計算対象とし、URL毎に、第1の時期の検索において計算対象の検索クエリの検索結果から選択された回数と、第2の時期の検索において計算対象の検索クエリの検索結果から選択された回数との差分を計算する。
計算対象指定部190は、差分計算部180が差分を計算する対象となる第1の時期と、第2の時期とを指定する。例えば、第1の時期には、ユーザが検索を行う時期が指定され、第2の時期には、ユーザが検索を行う時期から遠い時期が指定される。なお、この指定は、ユーザが設定することも可能である。
差分DB200には、差分計算部180が計算した差分が、計算対象の検索クエリとURLと関連付けられて格納される差分情報テーブルが記憶される。
さらに、情報処理装置100は、ランキング部210と、ソート用DB220と、ランキング結果DB230と、検索結果出力部240とを有する。
ランキング部210は、検索結果DB140の検索結果情報テーブルから、第1の属性又は第2の属性の検索において入力された検索クエリに適合するウェブサイトの検索結果の文書を抽出する。さらに、ランキング部210は、抽出した文書に対して、差分DB200の差分情報テーブルから入力された検索クエリ及びURLに対応付けられた差分を抽出する。
ソート用DB220には、ランキング部210が抽出した文書と差分とが関連付けられて格納されるソート用情報テーブルが記憶される。
さらに、ランキング部210は、ソート用DB220のソート用情報テーブルに基づいて、差分の値が高い文書から順番に並べ替えを行う。
ランキング結果DB230には、ランキング部210が並べ替えた文書とその順位とが関連付けられて格納されるランキング結果情報テーブルが記憶される。
検索結果出力部240は、ランキング結果情報テーブルに格納された各文書を、例えば、順位が高いものが画面の上位に位置するように図2に示したモニタ108に表示させる。
ユーザは、モニタ108に表示された文書の一覧を閲覧し、要求するウェブサイトを示す文書を選択してウェブサイトを閲覧する。なお、ユーザが選択した文書のURLは、対応する検索時期と検索クエリと共に、検索ログ収集部250により収集され、検索ログDB150の検索ログ情報テーブルに履歴情報として格納される。
次に、情報処理装置100の差分情報テーブルの更新手順について説明する。
図4は、第2の実施の形態に係る差分情報テーブルの更新手順の一例を示すフローチャートである。
以下に示す処理は、予め設定された稼働時間の時間間隔毎に処理の実行が開始される。なお、これに限らず、検索クエリ入力部260にユーザにより検索クエリが入力されることで実行が開始されてもよい。
[ステップS101]集計部160が、検索ログDB150の検索ログ情報テーブルに格納された履歴情報を抽出する。
[ステップS102]集計部160が、ステップS101で抽出した履歴情報に基づいて、集計結果DB170の集計結果情報テーブルを更新する。即ち、抽出された履歴情報に対応するURLの選択回数を、1つ増やす。
[ステップS103]集計部160が、検索ログ情報テーブルに未処理の履歴情報がないかを判定する。未処理の履歴情報がある場合、処理をステップS101に進める。未処理の履歴情報がない場合、処理をステップS104に進める。
[ステップS104]差分計算部180が、計算対象指定部190により指定された、計算の対象となる第1の時期と第2の時期とを取得する。
[ステップS105]差分計算部180が、集計結果情報テーブルから、計算対象のURLに対して、第1の時期の検索における計算対象の検索クエリの検索結果から選択された回数と、第2の時期の検索における計算対象の検索クエリの検索結果から選択された回数とを抽出する。
[ステップS106]差分計算部180が、ステップS105で抽出した第1の時期の検索における選択回数から第2の時期の検索における選択回数を差し引いて差分を得る。
[ステップS107]差分計算部180が、ステップS106で計算した差分を、計算対象の検索クエリとURLと共に、差分DB200の差分情報テーブルに格納する。
[ステップS108]差分計算部180が、集計結果情報テーブルに第1の時期及び第2の時期に検索が行われた未処理のURLがないかを判定する。未処理のURLがある場合、処理をステップS105に進める。未処理のURLがない場合、処理を終了する。
次に、情報処理装置100のランキング動作の処理手順について説明する。
図5は、第2の実施の形態に係る情報処理装置のランキング動作の処理手順の一例を示すフローチャートである。
以下に示す処理は、検索クエリ入力部260にユーザにより検索クエリが入力されることで実行が開始される。なお、差分DB200には差分情報テーブルが既に記憶されているものとする。
[ステップS201]検索結果取得部120が、検索クエリ入力部260に入力された検索クエリに基づいて、検索エンジン130にウェブサイトの検索を実行させ、その検索結果を取得し、検索結果DB140の検索結果情報テーブルに格納する。
[ステップS202]ランキング部210が、検索結果情報テーブルから、第1の属性又は第2の属性の検索において入力された検索クエリに適合するウェブサイトの検索結果の文書(URL及びタイトル)を抽出する。
[ステップS203]ランキング部210が、ステップS202で抽出した文書に対して、差分DB200の差分情報テーブルから入力された検索クエリ及びURLに対応付けられた差分を抽出する。
[ステップS204]ランキング部210が、ステップS202で抽出した文書と共にステップS203で抽出した差分をソート用DB220のソート用情報テーブルに格納する。
[ステップS205]ランキング部210が、検索結果情報テーブルに未処理の文書がないかを判定する。未処理の文書がある場合、処理をステップS202に進める。未処理の文書がない場合、処理をステップS206に進める。
[ステップS206]ランキング部210が、ソート用情報テーブルに格納された文書を、差分の値が高い文書から順番に並べ替えを行う。
[ステップS207]ランキング部210が、ステップS206で並べ替えを行った文書を、その順位と共にランキング結果DB230のランキング結果情報テーブルに格納する。
[ステップS208]検索結果出力部240が、ランキング結果情報テーブルに格納された文書を、例えば、順位が高いものが画面の上位に位置するようにモニタ108に表示させる。
[ステップS209]検索ログ収集部250が、ステップS208で出力された出力結果からユーザが選択した文書のURLを、対応する検索時期と検索クエリと共に、検索ログDB150の検索ログ情報テーブルに格納して処理を終了する。
次に、情報処理装置100によりモニタ108に表示される表示画面の遷移の一例を説明する。
図6は、第2の実施の形態に係る情報処理装置によりモニタに表示される表示画面の遷移の一例を示す図である。
検索クエリの入力時、表示画面20には、検索クエリ入力欄20aと検索実行ボタン20bとが表示される。この表示画面20に対して、ユーザが、検索クエリ入力欄20aに、例えば、図2に示したキーボード109aを用いて検索クエリを入力し、検索実行ボタン20bを、例えば、図2に示したマウス109bを用いてクリックする。これにより、検索エンジン130で検索が実行され、表示画面20が表示画面21に切り替わる。
表示画面21には、検索結果である各文書のタイトル21aの一覧が表示される。この表示画面21に対して、ユーザが、閲覧を希望するタイトル21aを、例えば、マウス109bを用いてクリックすることで、表示画面21が表示画面22に切り替わり、目的とするウェブサイトが表示される。
なお、例えば、図5に示したステップS209の検索ログ収集ステップは、ユーザが表示画面21のタイトル21aをクリックする動作に基づき実行される。
次に、情報処理装置100の差分情報テーブルの更新手順の一例、及び、ランキング動作の処理手順の一例について説明する。この例は、ユーザが7月に「飲み会」を検索クエリとする検索を行う場合のものである。
まず、差分情報テーブルの更新手順について説明する。
検索ログ情報テーブルには次の情報が予め格納されているものとする。
図7は、第2の実施の形態に係る検索ログ情報テーブルの一例を示す図である。
検索ログ情報テーブル150aには、検索クエリ151aと、選択されたURL152aと、検索の時期153aとが関連付けられた履歴情報が格納される。ここでは、検索の時期153aとして、検索が行われた年及び月が格納される。
検索ログ情報テーブル150aでは、例えば、「飲み会」を検索クエリとした検索結果からURL「fugu.xxx」が選択された検索が2009年1月に行われたことを示す履歴情報が格納されている。さらに、「飲み会」を検索クエリとした検索結果からURL「beer.xxx」が選択された検索が2009年7月に行われたことを示す履歴情報が格納されている。さらに、「飲み会」を検索クエリとした検索結果からURL「ra-men.xxx」が選択された検索が2009年1月及び7月に行われたことを示す履歴情報が格納されている。さらに、「餃子」を検索クエリとした検索結果からURL「gyouza.xxx」が選択された検索が2009年7月に行われたことを示す履歴情報が格納されている。
この検索ログ情報テーブル150aに格納された履歴情報に基づいて、集計部160が集計結果情報テーブルを更新する。
図8は、第2の実施の形態に係る集計結果情報テーブルの一例を示す図である。
集計結果情報テーブル170aには、検索クエリ171aと、選択されたURL172aと、選択されたURL172aが共通の検索クエリの検索結果から選択された回数173aと、検索の時期174aとが関連付けられて格納される。
集計結果情報テーブル170aには、例えば、「飲み会」を検索クエリとする検索結果からURL「fugu.xxx」が選択された回数が2009年1月は「50回」であったことを示す情報が格納されている。さらに、「飲み会」を検索クエリとする検索結果からURL「ra-men.xxx」が選択された回数が2009年1月は「10回」であったことを示す情報が格納されている。さらに、「飲み会」を検索クエリとする検索結果からURL「ra-men.xxx」が選択された回数が2009年7月は「30回」であったことを示す情報が格納されている。さらに、「飲み会」を検索クエリとする検索結果からURL「beer.xxx」が選択された回数が2009年7月は「25回」であったことを示す情報が格納されている。さらに、「餃子」を検索クエリとする検索結果からURL「gyouza.xxx」が選択された回数が2009年7月は「20回」であったことを示す情報が格納される。
次に、計算対象指定部190が、第1の時期に2009年7月を指定し、第2の時期に2009年1月を指定する。これにより、差分計算部180は、次の処理を行う。即ち、集計結果情報テーブル170aから、計算対象のURLに対して、2009年7月の検索における計算対象の検索クエリの検索結果から選択された回数と、2009年1月の検索における計算対象の検索クエリの検索結果から選択された回数とを抽出する。そして、差分計算部180は、抽出した2009年7月の検索における選択回数から2009年1月の検索における選択回数を差し引いた差分を算出し、算出した差分を差分情報テーブルに格納する。
図9は、第2の実施の形態に係る差分情報テーブルの一例を示す図である。
差分情報テーブル200aには、検索クエリ201aと、選択されたURL202aとが格納される。さらに、選択されたURL202aが、2009年7月の検索において共通の検索クエリの検索結果から選択された回数と、2009年1月の検索において共通の検索クエリの検索結果から選択された回数との差分203aとが格納される。
差分情報テーブル200aには、例えば、「飲み会」を検索クエリとする検索結果からURL「fugu.xxx」が選択された検索において、2009年7月の選択回数から2009年1月の選択回数を差し引いた値が「−50」であることを示す情報が格納される。さらに、「飲み会」を検索クエリとする検索結果からURL「ra-men.xxx」が選択された検索において、2009年7月の選択回数から2009年1月の選択回数を差し引いた値が「20」であることを示す情報が格納される。さらに、「飲み会」を検索クエリとする検索結果からURL「beer.xxx」が選択された検索において、2009年7月の選択回数から2009年1月の選択回数を差し引いた値が「25」であることを示す情報が格納される。さらに、「餃子」を検索クエリとする検索結果からURL「gyouza.xxx」が選択された検索において、2009年7月の選択回数から2009年1月の選択回数を差し引いた値が「20」であることを示す情報が格納される。
次に、ランキング動作の処理手順について説明する。
なお、ここで、差分DB200には、差分情報テーブル200aが格納されているものとする。
ユーザが、検索クエリ入力部260に「飲み会」を検索クエリとして入力すると、検索結果取得部120は、検索エンジン130に「飲み会」を検索クエリとするウェブサイトの検索を実行させ、その検索結果を取得して検索結果情報テーブルに格納する。
図10は、第2の実施の形態に係る検索結果情報テーブルの一例を示す図である。
検索結果情報テーブル140aには、検索クエリと、検索クエリに適合するウェブサイトの検索結果であるタイトル141aとURL142aとを含む文書と、順位143aとが関連付けられて格納される。
検索結果情報テーブル140aでは、例えば、タイトルが「飲み会はふぐ鍋」でURLが「fugu.xxx」である文書が1位に順位付けされている。また、タイトルが「夏の飲み会はビール」でURLが「beer.xxx」である文書が2位に順位付けされている。また、タイトルが「飲み会の後はラーメン」でURLが「ra-men.xxx」である文書が3位に順位付けされている。
次に、ランキング部210が、検索結果情報テーブル140aに格納された文書に対して、差分情報テーブル200aから「飲み会」の検索クエリ及び文書のURLに対応付けられた差分を抽出し、文書と差分とをソート用情報テーブルに格納する。
図11は、第2の実施の形態に係るソート用情報テーブルの一例を示す図である。
ソート用情報テーブル220aには、「飲み会」の検索クエリの検索結果であるウェブサイトのタイトル221aとURL222aとを含む文書と、「飲み会」の検索クエリ及び文書のURLに対応付けられた差分223aとが関連付けられて格納される。
ここでは、ソート用情報テーブル220aには、タイトルが「飲み会はふぐ鍋」でURLが「fugu.xxx」である文書の差分が「−50」であることを示す情報が格納される。さらに、タイトルが「夏の飲み会はビール」でURLが「beer.xxx」である文書の差分が「25」であることを示す情報が格納される。さらに、タイトルが「飲み会の後はラーメン」でURLが「ra-men.xxx」である文書の差分が「20」であることを示す情報が格納される。
次に、ランキング部210が、ソート用情報テーブル220aに格納された文書に対して、差分の高い文書から順番に並べ替えを行い、並べ替えを行った文書をその順位と共にランキング結果情報テーブルに格納する。
図12は、第2の実施の形態に係るランキング結果情報テーブルの一例を示す図である。
ランキング結果情報テーブル230aには、検索クエリに適合するウェブサイトの検索結果であるタイトル231aとURL232aとを含む文書と、ランキング部210が並べ替えた順位233aとが関連付けられて格納される。
ここで、ランキング結果情報テーブル230aでは、タイトルが「夏の飲み会はビール」でURLが「beer.xxx」である文書が1位に順位付けされている。また、タイトルが「飲み会の後はラーメン」でURLが「ra-men.xxx」である文書が2位に順位付けされている。また、タイトルが「飲み会はふぐ鍋」でURLが「fugu.xxx」である文書が3位に順位付けされている。
以上のように、情報処理装置100では、ランキング部210が、次の処理を行う。即ち、第1の時期又は第2の時期の検索において入力された検索条件に適合するウェブサイトの検索結果に対して、差分DB200から入力された検索クエリ及び検索結果に含まれるURLに対応付けられた差分を抽出する。そして、抽出した差分に基づいて検索結果に含まれる文書を並べ替える。この差分は、URLが第1の時期の検索において計算対象の検索クエリの検索結果から選択された回数と、URLが第2の時期の検索において計算対象の検索クエリの検索結果から選択された回数との差分である。
これにより、第1の時期の検索における選択回数が第2の時期の検索における選択回数と比較して際だって多いウェブサイトの文書を、上位に配置することが可能となる。従って、例えば、計算対象指定部190により、ユーザが検索を行う時期を第1の時期とし、ユーザが検索を行う時期から遠い時期を第2の時期として指定することで、次のことが可能となる。即ち、ユーザが検索を行う時期に際だって選択回数の多いウェブサイトの文書を上位に配置することが可能となる。これにより、情報処理装置100は、ユーザの検索目的に適合している可能性が高いウェブサイトを正しく上位に配置できる。
例えば、上述したユーザが7月に「飲み会」を検索クエリとする検索を行う例では、検索結果の段階では検索結果情報テーブル140aに示すように、「ふぐ鍋」に関する文書の順位が高く、「ビール」に関する文書の順位は「ふぐ鍋」よりも低い。
しかしながら、差分情報テーブル200aに示すように、「ふぐ鍋」に対応するURL(fugu.xxx)の差分は「ビール」に対応するURL(beer.xxx)の差分よりも低い。この為、ランキング後の順位は、ランキング結果情報テーブル230aに示すように、「ビール」に関する文書の方が「ふぐ鍋」に関する文書よりも高くなる。
即ち、7月という暑い時期にはユーザにより選択される可能性の低い「ふぐ鍋」に関する文書が下位にランキングされ、7月という暑い時期にユーザにより選択される可能性の高い「ビール」に関する文書が上位にランキングされる。
次に、第2の実施の形態の情報処理装置100の変形例について説明する。
(変形例1)
変形例1は、情報処理装置100において、差分の計算に検索の時期を用いる代わりに、検索元のIP(Internet Protocol)アドレスを用いたものである。
変形例1のハードウェア、機能ブロック、及び、処理手順は情報処理装置100と同様である。
変形例1における各機能ブロックの機能に関して、次に説明する。なお、次に説明する以外の機能については情報処理装置100と同様である。
検索ログDB150には、検索ログ収集部250が収集した過去のウェブサイト検索における次の情報が記憶される。即ち、検索元のIPアドレスと、検索クエリと、検索クエリに適合するウェブサイトの検索結果からユーザにより選択されたウェブサイトのURLとが関連付けられた履歴情報が格納される検索ログ情報テーブルが記憶される。
集計部160は、検索ログDB150の検索ログ情報テーブルに基づいて、検索クエリのそれぞれを集計対象とし、URL毎に、集計対象の検索クエリの検索結果から選択された回数を、検索元のIPアドレスに基づいて分けられたグループ毎に集計する。ここで、会社内等では、IPアドレスが組織別に体系的に割り当てられているため、IPアドレスに基づいて組織別にグループ化を行うことが可能となる。
集計結果DB170には、集計部160が集計した回数と、集計対象の検索クエリと、URLと、検索元グループとが関連付けられて格納される集計結果情報テーブルが記憶される。
差分計算部180は、集計結果DB170の集計結果情報テーブルに基づいて、次の計算を行う。即ち、検索クエリのそれぞれを計算対象とし、URL毎に、第1のグループの検索において計算対象の検索クエリの検索結果から選択された回数と、第2のグループの検索において計算対象の検索クエリの検索結果から選択された回数との差分を計算する。
計算対象指定部190は、差分計算部180が差分を計算する対象となる第1のグループと、第2のグループとを指定する。例えば、第1のグループには、ユーザのIPアドレスが分類されるグループが指定され、第2のグループには、ユーザのIPアドレスが分類されるグループを除いた残りのグループが指定される。
ユーザが選択した文書のURLは、対応する検索元のIPアドレスと検索クエリと共に、検索ログ収集部250により収集され、検索ログDB150の検索ログ情報テーブルに履歴情報として格納される。
次に、変形例の差分情報テーブルの更新手順の一例、及び、ランキング動作の処理手順の一例について説明する。この例は、「研究所」に所属するユーザが「管理部」を検索クエリとする検索を行う場合のものである。
まず、差分情報テーブルの更新手順について説明する。
検索ログ情報テーブルには次の情報が予め格納されているものとする。
図13は、第2の実施の形態に係る変形例1の検索ログ情報テーブルの一例を示す図である。
検索ログ情報テーブル150bには、検索クエリ151bと、選択されたURL152bと、検索元のIPアドレス153bとが関連付けられた履歴情報が格納される。
検索ログ情報テーブル150bでは、例えば、「管理部」を検索クエリとした検索結果からURL「ken-kanri.xxx」が選択された検索が、IPアドレスが「xx.xx.200.3」であるユーザにより行われたことを示す履歴情報が格納されている。さらに、「管理部」を検索クエリとした検索結果からURL「se-kanri.xxx」が選択された検索が、IPアドレスが「xx.xx.100.1」及び「xx.xx.100.2」であるユーザにより行われたことを示す履歴情報が格納されている。さらに、「稟議」を検索クエリとした検索結果からURL「ken-ringi.xxx」が選択された検索が、IPアドレスが「xx.xx.200.3」であるユーザにより行われたことを示す履歴情報が格納されている。さらに、「稟議」を検索クエリとした検索結果からURL「se-ringi.xxx」が選択された検索が、IPアドレスが「xx.xx.100.5」であるユーザにより行われたことを示す履歴情報が格納されている。
この検索ログ情報テーブル150bに格納された履歴情報に基づいて、集計部160が集計結果情報テーブルを更新する。
図14は、第2の実施の形態に係る変形例1の集計結果情報テーブルの一例を示す図である。
集計結果情報テーブル170bには、検索クエリ171bと、選択されたURL172bと、選択されたURL172bが共通の検索クエリの検索結果から選択された回数173bと、検索元グループ174bとが関連付けられて格納される。
ここで、集計結果情報テーブル170bでは、検索元グループ174bの「研究所」のグループには、検索ログ情報テーブル150bのIPアドレス153bに基づいて、IPアドレスが「xx.xx.200」以下のものが分類されている。さらに、「SE」のグループには、IPアドレスが「xx.xx.100」以下のものが分類され、「営業」のグループには、IPアドレスが「xx.xx.50」以下のものが分類されている。
集計結果情報テーブル170bには、例えば、「管理部」を検索クエリとする検索結果からURL「ken-kanri.xxx」が選択された回数が「研究所」は10回、「SE」は1回であることを示す情報が格納される。さらに、「管理部」を検索クエリとする検索結果からURL「se-kanri.xxx」が選択された回数が「SE」は20回であることを示す情報が格納される。さらに、「稟議」を検索クエリとする検索結果からURL「ken-ringi.xxx」が選択された回数が「研究所」は20回であることを示す情報が格納される。さらに、「稟議」を検索クエリとする検索結果からURL「se-ringi.xxx」が選択された回数が「SE」は15回、「営業」は1回であることを示す情報が格納される。
次に、計算対象指定部190が、第1のグループに「研究所」を指定し、第2のグループに「研究所」を除く残りのグループを指定する。これにより、差分計算部180は、次の処理を行う。即ち、集計結果情報テーブル170bから、計算対象のURLに対して、「研究所」のグループの検索における計算対象の検索クエリの検索結果から選択された回数を抽出する。さらに、計算対象のURLに対して、「研究所」を除く残りのグループの検索における計算対象の検索クエリの検索結果から選択された回数を抽出する。
そして、差分計算部180は、抽出した「研究所」のグループの検索における選択回数から「研究所」を除く残りのグループの検索における選択回数を差し引いた差分を算出し、算出した差分を差分情報テーブルに格納する。
図15は、第2の実施の形態に係る変形例1の差分情報テーブルの一例を示す図である。
差分情報テーブル200bには、検索クエリ201bと、選択されたURL202bとが格納される。さらに、選択されたURL202bが、「研究所」のグループの検索において共通の検索クエリの検索結果から選択された回数と、「研究所」を除く残りのグループの検索において共通の検索クエリの検索結果から選択された回数との差分203bとが格納される。
差分情報テーブル200bには、例えば、「管理部」を検索クエリとする検索結果からURL「ken-kanri.xxx」が選択された検索において、「研究所」の選択回数からそれ以外のグループの選択回数を差し引いた値が「9」であることを示す情報が格納される。さらに、「管理部」を検索クエリとする検索結果からURL「se-kanri.xxx」が選択された検索において、「研究所」の選択回数からそれ以外のグループの選択回数を差し引いた値が「−20」であることを示す情報が格納される。さらに、「稟議」を検索クエリとする検索結果からURL「ken-ringi.xxx」が選択された検索において、「研究所」の選択回数からそれ以外のグループの選択回数を差し引いた値が「20」であることを示す情報が格納される。さらに、「稟議」を検索クエリとする検索結果からURL「se-ringi.xxx」が選択された検索において、「研究所」の選択回数からそれ以外のグループの選択回数を差し引いた値が「−16」であることを示す情報が格納される。
次に、ランキング動作の処理手順について説明する。
なお、ここでは、差分DB200に差分情報テーブル200bが記憶されているものとする。
ユーザが、検索クエリ入力部260に「管理部」を検索クエリとして入力すると、検索結果取得部120は、検索エンジン130に「管理部」を検索クエリとするウェブサイトの検索を実行させ、その検索結果を取得して検索結果情報テーブルに格納する。
図16は、第2の実施の形態に係る変形例1の検索結果情報テーブルの一例を示す図である。
検索結果情報テーブル140bには、「管理部」の検索クエリの検索結果であるウェブサイトのタイトル141bとURL142bとを含む文書と、順位143bとが関連付けられて格納される。
検索結果情報テーブル140bでは、例えば、タイトルが「SE管理部」でURLが「se-kanri.xxx」である文書が1位に順位付けされている。また、タイトルが「研究所管理部」でURLが「ken-kanri.xxx」である文書が2位に順位付けされている。さらに、タイトルが「営業管理部」でURLが「eigyou.xxx」である文書が3位に順位付けされている。
次に、ランキング部210が、検索結果情報テーブル140bに格納された文書に対して、差分情報テーブル200bから「管理部」の検索クエリ及び文書のURLに対応付けられた差分を抽出し、文書と差分とをソート用情報テーブルに格納する。
次に、ランキング部210が、ソート用情報テーブルに格納された文書に対して、差分の高い文書から順番に並べ替えを行い、並べ替えを行った文書をその順位と共にランキング結果情報テーブルに格納する。
図17は、第2の実施の形態に係る変形例1のランキング結果情報テーブルの一例を示す図である。
ランキング結果情報テーブル230bには、「管理部」の検索クエリの検索結果であるウェブサイトのタイトル231bとURL232bとを含む文書と、ランキング部210が並べ替えた順位233bとが関連付けられて格納される。
ここで、ランキング結果情報テーブル230bでは、タイトルが「研究所管理部」でURLが「ken-kanri.xxx」である文書が1位に順位付けされている。また、タイトルが「営業管理部」でURLが「eigyou.xxx」である文書が2位に順位付けされている。さらに、タイトルが「SE管理部」でURLが「se-kanri.xxx」である文書が3位に順位付けされている。
以上のように、第2の実施の形態の変形例1は、URLが第1のグループの検索において計算対象の検索クエリの検索結果から選択された回数と、URLが第2のグループの検索において計算対象の検索クエリの検索結果から選択された回数との差分を用いる。
これにより、第1のグループの検索における選択回数が第2のグループの検索における選択回数と比較して際だって多いウェブサイトの文書を、上位に配置することが可能となる。従って、例えば、計算対象指定部190により、ユーザが所属するグループを第1のグループとし、ユーザが所属するグループを除いた残りのグループを第2のグループとして指定することで、次のことが可能となる。即ち、ユーザが所属するグループに際だって選択回数の多いウェブサイトの文書を上位に配置することが可能となる。これにより、ユーザの検索目的に適合している可能性が高いウェブサイトを正しく上位に配置できる。
例えば、上述した「研究所」に所属するユーザが「管理部」を検索クエリとする検索を行う例では、検索結果の段階では検索結果情報テーブル140bに示すように、「SE管理部」の文書の順位が高く、「研究所管理部」の文書の順位は「SE管理部」よりも低い。
しかしながら、差分情報テーブル200bに示すように、「SE管理部」に対応するURL(se-kanri.xxx)の差分は、「研究所管理部」に対応するURL(ken-kanri.xxx)の差分よりも低い。この為、ランキング後の順位は、ランキング結果情報テーブル230bに示すように、「研究所管理部」に関する文書の方が「SE管理部」に関する文書よりも高くなる。
即ち、「研究所」に所属するユーザにより選択される可能性の低い「SE管理部」に関する文書が下位にランキングされ、「研究所」に所属するユーザにより選択される可能性の高い「研究所管理部」に関する文書が上位にランキングされる。
なお、上述した変形例1では、グループ化に関して、検索元のIPアドレスを用いているが、これに代えて、予め登録された検索元の位置情報を用いてもよい。
この場合の例を、第2の実施の形態に係る変形例2として説明する。
(変形例2)
図18は、第2の実施の形態に係る変形例2の検索ログ情報テーブルの一例を示す図である。
検索ログ情報テーブル150cには、検索クエリ151cと、選択されたURL152cと、検索元の位置情報153cとが関連付けられた履歴情報が格納される。
例えば、検索ログ情報テーブル150cには、「餃子」を検索クエリとした検索結果からURL「Gyouza.xxx」が選択された検索が、位置情報が「栃木」のユーザにより行われたことを示す履歴情報が格納される。さらに、「納豆」を検索クエリとした検索結果からURL「nattou.xxx」が選択された検索が、位置情報が「茨城」であるユーザにより行われたことを示す履歴情報が格納される。
図19は、第2の実施の形態に係る変形例2の集計結果情報テーブルの一例を示す図である。
集計結果情報テーブル170cには、検索クエリ171cと、選択されたURL172cと、選択されたURL172cが共通の検索クエリの検索結果から選択された回数173cと、検索元位置情報174cとが関連付けられて格納される。
例えば、集計結果情報テーブル170cには、「餃子」を検索クエリとする検索結果からURL「Gyouza.xxx」が選択された回数が「栃木」は10回、「茨城」は1回であることを示す情報が格納される。さらに、「納豆」を検索クエリとする検索結果からURL「nattou.xxx」が選択された回数が「茨城」は50回、「栃木」は2回であることを示す情報が格納される。
変形例2では、変形例1と同様の理由により、ユーザが所属する位置に際だって選択回数の多いウェブサイトの文書を上位に配置することが可能となる。これにより、ユーザの検索目的に適合している可能性が高いウェブサイトを正しく上位に配置できる。
次に、情報処理装置100に、ランキング規則学習機能を付加した実施の形態を、第3の実施の形態として説明する。
[第3の実施の形態]
図20は、第3の実施の形態に係る情報処理装置の機能の一例を示すブロック図である。第3の実施の形態では、対応するURLの差分が差分情報テーブルに格納されていない場合においても、検索結果の各文書に対して並べ替えを行う。
情報処理装置300は、情報処理装置100に加えて、入力形式変換部310と、学習情報DB320と、ランキング規則学習部330と、ランキング規則DB340とを有する。なお、図20では、情報処理装置100が有する機能ブロックのうち、ランキング結果DB230、ランキング部210、検索結果DB140、及び、ランキング結果DB230以外の機能ブロックについては図示を省略している。
入力形式変換部310は、ランキング結果DB230が記憶するランキング結果情報テーブルの各情報から素性を抽出する。素性とはランキングを決定するための項目であり、例えば、情報のタイトルに出現する単語であったり、情報の位置を示すURLのホスト名等を用いる。以降の例では、ランキング結果DB230が記憶するランキング結果テーブルに格納された各タイトルから単語を素性として抽出したとする。
学習情報DB320は、入力形式変換部310が抽出した素性が、その順位に対応したID(identification)と関連づけて格納される学習情報テーブルを記憶する。
ランキング規則学習部330は、学習情報DB320の学習情報テーブルに格納された各素性に対して、IDに基づいて点数付けを行う。例えば、高い順位に対応するIDが付与された素性に対しては、高い点数を付ける。ランキングの学習アルゴリズムとしては、例えば、非特許文献1にある手法を用いる。
ランキング規則DB340は、ランキング規則学習部330が付けた点数が、対応する素性と共に格納されたランキング規則情報テーブルを記憶する。
ランキング部210は、ランキング規則DB340のランキング規則情報テーブルに基づいて、検索結果に対して点数付けを行い、この点数に基づいて、検索結果である各文書に対して並べ替えを行う。
次に、情報処理装置300の学習手順の一例、及び、ランキング動作の処理手順の一例について説明する。
まず、学習手順の一例について説明する。
ここで、ランキング結果DB230には、図12に示したランキング結果情報テーブル230aが記憶されているものとする。
まず、入力形式変換部310が、ランキング結果情報テーブル230aに格納された各タイトルから単語等の素性を抽出する。
次に、学習情報DB320が、入力形式変換部310が抽出した素性を、その順位に対応したIDと関連づけて学習情報テーブルに格納する。
図21は、第3の実施の形態に係る学習情報テーブルの一例を示す図である。
学習情報テーブル320aには、素性321aとID322aとが関連付けられて格納される。ここでは、学習情報テーブル320aには、ID「1」に対応する素性が、「夏」、「飲み会」、「ビール」であることを示す情報が格納される。さらに、ID「2」に対応する素性が、「飲み会」、「ラーメン」であり、ID「3」に対応する素性が、「飲み会」、「ふぐ鍋」であることを示す情報が格納される。
また、ここで、学習情報DB320には、学習情報テーブル320aとは別の学習情報テーブルが記憶されているものとする。
図22は、第3の実施の形態に係る学習情報テーブルの一例を示す図である。
学習情報テーブル320bには、例えば、ID「1」に対応する素性が、「餃子」、「ビール」であり、ID「2」に対応する素性が、「餃子」、「鍋」であり、ID「3」に対応する素性が、「飲み会」、「餃子」、「ふぐ鍋」であることを示す情報が格納される。
次に、ランキング規則学習部330が、学習情報テーブル320a,320bに格納された各素性に対して、IDに基づいて点数付けを行い、その点数を対応する素性と共にランキング規則情報テーブルに格納する。
図23は、第3の実施の形態に係るランキング規則情報テーブルの一例を示す図である。
ランキング規則情報テーブル340aには、素性341aと点数342aとが関連付けられて格納される。
ここでは、ランキング規則情報テーブル340aには、「夏」の点数が「10点」であり、「ビール」の点数が「20点」であることを示す情報が格納される。さらに、「鍋」の点数が「−10点」であり、「ふぐ」の点数が「−5」点であり、「ラーメン」の点数が「2点」であることを示す情報が格納される。
次に、ランキング動作の一例について説明する。
なお、ここで、ランキング規則DB340には、ランキング規則情報テーブル340aが格納されているものとする。
検索の結果、例えば、図24に示す検索結果が得られたとする。
図24は、第3の実施の形態に係る検索結果情報テーブルの一例を示す図である。
ランキング部210は、検索結果情報テーブル140cの各文書に対して、ランキング規則情報テーブル340aに基づいて点数付けを行う。
ここでは、文書141cは、タイトルに「ふぐ」、「鍋」を含むため、「−5点」、「−10」点が加算され、点数は「−15点」となる。文書142cは、タイトルに「ラーメン」を含むため、「2点」が加算され、点数は「2点」となる。文書143cは、タイトルに「ビール」を含むため、「20点」が加算され、点数は「20点」となる。
この点数に基づいて並べ替えを行った結果を図25に示す。
図25は、第3の実施の形態に係るランキング結果情報テーブルの一例を示す図である。
ランキング結果情報テーブル230cでは、「ビール」に関する文書の順位が「ふぐ鍋」に関する文書の順位よりも高くなる。即ち、第2の実施の形態と同様の結果を得ることが可能となる。
以上のように、情報処理装置300では、ランキング規則学習部330が、ランキング結果情報テーブル230cに格納された文書から抽出された素性に点数付けを行い、その点数と対応する素性とを関連付けてランキング規則情報テーブル340cに格納する。さらに、ランキング部210は、検索結果である各文書に対して、ランキング規則情報テーブル340cに基づいて点数付けを行う。
これにより、情報処理装置300では、対応するURLの差分が差分情報テーブルに格納されていない場合においても、検索結果の各文書に対して並べ替えを行うことが可能となる。
なお、各実施の形態で示した以上の処理は、コンピュータに所定のプログラムを実行させることで実現できる。その場合、実現すべき処理内容を記述したプログラムが提供される。処理内容を記述したプログラムは、コンピュータ読み取り可能な記録媒体に記録しておくことができる。コンピュータ読み取り可能な記録媒体には、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリがある。磁気記録装置には、ハードディスク装置、フレキシブルディスク(FD)、磁気テープ(MT)等がある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc−Read Only Memory)、CD−R(Recordable)、CD−RW(ReWritable)等がある。光磁気記録媒体には、MO(Magneto-Optical disk)等がある。
プログラムを流通させる場合、例えば、そのプログラムが記録されたDVD、CD−ROM等の可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。
以上説明した第1〜3の実施の形態を含む実施の形態に関し、さらに以下の付記を開示する。
(付記1) 過去の検索における、検索の属性と、検索条件と、前記検索条件に適合する情報の検索結果から選択された選択情報とを関連付けて記憶する検索ログ記憶手段を参照し、前記検索条件のそれぞれを計算対象とし、前記選択情報毎に、第1の属性の検索において前記計算対象の検索条件の検索結果から選択された回数と、第2の属性の検索において前記計算対象の検索条件の検索結果から選択された回数との差分を計算し、計算した前記差分を、前記計算対象の検索条件と前記選択情報とに関連付けて差分記憶手段に格納する差分計算手段と、
前記第1の属性又は前記第2の属性の検索において入力された検索条件に適合する情報の検索結果に対して、前記差分記憶手段から前記入力された検索条件及び検索結果に含まれる情報に対応付けられた前記差分を抽出し、抽出した前記差分に基づいて検索結果に含まれる情報を並べ替える並べ替え手段と、
を有することを特徴とする情報処理装置。
(付記2) 前記検索の属性から、前記第1の属性と前記第2の属性とを指定する指定手段を有することを特徴とする付記1記載の情報処理装置。
(付記3) 前記並べ替え手段が並べ替えを行った情報から抽出した素性に対して点数付けを行い、付けた点数と対応する前記素性とを関連付けてランキング規則記憶手段に格納するランキング規則学習手段を有し、
前記並べ替え手段は、検索結果に含まれる情報に対して、前記ランキング規則記憶手段を参照し、点数付けして並べ替えを行うことを特徴とする付記1又は2記載の情報処理装置。
(付記4) 前記検索の属性は、検索が行われた時期に関するものであることを特徴とする付記1から3のいずれかに記載の情報処理装置。
(付記5) 前記検索の属性は、検索元の所属に関するものであることを特徴とする付記1から3のいずれかに記載の情報処理装置。
(付記6) 前記検索の属性は、検索元のIPアドレスに関するものであることを特徴とする付記5記載の情報処理装置。
(付記7) 前記検索の属性は、検索元の位置情報に関するものであることを特徴とする付記5記載の情報処理装置。
(付記8) コンピュータを、
過去の検索における、検索の属性と、検索条件と、前記検索条件に適合する情報の検索結果から選択された選択情報とを関連付けて記憶する検索ログ記憶手段を参照し、前記検索条件のそれぞれを計算対象とし、前記選択情報毎に、第1の属性の検索において前記計算対象の検索条件の検索結果から選択された回数と、第2の属性の検索において前記計算対象の検索条件の検索結果から選択された回数との差分を計算し、計算した前記差分を、前記計算対象の検索条件と前記選択情報とに関連付けて差分記憶手段に格納する差分計算手段、
前記第1の属性又は前記第2の属性の検索において入力された検索条件に適合する情報の検索結果に対して、前記差分記憶手段から前記入力された検索条件及び検索結果に含まれる情報に対応付けられた前記差分を抽出し、抽出した前記差分に基づいて検索結果に含まれる情報を並べ替える並べ替え手段、
として機能させることを特徴とする情報処理プログラム。
(付記9) 前記コンピュータをさらに、前記検索の属性から、前記第1の属性と前記第2の属性とを指定する指定手段として機能させることを特徴とする付記8記載の情報処理プログラム。
(付記10) 前記コンピュータをさらに、
前記並べ替え手段が並べ替えを行った情報から抽出した素性に対して点数付けを行い、付けた点数と対応する前記素性とを関連付けてランキング規則記憶手段に格納するランキング規則学習手段として機能させ、
前記並べ替え手段は、検索結果に含まれる情報に対して、前記ランキング規則記憶手段を参照し、点数付けして並べ替えを行うことを特徴とする付記8又は9記載の情報処理プログラム。
(付記11) 前記検索の属性は、検索が行われた時期に関するものであることを特徴とする付記8から10のいずれかに記載の情報処理プログラム。
(付記12) 前記検索の属性は、検索元の所属に関するものであることを特徴とする付記8から10のいずれかに記載の情報処理プログラム。
(付記13) 前記検索の属性は、検索元のIPアドレスに関するものであることを特徴とする付記12記載の情報処理プログラム。
(付記14) 前記検索の属性は、検索元の位置情報に関するものであることを特徴とする付記12記載の情報処理プログラム。
(付記15) コンピュータが、
過去の検索における、検索の属性と、検索条件と、前記検索条件に適合する情報の検索結果から選択された選択情報とを関連付けて記憶する検索ログ記憶手段を参照し、前記検索条件のそれぞれを計算対象とし、前記選択情報毎に、第1の属性の検索において前記計算対象の検索条件の検索結果から選択された回数と、第2の属性の検索において前記計算対象の検索条件の検索結果から選択された回数との差分を計算し、計算した前記差分を、前記計算対象の検索条件と前記選択情報とに関連付けて差分記憶手段に格納し、
前記第1の属性又は前記第2の属性の検索において入力された検索条件に適合する情報の検索結果に対して、前記差分記憶手段から前記入力された検索条件及び検索結果に含まれる情報に対応付けられた前記差分を抽出し、抽出した前記差分に基づいて検索結果に含まれる情報を並べ替える、
ことを特徴とする情報処理方法。
(付記16) 前記検索の属性から、前記第1の属性と前記第2の属性とを指定することを特徴とする付記15記載の情報処理方法。
(付記17) 並べ替えを行った情報から抽出した素性に対して点数付けを行い、
付けた点数と対応する前記素性とを関連付けてランキング規則記憶手段に格納し、
検索結果に含まれる情報に対して、前記ランキング規則記憶手段を参照し、点数付けして並べ替えを行うことを特徴とする付記15又は16記載の情報処理方法。
(付記18) 前記検索の属性は、検索が行われた時期に関するものであることを特徴とする付記15から17のいずれかに記載の情報処理方法。
(付記19) 前記検索の属性は、検索元の所属に関するものであることを特徴とする付記15から17のいずれかに記載の情報処理方法。
(付記20) 前記検索の属性は、検索元のIPアドレスに関するものであることを特徴とする付記19記載の情報処理方法。
(付記21) 前記検索の属性は、検索元の位置情報に関するものであることを特徴とする付記19記載の情報処理方法。
10 情報処理装置
11 検索ログ記憶手段
11a 検索ログ情報テーブル
12 差分計算手段
13 差分記憶手段
13a 差分情報テーブル
14 検索結果記憶手段
14a 検索結果情報テーブル
15 並べ替え手段
16 並べ替え結果記憶手段
16a 並べ替え結果情報テーブル

Claims (7)

  1. 過去の検索における、検索の属性と、検索条件と、前記検索条件に適合する情報の検索結果から選択された選択情報とを関連付けて記憶する検索ログ記憶手段を参照し、前記検索条件のそれぞれを計算対象とし、前記選択情報毎に、第1の属性の検索において前記計算対象の検索条件の検索結果から選択された回数と、第2の属性の検索において前記計算対象の検索条件の検索結果から選択された回数との差分を計算し、計算した前記差分を、前記計算対象の検索条件と前記選択情報とに関連付けて差分記憶手段に格納する差分計算手段と、
    前記第1の属性又は前記第2の属性の検索において入力された検索条件に適合する情報の検索結果に対して、前記差分記憶手段から前記入力された検索条件及び検索結果に含まれる情報に対応付けられた前記差分を抽出し、抽出した前記差分に基づいて検索結果に含まれる情報を並べ替える並べ替え手段と、
    を有することを特徴とする情報処理装置。
  2. 前記検索の属性から、前記第1の属性と前記第2の属性とを指定する指定手段を有することを特徴とする請求項1記載の情報処理装置。
  3. 前記並べ替え手段が並べ替えを行った情報から抽出した素性に対して点数付けを行い、付けた点数と対応する前記素性とを関連付けてランキング規則記憶手段に格納するランキング規則学習手段を有し、
    前記並べ替え手段は、検索結果に含まれる情報に対して、前記ランキング規則記憶手段を参照し、点数付けして並べ替えを行うことを特徴とする請求項1又は2記載の情報処理装置。
  4. 前記検索の属性は、検索が行われた時期に関するものであることを特徴とする請求項1から3のいずれかに記載の情報処理装置。
  5. 前記検索の属性は、検索元の所属に関するものであることを特徴とする請求項1から3のいずれかに記載の情報処理装置。
  6. コンピュータを、
    過去の検索における、検索の属性と、検索条件と、前記検索条件に適合する情報の検索結果から選択された選択情報とを関連付けて記憶する検索ログ記憶手段を参照し、前記検索条件のそれぞれを計算対象とし、前記選択情報毎に、第1の属性の検索において前記計算対象の検索条件の検索結果から選択された回数と、第2の属性の検索において前記計算対象の検索条件の検索結果から選択された回数との差分を計算し、計算した前記差分を、前記計算対象の検索条件と前記選択情報とに関連付けて差分記憶手段に格納する差分計算手段、
    前記第1の属性又は前記第2の属性の検索において入力された検索条件に適合する情報の検索結果に対して、前記差分記憶手段から前記入力された検索条件及び検索結果に含まれる情報に対応付けられた前記差分を抽出し、抽出した前記差分に基づいて検索結果に含まれる情報を並べ替える並べ替え手段、
    として機能させることを特徴とする情報処理プログラム。
  7. コンピュータが、
    過去の検索における、検索の属性と、検索条件と、前記検索条件に適合する情報の検索結果から選択された選択情報とを関連付けて記憶する検索ログ記憶手段を参照し、前記検索条件のそれぞれを計算対象とし、前記選択情報毎に、第1の属性の検索において前記計算対象の検索条件の検索結果から選択された回数と、第2の属性の検索において前記計算対象の検索条件の検索結果から選択された回数との差分を計算し、計算した前記差分を、前記計算対象の検索条件と前記選択情報とに関連付けて差分記憶手段に格納し、
    前記第1の属性又は前記第2の属性の検索において入力された検索条件に適合する情報の検索結果に対して、前記差分記憶手段から前記入力された検索条件及び検索結果に含まれる情報に対応付けられた前記差分を抽出し、抽出した前記差分に基づいて検索結果に含まれる情報を並べ替える、
    ことを特徴とする情報処理方法。
JP2010003260A 2010-01-08 2010-01-08 情報処理装置、情報処理プログラム、及び、情報処理方法 Expired - Fee Related JP5381728B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010003260A JP5381728B2 (ja) 2010-01-08 2010-01-08 情報処理装置、情報処理プログラム、及び、情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010003260A JP5381728B2 (ja) 2010-01-08 2010-01-08 情報処理装置、情報処理プログラム、及び、情報処理方法

Publications (2)

Publication Number Publication Date
JP2011141838A JP2011141838A (ja) 2011-07-21
JP5381728B2 true JP5381728B2 (ja) 2014-01-08

Family

ID=44457609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010003260A Expired - Fee Related JP5381728B2 (ja) 2010-01-08 2010-01-08 情報処理装置、情報処理プログラム、及び、情報処理方法

Country Status (1)

Country Link
JP (1) JP5381728B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2956236B1 (fr) 2010-02-09 2012-11-30 France Etat Ponts Chaussees Procede et dispositif de detection de gouttes dans une image numerique; programme d'ordinateur pour la mise en oeuvre de ce procede.
JP6104048B2 (ja) * 2013-05-20 2017-03-29 株式会社Nttドコモ コンテンツ検索結果提供装置及びコンテンツ検索結果提供方法
US9760608B2 (en) * 2013-11-01 2017-09-12 Microsoft Technology Licensing, Llc Real-time search tuning
JP6872851B2 (ja) * 2016-01-14 2021-05-19 ヤフー株式会社 情報選択装置、情報選択方法および情報選択プログラム
JP7256357B2 (ja) * 2018-10-31 2023-04-12 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JP7174743B2 (ja) * 2020-11-02 2022-11-17 ヤフー株式会社 情報選択装置、情報選択方法および情報選択プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003173352A (ja) * 2001-12-05 2003-06-20 Nippon Telegr & Teleph Corp <Ntt> 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
JP2004348626A (ja) * 2003-05-26 2004-12-09 Hitachi Ltd 文書検索方法及び文書検索システム
JP4833305B2 (ja) * 2009-02-16 2011-12-07 ニフティ株式会社 ホットサイト提示システム

Also Published As

Publication number Publication date
JP2011141838A (ja) 2011-07-21

Similar Documents

Publication Publication Date Title
JP4005425B2 (ja) 検索結果ランキング変更処理プログラム、検索結果ランキング変更処理プログラム記録媒体、およびコンテンツ検索処理方法
US9245022B2 (en) Context-based person search
CN103699700B (zh) 一种搜索引导的生成方法、系统及相关服务器
JP5381728B2 (ja) 情報処理装置、情報処理プログラム、及び、情報処理方法
CN101154224B (zh) 一种网址导航方法及系统
JP5341276B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP5147947B2 (ja) クエリ別検索コレクション生成方法およびシステム
JP5673336B2 (ja) 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム
EP1917610A2 (en) Removing documents
JP2007058782A (ja) 情報検索装置および情報検索方法
US10282358B2 (en) Methods of furnishing search results to a plurality of client devices via a search engine system
JP5556711B2 (ja) カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム
JP4962980B2 (ja) クリックログを用いた検索結果分類装置及び方法
US20150339387A1 (en) Method of and system for furnishing a user of a client device with a network resource
JP2015106354A (ja) 検索サジェスト装置、検索サジェスト方法、及び、プログラム
CN103186666A (zh) 基于收藏进行搜索的方法、装置与设备
CN106126544A (zh) 一种互联网内容的投放方法及装置
JP2013092830A (ja) 情報処理装置、プログラム及び情報検索システム
JP4912384B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
KR20010095215A (ko) 사이트 정보 데이터베이스 구축을 통한 인터넷 상에서의정보 검색 방법
WO2007120781A2 (en) Systems and methods for performing searches within vertical domains
JP5315485B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2011103020A (ja) 検索条件推薦装置、検索条件推薦方法および検索条件推薦プログラム
JP5915724B2 (ja) 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム
JP2009070210A (ja) カテゴリ別ランキング作成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130916

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees