JP2010033442A - 検索システム評価装置、及び、検索システム評価方法 - Google Patents

検索システム評価装置、及び、検索システム評価方法 Download PDF

Info

Publication number
JP2010033442A
JP2010033442A JP2008196597A JP2008196597A JP2010033442A JP 2010033442 A JP2010033442 A JP 2010033442A JP 2008196597 A JP2008196597 A JP 2008196597A JP 2008196597 A JP2008196597 A JP 2008196597A JP 2010033442 A JP2010033442 A JP 2010033442A
Authority
JP
Japan
Prior art keywords
search
search system
data
evaluation value
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008196597A
Other languages
English (en)
Inventor
Daisuke Torii
大祐 鳥居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2008196597A priority Critical patent/JP2010033442A/ja
Publication of JP2010033442A publication Critical patent/JP2010033442A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】検索システム自体に対する評価が可能な検索システム評価装置および検索システム評価方法を提供する。
【解決手段】主セッション特定部201は、記録装置1gに格納された検索ログデータから、一の検索端末による一連の検索操作(主セッション)を特定する。サブセッション特定部203は、主セッション特定部201によって特定された一連の検索操作(主セッション)を構成しており検索システム毎の一連の検索操作を示す一又は複数の検索セッション(サブセッション)を、一連の検索操作(主セッション)から特定する。評価値算出部205は、サブセッション特定部203によって特定された検索セッション(サブセッション)の数に応じて評価値を算出する。
【選択図】図2

Description

本発明は、インターネット上の検索システムを評価する検索システム評価装置および検索システム評価方法に関する。
特許文献1には、検索システムによる検索結果に対する評価値を検索キーワードに基づいて算出する技術が開示されている。特許文献1のシステムは、アクセス要求側を示すアクセス要求側識別データとアクセス要求側にアクセスされたアクセス先を示すアクセス先識別データとを関連づけたWebログに基づいて同一のアクセス要求側による連続的なアクセスを表すアクセスシーケンスを抽出する機能と、検索システムを示すアクセス先識別データと入力される検索キーワードとがWebログにおいて関連付けされている場合に、Webログに基づいて検索キーワードを抽出する機能と、検索システムの検索結果に対する質的評価規則に基づいてアクセスシーケンスに対応する質的評価値を算出し、検索キーワードと質的評価値との対応関係を示す関係データを求める機能とを有する。
特開2004−252911号公報
特許文献1の技術によれば、検索システムによる検索結果に対する評価値が検索キーワード毎に算出される。しかし、複数の検索システムのそれぞれを評価する場合、このような検索キーワード毎の評価値を用いて検索システム自体を評価するのは困難である。そこで本発明の目的は、検索システム自体に対する評価が可能な検索システム評価装置および検索システム評価方法を提供することである。
本発明の検索システム評価装置は、インターネットを介した情報検索に用いられる一又は複数の検索システムの利用満足度をそれぞれ評価するための評価値を算出する検索システム評価装置であって、上記情報検索の履歴を示す検索ログデータを格納する記録装置と、上記記録装置に格納された上記検索ログデータから、一の検索端末による一連の検索操作を特定する第1の特定手段と、上記第1の特定手段によって特定された一連の検索操作を構成しており上記検索システム毎の一連の検索操作を示す一又は複数の検索セッションを、上記一連の検索操作から特定する第2の特定手段と、上記第2の特定手段によって特定された検索セッションの数に応じて上記評価値を算出する算出手段とを備える、ことを特徴とする。そして、上記算出手段は、上記第2の特定手段によって特定された上記検索セッションの数が複数の場合に、連続して行われた二つの検索セッションのうち最先の検索セッションの検索システムに対する上記評価値を減算する、ことを特徴とする。
従って、検索システムの利用状況を示す検索ログデータから検索システムの利用満足度を評価するための評価値が、一の検索端末による一連の検索操作に含まれる検索セッション(一の検索システムによる一連の検索操作)の数に応じて算出される。このように、一の検索端末による一連の検索操作において、一の検索システムのみが用いられたか、又は、この一の検索システム以外の他の検索システムが用いられたかに基づいて、検索システムに対する評価が可能となる。他の検索システムが用いられたということは、評価対象となっている検索システムに対する満足度が低い、ということを意味していると考えられるので、検索システムに対する評価を、従来のように評価対象となっている検索システム自体に対する検索操作(例えば、検索時間や閲覧サイト数等)に基づいて行うよりも、本発明のように他の検索システムが用いられたか否かに応じて行えば、好適な評価が可能となる。
また、本発明の検索システム評価装置では、上記評価値を算出するための一又は複数の指標データを上記記録装置に格納された上記検索ログデータに基づいて取得する取得手段を更に備え、上記算出手段は、上記取得手段によって取得された上記一又は複数の指標データの内容に応じて上記評価値を算出する。このように、指標データ(例えば、検索システム自体に対する検索操作を示すデータ)が検索システムに対する評価値の算出に更に用いられるので、検索システムに対するより好適な評価が可能となる。
インターネットを介した情報検索に用いられる一又は複数の検索システムの利用満足度をそれぞれ評価するための評価値を算出する検索システム評価装置を用いた検索システム評価方法であって、上記検索システム評価装置の記録装置に格納されており上記情報検索の履歴を示す検索ログデータから、一の検索端末による一連の検索操作を上記検索システム評価装置が特定する第1の特定ステップと、上記検索システム毎の一連の検索操作を示しており上記第1の特定ステップにおいて特定された一連の検索操作を構成する一又は複数の検索セッションを、上記一連の検索操作から上記検索システム評価装置が特定する第2の特定ステップと、上記第2の特定ステップにおいて特定された検索セッションの数に応じて上記評価値を上記検索システム評価装置が算出する算出ステップとを備える、ことを特徴とする。
従って、検索システムの利用状況を示す検索ログデータから検索システムの利用満足度を評価するための評価値が、一の検索端末による一連の検索操作に含まれる検索セッション(一の検索システムによる一連の検索操作)の数に応じて算出される。このように、一の検索端末による一連の検索操作において、一の検索システムのみが用いられたか、又は、この一の検索システム以外の他の検索システムが用いられたかに基づいて、検索システムに対する評価が可能となる。他の検索システムが用いられたということは、評価対象となっている検索システムに対する満足度が低い、ということを意味していると考えられるので、検索システムに対する評価を、従来のように評価対象となっている検索システム自体に対する検索操作(例えば、検索時間や閲覧サイト数等)に基づいて行うよりも、本発明のように他の検索システムが用いられたか否かに応じて行えば、好適な評価が可能となる。
本発明によれば、検索システム自体に対する評価が可能な検索システム評価装置および検索システム評価方法が提供できる。
以下、図面を参照して、本発明に係る好適な実施形態について詳細に説明する。なお、図面の説明において、可能な場合には、同一要素には同一符号を付し、重複する説明を省略する。検索システム評価装置1は、インターネット上の検索システムの利用満足度を自動的に評価するための装置である。検索システム評価装置1は、評価結果を検索システム等に通知する。検索システム評価装置1は、図1に示すように、物理的には、CPU1a(プロセッサ)、RAM1b、ROM1c、入力装置1d、出力装置1e、通信装置1f及び記録装置1gを有しており、これらはバス1hに接続されている。CPU1aは、ROM1c等の内蔵メモリに格納された所定のコンピュータソフトウェア(図12及び図13のフローチャートに示す処理を実行するためのコンピュータプログラムを含む)をRAM1bにロードして実行することにより、検索システム評価装置1を統括的に制御する。
入力装置1dは、データ入力用デバイスであり、入力されたデータをCPU1aに出力する。出力装置1eは、LCD等の表示装置やプリンタ等であり、CPU1aから入力されたデータ(検索システムに対する評価結果等)を出力する。通信装置1fは、インターネット上の検索システム等と通信を行うためのインターフェイスを有する。記録装置1gは、CPU1aの実行可能な上記コンピュータソフトウェアを格納する。記録装置1gは、図2に示すデータベース100,300,400を有する。データベース100は、図4に示すWebアクセスログ101を格納し、データベース300は、図6に示す検索システムIDリスト301を格納し、データベース400は、評価値算出結果401を格納する。
CPU1aは、図2および図3に示す機能を実現する。すなわち、検索システム評価装置1は、機能的には、利用状況解析部200および出力処理部500を有する。利用状況解析部200および出力処理部500は、CPU1aが記録装置1gに格納された上記コンピュータソフトウェアを実行し、例えば図12及び図13のフローチャートに示す処理を行うことによって実現される機能である。
図2に示すように、利用状況解析部200は、主セッション特定部201(第1の特定手段)、検索情報抽出部202、サブセッション特定部203(第2の特定手段)、指標データ取得部204(取得手段)および評価値算出部205(算出手段)を有する。また、図3に示すように、評価値算出部205は、第1の判定部205a、加算部205b、第2の判定部205c、第1の減算部205d、第3の判定部205eおよび第2の減算部205fを含む。
主セッション特定部201は、データベース100に格納されたWebアクセスログ101に基づいて図5に示すWebアクセスログ201aを作成し、この作成したWebアクセスログ201aを記録装置1gに格納する。主セッション特定部201は、Webアクセスログ101から後述の主セッションを特定し、この主セッションを示す主セッションIDデータD5を含むWebアクセスログ201aを作成する。
ここで、図4を参照して、Webアクセスログ101について説明する。Webアクセスログ101は、インターネットを介して検索操作(検索システムへのアクセス、検索結果としてのインターネットアドレス(URL)へのアクセス等であり、以下同様)の行われた複数の検索システムに対する利用状況を示す検索ログデータであり、ユーザIDデータD1、日付データD2、時間データD3およびリクエストデータD4(アクセスデータ)を含む。Webアクセスログ101は、検索システム評価装置1により作成される。
ユーザIDデータD1は、インターネットを介して検索操作を行った検索端末を識別するためのデータである。本実施形態においては、IDが「1000」の検索端末と、IDが「1001」の検索端末とが例示されている。日付データD2は、検索操作が行われた日付を示すデータである。時間データD3は、検索操作が行われた時間を示すデータであり、検索操作の開始時刻と終了時刻とを含む。リクエストデータD4は、検索システムのURLと検索キーワードとを含む。本実施形態においては、URLが「http://www.AAA.ne.jp」の検索システムと、URLが「http://www.BBB.co.jp」の検索システムとが例示されている。また、リクエストデータD4は、検索システムにより検索された一または複数のインターネットサイトのうち実際にアクセスされたインターネットサイトのURLを含む。本実施形態においては、URLが「http://www.CCC.ne.jp/CCC.htm」のインターネットサイトと、URLが「http://www.DDD.ne.jp/DDD.htm」のインターネットサイトとが例示されており、何れも、URLが「http://www.BBB.co.jp」の検索システムによって検索され検索端末によりアクセスされたURLである。
また、Webアクセスログ101は、レコードR1〜レコードR7等の複数のレコードを含む。Webアクセスログ101に含まれるレコードR1〜レコードR7等の複数のレコードのそれぞれは、リクエストデータD4に含まれているURL毎に(検索操作毎に)作成されている。
ここで、主セッションIDデータD5の示す主セッションは、一の検索端末(携帯電話やPC等)による一連の検索操作を示すデータであり、例えば、リファラ(referer)から得られる(リファラに記録された)ものであってもよいし、Webアクセスログ101に含まれるレコードR1〜レコードR7等のレコードのうち、一のレコード、または、ユーザIDデータD1に示すIDが同一であって時間データD3に示す時間(一のレコードにおける検索操作の開始時刻から次の検索操作に係るレコードにおける検索操作の開始時刻までの時間)が所定時間内(例えば30分内)の複数のレコードから成るものであってもよい。
図5に示すWebアクセスログ201aは、主セッションIDデータD5がWebアクセスログ101に追加されたデータである。Webアクセスログ201aは、レコードR1a〜レコードR7a等の複数のレコードを含む。レコードR1a〜レコードR7aは、Webアクセスログ101のレコードR1〜レコードR7にそれぞれ対応しており、レコードR1〜レコードR7のそれぞれに主セッションIDデータD5の内容が追加されたデータである。
図2に戻って説明する。検索情報抽出部202は、図7に示すWebアクセスログ202aを作成し、この作成したWebアクセスログ202aを記録装置1gに格納する。すなわち、検索情報抽出部202は、図6に示す検索システムIDリスト301に基づいて、記録装置1gに格納されたWebアクセスログ201a(又は、データベース100に格納されたWebアクセスログ101)から検索システムIDと検索キーワードとを抽出し、この検索システムIDを示す検索システムIDデータD6と、この検索キーワードを示す検索キーワードデータD9とを含むWebアクセスログ202aを作成する。Webアクセスログ202aは、例えばレコードR1b〜レコードR7b等の複数のレコードを含む。レコードR1b〜レコードR7bは、Webアクセスログ201aのレコードR1a〜レコードR7aにそれぞれ対応しており、レコードR1a〜レコードR7aのそれぞれに検索システムIDデータD6および検索キーワードデータD9が追加されたものである。
ここで、図6を参照して、検索システムIDリスト301について説明する。検索システムIDリスト301は、検索システム評価装置1により作成される。検索システムIDリスト301は、検索システムIDデータD6、検索システムURLデータD7およびクエリパターンデータD8を含む。検索システムIDデータD6は、リクエストデータD4に示すインターネットアドレスの検索システムを識別するためのデータであり、検索システムURLデータD7は、リクエストデータD4に示す(検索システムIDデータD6により識別される)検索システムのURLを示すデータであり、クエリパターンデータD8は、検索システムURLデータD7に示す検索システムで用いられているクエリパターンを示すデータである。また、検索システムIDリスト301は、レコードR9およびレコードR10等の複数のレコードを含む。検索システムIDリスト301に含まれるレコードR9およびレコードR10等の複数のレコードは、検索システムIDデータD6のデータ毎に(すなわち検索システム毎に)作成される。
図2に戻って説明する。サブセッション特定部203は、図8に示すWebアクセスログ203aを作成し、この作成したWebアクセスログ203aを記録装置1gに格納する。すなわち、サブセッション特定部203は、記録装置1gに格納されたWebアクセスログ201aやWebアクセスログ202aに含まれる主セッションIDデータD5の一の主セッションから後述のサブセッションを特定し、このサブセッションを示すサブセッションIDデータD10を含むWebアクセスログ203aを作成する。
なお、図8のサブセッションIDデータD10の示すサブセッションとは、Webアクセスログ201aやWebアクセスログ202aに含まれる主セッションIDデータD5に示す主セッションが同一であって(一の主セッションを構成しており)、検索システムIDデータD6に示す検索システムが同一の一または複数のレコード(検索システム毎の一連の検索操作を示す一または複数のレコード)から成る検索セッションである。図8に示すように、Webアクセスログ203aは、Webアクセスログ202aにサブセッションIDデータD10の内容が追加されたデータである。Webアクセスログ203aは、レコードR1c〜レコードR7c等の複数のレコードを含む。レコードR1c〜レコードR7cは、Webアクセスログ202aのレコードR1b〜レコードR7bにそれぞれ対応しており、レコードR1b〜レコードR7bのそれぞれにサブセッションIDデータD10の内容が追加されたデータである。
図2に戻って説明する。指標データ取得部204は、データベース100に格納されたWebアクセスログ101(より具体的には、Webアクセスログ101等に基づいて作成され記録装置1gに格納されたWebアクセスログ203a)に基づいて検索システムに対する利用満足度を評価するための指標データ(集計データ204aに含まれるアクセス回数データD12や滞留時間データD13)を取得する。指標データ取得部204は、アクセスされたインターネットアドレスの数を示すアクセス回数データD12をサブセッション毎にリクエストデータD4に基づいて取得し、また、検索端末のアクセスが検索システムに滞留した滞留時間を示す滞留時間データD13をサブセッション毎に時間データD3に基づいて取得する。
そして、指標データ取得部204は、アクセス回数データD12および滞留時間データD13を用いて、図9に示す集計データ204aを作成し、この作成した集計データ204aを記録装置1gに格納する。すなわち、指標データ取得部204は、Webアクセスログ203aに示されるサブセッション毎に、検索システムに滞留した滞留時間と、検索結果(検索されたインターネットアドレス)へのアクセス回数(アクセスされたインターネットアドレスの数)とをWebアクセスログ203aから取得し、この滞留時間を示す滞留時間データD13(第1の指標データ)と、このアクセス回数を示すアクセス回数データD12(第2の指標データ)とを含む集計データ204aを作成する。
図9に示すように、集計データ204aは、レコードR12〜レコードR15等の複数のレコードを含み、各レコードは、番号データD11、ユーザIDデータD1、主セッションIDデータD5、サブセッションIDデータD10、検索キーワードデータD9、アクセス回数データD12、検索システムIDデータD6および滞留時間データD13のそれぞれのデータを含む。番号データD11は、集計データ204aに含まれるレコードR12〜レコードR15等の各レコードを識別するための番号である。なお、番号データD11の番号は、主セッションが同一の場合(主セッションIDデータD5の値が同一の場合)、時系列的に(サブセッションの開始順に)付与されている。
集計データ204aに示すユーザIDデータD1、主セッションIDデータD5、検索キーワードデータD9およびサブセッションIDデータD10の内容は、Webアクセスログ203aのユーザIDデータD1、主セッションIDデータD5、検索キーワードデータD9およびサブセッションIDデータD10の内容と同様である。
評価値算出部205は、サブセッションIDデータD10のサブセッションのうち一の主セッションに含まれるサブセッション(サブセッション特定部203によって特定されたサブセッション)の数に応じて、検索システムに対する評価結果(このサブセッションに対応する検索システムに対する評価結果)を示す評価値を算出する。この評価値は、後に一例として示す評価値算出結果401に含まれる評価値データD14に記録される。評価値算出部205は、この評価値の記録された評価値算出結果401をデータベース400に格納する。例えば、評価値算出部205は、サブセッション特定部203によって特定されたサブセッションの数が複数の場合に、連続して行われた二つのサブセッションのうち最先のサブセッションに対応する検索システムに対する評価値を減算する。
更に、評価値算出部205は、図3に示す第1の判定部205a〜第2の減算部205fを用いて、指標データ取得部204により取得されたアクセス回数データD12や滞留時間データD13等の指標データの内容に応じて、検索システムに対する評価結果を示す評価値を算出する(この算出処理を図13のフローチャートに示す)。
評価値算出部205は、図10に示すテーブルデータT1を参照して集計データ204aから評価値算出結果401を作成する。図10に示すテーブルデータT1は、集計データ204aのサブセッションIDデータD10に示すサブセッション毎の滞留時間に応じて与えられ検索サイトの評価値に加算される点数を示すデータである。図10に示すテーブルデータT1は、記録装置1gに格納されている。評価値算出部205は、作成した評価値算出結果401をデータベース400に格納する。
評価値算出結果401は、集計データ204aに評価値データD14の内容が追加されたデータである。評価値算出結果401は、レコードR12a〜レコードR15a等の複数のレコードを含む。レコードR12a〜レコードR15aは、集計データ204aのレコードR12〜レコードR15にそれぞれ対応しており、レコードR12〜レコードR15のそれぞれに評価値データD14の内容が追加されたデータである。図11に示す評価値データD14の評価値は、図13のフローチャートに従って集計データ204aから算出される値である。
出力処理部500は、通信装置1fや出力装置1eを用いて、データベース400に格納された評価値算出結果401を外部に出力する。例えば、出力処理部500は、評価値算出結果401に含まれるレコード(レコードR12a〜レコードR15a等)を、通信装置1f等を介して各レコードに該当する検索システムに通知する。なお、この場合、出力処理部500は、評価値データD14の評価値が所定閾値以上となるレコードの検索システムに対し評価値を通知してもよいし、評価値に応じた広告表示(検索システムのWebページに表示する例えばバナー等の広告表示)の提示を各検索システムに行ってもよい。
次に、図12を参照して、検索システム評価装置1の動作を説明する。まず、ステップS1において、主セッション特定部201は、データベース100に格納されたWebアクセスログ101に基づいてWebアクセスログ201aを作成し、この作成したWebアクセスログ201aを記録装置1gに格納する。ステップS1において、主セッション特定部201は、Webアクセスログ101から後述の主セッションを特定し、この主セッションを示す主セッションIDデータD5を含むWebアクセスログ201aを作成する(ステップS1)。
ステップS1の後、ステップS2において、検索情報抽出部202は、Webアクセスログ202aを作成し、この作成したWebアクセスログ202aを記録装置1gに格納する。ステップS2において、検索情報抽出部202は、検索システムIDリスト301に基づいて、記録装置1gに格納されたWebアクセスログ201a(又は、データベース100に格納されたWebアクセスログ101)から検索システムIDと検索キーワードとを抽出し、この検索システムIDを示す検索システムIDデータD6と、この検索キーワードを示す検索キーワードデータD9とを含むWebアクセスログ202aを作成する(ステップS2)。
ステップS2の後、ステップS3において、サブセッション特定部203は、Webアクセスログ203aを作成し、この作成したWebアクセスログ203aを記録装置1gに格納する。ステップS3において、サブセッション特定部203は、記録装置1gに格納されたWebアクセスログ201aやWebアクセスログ202aに含まれる主セッションIDデータD5の一の主セッションから後述のサブセッションを特定し、このサブセッションを示すサブセッションIDデータD10を含むWebアクセスログ203aを作成する(ステップS3)。
ステップS3の後、ステップS4において、指標データ取得部204は、アクセス回数データD12および滞留時間データD13を用いて、集計データ204aを作成し、この作成した集計データ204aを記録装置1gに格納する。ステップS4において、指標データ取得部204は、Webアクセスログ203aに示されるサブセッション毎に、検索システムに滞留した滞留時間と、検索結果(検索されたインターネットアドレス)へのアクセス回数(アクセスされたインターネットアドレスの数)とをWebアクセスログ203aから取得し、この滞留時間を示す滞留時間データD13と、このアクセス回数を示すアクセス回数データD12とを含む集計データ204aを作成する(ステップS4)。
ステップS4の後、ステップS5において、評価値算出部205は、サブセッションIDデータD10のサブセッションのうち一の主セッションに含まれるサブセッション(サブセッション特定部203によって特定されたサブセッション)の数に応じて、検索システムに対する評価結果(このサブセッションに対応する検索システムに対する評価結果)を示す評価値を算出し、この算出した評価値を含む評価値算出結果(例えば、評価値算出結果401)を作成してデータベース400に格納する(ステップS5)。
次に、図13を参照して、検索システム評価装置1による評価値の算出処理の一例を説明する。図13のフローチャートに示す処理は、集計データ204aに含まれているレコード毎(サブセッション毎)に各レコードの検索システムに対する評価値を算出する処理であり、図3に示す評価値算出部205の第1の判定部205a〜評価値算出部205fによって行われる。ここで、集計データ204aの各レコードの評価値の初期値はゼロとする。
まず、第1の判定部205aは、集計データ204aの複数のレコードのそれぞれに対し、検索結果であるインターネットアドレスが検索端末によりアクセスされたか否か(アクセス回数が1以上かゼロか)をアクセス回数データD12に基づいて判定する(ステップS11)。
ステップS11において、アクセス回数が1以上である(検索結果である一または複数のインターネットアドレスのうちアクセスされたものが少なくとも一つ有る)と判定されたレコードの場合(ステップS11:Yes)、加算部205bは、ステップS12において、図10に示すテーブルデータT1を参照して、このレコードに含まれる滞留時間データD13の値(滞留時間)に応じた点数を評価値に加算し、ステップS15に移行する(ステップS12)。ステップS11において、アクセス回数がゼロである(検索結果である一または複数のインターネットアドレスのうちアクセスされたものが無い)と判定されたレコードの場合(ステップS11:No)、ステップS13の処理に移行する。
第2の判定部205cは、アクセス回数がゼロであるとステップS11において判定されたレコードに対し、滞留時間が所定の基準時間以上(例えば30秒以上とする)であるか否かを集計データ204aの滞留時間データD13の内容に基づいて判定する(ステップS13)。ステップS13において滞留時間がこの基準時間以上であると判定されたレコードの場合(ステップS13:Yes)、第1の減算部205dは、予め設定された第1の点数(第1の値であり、例えば10点とする)を評価値から減算し(ステップS14)、ステップS15に移行する。ステップS13において滞留時間が基準時間未満であると判定されたレコードの場合(ステップS13:Yes)、評価値の算出処理が終了される。
第3の判定部205eは、ステップS12の後に、ステップS11においてアクセス回数が1以上であると判定されたレコードと同じ主セッションに含まれており、このレコードに係る検索システムに対するアクセスに次いでアクセスされた他の検索システム(次検索システムという)に係るレコードがある場合、言い換えれば、ステップS11においてアクセス回数が1以上であると判定されたレコードのサブセッションに次いで行われたサブセッション(次サブセッションという)のレコードがある場合に、この次検索システム(次サブセッションに係る検索システム)により検索されたインターネットアドレスが検索端末にアクセスされたか否かをアクセス回数データD12に基づいて判定する(ステップS15)。
また、第3の判定部205eは、ステップS14の後に、ステップS13において滞留時間が基準時間以上であると判定されたレコードと同じ主セッションに含まれており、このレコードに係る検索システムに対するアクセスに次いでアクセスされた次検索システムに係るレコードがある場合、言い換えれば、ステップS13において滞留時間が基準時間以上であると判定されたレコードのサブセッションに次いで行われた次サブセッションのレコードがある場合に、この次検索システム(次サブセッションに係る検索システム)により検索されたインターネットアドレスが検索端末にアクセスされたか否かをアクセス回数データD12に基づいて判定する(ステップS15)。
ステップS15においてアクセスされたと判定された場合(ステップS15:Yes)、第2の減算部205fは、予め設定された第2の点数(第2の値であり、例えば30点)を評価値から減算し(ステップS16)、評価値の算出処理が終了される。ステップS15においてアクセスされなかったと判定された場合、または、次検索システムに係るレコードがない場合(言い換えると、次サブセッションのレコードがない場合)に(ステップS15:No)、評価値の算出処理が終了される。
図9に示す集計データ204aのレコードR12の場合、アクセス回数データD12の内容からアクセス回数がゼロであり(ステップS11:No)、滞留時間データD13の内容から滞留時間は、「1分21秒」であって基準時間以上(30秒以上)なので(ステップS13:Yes)、ステップS14において、初期値ゼロの評価値から第1の点数である10点が減算され、評価値は「−10」となる。そして、レコードR12を含む主セッション(主セッションIDデータD5が「1」の主セッション)は、レコードR12に係る検索システム(検索システムIDデータD6が「1」の検索システム)に対するアクセスに次いでアクセスされた次検索システム(検索システムIDデータD6が「2」の検索システム)に係るレコードR13を含み、このレコードR13のアクセス回数データD12の内容が「2」なので(ステップS15:Yes)、「−10」の評価値から第2の点数である30点が更に減算され(ステップS16)、最終的な評価値は「−40」となる。レコードR12におけるこの評価値は、図11に示すレコードR12aの評価値データD14の値である。
また、図9に示す集計データ204aのレコードR13の場合、アクセス回数データD12の内容からアクセス回数が「2」なので(ステップS11:Yes)、ステップS12において、図10に示すテーブルデータT1に基づき、レコードR13に含まれる滞留時間データD13の内容「5分1秒」に応じた点数「50」が評価値に加算され、評価値は「+50」となる。そして、レコードR13を含む主セッション(主セッションIDデータD5が「1」の主セッション)は、レコードR13に係る検索システム(検索システムIDデータD6が「2」の検索システム)に対するアクセスに次いでアクセスされた次検索システムに係るレコードを含まないので(ステップS15:No)、最終的な評価値は「+50」となる。レコードR13におけるこの評価値は、図11に示すレコードR13aの評価値データD14の値である。
また、図9に示す集計データ204aのレコードR14の場合、アクセス回数データD12の内容からアクセス回数が「1」なので(ステップS11:Yes)、ステップS12において、図10に示すテーブルデータT1に基づき、レコードR14に含まれる滞留時間データD13の内容「4分38秒」に応じた点数「40」が評価値に加算され、評価値は「+40」となる。そして、レコードR14を含む主セッション(主セッションIDデータD5が「2」の主セッション)は、レコードR14に係る検索システム(検索システムIDデータD6が「2」の検索システム)に対するアクセスに次いでアクセスされた次検索システムに係るレコードを含まないので(ステップS15:No)、最終的な評価値は「+40」となる。レコードR14におけるこの評価値は、図11に示すレコードR14aの評価値データD14の値である。
なお、レコードR15に対してもレコードR12〜レコードR14と同様に評価値が計算されるが、レコードR15から算出された図11のレコードR15aの評価値データD14の値は、ステップS16において第2の点数である30点が減算された場合の値となっている。
(変形例1) なお、評価値の算出処理は図13のフローチャートに示すものに限らない。例えば、第1の判定部205aがステップS11の処理を行わずに、加算部205bがステップS12の処理を行ってもよい。
(変形例2) また、ステップS11およびステップS12が行われることなく、加算部205bが、アクセス回数(アクセス回数データD12の値)に応じた点数を示すテーブルデータT2、閲覧ページ数(検索結果が複数のWebページにわたって提示された場合に実際に閲覧されたページ数を示す指標データであり、以下同様)に応じた点数を示すテーブルデータT3、滞留時間(滞留時間データD13の値)/アクセス回数(アクセス回数データD12の値)の商の値に応じた点数を示すテーブルデータT4、滞留時間(滞留時間データD13の値)/閲覧ページ数の商の値に応じた点数を示すテーブルデータT5、アクセス回数(アクセス回数データD12の値)/閲覧ページ数の商の値に応じた点数を示すテーブルデータT6のいずれかのテーブルデータを参照して評価値の加算処理を行ってもよい。なお、上記商の算出は、分母となる値がゼロの場合には行われない。
(変形例3) また、ステップS11に替えて、第1の判定部205aが、滞留時間(滞留時間データD13の値)、アクセス回数(アクセス回数データD12の値)または閲覧ページ数の何れかが所定閾値を越えたか否かを判定し、越えた場合に評価値の加算処理(ステップS12の処理や上記変形例2の加算処理)が行われ、越えない場合にステップS13に移行されてもよい。なお、アクセス回数が判定される場合の判定基準となる閾値は、一定値であってもよいし、閲覧ページ数に応じた値であってもよい。更に、アクセス回数が判定される場合において、アクセス回数が閾値を越えない場合には、ステップS13およびステップS14に替えて、滞留時間が所定閾値を越えたか否かが第2の判定部205cにより判定され、越えない場合には、算出処理が終了され、越えた場合には、滞留時間、アクセス回数または閲覧ページ数に応じた点数が、テーブルデータT1、テーブルデータT2または他の減算用のテーブルデータに基づいて評価値から減算されてもよい。更に、滞留時間が判定される場合、ステップS13の処理は行われずに、ステップS14の処理が行われる。
(変形例4) 連続してアクセスされた二つの検索システムに係る第1および第2のサブセッションが、同一の主セッションに含まれており(主セッションIDデータD5の内容が同一であり)、且つ、同一の検索キーワード(検索キーワードデータD9の内容が同一)の場合、ステップS15およびステップS16に替えて、以下の処理(a)〜(d)の何れかが第2の減算部205fにより行われてもよい。
(a)第1のサブセッションの滞留時間が所定閾値を下回り、且つ、第2のサブセッションの滞留時間が所定閾値以上の場合に、第2の減算部205fは、第1または第2のサブセッションの滞留時間に応じた点数を評価値から減算する。
(b)第1のサブセッションのアクセス回数が所定閾値を下回り、且つ、第2のサブセッションのアクセス回数が所定閾値以上の場合に、第2の減算部205fは、第1または第2のサブセッションのアクセス回数に応じた点数を評価値から減算する。
(c)第1のサブセッションのアクセス回数が所定閾値を下回り、且つ、第2のサブセッションの滞留時間が所定閾値以上の場合に、第2の減算部205fは、第1のサブセッションのアクセス回数に応じた点数を評価値から減算する。
(d)第1のサブセッションの滞留時間が所定閾値を下回り、且つ、第2のサブセッションのアクセス回数が所定閾値以上の場合に、第2の減算部205fは、第1のサブセッションの滞留時間に応じた点数を評価値から減算する。
次に、実施形態に係る検索システム評価装置1の作用・効果を説明する。検索システム評価装置1は、記録装置1gと、主セッション特定部201、サブセッション特定部203、及び、評価値算出部205とを備え、インターネットを介した情報検索に用いられる一又は複数の検索システムの利用満足度をそれぞれ評価するための評価値を算出する。記録装置1gは、上記情報検索の履歴を示すWebアクセスログ101,201a,202a,203aを格納する。主セッション特定部201は、記録装置1gに格納されたWebアクセスログ101から、一の検索端末による一連の検索操作(主セッション)を特定する。サブセッション特定部203は、主セッション特定部201によって特定された一の主セッションを構成しており検索システム毎の一連の検索操作を示す一又は複数の検索セッション(サブセッション)を、主セッションから特定する。評価値算出部205は、サブセッション特定部203によって特定されたサブセッションの数に応じて、検索システムの利用満足度をそれぞれ評価するための評価値を算出する。そして、評価値算出部205は、サブセッション特定部203によって特定されたサブセッションの数が複数の場合に、連続して行われた二つのサブセッションのうち最先のサブセッションに対応する検索システムに対する評価値を減算する。
従って、検索システムの利用状況を示すWebアクセスログ101等から検索システムの利用満足度を評価するための評価値が、一の主セッション(一の検索端末による一連の検索操作)に含まれるサブセッション(一の検索システムによる一連の検索操作)の数に応じて算出される。このように、一の検索端末による一連の検索操作において、一の検索システムのみが用いられたか、又は、この一の検索システム以外の他の検索システムが用いられたかに基づいて、検索システムに対する評価が可能となる。他の検索システムが用いられたということは、評価対象となっている検索システムに対する満足度が低い、ということを意味していると考えられるので、検索システムに対する評価を、従来のように評価対象となっている検索システム自体に対する検索操作(例えば、検索時間や閲覧サイト数等)に基づいて行うよりも、検索システム評価装置1のように他の検索システムが用いられたか否かに応じて行えば、より好適な評価が可能となる。
検索システム評価装置1は指標データ取得部204を更に備える。指標データ取得部204は、検索システムに対する評価値を算出するための一又は複数の指標データ(一の検索システムに対する検索操作を示すデータであり、例えば、集計データ204aに含まれるアクセス回数データD12や滞留時間データD13等)を記録装置1gに格納されWebアクセスログ101に基づいて作成されたWebアクセスログ203a等に基づいて取得する。評価値算出部205は、指標データ取得部204によって取得された一又は複数の指標データの内容に応じて検索システムに対する評価値を算出する。このように、指標データが検索システムに対する評価値の算出に更に用いられるので、検索システムに対するより好適な評価が可能となる。
また、検索システム評価装置1は、指標データ取得部204および評価値算出部205を備える。指標データ取得部204は、インターネットを介して検索端末により検索操作の行われた検索システムの利用状況を示すWebアクセスログ101から、この検索システムの利用満足度を評価するための一または複数の指標データ(集計データ204aに含まれるアクセス回数データD12や滞留時間データD13)を取得する。評価値算出部205は、指標データ取得部204により取得された上記指標データに基づいて、上記検索システムの評価結果を示す評価値(評価値算出結果401に含まれる評価値データD14)を算出する。
検索システム評価装置1によれば、検索システムの利用状況を示すWebアクセスログ101から検索システムの利用満足度を評価するための指標データが取得され、この取得された指標データに基づいてこの検索システムに対する評価値が算出される。従って、このような評価値を用いれば、検索システム自体に対する評価が容易に行われる。
本発明において、Webアクセスログ101は、検索端末が検索操作を行った時間を示す時間データD3と、検索システムにより検索され検索端末のアクセスしたインターネットアドレスを示すリクエストデータD4とを含む。指標データ取得部204は、検索端末のアクセスが検索システムに滞留した滞留時間を示す滞留時間データD13を時間データD3に基づいて取得し、検索端末によりアクセスされたインターネットアドレスの数を示すアクセス回数データD12をリクエストデータD4に基づいて取得する。そして、評価値算出部205は、第1の判定部205a、加算部205b、第2の判定部205cおよび第1の減算部205dを有する。第1の判定部205aは、検索システムにより検索され検索端末のアクセスしたインターネットアドレスの有無をアクセス回数データD12に基づいて判定する。加算部205bは、検索システムにより検索され検索端末のアクセスしたインターネットアドレスがあると第1の判定部205aが判定した場合に、滞留時間データD13の示す滞留時間(この検索システムに検索端末のアクセスが滞留した滞留時間)に応じた値を評価値に加算する。第2の判定部205cは、検索システムにより検索され検索端末のアクセスしたインターネットアドレスが無いと第1の判定部205aが判定した場合に、滞留時間データD13の示す滞留時間が所定時間以上であるか否かを判定する。第1の減算部205dは、滞留時間データD13の示す滞留時間が上記の所定時間以上であると第2の判定部205cが判定した場合に、第1の点数を評価値から減算する。
たとえ検索システムにおける滞留時間が長くても、検索システムによる検索結果がアクセスされなければ、検索システムが利用されたことにはならず、このような検索システムに対する利用満足度は低いことになるが、検索システム評価装置1のように、滞留時間だけでなく、検索結果としてのインターネットアドレスが実際にアクセスされたか否かに応じた評価値が算出できるので、的確な評価が可能となる。
評価値算出部205は、第3の判定部205eおよび第2の減算部205fを有する。第3の判定部205eは、加算部205bが評価値を加算した後、または、第1の減算部205dが評価値を減算した後に、評価対象の検索システムに対するアクセスに次いでアクセスされた他の検索システムにより検索されたインターネットアドレスを検索端末がアクセスしたか否かをアクセス回数データD12に基づいて判定する。第2の減算部205fは、上記の他の検索システムにより検索された少なくとも一のインターネットアドレスが検索端末によりアクセスされたと第3の判定部205eが判定した場合に、第2の点数を評価値から減算する。
評価対象の検索システムに次いでアクセスされた他の検索システムがある場合、この他の検索システムが利用されたのは、評価対象の検索システムに対する利用満足度が低いためであると考えられる。このように、評価対象の検索システムに対する利用状況だけでなく、他の検索システムが利用されたか否かに応じた評価値が算出できるので、的確な評価が可能となる。
実施形態に係る検索システム評価装置の構成を示す図である。 実施形態に係る検索システム評価装置の構成を示す図である。 実施形態に係る検索システム評価装置の構成を示す図である。 実施形態に係るWebアクセスログの内容を例示する図である。 実施形態い係るWebアクセスログの内容を例示する図である。 実施形態に係る検索システムIDリストの内容を例示する図である。 実施形態に係るWebアクセスログの内容を例示する図である。 実施形態に係るWebアクセスログの内容を例示する図である。 実施形態に係る集計データの内容を例示する図である。 実施形態に係るテーブルデータの内容を例示する図である。 実施形態に係る評価値算出結果の内容を例示する図である。 実施形態に係る検索システム評価装置の動作を説明するためのフローチャートである。 実施形態に係る検索システム評価装置の動作を説明するためのフローチャートである。
符号の説明
1…検索システム評価装置、100…データベース、101…Webアクセスログ、1a…CPU、1b…RAM、1c…ROM、1d…入力装置、1e…出力装置、1f…通信装置、1g…記録装置、1h…バス、200…利用状況解析部、201…主セッション特定部、201a…Webアクセスログ、202…検索情報抽出部、202a…Webアクセスログ、203…サブセッション特定部、203a…Webアクセスログ、204…指標データ取得部、204a…集計データ、205…評価値算出部、205a…第1の判定部、205b…加算部、205c…第2の判定部、205d…第1の減算部、205e…第3の判定部、205f…第2の減算部、300…データベース、301…検索システムIDリスト、400…データベース、401…評価値算出結果、500…出力処理部、D1…ユーザIDデータ、D10…サブセッションIDデータ、D11…番号データ、D12…アクセス回数データ、D13…滞留時間データ、D14…評価値データ、D2…日付データ、D3…時間データ、D4…リクエストデータ、D5…主セッションIDデータ、D6…検索システムIDデータ、D7…検索システムURLデータ、D8…クエリパターンデータ、D9…検索キーワードデータ、T1…テーブルデータ

Claims (4)

  1. インターネットを介した情報検索に用いられる一又は複数の検索システムの利用満足度をそれぞれ評価するための評価値を算出する検索システム評価装置であって、
    前記情報検索の履歴を示す検索ログデータを格納する記録装置と、
    前記記録装置に格納された前記検索ログデータから、一の検索端末による一連の検索操作を特定する第1の特定手段と、
    前記第1の特定手段によって特定された一連の検索操作を構成しており前記検索システム毎の一連の検索操作を示す一又は複数の検索セッションを、前記一連の検索操作から特定する第2の特定手段と、
    前記第2の特定手段によって特定された検索セッションの数に応じて前記評価値を算出する算出手段と
    を備える、ことを特徴とする検索システム評価装置。
  2. 前記算出手段は、前記第2の特定手段によって特定された前記検索セッションの数が複数の場合に、連続して行われた二つの検索セッションのうち最先の検索セッションの検索システムに対する前記評価値を減算する、ことを特徴とする請求項1に記載の検索システム評価装置。
  3. 前記評価値を算出するための一又は複数の指標データを前記記録装置に格納された前記検索ログデータに基づいて取得する取得手段を更に備え、
    前記算出手段は、前記取得手段によって取得された前記一又は複数の指標データの内容に応じて前記評価値を算出する、ことを特徴とする請求項2に記載の検索システム評価装置。
  4. インターネットを介した情報検索に用いられる一又は複数の検索システムの利用満足度をそれぞれ評価するための評価値を算出する検索システム評価装置を用いた検索システム評価方法であって、
    前記検索システム評価装置の記録装置に格納されており前記情報検索の履歴を示す検索ログデータから、一の検索端末による一連の検索操作を前記検索システム評価装置が特定する第1の特定ステップと、
    前記検索システム毎の一連の検索操作を示しており前記第1の特定ステップにおいて特定された一連の検索操作を構成する一又は複数の検索セッションを、前記一連の検索操作から前記検索システム評価装置が特定する第2の特定ステップと、
    前記第2の特定ステップにおいて特定された検索セッションの数に応じて前記評価値を前記検索システム評価装置が算出する算出ステップと
    を備える、ことを特徴とする検索システム評価方法。
JP2008196597A 2008-07-30 2008-07-30 検索システム評価装置、及び、検索システム評価方法 Pending JP2010033442A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008196597A JP2010033442A (ja) 2008-07-30 2008-07-30 検索システム評価装置、及び、検索システム評価方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008196597A JP2010033442A (ja) 2008-07-30 2008-07-30 検索システム評価装置、及び、検索システム評価方法

Publications (1)

Publication Number Publication Date
JP2010033442A true JP2010033442A (ja) 2010-02-12

Family

ID=41737807

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008196597A Pending JP2010033442A (ja) 2008-07-30 2008-07-30 検索システム評価装置、及び、検索システム評価方法

Country Status (1)

Country Link
JP (1) JP2010033442A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011188029A (ja) * 2010-03-04 2011-09-22 Fujitsu Ltd 電子署名装置、電子署名方法及びコンピュータプログラム
JP2015111942A (ja) * 2015-03-03 2015-06-18 富士通株式会社 電子署名装置及びコンピュータプログラム
JP2017157191A (ja) * 2016-03-01 2017-09-07 ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science And Technology Co., Ltd. 人工知能に基づく検索方法及び装置
JP6476395B1 (ja) * 2018-01-22 2019-03-06 データ・サイエンティスト株式会社 検索語の評価装置、評価システム、及び評価方法
CN110333983A (zh) * 2019-05-31 2019-10-15 口口相传(北京)网络技术有限公司 业务监控及搜索业务监控方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011188029A (ja) * 2010-03-04 2011-09-22 Fujitsu Ltd 電子署名装置、電子署名方法及びコンピュータプログラム
JP2015111942A (ja) * 2015-03-03 2015-06-18 富士通株式会社 電子署名装置及びコンピュータプログラム
JP2017157191A (ja) * 2016-03-01 2017-09-07 ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science And Technology Co., Ltd. 人工知能に基づく検索方法及び装置
JP6476395B1 (ja) * 2018-01-22 2019-03-06 データ・サイエンティスト株式会社 検索語の評価装置、評価システム、及び評価方法
JP2019128622A (ja) * 2018-01-22 2019-08-01 データ・サイエンティスト株式会社 検索語の評価装置、評価システム、及び評価方法
CN110333983A (zh) * 2019-05-31 2019-10-15 口口相传(北京)网络技术有限公司 业务监控及搜索业务监控方法及装置

Similar Documents

Publication Publication Date Title
US9300755B2 (en) System and method for determining information reliability
US20060259867A1 (en) System and method for automatic generation of browsing favorites
JP5415273B2 (ja) Url入力による広告キーワード推薦方法およびそのシステム
JP2008071259A (ja) ブックマーク・タグ設定装置
JP2010033442A (ja) 検索システム評価装置、及び、検索システム評価方法
JP4636473B2 (ja) リンク情報抽出装置、リンク情報抽出方法およびプログラム
CN112231598A (zh) 网页路径导航方法、装置、电子设备及存储介质
JP2009122807A (ja) 連想検索システム
JP2010128917A (ja) 情報伝播ネットワーク抽出方法、情報伝播ネットワーク抽出装置、及び情報伝播ネットワーク抽出プログラム
JP2007066206A (ja) 文書参照者検索装置及び文書参照者検索方法
JP5141144B2 (ja) 情報検索システム及び情報検索プログラム
WO2014040560A1 (zh) 实时推送媒体信息的方法、装置
JP5321258B2 (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
WO2019001333A1 (zh) App应用展示界面的方法、装置和电子设备
JP4528203B2 (ja) ファイル検索方法、ファイル検索装置、及びファイル検索プログラム
JP5213668B2 (ja) 操作シーケンス抽出方法及び装置及びプログラム
JP5777663B2 (ja) 検索支援装置及び検索支援プログラム
JP2000293531A (ja) 情報検索方法及び装置
CN107451160B (zh) 一种页面预读方法及装置
CN110825976A (zh) 网站页面的检测方法、装置、电子设备及介质
US20120030564A1 (en) Domain-Specific Spell Check Overlays
JP2010079645A (ja) 作業支援装置、サーバ、システム、および方法
JP2008097520A (ja) 検索装置
JPWO2009078397A1 (ja) 情報評価システム、情報評価方法および情報評価用プログラム
JP2013196315A (ja) 情報処理装置及び方法