以下に添付図面を参照して、この発明にかかる検索装置の好適な実施形態を詳細に説明する。
大量の電子化文書をネットワークに接続されたサーバに格納し、組織内でその構成員が情報を共有できる環境が整ってきた。これにより、組織内で活動する個人がサーバに蓄積された情報を自由に検索し、個々の業務上の課題解決に利用することで、業務遂行の効率を改善できるようになってきている。
例えば問い合わせ窓口やコールセンターといった部門においては、過去の問い合わせ事例やクレームに対する対処事例などを文書化して記録し、構成員が検索できるようにするシステムが用いられている。これにより、新たな問い合わせがあった場合に同様の過去事例を見つけ、的確な対応を短時間で行うことができるようになる。
一方、蓄積される文書の量が膨大になってくると、検索時に指定する検索条件(キーワードなど)に対して様々な文書が検索されて検索結果として表示されるようになる。このため、求めている検索結果を見つけ出すまでに大量の検索結果をチェックする必要が生じ、却って業務効率を低下させる恐れが生じている。
このような文書検索システムの問題を解決するため、上述のレレバンスフィードバックなどの技術が開発され効果を上げている。レレバンスフィードバックでは、システムが出力した検索結果の一部に対して検索を実行したユーザ(検索者)が自分の検索目的に合致しているか否かを評価し、システムがその評価結果を用いて検索要求(クエリ)に検索キーワードを追加して再検索したり検索結果のランキングを調整する。検索結果の評価には時間がかかるため、システムのユーザ一人一人が自分で検索結果を評価するのに加えて、評価結果を組織内で共有して作業効率を改善する手法が考案されている。
従来技術では、例えば同一の文書に対して複数人の評価結果が得られた場合には多数決で評価結果が決定され、評価したユーザが一人の場合には個人の評価結果が用いられる。このような方法では、検索対象に関するユーザの知識レベルが異なっているような場合でも、全てのユーザの評価結果を平等に扱って多数決により、利用する評価結果が決定される。または、特定の検索要求に対して初めて評価を行った人の評価結果が常に組織用のフィードバック情報として記録され再利用される。従って、問い合わせ窓口やコールセンターにおいて、ユーザごとに製品に対する知識や業務経験の程度に偏りがあるような場合でも、それが考慮されず、知識が豊富で専門性の高いユーザが行った評価結果が組織内で有効に活用されないという問題が生じる。
(第1の実施形態)
そこで、第1の実施形態にかかる検索装置は、検索結果を評価したユーザ(評価者)の信頼度を参照して、評価結果を利用したレレバンスフィードバックを実行するかを決定する。信頼度は、検索結果を評価したユーザがどの程度信頼できるかを示す情報である。例えば、検索対象が属する分野に対するユーザの専門度(専門性レベル)、ユーザによる検索の回数、および、ユーザの勤務年数などを信頼度として利用できる。
以下では、各種家電製品の利用方法や不具合に関する製品ユーザからの問い合わせに対応するコールセンターで使用する検索システムとして実現した例を説明する。
まず、検索システムの利用形態について説明する。図1は、検索システムの構成例を示す図である。図1に示す検索システムでは、3人のユーザ(ユーザUA、ユーザUB、ユーザUC)が、検索装置100を利用している。検索装置100は、結果記憶部123と、文書記憶部121と、検索部104と、を備えている。
結果記憶部123は、個々のユーザがそれぞれの検索結果に対して行った評価の結果を記録した個人用の評価情報22(ユーザUA用の評価情報22a、ユーザUB用の評価情報22b、ユーザUC用の評価情報22c)と、ユーザが所属する組織用の評価情報21と、を記憶する。
いずれかのユーザが検索装置100に対して検索要求を入力して検索を開始すると、検索部104は、入力された検索要求に対する過去の評価が個人用の評価情報22に記録されているか確認する。記録されている場合は、検索部104は、その評価情報を使って検索を実行する。過去の評価が評価情報22に記録されていない場合でも、組織用の評価情報21に記録されていれば、検索部104は、その評価情報を使って検索を行う。
一方、入力された検索要求に対する過去の評価情報が、評価情報22および評価情報21のいずれにも存在しない場合、検索部104は、入力された検索要求のみを用いて検索を行い、得られた検索結果をユーザに提示する。
ユーザは、提示された検索結果の一部(例えば検索順位の上位n件、nは10から20程度)を閲覧し、その中に自分が求めている情報と関係があるか否かを順に評価する。ユーザは、その評価結果を検索装置100に入力し、その後、検索装置100に対し再検索を要求する。
再検索が要求されると、検索装置100は、当該ユーザの評価情報22および組織用の評価情報21に評価結果を記録する。また検索装置100は、レレバンスフィードバックを実行する。例えば検索装置100は、評価結果の中で関係があると評価された文書の中から用語を抽出し、入力された検索要求に当該抽出された用語を追加して再び検索を実行して検索結果をユーザに再提示する。
以上が本実施形態による検索システムの基本的な動作である。本実施形態では、例えば組織用の評価情報21が既に存在する場合でも、評価を行ったユーザと検索を行うユーザとの専門性の高低により、評価情報の利用の可否や評価情報の更新の必要性を判断する。以下で詳細に説明する。
(システムの構成)
図2は、本実施形態の検索システムの機能構成の一例を示す図である。図2に示すように、本実施形態の検索システムは、検索装置100と、端末装置200と、がネットワーク300で接続された構成となっている。
ネットワーク300は、インターネットなどのあらゆるネットワーク形態により構成できる。図2では、検索装置100および端末装置200が1個ずつ記載されているが、個数は任意であり、それぞれ2個以上備えられてもよい。
端末装置200は、例えば図1のユーザUA〜UCなどのユーザが利用するパーソナルコンピュータなどの装置である。端末装置200は、通信制御部201と、表示制御部202と、入力部221と、表示部222と、を備えている。
入力部221は、キーボードやマウスなどの入力デバイスである。表示部222は、検索装置100から送信された検索結果などの情報を表示するためのデバイスであり、CRT(Cathode Ray Tube)および液晶ディスプレイなどの表示装置によって実現できる。
通信制御部201は、検索装置100などの外部装置との間の通信を制御する。例えば通信制御部201は、ユーザにより入力された検索要求を検索装置100に送信する。表示制御部202は、表示部222に対する情報の表示を制御する。
検索装置100は、通信制御部101と、受付部102と、選択部103と、検索部104と、文書記憶部121と、ユーザ情報記憶部122と、結果記憶部123と、を備えている。
文書記憶部121は、検索対象とする情報(文書)を記憶する。検索対象とする情報は、検索装置100の内部に記憶される必要はなく、検索装置100以外の装置に記憶されてもよい。
ユーザ情報記憶部122は、ユーザに関する情報(ユーザ情報)を記憶する。例えばユーザ情報は、ユーザを識別する識別情報と、ユーザの信頼度を示す情報とを含む。図3は、ユーザ情報のデータ構造の一例を示す図である。図3に示すように、ユーザ情報は、従業員番号と、専門性情報とを含む。
従業員番号は、ユーザを識別する識別情報の一例である。ユーザを識別可能であれば従業員番号以外の情報を、ユーザの識別情報として用いてもよい。専門性情報は、信頼度の一例であり、専門分野(分野情報)と専門性レベル(専門度)の組が列挙された情報である。専門分野は、例えばコールセンターで扱っている製品の種類を示す。専門性レベルは、対応する専門分野に対するユーザの知識や経験の程度を示す。専門性レベルが、信頼度に相当する。例えば専門性レベルは、「A:非常に詳しい」、「B:比較的詳しい」、および、「C:あまり詳しくない」などのレベルを含む。専門性レベルには、例えば各従業員に対して管理者により予め評価された結果が設定される。図3に例示されるように、専門性情報に記載されていない製品は、専門性レベルが「C」の製品であると解釈されてもよい。
図2に戻り、結果記憶部123は、検索を補助する補助情報と、ユーザの識別情報とを対応づけて記憶する。本実施形態では、レレバンスフィードバックで利用する評価結果を含む情報が、補助情報として利用される。図4は、補助情報のデータ構造の一例を示す図である。
なお図1では、ユーザごとに記憶される個人用の評価情報22と全ユーザによって共有される組織用の評価情報21の2種類がそれぞれ独立した記憶媒体に格納される例を記載した。評価情報の記憶方法はこれに限られるものではなく、各評価情報が論理的に区別できればよい。例えば図4の例では、各評価情報は1つのテーブルで管理される。
具体的には図4に示すように、補助情報は、IDと、種別と、キーワードと、製品種類と、従業員番号と、件数と、評価情報と、を含む。IDは補助情報を識別する情報である。種別は、補助情報が個人用か組織で共有できるかを示す情報である。キーワードは、検索時に検索条件として入力された語句である。製品種類は、検索時に検索条件として入力された製品の種類を示す。
従業員番号を対応づけることで、いずれのユーザが評価したかを特定可能となる。件数は、キーワードおよび製品種類の検索条件により検索された文書の件数である。評価情報は、検索された文書を特定する情報(文書名など)と、文書に対する評価結果(「○」または「×」など)とを含む。
例えば図4のID=1の補助情報は、従業員番号が「2009-1011」のユーザが、キーワード「電源が入らない」、および、製品種類「テレビ」という検索条件を指定した検索要求に対して得られた検索結果を評価した結果を示す。この検索要求で得られた検索結果の件数は1080件である。この検索結果に対する評価の結果は、「doc-0102:○、doc-0013:×」である。すなわちユーザは、「doc-0102」で特定される文書に対して「○」(適切である)と評価し、「doc-0013」で特定される文書に対して「×」(適切でない)と評価している。また、この補助情報の種別は「組織可」となっており、組織で共有できることを示している。
ID=2の補助情報も同様に種別が「組織可」である。一方、ID=3の補助情報は、種別が「個人」であるため、従業員番号「2012-123」のユーザ個人が使用するための補助情報であることが示されている。
なお、件数は、検索された文書の件数を単純に用いるのではなく、内容の共通性を考慮した「異なり数」を用いてもよい。例えば、「電源が入らない」で検索される結果(文書)に、「どうすればテレビの電源が入りますか」および「テレビの電源はどうやったら入りますか」という2件の質問文が含まれる場合を考える。この場合、いずれも名詞および動詞は「テレビ」、「電源」、および、「入り」の3語であり、内容の共通部分が大きい。このため2つの検索結果は、同一の内容であるとみなすことができる。同一の内容であると判定する方法としては、例えば、一致する単語の個数または割合などの閾値を用いて閾値より大きい場合に同一の内容であると判定する方法などを適用できる。このように構成することで、ほぼ同一の内容の質問が登録された場合は検索結果が変わったとみなさず、内容が異なる検索結果が得られた場合のみ、変更があったとみなす方法を利用することができる。
図2に戻り、通信制御部101は、端末装置200などの外部装置との間の通信を制御する。例えば通信制御部101は、端末装置200の通信制御部201から送信された検索要求を受信する。また、通信制御部101は、検索結果を表示する画面などの表示要求を端末装置200に送信する。
受付部102は、検索要求などの各種情報の入力を受け付ける。例えば受付部102は、通信制御部101により端末装置200から受信された検索要求を受け付ける。
選択部103は、レレバンスフィードバックに利用する補助情報を選択する。例えば選択部103は、受け付けられた検索要求に関連する補助情報から、対応する識別情報で識別されるユーザの信頼度に基づいて補助情報を選択する。検索要求に関連する補助情報は、例えば、検索要求に含まれる検索条件と一致する検索条件を含む補助情報である。
選択部103は、検索要求に含まれる検索条件と一致する検索条件を含み、かつ、検索要求を入力したユーザと同じ従業員番号を含む補助情報を選択してもよい。これにより、ユーザが過去に自分で評価した結果を含む補助情報をレレバンスフィードバックに利用可能となる。
組織用の評価情報21を用いる場合は、選択部103は、検索要求を入力したユーザより専門度が大きいユーザの識別情報に対応する補助情報を選択してもよい。これにより、検索結果を評価したユーザの知識や業務経験の程度を考慮したレレバンスフィードバックが可能となる。この結果、より有効な検索結果を得ることが可能となる。
検索対象となる文書が更新された場合、過去の評価結果を利用することが適切ではない場合がある。そこで選択部103は、文書が更新されていないと判断できる場合に、補助情報を選択するように構成してもよい。例えば選択部103は、検索要求に含まれる検索条件と一致する検索条件を含み、かつ、検索要求に含まれる検索条件による検索結果の件数と、補助情報に含まれる件数とが一致する補助情報から、信頼度に基づいて補助情報を選択してもよい。
検索部104は、検索要求に応じて、文書記憶部121に記憶された文書などの情報を検索する。また検索部104は、選択部103により選択された補助情報を用いて情報を検索する。例えば検索部104は、選択された補助情報に含まれる評価をフィードバック情報として用いてレレバンスフィードバックを行う。
なお、通信制御部101、受付部102、選択部103、および、検索部104は、例えば、CPU(Central Processing Unit)などの処理装置にプログラムを実行させること、すなわち、ソフトウェアにより実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェアおよびハードウェアを併用して実現してもよい。
上記記憶部(文書記憶部121、ユーザ情報記憶部122、および、結果記憶部123)は、HDD(Hard Disk Drive)、光ディスク、メモリカード、RAM(Random Access Memory)などの一般的に利用されているあらゆる記憶媒体により構成することができる。また、上記記憶部の一部または全部は、検索装置100以外の装置に備えられる記憶媒体としてもよい。
次に、このように構成された第1の実施形態にかかる検索装置100による検索処理について説明する。まず、ユーザ情報入力処理について説明する。図5は、第1の実施形態におけるユーザ情報入力処理の一例を示すフローチャートである。ユーザ情報入力処理は、例えばユーザが検索を実行する前に、自身の従業員番号などのユーザ情報を入力するために実行される。
ユーザは、例えば端末装置200の入力部221を用いて、識別情報入力画面に対して識別情報(従業員番号など)を入力する。識別情報入力画面は、例えば表示制御部202により表示部222に表示される。入力された識別情報は、通信制御部201により検索装置100に送信される。
検索装置100の受付部102は、送信された識別情報を受け付ける(ステップS101)。受付部102は、受け付けた識別情報を検索部104に渡す(ステップS102)。
図6は、識別情報入力画面の一例を示す図である。図6に示すように、識別情報入力画面は、入力欄601と、実行ボタン602と、を含む。入力欄601は、ユーザの識別情報である従業員番号を入力するための領域である。実行ボタン602が押下されると、例えば通信制御部201が、入力された従業員番号を検索装置100に送信する。
検索装置100は、受信した従業員番号によって、この後に検索要求を送信するユーザを識別する。検索装置100は、受信した従業員番号が正当であるか(登録されているかなど)を検証し、正当でない場合はエラーを通知してもよい。検索装置100は、従業員番号とともにパスワードなどの認証情報を受け付け、ユーザに対する認証処理を実行してもよい。
次に、検索要求入力処理について説明する。図7は、第1の実施形態における検索要求入力処理の一例を示すフローチャートである。検索要求入力処理は、例えばユーザが検索条件を入力して検索を要求する処理である。
ユーザは、例えば端末装置200の入力部221を用いて、検索要求入力画面に対して検索条件を入力する。検索要求入力画面は、例えば識別情報入力画面で実行ボタン602が押下された後に、表示制御部202により表示部222に表示される。入力された検索条件は、通信制御部201により検索装置100に送信される。
検索装置100の受付部102は、送信された検索要求を受付ける(ステップS201)。検索要求は、キーワードおよび専門分野(製品種類)などの検索条件を含む。キーワードは、単語である必要はなく、自然文などであってもよい。検索条件は、キーワードおよび専門分野に限られるものではなく、他の任意の条件を用いることができる。受付部102は、受け付けた検索要求を検索部104に渡す(ステップS202)。
図8は、検索要求入力画面の一例を示す図である。図8に示すように、検索要求入力画面は、入力欄801、802と、検索実行ボタン803と、を含む。入力欄801は、検索条件としてのキーワードを入力するための領域である。入力欄802は、検索条件としての専門分野(製品種類)を入力するための領域である。
例えば同じコールセンターに勤務する従業員であっても、製品に対する知識の程度にはばらつきがある。製品に対する知識が豊富である従業員ほど、検索結果を見て関連性を的確に判断できる可能性が高い。このため、専門分野が確実に識別できるように、キーワードとは区別して製品種類を検索条件として入力させる。検索実行ボタン803が押下されると、例えば通信制御部201が、入力された検索条件(キーワード、製品種類)を検索装置100に送信する。
次に、検索要求に応じた検索処理について説明する。図9は、第1の実施形態における検索処理の流れの一例を示すフローチャートである。
検索部104は、検索要求を受付部102から受け取る(ステップS301)。検索部104は、検索要求に含まれるキーワードを形態素解析して形態素に分割する。検索部104は、助詞などのように検索に不要な語(ストップワード)が形態素に含まれている場合には、それらの不要な語を削除する(ステップS302)。選択部103は、キーワードに対して利用可能な評価情報を、結果記憶部123から検索する(ステップS303)。ステップS303の処理の詳細は後述する。
検索部104は、評価情報が存在するか(検索されたか)否かを判断する(ステップS304)。利用可能な評価情報が存在しない場合(ステップS304:No)、検索部104は、検索要求を用いた通常の検索を行い、検索結果を出力する(ステップS305)。検索結果は、端末装置200に送信され、表示部222などに出力される。例えば上位の所定件数の検索結果を含む検索結果画面が表示部222に表示される。
図10は、検索結果画面の一例を示す図である。図10は、図8のような検索要求入力画面の下部に、検索結果等の表示領域が追加された検索結果画面の例を示す。検索結果画面は、評価欄904と、次へボタン905と、再検索ボタン906と、を含む。
評価欄904は、検索結果の評価(「○」または「×」)を指定するための領域である。ユーザは、検索条件に対する検索結果の関連性などを評価し、関連する場合は「○」、関連しない場合は「×」をチェックすることで、評価結果を入力する。次へボタン905は、次の検索結果を表示させるためのボタンである。再検索ボタン906は、入力された評価結果を用いた再検索を実行させるためのボタンである。再検索ボタン906が押下された場合、例えば通信制御部201は、入力された評価結果とともに再検索の要求を検索装置100に送信する。検索装置100の受付部102は、通信制御部101を介して、評価結果および再検索の要求を受付ける。
図9に戻り、受付部102は、評価結果および再検索の要求が受け付けられたか否かを判断する(ステップS306)。再検索の要求が受け付けられていない場合(ステップS306:No)、ステップS301に戻り処理が繰り返される。例えばユーザは、キーワードなどを修正して改めて検索を実行する場合は、入力欄801や入力欄802の情報を修正して検索実行ボタン803を押下する。この場合もステップS301に戻り処理が再開される。
再検索の要求が受け付けられた場合(ステップS306:Yes)、選択部103は、評価結果を結果記憶部123に保存する(ステップS307)。
ステップS307の後、および、ステップS304で利用可能な評価情報が存在すると判断された場合(ステップS304:Yes)、検索部104は、評価結果を利用してレレバンスフィードバックを行って再度検索処理を実行し、検索結果を表示部222に表示させる(ステップS308)。
レレバンスフィードバックの手法としては、従来から用いられているあらゆる手法を適用できる。基本的な手法としては、キーワードと製品種類のみで検索された結果に対してランキングを行って表示の順位を決定する処理において、関連すると評価された文書にのみ出現する単語をプラス評価とし、関連しないと評価された文書にのみ出現する単語をマイナス評価とするような点数処理を行うという手法がある。
次に、ステップS303の評価情報検索処理の詳細について説明する。図11は、評価情報検索処理の一例を示すフローチャートである。
選択部103は、結果記憶部123に記憶された補助情報のうち、未処理の補助情報を取得する(ステップS401)。選択部103は、検索要求を入力したユーザの従業員番号、検索要求に含まれるキーワード、および、検索要求に含まれる製品種類が、取得した補助情報に含まれる従業員番号、キーワード、および、製品種類と一致するか否かを判断する(ステップS402)。
一致する場合(ステップS402:Yes)、選択部103は、取得した補助情報を例えば検索部104で参照できる形式で一時記憶部などに記録する(ステップS403)。一致しない場合(ステップS402:No)、および、補助情報を記録した後、選択部103は、すべての補助情報を処理したか否かを判断する(ステップS404)。すべての補助情報を処理していない場合(ステップS404:No)、選択部103は、ステップS401に戻り処理を繰り返す。
すべての補助情報を処理した場合(ステップS404:Yes)、選択部103は、種別が「組織可」である補助情報を取得するために以下の処理を行う。すなわち選択部103は、新たに未処理の補助情報を結果記憶部123から取得する(ステップS405)。
選択部103は、取得した補助情報の種別が「組織可」であり、かつ、検索要求に含まれるキーワード、および、検索要求に含まれる製品種類が、取得した補助情報に含まれるキーワード、および、製品種類と一致するか否かを判断する(ステップS406)。条件を満たす場合(ステップS406:Yes)、選択部103は、さらに検索要求を入力したユーザ(検索者)の専門性レベルが、補助情報に含まれる従業員番号のユーザ(評価者)の専門性レベルより小さいか否かを判断する(ステップS407)。例えば選択部103は、図3に示すようなユーザ情報を参照して、各ユーザの専門性レベルを特定できる。
検索者の専門性レベルが評価者の専門性レベルより小さい場合(ステップS407:Yes)、選択部103は、取得した補助情報を例えば検索部104で参照できる形式で一時記憶部などに記録する(ステップS408)。
ステップS406の条件を満たさない場合(ステップS406:No)、および、検索者の専門性レベルが評価者の専門性レベル以上である場合(ステップS407:No)、選択部103は、すべての補助情報を処理したか否かを判断する(ステップS409)。すべての補助情報を処理していない場合(ステップS409:No)、選択部103は、ステップS405に戻り処理を繰り返す。すべての補助情報を処理した場合(ステップS409:Yes)、評価情報検索処理を終了する。
このような処理により、検索者が過去に評価した評価情報を含む補助情報のうち、今回入力した検索要求と同様のキーワードに対応する補助情報を選択することができる。さらに、検索者以外の評価者のうち専門性レベルが検索者より大きい評価者が過去に評価した評価情報を含む補助情報を選択することができる。なお、種別が「組織可」である補助情報を登録するときに、例えば専門性レベルが閾値より大きい評価者の補助情報を登録するように構成する場合などであれば、ステップS407の専門性レベルの比較処理を実行しなくてもよい。このような構成であっても、専門性レベルが高い評価者の補助情報を活用可能となるため、検索処理をより効率的に実行可能となる。
また、図11の例では、種別が「個人」の補助情報と種別が「組織可」の補助情報の両方を検索したが、いずれか一方のみを検索するように構成してもよい。また、両者が存在する場合に、いずれかを優先して出力するように構成してもよい。
次に、ステップS307の評価情報保存処理の詳細について説明する。図12は、評価情報保存処理の一例を示すフローチャートである。評価情報保存処理では、新たに受信した評価結果と同様の評価結果が既に結果記憶部123に記憶されているか判定される。既に記憶されている場合は、専門性レベルの違いに応じて、組織でも利用できるようにするか個人用に限定するかが判定され、評価結果が保存される。
選択部103は、結果記憶部123に記憶された補助情報のうち、未処理の補助情報を取得する(ステップS501)。選択部103は、取得した補助情報に含まれる種別が「組織可」であり、かつ、評価結果に対応する検索要求に含まれるキーワード、および、検索要求に含まれる製品種類が、取得した補助情報に含まれるキーワード、および、製品種類と一致するか否かを判断する(ステップS502)。条件を満たす場合(ステップS502:Yes)、選択部103は、検索要求を入力したユーザ(検索者)の専門性レベルが、補助情報に含まれる従業員番号のユーザ(評価者)の専門性レベルより大きいか否かを判断する(ステップS503)。
検索者の専門性レベルが評価者の専門性レベルより大きい場合(ステップS503:Yes)、選択部103は、ステップS501で取得した、登録済の補助情報の種別を「個人」に更新する(ステップS504)。選択部103は、新たに受信した評価結果を含む補助情報を、種別を「組織可」として、結果記憶部123に保存する(ステップS505)。検索者の専門性レベルが評価者の専門性レベル以下である場合(ステップS503:No)、選択部103は、新たに受信した評価結果を含む補助情報を、種別を「個人」として、結果記憶部123に保存する(ステップS506)。
ステップS502で条件を満たさない場合(ステップS502:No)、選択部103は、すべての補助情報を処理したか否かを判断する(ステップS507)。すべての補助情報を処理していない場合(ステップS507:No)、選択部103はステップS501に戻り、次の補助情報を取得して処理を繰り返す。
すべての補助情報を処理した場合(ステップS507:Yes)、選択部103は、検索者の専門性レベルが、予め定められた特定レベル以上であるか否かを判断する(ステップS508)。例えば、専門性レベル=「A:非常に詳しい」を特定レベルとして定めることができる。この場合、専門性レベルが高いユーザの評価結果を組織用として、他のユーザが共有可能となる。
検索者の専門性レベルが特定レベル以上である場合(ステップS508:Yes)、選択部103は、新たに受信した評価結果を含む補助情報を、種別を「組織可」として、結果記憶部123に保存する(ステップS509)。検索者の専門性レベルが特定レベルより小さい場合(ステップS508:No)、選択部103は、新たに受信した評価結果を含む補助情報を、種別を「個人」として、結果記憶部123に保存する(ステップS506)。
結果記憶部123に一度記録された評価情報はその後削除されることなく使い続けられるように構成してもよい。一方、検索対象となる文書が更新された場合、過去の評価結果を利用することが適切ではないこともある。そこで、例えば図11のステップS402およびステップS406の処理で、検索対象となる文書が更新されたか否かの判定も加え、更新されている場合には補助情報を利用しないように構成してもよい。例えば、入力された検索条件により検索された件数と、補助情報に含まれる件数とを比較し、件数が一致しなければ検索対象の文書が追加または削除されたと判断してもよい。上述のように、件数は、内容の共通性を考慮した「異なり数」を用いてもよい。
これまでは、信頼度として専門性レベルを用いていたが、信頼度はこれに限られるものではない。例えば、他のユーザの信頼度をユーザ情報記憶部122に記憶し、記憶された信頼度を参照して補助情報を利用するかを判断するように構成してもよい。信頼度は、例えば、あるユーザがどのユーザの評価情報であれば信用して使用できるかを示す情報である。
図3では、専門性情報は、管理者が事前に各ユーザの専門性を評価して設定すると説明した。しかし、管理者が、組織の全構成員の知識レベルを正確に把握できているとは限らない。そこで、図3の専門性情報とは別に、各ユーザが、日々の業務を通じて把握している他人の専門性の高さをもとに、自分と同等またはそれ以上の専門性を持つ人物、または、その人の評価であれば利用したいと考える人物を信頼できる評価者として、各ユーザのユーザ情報の中に設定可能とする。
このような信頼度を、専門性レベルとともに用いるように構成してもよい。これにより、例えば専門性レベルの判定では条件に合致しない場合でも、他のユーザの評価情報を利用できるようになる。
このように、第1の実施形態にかかる検索装置では、過去の検索結果を評価したユーザ(評価者)の専門性レベル(信頼度)を参照して、評価結果を利用したレレバンスフィードバックを実行するかを決定する。これにより、検索をより効率化することが可能となる。
(第2の実施形態)
第2の実施形態にかかる検索装置は、選択された補助情報を利用するかをユーザが指定可能とする機能、および、検索条件(キーワードなど)を正規化する機能をさらに備える。なおこれらの機能のうちいずれか一方のみを備えるように構成してもよい。
図13は、第2の実施形態の検索システムの機能構成の一例を示す図である。図13に示すように、本実施形態の検索システムは、検索装置100−2と、端末装置200と、がネットワーク300で接続された構成となっている。
第2の実施形態では、受付部102−2の機能、選択部103−2の機能、および、正規化部105−2を追加したことが第1の実施形態と異なっている。その他の構成および機能は、第1の実施形態のブロック図である図2と同様であるので、同一符号を付し、ここでの説明は省略する。
受付部102−2は、選択された補助情報の利用の可否を示す情報をさらに受け付ける点が、第1の実施形態の受付部102と異なっている。
正規化部105−2は、検索要求に含まれる表記を、意味が同一である他の表記に変換する正規化処理を実行する。正規化処理の詳細は後述する。正規化処理を実行することにより、評価情報をより有効に活用するとともに、検索者の入力作業を低減し作業を効率化することが可能となる。
選択部103−2は、正規化処理が実行された検索要求に含まれる検索条件と一致する検索条件を含む補助情報から信頼度に基づいて補助情報を選択する。これにより、選択部103−2は、検索要求に含まれる検索条件と一致または類似する検索条件を含む補助情報を選択可能となる。
第1の実施形態では、利用可能な評価情報が存在した場合は、その評価情報を常に使用して再検索が実行される(図9のステップS304:Yes、ステップS308)。しかし、組織用の評価情報として利用可能であっても、例えばユーザによっては、自分と同じ専門性レベルの人の評価情報は利用したくないと考える場合もありうる。そのような要望に対応するために、検索者が入力した検索要求に対して利用可能な評価情報が結果記憶部123に記録されている場合に、その評価を行ったユーザ(評価者)が誰であるかを表示した上で、その評価情報を利用するか否かを検索者が判断できるようにすることが望ましい。
そこで、本実施形態では、受付部102−2により、選択された補助情報の利用の可否を示す情報をさらに受け付けられるようにする。例えば、本実施形態では、検索結果画面で補助情報の利用の可否を指定できるようにする。受付部102−2は、検索結果画面で指定された利用の可否を示す情報を受け付ける。
図14は、第2の実施形態の検索結果画面の一例を示す図である。第1の実施形態の検索結果画面(図10)に対して、本実施形態の検索結果画面は、利用可能な補助情報がある旨を示すメッセージ907と、この補助情報を利用した再検索を指定するボタン908とが追加される。
検索者は、メッセージ907で表示されたユーザ(ユーザA)の専門性レベルなどを考慮し、このユーザの評価結果を利用する場合にはボタン908を押せばよい。ボタン908が押下されると、このユーザの評価結果(補助情報)を利用することを示す情報が検索装置100−2に送信される。受付部102−2は、この情報を受け付ける。一方、検索者が自分自身で評価を行う場合は、上述のように評価欄904に自分でチェックを入れ、再検索ボタン906を押せばよい。図14の例では、ユーザを特定できる情報(「ユーザA」)が表示されているが、ユーザは特定されずに専門レベルが特定される情報が表示されてもよい。例えば、氏名を表示する代わりに、「あなたよりも専門性の高い人」などを表示してもよい。
次に、正規化部105−2について説明する。正規化とは、同一の検索目的のために入力されたにも関わらず表記が異なる検索条件(キーワード)を、表記が同一の検索条件(キーワード)に変換することをいう。これにより、本来同一の検索目的で入力されたが表記が異なる検索要求に対して、結果記憶部123において異なる検索条件(キーワード)として記録されたため利用できなかった評価情報が検索に利用できるようになる。
正規化を行うには、例えば同義語辞書を用いればよい。図15は、同義語辞書の一例を示す図である。図15では、「TV」と「テレビ」が同義である、などの例が示されている。正規化では、入力された検索条件(キーワード)の形態素それぞれについて、同義語辞書を検索し、該当する行がある場合は、例えば各行の先頭の語に統一する。例えば検索条件(キーワード)に含まれる「TV」という単語は、「テレビ」に変換された上で、結果記憶部123に対する記録、および、結果記憶部123からの補助情報の検索に用いられる。
このように、第2の実施形態にかかる検索装置では、選択された補助情報を利用するかをユーザが指定可能とする機能、および、検索条件を正規化する機能をさらに備える。これにより、検索をさらに効率化することが可能となる。
(第3の実施形態)
検索結果が数多く表示され十分に絞り込みができていないと判断される場合や検索結果が想定されているものよりも少ないと判断される場合、通常、検索者は、クエリに検索キーワードを追加したり、検索式を修正したりする。このような検索要求の修正行為も、検索対象に対する知識を豊富に持っているユーザの方が的確に行える。このため、知識量が少ない検索者からすると、自分よりも高度な専門知識を持ったユーザが検索式をどのように指定したり修正しているのかを知ることにより自分の検索の質を高めることができる。
しかし従来技術では、検索者の知識の程度が考慮されていないため、知識レベルの低い検索者の検索履歴が共有されるなど、検索効率の向上に寄与しない情報が提示される場合があった。すなわち、知識が豊富で専門性の高い人間が行った検索履歴が組織内で有効に活用されない場合があった。
第3の実施形態にかかる検索装置は、他のユーザの信頼度を参照して、過去の検索履歴を利用するかを決定する。これにより、検索をより効率化することが可能となる。
図16は、第3の実施形態の検索システムの機能構成の一例を示す図である。図16に示すように、本実施形態の検索システムは、検索装置100−3と、端末装置200と、がネットワーク300で接続された構成となっている。
第3の実施形態では、選択部103−3、検索部104−3、および、結果記憶部123−3の機能が第1の実施形態と異なっている。その他の構成および機能は、第1の実施形態のブロック図である図2と同様であるので、同一符号を付し、ここでの説明は省略する。
結果記憶部123−3は、補助情報として、過去の検索履歴を記憶する点が、第1の実施形態の結果記憶部123と異なっている。図17は、結果記憶部123−3に記憶される検索履歴の一例を示す図である。図17に示すように、補助情報としての検索履歴は、IDと、種別と、キーワードと、製品種類と、従業員番号と、を含む。このように検索履歴は、どのユーザが、どの種類の製品に関して、どのようなキーワードで検索したかを記録した情報である。
選択部103−3は、検索要求に含まれる検索条件と一致する検索条件を含む検索履歴から信頼度に基づいて検索履歴を選択する。第2の実施形態と同様に、検索条件を正規化した上で一致するか判定するように構成してもよい。検索部104−3は、選択された検索履歴に含まれる検索条件を用いて情報を検索する。
ユーザ情報入力処理および検索要求入力処理は、第1の実施形態(図5、図7)と同様であるため説明を省略する。
次に、第3の実施形態にかかる検索装置100−3による検索処理について説明する。図18は、第3の実施形態における検索処理の一例を示すフローチャートである。
検索部104−3は、検索要求を受付部102から受け取る(ステップS601)。検索部104−3は、検索要求に応じた検索処理を実行し、検索結果を表示する(ステップS602)。検索要求は、検索者が自分で検索条件を入力した通常の検索要求と、検索履歴を用いた再検索の要求とを含む。検索部104−3は、ステップS602で実行した検索が、再検索であるか否かを判断する(ステップS603)。
再検索である場合(ステップS603:Yes)、検索部104−3は、検索処理を終了する。再検索でない場合、すなわち、通常の検索である場合(ステップS603:No)、検索部104−3は、この検索で用いた検索条件(キーワード、製品種類)を含む検索履歴を結果記憶部123−3に保存する(ステップS604)。
選択部103−3は、検索で用いた検索条件に対応する検索履歴を結果記憶部123−3から検索する(ステップS605)。選択部103−3は、対応する検索履歴が存在するか否かを判断する(ステップS606)。存在しない場合(ステップS606:No)、検索部104−3は、検索処理を終了する。
対応する検索履歴が存在する場合(ステップS606:Yes)、検索部104−3は、この検索履歴を例えば表示部222に表示させる(ステップS607)。
図19は、検索履歴が存在する場合に表示される検索結果画面の一例を示す図である。本実施形態の検索結果画面は、検索履歴を表示する領域1906と、再検索ボタン1907と、を含む。領域1906には、結果記憶部123−3から検索された検索履歴(キーワード)が表示される。領域1906には、検索履歴として記録されたキーワード全体をそのまま提示する代わりに、検索者が入力したキーワードとの差分となるキーワードだけを提示してもよい。領域1906の右側には、検索履歴それぞれに対応する再検索ボタン1907が表示される。再検索ボタン1907が押下されると、対応する検索履歴の検索条件(キーワード、製品種類)による検索要求が検索装置100−3に送信され、再度検索が実行される(ステップS601)。
図20は、検索結果画面の他の例を示す図である。図20の例では、領域1906の上に、製品種類が一致する検索履歴(図20の例では製品種類=「テレビ」)であることを示すメッセージが表示される。このように、本実施形態では、専門分野(製品種類)が関連する検索履歴を利用することができる。なお、製品種類が一致しない検索履歴を取得するように構成してもよい。
図21は、検索結果画面の他の例を示す図である。図21の例では、領域1906の上に、専門性レベルが検索者より高いユーザの検索履歴であることを示すメッセージが表示される。
次に、ステップS605の履歴検索処理の流れについて説明する。図22は、履歴検索処理の一例を示すフローチャートである。履歴検索処理では、検索者が指定したキーワードを包含するキーワードを、結果記憶部123−3に記録された検索履歴から抽出する。
選択部103−3は、結果記憶部123−3に記憶された補助情報のうち、未処理の補助情報を取得する(ステップS701)。選択部103−3は、取得した補助情報に含まれる種別が「組織可」であり、かつ、検索要求に含まれる製品種類が、取得した補助情報に含まれる製品種類と一致するか否かを判断する(ステップS702)。条件を満たす場合(ステップS702:Yes)、選択部103−3は、検索要求に含まれるキーワードの内容語が、補助情報に含まれるキーワードの内容語に包含されるか否かを判断する(ステップS703)。例えば選択部103−3は、キーワードを形態素解析して形態素に分割し、助詞などのストップワードを取り除いた形態素を内容語とする。
検索要求に含まれるキーワードの内容語が、補助情報に含まれるキーワードの内容語に包含される場合(ステップS703:Yes)、選択部103−3は、検索者の専門性レベルが、補助情報に含まれる従業員番号のユーザの専門性レベルより大きいか否かを判断する(ステップS704)。
検索者の専門性レベルが履歴の専門性レベルより大きい場合(ステップS704:Yes)、選択部103−3は、ステップS701で取得した補助情報を例えば検索部104−3で参照できる形式で一時記憶部などに記録する(ステップS705)。
補助情報を記録した後、ステップS702で条件を満たさないと判断した場合(ステップS702:No)、ステップS703で包含関係にないと判断した場合(ステップS703:No)、および、ステップS704で検索者の専門性レベルが履歴の専門性レベルより大きくないと判断した場合(ステップS704:No)、選択部103−3は、すべての補助情報を処理したか否かを判断する(ステップS706)。すべての補助情報を処理していない場合(ステップS706:No)、選択部103−3は、ステップS701に戻り処理を繰り返す。すべての補助情報を処理した場合(ステップS706:Yes)、選択部103−3は、履歴検索処理を終了する。
以上のような処理により、現在の検索条件よりも詳細な検索条件を抽出することが可能となる。
次に、ステップS604の履歴保存処理の流れについて説明する。図23は、履歴保存処理の一例を示すフローチャートである。
検索部104−3は、検索者の専門性レベルが予め定められた特定レベル以上であるか否かを判断する(ステップS801)。例えば、専門性レベル=「A:非常に詳しい」を特定レベルとして定めることができる。この場合、専門性レベルが高いユーザの検索履歴を組織用として、他のユーザが共有可能となる。
検索者の専門性レベルが特定レベル以上である場合(ステップS801:Yes)、検索部104−3は、種別を「組織可」として、検索で用いた検索条件(キーワード、製品種類)を含む検索履歴を結果記憶部123−3に保存する(ステップS802)。検索者の専門性レベルが特定レベル以上でない場合(ステップS801:No)、検索部104−3は、種別を「個人」として、検索で用いた検索条件(キーワード、製品種類)を含む検索履歴を結果記憶部123−3に保存する(ステップS803)。
このように、第3の実施形態にかかる検索装置では、あるユーザが検索を行う場合に、当該ユーザよりも専門性レベルの高いユーザが行った検索要求が参考情報として提示される。そして、ボタン操作により手間なく検索要求を修正することができる。また当該ユーザが入力した検索要求も検索履歴として記録され、別のユーザが検索を行った際に参考情報として提示可能となる。これにより、組織全体として検索時の検索条件の修正作業が効率化され、検索作業全体の効率が向上する。
以上説明したとおり、第1から第3の実施形態によれば、レレバンスフィードバックなどで用いる評価結果、または、過去の検索履歴などの検索の補助情報を共有する際に、ユーザの信頼度(専門性レベルなど)を考慮することができる。これにより、例えば組織内でより知識が豊富で専門性が高いユーザの評価結果や検索履歴を有効に活用し、検索作業の効率を高めることが可能となる。
次に、第1から第3の実施形態にかかる装置(検索装置、端末装置)のハードウェア構成について図24を用いて説明する。図24は、第1から第3の実施形態にかかる装置のハードウェア構成例を示す説明図である。
第1から第3の実施形態にかかる装置は、CPU(Central Processing Unit)51などの制御装置と、ROM(Read Only Memory)52やRAM(Random Access Memory)53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
第1から第3の実施形態にかかる装置で実行されるプログラムは、ROM52等に予め組み込まれて提供される。
第1から第3の実施形態にかかる装置で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
さらに、第1から第3の実施形態にかかる装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、第1から第3の実施形態にかかる装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
第1から第3の実施形態にかかる装置で実行されるプログラムは、コンピュータを上述した装置の各部として機能させうる。このコンピュータは、CPU51がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。