以下、本発明の実施の形態を図面を参照して説明する。
実施の形態1.
図1は、本発明の第1の実施の形態による情報検索支援システムの構成例を示すブロック図である。本発明の情報検索支援システムは、事例データベース70と、関連キーワード抽出手段10と、関連キーワードテーブル80と、キーワード選択入力手段40と、事例データ検索手段50と、事例データ提示手段60と、キーワード生成手段20と、キーワード提示手段30とを備える。
事例データベース70は、検索対象となるデータを記憶するデータベースである。事例データベース70が記憶するデータは、自然文で記述されたデータであり、例えば、コールセンタにおいて顧客から伝えられた事例(受付事例)や製品の障害事例等が検索対象データとして事例データベース70に記憶される。なお、自然文とは、自然言語で記述された文である。ここでは、コールセンタにおける受付事例や製品の障害事例を例示したが、事例データベース70に記憶される検索対象となるデータは、他のデータであってもよい。以下の説明では、検索対象となるデータが、コールセンタにおける受付事例や製品の障害事例である場合を例に説明し、検索対象となるデータを事例データ(あるいは、単に事例)と記す。
関連キーワード抽出手段10は、事例データベース70に記憶されている各事例データを解析し、各事例データに含まれている関連するキーワード(関連キーワード)を抽出する。関連キーワード抽出手段10は、関連するキーワードとして、互いに関連する2つのキーワードを対にして抽出する。そして、関連キーワード抽出手段10は、個々の事例データから抽出した関連するキーワードを関連キーワードテーブル80に登録する。すなわち、関連するキーワードを関連キーワードテーブル80に記憶させる。
関連キーワードテーブル80は、関連キーワード抽出手段10によって抽出された関連するキーワードを登録する記憶装置である。
キーワード選択入力手段40は、事例データを検索するための検索キーワードが入力される入力手段である。キーワード選択入力手段40は、例えば、キーボードやマウス等の入力装置によって実現される。キーワード選択入力手段40には、ユーザが決定したり選択したりした検索キーワードがユーザによって入力される。キーワード選択入力手段40による検索キーワードの入力態様は、例えば、キーボードをキーワード選択入力手段40として検索キーワードが入力される態様であってもよいし、ディスプレイ装置に表示される複数の検索キーワードの候補の中からマウスなどで検索キーワードが選択、決定され、その決定された検索キーワードを入力キーワードとする態様であってもよい。
事例データ検索手段50は、キーワード選択入力手段40に入力された検索キーワードを含む事例データを、事例データベース70が記憶している各事例データの中から検索する。
事例データ提示手段60は、事例データ検索手段50による検索結果、すなわち、事例データ検索手段50が検索した事例データをユーザに提示(例えば、表示や印刷等の態様で出力)する。
キーワード生成手段20は、キーワード選択入力手段40に入力された検索キーワードと、検索結果である各事例データとを用いて、検索キーワードの候補である絞り込みキーワードを生成する。
キーワード提示手段30は、キーワード生成手段20によって生成された絞り込みキーワードをユーザに提示(例えば、表示や印刷等の態様で出力)する。事例データ提示手段60およびキーワード提示手段30は、ディスプレイ装置や印刷装置等の出力装置によって実現される。事例データ提示手段60およびキーワード提示手段30は、共通の出力装置(例えば、共通のディスプレイ装置)であってもよい。また、事例データ提示手段60およびキーワード提示手段30は、ディスプレイ装置等の出力装置を備えた情報処理装置であってもよい。
ユーザが1つの検索キーワードを入力して事例データを検索した場合、キーワード生成手段20が絞り込みキーワードを生成し、キーワード提示手段30は生成された絞り込みキーワードを表示する。ユーザは自身が入力した検索キーワードによる検索結果に所望の事例データが含まれていない場合、キーワード生成手段20に生成された絞り込みキーワードを用いて検索を続行すればよい。この操作を繰り返すことにより、ユーザの望む事例データが検索されやすくなる。
また、キーワード生成手段20は、履歴管理手段203と、キーワード別共起判定手段201と、キーワードランキング手段202とを備える。
履歴管理手段203は、ユーザの検索履歴を管理する。具体的には、履歴管理手段203は、ユーザによってキーワード選択入力手段40に入力された検索キーワードを、入力された順序が判別可能となるように記憶する。例えば、履歴管理手段203は、キーワード選択入力手段40に入力された検索キーワードを入力された順番に記憶する。なお、このような記憶の態様は例示であり、履歴管理手段203は、入力された順序が判別可能となるように記憶するのであれば、他の態様で検索キーワードを記憶してもよい。例えば、キーワード選択入力手段40に入力された検索キーワードと、その検索キーワードが入力された順番を示す番号とを対応付けて記憶してもよい。
キーワード別共起判定手段201は、関連キーワード抽出手段10が事例データベース70に記憶されている各事例データから抽出した関連キーワードのうち、事例データ検索手段50によって検索された事例データから抽出されていた関連キーワードを参照する。そして、キーワード別共起判定手段201は、検索された事例データに対応する関連キーワードに属する各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている検索キーワードと共起しているか否かを判定する。このとき、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードであれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと共起しているキーワードを、絞り込みキーワード(検索キーワードの候補)とすることによって、絞り込みキーワードを生成する。なお、キーワード別共起判定手段201が生成する絞り込みキーワードは1つとは限らない。履歴管理手段203に記憶されている検索キーワードと共起しているキーワードが複数存在するならば、キーワード別共起判定手段201によって生成される絞り込みキーワードは複数となる。キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワードを、絞り込みキーワードとしてキーワードランキング手段202に送信する。
キーワードランキング手段202は、キーワード別共起判定手段201によって生成された絞り込みキーワード(すなわち、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワード)の順位付けを行う。
次に、動作について説明する。
図2は、第1の実施の形態の情報検索支援システムの動作を示すフローチャートである。まず、関連キーワード抽出手段10は、事例データベース70に記憶されている各事例データを解析し、各事例データに含まれている関連するキーワードを抽出し、個々の事例データから抽出した関連するキーワードを関連キーワードテーブル80に登録する(ステップS201)。ステップS201において、関連キーワード抽出手段10が行う解析処理とは、例えば、後述の図3(a)に示す処理である。また、ステップS201の処理は、ユーザによって入力される検索キーワードによる検索を実行する以前に、前処理として行う。すなわち、前処理としてステップS201の処理が完了してから、後述のステップS202以降の処理が行われる。
また、互いに関連するキーワードの抽出態様は、種々考えられるが、ここでは、事例データ内で係り受け関係が成立しているキーワード同士を、互いに関連するキーワードとして抽出する場合を例にして説明する。
図3は、関連キーワード抽出手段10の動作を示す説明図であり、図3(a)は、関連キーワード抽出手段10による関連キーワード抽出処理を示すフローチャートである。図3(a)に示すように、関連キーワード抽出手段10は、自然文で書かれた事例データに対して係り受け解析を行い、係り受けの発生している2つの文字列を、1つの文字列グループとする(ステップS301)。関連キーワード抽出手段10は、1つの文字列グループとした文字列を単語に分割する(ステップS302)。関連キーワード抽出手段10は、1つの文字列グループとした2つの文字列について、例えば形態素解析を行うことによって、文字列を単語に分割する。続いて、関連キーワード抽出手段10は、分割した単語の中らから不要な単語(不要な品詞)を除外する(ステップS303)。ステップS303では、少なくとも助詞、助動詞、接続詞を不要な単語として除外し、名詞、形容詞および動詞は必ず残すようにして、不要な品詞を除外する。副詞に関しては、名詞、形容詞および動詞とともに残してもよいし、あるいは、不要な品詞として除外してもよい。関連キーワード抽出手段10は、1つの文字列グループとした2つの係り受け関係にある文字列を分割して得た単語であって、ステップS303で除外せずに残した単語同士を、関連するキーワードとして抽出する(ステップS304)。ステップS304では、係り受け関係にある文字列の一方から得た単語と、他方から得た単語とを対にして関連キーワードとする。
例えば、図3(c)に示す事例データ31のように、「ドラム付近で紙が詰まって、用紙を取り除いてもすぐまた詰まる。」という障害の現象が記載された事例データから関連キーワードを抽出する場合を例に説明する。関連キーワード抽出手段10は、図3(c)に示す事例データ31における係り受けを判断し、係り受けの発生している2つの文字列を、1つの文字列グループとする(ステップS301)。本例では、図3(b)に示すように、文字列「ドラム付近で」と文字列「詰まって」を1つの文字列グループにする。同様に、文字列「紙が」と文字列「詰まって」を1つの文字列グループにする。また、同様に、文字列「用紙を」と文字列「取り除いても」を1つの文字列グループにする。事例データ31において係り受け関係が成立している他の文字列同士に関しても同様に1つの文字列グループとする。図3(b)は、図3(c)に示す事例データ31から生成される文字列グループを示す。図3(b)において実線の楕円は、文字列を示す。また、1つの文字列から他の文字列に延びる矢印は、その2つの文字列の間で係り受けが成立していることを示している。また、破線の楕円は文字列グループを表し、1つの破線の楕円は、係り受けが成立している2つの文字列を囲んでいる。
ステップS301の次に、関連キーワード抽出手段10は、各文字列グループに属する文字列を形態素解析し、文字列を形態素(単語)に分割する(ステップS302)。例えば、「ドラム付近で詰まって」という文字列グループ(文字列「ドラム付近で」と文字列「詰まって」からなる文字列グループ)に関しては、文字列「ドラム付近で」を、「ドラム」「付近」「で」という形態素に分割し、文字列「詰まって」を「詰まる」「て」という形態素に分割する。続いて、関連キーワード抽出手段10は、分割された単語のうち「で」や「て」のような助詞などの不要な単語(不要な品詞)を除外する(ステップS303)。そして、関連キーワード抽出手段10は、文字列「ドラム付近で」から抽出したキーワード「ドラム」と、文字列「詰まって」から抽出したキーワード「詰まる」を関連キーワードとして抽出する。すなわち、「ドラム」および「詰まる」を対にして関連キーワードとして抽出する。同様に、関連キーワード抽出手段10は、文字列「ドラム付近で」から抽出したキーワード「付近」と、文字列「詰まって」から抽出したキーワード「詰まる」を関連キーワードとして抽出する。すなわち、「付近」および「詰まる」を対にして関連キーワードとして抽出する。
関連キーワード抽出手段10は、全ての文字列グループに同様にステップS302〜S304の処理を行う。図3(c)に示す事例データ31に対して上記のステップS301〜S304の処理を行った場合、図3(c)に示す関連キーワード32が抽出される。なお、図3(c)に示すKW1は、係り受け関係にある文字列のうち修飾する側の文字列から得られた単語(キーワード)であることを示している。図3(c)に示すKW2は、係り受け関係にある文字列のうち修飾される側の文字列から得られた単語(キーワード)であることを示している。
ステップS201(図2参照。)では、関連キーワード抽出手段10は、図3(a)に例示する処理を実行することによって関連キーワードを事例データ毎に抽出する。
図3では、係り受け関係を利用して関連キーワードを抽出する場合を示したが、他の態様で関連キーワードを抽出してもよい。
例えば、関連キーワード抽出手段10は、句読点で区切られる文字列(読点に挟まれる文字列、あるいは読点および句点に挟まれる文字列)を1つの文字列グループとして関連キーワードを抽出してもよい。この場合、関連キーワード抽出手段10は、句読点で区切られる文字列をそれぞれ1つの文字列グループとする。そして、関連キーワード抽出手段10は、各文字列グループに属する文字列(句読点で区切られる文字列)を、例えば形態素解析を行うことによって、単語に分割し、不要な単語(不要な品詞。少なくとも、助詞、助動詞および接続詞。)を除外する。そして、1つ文字列グループに属する文字列を分割して、除外されずに残った単語から2つの単語の組み合わせを生成し、生成されたそれぞれの組み合わせに属する2つの単語を関連キーワードとしてもよい。このような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出してもよい。
また、例えば、個々の単語と、その個々の単語からの距離が閾値範囲内である単語との組み合わせを関連キーワードとして抽出してもよい。この場合、関連キーワード抽出手段10は、例えば形態素解析を行うことによって事例データを単語に分割し、不要な単語(不要な品詞。少なくとも、助詞、助動詞および接続詞。)を除外する。そして、関連キーワード抽出手段10は、除外されずに残った個々の単語毎に、その個々の単語からの距離が閾値範囲内である単語を取り出し、単語の組み合わせを生成する。関連キーワード抽出手段10は、生成されたそれぞれの組み合わせに属する2つの単語を関連キーワードとしてもよい。なお、単語からの距離とは、ある単語のいくつ隣になっているかを示す値である。例えば、ある単語からの距離が1以内である単語とは、そのある単語の1つ隣の単語のことである。このような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出してもよい。このような態様では、例えば、除外されずに残った単語に基づいて、隣り合う単語同士を関連キーワードとして抽出すること等ができる。
関連キーワード抽出手段10は、抽出した関連キーワードのデータ(例えば、図3(c)に例示する関連キーワード32)を関連キーワードテーブル80に登録する(ステップS201)。関連キーワード抽出手段10は、関連キーワードを関連キーワードテーブル80に登録するときに、どの事例データから抽出された関連キーワードであるのかを識別できるように関連キーワードを登録する。例えば、各事例データに識別情報を割り当てておき、関連キーワードを関連キーワードテーブル80に登録するときに、その関連キーワードの抽出元となった事例データの識別情報とともに登録してもよい。
事例データ毎に関連キーワードを抽出して、関連キーワードテーブル80に登録することによって、前処理であるステップS201が完了する。
続いて、ユーザがキーワードを使って事例データを検索するときの情報検索支援システムの動作を、図2を参照して説明する。
キーワード選択入力手段40に、ユーザによって検索キーワードが入力される(ステップS202)。キーワード選択入力手段40は、入力された検索キーワードを、事例データ検索手段50と履歴管理手段203とに送信する。
事例データ検索手段50は、キーワード選択入力手段40に入力された検索キーワードを使って、事例データベース70から事例データを検索する。すなわち、事例データ検索手段50は、キーワード選択入力手段40に入力された検索キーワードを含む事例データを、事例データベース70が記憶している各事例データの中から検索する。そして、事例データ検索手段50は、検索結果(検索した事例データ)をキーワード別共起判定手段201へ送信する(ステップS203)。さらに、事例データ検索手段50は、検索結果を事例データ提示手段60送信し、事例データ提示手段60は、検索結果をユーザへ提示する(ステップS204)。
履歴管理手段203は、ユーザが入力した検索キーワードを管理する(ステップS205)。具体的には、履歴管理手段203は、ユーザによってキーワード選択入力手段40に入力された検索キーワードを、入力された順序が判別可能となるように記憶する。ここでは、キーワード選択入力手段40に検索キーワードが入力され、キーワード選択入力手段40がその検索キーワードを履歴管理手段203に出力した場合、キーワード選択入力手段40が履歴管理手段203に出力した順に、検索キーワードを記憶するものとして説明する。すなわち、キーワード選択入力手段40に入力された順番に検索キーワードを記憶するものとして説明する。既に説明したように、キーワード選択入力手段40に入力された検索キーワードと、その検索キーワードが入力された順番を示す番号とを対応付けて記憶してもよい。図4は、履歴管理手段203に記憶された検索キーワードの例を示す説明図である。図4では、ユーザによて検索キーワード「印刷」、「詰まる」、「紙」が順に入力され、その順番に各検索キーワードが履歴管理手段203に記憶されている例を示している。
ユーザは、ステップS204で、事例データ提示手段60によって提示された検索結果の中にユーザの所望の事例データが含まれていれば、その事例データを参照し検索を終える。しかし、提示された検索結果に含まれる事例データの数が多すぎたりして、ユーザが検索結果の中に所望の事例データを見つけられない場合等がある。所望の事例データが見つけられなかった場合、ユーザは、キーワード生成手段20によって生成された絞り込みキーワードを使って、さらに検索を続ける。なお、キーワード生成手段20によって生成された絞り込みキーワードは、後述のステップS209で提示される。
キーワード生成手段20が絞り込みキーワードを生成して、その絞り込みキーワードをユーザに提示するまでの動作(図2に示すステップS206〜S209)の動作について説明する。
キーワード別共起判定手段201には、事例データ検索手段50による検索結果である事例データが、事例データ検索手段50から送られる(ステップS203)。キーワード別共起判定手段201は、関連キーワードテーブル80に記憶されている各事例データ毎の関連キーワードのうち、検索結果である事例データから抽出された関連キーワードを参照する(ステップS206)。すなわち、キーワード別共起判定手段201は、検索結果である事例データから抽出された関連キーワードを調べる(ステップS206)。
そして、キーワード別共起判定手段201は、検索された事例データに対応する関連キーワードに属する各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている検索キーワードと共起しているか否かを判定する(ステップS207)。このとき、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードであれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。そして、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワードを、絞り込みキーワード(検索キーワードの候補)としてキーワードランキング手段202に送信する。
ステップS206,S207の動作の具体例を図5を参照して説明する。ユーザからキーワード選択入力手段40に検索キーワード「印刷」が入力され、履歴管理手段203は、検索キーワード45(図5参照。本例では「印刷」。)を記憶しているものとする。また、ステップS204では、事例データ検索手段50が、検索キーワード「印刷」を含む事例データを、事例データベース70に記憶されている全事例データ40(図5参照。)の中から検索し、図5に示す「事例1」、「事例2」および「事例3」を含む検索結果をキーワード別共起判定手段201に出力しているものとする。また、前処理であるステップS201によって、事例1から抽出された関連キーワード42、事例2から抽出された関連キーワード43、および事例3から抽出された関連キーワード44が、関連キーワードテーブル80に記憶されたものとする。この場合、ステップS206で、キーワード別共起判定手段201は、検索結果41に含まれる「事例1」、「事例2」および「事例3」から抽出済みであって関連キーワードテーブル80に記憶されている関連キーワード42,43,44を参照する。すなわち、検索結果41に含まれる事例データから抽出されていた関連キーワードを調べる。
次にステップS207で、キーワード別共起判定手段201は、検索結果41に含まれる「事例1」、「事例2」および「事例3」に対応する各関連キーワード42,43,44に含まれる各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている検索キーワード45(「印刷」)と共起しているか否かを判定する。図5に例示する関連キーワード42,43,44では、「印刷」を含む関連キーワードの組を太枠で囲んで示している。図5に例示する関連キーワード42,43,44に含まれるキーワードは、「印刷」、「紙」、「トナー」、「汚れる」、「詰まる」、「交換」、「異常」、「ずれる」等がある。キーワード別共起判定手段201は、これらの各キーワードについて、検索キーワード45(「印刷」)と共起しているか否かを判定し、判定結果46(図5参照。)を導く。図5に示す判定結果46では、履歴管理手段203に記憶されている検索キーワード45と共起している場合を「1」で示し、共起していない場合を「0」で示している。「印刷」と対になるキーワードは、「汚れる」、「詰まる」、「異常」、「ずれる」である(図5に示す関連キーワード42,43,44における太枠で囲んだ範囲を参照。)。従って、「汚れる」、「詰まる」、「異常」、「ずれる」を、絞り込みキーワードとしてキーワードランキング手段202に送信する。なお、関連キーワードに含まれる「印刷」は、検索キーワード45と同一であるので、共起しているか否かの判定の対象外とする。
キーワードランキング手段202は、キーワード別共起判定手段201から送られた絞り込みキーワードの順位付けを行う(ステップS208)。順位付の基準は、例えば、五十音順であるが、他の基準で順位付を行ってもよい。続いて、キーワード提示手段30は、表示件数範囲内の絞り込みキーワードを、ステップS208で定められた順位に従って表示する(ステップS209)。
図6は、事例データ検索手段50による検索結果、およびキーワード別共起判定手段201に生成されキーワードランキング手段202に順位付けされた絞り込みキーワードを表示する表示画面の例を示す説明図である。図6に示す例では、「汚れる」、「詰まる」、「異常」、「ずれる」がキーワードランキング手段202によって五十音順に順位付けされた場合を示している。すなわち、キーワードの先頭語を対象として、あ行の先頭(「あ」)を最も順位を高くし、わ行の最後尾語(「を」)を最も順位を低くする。ただし、濁音および半濁音を、非濁音とみなす。なお、図6では、ステップS204で提示される検索結果と、ステップS209で提示される絞り込みキーワードとを同一画面内に表示する場合を示している。
ユーザが検索結果の中に所望の事例データを見つけられなかった場合、ユーザは、図6に例示する画面に表示された絞り込みキーワード(すなわち検索キーワードの候補)を用いて、検索操作を続ければよい。
以下、ステップS209で提示される絞り込みキーワードを用いて、さらに検索を進める場合について説明する。この場合、ステップS202以降の動作を行う。ステップS202〜S206の動作は、既に説明した動作と同様である。ここでは、ユーザが、図6に示される絞り込みキーワードのうち、「詰まる」を検索キーワードとして選択した場合を例にして説明する。図7は、絞り込みキーワードを用いてさらに検索を進める場合の動作を示す説明図である。
絞り込みキーワードのうち「詰まる」が選択され、検索キーワードとしてキーワード選択入力手段40に入力される(ステップS202)。キーワード選択入力手段40は、この検索キーワードを、事例データ検索手段50と履歴管理手段203とに送信する。事例データ検索手段50は、キーワード選択入力手段40に入力された検索キーワード「詰まる」を含む事例データを検索し、検索結果(本例では、図7に示す事例1、事例2および事例3とする。)をキーワード別共起判定手段201に送信し(ステップS203)、また、その検索結果を事例データ提示手段60送信し、事例データ提示手段60は、検索結果をユーザへ提示する(ステップS204)。履歴管理手段203は、キーワード選択入力手段40から送られた検索キーワード「詰まる」を、入力された順序が判別可能となるように記憶する。このとき、履歴管理手段203は、図7に示す検索キーワード220を記憶する(ステップS205)。すなわち、最初に入力された検索キーワード「印刷」と、二番目に入力された検索キーワード「詰まる」とを、入力順が判別可能となるように記憶する。
続くステップS206では、キーワード別共起判定手段201は、検索結果に含まれる「事例1」、「事例2」および「事例3」(図7参照。)から既に抽出されていて関連キーワードテーブル80に記憶されている関連キーワード42,43,44を参照する。
次にステップS207で、キーワード別共起判定手段201は、「事例1」、「事例2」および「事例3」に対応する各関連キーワード42,43,44に含まれる各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている各検索キーワード(図7に示す例では「印刷」、「詰まる」)と共起しているか否かを判定する。図7に例示する関連キーワード42,43,44では、「印刷」を含む関連キーワードの組を太枠で囲んで示している。図7に例示する関連キーワード42,43,44に含まれるキーワードは、「印刷」、「紙」、「トナー」、「汚れる」、「詰まる」、「交換」、「異常」、「ずれる」等がある。キーワード別共起判定手段201は、これらの各キーワードについて、履歴管理手段203の1番目に登録されている「印刷」と共起しているか否かを判定し、図7に示す判定結果46を導く。ただし、各関連キーワード(本例では、関連キーワード42,43,44)に含まれる各キーワードのうち、履歴管理手段203に登録されていて判定に用いている検索キーワードと一致するキーワードは、共起しているか否かの判定の対象外とする。図7では、履歴管理手段203に記憶されている検索キーワードと共起している場合を「1」で示し、共起していない場合を「0」で示している。「印刷」と対になるキーワードは、「汚れる」、「詰まる」、「異常」、「ずれる」である(図7に示す関連キーワード42,43,44における太枠で囲んだ範囲を参照。)。従って、1番目に登録されている「印刷」と共起しているか否かの判定結果として、図7に示す判定結果46が導かれる。なお、関連キーワード42,43,44に含まれるキーワードのうち「印刷」は、判定している検索キーワードと一致するので、共起しているか否かの判定の対象外とする。
同様に、キーワード別共起判定手段201は、関連キーワード42,43,44に含まれるキーワード毎に、そのキーワードが、履歴管理手段203の2番目に登録されている「詰まる」と共起しているか否かを判定する。このとき、関連キーワード42,43,44に含まれるキーワードのうち「詰まる」は、判定している検索キーワードと一致するので、共起しているか否かの判定の対象外とする。キーワード別共起判定手段201は、この判定により、図7に示す判定結果221を得る。すなわち、「詰まる」と共起しているキーワードとして「紙」と「印刷」を得る。キーワード別共起判定手段201は、履歴管理手段203に記憶されているいずれかの検索キーワードと共起していれば、検索キーワードとの共起関係があると判定し、検索キーワードと共起しているか否かの判定結果として、判定結果222を得る。ただし、履歴管理手段203に登録されている個々の検索キーワード毎に共起しているキーワードの判定を行うときには、その検索キーワードと同一のキーワードは、共起しているか否かの判定の対象外とされる。従って、判定結果222では、ユーザに入力された検索キーワード「印刷」および「詰まる」は、検索キーワードと共起しているか否かの判定の対象外とされる。
キーワード別共起判定手段201は、検索キーワードと共起していると判定したキーワードを、絞り込みキーワードとしてキーワードランキング手段202に送信する。図7に例示する判定結果222が得られた場合、キーワード別共起判定手段201は、「紙」、「汚れる」、「異常」、「ずれる」の4つの絞り込みキーワードを送信する。
キーワードランキング手段202は、キーワード別共起判定手段201から送信された絞り込みキーワードの順位付けを行い(ステップS208)、キーワード提示手段30は、その順位に従って、絞り込みキーワードを表示する(ステップS209)。図8は、事例データ検索手段50による検索結果、およびキーワード別共起判定手段201に生成されキーワードランキング手段202に順位付けされた絞り込みキーワードを表示する表示画面の例を示す説明図である。図8に示す例では、「紙」、「汚れる」、「異常」、「ずれる」の4つのキーワードを五十音順に順位付けた場合の例を示している。
図8では、図7に例示する判定結果222を導いてから表示される表示画面の例を示したが、検索キーワード毎に各キーワードが共起しているか否かを判定する度に、絞り込みキーワードを表示してもよい。図9は、検索キーワード毎に各キーワードが共起しているか否かを判定する度に絞り込みキーワードを表示する場合の表示画面の例を示す説明図である。すなわち、図9に例示する表示画面では、まず、図7に例示する判定結果46が導出された後、絞り込みキーワード91を表示する。この場合、キーワード別共起判定手段201は、判定結果46を導出したときに、共起していると判定されたキーワードのうち、履歴管理手段203に登録されていない各キーワード(本例では、「異常」、「ずれる」、「汚れる」)をキーワードランキング手段202に送信する。キーワードランキング手段202は、キーワード別共起判定手段201から送信された絞り込みキーワードの順位付けを行い、キーワード提示手段30は、その順位に従って、絞り込みキーワード91(図9参照。)を表示する。次に、図7に例示する判定結果221が導出された後、絞り込みキーワード92を表示する。この場合、キーワード別共起判定手段201は、判定結果221を導出したときに、共起していると判定されたキーワードのうち、履歴管理手段203に登録されていない各キーワード(本例では「紙」)をキーワードランキング手段202に送信する。キーワードランキング手段202は、キーワード別共起判定手段201から送信された絞り込みキーワードの順位付けを行い、キーワード提示手段30は、その順位に従って、絞り込みキーワード92(図9参照。)を表示する。
以上のように、本実施の形態によれば、検索対象データに対して、ユーザが入力したキーワードと関連性の高いキーワード(絞り込みキーワード)が提示され、ユーザの情報検索を支援することができる。例えば、ユーザが「印刷」というキーワードで検索した際に、印刷が、「異常」なのか、「ずれる」のか、「詰まる」のか、「汚れる」のかという、印刷がどうしたのかという関連性のある絞り込みキーワードを使って、事例データの絞り込みが可能になる。このとき、「交換」という紙やトナーがどうしたのかというキーワード(印刷に関連性のないキーワード)は表示されないため、ユーザは、検索に用いる検索キーワードを選択しやすい。
本実施の形態において、検索対象とするコンテンツは、受付事例データや障害事例データに限らず、論文や書籍等の文字情報コンテンツであればどのような種類であっても適用可能である。
実施の形態2.
図10は、本発明の第2の実施の形態による情報検索支援システムの構成例を示すブロック図である。第1の実施の形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。ただし、第2の実施の形態では、キーワードランキング手段202の動作が第1の実施の形態と異なる。
第2の実施の形態では、キーワードランキング手段202は、ステップS208において、直近のステップS204で検索された事例データを事例データ検索手段に問い合わせて、直近の検索結果(検索された事例データ)を得る。そして、キーワードランキング手段202は、キーワード別共起判定手段201から送られた絞り込みキーワードが、直近のステップS204で検索された事例データのうちいくつの事例に含まれているかを計算する。このとき、キーワードランキング手段202は、キーワード別共起判定手段201から送られた絞り込みキーワード毎に、絞り込みキーワードが含まれている事例数を集計する。なお、1つの事例データに1つの絞り込みキーワードが何回登場しているかは問題にしない。すなわち、ある事例データに絞り込みキーワードが1回だけ登場していても複数回登場していても、「事例数1件分」として集計する。キーワードランキング手段202は、多くの事例データに含まれている順に絞り込みキーワードを順位付ける。
図5および図11を参照して具体例を示す。図11は、絞り込みキーワードを含む事例数の集計結果および絞り込みキーワードの順位付け結果の具体例を示す説明図である。図5に示す判定結果46が導かれた場合、キーワード別共起判定手段201からキーワードランキング手段202に送信される絞り込みキーワードは、「汚れる」、「詰まる」、「異常」および「ずれる」である。「汚れる」は事例1だけに含まれているため(図5参照。)、キーワードランキング手段202は、「汚れる」について事例数1件と集計する。「詰まる」は、事例1、事例2および事例3に含まれているため(図5参照。)、キーワードランキング手段202は、「詰まる」について事例数3件と集計する。「異常」は、事例2および事例3に含まれているため、キーワードランキング手段202は、「異常」について事例数2件と集計する。「ずれる」は、事例3だけに含まれているため、キーワードランキング手段202は、「ずれる」について事例数1件と集計する。この結果、キーワードランキング手段202は、各絞り込みキーワードを含む事例数の集計結果として、図11(a)に示す集計結果を得る。そして、キーワードランキング手段202は、多くの事例データに含まれている順に絞り込みキーワードを順位付け、図11(b)に示す順位付け結果を得る。すなわち、「詰まる」、「異常」、「汚れる」、「ずれる」の順に順位を付ける。
キーワードランキング手段202は、絞り込みキーワードと絞り込みキーワードの順位付け結果をキーワード提示手段30に送信して、キーワード提示手段30が例えば図12のように表示する(ステップS209)。図12は、事例データ検索手段50による検索結果、およびキーワード別共起判定手段201に生成されキーワードランキング手段202に順位付けされた絞り込みキーワードを表示する表示画面の例を示す説明図である。本例では、図12に示すように、「詰まる」、「異常」、「汚れる」、「ずれる」の順に絞り込みキーワードが表示される。また、図12に示すように、絞り込みキーワードが含まれている事例数とともに絞り込みキーワードを表示してもよい。
本実施の形態によれば、ユーザの入力した検索キーワードとの間で、多くの事例データで共起関係が発生しており、検索キーワードとの関連性が強い絞り込みキーワードを、順位の高い絞り込みキーワードとして(優先的に提示すべき絞り込みキーワードとして)ユーザに提示できる。
また、上記の例では、多くの事例データに含まれている順に絞り込みキーワードを順位付ける場合を説明したが、キーワードランキング手段202は、集計結果の数の少ない順に絞り込みキーワードを順位付けてもよい。また、集計結果の数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。
実施の形態3.
図13は、本発明の第3の実施の形態による情報検索支援システムの構成例を示すブロック図である。第1の実施の形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。ただし、第3の実施の形態では、キーワードランキング手段202および履歴管理手段203の動作が第1の実施の形態と異なる。
図14は、本実施の形態において履歴管理手段203が記憶する情報の例を示す説明図である。本実施の形態において、履歴管理手段203は、例えば、図14(a)に示すように、時刻と、ユーザを識別するユーザIDと、ユーザIDによって特定されるユーザから入力された検索キーワードとを対応付けて記憶する。なお、個々ののユーザから入力された検索キーワードは、そのユーザによって入力された順序が判別可能となるように記憶される。そして、履歴管理手段203は、図14(b)に示すように、記憶している全ての種類のキーワード毎に、キーワードの利用回数(キーワードが検索キーワードとしてキーワード選択入力手段40に入力された回数)を集計し、記憶する。
図14(a)に例示する時刻は、例えば、アプリケーション(情報検索支援システム)の立ち上げ時刻であってもよいし、あるいは、個々のユーザが情報検索支援システムにログインした時刻であってもよい。あるいは、個々のユーザがキーワード選択入力手段40に第1番目の検索キーワードを入力した時刻であってもよい。
第3の実施の形態では、キーワードランキング手段202は、ユーザに利用された頻度の高いキーワード(検索キーワードとして入力された頻度の高いキーワード)の順に、絞り込みキーワードを順位付ける。例えば、キーワードランキング手段202は、各絞り込みキーワードが過去に検索キーワードして利用された回数を、履歴管理手段203に問い合わせ、その利用回数が多い順に絞り込みキーワードを順位付ける。
図5および図15を参照して具体例を示す。図15は、第3の実施の形態における絞り込みキーワードの順位付け結果の具体例を示す説明図である。図5に示す判定結果46が導かれた場合、キーワード別共起判定手段201からキーワードランキング手段202に送信される絞り込みキーワードは、「汚れる」、「詰まる」、「異常」および「ずれる」である。キーワードランキング手段202は、これら4つのキーワードが検索キーワードとして利用された回数を履歴管理手段203に問い合わせる。履歴管理手段203は、キーワードランキング手段202からの問い合わせに応じて、各キーワードの利用回数をキーワードランキング手段202に通知する。例えば、図14(b)に示す利用回数の集計結果を記憶している場合、キーワードランキング手段202からの問い合わせに応じて、「汚れる」、「詰まる」、「異常」および「ずれる」の利用回数をそれぞれキーワードランキング手段202に通知する。キーワードランキング手段202は通知された利用回数が多い順に、絞り込みキーワードを順位付け、図15に例示するような順位付け結果を導く。
その後、キーワードランキング手段202は、絞り込みキーワードと絞り込みキーワードの順位付け結果をキーワード提示手段30に送信して、キーワード提示手段30は、定められた順番に絞り込みキーワードを表示する(ステップS209)。
本実施の形態によれば、様々なユーザに検索キーワードとしてよく利用されたことのある絞り込みキーワードを、順位の高い絞り込みキーワードとして(優先的に提示すべき絞り込みキーワードとして)ユーザに提示できる。
なお、履歴管理手段203は、記憶しているキーワードの利用回数の修正をユーザID毎に行ってもよい。そして、キーワードランキング手段202からの問い合わせに応じて、特定のユーザのキーワードの利用回数を通知してもよい。例えば、現在、情報検索支援システムにログインして検索操作を行っているユーザのキーワードの利用回数を通知してもよい。あるいは、別のユーザによるキーワードの利用回数を通知してもよい。
また、履歴管理手段203は、キーワードランキング手段202からの問い合わせがあったときに、その問い合わせ時刻から所定時間前までの時刻に対応して記憶されているキーワード毎に、キーワードの利用回数を集計して、記憶し、問い合わせに応じて、その集計によって導出された利用回数を通知してもよい。
また、上記の例では、利用回数が多い順に絞り込みキーワードを順位付ける場合を説明したが、キーワードランキング手段202は、利用回数の少ない順に絞り込みキーワードを順位付けてもよい。また、利用回数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。
実施の形態4.
図16は、本発明の第4の実施の形態による情報検索支援システムの構成例を示すブロック図である。第1の実施の形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。ただし、第4の実施の形態の情報検索支援システムは、第1の実施の形態における構成要素の他に、外部ログ管理手段204を備える。また、キーワードランキング手段202の動作が第1の実施の形態と異なる。
外部ログ管理手段204は、本発明の情報検索支援システムとは別のシステム(図示せず。)で蓄積された外部ログに記述されているキーワード毎に、キーワードの出現回数(外部ログに出現している回数)を集計した値を記憶する。図17(a)は、外部ログに記述されている全キーワード毎のキーワードの出現回数の集計値の例を示す説明図である。外部ログ管理手段204は、図17(a)に例示するようにキーワード毎の出現回数を記憶する。
外部ログ管理手段204は、別のシステムで蓄積された外部ログに記述されている全キーワード毎のキーワードの出現回数を集計した値を、本発明の情報検索支援システムの管理者によって入力され、入力された集計値を記憶してもよい。あるいは、外部ログ管理手段204は、別のシステムで蓄積された外部ログを本発明の情報検索支援システムの管理者によって入力され、その外部ログを参照して、外部ログに記述されている全キーワード毎のキーワードの出現回数を集計し、集計した結果を記憶してもよい。また、外部ログ管理手段204は、通信ネットワークを介して別のシステムに外部ログを要求し、外部ログを別のシステムから受信してもよい。そして、受信した外部ログを参照して、外部ログに記述されている全キーワード毎のキーワードの出現回数を集計し、集計した結果を記憶してもよい。
外部ログの例として、例えば、別のコールセンタや受付センタで使われていた検索ログ等が挙げられる。
第4の実施の形態では、キーワードランキング手段202は、外部ログにおける出現頻度の高い順に、絞り込みキーワードを順位付ける。キーワードランキング手段202は、外部ログ管理手段204に記憶された各キーワードの出現回数を参照することによって、絞り込みキーワードと同一のキーワードに対応する出現回数を参照する。そして、外部ログ管理手段204に記憶されている出現回数が多い順に、絞り込みキーワードを順位付ける。
図5、図16および図17を参照して具体例を示す。外部ログ管理手段204が図17(a)に例示する各キーワードの出現回数を記憶しているものとする。図5に示す判定結果46が導かれた場合、キーワード別共起判定手段201からキーワードランキング手段202に送信される絞り込みキーワードは、「汚れる」、「詰まる」、「異常」および「ずれる」である。キーワードランキング手段202は、これら4つの絞り込みキーワードと同一のキーワードに対応する出現回数を参照する。「汚れる」、「詰まる」、「異常」および「ずれる」の各キーワードに対応するそれぞれの出現回数は、187回、101回、49回、0回である(図17(a)参照。)。キーワードランキング手段202は、この出現回数の値の大きい順に、絞り込みキーワードを順位付ける。図17(b)は、本実施の形態における絞り込みキーワードの順位付け結果の具体例を示す説明図である。本例では、キーワードランキング手段202は、図17(b)に示すように、「ずれる」、「異常」、「汚れる」、「詰まる」の順に絞り込みキーワードを順位付ける。
その後、キーワードランキング手段202は、絞り込みキーワードと絞り込みキーワードの順位付け結果をキーワード提示手段30に送信して、キーワード提示手段30は、定められた順番に絞り込みキーワードを表示する(ステップS209)。
本実施の形態によれば、特定の分野でよく利用された順番に、絞り込みキーワードをユーザに提示することができる。例えば、外部ログとして、コールセンタや受付センタで使われていた検索ログを用いた場合、コールセンタや受付センタなどの特定分野でよく使われるキーワードを優先的にユーザに提示することができる。
また、上記の例では、外部ログ管理手段204に記憶されている出現回数が多い順に絞り込みキーワードを順位付ける場合を説明したが、外部ログ管理手段204に記憶されている出現回数が少ない順に絞り込みキーワードを順位付けてもよい。また、出現回数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。
実施の形態5.
図18は、本発明の第5の実施の形態による情報検索支援システムの構成例を示すブロック図である。第4の実施の形態と同様の構成要素については、図16と同一の符号を付し、説明を省略する。ただし、第5の実施の形態では、キーワードランキング手段202の動作が第4の実施の形態と異なる。
第5の実施の形態では、キーワードランキング手段202は、複数の順位付けの態様を組み合わせて、絞り込みキーワードの順位付けを行う。例えば、第2の実施の形態で示したキーワードを含む事例数に基づく順位付けと、第3の実施の形態で示した履歴管理手段203に記憶された利用回数に基づく順位付けと、第4の実施の形態で示した外部ログでの出現回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行う。ここでは、上記の3種類の順位付けを組み合わせる場合を例に説明するが、2種類の順位付けを組み合わせてもよい。例えば、第2の実施の形態で示したキーワードを含む事例数に基づく順位付けと、第3の実施の形態で示した履歴管理手段203に記憶された利用回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行ってもよい。あるいは、第2の実施の形態で示したキーワードを含む事例数に基づく順位付けと、第4の実施の形態で示した外部ログでの出現回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行ってもよい。あるいは、第3の実施の形態で示した履歴管理手段203に記憶された利用回数に基づく順位付けと、第4の実施の形態で示した外部ログでの出現回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行ってもよい。
複数の順位付けの態様を組み合わせて絞り込みキーワードの順位付けを行う場合、キーワードランキング手段202は、それぞれの順位付けの態様において、順位付けられた各絞り込みキーワードに対してスコアを算出しておく。スコアは、順位に応じた値になるように算出する。例えば、順位が高い絞り込みキーワードほどスコアが高くなるようにスコアを算出する。そして、キーワードランキング手段202は、各順位付けの態様におけるスコアを用いて絞り込みキーワード毎に評価値を算出し、評価値によって絞り込みキーワードの順位付けを決定する。評価値は、例えば、各順位付け態様におけるスコアの和として算出する。
以下の説明では、第2の実施の形態で示したキーワードを含む事例数に基づく順位付けと、第3の実施の形態で示した履歴管理手段203に記憶された利用回数に基づく順位付けと、第4の実施の形態で示した外部ログでの出現回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行う場合を例にして説明する。
以下、スコアや評価値を算出して絞り込みキーワードを順位付ける例を示す。図19は、各絞り込み態様において算出された各絞り込みキーワードのスコアの例を示す説明図である。ここでは、キーワード共起判定手段201からキーワードランキング手段202に絞り込みキーワードとしてKW1〜KW11が送信されたとする。
キーワードランキング手段202は、第2の実施の形態と同様に、ステップS208において、直近のステップS204で検索された事例データを事例データ検索手段に問い合わせて、直近の検索結果(検索された事例データ)を得る。そして、キーワードランキング手段202は、キーワード別共起判定手段201から送られた絞り込みキーワードが、直近のステップS204で検索された事例データのうちいくつの事例に含まれているかを計算する。そして、キーワードランキング手段202は、多くの事例データに含まれている順に絞り込みキーワードを順位付ける。そして、個々の絞り込みキーワード毎に計算した絞り込みキーワードが含まれている事例数の和で、個々の絞り込みキーワードが含まれている事例数を除算した値をスコアとして算出する。図19(a)に示す例では、個々の絞り込みキーワード毎に計算した絞り込みキーワードが含まれている事例数の和は、1494となる。KW1が含まれている事例数は319である。従って、キーワードランキング手段202は、KW1のスコアを0.214(=319/1494)と算出する。キーワードランキング手段202は、KW2〜KW11についても同様にスコアを求める。このようにして求められたスコアは、図19(a)に示すようになる。
また、キーワードランキング手段202は、第3の実施の形態と同様に、各絞り込みキーワードが過去に検索キーワードして利用された回数を、履歴管理手段203に問い合わせ、その利用回数が多い順に絞り込みキーワードを順位付ける。この場合、履歴管理手段203は、第3の実施の形態と同様の情報を記憶する。例えば、履歴管理手段203は、図14に例示する情報を記憶する。キーワードランキング手段202は、個々のキーワードの利用回数の和で、個々のキーワードの利用回数を除算した値をスコアとして算出する。図19(b)に示す例では、個々のキーワードの利用回数の和165である。KW1の利用回数は35であるので、キーワードランキング手段202は、KW1のスコアを0.212(=35/165)と算出する。キーワードランキング手段202は、KW2〜KW11についても同様にスコアを求める。このようにして求められたスコアは、図19(b)に示すようになる。
さらに、キーワードランキング手段202は、第4の実施の形態と同様に、外部ログ管理手段204に記憶された各キーワードの出現回数を参照することによって、絞り込みキーワードと同一のキーワードに対応する出現回数を参照する。そして、外部ログ管理手段204に記憶されている出現回数が多い順に、絞り込みキーワードを順位付ける。そして、各絞り込みキーワードの外部ログでの出現数の和で、個々の絞り込みキーワードの出現数を除算した値をスコアとして算出する。図19(b)に示す例では、各絞り込みキーワードの外部ログでの出現数の和は、468である。また、外部ログでのKW1の出現数は101である。従って、キーワードランキング手段202は、KW1のスコアを0.216(=101/468)と算出する。キーワードランキング手段202は、KW2〜KW11についても同様にスコアを求める。このようにして求められたスコアは、図19(c)に示すようになる。
キーワードランキング手段202は、各絞り込みキーワード毎に、3種類のスコアの総和を算出し、その値を評価値とする。例えば、絞り込みキーワードKW1の評価値は、上記の0.214、0.212、0.216の和として算出する。他の絞り込みキーワードKW2〜KW11に関しても同様に評価値を算出する。そして、評価値の高い順に絞り込みキーワードを順位付ける。図20は、このように決定した絞り込みキーワードの順位の例を示す説明図である。
その後、キーワードランキング手段202は、絞り込みキーワードと絞り込みキーワードの順位付け結果をキーワード提示手段30に送信して、キーワード提示手段30は、定められた順番に絞り込みキーワードを表示する(ステップS209)。
本実施の形態によれば、ユーザの入力した検索キーワードとの間で、多くの事例データで共起関係が発生していたり、様々なユーザに検索キーワードとしてよく利用されていたり、特定の分野でよく利用されているキーワードを、順位の高い絞り込みキーワードとして(優先的に提示すべき絞り込みキーワードとして)ユーザに提示できる。
なお、キーワードを含む事例数に基づく順位付けでは、事例数の多い順に順位付けしても、少ない順に順位付けしてもよい。また、事例数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。履歴管理手段203に記憶された利用回数に基づく順位付けでは、利用回数の多い順に順位付けしても、少ない順に順位付けしてもよい。また、利用回数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。外部ログでの出現回数に基づく順位付けでは、出現回数の多い順に順位付けしても、少ない順に順位付けしてもよい。また、出現回数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。
実施の形態6.
第6の実施の形態の情報検索支援システムの構成は、第1の実施の形態の構成(図1参照。)と同様である。また、第6の実施の形態の情報検索支援システムの動作も、図2に示すフローチャートで表される。ただし、関連キーワード抽出手段10とキーワード別共起判定手段201の動作が、実施の形態1と異なる。
また、本実施の形態では、情報検索支援システムは、意味グループを記憶する。「意味グループ」とは、特定の事項に関連するキーワードの集合である。例えば、「異常箇所」という事項に関連する「ドラム」、「紙」、「用紙」、「印刷」、「給紙」、「印字」、「カセット」、「トナー」等の集合が1つの意味グループとなる。また、例えば、「症状」という事項に関連する「詰まる」、「取り除く」、「ずれる」、「消える」、「薄い」、「止まる」、「汚れる」等の集合が1つの意味グループとなる。各意味グループは、どのような事項に関するグループであるのかという情報と、その意味グループに属するキーワードの集合とが対応づけられて記憶される。意味グループは、関連キーワード抽出手段10によって参照される。意味グループは、予め、例えば、事例データベース70か、あるいは事例データベース70以外の記憶装置(図示せず。)に登録されている。各意味グループは、予め人手で、特定の事項に関連するキーワード(例えば、「異常箇所」に関連するキーワードや「症状」に関するキーワード)を辞書化することによって作成し、その意味グループを事例データベース70(あるいは、他の記憶装置)に登録しておけばよい。関連キーワード抽出手段10は、事例データから一対のキーワードを抽出したときに、その一方が予め定められた所定の意味グループに属し、他方が予め定められた別の所定の意味グループに属している場合に、その一対のキーワードを関連するキーワードとして関連キーワードテーブル80に記憶させる。
以下、図1および図2を参照して、本実施の形態の情報検索支援システムの動作について説明する。関連キーワード抽出手段10は、事例データベース70に蓄積されている各事例データを解析し、各事例データに含まれている関連するキーワードを抽出し、個々の事例データから抽出した関連するキーワードを関連キーワードテーブル80に登録する(ステップS201)。
ステップS201において、関連キーワード抽出手段10が行う解析処理は、図21に示すフローチャートで示される。図21に示すステップS301〜S303の処理は、図3(a)に示すステップS301〜S303と同様である。関連キーワード抽出手段10は、自然文で書かれた事例データに対して係り受け解析を行い、係り受けの発生している2つの文字列を、1つの文字列グループとする(ステップS301)。関連キーワード抽出手段10は、1つの文字列グループとした2つの文字列について、例えば形態素解析を行うことによって、文字列を単語に分割する(ステップS302)。続いて、関連キーワード抽出手段10は、分割した単語の中らから不要な単語(不要な品詞)を除外する(ステップS303)。ステップS303では、少なくとも助詞、助動詞、接続詞を除外する。
次に、関連キーワード抽出手段10は、文字列グループ内で、係り受けのある各文字列から分割した単語のうち、除外されずに残った単語(以下、抽出キーワードと記す。)の組み合わせを抽出する(ステップS1704)。ただし、1つの組み合わせを構成する抽出キーワードは2つとする。すなわち、2つの抽出キーワードを組み合わせて、1つの組み合わせとする。関連キーワード抽出手段10は、係り受け関係にある文字列のうち修飾する側の文字列から得られた抽出キーワードと、係り受け関係にある文字列のうち修飾される側の文字列から得られた抽出キーワードとを組み合わせて、1つの組み合わせとする。ステップS1704において、抽出される抽出キーワードの組み合わせは、1つに限定されるわけではなく、複数の組み合わせが抽出されてもよい。
次に、関連キーワード抽出手段10は、ステップS1704で抽出した各組み合わせを構成している抽出キーワードが、どの意味グループに属しているのかを判定する(ステップS1705)。このとき、関連キーワード抽出手段10は、事例データベース70(あるいは他の記憶装置でもよい。)に登録されている意味グループを参照して、各抽出キーワードがどの意味グループに属しているのかを判定すればよい。
そして、関連キーワード抽出手段10は、ステップS1704で抽出した抽出キーワードの各組み合わせの中から、一方の抽出キーワードが予め定められた所定の意味グループに属し、他方の抽出キーワードが予め定められた別の所定の意味グループに属している組み合わせを選択する。関連キーワード抽出手段10は、選択した組み合わせを構成している対になっている抽出キーワードを関連キーワードとして関連キーワードテーブル80に記憶させる(ステップS1706)。
関連キーワード抽出手段10は、上述のような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出する。
図22は、第6の実施の形態における関連キーワード抽出の具体例を示す説明図である。図22に示すように、意味グループ180として、「異常箇所」に関連する意味グループおよび「症状」に関連する意味グループが登録されているものとする。そして、関連キーワード抽出手段10がステップS1704の処理において、図22に示す抽出キーワードの各組み合わせ32を抽出しているものとする。図22に示す各組み合わせ32において、抽出キーワードKW1は、係り受け関係にある文字列のうち修飾する側の文字列から得られた抽出キーワードであり、抽出キーワードKW2は、係り受け関係にある文字列のうち修飾される側の文字列から得られた抽出キーワードである。本例では、係り受け関係にある文字列のうち修飾する側の文字列から得られた抽出キーワードが「異常箇所」に関連する意味グループに属し、係り受け関係にある文字列のうち修飾される側の文字列から得られた抽出キーワードが「症状」に関連する意味グループに属している場合、その2つの抽出キーワードが互いに関連するキーワードであるものとする。例えば、修飾する側の文字列から得られた抽出キーワード「ドラム」は、「異常箇所」に関連する意味グループに属し、修飾される側の文字列から得られた抽出キーワード「詰まる」は、「症状」に関連する意味グループに属している。従って、関連キーワード抽出手段10は、「ドラム」および「詰まる」を関連キーワード181として関連キーワードテーブル80に記憶させる。関連キーワード抽出手段10は、同様に、「紙」および「詰まる」の組み合わせや、「用紙」および「取り除く」の組み合わせも関連キーワード181として関連キーワードテーブル80に記憶させる。このとき、関連キーワード抽出手段10は、対になるキーワードがどの意味グループに属するのかを識別できるように関連キーワードを関連キーワードテーブル80に記憶させる。例えば、2つの意味グループに分けて関連キーワードを関連キーワードテーブル80に記憶させる。図22では、関連キーワードである「ドラム」および「詰まる」を関連キーワードテーブル80に記憶させるときに、「ドラム」は「異常箇所」のグループに属するキーワードとして記憶させ、「詰まる」は「症状」に関連するキーワードとして記憶させている。「紙」および「詰まる」の組み合わせや、「用紙」および「取り除く」の組み合わせについても同様である。
また、図22に示す各組み合わせ32のうち、例えば、「詰まる」および「取り除く」の組み合わせについては、修飾する側の文字列から得られた抽出キーワード「詰まる」が「異常箇所」に関連する意味グループに属していない。従って、関連キーワード抽出手段10は、「詰まる」および「取り除く」の組み合わせを関連キーワードとせず、関連キーワードテーブル80に記憶させない。「すぐ」および「詰まる」等の組み合わせについても同様である。
また、特開2006−65366号公報の段落[0032]に記載されているように、キーワード抽出の際に、キーワードの後ろ近傍に出現する助詞によってキーワードの主題らしさを計算し、主題らしいと判定されるキーワードを所定の事項に関連するグループのキーワードとし、そのキーワードと係り受け関係にあるキーワードを他の所定の事項に関連するグループに属するキーワードとして、その2つのキーワードを関連キーワードとして関連キーワードテーブル80に記憶させてもよい。例えば、主題らしいと判定されるキーワードを「異常箇所」に関連するグループのキーワードとし、そのキーワードと係り受け関係にあるキーワードを「症状」に関連するグループのキーワードとして、その2つのキーワードを関連キーワードとして関連キーワードテーブル80に記憶させてもよい。
図21では、係り受け関係を利用して関連キーワードを抽出する場合を示したが、他の態様で関連キーワードを抽出してもよい。
例えば、関連キーワード抽出手段10は、句読点で区切られる文字列(読点に挟まれる文字列、あるいは読点および句点に挟まれる文字列)を1つの文字列グループとして関連キーワードを抽出してもよい。この場合、関連キーワード抽出手段10は、句読点で区切られる文字列をそれぞれ1つの文字列グループとする。そして、関連キーワード抽出手段10は、各文字列グループに属する文字列(句読点で区切られる文字列)を、例えば形態素解析を行うことによって、単語に分割し、不要な単語(不要な品詞。少なくとも、助詞、助動詞および接続詞。)を除外する。そして、除外されずに残った単語を抽出キーワードとする。関連キーワード抽出手段10は、抽出キーワードを用いて、2つの抽出キーワードの組み合わせを生成する。このとき生成される組み合わせの数は1つに限定されない。関連キーワード抽出手段10は、生成した組み合わせの中から、一方の抽出キーワードが予め定められた所定の意味グループに属し、他方の抽出キーワードが予め定められた別の所定の意味グループに属している組み合わせを選択する。関連キーワード抽出手段10は、選択した組み合わせを構成している対になっている抽出キーワードを関連キーワードとして関連キーワードテーブル80に記憶させる。このような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出してもよい。
また、例えば、個々の単語と、その個々の単語からの距離が閾値範囲内である単語との組み合わせを関連キーワードとして抽出してもよい。この場合、関連キーワード抽出手段10は、例えば形態素解析を行うことによって事例データを単語に分割し、不要な単語(不要な品詞。少なくとも、助詞、助動詞および接続詞。)を除外する。そして、除外されずに残った単語を抽出キーワードとする。そして、関連キーワード抽出手段10は、抽出キーワード毎に、その個々の抽出キーワードからの距離が閾値範囲内である抽出キーワードを取り出し、2つの抽出キーワードからなる抽出キーワードの組み合わせを生成する。関連キーワード抽出手段10は、生成した組み合わせの中から、一方の抽出キーワードが予め定められた所定の意味グループに属し、他方の抽出キーワードが予め定められた別の所定の意味グループに属している組み合わせを選択する。関連キーワード抽出手段10は、選択した組み合わせを構成している対になっている抽出キーワードを関連キーワードとして関連キーワードテーブル80に記憶させる。このような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出してもよい。
第1の実施の形態と同様に、関連キーワード抽出手段10は、関連キーワードを関連キーワードテーブル80に登録するときに、どの事例データから抽出された関連キーワードであるのかを識別できるように関連キーワードを登録する。
事例データ毎に関連キーワードを抽出して、関連キーワードテーブル80に登録することによって、前処理であるステップS201が完了する。
続いて、ユーザがキーワードを使って事例データを検索するときの情報検索支援システムの動作を説明する。ステップS202〜S205(図2参照。)の動作は、第1の実施の形態と同様であるので説明を省略する。
ステップS203において、キーワード別共起判定手段201には、事例データ検索手段50による検索結果である事例データが、事例データ検索手段50から送られる。キーワード別共起判定手段201は、関連キーワードテーブル80に記憶されている各事例データ毎の関連キーワードのうち、検索結果である事例データから抽出された関連キーワードを参照する(ステップS206)。すなわち、キーワード別共起判定手段201は、検索結果である事例データから抽出された関連キーワードを調べる(ステップS206)。
そして、キーワード別共起判定手段201は、検索された事例データに対応する関連キーワードに属する各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている検索キーワードと共起しているか否かを判定する(ステップS207)。第6の実施の形態では、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードであれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。この点は、第1の実施の形態と同様である。さらに本実施の形態では、関連キーワードに属する各キーワードのうち、履歴管理手段203に記憶されている検索キーワードと同じ意味グループに属しているキーワードも、履歴管理手段203に記憶されている検索キーワードと共起しているキーワードであると判定する。すなわち、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードがどの意味グループに属しているかを判定し、関連キーワードに属する各キーワードのうち、その意味グループに属しているキーワードは、全て共起していると判定する。なお、関連キーワード抽出手段10は、対になるキーワードがどの意味グループに属するのかを識別できるように関連キーワードを関連キーワードテーブル80に記憶させる。例えば、2つの意味グループに分けて関連キーワードを関連キーワードテーブル80に記憶させる。従って、キーワード別共起判定手段201は、関連キーワードテーブル80を参照することによって、各キーワードがどの意味グループに属しているのかを判断することができる。
キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワードを、絞り込みキーワード(検索キーワードの候補)としてキーワードランキング手段202に送信する。
図23は、第6の実施の形態における共起関係の有無の判定の具体例を示す説明図である。ユーザからキーワード選択入力手段40に検索キーワード「印刷」が入力され、履歴管理手段203は、検索キーワード195(図23参照。本例では「印刷」。)を記憶しているものとする。また、また、ステップS204では、事例データ検索手段50が、検索キーワード「印刷」を含む事例データを、事例データベース70に記憶されている全事例データ190(図23参照。)の中から検索し、図23に示す「事例1」、「事例2」および「事例3」を含む検索結果をキーワード別共起判定手段201に出力しているものとする。また、前処理であるステップS201によって、事例1から抽出された関連キーワード192、事例2から抽出された関連キーワード193、および事例3から抽出された関連キーワード194が、関連キーワードテーブル80に記憶されたものとする。また、関連キーワード192,193,194は、2つの意味グループ(本例では「異常箇所」の意味グループおよび「症状」の意味グループ)に分けて記憶されているものとする。ステップS206で、キーワード別共起判定手段201は、検索結果191に含まれる「事例1」、「事例2」および「事例3」から抽出済みであって関連キーワードテーブル80に記憶されている関連キーワード192,193,194を参照する。すなわち、検索結果191に含まれる事例データから抽出されていた関連キーワードを調べる。
ステップS207では、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワード195の意味グループを判定する。本例では、検索キーワード195と同一のキーワード「印刷」が、「異常箇所」の意味グループとして関連キーワードテーブル80に登録されているので、キーワード別共起判定手段201は、検索キーワード195の意味グループが、「異常箇所」の意味グループであると判定する。次に、キーワード別共起判定手段201は、関連キーワード192,193,194に属する各キーワードのうち、履歴管理手段203に記憶されている検索キーワード195と同一の意味グループに属するキーワードは全て、履歴管理手段203に記憶されている検索キーワード195と共起していると判定する。本例では、「印刷」と同じ意味グループに属する「紙」、「トナー」は、「印刷」と共起していると判定される。また、キーワード別共起判定手段201は、関連キーワード192,193,194に属するキーワードのうち、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードがあれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。この点は、第1の実施の形態と同様であり、本例では、「汚れる」、「詰まる」、「異常」、「ずれる」が、「印刷」と共起していると判定する(図23に示す関連キーワード192,193,194における太枠で囲んだ範囲を参照。)。
キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワード195と、関連キーワードとの共起の有無の判定を行い、判定結果197を導く。図23に示す例では、各意味グループ毎に意味グループを分けて、判定結果を示している。図23に示す判定結果195では、履歴管理手段203に記憶されている検索キーワード45と共起している場合を「1」で示し、共起していない場合を「0」で示している。
キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワードを、絞り込みキーワードとしてキーワードランキング手段202に送信する。図23に示す判定結果197が得られた場合、キーワード別共起判定手段201は、「異常箇所」の意味グループに属する「紙」、「トナー」、および「症状」のグループに属する「汚れる」、「詰まる」、「異常」、「ずれる」をキーワードランキング手段202に送信する。
キーワードランキング手段202は、送信された絞り込みキーワードを第1の実施の形態と同様に順位付けする(ステップS208)。例えば、五十音順に順位付けする。このとき、キーワードランキング手段202は、絞り込みキーワードの順位付を意味グループ毎に行ってもよい。続いて、キーワード提示手段30は、表示件数範囲内の絞り込みキーワードを、ステップS208で定められた順位に従って表示する(ステップS209)。キーワード提示手段30は、意味グループ毎に分けて、絞り込みキーワードを表示してもよい。例えば、「異常箇所」の意味グループに属する「紙」、「トナー」と、「症状」のグループに属する「汚れる」、「詰まる」、「異常」、「ずれる」とをそれぞれ分けて、ステップS208で定められた順番で、「異常箇所」の意味グループの絞り込みキーワードと、「症状」のグループの絞り込みキーワードを表示してもよい。
また、キーワードランキング手段202による順位付けは、第2の実施の形態、第3の実施の形態、第4の実施の形態、あるいは第5の実施の形態と同様に行ってもよい。以下、一例として、キーワードランキング手段202が、第2の実施の形態と同様に、事例検索手段50に問い合わせを行い、送信されたキーワードがいくつの事例に含まれているかを計算し、事例数を使って順位付けする場合の例を示す。
キーワードランキング手段202は、キーワード別共起判定手段201から送信された絞り込みキーワード毎に事例数を集計する。ここでは、意味グループ毎に絞り込みキーワードの事例数を集計するものとする。図24は、各意味グループにおける絞り込みキーワードを含む事例の数の集計結果の例を示す説明図である。図24(a)に示すように、「異常箇所」の意味グループに属する絞り込みキーワード「紙」、「トナー」を含む事例の数は、それぞれ2,1であったとする。また、図24(b)に示すように、「症状」の意味グループに属する「詰まる」、「異常」、「汚れる」、「ずれる」を含む事例の数は、それぞれ3,2,1,1であったとする。キーワードランキング手段202は、各意味グループ毎に、集計した事例数の多い順に絞り込みキーワードの順位付を行う。「異常箇所」の意味グループでは、「紙」、「トナー」の順に順位付を行う。また、「症状」の意味グループでは、「詰まる」、「異常」、「汚れる」、「ずれる」の順に順位付を行う。
キーワードランキング手段202は、キーワードとキーワードのランキング結果をキーワード提示手段30に送信して、キーワード提示手段30が例えば図25のように絞り込みキーワードを表示する。図25は、第6の実施の形態における絞り込みキーワードの表示例を示す説明図である。本例のように、事例数に基づいて順位付が行われた場合、図25に示すように、絞り込みキーワードが含まれている事例数とともに絞り込みキーワードを表示してもよい。
本実施の形態によれば、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードであれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。従って、入力された検索キーワードに対して、関連のあるキーワードを絞り込みキーワードとして表示することができる。例えば、「異常箇所」の意味グループの検索キーワードに対して、関連のある「症状」の意味グループのキーワードを絞り込みキーワードとして提示したり、逆に「症状」の意味グループの検索キーワードに対して、関連のある「異常箇所」の意味グループのキーワードを絞り込みキーワードとして提示することができる。このように、ユーザが入力した検索キーワードと意味的に関連性の高いキーワードを選択的に提示することができる。また、履歴管理手段203に記憶されている検索キーワードと同じ意味グループに属しているキーワードも、履歴管理手段203に記憶されている検索キーワードと共起しているキーワードであると判定する。従って、同一の意味グループに属するキーワードも絞り込みキーワードとして提示することができ、検索キーワードと同種のトピックに関するキーワードを絞り込みキーワードとして提示することができる。例えば、ユーザは、一度異常箇所に関するキーワードを選択した後に、続けて、別の異常箇所に関するキーワードを選択することができるため、複数の異常箇所が存在している場合にでも簡単に事例を検索することができる。
上記の各実施の形態において、関連キーワード抽出手段10、キーワード生成手段20および事例データ検索手段50は、例えば、プログラムに従って動作するCPUによって実現される。
また、情報検索支援システムは、各構成要素を含む1台の装置として実現されていてもよい。この場合、その情報検索支援システムは、例えば、CPUに関連キーワード抽出手段10、キーワード生成手段20および事例データ検索手段50としての動作を実行させる情報検索支援プログラムを搭載する。
あるいは、関連キーワード抽出手段10をバックエンドとする構成であってもよい。例えば、キーワード生成手段20、事例データ検索手段50、キーワード提示手段30、キーワード選択入力手段40、および事例データ提示手段60を含む情報検索支援装置を備え、バックエンドとして、事例データベース70、関連キーワード抽出手段10、および関連キーワードテーブル80を含む関連キーワード抽出装置とを備えた構成であってもよい。この場合、情報検索支援装置は、例えば、CPUにキーワード生成手段20および事例データ検索手段50としての動作を実行させる情報検索支援プログラムを搭載すればよい。そして、バックエンドとなる関連キーワード抽出装置は、例えば、CPUに関連キーワード抽出手段10としての動作を実行させる関連キーワード抽出プログラムを搭載すればよい。
上記の各実施の形態において、データベースは、事例データベース70によって実現される。データ検索手段は、事例データ検索手段50によって実現される。共起判定手段は、キーワード別共起判定手段201によって実現される。キーワードランキング手段は、キーワードランキング手段202によって実現される。履歴管理手段は、履歴管理手段203によって実現される。外部ログ管理手段は、外部ログ管理手段204によって実現される。事例データは、検索対象データに相当する。