WO2015181962A1

WO2015181962A1 - 検索方法及び装置並びに記憶媒体

Info

Publication number: WO2015181962A1
Application number: PCT/JP2014/064455
Authority: WO
Inventors: 千種　健太郎; 土田　正士; 幸生中野
Original assignee: 株式会社日立製作所
Priority date: 2014-05-30
Filing date: 2014-05-30
Publication date: 2015-12-03
Also published as: JP6216873B2; JPWO2015181962A1; US20170116189A1; US10311111B2

Abstract

【課題】　検索結果の回答の精度を向上させ得る検索方法及び装置並びに記憶媒体を提案する。【解決手段】　それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と問合せの内容が類似する対応履歴文書を検索する検索装置が、複数の対応履歴文書を内容に応じて複数のクラスタに分類し、クラスタごとに、当該クラスタの代表となる対応履歴文書を代表文書として抽出し、問合せ文と関連を有する対応履歴文書を検索し、当該検索により検出した対応履歴文書が属するクラスタの代表文書を検索結果として提示するようにした。

Description

検索方法及び装置並びに記憶媒体

　本発明は検索方法及び装置並びに記憶媒体に関し、例えば、コールセンタなどにおいて顧客からの問合せに対する回答を作成するにあたり、過去の対応履歴文書の中からその問合せに類似する内容の対応履歴文書を検索する検索装置に適用して好適なものである。

　顧客とのコンタクトを記録し、その内容を分析し、以後の顧客対応や製品開発などに活用する事例がある。このような事例自体は以前から存在するが、ビッグデータの活用例として、顧客と顧客から製品に対する問合せを受け付けるコールセンタとのやり取りをすべて記録した文書（問合せ／途中経過／最終回答を全て含むテキストであり、以下、これを対応履歴文書と呼ぶ）の分析及び活用が注目を浴びている。例えば、上記のようなコールセンタでは過去の対応履歴文書を、新たな問合せに対する適切な解決策を求める際に利用している。

特開２００７－３０４７９３号公報

　ところで、コールセンタ等の問題解決担当者は顧客からの新規の問合せに対する回答を作成するにあたり、過去の対応履歴文書から回答の参考となる類似の事例を探すために、まず、検索システム等でキーワード等を入力し、そのキーワードを含む過去の対応履歴文書を検索する。次に検索の結果の中から類似すると思われる過去の対応履歴文書の詳細を読む。そして、読んだ対応履歴文書が新規の問合せに対して有用かを判断するという履歴探索プロセスを実行している。

　このうち検索プロセスではシステム等で過去の類似する対応履歴文書を検索し、この後の確認プロセス、選択プロセス及び判断プロセスでその検索結果から回答作成に有効な対応履歴文書があるかを見極める。見極めた結果、新規の問合せに対して参考になるような対応履歴文書が存在すればその対応履歴文書を参考に回答を作成するが、存在しない場合には、検索条件を変えるなどして、再度、上述の履歴探索プロセスを実行する。

　顧客からの問合せに対して短時間で有効な回答を作成するためには、この履歴探索プロセスの実行回数を減らすことが望まれる。そして、履歴探索プロセスの実行回数を減らすためには、検索結果の回答の精度を上げることが求められる。

　この場合において、かかる履歴探索プロセスの実行回数を減らすことを目的とした発明は従来から存在する。例えば、特許文献１では、問題解決担当者と顧客とのやり取りの内容からキーワードを機械的に抽出し、そのキーワードを含む過去の対応履歴文書を検索することで、問題解決担当者による検索プロセスを省略し、履歴探索プロセス自体を短くすることを目的としている。

　しかしながら、このような従来技術によると、検索結果の回答の精度が問題解決担当者と顧客とのやり取りの内容の表現形態に依存することになる。すなわち、特許文献１に開示された技術によれば、抽出されたキーワードを含む文書を検索するため、問合せ内容に関連が深い過去履歴であっても、キーワードが一致又は類似していなければ検索の結果としてヒットせず、その結果、再度履歴探索プロセスを実行することになる。

　本発明は以上の点を考慮してなされたもので、検索結果の回答の精度を向上させ得る検索方法及び装置並びに記憶媒体を提案しようとするものである。

　かかる課題を解決するため本発明においては、それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置において実行される検索方法であって、前記検索装置が、複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する第１のステップと、前記検索装置が、前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する第２のステップと、前記検索装置が、前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する第３のステップとを設けるようにした。

　また本発明においては、それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置において、複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する対応履歴文書分類部と、前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する代表文書抽出部と、前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する文書検索部とを設けるようにした。

　さらに本発明においては、それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置に実行させるプログラムが格納された記憶媒体であって、前記検索装置に、複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する第１のステップと、前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する第２のステップと、前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する第３のステップとを備える処理を実行させるプログラムを格納するようにした。

　本検索方法及び本検索装置と、本記憶媒体に格納されたプログラムとによれば、問合せ文と関連を有する対応履歴文書が属するクラスタの代表文書を提示するため、問合せ文における問合せ内容の表現形態等に依存することなく、問合せ文と関連が深い問合せ内容の対応履歴文書を提示することができる。

　本発明によれば、検索結果の回答の精度を向上させ得る検索方法及び装置並びに記憶媒体を実現できる。

第１及び第２の実施の形態による検索装置の全体構成を示すブロック図である。対応履歴文書の構成例を示す図である。対応履歴文書の構成例を示す図である。対応履歴文書の構成例を示す図である。グラフの構成例を示す概念図である。クラスタの説明に供する概念図である。代表文書の説明に供する概念図である。文書間関連情報の構成例を示す概念図である。対応履歴文書間関連作成処理の処理手順を示すフローチャートである。類似度スコア一覧の構成例を示す概念図である。対応履歴文書検索処理の処理手順を示すフローチャートである。検索文入力画面の構成例を示す略線図である。第２の実施の形態による文書間関連情報を示す概念図である。第２の実施の形態による対応履歴文書間関連作成処理の処理手順を示すフローチャートである。第３の実施の形態による検索装置の全体構成を示すブロック図である。参照履歴情報の構成例を示す概念図である。第３の実施の形態による対応履歴文書間関連作成処理の処理手順を示すフローチャートである。第３の実施の形態による対応履歴文書間関連作成処理の説明に供する図表である。第３の実施の形態による対応履歴文書間関連作成処理の説明に供する図表である。第３の実施の形態による対応履歴文書検索処理の処理手順を示すフローチャートである。第４の実施の形態による検索装置の全体構成を示すブロック図である。第４の実施の形態による対応履歴文書検索処理の処理手順を示すフローチャートである。他の実施の形態の説明に供する概念図である。

　以下図面について、本発明の一実施の形態を詳述する。

（１）第１の実施の形態
（１－１）本実施の形態による検索装置の構成
　図１において、１は全体として本実施の形態による検索装置を示す。この検索装置１は、ＣＰＵ（Central Processing Unit）２、メモリ３、記憶装置４、ネットワークインタフェース５、外部記憶媒体ドライブ６、入力装置７及び表示装置８を備えて構成され、これらが内部バス９を介して相互に接続されている。

　ＣＰＵ２は、検索装置１全体の動作制御を司るプロセッサである。またメモリ３は、例えば揮発性の半導体メモリから構成され、オペレーティングシステム（ＯＳ：Operating System）１０を始めとする各種プログラムなどを保持するために利用される。後述の文書管理部１１、文書間関連管理部１２及び検索実行部１３もこのメモリ３に格納されて保持される。またメモリ３は、ＣＰＵ２のワークメモリとしても用いられる。このためメモリ３には、ＣＰＵ２が各処理の実行時に利用するワークエリア１４が設けられている。

　記憶装置４は、例えばハードディスク装置やＳＳＤ（Solid State Drive）などから構成され、プログラムやデータを長期間保存するために利用される。本実施の形態の場合、記憶装置４には、過去のすべての対応履歴文書を含む対応履歴文書情報１５と、後述する文書間関連情報１６となどが格納される。

　なお、本実施の形態における「対応履歴文書」とは、顧客からの問合せの内容を表す問合せ文とその問合せに対する回答とを含み、その一例として問合せ案件単位で下記の項目を記録した文書（テキスト）であり、以下の内容を含む。
１．問合せ（顧客からコールセンタのオペレータ等の担当者への連絡内容）
２．資料採取依頼（担当者から顧客への連絡内容）
３．資料（顧客から担当者への連絡内容）
４．調査依頼（担当者から製品部署への連絡内容）
５．調査回答（製品部署から担当者への連絡内容）
６．最終回答（担当者から顧客への連絡内容）

　また対応履歴文書は、問合せに対する担当者からの確認、質問及び又は依頼などや、これらに対する顧客からの回答を含む場合もある。さらに対応履歴文書は、ひとつの対応履歴文書に複数の問合せと複数の回答とを含む場合もある。図２～図４にこのような対応履歴文書の構成例を示す。

　ネットワークインタフェース５は、例えばＮＩＣ（Network Interface Card）などから構成され、ネットワーク１７を介した他の通信機器との通信時におけるプロトコル制御を行う。また外部記憶媒体ドライブ６は、例えば、ＣＤ（Compact Disk）若しくはＤＶＤ（Digital Versatile Disk）などのディスク媒体、又は、ＳＤカードなどの半導体メモリカードといった、可搬性の記憶媒体１８に対するドライブであり、ＣＰＵ２の制御の下に、装填された記憶媒体１８に対してデータを読み書きする。

　入力装置７は、例えばキーボードやマウスなどから構成され、ユーザが各種情報やコマンドを入力するために利用される。また表示装置８は、例えば、液晶ディスプレイ装置などから構成され、各種情報や各種ＧＵＩ（Graphical User Interface）を表示するために利用される。

（１－２）検索装置に搭載された各種機能
　次に、本検索装置１に搭載されたデータ検索に関する各種機能について説明する。本検索装置１には、過去の対応履歴文書をその内容に応じて複数のクラスタに分類すると共に、クラスタごとに、そのクラスタの代表となる対応履歴文書（以下、これを代表文書と呼ぶ）をそれぞれ抽出する対応履歴文書間関連作成機能が搭載されている。

　実際上、本検索装置１は、過去のすべての対応履歴文書を対応履歴文書情報１５として記憶装置４に保持している。そして検索装置１は、定期的（例えば１週間又は１か月）に、又は、入力装置７を介して入力されたユーザからの指示に応じて非定期に、記憶装置４に格納された対応履歴文書情報１５に含まれる対応履歴文書同士でその対応履歴文書に含まれる文字の成分比較（いわゆる概念検索）を行い、対応履歴文書同士の類似の度合を数値としてそれぞれ算出する。以下においては、この数値を類似度スコアと呼ぶものとする。

　また検索装置１は、算出した類似度スコアが予め設定された閾値（以下、これを類似度スコア閾値と呼ぶ）以上の対応履歴文書間の関連構造を作成する。本実施の形態の場合、検索装置１は、対応履歴文書間の関連構造として、例えば図５に示すようなグラフ２０を作成する。このグラフ２０は、類似度スコアが類似度スコア閾値以上の対応履歴文書を表すノード２１同士をエッジ２２と呼ばれる線で繋いだものである。

　さらに検索装置１は、このようにして作成したグラフ２０に対して、各対応履歴文書に含まれる文字列の特徴ごとに分類する、いわゆるクラスタリングを行うことにより、図６に示すように、対応履歴文書情報１５に含まれるすべての対応履歴文書を複数のクラスタ２３に分類する。そして検索装置１は、この後、個々のクラスタ２３について、そのクラスタ２３に属する対応履歴文書の中から１つの対応履歴文書を代表文書して抽出する。

　ここで、本実施の形態における「代表文書」とは、そのクラスタ内で他の対応履歴文書との関連を表す計算値の高い（本実施の形態では、そのクラスタ内で他の対応履歴文書との関連数が最も多い）対応履歴文書のことを指す。例えば、クラスタに属する対応履歴文書のうち、そのクラスタ内のより多くの対応履歴文書に記述されている回答を含む対応履歴文書が存在する場合、その対応履歴文書がそのクラスタの代表文書となる。具体的には、あるクラスタに図７に示すような４つの対応履歴文書２４Ａ～２４Ｄのみが属する場合、対応履歴文書２４Ａ～２４Ｃにそれぞれ記述されている回答を含む対応履歴文書２４Ｄがそのクラスタの代表文書となる。

　一方、検索装置１には、顧客からの問合せに対する回答例の検索指示が与えられた場合に、その問合せに内容が類似する問合せについての対応履歴文書を検索し、その対応履歴文書が属するクラスタの代表文書等をその検索結果としてユーザに提示する対応履歴文書検索機能も搭載されている。

　実際上、検索装置１は、コールセンタのオペレータや問題解決担当者などのユーザにより入力装置７が操作されて、顧客からの問合せ内容を表す問合せ文と、その問合せに対する回答例の検索指示とが入力されると、当該問合せ文と類似する内容の問合せについての対応履歴文書を概念検索により検索する。

　そして検索装置１は、この検索により問合せ文と最も内容が類似する問合せについての対応履歴文書を検出すると、その対応履歴文書が属するクラスタの代表文書のテキストを表示する画面へのリンクと、当該代表文書と問合せ内容が類似する対応履歴文書（例えば図５において代表文書のノード２１とエッジ２２を介して接続された各ノード２１と対応する対応履歴文書）のテキストをそれぞれ表示する各画面へのリンクとが掲載された検索結果画面を表示装置８に表示する。

　例えば図７の例の場合、「サーバのバックアップが所定時間内に終わらない」といった問合せ文や、「バックアップが予定通り終了しない」といった問合せ文に対して、問合せ文と類似する内容の対応履歴文書として対応履歴文書２４Ａ～２４Ｄのいずれかが検出された場合、この対応履歴文書２４Ａ～２４Ｄが属するクラスタの代表文書である対応履歴文書２４Ｄのテキストを表示する画面へのリンクと、当該対応履歴文書２４Ｄと問合せ内容が類似する対応履歴文書２４Ａ～２４Ｃのテキストをそれぞれ表示する各画面へのリンクとが表示された検索結果画面が表示装置８に表示されることになる。

　以上のような対応履歴文書間関連作成機能及び対応履歴文書検索機能（以下、適宜、この２つの機能をまとめてデータ検索機能と呼ぶ）を実現するための手段として、図１に示すように、検索装置１のメモリ３には対応履歴文書分類部１９及び検索実行部１３が格納され、記憶装置４には文書間関連情報１６が格納されている。

　対応履歴文書分類部１９は、記憶装置４に格納された対応履歴文書情報に含まれる対応履歴文書を分類する機能を有するプログラムであり、文書管理部１１及び文書間関連管理部１２を備えて構成される。

　文書管理部１１は、対応履歴文書情報に含まれる対応履歴文書同士の関連を抽出する機能を有するモジュールである。この文書管理部１１は、対応履歴文書管理部３０及び対応履歴文書関連算出部３１を備えて構成される。

　対応履歴文書管理部３０は、対応履歴文書のデータを対応履歴文書情報１５として記憶装置４に書き込んだり、当該対応履歴文書情報１５に含まれる対応履歴文書のデータをメモリ３のワークエリア１４に読み込み、又は、対応履歴文書情報１５から不要な対応履歴文書を削除するなど、対応履歴文書の管理を行うモジュールである。また対応履歴文書関連算出部３１は、対応履歴文書同士の関連を上述の類似度スコアとして算出するモジュールである。

　また文書間関連管理部１２は、記憶装置４に格納された対応履歴文書を分類（クラスタリング）する機能を有するモジュールである。この文書間関連管理部１２は、関連構造作成部３２及び関連構造分析部３３を備えて構成される。

　関連構造作成部３２は、文書管理部１１の対応履歴文書関連算出部３１により算出された対応履歴文書間の類似度スコアに基づいて、図５について上述したグラフ２０を作成し、作成したグラフ２０を文書間関連情報１６として記憶装置４に格納するモジュールである。また関連構造分析部３３は、記憶装置４に格納された文書間関連情報１６に基づいて、対応履歴文書を複数のクラスタに分類する機能を有するモジュールである。

　検索実行部１３は、ユーザから与えられた顧客からの問合せ文に類似する問合せ内容の対応履歴文書を対応履歴文書情報１５上で検索し、検出した対応履歴文書が属するクラスタの代表文書のテキストを表示する画面等へのリンクを含む検索結果画面を表示装置８に表示させる機能を有するプログラムである。この検索実行部１３は、検索文受付・解析部３４及び文書検索部３５を備えて構成され、文書検索部３５は、さらに類似文書検索部３６、類似クラスタ検出部３７及び代表文書抽出部３８を備えて構成される。

　このうち検索文受付・解析部３４は、入力装置７を介してユーザにより入力された顧客からの問合せの問合せ文を受け付ける機能を有するモジュールである。また類似文書検索部３６は、検索文受付・解析部３４が受け付けた問合せ文と類似する対応履歴文書を対応履歴文書情報１５上で検索する機能を有するモジュールである。

　さらに類似クラスタ検出部３７は、上述の検索により検出された対応履歴文書が含まれるクラスタを特定する機能を有するモジュールであり、代表文書抽出部３８は、文書間関連管理部１２の関連構造分析部３３の分析結果に基づいて各クラスタの代表文書を抽出したり、類似クラスタ検出部３７により特定されたクラスタの代表文書を抽出等する機能を有するモジュールである。

　なお以下においては、各種処理の処理主体を「モジュール」として説明するが、そのモジュールに基づいてＣＰＵ２（図１）がその処理を実行することは言うまでもない。

　一方、文書間関連情報１６は、文書間関連管理部１２の関連構造作成部３２により作成され、記憶装置４に格納された対応履歴文書の関連構造（グラフ構造）と、文書間関連管理部１２の関連構造分析部３３により実行されたクラスタリングの結果とを保持するために利用される情報である。

　この文書間関連情報１６は、図８に示すように、エッジＩＤ欄１６Ａ、始点ノードＩＤ欄１６Ｂ、終点ノードＩＤ欄１６Ｃ及びクラスタ番号欄１６Ｄを備えるテーブル構造を有する。そしてエッジＩＤ欄１６Ａには、図５について上述したグラフ２０の各エッジ２２にそれぞれ付与された識別子（エッジＩＤ）が格納される。

　また始点ノードＩＤ欄１６Ｂには、対応するエッジ２２の始点側に接続されるノード２１に付与された識別子（以下、これをノードＩＤと呼ぶ）が格納され、終点ノードＩＤ欄１６Ｃには、対応するエッジ２２の終点側に接続されるノード２１に付与されたノードＩＤが格納される。

　ただし、本実施の形態においては、図５からも明らかなように、対応履歴文書間の関連構造として無向グラフを用いており、エッジ２２の始点及び終点という概念がないため、対応するエッジ２２に接続される２つのノード２１のうちの任意の一方のノード２１のノードＩＤが始点ノードＩＤ欄１６Ｂに格納され、他方のノード２１のノードＩＤが終点ノードＩＤ欄１６Ｃに格納されるだけであり、ノード２１がエッジ２２の始点及び終点のいずれが接続されているかは特に意味をもたない。

　さらにクラスタ番号欄１６Ｄには、対応するエッジ２２の終点側に接続されるノード２１と対応付けられた対応履歴文書が属するクラスタの識別番号（クラスタ番号）が格納される。

　なお、後述のように、文書間関連情報１６の各レコード（行）の情報のうち、エッジＩＤ欄１６Ａ、始点ノードＩＤ欄１６Ｂ及び終点ノードＩＤ欄１６Ｃの情報は文書管理部１１の対応履歴文書関連算出部３１により登録され、クラスタ番号欄１６Ｄの情報は文書間関連管理部１２の関連構造分析部３３により登録される。

（１－３）対応履歴文書間関連作成処理
　図９は、上述の対応履歴文書間関連作成機能に関連して対応履歴文書分類部１９及び検索実行部１３により実行される対応履歴文書間関連作成処理の具体的な処理手順を示す。この対応履歴文書間関連作成処理は、定期的に又はユーザからの処理実行指示を受けて非定期に実行される。

　対応履歴文書間関連作成処理では、まず、文書管理部１１の対応履歴文書管理部３０が、記憶装置４に格納された対応履歴文書情報１５に含まれる１つの対応履歴文書をメモリ３のワークエリア１４に読み込み、その旨を対応履歴文書関連算出部３１に通知する（ＳＰ１）。

　対応履歴文書関連算出部３１は、対応履歴文書管理部３０からのかかる通知を受信すると、ワークエリア１４に読み込まれた対応履歴文書（以下、これを対象対応履歴文書と呼ぶ）と、これ以外のすべての対応履歴文書との文字の成分比較（概念検索）をそれぞれ実行し、その類似度スコアをそれぞれ算出する（ＳＰ２）。この結果、このステップＳＰ２の処理が完了した段階で、図１０に示すような類似度スコア一覧４０がメモリ３のワークエリア１４上に作成される。

　次いで、対応履歴文書関連算出部３１は、ステップＳＰ２で算出した対象対応履歴文書との類似度スコアが類似度スコア閾値（例えば70）以上のすべての対応履歴文書について、対象対応履歴文書との関連を文書間関連情報１６（図８）にそれぞれ登録する（ＳＰ３）。

　具体的に、対応履歴文書関連算出部３１は、対象対応履歴文書に対応するノード２１の識別子（ノードＩＤ）を文書間関連情報１６の始点ノードＩＤ欄１６Ｂ（図８）に格納すると共に、対象対応履歴文書と類似度スコアが類似度スコア閾値以上の対応履歴文書に対応するノード２１のノードＩＤを文書間関連情報１６の終点ノードＩＤ欄１６Ｃ（図８）に格納し、これら対象対応履歴文書及び対応履歴文書にそれぞれ対応付けられたノード２１間を接続するエッジ２２に付与されるエッジＩＤを文書間関連情報１６のそのレコードのエッジＩＤ欄１６Ａに格納するようにして、これらの対応履歴文書を文書間関連情報１６に登録する。

　さらに対応履歴文書関連算出部３１は、対応履歴文書情報１５に含まれるすべての対応履歴文書を対象対応履歴文書としてステップＳＰ１～ステップＳＰ３の処理を実行し終えたか否かを判断する（ＳＰ４）。

　そしてこの判断で否定結果が得られた場合、その旨を対応履歴文書関連算出部３１が対応履歴文書管理部３０に通知し、この後、対応履歴文書管理部３０がステップＳＰ１でメモリ３のワークエリア１４に読み込む対応履歴文書を未処理の他の対応履歴文書に順次切り替えながら、ステップＳＰ１～ステップＳＰ４の処理が繰り返される。

　やがて、対応履歴文書情報１５に含まれるすべての対応履歴文書を対象対応履歴文書としてステップＳＰ１～ステップＳＰ３の処理を実行し終えることによりステップＳＰ４で肯定結果が得られると、その旨が文書間関連管理部１２の関連構造作成部３２に通知される。そしてこの通知を受信した関連構造作成部３２は、記憶装置４に格納されている文書間関連情報１６に基づいて、対応履歴文書間の関連構造として、図５について上述したグラフ２０を作成し、その旨を関連構造分析部３３に通知する（ＳＰ５）。

　そして、この通知を受信した関連構造分析部３３は、ステップＳＰ５で作成されたグラフ２０を参照して、各エッジ２２をそれぞれ介して接続された２つのノード２１にそれぞれ対応する各対応履歴文書に対して文字列の特徴量分析（いわゆるクラスタリング）を実行することにより該当する対応履歴文書を複数のクラスタに分類する。そして関連構造分析部３３は、このクラスタリング結果に基づいて、文書間関連情報１６の各レコードのクラスタ番号欄１６Ｄ（図８）に、対応するエッジ２２の終点側に接続されたノード２１と対応付けられた対応履歴文書が振り分けられたクラスタのクラスタ番号を格納し、この後、その旨を検索実行部１３の代表文書抽出部３８に通知する（ＳＰ６）。

　代表文書抽出部３８は、関連構造分析部３３からのかかる通知を受信すると、ステップＳＰ６で作成された各クラスタの代表文書をそれぞれ抽出する（ＳＰ７）。本実施の形態の場合、代表文書抽出部３８は、クラスタごとに、接続されたエッジ２２の数がそのクラスタ内で最も多いノード（中心性解析における次数中心性が最も高いノード）２１と対応する対応履歴文書をそのクラスタの代表文書として抽出する。

　以上の処理により、クラスタごとの代表文書が抽出され、この後、この対応履歴文書間関連作成処理が終了する。

（１－４）対応履歴文書検索処理
　一方、図１１は、上述の対応履歴文書検索機能に関連して検索実行部１３により実行される対応履歴文書検索処理の具体的な処理手順を示す。この対応履歴文書検索処理は、ユーザからの検索指示を受けて実行される。

　実際上、検索実行部１３の検索文受付・解析部３４（図１）は、入力装置７を介したユーザからの検索文入力画面の表示要求が与えられると、図１２に示すような検索文入力画面５０を表示装置８に表示させる（ＳＰ１０）。

　この検索文入力画面５０は、ユーザが顧客からの問合せ文を検索文として入力するための画面であり、問合せ文入力フィールド５１及び検索ボタン５２を備えて構成される。そして検索文入力画面５０では、ユーザが入力装置７を利用して問合せ文入力フィールド５１に顧客からの問合せ文を入力し、その後、検索ボタン５２をクリックすることにより、その問合せ文を検索文とした検索の実行を検索装置１に指示することができる。

　そして検索文受付・解析部３４は、上述のようにして検索文入力画面５０に問合せ文が入力されて検索ボタン５２がクリックされると、その問合せ文を検索文として取り込み、取り込んだ検索文のデータをメモリ３のワークエリア１４に格納する（ＳＰ１１）。そして検索文受付・解析部３４は、その旨を文書検索部３５の類似文書検索部３６に通知する。

　類似文書検索部３６は、検索文受付・解析部３４からのかかる通知を受信すると、メモリ３のワークエリア１４にデータが格納されている検索文と内容が類似する問合せ文を含む対応履歴文書を概念検索で検索し、検索結果を類似クラスタ検出部３７（図１）に通知する（ＳＰ１２）。

　また類似クラスタ検出部３７は、類似文書検索部３６からのかかる通知を受信すると、ステップＳＰ１２において検出された対応履歴文書が属するクラスタのクラスタＩＤを文書間関連情報１６（図１）から取得し（ＳＰ１３）、取得したクラスタＩＤを代表文書抽出部３８に通知する（ＳＰ１４）。

　代表文書抽出部３８は、類似クラスタ検出部３７からかかるクラスタＩＤが与えられると、図９について上述した対応履歴文書間関連作成処理のステップＳＰ７で抽出した各クラスタの代表文書のうちのそのクラスタＩＤが付与されたクラスタの代表文書を取得する。そして代表文書抽出部３８は、取得した代表文書を表示する画面へのリンクと、当該代表文書と問合せ内容が類似する幾つかの対応履歴文書をそれぞれ表示する各画面へのリンクとが掲載された検索結果画面を表示装置８に表示させる（ＳＰ１４）。

　そして、この後、この対応履歴文書検索処理が終了する。

（１－５）本実施の形態の効果
　以上のように本実施の形態の検索装置１では、対応履歴文書を内容に応じて複数のクラスタに分類し、クラスタごとに、そのクラスタ内で他の対応履歴文書との関連数が最も多い対応履歴文書を代表文書として抽出し、問合せ文に類似する対応履歴文書の検索時には、当該問合せ文と関連を有する対応履歴文書を検索し、当該検索により検出した対応履歴文書が属するクラスタの代表文書を検索結果としてユーザに提示する。

　従って、本検索装置１によれば、問合せ文における問合せ内容の表現形態等に依存することなく、問合せ文と関連が深い問合せ内容の対応履歴文書を提示することができ、かくして検索結果の回答の精度を向上することができる。よって、本検索装置１を利用することによって、顧客からの問合せに対して短時間で有効な回答を提示できるようになる。

（２）第２の実施の形態
　図１において、６０は全体として第２の実施の形態による検索装置を示す。この検索装置６０は、対応履歴文書間関連作成処理において作成されるグラフ２０（図５）の各エッジ２２に、そのエッジ２２が接続する２つのノード２１とそれぞれ対応付けられた対応履歴文書同士の関連の強さに応じた重みがそれぞれ設定され、この重みを用いて対応履歴文書の各カテゴリの代表文書を抽出する点を除いて第１の実施の形態による検索装置１と同様に構成されている。

　実際上、本実施の形態の検索装置６０の場合、図１３に示すように、文書間関連情報６１には、エッジＩＤ欄６１Ａ、始点ノードＩＤ欄６１Ｂ、終点ノードＩＤ欄６１Ｃ及びクラスタ番号欄６１Ｄに加えて、重み欄６１Ｅが設けられている。そして、エッジＩＤ欄６１Ａ、始点ノードＩＤ欄６１Ｂ、終点ノードＩＤ欄６１Ｃ及びクラスタ番号欄６１Ｄには、それぞれ第１の実施の形態の文書間関連情報１６のエッジＩＤ欄１６Ａ、始点ノードＩＤ欄１６Ｂ、終点ノードＩＤ欄１６Ｃ及びクラスタ番号欄１６Ｄに格納される情報とそれぞれ同じ情報が格納される一方、重み欄６１Ｅには、対応するエッジ２２（図５）に対して付与された重みが格納される。

　本実施の形態の場合、エッジ２２に設定する重みは、そのエッジ２２が接続する２つのノード２１とそれぞれ対応付けられた対応履歴文書間の類似度スコアの１／10に設定されるものとする。ただしこれ以外の方法により各エッジの重みを設定することもできる。例えば、ユーザが顧客からの問合せに対する回答を作成する際、検索装置６０が提示した代表文書以外の複数の対応履歴文書を参照したときに、どのような順番で対応履歴文書を参照していったかというユーザの履歴探索プロセスを記憶しておき、よく辿られる（つまり一緒に参照されることが多い）対応履歴文書間のエッジ２２の重みを高くするように各エッジ２２の重みを設定するようにしても良い。この場合には、対応履歴文書間で一緒に参照された回数をそれぞれカウントしておき、そのカウント値をそのまま重みとして設定する。

　図１４は、上述のような構成を有する文書間関連情報６１を用いて実行される本実施の形態による対応履歴文書間関連作成処理の具体的な処理手順を示す。この対応履歴文書間関連作成処理は、第１の実施の形態による対応履歴文書間関連作成処理（図９）と同様に、定期的に又はユーザからの処理実行指示を受けて開始される。

　そして本実施の形態の対応履歴文書間関連作成処理では、ステップＳＰ２０～ステップＳＰ２２の処理が第１の実施の形態の対応履歴文書間関連作成処理のステップＳＰ１～ステップＳＰ３と同様に処理される。

　続いて、対応履歴文書関連算出部３１が、ステップＳＰ２２で文書間関連情報６１に登録した各エッジ２２について、そのエッジ２２が接続する２つのノード２１とそれぞれ対応付けられた対応履歴文書間の類似度スコアの値をＳとして、次式

により重みＷをそれぞれ算出し、算出した各エッジ２２の重みをそれぞれ文書間関連情報６１の対応するレコードの重み欄６１Ｅに格納する（ＳＰ２３）。

　この後、本実施の形態の対応履歴文書間関連作成処理では、ステップＳＰ２４～ステップＳＰ２６の処理が第１の実施の形態の対応履歴文書間関連作成処理のステップＳＰ４～ステップＳＰ６と同様に処理される。

　そして、さらにこの後、検索実行部６２の文書検索部６３の代表文書抽出部６４が、ステップＳＰ２６で作成した各クラスタの中心となる文書を代表文書としてそれぞれ抽出する（ＳＰ２７）。本実施の形態の場合、代表文書抽出部６４は、クラスタごとに、接続された各エッジ２２に設定された重みの平均値がそのクラスタ内で最も大きくなるノード２１に対応する対応履歴文書をそのクラスタの代表文書として抽出する。

　以上の処理により、クラスタごとの代表文書がエッジ２２の重みを加味して抽出される。そして、この後、この対応履歴文書間関連作成処理が終了する。

　以上のように本実施の形態の検索装置６０では、グラフ２０の各エッジ２２に対して、当該エッジ２２が接続する２つのノード２１とそれぞれ対応付けられた対応履歴文書同士の関連の強さに応じた重みを設定する。従って、本検索装置６０によれば、対応履歴文書間の関連をより精密に表すことができ、かくして第１の実施の形態の検索装置１と比して、検索結果の精度をより一層と向上させることができる。

（３）第３の実施の形態
　第２の実施の形態では、文書間関連情報１６に基づき作成されるグラフ２０（図５）の各エッジ２２（図５）に重みを設定することについて説明した。これに対して本実施の形態では、各対応履歴文書にその対応履歴文書の参照回数に応じた重みをそれぞれ設定し、中心性解析によって算出された各対応履歴文書の次数中心性をそれぞれその対応履歴文書の重みに基づいて補正した上で、その補正後の各対応履歴文書の次数中心性に基づいて代表文書を抽出する。このようにすることによって、実情に合致した代表文書を抽出することができる。

　図１との対応部分に同一符号を付した図１５は、このような本実施の形態による検索装置７０の構成を示す。本実施の形態の検索装置７０は、記憶装置４に対応履歴文書情報１５及び文書間関連情報１６に加えて参照履歴情報７２が格納されている点と、メモリ３に格納された検索実行部７３の文書検索部７４に参照履歴登録部７５が設けられている点と、当該文書検索部７４の代表文書抽出部７６の機能が異なる点とを除いて第１の実施の形態の検索装置１と同様に構成されている。

　図１６は、参照履歴情報７２の構成例を示す。参照履歴情報７２は、対応履歴文書ごとのユーザからの参照回数を管理するために利用される情報であり、文書ＩＤ欄７２Ａ及び参照回数欄７２Ｂを備えるテーブル構造を有する。そして文書ＩＤ欄７２Ａには、各対応履歴文書の識別子（以下、これを文書ＩＤと呼ぶ）がそれぞれ格納され、参照回数欄７２Ｂには、対応する対応履歴文書の現在までの参照回数が格納される。この参照回数は、対応する対応履歴文書が参照されるごとに文書検索部７４の参照履歴登録部７５により１ずつカウントアップされる。

　一方、図１７は、本実施の形態の検索装置７０により実行される対応履歴文書間関連作成処理の処理手順を示す。この対応履歴文書間関連作成処理では、ステップＳＰ３０～ステップＳＰ３５が図９について上述した第１の実施の形態の対応履歴文書間関連作成処理のステップＳＰ１～ステップＳＰ６と同様に処理される。

　続いて、代表文書抽出部７６が、ステップＳＰ３５で作成されたクラスタごとに、各対応履歴文書の次数中心性を算出する（ＳＰ３６）。また、この後、代表文書抽出部７６が、クラスタごとに、ステップＳＰ３６において算出した各対応履歴文書の次数中心性を正規化（全ノード数で除算）した後に、正規化した各対応履歴文書の次数中心性を参照履歴情報７２に基づいて補正し、補正結果に基づいて、そのクラスタの代表文書をそれぞれ抽出する（ＳＰ３７）。

　具体的に、代表文書抽出部７６は、ステップＳＰ３６において算出した対応履歴文書の正規化した次数中心性をＣ、参照履歴情報７２から得られるその対応履歴文書の参照回数をＲ、その対応履歴文書が属するすべての対応履歴文書の参照回数の合計値をＴＲとして、次式

により、各対応履歴文書の正規化した次数中心性の補正値Ｃ´をそれぞれ算出し、クラスタ内で正規化した次数中心性の補正値Ｃ´が最も大きい対応履歴文書をそのクラスタの代表文書として抽出する。

　例えば、あるクラスタにおいて、ステップＳＰ３６において算出した各対応履歴文書の正規化した次数中心性が図１８のような値であり、これらの対応履歴文書が属するクラスタの参照回数の合計値が100回であった場合、これら対応履歴文書の正規化した次数中心性はステップＳＰ３７においてそれぞれ図１９のように補正される。従って、補正前の段階（図１８）では「20140231_0232」という文書ＩＤの対応履歴文書の正規化した次数中心性が最も大きかったにも関わらず、補正後の段階（図１９）では「20131005_0002」という文書ＩＤの対応履歴文書の正規化した次数中心性が最も大きくなったため、ステップＳＰ３７ではこの「20131005_0002」という文書ＩＤの対応履歴文書がこのクラスタの代表文書として抽出されることになる。

　図２０は、本実施の形態の検索装置７０により実行される対応履歴文書検索処理の処理手順を示す。この対応履歴文書検索処理では、ステップＳＰ４０～ステップＳＰ４４が図１１について上述した第１の実施の形態の対応履歴文書検索処理のステップＳＰ１０～ステップＳＰ１４と同様に処理される。この結果、上述のように検索文入力画面５０（図１２）に入力された問合せ文と内容が類似する幾つかの対応履歴文書（代表文書を含む）をそれぞれ表示する画面への各リンクを含む検索結果画面が表示装置８（図１５）に表示される。

　続いて、検索結果画面上のユーザの操作を文書検索部７４の参照履歴登録部７５が監視し、当該検索結果画面においていずれかの対応履歴文書を表示する画面へのリンクがクリックされた場合に、その対応履歴文書の参照回数を１増加させるように参照履歴登録部７５が参照履歴情報７２を更新する（ＳＰ４５）。

　そして、この後、この検索結果画面がクローズされると、この対応履歴文書検索処理が終了する。

　以上のように本実施の形態の検索装置７０では、各対応履歴文書にその対応履歴文書の参照回数に応じた重みをそれぞれ設定し、中心性解析によって算出された各対応履歴文書の次数中心性をそれぞれその対応履歴文書の重みに基づいて補正した上で、その補正後の各対応履歴文書の次数中心性に基づいて代表文書を抽出する。従って、本検索装置７０によれば、実情に合致した代表文書を抽出することができるため、第１の実施の形態の検索装置１と比して、検索結果の精度をより一層と向上させることができる。

（４）第４の実施の形態
　第１の実施の形態による検索装置１では、対応履歴文書検索処理（図１１）において、概念検索の検索対象（検索文と文字の成分比較を行う対象）をすべての対応履歴文書としている。しかしながら、このようにすべての対応履歴文書を概念検索の検索対象とした場合、対応履歴文書の数に応じて処理時間が長時間化するおそれがある。

　そこで、本実施の形態においては、かかる対応履歴文書検索処理における概念検索の検索対象を対応履歴文書の各カテゴリの代表文書のみとする。このようにすることによって、検索対象の対応履歴文書数を低減させ、検索の高速化を図ることができる。

　図１との対応部分に同一符号を付して示す図２１は、このような本実施の形態による検索装置８０の構成を示す。この検索装置８０は、メモリ３に格納された検索実行部８１の文書検索部８２が類似文書検索部８３及び代表文書抽出部３８のみから構成されている点を除いて第１の実施の形態の検索装置１と同様に構成されている。

　図２２は、本実施の形態による対応履歴文書検索処理の具体的な処理手順を示す。この対応履歴文書検索処理は、ユーザからの検索指示を受けて実行される。

　そして本実施の形態の対応履歴文書検索処理では、ステップＳＰ５０及びステップＳＰ５１が第１の実施の形態の対応履歴文書検索処理（図１１）のステップＳＰ１０及びステップＳＰ１１と同様に処理される。

　次いで、類似文書検索部８３が、メモリ３のワークエリア１４にデータが格納されている検索文と類似する代表文書を概念検索で検索する（ＳＰ５２）。なお、この際の概念検索方法としては、例えばＳＱＬ（Structured Query Language）のＷＨＥＲＥ句のように条件を付けて検索する方法のほか、予め代表文書のみをまとめた文書の集合を作成し、その文書の集合のみを対象に検索する方法を適用することができる。

　この後、類似文書検索部８３が、かかる検索により検出した代表文書を表示する画面へのリンクと、当該代表文書と問合せ内容が類似する他の幾つかの対応履歴文書をそれぞれ表示する各画面へのリンクとが掲載された検索結果画面を表示装置８に表示させる（ＳＰ５３）。そして、この後、この対応履歴文書検索処理が終了する。

　以上のように本実施の形態による検索装置８０では、対応履歴文書検索処理時、対応履歴文書の各カテゴリの代表文書のみを対象として概念検索を実行する。従って、本検索装置８０によれば、検索対象の対応履歴文書数を低減させることができ、第１の実施の形態の検索装置１と比して検索の高速化を図ることができる。

（５）他の実施の形態
　なお上述の第１～第４の実施の形態においては、文書間関連管理部１２の関連構造分析部３３が作成するグラフが無向グラフである場合について述べたが、本発明はこれに限らず、関連構造分析部３３が作成するグラフが例えば図２３に示すような有向グラフ９０を作成するようにしても良い。この場合において、エッジ９２の向きは、検索元の対応履歴文書に対応するノード９１から検索により検出された対応履歴文書に対応するノード９１への向きとし、各ノード９１の次数中心性は、自ノード９１を向いているエッジ９２の数を数える入次数中心性を適用すれば良い。

　また上述の第１～第４の実施の形態においては、対応履歴文書の各クラスタの代表文書を抽出する手法として次数中心性を利用するようにした場合について述べたが、本発明はこれに限らず、例えばグラフのどの点にも近い点を表す近接中心性や、グラフにおいてどれだけ重要な役割を果たすかを表す媒介中心性など、次数中心性以外の中心性を利用して各クラスタの代表文書を抽出するようにしても良い。この場合、クラスタごとに、当該クラスタ内で他の対応履歴文書との関連を表す計算値の高い対応履歴文書を代表文書として抽出すれば良い。

　さらに上述の第１～第４の実施の形態においては、対応履歴文書の各クラスタの情報をいわゆるリレーショナルデータベースに格納するようにした場合について述べたが、本発明はこれに限らず、各クラスタの情報を例えばグラフデータベースに直接保持するようにしても良い。ただし、各クラスタの情報をリレーショナルデータベースに格納することによって、各対応履歴文書を複数のクラスタに分類する際、かかる分類をより高速に行うことができる。

　さらに上述の第１～第４の実施の形態においては、対応履歴文書間関連作成処理を定期的に又はユーザからの処理実行指示を受けて非定期に実施するようにした場合について述べたが、本発明はこれに限らず、例えば対応履歴文書が追加されるごとに対応履歴文書間関連作成処理を実行するようにしても良く、対応履歴文書間関連作成処理の実行のタイミングとしては、この他種々のタイミングを広く適用することができる。

　さらに上述の第１～第４の実施の形態においては、対応履歴文書分類部１９及び検索実行部１３，６２，７３，８１をそれぞれ別のプログラムとして作成するようにした場合について述べたが、本発明はこれに限らず、これらを１つのプログラムとして構成するようにしても良い。

　さらに上述の第２の実施の形態においては、エッジ２２に設定する重みを、類似度スコアの１／１０とするようにした場合について述べたが、本発明はこれに限らず、エッジ２２の重みの設定方法としては、この他種々の設定方法を広く適用することができる。

　さらに上述の第３の実施の形態においては、対応履歴文書が閲覧された回数をその対応履歴文書の参照回数としてカウントするようにした場合について述べたが、本発明はこれに限らず、対応履歴文書が実際にコピー及びペーストされて問合せの回答として利用された回数（コピーされた回数）をその対応履歴文書の参照回数としてカウントするようにしても良い。このようにすることによって、例えば代表文書以外の対応履歴文書が新規問合せの回答として代表文書よりも多く利用された場合に、その対応履歴文書の参照回数が増加し、当該対応履歴文書が次の代表文書として抽出されることになるため、より実情に沿った情報（顧客からの新規問合せに対する検索結果）をユーザに提供することができる。

　また、対応履歴文書が顧客からの問合せの回答に利用された回数を検索装置７０が自動的にカウントするのではなく、例えば、検索結果画面に表示された代表画面を表示する画面へのリンクや、他の対応履歴文書を表示する画面へのリンクにそれぞれ対応させて検索結果画面内にチェックボックスを設け、顧客からの問合せに実際に利用した対応履歴文書に対応するチェックボックスにユーザがチェックを入れ、そのチェックが入れられた数を対応履歴文書ごとにカウントするようにしても良い。

　さらに上述の第３の実施の形態においては、各対応履歴文書の次数中心性を正規化した後に、正規化した各対応履歴文書の次数中心性を参照履歴情報７２に基づいて補正し、補正結果に基づいて、そのクラスタの代表文書をそれぞれ抽出するようにした場合について述べたが、本発明はこれに限らず、各対応履歴文書の次数中心性を正規化することなく、各対応履歴文書の次数中心性を参照履歴情報７２に基づいて補正し、補正結果に基づいて、そのクラスタの代表文書をそれぞれ抽出するようにしても良い。

　本発明は、文書検索を実行する検索装置に広く適用することができる。

　１，６０，７０，８０……検索装置、２……ＣＰＵ、３……メモリ、４……記憶装置、７……入力装置、８……表示装置、１１……文書管理部、１２……文書間関連管理部、１３，６２，７３，８１……検索実行部、１５……対応履歴文書情報、１６，６１……文書間関連情報、１９……対応履歴文書分類部、２０，９０……グラブ、２１，９１……ノード、２２，９２……エッジ、２３……クラスタ、３０……対応履歴文書管理部、２４Ａ～２４Ｄ……対応履歴文書、２５Ａ，２５Ｂ……問合せ文、３１……対応履歴文書関連算出部、３２……関連構造作成部、３３……関連構造分析部、３４……検索文受付・解析部、３５，７４，８２……文書検索部、３６，８３……類似文書検索部、３７……類似クラスタ検出部、３８，６４，７６……代表文書抽出部、４０……類似度スコア一覧、５０……検索文入力画面、７２……参照履歴情報、７５……参照履歴登録部。

Claims

　それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置において実行される検索方法であって、
　前記検索装置が、複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する第１のステップと、
　前記検索装置が、前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する第２のステップと、
　前記検索装置が、前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する第３のステップと
　を備えることを特徴とする検索方法。
　前記第１のステップは、
　前記対応履歴文書同士の関連を算出する対応履歴文書関連算出ステップと、
　算出した前記対応履歴文書同士の関連に基づいて前記対応履歴文書の関連構造を作成する関連構造作成ステップと、
　作成した前記対応履歴文書の前記関連構造に基づいて、複数の前記対応履歴文書を複数の前記クラスタに分類する対応履歴文書分類ステップと
　を備えることを特徴とする請求項１に記載の検索方法。
　前記対応履歴文書関連算出ステップでは、
　前記対応履歴文書の文字の成分を比較する概念検索により、前記対応履歴文書間の関連を当該対応履歴文書同士の類似性の度合を表す数値として算出する
　ことを特徴とする請求項２に記載の検索方法。
　前記関連構造分析ステップでは、
　各前記対応履歴文書を、前記対応履歴文書に含まれる文字列の特徴ごとに分類するクラスタリングにより複数のクラスタに分類する
　ことを特徴とする請求項２に記載の検索方法。
　前記第３のステップでは、
　前記クラスタごとに、当該クラスタ内で他の前記対応履歴文書との関連を表す計算値の高い前記対応履歴文書を前記代表文書として抽出する
　ことを特徴とする請求項１に記載の検索方法。
　前記クラスタ内で他の前記対応履歴文書との関連数が最も多い前記対応履歴文書とは、当該クラスタ内のより多くの前記対応履歴文書に記述されている回答を含む前記対応履歴文書である
　ことを特徴とする請求項５に記載の検索方法。
　前記第１のステップは、
　前記対応履歴文書同士の関連を算出する対応履歴文書関連算出ステップと、
　算出した前記対応履歴文書同士の関連に基づいて前記対応履歴文書の関連構造を作成する関連構造作成ステップと、
　作成した前記対応履歴文書の前記関連構造に基づいて、複数の前記対応履歴文書を複数の前記クラスタに分類する対応履歴文書分類ステップと
　を有し、
　前記関連構造作成ステップでは、
　前記対応履歴文書の前記関連構造としてグラフを作成し、
　前記対応履歴文書関連算出ステップでは、
　前記グラフを構成する各エッジに対して、それぞれ算出した前記対応履歴文書同士の関連の強さ応じた重みを設定し、
　前記関連構造分析ステップでは、
　各前記エッジにそれぞれ設定された前記重みに基づいて、前記クラスタごとの前記代表文書を抽出する
　ことを特徴とする請求項５に記載の検索方法。
　各前記対応履歴文書の参照回数をそれぞれ管理し、
　前記第２のステップでは、
　前記参照回数に基づいて前記代表文書を抽出する
　ことを特徴とする請求項５に記載の検索方法。
　前記第３のステップでは、
　前記問合せ文と関連を有する前記対応履歴文書を、各前記クラスタの前記代表文書を検索対象として検索する
　ことを特徴とする請求項１に記載の検索方法。
　それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置において、
　複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する対応履歴文書分類部と、
　前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する代表文書抽出部と、
　前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する文書検索部と
　を備えることを特徴とする検索装置。
　それぞれ顧客からの問合せ及び当該問合せに対する回答を含む複数の対応履歴文書の中から、顧客からの新たな問合せの内容を表す問合せ文と前記問合せの内容が類似する前記対応履歴文書を検索する検索装置に実行させるプログラムが格納された記憶媒体であって、
　前記検索装置に、
　複数の前記対応履歴文書を内容に応じて複数のクラスタに分類する第１のステップと、
　前記クラスタごとに、当該クラスタの代表となる前記対応履歴文書を代表文書として抽出する第２のステップと、
　前記問合せ文と関連を有する前記対応履歴文書を検索し、当該検索により検出した前記対応履歴文書が属する前記クラスタの前記代表文書を検索結果として提示する第３のステップと
　を備える処理を実行させるプログラムが格納されたことを特徴とする記憶媒体。