JP2007323558A

JP2007323558A - キーワード生成装置、文書検索装置、その方法、およびそのプログラム

Info

Publication number: JP2007323558A
Application number: JP2006155693A
Authority: JP
Inventors: Tetsuo Amakasu; 哲郎甘粕; Satoshi Takahashi; 敏高橋
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2006-06-05
Filing date: 2006-06-05
Publication date: 2007-12-13

Abstract

【課題】誤認識や応対の話題に直接関係のないキーワードを選択しないようにする。
【解決手段】応対中の文字列中よりキーワードを検出し（６）、上記キーワードを出現時系列として蓄積し（１６）、別途現在の応対に直接的に関連するキーワードである関連キーワードを関連キーワード入力部９６から入力し、関連キーワード取り出し部３８がキーワード履歴から関連キーワードを取り出し、記憶し（３２）、蓄積された上記キーワードの内、出現の新しいものから順に、時間をさかのぼり、関連キーワードとキーワードとを組み合わせて、これらを検索語として含む文書を検索用データベース２１から検索し、これら文書中の最も長く連続するキーワードを生成出力する（２０）。
【選択図】図１

Description

この発明は、例えばコールセンタ、窓口業務、電子メールのやり取りによる顧客応対業務の業務支援に関するキーワードを生成する装置、その生成されたキーワードを用いて文書を検索する装置、その方法、およびそのプログラムに関するものである。

現状のコールセンタ、窓口業務、電子メールのやり取りによる顧客応対業務においては、各応対業務の流れを示したマニュアル文書、商品情報などの文書が電子的に管理されている。オペレータは応対中にそれら文書を端末上で検索、表示しながら応対業務についている。
文書の検索のためのキーボードやマウス操作の時間を極力省いて、応対時間を効率化させる、または、業務経験の浅いオペレータの検索支援を行うことを目的として、応対中の対話音声を音声認識し、そこから得られるキーワードを用いて応対用件の質問の回答案や問題解決方法などを記した文書を自動的に検索・表示を行う技術の適用が考えられる。これには、例えば特許文献１で開示されている技術がある。
特開２００１−２２９１８０号公報

応対を開始した直後の段階においては、顧客が問い合わせてくる問題については、顧客自身が的確に説明できず、曖昧さが残る説明になることが多い。よってオペレータは、顧客からの説明を受けると、用件の復唱や用件の状況を噛み砕いて確認する質問を返す問題把握応対を通して、徐々に解答すべき問題を突き止めていくことになる。

問題把握応対の段階においては、その問題についておおよそのカテゴリが判明しても、最終的な回答までにはさらなる問題の詳細な切り分けが必要である。そのため、応対の進行に伴って選択すべき回答用文書の候補は徐々に変化する。例えば、「プリンタから印刷ができない。」という質問があった場合でも、プリンタからエラーが出ているのか、パソコンの画面メッセージでエラーが出ているかで、回答の内容が大きく異なる。従って、応答用文書の検索には、オペレータの質問のたびに、つまり、応答発生の度毎に直前までの応対話題のカテゴリの推測や、文書候補の絞り込みの見直しをする必要がある。

オペレータの負担を最小限にするためには、自動検索結果となる文書のリストは的確に絞り込まれている必要がある。そのため、キーワードを元に検索する場合にはそのキーワードの組み合わせは適切に設定されている必要がある。

応対の各発話が認識され、その結果が出力されるごとに、単にキーワードを取り出すだけでは、応対の内容にはそぐわないキーワードが取り出され、結果として検索結果となる文書が応対にそぐわない文書となることがある。例えば、音声認識の誤認識結果にたまたまキーワードとなる表現が出現したことにより、現在の話題とは異なるキーワードが含まれることがある。また、正しく、音声認識できた場合でも、その応対中、局所的に本題とは関係のない内容を説明していたり、例え話のように間接的な表現で質問していた場合、その内容から得られるキーワードではうまく文書は検索できない。

誤認識を含んだ音声認識結果の中から、誤認識されたキーワードであるかそうでないかを判定する技術が前記特許文献１の段落［００５８］付近に示されている。この技術は、音声認識した文書から大局的な話題の内容を表した話題語を取り出し、キーワードの候補となる単語が話題語と上位・下位概念の関係を持っているかを調査することで、判定している。しかし、応対で扱おうとしている話題毎にキーワードの上位・下位概念の関係をあらかじめ構築しておかなければならず、一般にこの構築コストは非常に高く、扱う話題を新たにするたびに概念ツリーを構築することは現実的ではないという問題があった。

以上のような各種の問題は、コールセンタなどの電話音声による応対のみならず、窓口業務における応対や、電子メールによる応対などにおいても同様に生じる。

この発明によれば、応対中の文字列中よりキーワードを検出し、その検出したキーワードを出現時系列としてキーワード履歴部に蓄積し、全てのキーワードを検出するとトリガーを生成し、そのトリガーをキーワード生成部へ送信し、上記キーワード生成部はトリガーを受信すると、別途現在の応対に直接的に関連するキーワードである関連キーワードを受け取り、蓄積された上記キーワードの内、出現の新しいものから順に、時間をさかのぼり、上記関連キーワードと直接的な結びつきがあるキーワードの連続する範囲を探し出し、当該範囲にあるキーワードを組み合わせて出力する。

以上の構成によれば、応対に直接的に関連がある関連キーワードを受け取り、これと直接的に関連し、かつ連続するキーワードをキーワード履歴中から最新のキーワード側より探し出しているため、オペレータや窓口業務員などの支援となる文書をより的確に検索し、提示するためのキーワードが探し出せる。つまり、誤認識を含む認識結果や応対の内容に間接的な表現が含まれている場合でも、的確に文書を選び出すためのキーワードを生成することができる。応対業務に沿った文書を検索するためのキーワードの選択において、扱おうとしている話題に対して、概念ツリーといった特別な情報の構築なしに、誤認識や応対の話題に直接関係のないキーワードが選択されることを防ぐことが出来るようになる。話題に直接関係のないキーワードが選択されることがなくなることにより、より的確に応対中の話題に沿った文書を検索することが出来るようになる。また、より的確に文書を検索できるようになったことにより、提示された文書を参照しながらオペレータがより早く的確に案件に回答することが出来るようになる。

実施例１
図１にこの発明の実施例１を示し、主な処理の流れを図２に示す。
キーワード検出処理部６はキーワード検出部７とキーワード計数部１４とトリガー生成部１８とで構成されおり、キーワード生成部２０は第１の判定部２４、第２の判定部２６、キーワードレジスタ２８、制御部３０とで構成されている。
以下の会話に関して、この実施例の処理を説明する。
オペレータ：「ブラウザからインターネットにですか？」
顧客：「えー、えー、そうです。」
オペレータ：「社内のデータベースにはクエリーできるのに、接続出来ないのですね。」

まず、電話などの通信手段により到着した前記会話の音声信号が、ディジタル変換され、このディジタル音声信号が入力端子２より、音声認識処理部４に入力される（ステップＳ１００）。音声認識処理部４では例えば、公知の技術である隠れマルコフモデル（ＨＭＭ：ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ）、単語辞書などを用いて、音声認識され、認識文字列が生成される（ステップＳ１０１）。そして、この認識文字列が発話毎にキーワード検出処理部６に入力される。

また、この発明では、電話などに限らず、直接、顧客が応対窓口に来て、窓口業務員（相談員など）と話す場合にも適用できる。この場合は、例えば、マイクなどの収音手段（図示せず）により顧客と窓口業務員との会話を収音し、収音した音声信号をＡ／Ｄ変換器（図示せず）などで、ディジタル信号に変換され、入力端子２に入力させることも可能である。
また、この発明では、音声に限らず電子メールなどによる応対などにも適用することが出来る。この場合、電子メール中の本文の文字列が、破線で記している文字列入力部１２に入力され、この文字列が上記の認識文字列として同様に、キーワード検出処理部６に入力される。

キーワード検出処理部６では、キーワード検出部７がその文字列の中から検索の際のキーとなる単語であるキーワードを検出して時間順にキーワード列として取り出す（ステップＳ１０２）。この処理には抜き出すべきキーワードの文字列、例えば、「データベース」、「ネット」、「ブラウザ」などのような文字列を格納したキーワード辞書格納部８を予め準備し、この格納部８内の各文字列と認識文字列を例えば、マッチング処理をすることで得ることができる。

また、キーワード辞書格納部８に変えて、例えば、特開平９−３３０３３１号公報に開示されている方法のように、破線で示す形態素解析部１０によって、認識文字列を形態素解析し、例えば、名詞と固定された単語が連続する文字列の部分で同一の文字列パターンが同一文書内に２回以上現れたものをキーワードとして検出してもよい。この処理は単語を検出する処理だけであるので処理時間は短くて済む。

この実施例では、上記の会話から
オペレータ：「ブラウザ」から「インターネット」にですか？
顧客：えー、えー、そうです。
オペレータ：社内の「データベース」には「クエリー」できるのに、「接続」「出来ない」のですね。
のように、キーワードは「ブラウザ」「インターネット」「データベース」「クエリー」「接続」「出来ない」の６個が検出されたとする。キーワード計数部１４では、キーワードが検出されるごとに計数する。ちなみにこの例では検出されたキーワードの個数は「６」となる。

キーワード検出処理部６により得られた各キーワードは、後で各キーワードを最新のものから時間的に遡って順に取り出せるように、出現順番の番号と組み合わせてキーワード履歴記憶部１６に記憶される（ステップＳ１０４）。つまり、これらのキーワードにはその検出が時間的に古いものから若い番号を付けていく。例えば、この場合であると、１：「ブラウザ」２：「インターネット」３：「データベース」４：「クエリー」５：「接続」６：「出来ない」という形式で、記憶される。このようにキーワードは時系列として、キーワード履歴記憶部１６に記憶される。

また、キーワード検出処理部６では各発話の認識ごとに、全てのキーワードの検出が終了し、得られたキーワード列のキーワード履歴記憶部１６への記憶が終了すると、トリガー生成部１８がトリガーを生成し、キーワード生成部２０へ実行開始のトリガーを送信する。キーワード生成部２０は、トリガーを受け取ると、入力された関連キーワードを受け取り（ステップＳ１０６）、今の話題に沿った文書を検索するためのキーワードを１つまたは複数個の組み合わせを生成する。

ここで、関連キーワードとは、別途、現在の応対に頻繁に使用され、その内容に直接的に関連するキーワードのことであり、オペレータなどによって、事前にきめられるものである。オペレータは、通常、様々な部門に配置され、その部門に直接的に関係するキーワードを関連キーワードとすればよい。例えば、パソコンの故障部門においての関連キーワードであれば、「出来ない」「作動しない」などが考えられ、パソコンの料金問い合わせ部門においての関連キーワードであれば、「請求書」「料金」などが考えられる。
この関連キーワードは予め、もしくは応対が開始した直後に、オペレータが破線で示す関連キーワード記憶部３２にキーワード入力部３３から記憶させてもよい。

また、応対の開始の時点では、関連キーワードを考慮せず、この応対を開始し、その応対の途中で、キーワード検出処理部６より得られてくるキーワード列を、図１中に破線で示す表示部３４に表示させ、つまり、キーワード履歴記憶部１６に記憶されているキーワード列を表示させ、応対の途中で、表示されているキーワード列からオペレータが目視等で、その応対に直接関連するキーワードを関連キーワードとして選択し、その選択情報を、破線で示す関連キーワード入力部３６から入力する。関連キーワード入力部３６からの入力情報に基づき、破線で示す関連キーワード取り出し部３８が表示部３４に表示されたキーワード中の１ないし複数の関連キーワードをキーワード履歴記憶部１６から取り出し、取り出したキーワードを関連キーワードとして、関連キーワード記憶部３２に記憶させてもよい。なお、この実施例の説明での関連キーワードを「ブラウザ」「インターネット」とする。

また、前記特許文献１中に記されているように、話題語を抽出する処理を実施し（図示せず）、その話題語を関連キーワードとして関連キーワード記憶部３２に記憶させてもよい。また関連キーワード生成の方法はこれらに限られるものではない。
関連キーワード記憶部３２に記憶されている関連キーワードはキーワード生成部２０へ入力される。キーワード生成部２０内において関連キーワードはキーワードレジスタ２８内の一部に格納される。また、
応対が開始した直後に、オペレータが入力した関連キーワードを、必要に応じて、キーワードレジスタ２８に直接格納しても良い。

キーワード生成部２０は関連キーワードを用いて、キーワード履歴記憶部１６に記憶されたキーワードのうち、出現の新しいものから順に、時間をさかのぼり、関連キーワードと直接的な結びつきがあるキーワードがある連続する範囲を探し出し、当該範囲にあるキーワードを組み合わせて、出力するものである。この実施例では、この処理を例えば、検索用データベース２１を用いて行う場合について説明する。

検索用データベース２１はキーワードおよび関連キーワードの個々のものと同一のものを検索語とし、これら検索語の１つでも含む文書を検索できるものである。キーワード生成部２０は検索用データベース２１を用いて、関連キーワードと検出したキーワードとを検索語として含む文書を検索する。検索用データベース２１の具体的構成例は図１に記載のように、検索語と、文書のインデックスと、各文書のインデックスが表す文書中に各検索語が含まれているか否かを表すフラグと、で構成される。この例では、検索用データベース２１中に行列として格納され、左端の列に各検索語が配列格納され、最上位行に各文書のインデックスが配列格納され、各文書のインデックスごとに、その文書に検索語が含まれていれば、その文書のインデックスの列におけるその検索語の行に「１」のフラグを立て、含まれていなければ「０」のフラグを立てる。例えば、文書のインデックスがｄ１の列では、検索語「データベース」「接続」「クエリー」「出来ない」の各行に「１」のフラグが立ち、それ以外の検索語には「０」のフラグが立つ。また、「データベース」という検索語が含まれる文書のインデックスは、ｄ１、ｄ２、ｄ５、ｄ８となり、これらには「１」のフラグが立ち、これら以外の文書のインデックスは「０」のフラグが立っている。また、キーワード生成部２０によるキーワードの生成において、検索用データベース２１はこのようなものに限られるものではなく、例えば、その応対と関連のある文書全体を文書のインデックスを付けて全て格納したものでも良い。

キーワード生成部２０の処理の具体的な流れを、図３を参照しながら説明する。キーワード生成部２０は検索用データベース２１を用いて、関連キーワードと検出したキーワードとを検索語として含む文書を検索し、検索結果があれば、関連キーワードと結びつきがあると判定して、上記キーワードの連続する範囲を探し出し、探し出された連続する範囲中の最も長く連続するキーワードを生成出力する。またキーワード生成部２０での処理は、オペレータと顧客間の会話において、最新の発話に重要なキーワードがあるとの思想に基づいている。ここで、キーワード履歴記憶部１６中のキーワード履歴中の位置を示すカウンタ変数としてｉ、ｊが定義され、このカウンタ変数は制御部３０により制御される。また関連キーワード記憶部３２よりのＭ個の関連キーワードをＣＫ１、ＣＫ２、．．．、ＣＫＭとし、キーワード履歴記憶部１６中に音声認識開始から現時点までに蓄積されたキーワードの数をＮとし、キーワード履歴記憶部１６に保存されているキーワードを音声中での出現順に、Ｋ１、Ｋ２、．．．、ＫＮとする。ただしＮ、Ｍは１以上の整数とする。

まずカウンタ変数ｉにＮを設定する（ステップＳ２００）。次に、ｉの値が「０」であるか否かを判定し、「０」でない場合は、第１の判定部２４での処理に進む（ステップＳ２０２）。
ここで、第１の判定部２４で使用される関数Ｎ（ｘ）について説明する。関数Ｎ（ｘ）はその引数ｘに与えられたキーワードを検索語として用いて、ＡＮＤ条件で検索した場合に、検索結果として得られる文書数を求める関数である。また関数Ｎ（ｘ）の計算には、文書のインデックスを用いて、実際に検索処理を行うことで、実行可能である。例えば、図１中の検索用データベース２１の例として示す転置行列を検索用インデックスとして構成し、各検索語に対応づく文書集合のＡＮＤ検索を行い、その文書数を数えることで、計算可能である。なお、詳細は、「情報検索と言語処理発効日：２００４年９月１５日第３刷発行所：（財）東京大学出版会Ｐ３９ーＰ４１」に記載されている。

説明を図３のフローチャートに戻すと、Ｎ（ＣＫ１、ＣＫ２、．．．、ＣＫＭ、Ｋｉ）の値である第１の文書検索数を求め、この値が「０」であるか否かを判定する（ステップＳ２０４）。Ｎ（ＣＫ１、ＣＫ２、．．．、ＣＫＭ、Ｋｉ）の値は図１中の検索用データベース２１を用いて、関連キーワードＣＫ１、ＣＫ２、．．．、ＣＫＭとキーワード履歴記憶部１６中のキーワードＫｉをそれぞれ検索語としてこれら全ての検索語を含む文書の数つまり、第１の文書検索数を求める。なお、この実施例では、検索開始においては、ｉ＝Ｎ＝６である場合のＫｉは「出来ない」であり、関連キーワードを「ブラウザ」「インターネット」とすると、「出来ない」「ブラウザ」「インターネット」を検索語とすると、全ての検索語を含む文書のインデックスはｄ６となり、文書のインデックスの数は「１」であるから、Ｎ（ＣＫ１、ＣＫ２、．．．、ＣＫＭ、Ｋｉ）は「１」と出力される。よってＮ（ＣＫ１、ＣＫ２、．．．、ＣＫＭ、Ｋｉ）の値は「０」でないので、ステップＳ２１２に移動する。

また、ステップＳ２０４で、第１の文書検索数が「０」の場合は、ｉの値を「１」引いて（ステップＳ２０６）、ステップＳ２０２に戻る。このときにカウンタ変数ｉ≠０であればステップＳ２０４に再び移るが、カウンタ変数ｉ＝０になったときは、キーワード生成部２０の処理は、結果無しとして終了する（ステップＳ２０８）。つまり、第１の判定部２４での処理は、上述のように最新の発話に重要なワードがあるとの思想に基づき、最新のキーワードＫＮから順番に過去にさかのぼったキーワードと関連キーワードＣＫ１、ＣＫ２、．．．、ＣＫＭとの組み合わせを検索語として使用する。

一方、ステップＳ２１２では、カウンタ変数ｊ＝ｉ−１とし（ステップＳ２１２）、その後ｊ＝０であるか否かを判定する（ステップＳ２１４）。ｊ≠０であれば、第２の判定部２６で行う。上述の関数Ｎ（ｘ）を用いて、関連キーワードＣＫ１〜ＣＫＭとキーワード履歴記憶部１６中のキーワードＫｊ、Ｋｊ＋１、．．．、Ｋｉを組み合わせたものを検索語とし、ＡＮＤ条件で文書検索を行った場合の文書検索数つまりＮ（ＣＫ１、ＣＫ２、．．．、ＣＫＭ、Ｋｉ、Ｋｉ−１、．．．、Ｋｊ）を求め、この値を第２の文書検索数とし、第２の文書検索数が「０」以上であるか否かを第２の判定部２６で判定する（ステップＳ２１６）。第２の文書検索数が「０」以上の場合は、ｊの値を「１」減らして（ステップＳ２１８）、ステップＳ２１４に戻る。

第２の文書検索数が「０」である場合はキーワード履歴記憶部１６中の位置ｊ＋１〜位置ｉにあるキーワードＫｉ、Ｋｉ−１、．．．、Ｋｊ＋１をキーワード生成結果として出力部４０から出力する（ステップＳ２２０）。またステップＳ２１４でｊ＝０の場合で、ステップＳ２２０に移動した場合は、ｊ＋１＝ｉとなり、１つのキーワードＫｉのみが出力部４０から出力される（ステップＳ２２０）。つまり、第２の判定部２６では、Ｋｉから更に過去に遡った複数のキーワードと関連キーワードとを検索語とし、これら検索語とのＡＮＤ条件で検索ヒットする最大のキーワード集合を求めている。

実施例２
次に、実施例２を説明する。実施例２は実施例１で説明したキーワード生成装置を用いて、構成した文書検索装置である。文書検索装置の具体的構成例とその他これに関連する装置を図４、文書検索装置の主な処理の流れを図５に示す。文書検索装置１００は実施例１で説明したキーワード生成装置１０２、文書検索部１０４、映像信号変換部１０６、表示部１０８、選択入力部１１０とで構成されている。以下の説明は、顧客がコールセンタ内のオペレータに電話で質疑応答をする場面を想定する。

顧客電話端末１１２は顧客がコールセンタとの音声信号を送受信するためのものである。まず顧客が例えば、顧客電話端末１１２から話しかけると、その音声信号が、ネットワーク１１４に入力され、オペレータと顧客との音声信号を送受信する電話送受信部１１６に着信し、顧客とオペレータの会話が可能となる（ステップＳ５００）。接続切断判定部１１８は電話送受信部１１６の状態を監視している。オペレータが電話送受信部１１６で顧客の電話を受信することにより、顧客電話端末１１２と電話送受信部１１６との間でネットワーク１１４を介した通信が開始されたことを検出すると、接続切断判定部１１８はキーワード生成装置１０２に対して、接続情報を送信する。また、その通信が終了すると、切断情報を送信する。通信の接続または切断の判定は電話送受信部１１６から別途、通信が接続、切断したことを知らせる信号を出力させ、その信号を受信することで判定するなどの方法を取ることで実現できる。

接続情報を受信したキーワード生成装置１０２は電話送受信部１１６を介して、送受信されている音声信号を受け取り、実施例１で説明したキーワード出力処理を実行し、キーワードを出力する（ステップＳ５０２）。なお、音声認識をする対象音声は、送話装置から取り出したオペレータ側の音声のみ、または受話装置から取り出した着信音声のみ、またはそれら両方を認識する何れでも良い。
関連キーワードが入力されると（ステップＳ５０４）、キーワード生成装置１０２より出力されたキーワードと関連キーワードは文書検索部１０４に入力される。

関連キーワードについては、図１記載のキーワード生成装置１０２の出力部４０より生成されたキーワードと同時に、関連キーワードを出力させるようにキーワード生成装置１０２を構成してもよい。また実施例１でも言及したように、応対が開始した直後に選択入力部１１０から、オペレータが関連キーワードを直接入力するのでもよいし、音声認識中の単語からキーワードを生成して、映像信号変換部１０６で映像信号に変換させて表示部１０８に表示させ、応対の途中で、オペレータが目視等で、それらキーワードの中から、応対に直接関連するキーワードを選び、選択入力部１１０から関連キーワードとして選択することで、文書検索部１０４に入力してもよい。

キーワード生成装置１０２が文書検索装置１００と一体構成されている場合は、選択入力部１１０は図１中の関連キーワード入力部３６と、表示部１０８は図１中の表示部３４とそれぞれ兼用すればよい。

文書検索部１０４は、キーワードと関連キーワードの組を用いて、文書検索を行う。具体的には、文書記憶装置１２０内の検索データベース１２０１を用いて、キーワードと関連キーワードの組について実施例１で説明したＡＮＤ検索による検索処理を行う。検索データベース１２０１は図１中の検索用データベース２１と同様なものでもよい。その検索結果が文書検索部１０４に返され、その検索結果が映像信号変換部１０６により映像信号に変換され、表示部１０８に表示される（ステップＳ５０６）。

上記検索結果中には得られた文書の件数、検索結果の各文書が文書記憶装置内１２０内の記憶されているメモリやファイルの位置やファイル名、各検索結果の見出し（タイトル）や要約文などが含まれる。

表示部１０８の画面に表示された検索結果例を図６に示す。リスト欄４０２には、検索結果となる文書の内容をオペレータが把握するための文書のタイトル、又は要約文が表示されている。例えば「プリントサーバ経由で印刷をする方法」などである。この検索に用いられた、つまり文書検索部１０４に入力されたキーワードの組み合わせと、得られた文書の件数が検索キーワード表示欄４０１に表示している。

オペレータはマウスなどの選択入力部１１０を操作し、リスト欄４０２に表示されているリストの何れかのタイトルまたは要約を、例えば、カーソルを移動させてクリックすることにより、選択し、その後、表示指令ボタン４０３にカーゾルを移動させて、クリックすることで表示指令を出す。選択入力部１１０からのこれら選択表示指示情報に基づき、文書検索部１０４は選択されたタイトルまたは要約と該当する文書情報を文書記憶装置１２０中から検索し（ステップＳ５０８）、この文書情報を文書検索部１０４に読み出す。この文書情報は映像信号変換部１０６に入力され、文書情報は映像信号に変換され、表示部１０８に表示される（ステップＳ５０８）。オペレータは表示部３０９に表示されている文書を参考にして、用件について説明することが可能である。

なお、上述したようにキーワード生成装置１０２で用いた関連キーワードを応対中に得られたキーワードからオペレータの操作によって、選択する場合の具体例を説明する。応対中に順次得られたキーワードは表示部１０８の表示面に、図６中において選択用キーワード欄４０４に表示される。この選択用キーワード欄４０４に表示されたこれまでに検出したキーワードのリスト中から、応対の話題に直接的に関連するキーワード、つまり関連キーワードを選択する。例えば四角枠４０５で囲まれたキーワードを「プリンター」「故障」「電源」を選択し、選択ボタン表示４０６を選択する。この選択操作は選択入力部１１０を、タイトル又は要約文と該当する文書情報を選択表示させる場合と、同様に操作すればよい。

上述したように、この発明はコールセンタ内のオペレータと顧客との電話による応対のみではなく、例えば、電子メールでのやり取りや、窓口での直接の会話による応対にも適用することが出来る。

なお、キーワード生成装置１０２からその検索用データベース２１で検索された文書のインデックスをも出力するようにし、その文書のインデックスのそれぞれに該当する文書のタイトル又は要約文を、文書検索部１０４により、文書記憶装置１２０から検索して、表示部１０８の表示面中のリスト欄４０２に表示するようにしてもよい。

電子メールでのやり取りの場合は、電子メール中の本文が図１中の文字列入力部１２に入力されると上述のように、キーワードを生成して、予め関連キーワードを関連キーワード記憶部３２に記憶させておくことにより、文書記憶装置１２０からいくつかの文書が選択されるが、そのいくつかの文書の中から、例えば、一番選択された回数の多い文書を顧客に返答するようにすればよい。これらの処理をＣＰＵ（図示せず）などに制御させれば、オペレータを配置させる必要もなく、２４時間応対業務を低コストで実施することなども可能である。

以上の各実施形態の他、本発明であるキーワード生成装置・方法、文書検索装置・方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記言語モデル作成装置・方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。

また、上記キーワード生成装置、文書検索装置における処理機能をコンピュータによって実現する場合、キーワード生成装置、文書検索装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記キーワード生成装置、文書検索装置における処理機能がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）、ＤＶＤ−ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＣＤ−Ｒ（Ｒｅｃｏｒｄａｂｌｅ）／ＲＷ（ＲｅＷｒｉｔａｂｌｅ）等を、光磁気記録媒体として、ＭＯ（Ｍａｇｎｅｔｏ−Ｏｐｔｉｃａｌｄｉｓｃ）等を、半導体メモリとしてＥＥＰ−ＲＯＭ（ＥｌｅｃｔｒｏｎｉｃａｌｌｙＥｒａｓａｂｌｅａｎｄＰｒｏｇｒａｍｍａｂｌｅ−ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）等を用いることができる。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（ＡｐｐｌｉｃａｔｉｏｎＳｅｒｖｉｃｅＰｒｏｖｉｄｅｒ）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、キーワード生成装置、文書検索装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

この発明のキーワード生成装置の具体的構成例を示すブロック図。キーワード生成装置の主な処理の流れを示すフローチャートキーワード生成部２０の主な処理の流れを示すフローチャート。この発明の文書検索装置の具体的構成例を示すブロック図。文書検索装置の主な処理の流れを示すフローチャート。表示部１０８に表示される画面の具体例。

Claims

応対中の文字列中よりキーワードを検出し、検出したキーワードを、キーワード生成部へ送信するキーワード検出処理部と、
上記キーワードを出現時系列として蓄積するキーワード履歴記憶部と、
別途現在の応対に直接的に関連するキーワードである関連キーワードを受け取り、蓄積された上記キーワードの内、出現の新しいものから順に、時間をさかのぼり、上記関連キーワードと直接的な結びつきがあるキーワードの連続する範囲を探し出し、当該範囲にあるキーワードを組み合わせて出力するキーワード生成部と、を有するキーワード生成装置。
請求項１記載のキーワード生成装置において、
更に、上記キーワードの個々のものと同一のものを検索語とし、複数の文書のそれぞれについて、少なくともその文書に含まれる検索語が保存されている検索用データベースを備え、
上記キーワード生成部は、上記検索用データベースを用いて、上記関連キーワードと上記検出したキーワードとを検索語として含む文書を検索し、検索結果があれば、関連キーワードと結びつきがあると判定して、上記キーワードの連続する範囲を探し出し、
探し出された連続する範囲中の最も長く連続するキーワードを生成出力するものである、ことを特徴とするキーワード生成装置。
請求項１または２の何れかに記載のキーワード生成装置において、
更に、上記関連キーワードを入力する関連キーワード入力部と、を有することを特徴とするキーワード生成装置。
請求項１〜３の何れかに記載のキーワード生成装置を備え、
上記キーワード生成装置から出力されたキーワードまたはこれと上記関連キーワードを受け取ると、上記キーワードと上記関連キーワードを含む文書のタイトル又は要約を文書記憶装置から検索出力する文書検索部と、
上記文書検索部からの出力を映像信号に変換して、表示部へ出力する映像信号変換部と、を有することを特徴とする文書検索装置。
請求項１〜３の何れかに記載のキーワード生成装置を備え、
上記キーワード生成部は上記生成したキーワードと関連キーワードを検索語として含む文書のインデックスをも出力するものであり、
上記キーワード生成装置から出力されたインデックスで、文書記憶装置から検索して、上記文書のタイトルまたは要約を出力する文書検索部と、
上記文書検索部からの出力を映像信号に変換して、表示部へ出力する映像信号変換部と、を有することを特徴とする文書検索装置。
キーワード検出処理手段が、応対中の文字列中よりキーワードを検出するキーワード検出処理過程と、
キーワード履歴記憶手段が、上記キーワードを出現時系列として蓄積するキーワード履歴記憶過程と、
キーワード生成手段が、別途現在の応対に直接的に関連するキーワードである関連キーワードから、蓄積された上記キーワードの内、出現の新しいものから順に、時間をさかのぼり、上記関連キーワードと直接的な結びつきがあるキーワードの連続する範囲を探し出し、当該範囲にあるキーワードを組み合わせて生成するキーワード生成過程と、を有するキーワード生成方法。
請求項６記載のキーワード生成方法において、
上記キーワード生成過程は、検索用データベースを参照して、上記関連キーワードと上記検出したキーワードとを検索語として含む文書を検索し、検索結果があれば、関連キーワードと結びつきがあると判定して、上記キーワードの連続する範囲を探し出し、
探し出された連続する範囲中の最も長く連続するキーワードを生成出力する過程であることを特徴とするキーワード生成方法、ここで検索用データベースは上記キーワードの個々のものと同一のものを検索語とし、複数の文書中のそれぞれについて、少なくとも、その文書に含まれる検索語が保存されたものである。
請求項６または７の何れかに記載のキーワード生成方法において、
更に表示手段が、上記検出されたキーワードを表示手段に表示する過程と、キーワード取り出し手段が、関連キーワード入力手段により入力された入力情報に基づき上記表示手段に表示されたキーワード中の１ないし複数を上記関連キーワードとする過程と、を有することを特徴とするキーワード生成方法。
請求項６〜８の何れかに記載のキーワード生成方法に加え、
文書検索手段が、上記キーワード生成過程で生成された上記キーワードと上記関連キーワードを含む文書のタイトル又は要約を文書記憶手段から検索する文書検索過程と、
映像信号変換手段が、上記検索された文書のタイトル又は要約を映像信号に変換して表示手段へ入力する映像信号変換過程と、を有することを特徴とする文書検索方法。
請求項６〜８の何れかに記載のキーワード生成方法に加え、
上記キーワード生成過程は、更に上記生成したキーワードと関連キーワードを検索語として含む文書のインデックスを検索する過程であり、
文書検索手段が、上記キーワード生成過程により検索されたインデックスで、上記文書のタイトルまたは要約を文書記憶手段から検索する文書検索過程と、
映像信号変換手段が、上記検索された文書のタイトル又は要約を映像信号に変換して表示手段へ入力する映像信号変換過程と、を有することを特徴とする文書検索方法。
請求項９又は１０に記載の文書検索方法において、
上記文書検索過程は、更に、上記選択入力手段により選択入力された情報に基づき、上記文書のタイトル又は要約に対応する文書を文書記憶手段から読み出して、上記映像信号変換手段へ入力する過程を含むことを特徴とする文書検索方法。
請求項６〜８の何れかに記載のキーワード生成方法の各過程をコンピュータに実行させるためのキーワード生成プログラム。
請求項９〜１１の何れかに記載の文書検索方法の各過程をコンピュータに実行させるための文書検索プログラム。