JP2012252484A

JP2012252484A - 回答自動生成システム

Info

Publication number: JP2012252484A
Application number: JP2011124071A
Authority: JP
Inventors: Masayoshi Kono; 全良河野
Original assignee: Hitachi Systems Ltd
Current assignee: Hitachi Systems Ltd
Priority date: 2011-06-02
Filing date: 2011-06-02
Publication date: 2012-12-20

Abstract

【課題】問合せに対する回答を、人手を介さずに自動的に作成する。
【解決手段】
ネットワークを介して端末に接続されるサーバを有し、端末からの問合せをサーバで受け付けて問合せに対する回答を生成して端末へ提供する回答自動生成システムにおいて、質問者の端末から送られる問合わせ内容と、過去の問い合わせ内容とを比較し、一致率と参照率と語順一致率から類似度を算出し、算出されたこの類似度が高い過去の質問の回答を、問合わせに対する回答として生成する。
【選択図】図１

Description

本発明は、回答自動生成システムに係り、特に、ネットワークに接続された端末からの問い合わせに対する回答を自動的に作成する回答自動生成システムに関するものである。

コンピュータシステムの運用や保守のサポート、更にはコンピュータから提供されるサービスについての問い合わせに対して回答を作成して提供するシステムが実用化されている。例えば、特許文献１には、サポートサービス側の担当者が作成した回答を、顧客が予め指定した回答手段である電子メール又はＦＡＸによって顧客側端末に送信する処理を行うヘルプデスクシステムが開示されている。

特開２００４−３０５０３公報

特許文献１に記載のように、従来のヘルプデスクシステムでは、サポートサービス側の担当者（人手）が、例えば過去のデータが蓄積されたデータベースを検索して、合致する事例を探して回答を作成するので、工数がかかるという課題がある。また、担当者の熟練度によって回答を作成する時間や回答の内容が異なるため、質問者に対して均一的なサポートサービスを提供できないという課題がある。

本発明の目的は、問合せに対する回答を、人手を介さずに自動的に作成することができる回答自動生成システムを提供することである。

本発明に係る回答自動生成システムは、ネットワークを介して端末に接続されるサーバを有し、該端末からの質問者による問合せをサーバで受け付けて該問合せに対する回答を生成して該端末へ提供する回答自動生成システムにおいて、
受け付けた該問合せの案件の質問文と、該質問文に対する回答文を格納する質問／回答ＤＢと、過去の質問文に対する回答文の事例を蓄積して格納する回答事例ＤＢと、
該サーバでプログラムを実行することで実現される；
問合せの質問文及びその回答文のデータ、及び回答事例のデータを、該質問／回答ＤＢ及び該回答事例ＤＢに登録する質問／回答登録機能と、問合せの質問文に対する回答文を自動生成する回答自動生成機能と、該回答事例ＤＢを検索して過去の質問文から回答を検索する検索機能とを有し、
該回答自動生成機能は、受け付けた該問合せの質問文と、該回答事例ＤＢを検索して得られる過去の問合せの質問文を照合して、類似度が高い質問文に対する回答文を得て、該回答文を回答として、質問者の該端末へ提供すること特徴とする回答自動生成システムとして構成される。

好ましい例では、前記回答自動生成機能は、問合せの質問文と過去の蓄積された問合せの質問文とを照合して類似度を算出する類似度算出処理部と、算出された類似度の高い過去の問合せデータに対する回答を更新する回答更新処理部を有する前記回答自動生成システムとして構成される。

また、好ましい例では、前記類似度算出処理部は、（a）〜（d）の計算式をプロセッサで実行することによって、（a）一致率、（b）参照率、（c）語順一致率、（d）類似度を算出する前記回答自動生成システムとして構成される。
（a）一致率＝全ての適合単語（回答事例ＤＢ質問文側）の文字数の総和／回答事例ＤＢ質問文の文字数
（b）参照率＝回答事例ＤＢ参照回数／回答事例ＤＢ全参照回数
（c）語順一致率＝適合単語中２単語の組でその順序関係が質問／回答ＤＢ質問文と一致する組の数／適合単語２単語の組み合わせ総数
（d）類似度＝一致率×参照率×語順一致率

本発明によれば、質問者からの問い合わせに対する回答を自動的に作成するため、回答の作成工数を削減することができる。また、サポートサービス担当者の熟練度により異なる回答時間や内容が均一となる。

一実施例による回答自動生成システムの全体構成を示す図である。一実施例による回答自動生成機能の処理動作を示すフローチャートである。一実施例による類似度算出処理部の処理動作を示すフローチャートである。一実施例による回答更新処理部の処理動作を示すフローチャートである。一実施例における質問／回答ＤＢの構成を示す図である。一実施例における回答事例ＤＢの構成を示す図である。一実施例における質問ファイルの構成を示す図である。一実施例における類似度ファイルの構成を示す図である。一実施例における回答ファイルの構成を示す図である。

以下、図面を参照して本発明の一実施例について説明する。
図１は、回答自動生成システムの全体構成を示す。この回答自動作成システムは、ユーザ（質問者）からの問合せに対して回答を自動生成する管理サーバ（以下単にサーバという）１に、ネットワーク３を介して、１又は複数のユーザ（質問者）の端末２が接続して構成される。ユーザの端末２は、入力器及び表示器、情報処理するプロセッサを備えた、パーソナルコンピュータ（ＰＣ）や携帯端末等のクライアントである。質問者は、表示器の画面を見ながら、入力器より質問等の問合せを文章で入力する。入力された問合せ文章（質問文）のデータは、ネットワーク３を介してサーバ１へ送信される。

サーバ１は、所定のプログラムを実行させて情報処理するプロセッサ、メモリ及びデータベース（ＤＢ）等を保管する大容量の記憶装置を有する。サーバ１には、問合せに対する回答を提供するためのアプリケーションプログラムがプロセッサで実行されて、案件管理システム１０が構築される。

案件管理システム１０は、問合せの質問文及びその回答文のデータ更には回答事例のデータを、ＤＢ１１１，１１２に登録する質問／回答登録機能１２と、問合せの質問文に対する回答文を自動生成する質問／回答自動生成機能１３と、回答事例ＤＢ１１２を検索して過去の質問文から回答を検索する検索機能１４から構成される。質問／回答自動生成機能１４は更に、問合せの質問文と過去の蓄積された問合せの質問文とを照合して類似度を算出する類似度算出処理部１３１と、算出された類似度の高い過去の問合せデータに対する回答を更新する回答更新処理部１３２より構成される。更に、案件管理システム１０は、質問／回答ＤＢ１１１と、回答事例ＤＢ１１２と、質問ファイル１１３と、類似度ファイル１１４と、回答ファイル１１５を有する。
上記各機能及び各ＤＢ及びファイルの構成については、図２〜図４、及び図５〜９を参照して後述する。

図５は質問／回答ＤＢ１１１の構成を示す。
質問／回答ＤＢ１１１は、質問者の端末２から送信され、案件管理システム１０で受け付けられた案件の質問文に対して回答された文を格納する。即ち、案件の受け付けの度に付与される固有の案件番号ごとに、質問文と、その質問文に対する回答文を格納する。なお、端末２からの質問文を受け付けた後であって回答を生成している段階では、当該質問文に案件番号が付与され、回答文は未だ格納されていない状況がある。

図６は回答事例ＤＢ１１２の構成図である。
回答事例ＤＢ１１２は、過去に収集された質問文とそれに対する回答文の事例を蓄積して格納する。
連続する番号（ＳＥＱ）ごとに、質問文から抽出されたキーワードとなる１又は複数の単語と、回答文と、その質問／回答文の対が参照された参照回数を格納する。参照回数は、この回答事例ＤＢ１１２が検索されて参照される度に、検索機能によって順次更新される。

図７は質問ファイル１１３の構成図である。
質問ファイル１１３は、質問／回答ＤＢ１１１の案件番号に対応して、質問文から抽出されたキーワードとなる１又は複数の単語を格納する。

図８は類似度ファイル１１４の構成図である。
類似度ファイル１１４は、回答事例ＤＢ１１２の番号（ＳＥＱ）に対応して、回答文と、その回答文に対して算出された類似度を格納する。類似度の計算については、後で詳述する。

図９は回答ファイル１１５の構成図である。
回答ファイル１１５は、質問／回答ＤＢ１１１の案件番号に対応して、回答文の内容を格納する。

次に、図２のフローチャートを参照して、回答自動生成機能１３の処理動作について説明する。
本処理の前提として、質問者の端末２から送信された質問文は、質問／回答登録機能１２によって案件番号が付与されて質問／回答ＤＢ１１１に格納されているとする（回答文はこれから生成される段階である）。また、回答事例ＤＢ１１２には、過去に収集された質問文とその回答文の事例が格納されているとする。
回答自動生成機能１３は、まず、質問／回答ＤＢ１１１から質問文を読み込み、当該質問文について回答事例ＤＢ１１２の質問文と突合せて、類似度算出処理部１３１で類似度の計算を行い（Ｓ２１）、その結果算出された類似度を類似度ファイル１１４に格納する。なお、類似度の算出処理（Ｓ２１）については、図３を参照して後述する。

そして、類似度ファイル１１４に格納された回答事例をキーにして回答事例ＤＢ１１２を検索する。その検索の結果得られた回答事例は、質問／回答登録機能１２によって質問／回答ＤＢ１１１の上記質問文に対応する「回答文」エリアに格納される（Ｓ２２）。質問／回答ＤＢ１１１に格納された回答文は、その後読み出されて、ネットワーク３を介して質問者の端末２へ送信される（Ｓ２４）。
ここで、Ｓ２４の処理の前に（後でもよいが）、回答更新処理部１３２は回答事例ＤＢ１１２の参照回数を更新する（Ｓ２３）。なお、更新処理（Ｓ２２）については、図４を参照して後述する。

次に、図３のフローチャートを参照して、類似度算出処理部１３１の処理動作について説明する。
類似度算出処理部１３１は、質問／回答ＤＢ１１１を検索して、案件Ｎｏをキーに読み出しを行ない、読み出した案件Ｎｏを回答ファイル１１５に書き込む（Ｓ３０２）。また、読み出した質問文のデータを１又は複数の単語に分解して、その分解された単語を質問ファイル１１３に、質問Ｎｏに対応付けて書き込む（Ｓ３０３）。

次に、回答事例ＤＢ１１２に格納されたレコードをNULLまで順次に読み出す（Ｓ３０４）。そして、１レコードを読み込む度に以下の処理を行う。
まず、一致率の算出を行う（Ｓ３０５）。一致率は、全ての適合単語（回答事例ＤＢ質問文側）の文字数の総和を、回答事例ＤＢ質問文の文字数で割った値である。即ち、
一致率＝全ての適合単語（回答事例ＤＢ質問文側）の文字数の総和／回答事例ＤＢ質問文の文字数
で表される。計算処理は次の工程（１）〜（４）で行われる。
（１）質問文の全単語をメモリ（#1〜#n）にセットする。
（２）メモリ（#1）からメモリ（#n）まで順に読み出しを行って、質問文の単語と一致した回答事例ＤＢ１１２の質問文単語の文字数をメモリ（#n＋1）にプラスする。
（３）回答事例ＤＢ１１２の質問文単語の総文字数をメモリ（#n＋2）に取り出す。
（４）一致した文字数（メモリ（#n＋1））を総文字数（メモリ（#n＋2））で割り、メモリ（#n＋3）にセットする。

次に、参照率の算出を行なう（Ｓ３０６）。参照率は、回答事例ＤＢ１１２の参照回数を回答事例ＤＢの全参照回数で割った値である。即ち、参照率＝回答事例ＤＢ参照回数／回答事例ＤＢ全参照回数で表される。計算処理は次の工程（１）〜（２）で行われる。
（１）回答事例ＤＢ１１２のレコードを順次に読み出し、参照回数をメモリ（#n＋4）上に加算する。
（２）回答事例ＤＢ１１２の参照回数をメモリ（#n＋4）で割り、メモリ（#n＋5）上にセットする。

次に、語順一致率の算出を行なう（Ｓ３０７）。語順一致率は、適合単語中２単語の組でその順序関係が質問／回答ＤＢ質問文と一致する組の数を、適合単語２単語の組み合わせ総数で割った値である。即ち、
語順一致率＝適合単語中２単語の組でその順序関係が質問／回答ＤＢ質問文と一致する組の数／適合単語２単語の組み合わせ総数
で表される。計算処理は次の工程（１）〜（１０）で行われる。

（１）一致した単語の質問文１番目の単語と2番目の単語をメモリ（#n＋6）に取り出す。
（２）一致した単語の質問文n-1番目の単語とn番目の単語をメモリ（#n＋7）に取り出す。
この（１）（２）は、一致した単語の終わり（n）まで繰り返し処理する。
（３）質問文の単語と一致した回答事例ＤＢ質問文単語をメモリ（1〜m）に取り出す。
この（３）は回答事例ＤＢの単語の終わりまで繰り返し処理する。

下記（４）〜（１０）はメモリ（m）まで繰り返し処理する。
（４）一致した単語の１番目の単語と2番目の単語をメモリ（#n＋8）に取り出す。
（５）（１）の組合せ（メモリ（#n＋6））と、（４）の組合せ（メモリ（#n＋8））が一致した場合、メモリ（#n＋9）に１を加算し、（７）へ行く。
（６）（２）の組合せ（メモリ（#n＋7））と、（４）の組合せ（メモリ（#n＋8））が一致した場合、メモリ（#n＋9）に1を加算する。

（７）一致した単語の（m-1）番目の単語と（m）番目の単語をメモリ（#n＋10）に取り出す。
（８）（１）の組合せ（メモリ（#n＋6））と、（７）の組合せ（メモリ（#n＋10））が一致した場合、メモリ（#n＋9）に１を加算し、（１０）へ行く。
（９）（２）の組合せ（メモリ（#n＋7））と、（７）の組合せ（メモリ（#n＋10））が一致した場合、メモリ（#n＋9）に１を加算する。
（１０）メモリ（#n＋9）の値を２で割り、メモリ（#n＋9）にセットする。

次に、類似度の算出を行なう（Ｓ３０８）。類似度は、一致率×参照率×語順一致率で表される。この計算処理は、メモリ（#n＋3）とメモリ（#n＋5）とメモリ（#n＋9）を掛けることで行われる。
以上の計算処理が終わると、回答事例ＤＢ１１２のＳＥＱと、回答事例と、算出した類似度を類似度ファイル１１４に書き込んで、一連の類似度算出処理を終了する（Ｓ３０９）。

次に、図４のフローチャートを参照して、回答更新処理部１３２の処理動作について説明する。
回答更新処理部１３２は、類似度ファイル１１４を検索して、類似度が最大の回答事例のデータを読み出して、それを回答ファイル１１５の回答文のレコードに書き込（Ｓ４０２）。
そして、回答ファイル１１５に格納された当該回答文に対応する質問Ｎｏと一致する、質問／回答ＤＢ１１１の回答文のレコードに当該回答文を追記して、質問／回答ＤＢ１１１を更新する（Ｓ４０３）。
回答更新処理部１３２はまた、類似度ファイル１１４の中で最大の類似度のデータからＳＥＱを抽出して、当該ＳＥＱの一致する回答事例ＤＢ１１２のレコードの参照回数を１加算して更新する（Ｓ４０４）。これで一連の処理を終わる。

１：サーバ２：端末３：ネットワーク１０：案件管理システム
１２：質問／回答登録機能１３：回答自動生成機能
１３１：類似度算出処理部１３２：回答更新処理部
１４：検索機能
１１１：質問／回答ＤＢ１１２：回答事例ＤＢ１１３：質問ファイル
１１４：類似度ファイル１１５：回答ファイル

Claims

ネットワークを介して端末に接続されるサーバを有し、該端末からの質問者による問合せをサーバで受け付けて該問合せに対する回答を生成して該端末へ提供する回答自動生成システムにおいて、
受け付けた該問合せの案件の質問文と、該質問文に対する回答文を格納する質問／回答ＤＢと、
過去の質問文に対する回答文の事例を蓄積して格納する回答事例ＤＢと、
該サーバでプログラムを実行することで実現される；
問合せの質問文及びその回答文のデータ、及び回答事例のデータを、該質問／回答ＤＢ及び該回答事例ＤＢに登録する質問／回答登録機能と、問合せの質問文に対する回答文を自動生成する回答自動生成機能と、該回答事例ＤＢを検索して過去の質問文から回答を検索する検索機能とを有し、
該回答自動生成機能は、受け付けた該問合せの質問文と、該回答事例ＤＢを検索して得られる過去の問合せの質問文を照合して、類似度が高い質問文に対する回答文を得て、該回答文を回答として、質問者の該端末へ提供すること特徴とする回答自動生成システム。
前記回答自動生成機能は、問合せの質問文と過去の蓄積された問合せの質問文とを照合して類似度を算出する類似度算出処理部と、算出された類似度の高い過去の問合せデータに対する回答を更新する回答更新処理部を有することを特徴とする請求項１の回答自動生成システム。
前記類似度算出処理部は、（a）〜（d）の計算式をプロセッサで実行することによって、（a）一致率、（b）参照率、（c）語順一致率、（d）類似度を算出することを特徴とする請求項２の回答自動生成システム。
（a）一致率＝全ての適合単語(回答事例ＤＢ質問文側)の文字数の総和／回答事例ＤＢ質問文の文字数
（b）参照率＝回答事例ＤＢ参照回数／回答事例ＤＢ全参照回数
（c）語順一致率＝適合単語中2単語の組でその順序関係が質問／回答ＤＢ質問文と一致する組の数／適合単語2単語の組み合わせ総数
（d）類似度＝一致率×参照率×語順一致率