WO2020071398A1

WO2020071398A1 - 質問生成装置および質問生成方法

Info

Publication number: WO2020071398A1
Application number: PCT/JP2019/038845
Authority: WO
Inventors: 淳細矢; 山田　弘樹; 白井　剛
Original assignee: 株式会社日立製作所
Priority date: 2018-10-05
Filing date: 2019-10-02
Publication date: 2020-04-09
Also published as: JP2020060846A; JP7028746B2

Abstract

質問生成装置１００において、所定事項各々に関する各説明文を保持する記憶部１０１と、前記各説明文の形態素解析結果に基づき、前記各説明文における各単語の有無を記述したマトリクスの生成を行う処理と、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記各説明文のうち前記キーワードを含むものを候補説明文として特定する処理と、前記マトリクスにおける前記候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした質問木を生成する処理と、を実行する演算部１０４を含む構成とする。

Description

質問生成装置および質問生成方法

　本発明は、質問生成装置および質問生成方法に関するものである。

　商品、サービスに関して不具合等が生じた場合、そのユーザがベンダーに問い合わせを行うことは一般的である。そのためベンダー側ではお客様対応窓口やコールセンターを運用し、そうした問い合わせに対応している。

　しかしながら、そうした顧客対応に要するコストは小さくないため、近年ではチャットボットやＩＶＲ（Ｉｎｔｅｒａｃｔｉｖｅ　Ｖｏｉｃｅ　Ｒｅｓｐｏｎｓｅ）等の自動応答システムを適宜採用し、該当業務の効率化が図られつつある。

　このような自動応答システムでは、問い合わせの内容を認識し、その内容に応じた応答をコンピュータが自動実行する。この自動応答の仕組みには、いわゆるシナリオ型や一問一答型など種々のタイプが存在する。

　このうちシナリオ型の自動応答システムは、ユーザからの問い合わせを契機に、最終的な回答に至るまで、複数回のやり取りをユーザと行って回答を絞り込む。いわゆるＦＡＱの内容を単純にシステム化した一問一答型とは異なり、多少の手間と引き換えに、ユーザの望む回答を導き出せる確率が高くなりやすい特徴がある。

　こうした自動応答技術に関連する従来技術としては、例えば、予め登録されている検索条件と、検索対象である検索データからなるデータベースとによって構成され、上記検索条件についてＹｅｓ／Ｎｏで答えることによって上記検索データを絞り込むＹｅｓ／Ｎｏ型質問木を作成するＹｅｓ／Ｎｏ型質問木作成装置において、所定の検索条件によって検索データ群を抽出し、上記抽出された検索データ群を、任意の検索条件で検索できる検索データ群と、上記任意の検索条件では検索できない検索データ群とに分割するデータ分割手段と；上記登録されている検索条件のうちで、上記検索データ群について検索結果が在在する検索条件だけを、上記質問木を構成する検索条件として作成し、上記検索データ群を再帰的に分割する再帰的分割手段と；上記再帰的に検索データ群を分割する場合における当該検索データ群の評価値を、当該検索データ群における最大評価値という関数に代入する関数代入手段と；所定の検索条件で検索できる検索データ群の最大評価値と、上記所定の検索条件で検索できない検索データ群の最大評価値とを足し合わせた値を、当該検索条件における分割の最大評価値として決定する最大評価値決定手段と；上記最大評価値が最も大きくなるように、検索条件で検索データを分割する質問木、または、分割の対象となる検索データ群を質問木として設定する質問木設定手段と；を有することを特徴とするＹｅｓ／Ｎｏ型質問木作成装置（特許文献１参照）などが提案されている。

　また、対話型検索システム及びプログラム、並びに対話シナリオ生成システム及びプログラム（特許文献２参照）や、対話シナリオに対する動的対話ノードの挿入行動を制御する対話プログラム、サーバ及び方法（特許文献３参照）なども提案されている。

特開２００３－２６３４３８号公報特開２０１２－２４８１６１号公報特開２０１５－１２５１９８号公報

　上述のシナリオ型の自動応答システムは、顧客対応の品質面では確かに相応の利点を有する。しかし一方で、その運用コストが大きいという課題がある。

　すなわち、ユーザからの問い合わせに対する回答ないし追加の問いかけを順次行うためには、そうした問いかけ等を場合分けした質問木すなわちシナリオを作成し、必要に応じてメンテナンスするが必要あり、大きなコストが継続的に発生しうる。
　そこで本発明の目的は、質問木を効率的に自動生成する技術を提供することにある。

　上記課題を解決する本発明の質問生成装置は、所定事項各々に関する各説明文を保持する記憶部と、前記各説明文の形態素解析結果に基づき、前記各説明文における各単語の有無を記述したマトリクスの生成を行う処理と、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記各説明文のうち前記キーワードを含むものを候補説明文として特定する処理と、前記マトリクスにおける前記候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした質問木を生成する処理と、を実行する演算部とを備えることを特徴とする。

　また、本発明の質問生成方法は、所定事項各々に関する各説明文を保持する記憶部を備えた情報処理装置が、前記各説明文の形態素解析結果に基づき、前記各説明文における各単語の有無を記述したマトリクスの生成を行う処理と、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記各説明文のうち前記キーワードを含むものを候補説明文として特定する処理と、前記マトリクスにおける前記候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした質問木を生成する処理と、を実行することを特徴とする。

　本発明によれば、質問木を効率的に自動生成可能となる。

本実施形態の質問生成装置を含むネットワーク構成図である。本実施形態における質問生成装置のハードウェア構成例を示す図である。本実施形態のＱＡ情報のデータ構成例を示す図である。本実施形態のマトリクスのデータ構成例を示す図である。本実施形態の質問生成方法におけるフロー例１を示す図である。本実施形態の質問生成方法を示すシーケンス例１を示す図である。本実施形態における画面例１を示す図である。本実施形態における画面例２を示す図である。本実施形態における画面例３を示す図である。本実施形態の質問生成方法を示すシーケンス例２を示す図である。本実施形態における画面例４を示す図である。本実施形態における画面例５を示す図である。本実施形態における質問木の生成概念例１を示す図である。本実施形態における質問生成方法のフロー例２を示す図である。本実施形態における質問木の生成概念例２を示す図である。本実施形態における質問生成方法のフロー例３を示す図である。本実施形態における質問木の生成概念例３を示す図である。

－－－ネットワーク構成－－－
　以下に本発明の実施形態について図面を用いて詳細に説明する。図１は、本実施形態の質問生成装置１００を含むネットワーク構成図である。

　図１に示す質問生成装置１００は、質問木を効率的に自動生成するコンピュータ装置である。質問生成装置１００は、一例として、各種の金融サービスを顧客に提供する金融機関が運用するサーバ装置を想定できる。この質問生成装置１００は、チャットボット機能を有し、或いは既存のチャットボットシステムと連動し、顧客からの問い合わせに対して、適宜な応答を自動的に行う顧客対応業務用のシステムとも言える。

　従って本実施形態の質問生成装置１００は、こうしたチャットボット機能における自動応答処理に適用する質問木を、顧客からの問い合わせ機会ごとに生成し、当該チャットボット機能に提供するものとなる。

　なお、図１で例示するように、質問生成装置１００は、インターネットなどの適宜なネットワーク１０を介して、ユーザ端末２００と通信可能に接続されている。

　ユーザ端末２００は、上述の顧客が操作する端末である。当該ユーザ端末２００を操作する顧客は、所定のＷＥＢサイトを閲覧しつつ、自身が行う問い合わせの内容を入力する。

　上述のＷＥＢサイトは、例えば、金融機関が運用する顧客対応業務用のサーバ（質問生成装置１００も含みうる）がインターネット上で公開するＷＥＢサイトである。
　一方、ユーザ端末２００は、顧客が入力した問い合わせの情報を、ネットワーク１０を介して質問生成装置１００に送信することとなる。
－－－ハードウェア構成－－－

　また、本実施形態の質問生成装置１００のハードウェア構成は図２に示すものとなる。すなわち本実施形態の質問生成装置１００は、記憶部１０１、メモリ１０３、演算部１０４、入力部１０５、出力部１０６、および、通信部１０７、を備える。
　このうち、記憶部１０１は、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
　また、メモリ１０３は、ＲＡＭなど揮発性記憶素子で構成される。

　また、演算部１０４は、記憶部１０１に保持されるプログラム１０２をメモリ１０３に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうＣＰＵで構成される。
　また、入力部１０５は、ユーザからのキー入力や音声入力を受け付けるキーボード、マウス等で構成される。
　また、出力部１０６は、処理データの表示を行うディスプレイ、スピーカー等で構成される。

　また、通信部１０７は、ネットワーク１０と接続して、ユーザ端末２００等の他装置との通信処理を担うＮＦＣ（Ｎｅｔｗｏｒｋ　Ｉｎｔｅｒｆａｃｅ　Ｃａｒｄ）で構成される。

　なお、記憶部１０１内には、本実施形態の質問生成装置として必要な機能を実装する為のプログラム１０２に加えて、ＱＡ情報１２５およびマトリクス１２６が少なくとも記憶されている。このＱＡ情報１２５およびマトリクス１２６の詳細については後述する。
－－－データ構造例－－－
　続いて、本実施形態の質問生成装置１００が用いるテーブル類について説明する。図３に、本実施形態におけるＱＡ情報１２５の一例を示す。

　本実施形態のＱＡ情報１２５は、上述の金融機関において生成した、いわゆるＦＡＱなどの想定問答集である。金融機関において、顧客から問い合わせを受ける対象は、金融サービス（金融商品の概念含む）の不明点や不具合といった事項である。

　よって、このＱＡ情報１２５においては、こうした事項に関する問い合わせに対して想定される１または複数の説明分を格納している。なお、以降は「問い合わせ」を「質問」、「説明文」を「回答」と称している。

　そのデータ構造は、質問と回答の組合せを一意に特定するＩＤをキーとして、当該組合せにおける質問、当該質問に対する回答、当該回答に関する形態素解析結果、および、回答実績、といったデータから成るレコードの集合体である。

　このうち形態素解析結果は、一般的な形態素解析プログラムにより得られるもので、上述の回答（の文章）において意味を有する最小単位に該当する。こうした形態素解析結果は、質問生成装置１００が所定の形態素解析プログラムを実行した結果であってもよいし、或いは、金融機関における他の所定装置による結果であってもよい。

　また、回答実績は、当該組合せにおける質問に対して当該回答を顧客に返した回数や頻度を示す値である。図３で示すＱＡ情報１２５の例では、一例として累積回数の値を回答実績としている。

　したがって、この回答実績の値が所定の基準より大きい場合、或いは、相対的に他の組合せより大きい場合、当該組合せにおける質問に対して、当該回答が用いられやすい、ことを示している。換言すれば、顧客らが不明点等を感じる機会が多い事項（の質問）に関して、そうした顧客らの条件に合致しやすい回答、であるとも言える。

　続いて図４に、本実施形態のマトリクス１２６の一例を示す。本実施形態のマトリクス１２６は、上述のＱＡ情報１２５における各回答の形態素解析結果に基づき、当該各回答における各単語の有無を記述したテーブルである。

　そのデータ構造は、上述のＱＡ情報１２５における各組合せのＩＤをキーとして、当該組合せにおける回答での所定単語の有無といったデータから成るレコードの集合体である。

　図４の例では、上述の単語として、単語１「住所変更」、単語２「本人」、単語３「来店」、単語４「法定代理人」、・・・、といったものを示している。また、こうした単語の有無については「１」で「有」、「０」で「無」を示している。

　したがって、例えば、ＩＤ「ＴＥＸＴ１」なる組合せにおける回答では、単語１「住所変更」は「１」、単語２「本人」は「１」、単語３「来店」は「１」、単語４「法定代理人」は「０」、となっている。また、例えばＩＤ「ＴＥＸＴ２」なる組合せにおける回答では、単語１「住所変更」は「１」、単語２「本人」は「１」、単語３「来店」は「０」、単語４「法定代理人」は「０」、となっている。また、例えばＩＤ「ＴＥＸＴ３」なる組合せにおける回答では、単語１「住所変更」は「１」、単語２「本人」は「０」、単語３「来店」は「０」、単語４「法定代理人」は「１」、となっている。また、例えばＩＤ「ＴＥＸＴ４」なる組合せにおける回答では、単語１「住所変更」は「１」、単語２「本人」は「０」、単語３「来店」は「０」、単語４「法定代理人」は「０」、となっている。

　なお、マトリクス１２６には、複数のマトリクスが含まれうる。例えば、ＱＡ情報１２５における各回答のうち、所定期間における回答実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、当該頻出回答における各単語の有無を記述した頻出回答向けマトリクスが想定できる。また他にも、ＱＡ情報１２５における各回答のうち、上述の頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、当該非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスも想定できる。
－－－質問生成方法の手順について－－－

　以下、本実施形態における質問生成方法の実際手順について図に基づき説明する。以下で説明する質問生成方法に対応する各種動作は、質問生成装置１００がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
　ここではまず、マトリクス１２６の生成手順について説明する。図５は本実施形態における質問生成方法のフロー例１を示す図である。

　この場合、質問生成装置１００は、ＱＡ情報１２５における各組合せにおける回答（説明文）欄の値、すなわち文章に対して形態素解析を実行する（ｓ１）。質問生成装置１００は、形態素解析プログラムを予め保持し、適宜に呼び出して利用出来るものとする。

　上述の形態素解析により、解析対象となる文章において意味を有する最小単位を特定できることとなる。例えば、「本人によるご来店の住所変更・・・」という回答に関して得た形態素解析結果は、「本人」、「来店」、「住所変更」、を少なくとも含む単語群となる。

　続いて、質問生成装置１００は、ｓ１で得た形態素解析結果である単語群に基づき、上述の各回答（説明文）における各単語の有無に応じた所定値を、所定の雛形マトリクスに設定し、マトリクスを生成する（ｓ２）。

　上述の雛形マトリクスは、図４で例示したマトリクス１２６におけるテーブル構造に対応したマトリクスを想定できる。また、各単語の有無に応じた所定値は、同じく図４で例示したマトリクス１２６における、該当単語が「有」の場合の「１」、該当単語が「無」の場合の「０」、を想定できる。
　また、質問生成装置１００は、ｓ２で生成したマトリクスを記憶部１０１のマトリクス１２６として格納し（ｓ３）、処理を終了する。

　続いて図６は、本実施形態の質問生成方法を示すシーケンス例１を示す図である。ここで、或る顧客がユーザ端末２００を操作し、問い合わせ画面（図７Ａの画面６００）にて、「来店し住所変更したい」といった問い合わせ内容を入力し、当該問い合わせを質問生成装置１００に送信してきたとする。

　一方、これを受ける質問生成装置１００は、記憶部１０１におけるＱＡ情報１２５に対し、上述の問い合わせ内容が含むキーワード（「来店」、「住所変更」）による検索処理を実行する（ｓ１０）。

　具体的には、質問生成装置１００は、ＱＡ情報１２５における各レコードの「質問」欄の値と、上述の問い合わせ内容が含むキーワード（「来店」、「住所変更」）との照合処理を実行し、該当するレコードを候補説明文に関するレコードとして特定する。

　続いて、質問生成装置１００は、マトリクス１２６における要素のうち、ｓ１０で特定したレコードに関するものを当該レコードのＩＤに基づき特定し、ここで特定した要素に関して決定木分析を実行する（ｓ１１）。なお、決定木分析の手法自体は、既存のものを適宜に採用すればよい。

　これにより、ｓ１０の検索で特定された複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした質問木が生成される。なお、図６では、質問木を「決定木」と記している（以下同様）。

　続いて、質問生成装置１００は、ｓ１１の決定木分析で得た質問木の段数が予め定めた基準を越えるか判定する（ｓ１２）。質問木における段数とは、最初の分岐判定項目から最終的に回答を導く最後の分岐判定項目までの、分岐判定項目の数である。

　この判定の結果、上述の段数が基準を超える場合、質問生成装置１００は、図８で別途示すシーケンス例に処理を遷移させる。この遷移は、現状の質問木では顧客に対して問いかけの回数が多いため、その回数を低減するとの意図に基づくものである。

　一方、上述の判定の結果、段数が基準を超えない場合、質問生成装置１００は、ｓ１１で得た質問木を、例えばメモリ１０３における所定の記憶領域に格納する（ｓ１３）。

　また、質問生成装置１００は、当該質問木における最上位の段数における分岐判定項目に対応した質問（以下、問いかけ）を、上述のユーザ端末２００に出力する（ｓ１４）。

　ユーザ端末２００は、上述の問いかけを表示して（例：図７Ｂの画面６１０）、顧客からの回答を取得する。また、ユーザ端末２００は、ここで得た回答を質問生成装置１００に返す。

　他方、質問生成装置１００は、ユーザ端末２００から送信されてきた回答、すなわち最初の問いかけに対する回答を得て、上述の質問木に適用し、当該質問木における最終段すなわち回答に至るまで、各段の分岐判定項目に応じた問いかけを繰り返し実行する（ｓ１５～ｓ１６）。質問生成装置１００は、回答に至った場合、これをユーザ端末２００に出力し（図７Ｃの画面６２０）、処理を終了する。

　なお、上述のｓ１２での判定の結果、質問木における段数が基準を超える場合、質問生成装置１００は、図８のシーケンス例で示すように、ユーザ端末２００に対し、追加キーワード（図中では「質問絞り込み」）の要求メッセージを通知する（ｓ２１）。

　一方、ユーザ端末２００は、上述の追加キーワードの要求メッセージを表示し、顧客から、「代理人」などといった追加キーワードの入力を受け付ける（図９Ａの画面８００）。また、質問生成装置１００は、ここで受け付けた追加キーワードを質問生成装置１００に返信する。

　質問生成装置１００は、ユーザ端末２００から追加キーワードを受信し、既にｓ１０の検索で用いたキーワード（例：「住所変更」）に当該追加キーワード（例：「代理人」）を加えたアンド検索を、ＱＡ情報１２５にて実行する（ｓ２２）。

　具体的には、質問生成装置１００は、ＱＡ情報１２５における各レコードの「質問」欄の値と、上述の問い合わせ内容が含むキーワード（「住所変更」および「代理人」）との照合処理を実行し、該当するレコードを新たな候補説明文に関するレコードとして特定する。

　続いて、質問生成装置１００は、マトリクス１２６における要素のうち、ｓ２２で特定したレコードに関するものを当該レコードのＩＤに基づき特定し、ここで特定した要素に関して決定木分析を実行する（ｓ２３）。

　これにより、ｓ２２の検索で特定された新たな候補説明文に対応する複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした新たな質問木が生成される。
　続いて、質問生成装置１００は、ｓ２３の決定木分析で得た新たな質問木の段数が予め定めた基準を越えるか判定する（ｓ２４）。

　この判定の結果、上述の段数が基準を超える場合、質問生成装置１００は、ｓ２１に処理を遷移させる。この遷移は、現状の質問木では顧客に対して問いかけの回数が多いため、その回数を低減するとの意図に基づくものである。

　一方、上述の判定の結果、段数が基準を超えない場合、質問生成装置１００は、ｓ２３で得た質問木を、例えばメモリ１０３における所定の記憶領域に格納し（ｓ２５）、処理を終了する。

　ここで、上述のマトリクスと質問木との関係を踏まえた、質問木の生成概念例を図１０に示す。図１０で示す具体例は、ＱＡ情報１２５におけるレコードのうち「ＴＥＸＴ１」～「ＴＥＸＴ４」に関して「単語１」～「単語４」の各単語の有無を規定したマトリクス７００と、このマトリクス７００を決定木分析の対象とした場合の質問木７５０、を示している。

　この場合、顧客からの初回の質問７５１、すなわちユーザ端末２００から受けた問い合わせの内容は、「住所変更」である。また、この「住所変更」なるキーワードを回答（説明文）に含むレコードをＱＡ情報１２５で特定すると、「ＴＥＸＴ１」～「ＴＥＸＴ４」が特定されたものとする。

　すると、この「ＴＥＸＴ１」～「ＴＥＸＴ４」のうちいずれかを、当該顧客からの問い合わせに対する回答として特定する必要がある。よってこの「ＴＥＸＴ１」～「ＴＥＸＴ４」における「単語１」～「単語４」の各有無に基づく決定木分析により、「ＴＥＸＴ１」～「ＴＥＸＴ４」を切り分ける、質問木７５０が生成される。

　図１０の例では、分岐判定項目７５２～７５７、すなわち顧客への問いかけとして、「本人」か否か、「本人」である場合に「来店」するか否か、を順次問いかけすることで、当該顧客に提示すべき回答７６０～７６３として「ＴＥＸＴ１」と「ＴＥＸＴ２」とを切り分けできる。

　また、「本人」ではない場合に、それは「法定代理人」か否か、を順次問いかけすることで、当該顧客に提示すべき回答７６０～７６３として「ＴＥＸＴ３」と「ＴＥＸＴ４」とを切り分けできる。

　続いて、質問木生成を効率化する工夫について説明する。図１１は本実施形態における質問生成方法のフロー例２を示す図であり、図１２は本実施形態における質問木の生成概念例２を示す図である。

　この場合、質問生成装置１００は、上述のｓ１０で得た候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定する（ｓ３０）。

　具体的には、質問生成装置１００は、例えば、マトリクス１２６における各候補説明文に関する各単語の有無の値を参照し、最多の候補説明文に存在する単語、２番目に多い候補説明文に存在する単語、および、３番目に多い候補説明文に存在する単語、を特定し、当該単語らを含んでいる候補説明文に関するＩＤをマトリクス１２６にて特定する。

　なお、上述の最多の候補説明文に存在する単語、２番目に多い候補説明文に存在する単語、および、３番目に多い候補説明文に存在する単語、を特定するに際し、ＱＡ情報１２５における各候補説明文のレコードの「質問」欄の値を参照し、該当単語を特定するとしてもよい。

　また、質問生成装置１００は、上述のｓ１１における質問木の生成に際し、マトリクス１２６における要素のうち、ｓ３０で特定した優先候補説明文のレコードに関するものを当該レコードのＩＤに基づき特定して頻出単語マトリクス（図１２の頻出単語マトリクス８１０参照）を生成し、この頻出単語マトリクスに関して決定木分析を実行する（ｓ３１）。

　これにより、ｓ３０で優先候補説明文として特定された複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした頻出単語向け質問木（図１２の頻出単語向け質問木８２０参照）が生成される。

　続いて、質問生成装置１００は、ｓ３１の決定木分析で得た頻出単語向け質問木における所定段の分岐判定項目で、候補説明文（ｓ１０で得ているもの）を区分しきれているか判定する（ｓ３２）。具体的には、頻出単語向け質問木において、複数の回答が１つの分岐判定項目（最終段のもの）に紐付けられている構成（図１２の頻出単語向け質問木８２０における構成８３０）が存在するか判定する。

　上述の判定の結果、候補説明文を区分しきれている場合（ｓ３２：ｙ）、質問生成装置１００は、当該頻出単語向け質問木を、例えばメモリ１０３における所定の記憶領域に格納し（ｓ３３）、処理を終了する。

　他方、上述の判定の結果、候補説明文を区分しきれていない場合（ｓ３２：ｎ）、質問生成装置１００は、上述の候補説明文のうち、優先候補説明文以外の非優先候補説明文を特定する（ｓ３４）。

　また、質問生成装置１００は、マトリクス１２６における要素のうち、ｓ３４で特定した非優先候補説明文のレコードに関するものを当該レコードのＩＤに基づき特定して非頻出単語マトリクス（図１２の非頻出単語マトリクス８３０参照）を生成し、この非頻出単語マトリクスに関して決定木分析を実行する（ｓ３５）。

　これにより、ｓ３４で非優先候補説明文として特定された複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした非頻出単語向け質問木（図１２の非頻出単語向け質問木８４０参照）が生成される。
　また、質問生成装置１００は、当該非頻出単語向け質問木を、例えばメモリ１０３における所定の記憶領域に格納し（ｓ３６）、処理を終了する。

　また、質問木生成を効率化する別の工夫について説明する。図１３は本実施形態における質問生成方法のフロー例３を示す図であり、図１４は本実施形態における質問木の生成概念例３を示す図である。

　この場合、質問生成装置１００は、ＱＡ情報１２５における各レコードのうち、例えば、回答実績の値が所定基準以上の頻出回答であるものを特定し、当該レコードにおける形態素解析結果欄の値を取得する（ｓ４０）。

　続いて、質問生成装置１００は、上述のｓ４０で得た形態素解析結果欄の値、すなわち単語群に基づき、当該頻出回答における各単語の有無を記述した頻出回答向けマトリクス（図１４の頻出回答向けマトリクス９１０参照）を生成する（ｓ４１）。

　続いて、質問生成装置１００は、ユーザ端末２００からの問い合わせを受信し、当該問い合わせが含むキーワードに基づき、ｓ４１で特定している頻出回答のうち当該キーワードを含むものを優先候補説明文として特定する（ｓ４２）。

　また、質問生成装置１００は、ｓ４１で生成している頻出回答マトリクスにおける、上述の優先候補説明文（ｓ４２で特定したもの）に関するものを当該優先候補説明文のＩＤに基づき特定し、ここで特定した要素に関して決定木分析を実行する（ｓ４３）。

　これにより、ｓ４２で優先候補説明文として特定された複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、頻出回答向け質問木（図１４の頻出回答向け質問木９２０参照）が生成される。

　続いて、質問生成装置１００は、ｓ４３の決定木分析で得た頻出回答向け質問木における所定段の分岐判定項目で、優先候補説明文（ｓ４２で得ているもの）を区分しきれているか判定する（ｓ４４）。具体的には、頻出回答向け質問木において、複数の回答が１つの分岐判定項目（最終段のもの）に紐付けられている構成（図１４の頻出回答向け質問木９２０における構成９３０）が存在するか判定する。

　上述の判定の結果、優先候補説明文を区分しきれている場合（ｓ４４：ｙ）、質問生成装置１００は、当該頻出回答向け質問木を、例えばメモリ１０３における所定の記憶領域に格納し（ｓ４５）、処理を終了する。

　他方、上述の判定の結果、優先候補説明文を区分しきれていない場合（ｓ４４：ｎ）、質問生成装置１００は、ＱＡ情報１２５における各レコードのうち、上述の頻出回答以外の非頻出回答における形態素解析結果欄の値を取得する（ｓ４６）。

　続いて、質問生成装置１００は、上述のｓ４６で得た形態素解析結果欄の値、すなわち単語群に基づき、当該非頻出回答における各単語の有無を記述した非頻出回答向けマトリクス（図１４の非頻出回答向けマトリクス９１５参照）を生成する（ｓ４７）。
　また、質問生成装置１００は、この非頻出回答向けマトリクスに関して決定木分析を実行する（ｓ４８）。

　これにより、非優先候補説明文である複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした非頻出回答向け質問木（図１４の非頻出回答向け質問木９４０参照）が生成される。
　また、質問生成装置１００は、当該非頻出回答向け質問木を、例えばメモリ１０３における所定の記憶領域に格納し（ｓ４９）、処理を終了する。

　以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
　こうした本実施形態によれば、質問木を効率的に自動生成可能となる。

　本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の質問生成装置において、前記演算部は、前記生成した質問木の段数が所定基準を越える場合、前記端末に追加キーワードの要求メッセージを通知し、当該端末から追加キーワードを取得する処理を更に実行し、前記候補説明文の特定に際し、前記キーワードおよび前記追加キーワードに基づき、前記各説明文のうち前記キーワードおよび前記追加キーワードを含むものを新たな候補説明文として特定し、前記質問木の生成に際し、前記マトリクスにおける前記新たな候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした新たな質問木を生成し、前記新たな質問木の段数が前記所定基準を超えなくなるまで、前記追加キーワードの取得、前記新たな候補説明文の特定、および、前記新たな質問木の生成、を繰り返し行うものである、としてもよい。

　これによれば、質問木の段数が多すぎる、すなわち問い合わせを行ってきた顧客とのやりとりが多くなりすぎることになる場合、これを効果的に回避すること可能となる。ひいては、質問木をより効率的に自動生成可能となる。

　また、本実施形態の質問生成装置において、前記演算部は、前記候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定し、前記質問木の生成に際し、前記マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出単語向け質問木を生成するものである、としてもよい。

　これによれば、候補説明文の群の中で広く出現する単語を含む候補説明文を優先的に使用し、質問木を生成するため、共通性が推定される事項間でポピュラーな内容の問い合わせに対して効率的に説明文すなわち回答を導く可能性を高める。ひいては、質問木をより効率的に自動生成可能となる。

　また、本実施形態の質問生成装置において、前記演算部は、前記頻出単語向け質問木における所定段の分岐判定項目で前記候補説明文を区分しきれていない場合、前記候補説明文のうち、前記優先候補説明文以外の非優先候補説明文を特定し、前記マトリクスにおける前記非優先候補説明文に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出単語向け質問木を生成するものである、としてもよい。

　これによれば、上述の頻出単語向け質問木での説明文すなわち回答の導出が難しい状況に対して的確に対応し、ひいては、質問木をより効率的に自動生成可能となる。

　また、本実施形態の質問生成装置において、前記演算部は、前記各説明文のうち、所定期間において回答として出力された実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、前記頻出回答における各単語の有無を記述した頻出回答向けマトリクスの生成を行い、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記頻出回答のうち前記キーワードを含むものを優先候補説明文として特定し、前記頻出回答マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出回答向け質問木を生成するものである、としてもよい。

　これによれば、例えば最近の顧客が望む回答の傾向等を踏まえて、効率的に回答を導く質問木を生成しやすくなる。ひいては、質問木をより効率的に自動生成可能となる。

　また、本実施形態の質問生成装置において、前記演算部は、前記頻出回答向け質問木における所定段の分岐判定項目で前記優先候補説明文を区分しきれていない場合、前記各説明文のうち、前記頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、前記非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスの生成を行い、前記非頻出回答向けマトリクスにおける前記非頻出回答に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出回答向け質問木を生成するものである、としてもよい。

　これによれば、上述の頻出回答向け質問木での説明文すなわち回答の導出が難しい状況に対して的確に対応し、ひいては、質問木をより効率的に自動生成可能となる。

　また、本実施形態の質問生成方法において、前記情報処理装置が、前記生成した質問木の段数が所定基準を越える場合、前記端末に追加キーワードの要求メッセージを通知し、当該端末から追加キーワードを取得する処理を更に実行し、前記候補説明文の特定に際し、前記キーワードおよび前記追加キーワードに基づき、前記各説明文のうち前記キーワードおよび前記追加キーワードを含むものを新たな候補説明文として特定し、前記質問木の生成に際し、前記マトリクスにおける前記新たな候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした新たな質問木を生成し、前記新たな質問木の段数が前記所定基準を超えなくなるまで、前記追加キーワードの取得、前記新たな候補説明文の特定、および、前記新たな質問木の生成、を繰り返し行う、としてもよい。

　また、本実施形態の質問生成方法において、前記情報処理装置が、前記候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定し、前記質問木の生成に際し、前記マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出単語向け質問木を生成する、としてもよい。

　また、本実施形態の質問生成方法において、前記情報処理装置が、前記頻出単語向け質問木における所定段の分岐判定項目で前記候補説明文を区分しきれていない場合、前記候補説明文のうち、前記優先候補説明文以外の非優先候補説明文を特定し、前記マトリクスにおける前記非優先候補説明文に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出単語向け質問木を生成する、としてもよい。

　また、本実施形態の質問生成方法において、前記情報処理装置が、前記各説明文のうち、所定期間において回答として出力された実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、前記頻出回答における各単語の有無を記述した頻出回答向けマトリクスの生成を行い、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記頻出回答のうち前記キーワードを含むものを優先候補説明文として特定し、前記頻出回答マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出回答向け質問木を生成する、としてもよい。

　また、本実施形態の質問生成方法において、前記情報処理装置が、前記頻出回答向け質問木における所定段の分岐判定項目で前記優先候補説明文を区分しきれていない場合、前記各説明文のうち、前記頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、前記非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスの生成を行い、前記非頻出回答向けマトリクスにおける前記非頻出回答に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出回答向け質問木を生成する、としてもよい。

１０　　ネットワーク
１００　質問生成装置
１０１　記憶部
１０２　プログラム
１０３　メモリ
１０４　演算部
１０５　入力部
１０６　出力部
１０７　通信部
１２５　情報
１２６　情報
１２７　情報
２００　ユーザ端末

Claims

　所定事項各々に関する各説明文を保持する記憶部と、
　前記各説明文の形態素解析結果に基づき、前記各説明文における各単語の有無を記述したマトリクスの生成を行う処理と、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記各説明文のうち前記キーワードを含むものを候補説明文として特定する処理と、前記マトリクスにおける前記候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした質問木を生成する処理と、を実行する演算部と、
　を備えることを特徴とする質問生成装置。
　前記演算部は、
　前記生成した質問木の段数が所定基準を越える場合、
　前記端末に追加キーワードの要求メッセージを通知し、当該端末から追加キーワードを取得する処理を更に実行し、
　前記候補説明文の特定に際し、前記キーワードおよび前記追加キーワードに基づき、前記各説明文のうち前記キーワードおよび前記追加キーワードを含むものを新たな候補説明文として特定し、
　前記質問木の生成に際し、前記マトリクスにおける前記新たな候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした新たな質問木を生成し、
　前記新たな質問木の段数が前記所定基準を超えなくなるまで、前記追加キーワードの取得、前記新たな候補説明文の特定、および、前記新たな質問木の生成、を繰り返し行うものである、
　ことを特徴とする請求項１に記載の質問生成装置。
　前記演算部は、
　前記候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定し、
　前記質問木の生成に際し、前記マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出単語向け質問木を生成するものである、
　ことを特徴とする請求項１に記載の質問生成装置。
　前記演算部は、
　前記頻出単語向け質問木における所定段の分岐判定項目で前記候補説明文を区分しきれていない場合、前記候補説明文のうち、前記優先候補説明文以外の非優先候補説明文を特定し、
　前記マトリクスにおける前記非優先候補説明文に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出単語向け質問木を生成するものである、
　ことを特徴とする請求項３に記載の質問生成装置。
　前記演算部は、
　前記各説明文のうち、所定期間において回答として出力された実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、前記頻出回答における各単語の有無を記述した頻出回答向けマトリクスの生成を行い、
　所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記頻出回答のうち前記キーワードを含むものを優先候補説明文として特定し、
　前記頻出回答マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出回答向け質問木を生成するものである、
　ことを特徴とする請求項１に記載の質問生成装置。
　前記演算部は、
　前記頻出回答向け質問木における所定段の分岐判定項目で前記優先候補説明文を区分しきれていない場合、
　前記各説明文のうち、前記頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、前記非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスの生成を行い、
　前記非頻出回答向けマトリクスにおける前記非頻出回答に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出回答向け質問木を生成するものである、
　ことを特徴とする請求項５に記載の質問生成装置。
　所定事項各々に関する各説明文を保持する記憶部を備えた情報処理装置が、
　前記各説明文の形態素解析結果に基づき、前記各説明文における各単語の有無を記述したマトリクスの生成を行う処理と、
　所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記各説明文のうち前記キーワードを含むものを候補説明文として特定する処理と、
　前記マトリクスにおける前記候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした質問木を生成する処理と、
　を実行することを特徴とする質問生成方法。
　前記情報処理装置が、
　前記生成した質問木の段数が所定基準を越える場合、
　前記端末に追加キーワードの要求メッセージを通知し、当該端末から追加キーワードを取得する処理を更に実行し、
　前記候補説明文の特定に際し、前記キーワードおよび前記追加キーワードに基づき、前記各説明文のうち前記キーワードおよび前記追加キーワードを含むものを新たな候補説明文として特定し、
　前記質問木の生成に際し、前記マトリクスにおける前記新たな候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした新たな質問木を生成し、
　前記新たな質問木の段数が前記所定基準を超えなくなるまで、前記追加キーワードの取得、前記新たな候補説明文の特定、および、前記新たな質問木の生成、を繰り返し行う、
　ことを特徴とする請求項７に記載の質問生成方法。
　前記情報処理装置が、
　前記候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定し、
　前記質問木の生成に際し、前記マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出単語向け質問木を生成する、
　ことを特徴とする請求項７に記載の質問生成方法。
　前記情報処理装置が、
　前記頻出単語向け質問木における所定段の分岐判定項目で前記候補説明文を区分しきれていない場合、前記候補説明文のうち、前記優先候補説明文以外の非優先候補説明文を特定し、
　前記マトリクスにおける前記非優先候補説明文に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出単語向け質問木を生成する、
　ことを特徴とする請求項９に記載の質問生成方法。
　前記情報処理装置が、
　前記各説明文のうち、所定期間において回答として出力された実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、前記頻出回答における各単語の有無を記述した頻出回答向けマトリクスの生成を行い、
　所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記頻出回答のうち前記キーワードを含むものを優先候補説明文として特定し、
　前記頻出回答マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出回答向け質問木を生成する、
　ことを特徴とする請求項７に記載の質問生成方法。
　前記情報処理装置が、
　前記頻出回答向け質問木における所定段の分岐判定項目で前記優先候補説明文を区分しきれていない場合、
　前記各説明文のうち、前記頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、前記非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスの生成を行い、
　前記非頻出回答向けマトリクスにおける前記非頻出回答に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出回答向け質問木を生成する、
　ことを特徴とする請求項１１に記載の質問生成方法。