JP2021096711A

JP2021096711A - 情報処理プログラム、情報処理方法および情報処理装置

Info

Publication number: JP2021096711A
Application number: JP2019228534A
Authority: JP
Inventors: 片岡　正弘; Masahiro Kataoka; 正弘片岡; 延寛坂本; Nobuhiro Sakamoto; 泰裕鈴木; Yasuhiro Suzuki; 徹也西村; Tetsuya Nishimura
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-12-18
Filing date: 2019-12-18
Publication date: 2021-06-24
Also published as: US20210191939A1; US11449501B2

Abstract

【課題】ＦＡＱの抽出精度を向上させる情報処理プログラム、情報処理方法および情報処理装置を提供する。【解決手段】情報処理プログラムは、入力を受け付けた利用者入力文データをベクトル変換して第１のベクトルデータを生成し、記憶部に記憶された複数のベクトルデータをそれぞれ含む複数のＦＡＱデータのうち、第１ベクトルデータを含む複数のＦＡＱデータを特定し、特定した複数のＦＡＱデータに含まれるあるデータ内の第１のベクトルデータ以外のベクトルデータそれぞれと、特定した複数のＦＡＱデータに含まれるあるデータ以外のデータ内の第１のベクトルデータ以外のベクトルデータそれぞれとの類似度に基づいて、入力を受け付けた利用者入力文データに対して出力するデータを決定する。【選択図】図１４Ｂ

Description

本発明は、情報処理プログラム、情報処理方法および情報処理装置に関する。

従来、ＦＡＱ（Frequently Asked Questions）を使用して適切な回答を提供する技術は広く知られている。さらに、ＦＡＱの中から適切な選択を行うために、自動応答サービスであるチャットボットを用いてＦＡＱ検索を行う技術の導入が進んでいる。

ＦＡＱ検索では、利用者の質問文に対して多数の候補がヒットする場合が多い。その場合、検索結果を類似度の高い順に並べた場合の上位数件以内に正解候補が入ることが好ましい。

従来のＦＡＱ検索では、検索精度を高めるために、利用者の質問文と利用者が選択したＦＡＱの回答文との組を教師データとして、ＲＮＮ（Recurrent Neural Network）機械学習が行われる。

ここで、文章や文（以下、単に文）を解析し、文を構成する各単語をベクトルで表現する従来技術として、word2vec（Skip-Gram ModelまたはCBOW）等がある。表記の異なる単語であっても、意味が類似している単語同士は、ベクトルの値も類似するという特徴がある。以下の説明では、単語のベクトルを、「単語ベクトル」と表記する。

例えば、ＲＮＮ機械学習において、単語ベクトルを用いて入力文から出力文を得る技術としては、機械翻訳が実用化されている。機械翻訳は、１つの入力文に対して、ＲＮＮ機械学習で計算されたハイパーパラメータにより、文を構成する単語を置き換えて１つの出力文を作成する処理であるため、ＲＮＮによる高精度な翻訳が実現可能である。

ＦＡＱ検索においても、質問文と回答文との教師データとＲＮＮ機械学習し、ハイパーパラメータが計算される。このハイパーパラメータと単語ベクトルとを用いて、利用者の質問文に対し、高い精度で最適な回答文を抽出する技術が提案されている。

一方、対話型の応答システムとして、深層学習に基づいてナレッジグラフで自動質問応答を行う従来技術がある。また、学習用の発話文と関連文と応答文を用いて、関連文を入力とし応答文を出力として学習を行い、入力された発話文の関連文を取得して応答文を生成する従来技術がある。また、複数の利用者のソーシャルデータを学習素材とし共通の形態を一般化モデルとして作成し、入力データを基に一般化モデルを検索して蓄積された質問のうちある程度の表記の揺らぎを考慮して一致するかどうかを判定する従来技術がある。

特開２０１７−７６４０３号公報特開２０１９−４０５７４号公報特開２０１７−２２４１９０号公報

しかしながら、ＦＡＱの質問文や回答文の各文章を構成する文の数量が増加すると、ＲＮＮ機械学習による回答文の抽出精度が低下する。そのため、多量な教師データの整備や多階層のＲＮＮ機械学習の演算量の増加に対する対策が必要となっている。

また、利用者が入力した質問文のテキストが短く、ＦＡＱを特定するための情報が不足する場合がある。そのような場合、回答文の候補が急増するため、抽出精度が低下して利用者が取得したいＦＡＱが検索結果を類似度順に並べた場合の上位に入らないおそれがある。

さらに、対話型の応答システムにおいても、利用者の質問文を補充するために、どのような文を応答すれば良いのかを判定する技術が確立されていない。

開示の技術は、上記に鑑みてなされたものであって、ＦＡＱの抽出精度を向上させる情報処理プログラム、情報処理方法および情報処理装置を提供することを目的とする。

本願の開示する情報処理プログラム、情報処理方法および情報処理装置の一つの態様において、入力を受け付けた第１の文章データをベクトル変換して第１のベクトルデータを生成し、記憶装置に記憶された複数のベクトルデータをそれぞれ含む複数の第２の文章データのうち、前記第１ベクトルデータを含む複数の前記第２の文章データを特定し、特定した複数の前記第２の文章データに含まれるあるデータ内の前記第１のベクトルデータ以外のベクトルデータそれぞれと、特定した複数の前記第２の文章データに含まれる前記あるデータ以外のデータ内の前記第１のベクトルデータ以外のベクトルデータそれぞれとの類似度に基づいて、入力を受け付けた前記第１の文章データに対して出力する出力データを決定する。

１つの側面では、本発明は、ＦＡＱの抽出精度を向上させることができる。

図１は、チャットボットによるＦＡＱ検索システムのシステム構成図である。図２は、ＦＡＱデータの内容の一例を表す図である。図３は、実施例１に係る情報処理装置のＲＮＮの学習時の処理の一例を説明するための図である。図４は、ＲＮＮの学習時の処理の詳細を表す図である。図５は、実施例１に係る情報処理装置の利用者からの質問に対するＦＡＱデータの特定処理の一例を説明するための図である。図６は、ＦＡＱデータの特定処理の詳細を表す図である。図７は、実施例１に係る情報処理装置の質問追加補充要求判定処理の一例を説明するための図である。図８は、実施例１に係る情報処理装置の文ベクトル生成部による文ベクトルの生成を説明するための図である。図９は、実施例１に係る情報処理装置によるＦＡＱデータの文と文ベクトルとの取得処理を説明するための図である。図１０は、実施例１に係る情報処理装置による質問要求補充文の選択処理を説明するための図である。図１１は、質問補充要求文リストの一例を表す図である。図１２は、ＦＡＱデータと質問補充要求文との関係について説明するための図である。図１３は、実施例１に係る情報処理装置における質問補充要求処理の詳細を説明するための図である。図１４Ａは、実施例１に係る情報処理装置によるＲＮＮ機械学習処理のフローチャートである。図１４Ｂは、実施例１に係る情報処理装置による回答処理のフローチャートである。図１５は、実施例１に係る情報処理装置のブロック図である。図１６は、ＲＮＮ処理部の詳細を表すブロック図である。図１７は、質問補充要求処理部の詳細を表すブロック図である。図１８は、ＦＡＱ質問文と質問補充要求文とを用いたＲＮＮ機械学習の一例を示す図である。図１９は、実施例２に係る情報処理装置における質問補充要求処理の詳細を説明するための図である。図２０は、実施例２に係る情報処理装置による回答処理のフローチャートである。図２１は、コンピュータのハードウェア構成図である。

以下に、本願の開示する情報処理プログラム、情報処理方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、以下の実施例により本願の開示する情報処理プログラム、情報処理方法および情報処理装置が限定されるものではない。

図１は、チャットボットによるＦＡＱ検索システムのシステム構成図である。チャットボットによるＦＡＱ検索システムは、例えば図１に示すように、利用者端末２に接続された情報処理装置１を有する。

利用者端末２は、ＦＡＱを利用するユーザが使用する端末である。利用者端末２は、利用者により入力された質問を情報処理装置１へ送信する。その後、利用者端末２は、質問に対するＦＡＱを用いた回答を情報処理装置１から取得し、取得した回答を利用者へ提供する。

情報処理装置１は、ＡＩ（Artificial Intelligence）チャットボット１１が動作する。ＡＩチャットボット１１は、ＡＰＩ（Application Programing Interface）１２を介して、利用者端末２とデータの送受信を行う。また、ＡＩチャットボット１１は、音声制御機能１３、対話制御機能１４、自動機械学習機能１５及びナレッジ検索機能１６を有する。

音声制御機能１３により、音声認識及び音声合成などが実行される。利用者端末２から音声でデータが入力された場合、音声制御機能１３により、音声を用いたデータの送受信が行われる。

対話制御機能１４は、表現認識、形態素解析及びスクリプト編集などが実行される。対話制御機能１４は、利用者端末２から入力されたデータに対して対話を行う。

自動機械学習機能１５は、個別辞書及び会話検索履歴などを用いてＦＡＱや対話に関する機械学習を行う。例えば、自動機械学習機能１５は、ＲＮＮ機械学習を実行してＦＡＱ質問文に対するＦＡＱ回答文を出力するためのＲＮＮのハイパーパラメータを計算する。

ナレッジ検索機能１６は、ＦＡＱデータや共通辞書などを用いて、利用者端末２から入力された質問文に対して適切なＦＡＱ回答文を特定する。また、本実施例に係るナレッジ検索機能１６は、ＦＡＱ回答文を特定するためにＦＡＱ質問文が十分でない場合に、ＦＡＱ質問文の追加要求をするための追加要求文を生成する。

図２は、ＦＡＱデータの内容の一例を表す図である。このＦＡＱデータ１５０が、「第２の文章データ」の一例にあたる。ＦＡＱデータ１５０は、質問概要とその質問概要に対応する回答概要を有する。ＦＡＱデータ１５０の質問概要の文章を、以下ではＦＡＱ質問文という。また、ＦＡＱデータ１５０の回答概要を、以下ではＦＡＱ回答文という。ＦＡＱ質問文が、「あるデータ」の一例にあたる。

さらに、ＦＡＱデータ１５０は、現象及び質問項目、ヒアリング項目、資料採取項目、調査及び解析項目、原因項目、並びに、対処方法及び回答項目の各項目のデータを含む。このＦＡＱデータ１５０が、「第２の文章データ」の一例にあたる。

現象及び質問内容項目は、当該ＦＡＱデータ１５０が適応される場合の、発生した現象や利用者から入力される質問内容が登録される。すなわち、現象及び質問内容項目に登録された現象が起こっている場合や利用者からの質問に登録された質問内容が含まれる場合に、当該ＦＡＱデータ１５０の回答の内容が利用者に提供される。

ヒアリング項目は、当該ＦＡＱデータ１５０を適用する場合か否かを判定するために利用者に対してヒアリングを行う内容が登録される。すなわち、このヒアリング項目の内容に対する回答を利用者から取得することで、当該ＦＡＱデータ１５０を適用する場合か否かが判定可能となる。

資料採取項目は、当該ＦＡＱデータ１５０を適用する場合か否かを判定するために採取することが好ましい資料の一覧と手順が登録される。すなわち、資料採取項目に登録された手順にしたがい取得される資料により、当該ＦＡＱデータ１５０を適用する場合か否かが判定可能となる。

調査及び解析項目は、当該ＦＡＱデータ１５０を適用する場合か否かを判定するための情報が登録される。すなわち、調査及び解析項目に登録された情報を取得することで、当該ＦＡＱデータ１５０を適用する場合か否かが判定可能となる。

原因項目は、質問概要に登録された内容が発生した場合の原因が登録される。対処方法は、発生した現象に対する対処方法が登録される。

次に、図３及び図４を参照して、本実施例に係る情報処理装置１によるＲＮＮ機械学習の処理について説明する。以下に説明するＲＮＮ機械学習の処理は、図１で示した自動機械学習機能１５にあたる。

情報処理装置１は、ＦＡＱデータの多量な文に対応した多階層ＲＮＮ機械学習を実現するため、ＦＡＱの質問文と回答文を教師データとして、単語の上位である文の粒度のＲＮＮ機械学習により、ＲＮＮのハイパーパラメータを計算する。図３は、実施例１に係る情報処理装置のＲＮＮの学習時の処理の一例を説明するための図である。図４は、ＲＮＮの学習時の処理の詳細を表す図である。

情報処理装置１は、ＦＡＱデータ１５０を予め有する。また、情報処理装置１は、２００次元ベクトル単語ベクトルテーブル１５１、次元圧縮された、例えば７次元単語ベクトルテーブル１５２、７次元文グループベクトルテーブル１５３（以降、７次元単語ベクトルテーブル１５２、７次元文グループベクトルテーブル１５３と記す。）、及び次元復元された２００次元文グループベクトルテーブル１５４を予め生成する。ここで、word2vecにより２００次元の単語ベクトルが表現される。次に、文ベクトルのサイズの縮小や集計の計算量を削減するために、２００次元から素数の次元などの共通の次元を選択し、直交変換を用いてベクトルの次元圧縮を行うことで、７次元単語ベクトルテーブル１５２を生成する。また、文を構成する各単語に対し、この７次元単語ベクトルテーブルを用いて、単語ベクトルを集計した文ベクトルをグループ化することで、７次元文グループベクトルテーブル１５３を生成する。さらに、ＲＮＮ機械学習のため、直交変換を用いて、２００次元文グループベクトルテーブル１５４を次元復元し、生成することができる。

図３に示すように、情報処理装置１が有する学習部４２１は、ＦＡＱデータ１５０を取得する。さらに、学習部４２１は、２００次元単語ベクトルテーブル１５１と、７次元単語ベクトルテーブル１５２を取得する。そして、学習部４２１は、ＦＡＱデータ１５０を教師データとして、７次元単語ベクトルテーブル１５２を用いて文ベクトルを集計し、７次元文ベクトルグループテーブル１５３及び２００次元文ベクトルグループテーブル１５４を用いて、ＲＮＮのハイパーパラメータを計算して学習データ１５５とする。

次に、図４を参照して、学習部４２１によるＲＮＮの学習時の処理の詳細について説明する。学習部４２１は、教師データとなる複数のＦＡＱデータ１５０の中から１つの文章であるＦＡＱデータ１５０を選択する。次に、学習部４２１は、選択したＦＡＱデータ１５０のＦＡＱ質問文及びＦＡＱ回答文に含まれる複数の文を抽出する。例えば、学習部４２１は、ＦＡＱ質問文及びＦＡＱ回答文を走査し、句読点で区切られる部分を、文として抽出する。

学習部４２１は、抽出した複数の文のうち、一つの文を選択し、選択した文に対して形態素解析を実行することで、選択した文に含まれる複数の単語を特定する。学習部４２１は、特定した単語と、７次元単語ベクトルテーブル１５２とを比較して、各単語の７次元の単語ベクトルを特定する。次に、学習部４２１は、例えば、特定した７次元の単語ベクトルを足し合わせることで、選択した文の７次元の文ベクトルを算出する。学習部４２１は、選択したＦＡＱ質問文及びＦＡＱ回答文における他の文についても同様にして、７次元の文ベクトルを算出する（ステップＳ１０１）。図４における、文ベクトルＶｑｓ１〜Ｖｑｓ４が、ＦＡＱデータ１５０のＦＡＱ質問文に含まれる各文の７次元の文ベクトルを表す。また、文ベクトルＶａｓ１〜Ｖａｓ４が、ＦＡＱデータ１５０のＦＡＱ回答文に含まれる各文の７次元の文ベクトルを表す。

また、学習部４２１は、７次元文グループベクトルテーブル１５３を参照して各文に類似する文ベクトルを有する文グループを特定し、ＦＡＱデータ１５０のＦＡＱ質問文及びＦＡＱ回答文に含まれる各文がどの文グループに振り分けられるか判定する（ステップＳ１０２）。図４では、ＦＡＱ質問文に含まれる各文がそれぞれ、文グループＧｑ１〜Ｇｑ４に含まれる。また、ＦＡＱ回答文に含まれる各文がそれぞれ、文グループＧａ１〜Ｇａ４に含まれる。

次に、学習部４２１は、２００次元文グループベクトルテーブル１５４を参照して、各文の文グループに対応する２００次元の文ベクトルを特定して、ＦＡＱ質問文の各文の文ベクトルを２００次元に展開する（ステップＳ１０３）。図４では、ＦＡＱ質問文に含まれる各文の文ベクトルはそれぞれ、２００次元の文ベクトルＶ’ｑｓ１〜Ｖ’ｑｓ４に展開される。学習部４２１は、ステップＳ１０１〜Ｓ１０３の処理を、全てのＦＡＱデータ１５０について実行する。

学習部４２１は、各ＦＡＱデータ１５０のＦＡＱ質問文に含まれる各文の２００次元の文ベクトル２０１を入力とし、ＦＡＱ回答文に含まれる各文の７次元の文ベクトル２０２を出力としてＲＮＮ機械学習を実行する。学習部４２１は、入力及び出力となる各データを教師データとして次々読み込みＲＮＮのハイパーパラメータを算出する（ステップＳ１０４）。そして、学習部４２１は、算出したハイパーパラメータを学習データ１５５とする。

次に、本実施例に係る情報処理装置１によるＲＮＮの適用時の処理について説明する。図５及び６を参照して、情報処理装置１による利用者入力文データ２００に対するＦＡＱデータ１５０の特定処理について説明する。図５は、実施例１に係る情報処理装置の利用者からの質問に対するＦＡＱデータの特定処理の一例を説明するための図である。また、図６は、ＦＡＱデータの特定処理の詳細を表す図である。

特定部４２２は、利用者入力文リスト２０１から利用者入力文データ２００を取得する。そして、特定部４２２は、７次元単語ベクトルテーブル１５２、７次元文グループベクトルテーブル１５３及び２００次元文グループベクトルテーブル１５４を参照して、利用者入力文データ２００に含まれる各文の２００次元の文ベクトルを求める。次に、特定部４２２は、特定した文ベクトルをＲＲＮの入力としてＲＮＮ機械学習の学習結果を用いてＦＡＱ回答文の文グループを出力として得る。そして、特定部４２２は、ＦＡＱデータ１５０及び学習データ１５５を用いて、取得した文グループに含まれるＦＡＱ回答文３０１を取得する。その後、特定部４２２は、取得したＦＡＱ回答文３０１を生成部４２３へ出力する。

生成部４２３は、特定部４２２から取得したＦＡＱ回答文３０１と利用者入力文データ２００との類似度を求める。例えば、生成部４２３は、ＦＡＱ回答文３０１及び利用者入力文データ２００の各文の文ベクトルを、７次元単語ベクトルテーブル１５２を用いて求める。また、単語の位置と７次元単語ベクトルを対応付けた単語ベクトルインデックス１５６と、文の位置と７次元文グループベクトルを対応付けた文グループベクトルインデックス１５７を生成する。

そして、生成部４２３は、利用者入力文データ２００の各文の文ベクトルとＦＡＱ回答文３０１の各文の文ベクトルとをＣＯＳ類似度比較し、各文の類似度を集積した値からＦＡＱ回答文３０１と利用者入力文データ２００との類似度を求める。その後、生成部４２３は、類似度順のＦＡＱ回答文３０１のランキングを求める。そして、生成部４２３は、ランキング順ＦＡＱ回答文３０２のリストを生成して利用者端末２へ送信することで、ランキング順ＦＡＱ回答文３０２を利用者に提供する。

次に、図６を参照して、特定部４２２によるＲＮＮの適用時の処理の詳細について説明する。特定部４２２は、利用者入力文データ２００を利用者入力文リスト２０１から取得する。次に、特定部４２２は、取得した利用者入力文データ２００に含まれる複数の文を抽出する。

特定部４２２は、抽出した複数の文のうち、一つの文を選択し、選択した文に対して形態素解析を実行することで、選択した文に含まれる複数の単語を特定する。特定部４２２は、特定した単語と、７次元単語ベクトルテーブル１５２とを比較して、各単語の７次元の単語ベクトルを特定する。次に、特定部４２２は、特定した７次元の単語ベクトルを足し合わせることで、選択した文の７次元の文ベクトルを算出する。特定部４２２は、利用者入力文データ２００における他の文についても同様にして、７次元の文ベクトルを算出する（ステップＳ１１１）。図６における、文ベクトルＶｑｓｘｘ〜Ｖｑｓｚｚが、利用者入力文データ２００に含まれる各文の７次元の文ベクトルを表す。

次に、特定部４２２は、７次元文グループベクトルテーブル１５３を参照して各文に類似する文ベクトルを有する文グループを特定し、利用者入力文データ２００のＦＡＱ質問文及びＦＡＱ回答文に含まれる各文がどの文グループに振り分けられるか判定する（ステップＳ１１２）。図６では、利用者入力文データ２００に含まれる各文がそれぞれ、文グループＧｑｘｘ〜Ｇｑｚｚに含まれる。

次に、特定部４２２は、２００次元文グループベクトルテーブル１５４を参照して、各文の文グループに対応する２００次元の単語ベクトルを特定して、利用者入力文データ２００の各文の文ベクトルを２００次元に展開する（ステップＳ１１３）。図７では、利用者入力文データ２００に含まれる各文の文ベクトルはそれぞれ、２００次元の文ベクトルＶ’ｑｓｘｘ〜Ｖ’ｑｘｚｚに展開される。

特定部４２２は、利用者入力文データ２００に含まれる各文の２００次元の文ベクトル３０３を入力とし、学習データ１５５に含まれるＲＮＮのパラメータを用いることで、ＦＡＱ回答文の文グループを出力として得る（ステップＳ１１４）。そして、特定部４２２は、取得した文グループに含まれるＦＡＱ回答文を取得する。その後、特定部４２２は、取得したＦＡＱ回答文を生成部４２３へ出力する。

利用者の質問文が多数の文（例えば、３文）で構成される場合、利用者が求めるＦＡＱデータ１５０を特定可能である。しかし、質問文を構成する文が少ない場合、ＦＡＱ候補のヒット件数が急増し、特定が困難になる。そこで、本実施例に係る情報処理装置１は、利用者から取得した質問文がＦＡＱ質問文を構成する文が、例えば３文以上であるか否かを判定し、３文以上の場合には、利用者が求めるＦＡＱデータ１５０を特定し、３文未満の場合には質問補充要求文を利用者に通知して、さらに質問文を追加取得する。

図７を参照して、質問補充要求を行うか否かの判定処理について説明する。図７は、実施例１に係る情報処理装置の質問追加補充要求判定処理の一例を説明するための図である。

情報処理装置１は、利用者により入力された質問文である利用者入力文データ２００の入力を利用者端末２から受ける。判定部１４１は、利用者入力文データ２００に含まれる文を特定する。そして、判定部１４１は、利用者入力文データ２００に含まれる文をそれぞれ利用者入力文リスト２０１に登録する。この利用者入力文データ２００が、「第１の文章データ」の一例にあたる。

次に、判定部１４１は、利用者入力文リスト２０１に登録された文が３文以上か否かを判定する。そして、判定部１４１は、利用者登録リストに登録された文が３文以上の場合、ＦＡＱデータ１５０の特定処理の実行を特定部４２２に指示する。

これに対して、利用者登録リストに登録された文が３文未満の場合、判定部１４１は、質問補充要求実行の指示を文ベクトル生成部４３１に指示する。その後、質問補充要求が利用者に対して行われ、利用者から追加の質問文が入力された場合、判定部１４１は、新たに追加された質問文を利用者入力文リスト２０１に追加し、質問補充要求を行うか否かの判定処理を行う。

また、利用者入力文データ２００に含まれる文が３文未満の場合、情報処理装置１は、取得した利用者入力文データ２００を用いて追加の質問を決定し、利用者に対して追加の質問の補充を要求する。次に、本実施例に係る情報処理装置１による質問補充要求処理について説明する。以下に説明する、質問補充要求処理は、図１で示したナレッジ検索機能１６にあたる。

図８は、実施例１に係る情報処理装置の文ベクトル生成部による文ベクトルの生成を説明するための図である。利用者入力文データ２００に含まれる文が３文未満の場合、情報処理装置１の文ベクトル生成部４３１は、質問補充要求処理の実行の指示を判定部１４１から受ける。そして、文ベクトル生成部４３１は、利用者入力文リスト２０１から利用者入力文データ２００を取得する。そして、文ベクトル生成部４３１は、利用者入力文データ２００に含まれる文を抽出する。例えば、文ベクトル生成部４３１は、利用者入力文データ２００を走査し、句読点で区切られる部分を、文として抽出する。

文ベクトル生成部４３１は、抽出した複数の文のうち、一つの文を選択し、選択した文に対して形態素解析を実行することで、選択した文に含まれる複数の単語を特定する。文ベクトル生成部４３１は、特定した単語と、７次元単語ベクトルテーブル１５２とを比較して、各単語の７次元の単語ベクトルを特定する。次に、文ベクトル生成部４３１は、特定した７次元の単語ベクトルを足し合わせることで、選択した文の７次元の文ベクトルを算出する。文ベクトル生成部４３１は、利用者入力文データ２００に含まれる各文の文ベクトルを算出する。そして、文ベクトル生成部４３１は、利用者入力文データ２００に含まれる各文の文ベクトルを出力する。この文ベクトル生成部４３１が、「生成部」の一例にあたる。また、利用者入力文データ２００に含まれる各文の７次元の文ベクトルの取得が、「ベクトル変換」の一例にあたる。そして、この利用者入力文データ２００に含まれる各文の７次元の文ベクトルが、「第１のベクトルデータ」の一例にあたる。

図９は、実施例１に係る情報処理装置によるＦＡＱデータの文と文ベクトルの取得処理を説明するための図である。検索部４３２は、利用者入力文データ２００に含まれる各文の文ベクトルを取得する。そして、検索部４３２は、各文の文ベクトルをもとに、文グループベクトルインデックス１５７を参照して、ＦＡＱデータ１５０を取得する。そして、検索部４３２は、利用者入力文データ２００に含まれる各文の文ベクトルと各ＦＡＱデータ１５０に含まれる各文の文ベクトルとをＣＯＳ類似度比較して、利用者入力文データ２００に含まれる各文に最も類似する文が含まれるＦＡＱデータ１５０を特定する。その後、検索部４３２は、特定した類似度が最も高いＦＡＱデータ１５０に含まれる文のうち、利用者入力文データ２００に含まれる各文以外の文を１つ選択する。ここで、検索部４３２は、例えば、利用者入力文データ２００に含まれる各文に類似する文が含まれる複数のＦＡＱデータ１５０の中で最も使用頻度の高い文を１つ選択する。その後、検索部４３２は、類似度が最も高いＦＡＱデータ１５０に含まれる利用者入力文データ２００に含まれる文以外の文ベクトルを出力する。この検索部４３２が、「特定部」の一例にあたる。

図１０は、実施例１に係る情報処理装置による質問要求補充分の選択処理を説明するための図である。情報処理装置１の質問補充要求文取得部４３３は、類似度が最も高いＦＡＱデータ１５０に含まれる利用者入力文データ２００に含まれる文以外の文の文ベクトルの入力を受ける。そして、質問補充要求文取得部４３３は、取得した文ベクトルに最も類似度が高い質問補充要求文を質問補充要求文リスト１５８の中から取得する。質問補充要求文取得部４３３は、取得した質問補充要求文を出力する。

図１１は、質問補充要求文リストの一例を表す図である。質問補充要求文リスト１５８は、質問補充要求文とともにその質問補充要求文の文ベクトルが格納される。情報処理装置１は、質問補充要求文リスト１５８を予め有する。

ここで、図１２を参照して、ＦＡＱデータ１５０と質問補充要求文との関係について説明する。図１２は、ＦＡＱデータと質問補充要求文との関係について説明するための図である。図１２の上段は、ＦＡＱデータ１５０に含まれる文であり、下段は、質問要求補充文である。そして、図１２に記載したＦＡＱデータ１５０に含まれる文は、下段の質問要求補充文の回答になっている。そして、図１２では、各文に含まれる各単語の文ベクトルが、各文の下に記載されている。図１２に示すように、ＦＡＱデータ１５０に含まれる文の文ベクトルが質問補充要求文の回答となる場合には、ＦＡＱデータ１５０に含まれる文と質問要求補充文との双方に同様の単語ベクトルを有する単語が多く含まれる。図１２では、単語ベクトルＶ１〜Ｖ３及びＶ５が同じ単語ベクトルである。このため、ＦＡＱデータ１５０に含まれる文と質問要求補充文とは、文ベクトルの類似度が高くなるといえる。そこで、質問補充要求文取得部４３３は、選択したＦＡＱデータ１５０に含まれる文と文ベクトルが類似する質問補充要求文を選択することで、ＦＡＱデータ１５０に含まれる文を得ることができる質問補充要求文を得ることができる。

質問補充要求文取得部４３３は、選択した質問補充要求文を利用者端末２に送信して表示させることで、利用者に質問補充要求文を提供する。利用者は、質問補充要求文取得部４３３から提供された質問補充要求文に対してその回答を情報処理装置１へ送信する。これにより、情報処理装置１は、追加のＦＡＱ質問文を利用者から取得できる。この質問補充要求文取得部４３３が、「出力データ決定部」の一例にあたる。

次に、図１３を参照して、質問補充要求処理の詳細について説明する。図１３は、実施例１に係る情報処理装置における質問補充要求処理の詳細を説明するための図である。

文ベクトル生成部４３１は、利用者入力文データ２００を利用者入力文リスト２０１から取得する。そして、文ベクトル生成部４３１は、利用者入力文データ２００に含まれる文を特定する。図１３では、利用者入力文データ２００に１つの文が存在する場合の例を記載した。文ベクトル生成部４３１は、単語ベクトルテーブル１５２を参照して、利用者入力文データ２００に含まれる文の文ベクトルを求める（ステップＳ２０１）。ここでは、文ベクトルＶＳ１が、利用者入力文データ２００の文の文ベクトルである。

次に、検索部４３２は、利用者入力文データ２００の文の文ベクトルと学習データ１５５に登録されたＦＡＱデータ１５０の各文の文ベクトルとを比較して、利用者入力文データ２００に最も類似するＦＡＱデータ１５０を特定する。次に、検索部４３２は、特定したＦＡＱデータ１５０の各文の文ベクトルから、利用者入力文データ２００の文の文ベクトルとは異なる文の文ベクトルを選択する（ステップＳ２０２）。ここでは、検索部４３２は、文ベクトルＶＳ２−αを取得する。

次に、質問補充要求文取得部４３３は、検索部４３２が選択した文ベクトルと最も類似する文ベクトルを有する質問補充要求文を質問補充要求文リスト１５８から取得する（ステップＳ２０３）。

そして、質問補充要求文取得部４３３は、取得した質問補充要求文を利用者端末２へ送信して質問補充要求を行う（ステップＳ２０４）。その後、情報処理装置１は、利用者からの追加の質問の入力を待つ。

次に、図１４Ａと図１４Ｂを参照して、実施例１に係る情報処理装置１によるＦＡＱを利用したＲＮＮ機械学習処理と回答処理の流れをまとめて説明する。

図１４Ａは、実施例１に係る情報処理装置によるＲＮＮ機械学習処理のフローチャートである。

学習部４２１は、教師データとなる複数のＦＡＱデータ１５０の中から１つの文章であるＦＡＱデータ１５０を選択する（ステップＳ００１）。

次に、学習部４２１は、選択したＦＡＱデータ１５０のＦＡＱ質問文及びＦＡＱ回答文に含まれる複数の文を抽出する（ステップＳ００２）。例えば、学習部４２１は、ＦＡＱ質問文及びＦＡＱ回答文を走査し、句読点で区切られる部分を、文として抽出する。

次に、学習部４２１は、抽出した複数の文のうち、一つの文を選択する（ステップＳ００３）。

そして、学習部４２１は、選択した文に対して形態素解析を実行することで、選択した文に含まれる複数の単語を特定する（ステップＳ００４）。

次に、学習部４２１は、特定した単語と、７次元単語ベクトルテーブル１５２とを比較して、各単語の７次元の単語ベクトルを特定する（ステップＳ００５）。

次に、学習部４２１は、例えば、特定した７次元の単語ベクトルを足し合わせることで、選択した文の７次元の文ベクトルを算出する（ステップＳ００６）。

次に、学習部４２１は、抽出した全ての文について、７次元の文ベクトルを取得したか否かを判定する（ステップＳ００７）。７次元の文ベクトルを未取得の文が残っている場合（ステップＳ００７：否定）、学習部４２１は、ステップＳ００３へ戻る。

これに対して、抽出した文の全てについて７次元の文ベクトルの取得が完了した場合（ステップＳ００７：肯定）、学習部４２１は、７次元文グループベクトルテーブル１５３を参照して、ＦＡＱデータ１５０のＦＡＱ質問文及びＦＡＱ回答文に含まれる各文の文グループを特定する（ステップＳ００８）。

次に、学習部４２１は、２００次元文グループベクトルテーブル１５４を用いてＦＡＱ質問文の各文の７次元の文ベクトルを２００次元に展開し、ＦＡＱ質問文及びＦＡＱ回答の各文の２００次元の文ベクトルを取得する（ステップＳ００９）。

さらに、全てのＦＡＱデータ１５０についてのＦＡＱ質問文の２００次元の文ベクトル及びＦＡＱ回答文の２００次元の文ベクトルを取得し、学習部４２１は、ＲＮＮの機械学習を実行する（ステップＳ０１０）。具体的には、学習部４２１は、各ＦＡＱデータ１５０のＦＡＱ質問文に含まれる各文の２００次元の文ベクトル２０１を入力とし、ＦＡＱ回答文に含まれる各文の２００次元の文ベクトル２０２を出力としてＳｏｆｔｍａｘ演算により、ＲＮＮ機械学習を実行する。

次に、学習部４２１は、全てのＦＡＱデータ１５０について、ＲＮＮ機械学習が完了したか否かを判定する（ステップＳ０１１）。ＲＮＮ機械学習を行っていないＦＡＱデータが残っている場合（ステップＳ０１１：否定）、学習部４２１は、ステップＳ００１へ戻る。

これに対して、全てのＦＡＱデータ１５０についてＲＮＮ機械学習が完了した場合（ステップＳ０１１：肯定）、学習部４２１は、学習データ１５５としてＲＮＮのハイパーパラメータを取得する（ステップＳ０１２）。

図１４Ｂは、実施例１に係る情報処理装置による回答処理のフローチャートである。

判定部１４１は、利用者入力文データ２００を取得する（ステップＳ１）。判定部１４１は、利用者入力文データ２００に含まれる各文を利用者入力文リスト２０１に登録する。そして、判定部１４１は、利用者入力文リスト２０１に登録された利用者入力文データ２００に、ＦＡＱデータ１５０のＦＡＱ質問文が３文以上含まれるか否かを判定する（ステップＳ２）。

ＦＡＱデータ１５０のＦＡＱ質問文が３文以上含まれていない場合（ステップＳ２：否定）、判定部１４１は、質問補充要求処理の実行を文ベクトル生成部４３１に指示する。文ベクトル生成部４３１は、利用者入力文リスト２０１に登録された文を取得し、７次元単語ベクトルテーブル１５２を利用して各文の文ベクトルを生成する（ステップＳ３）。そして、文ベクトル生成部４３１は、生成した文ベクトルを検索部４３２へ出力する。

検索部４３２は、利用者入力文データ２００に含まれる各文の文ベクトルの入力を文ベクトル生成部４３１から受ける。そして、検索部４３２は、各文の文ベクトルとＦＡＱデータ１５０に含まれる各文の文ベクトルとを比較し、利用者入力文データ２００に類似度が最も高いＦＡＱデータ１５０を特定する（ステップＳ４）。

次に、検索部４３２は、特定したＦＡＱデータ１５０に含まれる文のうち利用者入力文データ２００に含まれる文以外の文の文ベクトルを取得する（ステップＳ５）。そして、検索部４３２は、取得した文ベクトルを質問補充要求文取得部４３３へ出力する。

次に、質問補充要求文取得部４３３は、文ベクトルの入力を検索部４３２から受ける。そして、質問補充要求文取得部４３３は、取得した文ベクトルに最も類似度が高い文ベクトルを有する質問補充要求文を質問補充要求文リスト１５８から選択する（ステップＳ６）。

その後、質問補充要求文取得部４３３は、選択した質問補充要求文を利用者端末２へ送信して表示させることで利用者への質問補充要求を行う（ステップＳ７）。

その後、判定部１４１は、質問補充要求に対する応答として追加の質問を利用者端末２から受信する（ステップＳ８）。その後、判定部１４１は、ステップＳ２の処理へ戻る。

これに対して、利用者入力文データ２００にＦＡＱデータ１５０のＦＡＱ質問文が３文以上含まれている場合（ステップＳ２：肯定）、判定部１４１は、ＦＡＱデータ１５０の特定処理の実行を特定部４２２に指示する。特定部４２２は、判定部１４１からの指示を受けて、利用者入力文リスト２０１から利用者入力文データ２００を取得する。そして、特定部４２２は、７次元単語ベクトルテーブル１５２を利用して、利用者入力文データ２００の各文の７次元の文ベクトルを生成する（ステップＳ９）。

次に、特定部４２２は、７次元文グループベクトルテーブル１５３を参照して、生成した各文ベクトルが属する７次元の文グループを特定する（ステップ１０）。

次に、特定部４２２は、２００次元文グループベクトルテーブル１５４を用いて、利用者入力文データ２００に含まれる各文の文ベクトルを２００次元の文ベクトルに展開する（ステップＳ１１）。

そして、特定部４２２は、利用者入力文データ２００に含まれる各文の２００次元の文ベクトルを入力として、ＲＮＮのハイパーパラメータを用いてＦＡＱ回答文の２００次元の文グループの情報の出力を得る（ステップＳ１２）。

その後、特定部４２２は、取得した２００次元の文グループに属するＦＡＱ回答文を取得し、取得した各ＦＡＱ回答文を生成部４２３へ出力する（ステップＳ１３）。

生成部４２３は、複数のＦＡＱ回答文の入力を特定部４２２から受ける。そして、生成部４２３は、取得したＦＡＱ回答文の文ベクトルと利用者入力文データ２００に含まれる文の文ベクトルとを比較して、類似度の高い順にＦＡＱ回答文に順位を付ける。そして、生成部４２３は、ランキング順に並べたランキング順ＦＡＱ回答文を生成する（ステップＳ１４）。

その後、生成部４２３は、生成したランキング順ＦＡＱ回答文を利用者端末２へ送信し、利用者にＦＡＱ回答文を提供して、利用者の質問に対する回答を行う（ステップＳ１５）。

次に、本実施例１に係る情報処理装置の構成について説明する。図１５は、実施例１に係る情報処理装置のブロック図である。図１５に示すように、本実施例に係る情報処理装置１は、通信部１０１、入力部１０２、表示部１０３、制御部１０４及び記憶部１０５を有する。

通信部１０１は、ネットワークを介して利用者端末２などの外部装置との間で情報通信を実行する処理部である。通信部１０１は、ＮＩＣ（Network Interface Card）等の通信装置に対応する。たとえば、制御部１０４は、通信部１０１を介して、利用者端末２と情報をやり取りする。

入力部１０２は、各種の情報を、情報処理装置１に入力する入力装置である。入力部１０２は、キーボードやマウス、タッチパネル等に対応する。

表示部１０３は、制御部１０４から出力される情報を表示する表示装置である。表示部１０３は、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイ、タッチパネル等に対応する。

記憶部１０５は、利用者入力文リスト２０１、ＦＡＱデータ１５０、２００次元単語ベクトルテーブル１５１、７次元単語ベクトルテーブル１５２、７次元文グループベクトルテーブル１５３、２００次元文グループベクトルテーブル１５４、学習データ１５５、単語ベクトルインデックス１５６、文グループベクトルインデックス１５７及び質問補充要求文リスト１５８を格納する。記憶部１０５は、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）などの半導体メモリ素子や、ＨＤＤ（Hard Disk Drive）などの記憶装置に対応する。

利用者入力文リスト２０１は、利用者から入力された質問文のデータである利用者入力文データ２００が登録される。

ＦＡＱデータ１５０は、図２に例示した内容を有する。ＦＡＱデータ１５０は、記憶部１０５に複数格納される。ＦＡＱデータ１５０は、情報処理装置１におけるＲＮＮ機械学習の教師データとなる。

２００次元単語ベクトルテーブル１５１は、単語と２００次元の単語ベクトルを対応付けるテーブルである。また７次元単語ベクトルテーブル１５２は、単語と、７次元の単語ベクトルとを対応付けるテーブルである。

７次元文グループベクトルテーブル１５３は、文グループと、７次元の単語ベクトルで表される文ベクトルとを対応付けるテーブルである。また、２００次元文グループベクトルテーブル１５４は、文グループと、２００次元の単語ベクトルで表される文ベクトルとを対応付けるテーブルである。

学習データ１５５は、情報処理装置１におけるＲＮＮ機械学習により得られた情報を格納する。例えば、学習データ１５５は、ＲＮＮのハイパーパラメータ及びＦＡＱデータ１５０に含まれる各文の文ベクトルが格納される。

単語ベクトルインデックス１５６は、単語の位置とその７次元単語ベクトルを対応付けたインデックスである。また、文グループベクトルインデックス１５７は、文の位置とその７次元文グループベクトルを対応付けたインデックスである。

質問補充要求文リスト１５８は、利用者に対して追加の質問の補充を要求するための質問補充要求文とその文ベクトルとを対応付けるテーブルである。

制御部１０４は、判定部１４１、ＲＮＮ処理部１４２及び質問補充要求処理部１４３を有する。制御部１０４は、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）などによって実現できる。また、制御部１０４は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などのハードワイヤードロジックによっても実現できる。

判定部１４１は、利用者端末２から受信した利用者入力文データ２００を利用者入力文リスト２０１に登録する。そして、判定部１４１は、利用者入力文リスト２０１に登録された利用者入力文データ２００が利用者の求めるＦＡＱデータ１５０を特定するために十分な情報を有するか否かを判定する。具体的には、判定部１４１は、利用者入力文データ２００にＦＡＱ質問文における３文以上が含まれるか否かを判定する。３文以上が含まれていなければ、判定部１４１は、質問補充要求文の作成の指示を質問補充要求処理部１４３に通知する。また、３文以上が含まれていれば、判定部１４１は、ＦＡＱデータ１５０の特定処理の実行の指示をＲＮＮ処理部１４２に通知する。

図１６は、ＲＮＮ処理部の詳細を表すブロック図である。図１６では、ＲＮＮ処理部の動作に直接関わらない一部の機能は図示を省略した。ＲＮＮ処理部１４２は、特定部４２２、生成部４２３及び学習部４２１を有する。

学習部４２１は、ＦＡＱデータ１５０を教師データとして、７次元単語ベクトルテーブル１５２、７次元文グループベクトルテーブル１５３及び２００次元文グループベクトルテーブル１５４を用いてＲＮＮ機械学習を実行する。学習部４２１は、ＦＡＱデータ１５０のＦＡＱ質問文の２００次元の文ベクトルを入力としてＦＡＱ回答文の７次元の文グループを出力とするＲＮＮ機械学習を実行し、ＲＮＮのハイパーパラメータを計算する。そして、学習部４２１は、算出したＲＮＮのハイパーパラメータ及びＦＡＱデータ１５０の各文の文ベクトルを学習データ１５５として記憶部１０５に格納する。

特定部４２２は、判定部１４１からＦＡＱデータ１５０の特定処理の実行の指示を受けると、利用者入力文リスト２０１に格納された利用者入力文データ２００を取得する。そして、特定部４２２は、単語ベクトルテーブル１５２、７次元文グループベクトルテーブル１５３及び２００次元文グループベクトルテーブル１５４を用いて利用者入力文データ２００の各文の２００次元の文ベクトルを求める。その後、特定部４２２は、学習データ１５５に格納されたＲＮＮのハイパーパラメータを用いて、利用者入力文データ２００の各文の２００次元の文ベクトルをＲＮＮに入力して、ＦＡＱ回答文の文グループの出力を得る。その後、特定部４２２は、取得したＦＡＱ回答文の文グループに属するＦＡＱ回答文を取得して生成部４２３へ出力する。

生成部４２３は、特定部４２２から入力されたＦＡＱ回答文と利用者入力文データ２００との類似度を求め、類似度の高い順に並べたランキング順ＦＡＱ回答文を生成する。その後、生成部４２３は、ランキング順ＦＡＱ回答文を利用者端末２へ送信する。

図１７は、質問補充要求処理部の詳細を表すブロック図である。図１７では、質問補充要求処理部１４３の動作に直接関わらない一部の機能は図示を省略した。質問補充要求処理部１４３は、文ベクトル生成部４３１、検索部４３２及び質問補充要求文取得部４３３を有する。

文ベクトル生成部４３１は、利用者入力文リスト２０１から利用者入力文データ２００を取得する。そして、文ベクトル生成部４３１は、利用者入力文データ２００に含まれる各文の文ベクトルを求める。その後、文ベクトル生成部４３１は、利用者入力文データ２００に含まれる各文の文ベクトルを検索部４３２へ出力する。

検索部４３２は、利用者入力文データ２００に含まれる各文の文ベクトルの入力を文ベクトル生成部４３１から受ける。そして、検索部４３２は、学習データに格納されたＦＡＱデータ１５０の各文の文ベクトルを用いて、利用者入力文データ２００に最も類似度の高いＦＡＱデータ１５０を特定する。次に、検索部４３２は、特定したＦＡＱデータ１５０から利用者入力文データ２００に含まれる文以外の文の文ベクトルを取得する。そして、検索部４３２は、取得した文ベクトルと最も文ベクトルが類似する質問補充要求文を質問補充要求文リスト１５８から取得する。そして、質問補充要求文取得部４３３は取得した質問補充要求文を利用者端末２へ送信して利用者に提供する。

ここで、本実施例では、ＲＮＮ処理部１４２及び質問補充要求処理部１４３の双方で個別に文ベクトルを求めるように説明したが、この機能は１つにまとめてもよい。

以上に説明したように、本実施例に係る情報処理装置は、ＦＡＱの多量な文に対応した多階層ＲＮＮ機械学習を実現するため、ＦＡＱの質問文と回答文を教師データとして、単語の上位である文の粒度の文ベクトルを用いてＲＮＮ機械学習することにより、回答精度を向上することができる。

また、利用者から入力されたＦＡＱの質問文が短く、例えば３文未満の場合に、文ベクトルを用いてその質問文に類似するＦＡＱデータを特定し、そのＦＡＱデータの他の質問文に類似する質問補充要求文を利用者に提供する。そして、情報処理装置は、ＦＡＱの質問文が３文以上得られると、その質問文に対応するＦＡＱデータを特定して回答を利用者へ返す。ＦＡＱ質問文が３文以上あれば利用者が求めるＦＡＱが特定可能になることから、質問に対して適切な回答を返すことが可能になり、回答精度を維持することができる。

本実施例では、ＲＮＮを用いて質問要求補充文の選択を実行することが実施例１と異なる。本実施例に係る情報処理装置１も、図１５〜１７のブロック図で示される。以下の説明では、実施例１と同様の各部の動作については説明を省略する。

教師データとして、ＦＡＱ質問文の文ベクトル及びそれに対応する質問補充要求文の文ベクトルの組み合わせが用意される。そして、学習部４２１は、ＦＡＱ質問文の文ベクトルを入力とし、質問補充要求文の文ベクトルを出力としてＲＮＮ機械学習を実行する。

図１８は、ＦＡＱ質問文と質問補充要求文とを用いたＲＮＮ機械学習の一例を示す図である。学習５０１は、ＦＡＱ質問文としてエラーコードの確認を用いる場合を示す。学習５０２は、ＦＡＱ質問文として実行コマンドの確認を用いる場合を示す。

例えば、学習５０１で示すように、「エラーコードはｘｘｘです。」というＦＡＱ質問文に対応する質問補充要求文が「エラーコードは何ですか？」である。そして、「エラーコードはｘｘｘです。」は文ベクトルＶ０１−１を有する。さらに、「エラーコードはｘｘｘです。」に類似するＦＡＱ質問文の文ベクトルがＶ０１−２〜Ｖ０１−ｎである。そして、それらのＦＡＱ質問文に対応する質問補充要求文である「エラーコードは何ですか？」は文ベクトルＶ’０１を有する。そこで、学習部４２１は、文ベクトルＶ０１−１〜Ｖ０１−ｎを入力とし、文ベクトルＶ’０１を出力とする教師データを用いてＲＮＮ機械学習を実行する。

同様に、学習５０２に示すように、「実行コマンドはａａａａです。」というＦＡＱ質問文に対応する質問補充要求文が「実行コマンドは何ですか？」である。そして、「実行コマンドはａａａａです。」は文ベクトルＶ０２−１を有する。さらに、「実行コマンドはａａａａです。」に類似するＦＡＱ質問文の文ベクトルがＶ０２−２〜Ｖ０２−ｎである。そして、それらのＦＡＱ質問文に対応する質問補充要求文である「実行コマンドは何ですか？」は文ベクトルＶ’０２を有する。そこで、学習部４２１は、文ベクトルＶ０２−１〜Ｖ０２−ｎを入力とし、文ベクトルＶ’０２を出力とする教師データを用いてＲＮＮ機械学習を実行する。

学習部４２１は、他のＦＡＱ質問文についても同様にＲＮＮ機械学習を実行する。そして、学習部４２１は、ＲＮＮのハイパーパラメータを取得する。その後、学習部４２１は、ＦＡＱ質問文の文ベクトルを入力とし質問補充要求文の文ベクトルを出力とする場合のＲＮＮのハイパーパラメータを学習データ１５５に格納する。

質問補充要求文取得部４３３は、利用者入力文データ２００に最も類似度が高いＦＡＱデータ１５０から利用者入力文データ２００に含まれる文以外の文の１つの文ベクトルを検索部４３２から取得する。そして、質問補充要求文取得部４３３は、学習データ１５５に格納されたＲＮＮのハイパーパラメータを用いて、取得した文ベクトルをＲＮＮの入力とした場合に出力される質問補充要求文の文ベクトルを取得する。その後、質問補充要求文取得部４３３は、取得した文ベクトルと類似度が最も高い文ベクトルを有する質問補充要求文を質問補充要求文リスト１５８から取得する。

図１９は、実施例２に係る情報処理装置における質問補充要求処理の詳細を説明するための図である。

文ベクトル生成部４３１は、利用者入力文データ２００を利用者入力文リスト２０１から取得する。そして、文ベクトル生成部４３１は、利用者入力文データ２００に含まれる文を特定する。図１９では、利用者入力文データ２００に１つの文が存在する場合の例を記載した。文ベクトル生成部４３１は、単語ベクトルテーブル１５２を参照して、利用者入力文データ２００に含まれる文の文ベクトルを求める（ステップＳ３０１）。ここでは、文ベクトルＶ０１が、利用者入力文データ２００の文の文ベクトルである。

次に、検索部４３２は、利用者入力文データ２００の文の文ベクトルと学習データ１５５に登録されたＦＡＱデータ１５０の各文の文ベクトルとを比較して、利用者入力文データ２００に最も類似するＦＡＱデータ１５０を特定する。次に、検索部４３２は、特定したＦＡＱデータ１５０の各文の文ベクトルから、利用者入力文データ２００の文の文ベクトルとは異なる文の文ベクトルを選択する（ステップＳ３０２）。ここでは、検索部４３２は、文ベクトルＶ０２−αを取得する。

次に、質問補充要求文取得部４３３は、検索部４３２が選択した文ベクトルをＲＮＮへの入力として、出力される質問補充要求文の文ベクトルを取得する（ステップＳ３０３）。

次に、質問補充要求文取得部４３３は、取得した文ベクトルを有する質問補充要求文を質問補充要求文リスト１５８から取得する（ステップＳ３０４）。

そして、質問補充要求文取得部４３３は、取得した質問補充要求文を利用者端末２へ送信して質問補充要求を行う（ステップＳ３０５）。その後、情報処理装置１は、利用者からの追加の質問の入力を待つ。

次に、図２０を参照して、実施例２に係る情報処理装置１によるＦＡＱを利用した回答処理の流れをまとめて説明する。図２０は、実施例２に係る情報処理装置による回答処理のフローチャートである。

判定部１４１は、利用者入力文データ２００を取得する（ステップＳ２１）。判定部１４１は、利用者入力文データ２００に含まれる各文を利用者入力文リスト２０１に登録する。そして、判定部１４１は、利用者入力文リスト２０１に登録された利用者入力文データ２００に、ＦＡＱデータ１５０のＦＡＱ質問文が３文以上含まれるか否かを判定する（ステップＳ２２）。

ＦＡＱデータ１５０のＦＡＱ質問文が３文以上含まれていない場合（ステップＳ２２：否定）、判定部１４１は、質問補充要求処理の実行を文ベクトル生成部４３１に指示する。文ベクトル生成部４３１は、利用者入力文リスト２０１に登録された文を取得し、単語ベクトルテーブル１５２を利用して各文の文ベクトルを生成する（ステップＳ２３）。そして、文ベクトル生成部４３１は、生成した文ベクトルを検索部４３２へ出力する。

検索部４３２は、利用者入力文データ２００に含まれる各文の文ベクトルの入力を文ベクトル生成部４３１から受ける。そして、検索部４３２は、各文の文ベクトルとＦＡＱデータ１５０に含まれる各文の文ベクトルとを比較し、利用者入力文データ２００に類似度が最も高いＦＡＱデータ１５０を特定する（ステップＳ２４）。

次に、検索部４３２は、特定したＦＡＱデータ１５０に含まれる文のうち利用者入力文データ２００に含まれる文以外の文の文ベクトルを取得する（ステップＳ２５）。そして、検索部４３２は、取得した文ベクトルを質問補充要求文取得部４３３へ出力する。

質問補充要求文取得部４３３は、文ベクトルの入力を検索部４３２から受ける。そして、質問補充要求文取得部４３３は、取得した文ベクトルをＲＮＮの入力として、出力される質問補充要求文の文ベクトルを取得する（ステップＳ２６）。

次に、質問補充要求文取得部４３３は、取得した文ベクトルとの類似度が最も高い質問補充要求文を質問補充要求文リスト１５８から取得する（ステップＳ２７）。

その後、質問補充要求文取得部４３３は、選択した質問補充要求文を利用者端末２へ送信して表示させることで利用者への質問補充要求を行う（ステップＳ２８）。

その後、判定部１４１は、質問補充要求に対する応答として追加の質問を利用者端末２から受信する（ステップＳ２９）。その後、判定部１４１は、ステップＳ２２の処理へ戻る。

これに対して、利用者入力文データ２００にＦＡＱデータ１５０のＦＡＱ質問文が３文以上含まれている場合（ステップＳ２２：肯定）、判定部１４１は、ＦＡＱデータ１５０の特定処理の実行を特定部４２２に指示する。特定部４２２は、判定部１４１からの指示を受けて、利用者入力文リスト２０１から利用者入力文データ２００を取得する。そして、特定部４２２は、単語ベクトルテーブル１５２を利用して、利用者入力文データ２００の各文の７次元の文ベクトルを生成する（ステップＳ３０）。

次に、特定部４２２は、７次元文グループベクトルテーブル１５３を参照して、生成した各文ベクトルが属する７次元の文グループを特定する（ステップ３１）。

次に、特定部４２２は、２００次元文グループベクトルテーブル１５４を用いて、利用者入力文データ２００に含まれる各文の文ベクトルを２００次元の文ベクトルに展開する（ステップＳ３２）。

そして、特定部４２２は、利用者入力文データ２００に含まれる各文の２００次元の文ベクトルを入力として、ＲＮＮのハイパーパラメータを用いてＦＡＱ回答文の７次元の文グループの情報の出力を得る（ステップＳ３３）。

その後、特定部４２２は、取得した７次元の文グループに属するＦＡＱ回答文を取得し、取得した各ＦＡＱ回答文を生成部４２３へ出力する（ステップＳ３４）。

生成部４２３は、複数のＦＡＱ回答文の入力を特定部４２２から受ける。そして、生成部４２３は、取得したＦＡＱ回答文の文ベクトルと利用者入力文データ２００に含まれる文の文ベクトルとを比較して、類似度の高い順にＦＡＱ回答文に順位を付ける。そして、生成部４２３は、ランキング順に並べたランキング順ＦＡＱ回答文を生成する（ステップＳ３５）。

その後、生成部４２３は、生成したランキング順ＦＡＱ回答文を利用者端末２へ送信し、利用者にＦＡＱ回答文を提供して、利用者の質問に対する回答を行う（ステップＳ３６）。

以上に説明したように、本実施例に係る情報処理装置は、ＲＮＮを用いてＦＡＱ質問文に対応する質問補充要求文を特定する。このように、質問補充要求文を特定する場合にＲＮＮを用いることもでき、そのような構成であっても、質問に対して適切な回答を返すことが可能になり、回答精度を維持することができる。

（ハードウェア構成）
図２１は、コンピュータのハードウェア構成図である。情報処理装置１は、図２１に示すコンピュータ９００により実現可能である。

コンピュータ９００は、ＣＰＵ９０１、入力装置９０２、ディスプレイ９０３、メモリ９０４、ハードディスク９０５及び通信装置９０６を有する。ＣＰＵ９０１は、バスにより入力装置９０２、ディスプレイ９０３、メモリ９０４、ハードディスク９０５及び通信装置９０６と接続される。

入力装置９０２は、例えば、キーボードやマウスなどである。操作者は入力装置９０２を用いて命令などを入力する。入力装置９０２は、図１５〜１７に例示した入力部１０２の機能を実現する。

ディスプレイ９０３は、ＣＰＵ９０１の演算結果などを表示する。ディスプレイ９０３は、図１５〜１７に例示した表示部１０３の機能を実現する。

通信装置９０６は、外部装置との通信のインタフェースである。通信装置９０６は、図１５〜１７に例示した通信部１０１の機能を実現する。

ハードディスク９０５は、図１５〜１７に例示した記憶部１０５の機能を実現する。さらに、ハードディスク９０５は、図１５〜１７に例示した制御部１０４の各機能を実現するためのプログラムを含む各種プログラムを格納する。

ＣＰＵ９０１は、ハードディスク９０５に格納された各種プログラムを読み出してメモリ９０４上に展開して実行する。これにより、ＣＰＵ９０１及びメモリ９０４は、ハードディスク９０５に格納された各種データを利用しつつ、図１５〜１７に例示した制御部１０４の各機能を実現する。

１情報処理装置
２利用者端末
１０１通信部
１０２入力部
１０３表示部
１０４制御部
１０５記憶部
１４１判定部
１４２ＲＮＮ処理部
１４３質問補充要求処理部
１５０ＦＡＱデータ
１５１２００次元単語ベクトルテーブル
１５２７次元単語ベクトルテーブル
１５３７次元文グループベクトルテーブル
１５４２００次元文グループベクトルテーブル
１５５学習データ
１５６単語ベクトルインデックス
１５７文グループベクトルインデックス
１５８質問補充要求文リスト
２００利用者入力文データ
２０１利用者入力文リスト
４２１学習部
４２２特定部
４２３生成部
４３１文ベクトル生成部
４３２検索部
４３３質問補充要求文取得部

Claims

入力を受け付けた第１の文章データをベクトル変換して第１のベクトルデータを生成し、
記憶装置に記憶された複数のベクトルデータをそれぞれ含む複数の第２の文章データのうち、前記第１のベクトルデータを含む複数の前記第２の文章データを特定し、
特定した複数の前記第２の文章データに含まれるあるデータ内の前記第１のベクトルデータ以外のベクトルデータそれぞれと、特定した複数の前記第２の文章データに含まれる前記あるデータ以外のデータ内の前記第１のベクトルデータ以外のベクトルデータそれぞれとの類似度に基づいて、入力を受け付けた前記第１の文章データに対して出力するデータを決定する
処理をコンピュータに実行させることを特徴とする情報処理プログラム。
入力を受け付けた前記第１の文章データに対して出力するデータは、複数の前記第２の文章データに含まれるデータであることを特徴とする請求項１に記載の情報処理プログラム。
前記あるデータ内の前記第１のベクトルデータ以外のベクトルデータを基に、複数の補充要求データと各前記補充要求データをベクトル変換した補充要求ベクトルデータとの対応情報を用いて、前記第１の文章データに対して出力する前記データを前記補充要求データの中から決定する処理をコンピュータに実行させることを特徴とする請求項１に記載の情報処理プログラム。
前記第２の文章データに含まれる前記あるデータに含まれる文データをベクトル変換して複数の特定ベクトルを取得し、
前記あるデータに対応する対応データに含まれる文データをベクトル変換して複数の対応ベクトルを取得し、
ベクトルデータを分類した分類グループの中から、各前記特定ベクトルがそれぞれ属する第１グループ及び各前記対応ベクトルが属する第２グループを特定し、
前記第１グループを基に前記特定ベクトルを高次元に展開し、
前記高次元に展開された前記特定ベクトル及び前記第２グループを教師データとして機械学習を実行する
処理をコンピュータに実行させることを特徴とする請求項１に記載の情報処理プログラム。
前記第１の文章データをベクトル変換して前記第１のベクトルデータを生成し、
前記分類グループの中から前記第１のベクトルデータが属する所属グループを特定し、
前記所属グループを基に前記第１のベクトルデータを高次元に展開し、
前記高次元に展開したベクトルデータを入力として前記機械学習の結果を基に出力する前記データを決定する
処理をコンピュータに実行させることを特徴とする請求項４に記載の情報処理プログラム。
入力を受け付けた第１の文章データをベクトル変換して第１のベクトルデータを生成し、
記憶装置に記憶された複数のベクトルデータをそれぞれ含む複数の第２の文章データのうち、前記第１のベクトルデータを含む複数の前記第２の文章データを特定し、
特定した複数の前記第２の文章データに含まれるあるデータ内の前記第１のベクトルデータ以外のベクトルデータそれぞれと、特定した複数の前記第２の文章データに含まれる前記あるデータ以外のデータ内の前記第１のベクトルデータ以外のベクトルデータそれぞれとの類似度に基づいて、入力を受け付けた前記第１の文章データに対して出力するデータを決定する
ことを特徴とする情報処理方法。
入力を受け付けた第１の文章データをベクトル変換して第１のベクトルデータを生成する生成部と、
記憶部に記憶された複数のベクトルデータをそれぞれ含む複数の第２の文章データのうち、前記第１のベクトルデータを含む複数の前記第２の文章データを特定する特定部と、
特定した複数の前記第２の文章データに含まれるあるデータ内の前記第１のベクトルデータ以外のベクトルデータそれぞれと、特定した複数の前記第２の文章データに含まれる前記あるデータ以外のデータ内の前記第１のベクトルデータ以外のベクトルデータそれぞれとの類似度に基づいて、入力を受け付けた前記第１の文章データに対して出力するデータを決定する出力データ決定部と
を備えたことを特徴とする情報処理装置。