JP7272458B2

JP7272458B2 - 表示制御プログラム、表示制御方法および情報処理装置

Info

Publication number: JP7272458B2
Application number: JP2021555771A
Authority: JP
Inventors: 貴宏前川; 洋晃村岡
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-11-15
Filing date: 2019-11-15
Publication date: 2023-05-12
Anticipated expiration: 2039-11-15
Also published as: JPWO2021095262A1; WO2021095262A1

Description

本発明は、表示制御プログラム、表示制御方法および情報処理装置に関する。

近年、チャットボットと呼ばれる技術を利用したＦＡＱ（ＦｒｅｑｕｅｎｔｌｙＡｓｋｅｄＱｕｅｓｔｉｏｎ）システムを導入するコールセンタが増えている。チャットボットは、人工知能を利用して、人間との対話やメッセージのやりとりを行うコンピュータシステムである。

先行技術としては、例えば、ユーザのアクションに応じてノードグラフデータに関連付けられた複数のキーワードのうち、ノードにヒットした成功キーワードに基づいてノードの注目度を上げ、ノードにヒットしなかった失敗キーワードを、成功キーワードにヒットしたノードに関連付け、注目度に基づいて特定したノードと、特定したノードに関連付けられた失敗キーワードとを提示するものがある。

特開２０１４－９２８２２号公報

しかしながら、従来技術では、入力される質問に対して適切な回答を提示するためのＦＡＱのメンテナンス作業に手間や時間がかかるという問題がある。

一つの側面では、本発明は、入力された単語または文章のうち対応する回答がない単語または文章を、質問であるかフリートークであるかを識別可能に表示することを目的とする。

一つの実施態様では、入力された単語または文章に対応する回答を検索した結果、前記入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定し、前記対応する回答がなかった単語または文章を一覧表示する際に、前記問い合わせと判定した単語または文章を、前記問い合わせ以外と判定した単語または文章とは異なる態様で表示する、表示制御プログラムが提供される。

本発明の一側面によれば、入力された単語または文章のうち対応する回答がない単語または文章を、質問であるかフリートークであるかを識別可能に表示することができる。

図１は、実施の形態にかかる表示制御方法の一実施例を示す説明図である。図２は、情報処理システム２００のシステム構成例を示す説明図である。図３は、情報処理装置１０１のハードウェア構成例を示すブロック図である。図４は、作業者端末２０１のハードウェア構成例を示すブロック図である。図５は、ＦＡＱマスタ２２０の記憶内容の一例を示す説明図である。図６は、会話テキストマスタ２３０の記憶内容の一例を示す説明図である。図７は、解決不良テーブル２４０の記憶内容の一例を示す説明図である。図８は、情報処理装置１０１の機能的構成例を示すブロック図である。図９は、教師データの具体例を示す説明図である。図１０は、特徴度を用いた判定例を示す説明図である。図１１は、学習モデルによる分類結果の具体例を示す説明図である。図１２は、管理画面ＭＳの画面例を示す説明図（その１）である。図１３は、管理画面ＭＳの画面例を示す説明図（その２）である。図１４は、管理画面ＭＳの画面例を示す説明図（その３）である。図１５は、管理画面ＭＳの画面例を示す説明図（その４）である。図１６は、情報処理装置１０１の表示制御処理手順の一例を示すフローチャートである。図１７は、特徴度判定処理の具体的処理手順の一例を示すフローチャートである。

以下に図面を参照して、本発明にかかる表示制御プログラム、表示制御方法および情報処理装置の実施の形態を詳細に説明する。

（実施の形態）
図１は、実施の形態にかかる表示制御方法の一実施例を示す説明図である。図１において、情報処理装置１０１は、入力された単語または文章に対応する回答を検索した結果、当該単語または文章に対応する回答がなかった単語または文章を一覧表示するコンピュータである。

ここで、入力された単語または文章は、例えば、情報処理端末に入力される単語または文章である。情報処理端末は、例えば、ＦＡＱシステムを利用するユーザのコンピュータである。文章は、１または複数の文であってもよいし、句（フレーズ）であってもよい。入力される単語または文章は、例えば、問い合わせ（クエリ）である。問い合わせは、何らかの問題の答えを問いただす質問に相当する。

回答は、例えば、ＦＡＱとして登録される回答である。ＦＡＱは、「頻繁に尋ねられる質問」であり、予め予想される質問に対して、質問と回答をまとめたものである。対応する回答がなかった単語または文章は、例えば、入力された単語または文章に関連する回答を特定できなかった、すなわち、１件も回答が検索されなかったものである（ゼロ件ヒット）。

また、対応する回答がなかった単語または文章は、検索した回答について否定的な評価がなされたものであってもよい。否定的な評価がなされたものとは、例えば、入力された単語または文章に対して関連する回答を提示したにもかかわらず、いずれの回答も選択されず、「この中にはない」といった項目の選択がなされたものである（適合回答無し）。

ＦＡＱシステムにおいて、ゼロ件ヒットや適合回答無しの件数が増えると、ユーザの満足度の低下を招くおそれがある。このため、ゼロ件ヒットや適合回答無しの対策として、ＦＡＱのメンテナンスが行われる。例えば、ＦＡＱシステムの管理者は、頻繁にゼロ件ヒットが発生している問い合わせがあれば、その問い合わせに対応する回答を新たに用意してＦＡＱに登録するといった作業を行う。

このようなメンテナンス作業を支援する機能として、例えば、ゼロ件ヒットの入力ワードを一覧表示するものがある。入力ワードは、例えば、ＦＡＱシステムのユーザの情報処理端末に入力された単語または文章である。また、ゼロ件ヒットの入力ワードを一覧表示する際に、ゼロ件ヒットの件数が多い順に順位付けして表示するものがある。

しかし、ゼロ件ヒットとなった入力ワードには、質問（問い合わせ）だけでなく、フリートーク（雑談）も含まれることがある。フリートークは、例えば、「おはようございます」や「こんにちは」などのチャットボットでの会話である。フリートークは、問い合わせに比べて、回答を用意する必要性が低いものである。

このため、ゼロ件ヒットの入力ワードを一覧表示する際に、回答を用意する必要性が高いものと低いものとが混在する場合がある。この場合、管理者は、例えば、一覧表示された入力ワードの内容を一つ一つ確認して、問い合わせなのかフリートークなのかを判断することになり、ＦＡＱのメンテナンス作業にかかる手間や時間が増大するおそれがある。

そこで、本実施の形態では、入力された単語または文章のうち対応する回答がない単語または文章を一覧表示する際に、当該単語または文章が、質問なのかフリートークなのかを識別可能に表示して、ＦＡＱのメンテナンス作業を支援する表示制御方法について説明する。以下、情報処理装置１０１の処理例について説明する。

（１）情報処理装置１０１は、入力された単語または文章に対応する回答を検索した結果、当該入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定する。

ここで、対応する回答がない単語または文章は、入力された単語または文章に関連する回答を特定できなかった、すなわち、ゼロ件ヒットとなった単語または文章である。また、対応する回答がない単語または文章は、検索した回答について否定的な評価がなされたもの、すなわち、適合回答無しとなった単語または文章であってもよい。

単語または文章の特徴量とは、単語または文章の特徴をあらわす情報である。例えば、単語または文章の特徴量は、単語または文章をベクトル化して得られる特徴量ベクトルである。なお、特徴量として、単語または文章のどのような特徴を抽出するかは任意に設定可能である。

具体的には、例えば、情報処理装置１０１は、学習モデルＭを用いて、単語または文章の特徴量に基づいて、当該単語または文章が、問い合わせであるか、または、問い合わせ以外であるかを判定する。学習モデルＭは、入力データの特徴量から、問い合わせ、または、問い合わせ以外のいずれであるかを分類する分類器である。

学習モデルＭは、例えば、問い合わせを示すラベルが付与された質問データを教師データとして機械学習を行って生成されることにしてもよい。また、学習モデルＭは、問い合わせを示すラベルが付与された質問データと、問い合わせ以外を示すラベルが付与された会話データとを教師データとして機械学習を行って生成されることにしてもよい。

問い合わせを示すラベルが付与された質問データとしては、例えば、既存のＦＡＱ（質問データと回答データとの組）を用いることができる。また、問い合わせ以外を示すラベルが付与された会話データとしては、例えば、チャットで行われた日常会話などを集めた会話テキスト集を用いることができる。

図１の例では、入力ワード１１０（降水確率を教えて）の特徴量を学習モデルＭに与えた結果、問い合わせを示す分類結果１１１が出力されている。また、入力ワード１２０（いい天気ですね）の特徴量を学習モデルＭに与えた結果、問い合わせ以外を示す分類結果１２１が得られている。入力ワード１１０，１２０は、入力された単語または文章のうち対応する回答がない単語または文章の一例である。

（２）情報処理装置１０１は、入力された単語または文章のうち対応する回答がない単語または文章を一覧表示する際に、問い合わせと判定した単語または文章を、問い合わせ以外と判定した単語または文章とは異なる態様で表示する。

具体的には、例えば、情報処理装置１０１は、問い合わせと判定した単語または文章を、問い合わせ以外と判定した単語または文章と背景色が異なるように表示することにしてもよい。また、情報処理装置１０１は、問い合わせと判定した単語または文章を表示し、問い合わせ以外と判定した単語または文章を非表示とすることにしてもよい。

図１の例では、ゼロ件ヒットや適合回答無しの入力ワードを一覧表示する際に、問い合わせを示す分類結果１１１が得られた入力ワード１１０が、問い合わせ以外を示す分類結果１２１が得られた入力ワード１２０と異なる態様で表示される。

このように、情報処理装置１０１によれば、入力された単語または文章のうち対応する回答がない単語または文章を一覧表示する際に、質問（問い合わせ）であるか、フリートーク（問い合わせ以外）であるかを識別可能に表示することができる。このため、例えば、ＦＡＱシステムの管理者は、ＦＡＱのメンテナンスを行う際に、ゼロ件ヒットや適合回答無しとなった単語または文章のうち、優先して回答を用意すべき単語または文章（問い合わせ）を容易に判断することが可能となる。

図１の例では、例えば、ＦＡＱシステムの管理者は、ゼロ件ヒットまたは適合回答無しとなった入力ワード１１０，１２０のうち、入力ワード１１０が、優先して回答を用意すべきものであることを容易に判断することができる。

（情報処理システム２００のシステム構成例）
つぎに、図１に示した情報処理装置１０１を含む情報処理システム２００のシステム構成例について説明する。情報処理システム２００は、例えば、チャットボットを利用したＦＡＱシステムに適用される。

図２は、情報処理システム２００のシステム構成例を示す説明図である。図２において、情報処理システム２００は、情報処理装置１０１と、作業者端末２０１と、複数の情報処理端末２０２と、を含む。情報処理システム２００において、情報処理装置１０１、作業者端末２０１および情報処理端末２０２は、有線または無線のネットワーク２１０を介して接続される。ネットワーク２１０は、例えば、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、インターネットなどである。

情報処理装置１０１は、ＦＡＱマスタ２２０、会話テキストマスタ２３０および解決不良テーブル２４０を有する。ＦＡＱマスタ２２０、会話テキストマスタ２３０および解決不良テーブル２４０の記憶内容については、図５～図７を用いて後述する。情報処理装置１０１は、例えば、サーバである。

作業者端末２０１は、作業者が使用するコンピュータである。作業者は、ＦＡＱのメンテナンスを行う者であり、例えば、情報処理システム２００の管理者である。作業者端末２０１は、例えば、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、タブレット型ＰＣなどである。

情報処理端末２０２は、ユーザが使用するコンピュータである。ユーザは、例えば、ＦＡＱシステムの利用者である。情報処理端末２０２は、例えば、スマートフォン、ＰＣ、タブレット型ＰＣなどである。

なお、情報処理システム２００において、情報処理装置１０１は、応答処理機能を有していてもよい。応答処理機能は、例えば、ＦＡＱシステムに入力された入力ワード（単語または文章）に対応する回答データを検索して出力する機能である。入力ワードに対応する回答データは、例えば、ＦＡＱシステムにおいて採用されている既存の検索アルゴリズムを用いて検索される。

具体的には、例えば、情報処理装置１０１は、ＦＡＱマスタ２２０を参照して、入力された入力ワード（単語または文章）に一致する質問を検索する。そして、情報処理装置１０１は、入力ワードに一致する質問が検索された場合に、検索された質問に対応する回答を、入力ワードに対応する回答として出力する。

検索された質問に対応する回答は、例えば、検索された質問と同一のタイトルの質問に関連する回答、すなわち、検索された質問とＦＡＱ－ＩＤが同一の質問に関連する回答である（例えば、後述の図５参照）。一方、入力ワードに対応する回答が検索されなかった場合は、情報処理装置１０１は、入力ワードに対応する回答がないことを示す検索結果（ゼロ件ヒット）を出力する。

また、入力ワードに対応する回答を検索するにあたり、情報処理装置１０１は、入力ワードを形態素解析して形態素に分解することにしてもよい。そして、情報処理装置１０１は、ＦＡＱマスタ２２０を参照して、所定の検索条件にしたがって、分解した形態素に対応するＦＡＱを検索することにしてもよい。

ただし、応答処理機能は、情報処理装置１０１とは異なる他のコンピュータにより実行されることにしてもよい。また、ＦＡＱマスタ２２０や会話テキストマスタ２３０は、例えば、情報処理装置１０１がアクセス可能な他のコンピュータ（例えば、データベースサーバ）が有することにしてもよい。

（情報処理装置１０１のハードウェア構成例）
図３は、情報処理装置１０１のハードウェア構成例を示すブロック図である。図３において、情報処理装置１０１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）３０１と、メモリ３０２と、ディスクドライブ３０３と、ディスク３０４と、通信Ｉ／Ｆ（Ｉｎｔｅｒｆａｃｅ）３０５と、可搬型記録媒体Ｉ／Ｆ３０６と、可搬型記録媒体３０７と、を有する。また、各構成部は、バス３００によってそれぞれ接続される。

ここで、ＣＰＵ３０１は、情報処理装置１０１の全体の制御を司る。ＣＰＵ３０１は、複数のコアを有していてもよい。メモリ３０２は、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）およびフラッシュＲＯＭなどを有する。具体的には、例えば、フラッシュＲＯＭがＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）のプログラムを記憶し、ＲＯＭがアプリケーションプログラムを記憶し、ＲＡＭがＣＰＵ３０１のワークエリアとして使用される。メモリ３０２に記憶されるプログラムは、ＣＰＵ３０１にロードされることで、コーディングされている処理をＣＰＵ３０１に実行させる。

ディスクドライブ３０３は、ＣＰＵ３０１の制御に従ってディスク３０４に対するデータのリード／ライトを制御する。ディスク３０４は、ディスクドライブ３０３の制御で書き込まれたデータを記憶する。ディスク３０４としては、例えば、磁気ディスク、光ディスクなどが挙げられる。

通信Ｉ／Ｆ３０５は、通信回線を通じてネットワーク２１０に接続され、ネットワーク２１０を介して外部のコンピュータ（例えば、図２に示した作業者端末２０１、情報処理端末２０２）に接続される。そして、通信Ｉ／Ｆ３０５は、ネットワーク２１０と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。通信Ｉ／Ｆ３０５には、例えば、モデムやＬＡＮアダプタなどを採用することができる。

可搬型記録媒体Ｉ／Ｆ３０６は、ＣＰＵ３０１の制御に従って可搬型記録媒体３０７に対するデータのリード／ライトを制御する。可搬型記録媒体３０７は、可搬型記録媒体Ｉ／Ｆ３０６の制御で書き込まれたデータを記憶する。可搬型記録媒体３０７としては、例えば、ＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）－ＲＯＭ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリなどが挙げられる。

なお、情報処理装置１０１は、上述した構成部のほかに、例えば、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、入力装置、ディスプレイ等を有することにしてもよい。また、情報処理装置１０１は、上述した構成部のうち、例えば、ディスクドライブ３０３、ディスク３０４、可搬型記録媒体Ｉ／Ｆ３０６、可搬型記録媒体３０７を有していなくてもよい。

（作業者端末２０１のハードウェア構成例）
図４は、作業者端末２０１のハードウェア構成例を示すブロック図である。図４において、作業者端末２０１は、ＣＰＵ４０１と、メモリ４０２と、通信Ｉ／Ｆ４０３と、ディスプレイ４０４と、入力装置４０５と、可搬型記録媒体Ｉ／Ｆ４０６と、可搬型記録媒体４０７と、を有する。また、各構成部はバス４００によってそれぞれ接続される。

ここで、ＣＰＵ４０１は、作業者端末２０１の全体の制御を司る。ＣＰＵ４０１は、複数のコアを有していてもよい。メモリ４０２は、例えば、ＲＯＭ、ＲＡＭおよびフラッシュＲＯＭなどを有する記憶部である。具体的には、例えば、フラッシュＲＯＭやＲＯＭが各種プログラムを記憶し、ＲＡＭがＣＰＵ４０１のワークエリアとして使用される。メモリ４０２に記憶されるプログラムは、ＣＰＵ４０１にロードされることで、コーディングされている処理をＣＰＵ４０１に実行させる。

通信Ｉ／Ｆ４０３は、通信回線を通じてネットワーク２１０に接続され、ネットワーク２１０を介して外部のコンピュータ（例えば、情報処理装置１０１）に接続される。そして、通信Ｉ／Ｆ４０３は、ネットワーク２１０と自装置内部とのインターフェースを司り、外部装置からのデータの入出力を制御する。

ディスプレイ４０４は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する表示装置である。ディスプレイ４０４としては、例えば、液晶ディスプレイや有機ＥＬ（Ｅｌｅｃｔｒｏｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイなどを採用することができる。

入力装置４０５は、文字、数字、各種指示などの入力のためのキーを有し、データの入力を行う。入力装置４０５は、キーボードやマウスなどであってもよく、また、タッチパネル式の入力パッドやテンキーなどであってもよい。

可搬型記録媒体Ｉ／Ｆ４０６は、ＣＰＵ４０１の制御に従って可搬型記録媒体４０７に対するデータのリード／ライトを制御する。可搬型記録媒体４０７は、可搬型記録媒体Ｉ／Ｆ４０６の制御で書き込まれたデータを記憶する。

なお、作業者端末２０１は、上述した構成部のほかに、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ、スキャナ、プリンタ等を有することにしてもよい。また、作業者端末２０１は、上述した構成部のうち、例えば、可搬型記録媒体Ｉ／Ｆ４０６、可搬型記録媒体４０７を有していなくてもよい。また、図２に示した情報処理端末２０２についても、作業者端末２０１と同様のハードウェア構成により実現することができる。

（ＦＡＱマスタ２２０の記憶内容）
つぎに、図５を用いて、情報処理装置１０１が有するＦＡＱマスタ２２０の記憶内容について説明する。ＦＡＱマスタ２２０は、例えば、図３に示したメモリ３０２、ディスク３０４などの記憶装置により実現される。

図５は、ＦＡＱマスタ２２０の記憶内容の一例を示す説明図である。図５において、ＦＡＱマスタ２２０は、ＦＡＱ－ＩＤ、質問および回答のフィールドを有し、各フィールドに情報を設定することで、ＦＡＱ（例えば、ＦＡＱ５００－１，５００－２）をレコードとして記憶する。

ここで、ＦＡＱ－ＩＤは、ＦＡＱを識別する識別子である。質問は、ＦＡＱを形成する質問を示す質問データである。回答は、質問に対応する回答を示す回答データである。質問および回答は、単語または複数の単語の組み合わせによって表現されてもよく、また、１または複数の文によって表現されてもよい。

例えば、ＦＡＱ５００－１は、ＦＡＱ－ＩＤ「１」の質問「曇りの定義は？」と、回答「雲の量が９割以上が曇り」と、を含む。

（会話テキストマスタ２３０の記憶内容）
つぎに、図６を用いて、情報処理装置１０１が有する会話テキストマスタ２３０の記憶内容について説明する。会話テキストマスタ２３０は、例えば、図３に示したメモリ３０２、ディスク３０４などの記憶装置により実現される。

図６は、会話テキストマスタ２３０の記憶内容の一例を示す説明図である。図６において、会話テキストマスタ２３０は、会話－ＩＤおよび会話テキストのフィールドを有し、各フィールドに情報を設定することで、会話データ（例えば、会話データ６００－１～６００－４）をレコードとして記憶する。

ここで、会話－ＩＤは、会話テキストを識別する識別子である。会話テキストは、会話内容を示す。会話テキストとしては、例えば、チャットで行われた日常会話（例えば、挨拶、趣味の話など）が記憶される。例えば、会話データ６００－１は、会話－ＩＤ「１」の会話テキスト「おはようございます」を示す。

（解決不良テーブル２４０の記憶内容）
つぎに、図７を用いて、情報処理装置１０１が有する解決不良テーブル２４０の記憶内容について説明する。解決不良テーブル２４０は、例えば、図３に示したメモリ３０２、ディスク３０４などの記憶装置により実現される。

図７は、解決不良テーブル２４０の記憶内容の一例を示す説明図である。図７において、解決不良テーブル２４０は、入力ワード、ゼロ件ヒットおよび適合回答無しのフィールドを有し、各フィールドに情報を設定することで、解決不良データ（例えば、解決不良データ７００－１～７００－３）をレコードとして記憶する。

ここで、入力ワードは、入力された単語または文章である。ゼロ件ヒットは、ゼロ件ヒットの件数を示す。ゼロ件ヒットの入力ワードは、入力ワードに関連する回答を特定できなかった入力ワードのことである。適合回答無しは、適合回答無しの件数を示す。適合回答無しは、検索した回答について否定的な評価がなされた入力ワードのことである。

例えば、解決不良データ７００－１は、入力ワード「台風の予報」のゼロ件ヒット「３」および適合回答無し「０」を示す。

（情報処理装置１０１の機能的構成例）
図８は、情報処理装置１０１の機能的構成例を示すブロック図である。図８において、情報処理装置１０１は、取得部８０１と、学習部８０２と、判定部８０３と、表示制御部８０４と、を含む。具体的には、例えば、取得部８０１～表示制御部８０４は、図３に示したメモリ３０２、ディスク３０４、可搬型記録媒体３０７などの記憶装置に記憶されたプログラムをＣＰＵ３０１に実行させることにより、または、通信Ｉ／Ｆ３０５により、その機能を実現する。各機能部の処理結果は、例えば、メモリ３０２、ディスク３０４などの記憶装置に記憶される。

取得部８０１は、入力された単語または文章に対応する回答を検索した結果、当該入力された単語または文章のうち対応する回答がない単語または文章の情報を取得する。ここで、対応する回答がなかった単語または文章は、ゼロ件ヒットとなった単語または文章である。また、対応する回答がない単語または文章は、適合回答無しとなった単語または文章であってもよい。

具体的には、例えば、取得部８０１は、不図示の入力装置を用いた管理者の操作入力により、または、外部のコンピュータから、解決不良データを取得することにしてもよい。解決不良データは、ゼロ件ヒットや適合回答無しとなった入力ワード（単語または文章）に関する情報であり、例えば、当該入力ワードがゼロ件ヒットとなった件数や、当該入力ワードが適合回答無しとなった件数を含む。

また、解決不良データは、例えば、情報処理装置１０１において、不図示のチャットログＤＢ（Ｄａｔａｂａｓｅ）から生成されることにしてもよい。チャットログは、ＦＡＱシステムで行われたチャットに関するログであり、例えば、入力ワード、ＦＡＱ－ＩＤおよびＦＡＱ－ＬＩＳＴを含む。

入力ワードは、ＦＡＱシステムに入力された単語または文章である。ＦＡＱ－ＩＤは、入力ワードに対して提示された回答（回答候補）のうち、選択された回答のＦＡＱ－ＩＤである。ＦＡＱ－ＬＩＳＴは、入力ワードに対して提示された回答のリストである。入力ワードに対して回答が提示されなかった場合、ＦＡＱ－ＩＤには「－（Ｎｕｌｌ）」が設定される。

また、回答が提示されたにもかかわらず、いずれの回答も選択されなかった場合は、ＦＡＱ－ＩＤに「ＮｏｔＦｏｕｎｄ」が設定される。ＦＡＱ－ＩＤ「ＮｏｔＦｏｕｎｄ」の入力ワードは、適合回答無しの入力ワードを示す。入力ワードに対して回答が提示されなかった場合、ＦＡＱ－ＬＩＳＴフィールドには「ＮｏｔＦｏｕｎｄ」が設定される。ＦＡＱ－ＬＩＳＴ「ＮｏｔＦｏｕｎｄ」の入力ワードは、ゼロ件ヒットとなった入力ワードを示す。

例えば、情報処理装置１０１は、チャットログＤＢを参照して、ＦＡＱ－ＩＤに「ＮｏｔＦｏｕｎｄ」が設定された入力ワードを、適合回答無しの入力ワードとして特定する。また、情報処理装置１０１は、チャットログＤＢを参照して、ＦＡＱ－ＬＩＳＴに「ＮｏｔＦｏｕｎｄ」が設定された入力ワードを、ゼロ件ヒットの入力ワードとして特定する。

そして、情報処理装置１０１は、特定したゼロ件ヒットや適合回答無しとなった入力ワードに関する解決不良データを生成する。この場合、取得部８０１は、生成された解決不良データを取得する。なお、チャットログＤＢ内のどの期間のチャットログを用いるかは任意に設定可能である。取得された解決不良データは、例えば、図７に示した解決不良テーブル２４０に記憶される。

学習部８０２は、問い合わせを示すラベルが付与された質問データを教師データとして機械学習を行って、学習モデルＭを生成する。また、学習部８０２は、問い合わせを示すラベルが付与された質問データと、問い合わせ以外を示すラベルが付与された会話データとを教師データとして機械学習を行って、学習モデルＭを生成することにしてもよい。

ここで、学習モデルＭは、入力データの特徴量から、問い合わせ、または、問い合わせ以外のいずれであるかを分類する分類器である。学習モデルＭとしては、例えば、サポートベクターマシン（ＳＶＭ：ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ）を用いることができる。

具体的には、例えば、学習部８０２は、図５に示したＦＡＱマスタ２２０を参照して、ＦＡＱの各質問および回答のテキストから特徴量ベクトルを生成する。より詳細に説明すると、例えば、学習部８０２は、ＦＡＱの各質問および回答のテキストを形態素解析して単語に分割して、分割した単語をベクトル化する。単語のベクトル化には、例えば、ｗｏｒｄ２ｖｅｃなどの既存の技術を用いることができる。

つぎに、学習部８０２は、各単語のベクトルの和を特徴量ベクトル（文章のベクトル値）として生成する。そして、学習部８０２は、生成した特徴量ベクトルにラベル「＿ＱＵＥＲＹ＿」を付与したものを教師データとする。ラベル「＿ＱＵＥＲＹ＿」は、問い合わせ（クエリ）を示すラベルである。

同様に、学習部８０２は、図６に示した会話テキストマスタ２３０を参照して、各会話テキストを形態素解析して単語に分割して、分割した単語をベクトル化する。つぎに、学習部８０２は、各単語のベクトルの和を特徴量ベクトル（文章のベクトル値）として生成する。そして、学習部８０２は、生成した特徴量ベクトルにラベル「＿ＯＴＨＥＲ＿」を付与したものを教師データとする。ラベル「＿ＯＴＨＥＲ＿」は、問い合わせ以外を示すラベルである。

ここで、図９を用いて、教師データの具体例について説明する。

図９は、教師データの具体例を示す説明図である。図９において、データセット９００は、教師データの集合である。データセット９００内の各教師データ（例えば、教師データ９０１，９０２）は、文章のベクトル値とラベルとを含む。文章のベクトル値は、ＦＡＱのテキストや会話テキストから生成した特徴量ベクトルである。ラベルは、問い合わせ（＿ＱＵＥＲＹ＿）、または、問い合わせ以外（＿ＯＴＨＥＲ＿）を示すラベル（正解）である。

例えば、学習部８０２は、データセット９００に基づいて、サポートベクターマシンを用いた教師あり学習を行う。この際、学習部８０２は、例えば、ソフトマージン（制約緩和）を制御するパラメタＣには交差検証法を用いて良好な精度が得られる値を採用する。なお、学習部８０２による機械学習（教師あり学習）は、例えば、ＦＡＱマスタ２２０の記憶内容が更新される度に行われることにしてもよい。

これにより、入力データの特徴量ベクトルから、問い合わせ、または、問い合わせ以外のいずれであるかを分類する学習モデルＭ（分類器）を生成することができる。なお、学習モデルＭ（分類器）による分類結果の具体例については、図１１を用いて後述する。

図８の説明に戻り、判定部８０３は、取得された情報を参照して、入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定する。具体的には、例えば、判定部８０３は、学習モデルＭを用いて、単語または文章の特徴量に基づいて、当該単語または文章が、問い合わせであるか、または、問い合わせ以外であるかを判定する。

より詳細に説明すると、例えば、判定部８０３は、解決不良テーブル２４０を参照して、ゼロ件ヒットまたは適合回答無しとなった入力ワード（対応する回答がない入力ワード）を特定する。そして、判定部８０３は、特定した入力ワードを単語に分割して、分割した単語をベクトル化する。

つぎに、判定部８０３は、各単語のベクトルの和を特徴量ベクトル（文章のベクトル値）として生成する。そして、判定部８０３は、生成した特徴量ベクトルを、生成された学習モデルＭ（分類器）に入力することにより得られる分類結果から、入力ワードが、問い合わせであるか、または、問い合わせ以外であるかを判定する。

なお、判定された結果は、例えば、ゼロ件ヒットまたは適合回答無しとなった入力ワード（単語または文章）と対応付けて記憶される。

表示制御部８０４は、入力された単語または文章のうち対応する回答がない単語または文章を一覧表示する際に、問い合わせと判定された単語または文章を、問い合わせ以外と判定された単語または文章とは異なる態様で表示する。

具体的には、例えば、表示制御部８０４は、問い合わせと判定された単語または文章を、問い合わせ以外と判定された単語または文章と背景色、背景模様、文字色、フォントの少なくともいずれかが異なるように表示することにしてもよい。また、表示制御部８０４は、問い合わせと判定された単語または文章を表示し、問い合わせ以外と判定された単語または文章を非表示とすることにしてもよい。

より詳細に説明すると、例えば、表示制御部８０４は、解決不良テーブル２４０を参照して、後述の図１３～図１５に示すような管理画面ＭＳを、図２に示した作業者端末２０１に表示することにしてもよい。管理画面ＭＳは、ＦＡＱのメンテナンスを行う際に表示される画面である。また、表示制御部８０４は、後述の図１３～図１５に示すような管理画面ＭＳを、自装置の不図示のディスプレイに表示することにしてもよい。

例えば、表示制御部８０４は、管理画面ＭＳにおいて、ゼロ件ヒットまたは適合回答無しとなった入力ワードを一覧表示する際に、問い合わせと判定された入力ワードをハイライト表示することにしてもよい（後述の図１３参照）。この際、表示制御部８０４は、例えば、ゼロ件ヒットまたは適合回答無しとなった回数が多い順に入力ワードをソートしてランキング形式で表示してもよい。また、表示制御部８０４は、管理画面ＭＳにおいて、ゼロ件ヒットまたは適合回答無しとなった入力ワードを一覧表示する際に、問い合わせ以外と判定された入力ワードを非表示として、問い合わせと判定された入力ワードのみを絞り込み表示することにしてもよい（後述の図１４参照）。

なお、管理画面ＭＳの画面例については、図１２～図１５を用いて後述する。

（単語数が少ない入力ワードについて）
同じ単語であっても、会話の状況によっては、問い合わせ（クエリ）とも雑談（フリートーク）とも受け取ることができることがある。したがって、入力ワードに含まれる単語数が少ないと（例えば、１個や２個）、上述した学習モデルＭ（分類器）を用いた手法では、問い合わせであるかどうかの判定精度が低下するおそれがある。

ここで、ＦＡＱには、雑談などの会話に比べて、特徴的な単語が出現する傾向がある。そこで、情報処理装置１０１は、入力ワードに含まれる単語数が少ないときは、単語のＦＡＱらしさを示す尺度となる特徴度を用いて、入力ワードが、問い合わせであるか、または、問い合わせ以外であるかを判定することにしてもよい。

特徴度は、ＦＡＱで多く出現するほど値が高くなり、会話テキスト集に多く出現するほど値が低くなるように算出される。例えば、特徴度は、ＴＦ（ＴｅｒｍＦｒｅｑｕｅｎｃｙ）－ＩＤＦ（ＩｎｖｅｒｓｅＤｏｃｕｍｅｎｔＦｒｅｑｕｅｎｃｙ）アルゴリズムを用いて算出されることにしてもよい。

具体的には、例えば、判定部８０３は、入力ワード（単語または文章）に含まれる単語数が所定数以下の場合、質問データと回答データとの組の集合と会話データの集合とに基づいて、入力ワードに含まれる単語の特徴度を算出する。ここで、所定数は、任意に設定可能であり、例えば、１、２程度の値に設定される。

質問データと回答データとの組は、質問データと当該質問データに対応する回答データとの組であり、例えば、ＦＡＱである。会話データは、例えば、チャットで行われた日常会話を示す会話テキストである。単語の特徴度は、単語の特徴的な度合いを示す指標値である。

より具体的には、例えば、判定部８０３は、下記式（１）を用いて、入力ワードに含まれる単語ｉの特徴度（ｉ）を算出することができる。全文書は、例えば、ＦＡＱマスタ２２０内のＦＡＱと、会話テキストマスタ２３０内の会話テキストを合わせたものである。

特徴度（ｉ）＝ＦＡＱ内での単語ｉの出現頻度 × ｌｏｇ（全文書中での単語ｉが出現する文書数の逆数）・・・（１）

上記式（１）の「ＦＡＱ内での単語ｉの出現頻度」は、例えば、ＦＡＱマスタ２２０内の全ＦＡＱでの単語ｉの出現頻度であり、ＴＦ－ＩＤＦ値におけるＴＦ値に対応する。ＴＦ値は、特定の文書中での単語ｉの出現頻度を示す。上記式（１）の「ｌｏｇ（全文書中での単語ｉが出現する文書数の逆数）」は、ＴＦ－ＩＤＦ値におけるＩＤＦ値に対応する。ＩＤＦ値は、全文書中で単語ｉが出現する文書数の逆数である。

そして、判定部８０３は、算出した特徴度（ｉ）に基づいて、入力ワードが、問い合わせであるか、または、問い合わせ以外であるかを判定する。具体的には、例えば、判定部８０３は、特徴度（ｉ）が閾値を超えている場合、入力ワードが問い合わせであると判定する。また、判定部８０３は、特徴度（ｉ）以下の場合には、入力ワードが問い合わせ以外であると判定する。閾値は、任意に設定可能である。

なお、入力ワードに複数の単語が含まれる場合、例えば、判定部８０３は、複数の単語のいずれかの単語の特徴度が閾値を超えている場合に、入力ワードが問い合わせであると判定することにしてもよい。また、判定部８０３は、複数の単語それぞれの特徴度の平均値が閾値を超えている場合に、入力ワードが問い合わせであると判定することにしてもよい。また、判定部８０３は、複数の単語それぞれの特徴度が全て閾値を超えている場合に、入力ワードが問い合わせであると判定することにしてもよい。

ここで、図１０を用いて、単語ｉの特徴度（ｉ）から、入力ワードが、問い合わせであるか、または、問い合わせ以外であるかを判定する場合の判定例について説明する。

図１０は、特徴度を用いた判定例を示す説明図である。図１０に示すケース１では、入力ワードに含まれる単語ｉを「百葉箱」とする。点線枠１０１０（ＦＡＱ）内の各文書１０１１～１０１３は、個々のＦＡＱを示す。点線枠１０２０（会話テキスト集）内の各文書１０２１～１０３２は、個々の会話テキストを示す。

「百葉箱」は、ＦＡＱに多く登場する一方で、会話テキスト集にはあまり登場していないため、ＦＡＱらしい単語とみなす。上記式（１）を用いた計算では、ＦＡＱを対象とした単語ｉの出現頻度が高くなるため、特徴度（ｉ）は大きくなる。

図１０に示すケース２では、入力ワードに含まれる単語ｉを「今日」とする。点線枠１０４０（ＦＡＱ）内の各文書１０４１～１０４３は、個々のＦＡＱを示す。点線枠１０５０（会話テキスト集）内の各文書１０５１～１０６２は、個々の会話テキストを示す。

「今日」は、会話テキスト集に多く登場するため、一般的な単語とみなす。上記式（１）を用いた計算では、ＦＡＱと会話テキスト集とを対象としたＩＤＦ（ＤＦの逆数）値に対応する部分が低くなるため、特徴度（ｉ）は小さくなる。

なお、ＦＡＱテキストと会話テキストの量に差をつけ、ＦＡＱよりも大量の会話テキストを設けることで、一般的な単語のＩＤＦ値がより小さく計算されるため、特徴度（ｉ）の計算結果が鮮明に表れるようになる。

ここで、図１１を用いて、学習モデルＭ（分類器）による分類結果の具体例について説明する。

図１１は、学習モデルによる分類結果の具体例を示す説明図である。図１１において、分類結果情報１１１０は、ＦＡＱのテキストから生成した教師データ（ラベル「＿ＱＵＥＲＹ＿」）のみを使用して生成した学習モデルＭ（分類器）を用いて分類した結果を示している。

また、分類結果情報１１２０は、ＦＡＱのテキストから生成した教師データ（ラベル「＿ＱＵＥＲＹ＿」）とともに、会話テキストから生成した教師データ（ラベル「＿ＯＴＨＥＲ＿」）を使用して生成した学習モデルＭ（分類器）を用いて分類した結果を示している。

分類結果情報１１１０において、例えば、分類結果１１１１は、入力ワード「こんにちは」が、問い合わせ以外（図１１中、「Ｔａｌｋ」）であることを示す。また、分類結果１１１２は、入力ワード「今日はいい天気ですね」が、問い合わせ（図１１中、「Ｑｕｅｒｙ」）であることを示す。

また、分類結果１１１３は、入力ワード「昨日は土砂降りの雨で苦労しました」が、問い合わせであることを示す。ここで、入力ワード「今日はいい天気ですね」や「昨日は土砂降りの雨で苦労しました」は、「問い合わせ以外（Ｔａｌｋ）」と分類されるべきものである。

これに対して、分類結果情報１１２０において、分類結果１１２１は、入力ワード「今日はいい天気ですね」が、問い合わせ以外であることを示している。また、分類結果１１２２は、入力ワード「昨日は土砂降りの雨で苦労しました」が、問い合わせ以外であることを示している。

このように、学習モデルＭ（分類器）の生成にあたり、ＦＡＱのテキストから生成した教師データ（ラベル「＿ＱＵＥＲＹ＿」）だけでなく、会話テキストから生成した教師データ（ラベル「＿ＯＴＨＥＲ＿」）も使用することで、分類精度が向上していることがわかる。

（管理画面ＭＳの画面例）
つぎに、図１２～図１５を用いて、作業者端末２０１のディスプレイ４０４（図４参照）に表示される管理画面ＭＳの画面例について説明する。

図１２～図１５は、管理画面ＭＳの画面例を示す説明図である。まず、図１２を用いて、問い合わせ（＿ＱＵＥＲＹ＿）と判定された入力ワードと、問い合わせ以外（＿ＯＴＨＥＲ＿）と判定された入力ワードとを、同じ態様で表示する場合の表示例について説明する。

図１２において、管理画面ＭＳは、ＦＡＱのメンテナンスを行う際に表示される管理画面の一例である。管理画面ＭＳには、ゼロ件ヒットまたは適合回答無しとなった入力ワードが、出現回数（ゼロ件ヒットの件数＋適合回答無しの件数）の多い順に一覧表示されている。

つぎに、図１３～図１５を用いて、問い合わせと判定された入力ワードを、問い合わせ以外と判定された入力ワードとは異なる態様で表示する場合の表示例について説明する。

図１３に示す管理画面ＭＳでは、ゼロ件ヒットまたは適合回答無しとなった順位１～７の入力ワードのうち、問い合わせ（＿ＱＵＥＲＹ＿）と判定された順位１，２，３，７の入力ワードのみがハイライト表示されている。

これにより、ＦＡＱシステムの管理者は、ゼロ件ヒットまたは適合回答無しとなった入力ワードのうち、どの入力ワードが質問（問い合わせ）なのかを容易に識別することが可能となり、優先的にメンテナンスを行うべきＦＡＱを判断しやすくなる。例えば、管理者は、順位１の「台風」は質問（問い合わせ）であり、順位４の「土砂降りの雨で憂鬱です」はフリートーク（問い合わせ以外）であることを容易に判断することができる。

また、ＦＡＱシステムの管理者は、順位を参照することで、質問（問い合わせ）の入力ワードのうち、どの入力ワードからメンテナンスを行うべきかを判断しやすくなる。例えば、管理者は、頻繁に出現している高順位の入力ワードからメンテナンスを行うべきであると判断することができる。

図１４に示す管理画面ＭＳでは、ゼロ件ヒットまたは適合回答無しとなった入力ワードのうち、問い合わせ（＿ＱＵＥＲＹ＿）と判定された順位１，２，３，７の入力ワードのみが表示されている。すなわち、問い合わせ以外（＿ＯＴＨＥＲ＿）と判定された入力ワードが非表示となっている。

これにより、ＦＡＱシステムの管理者は、ゼロ件ヒットまたは適合回答無しとなった入力ワードのうち、質問（問い合わせ）の入力ワードを容易に特定することが可能となり、優先的にメンテナンスを行うべきＦＡＱを判断しやすくなる。

図１５に示す管理画面ＭＳでは、ゼロ件ヒットまたは適合回答無しとなった入力ワードのうち、問い合わせ（＿ＱＵＥＲＹ＿）と判定された順位１，２，３，７の入力ワードに対して、アイコン１５０１～１５０４が表示されている。アイコン１５０１～１５０４は、問い合わせの入力ワードであることを示すマークである。

これにより、ＦＡＱシステムの管理者は、ゼロ件ヒットまたは適合回答無しとなった入力ワードのうち、どの入力ワードが質問（問い合わせ）なのかを容易に識別することが可能となり、優先的にメンテナンスを行うべきＦＡＱを判断しやすくなる。

なお、情報処理装置１０１（表示制御部８０４）は、作業者端末２０１のユーザの操作入力に応じて、図１２～図１５に示した管理画面ＭＳの表示態様を切替可能にしてもよい。例えば、表示制御部８０４は、ユーザの操作入力に応じて、管理画面ＭＳの表示態様を、図１２に示した管理画面ＭＳから、図１３に示した管理画面ＭＳに切り替えることにしてもよい。

また、表示制御部８０４は、ユーザの操作入力に応じて、管理画面ＭＳの表示態様を、図１３に示した管理画面ＭＳから、図１４に示した管理画面ＭＳに切り替えることにしてもよい。これにより、ＦＡＱシステムの管理者は、例えば、ゼロ件ヒットまたは適合回答無しとなった入力ワード全体を一旦確認した上で、優先的にメンテナンスを行うべき問い合わせ（質問）の入力ワードのみを絞り込み表示させることができる。

（情報処理装置１０１の表示制御処理手順）
つぎに、図１６を用いて、情報処理装置１０１の表示制御処理手順について説明する。情報処理装置１０１の表示制御処理は、例えば、作業者端末２０１からの要求に応じて実行される。

図１６は、情報処理装置１０１の表示制御処理手順の一例を示すフローチャートである。図１６のフローチャートにおいて、まず、情報処理装置１０１は、解決不良テーブル２４０を参照して、管理画面ＭＳにゼロ件ヒットランキングを表示する（ステップＳ１６０１）。ゼロ件ヒットランキングは、ゼロ件ヒットまたは適合回答無しとなった入力ワードを、出現回数（ゼロ件ヒットの件数＋適合回答無しの件数）が多い順にソートしたものである。

つぎに、情報処理装置１０１は、Ｑｕｅｒｙハイライト機能が有効であるか否かを判断する（ステップＳ１６０２）。Ｑｕｅｒｙハイライト機能の有効／無効は、例えば、予め設定されていてもよく、また、管理画面ＭＳ上の操作ボタン（不図示）を押下するなどの操作入力により設定されてもよい。

ここで、情報処理装置１０１は、Ｑｕｅｒｙハイライト機能が有効となるのを待つ（ステップＳ１６０２：Ｎｏ）。そして、情報処理装置１０１は、Ｑｕｅｒｙハイライト機能が有効となった場合（ステップＳ１６０２：Ｙｅｓ）、ゼロ件ヒットランキングから選択されていない未選択の入力ワードを選択する（ステップＳ１６０３）。

つぎに、情報処理装置１０１は、選択した入力ワードを単語に分割する（ステップＳ１６０４）。そして、情報処理装置１０１は、入力ワードに含まれる単語数が所定数以下であるか否かを判断する（ステップＳ１６０５）。

ここで、単語数が所定数より大きい場合（ステップＳ１６０５：Ｎｏ）、情報処理装置１０１は、入力ワードから分割した各単語のベクトルの和を特徴量ベクトル（文章のベクトル値）として生成する（ステップＳ１６０６）。そして、情報処理装置１０１は、生成した特徴量ベクトルを学習モデルＭ（分類器）に入力して、入力ワードが、Ｑｕｅｒｙ（問い合わせ）に属するか、ＯＴＨＥＲ（問い合わせ以外）に属するかを判定して（ステップＳ１６０７）、ステップＳ１６０９に移行する。

また、ステップＳ１６０５において、単語数が所定数以下の場合（ステップＳ１６０５：Ｙｅｓ）、情報処理装置１０１は、特徴度判定処理を実行する（ステップＳ１６０８）。特徴度判定処理は、単語の特徴度を用いて、入力ワードが、問い合わせであるか、または、問い合わせ以外であるかを判定する処理である。

なお、特徴度判定処理の具体的な処理手順については、図１７を用いて後述する。

つぎに、情報処理装置１０１は、ゼロ件ヒットランキングから選択されていない未選択の入力ワードがあるか否かを判断する（ステップＳ１６０９）。ここで、未選択の入力ワードがある場合（ステップＳ１６０９：Ｙｅｓ）、情報処理装置１０１は、ステップＳ１６０３に戻る。

一方、未選択の入力ワードがない場合（ステップＳ１６０９：Ｎｏ）、情報処理装置１０１は、管理画面ＭＳにおいて、Ｑｕｅｒｙ（問い合わせ）に属する入力ワードをハイライト表示して（ステップＳ１６１０）、本フローチャートによる一連の処理を終了する。

これにより、管理画面ＭＳにおいて、ゼロ件ヒットまたは適合回答無しとなった入力ワードのうち、ＱＵＥＲＹに属すると判定された入力ワードのみをハイライト表示して、どの入力ワードが問い合わせ（質問）なのかを容易に識別可能にすることができる。

なお、Ｑｕｅｒｙハイライト機能が予め有効に設定されている場合、情報処理装置１０１は、ステップＳ１６０１，Ｓ１６０２の処理をスキップすることにしてもよい。また、ステップＳ１６１０において、情報処理装置１０１は、管理画面ＭＳにおいて、Ｏｔｈｅｒ（問い合わせ以外）に属する入力ワードを非表示とし、Ｑｕｅｒｙ（問い合わせ）に属する入力ワードのみを表示することにしてもよい。

つぎに、図１７を用いて、図１６に示したステップＳ１６０８の特徴度判定処理の具体的な処理手順について説明する。

図１７は、特徴度判定処理の具体的処理手順の一例を示すフローチャートである。図１７のフローチャートにおいて、まず、情報処理装置１０１は、ＦＡＱマスタ２２０および会話テキストマスタ２３０を参照して、上記式（１）を用いて、図１６に示したステップＳ１６０４において分割した単語の特徴度を算出する（ステップＳ１７０１）。

つぎに、情報処理装置１０１は、算出した単語の特徴度が閾値を超えているか否かを判断する（ステップＳ１７０２）。ここで、単語の特徴度が閾値を超えている場合（ステップＳ１７０２：Ｙｅｓ）、情報処理装置１０１は、入力ワードが、Ｑｕｅｒｙ（問い合わせ）に属すると判定して（ステップＳ１７０３）、特徴度判定処理を呼び出したステップに戻る。

一方、単語の特徴度が閾値以下の場合（ステップＳ１７０２：Ｎｏ）、情報処理装置１０１は、入力ワードが、Ｏｔｈｅｒ（問い合わせ以外）に属すると判定して（ステップＳ１７０４）、特徴度判定処理を呼び出したステップに戻る。

これにより、入力ワードに含まれる単語数が少ないときに（例えば、１個や２個）、入力ワードに特徴的な単語が出現するかどうかで、入力ワードが、問い合わせであるか、または、問い合わせ以外であるかを判定することができる。

以上説明したように、実施の形態にかかる情報処理装置１０１によれば、入力された単語または文章に対応する回答を検索した結果、入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定することができる。入力された単語または文章は、例えば、ＦＡＱシステムのユーザの情報処理端末２０２に入力された単語または文章である。そして、情報処理装置１０１によれば、入力された単語または文章のうち対応する回答がない単語または文章を一覧表示する際に、問い合わせと判定した単語または文章を、問い合わせ以外と判定した単語または文章とは異なる態様で表示することができる。

これにより、ユーザの情報処理端末２０２に入力された入力ワードのうち、ゼロ件ヒットまたは適合回答無しとなった入力ワードを一覧表示する際に、質問（問い合わせ）であるか、フリートーク（問い合わせ以外）であるかを識別可能に表示することができる。このため、例えば、ＦＡＱシステムの管理者は、ＦＡＱのメンテナンスを行う際に、ゼロ件ヒットまたは適合回答無しとなった入力ワードのうち、優先して回答を用意すべき入力ワード（問い合わせ）を容易に判断することが可能となる。

また、情報処理装置１０１によれば、問い合わせを示すラベルが付与された質問データと、問い合わせ以外を示すラベルが付与された会話データとを教師データとして機械学習を行って、入力データの特徴量から、問い合わせ、または、問い合わせ以外のいずれであるかを分類する学習モデルＭ（分類器）を用いて、単語または文章の特徴量に基づいて、当該単語または文章が、問い合わせであるか、または、問い合わせ以外であるかを判定することができる。

これにより、学習モデルＭ（分類器）の生成にあたり、ＦＡＱのテキストから生成した教師データ（ラベル「＿ＱＵＥＲＹ＿」）だけでなく、会話テキストから生成した教師データ（ラベル「＿ＯＴＨＥＲ＿」）も使用することで、分類精度の向上を図ることができる。

また、情報処理装置１０１によれば、単語または文章に含まれる単語数が所定数以下の場合、質問データと回答データとの組の集合と会話データの集合とに基づいて、単語または文章に含まれる単語の特徴的な度合いを示す特徴度を算出することができる。特徴度は、例えば、ＴＦ－ＩＤＦアルゴリズムを用いて算出される。そして、情報処理装置１０１によれば、算出した特徴度に基づいて、単語または文章が、問い合わせであるか、または、問い合わせ以外であるかを判定することができる。

これにより、入力ワードに含まれる単語数が少ないときに（例えば、１個や２個）、入力ワードに特徴的な単語が出現するかどうかで、入力ワードが、問い合わせであるか、または、問い合わせ以外であるかを判定することができる。また、ＴＦ－ＩＤＦアルゴリズムを用いることで、ＦＡＱで多く出現するほど値が高くなり、会話テキスト集に多く出現するほど値が低くなる特徴度を求めることができ、単語のＦＡＱらしさを評価する適切な指標値を得ることができる。

また、情報処理装置１０１によれば、問い合わせと判定した単語または文章を、問い合わせ以外と判定した単語または文章と背景色、背景模様、文字色、フォントの少なくともいずれかが異なるように表示することができる。

これにより、ゼロ件ヒットまたは適合回答無しとなった入力ワードのうち、質問（問い合わせ）に属する入力ワードを直感的に判断可能にすることができる。

また、情報処理装置１０１によれば、問い合わせと判定した単語または文章を表示し、問い合わせ以外と判定した単語または文章を非表示とすることができる。

これにより、ゼロ件ヒットまたは適合回答無しとなった入力ワードのうち、回答を用意する必要性が低い入力ワードを非表示にして、優先して回答を用意すべき入力ワードの判断ミスを防ぐことができる。

これらのことから、情報処理装置１０１によれば、入力される質問に対して適切な回答を提示するためのＦＡＱのメンテナンス作業にかかる手間や時間を削減することができる。これにより、ＦＡＱのメンテナンス作業にかかる人的負荷やコストを抑えつつ、ゼロ件ヒットや適合回答無しの件数の増加を抑えることが可能となり、ひいては、ユーザの満足度を向上させることができる。

なお、本実施の形態で説明した表示制御方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本表示制御プログラムは、ハードディスク、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ、ＵＳＢメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本表示制御プログラムは、インターネット等のネットワークを介して配布してもよい。

また、本実施の形態で説明した情報処理装置１０１は、スタンダードセルやストラクチャードＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）などの特定用途向けＩＣやＦＰＧＡなどのＰＬＤ（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）によっても実現することができる。

上述した実施の形態に関し、さらに以下の付記を開示する。

（付記１）入力された単語または文章に対応する回答を検索した結果、前記入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定し、
前記対応する回答がない単語または文章を一覧表示する際に、前記問い合わせと判定した単語または文章を、前記問い合わせ以外と判定した単語または文章とは異なる態様で表示する、
処理をコンピュータに実行させることを特徴とする表示制御プログラム。

（付記２）前記判定する処理は、
問い合わせを示すラベルが付与された質問データと、問い合わせ以外を示すラベルが付与された会話データとを教師データとして機械学習を行って、入力データの特徴量から、問い合わせ、または、問い合わせ以外のいずれであるかを分類する分類器を用いて、前記単語または文章の特徴量に基づいて、当該単語または文章が、問い合わせであるか、または、問い合わせ以外であるかを判定する、ことを特徴とする付記１に記載の表示制御プログラム。

（付記３）前記単語または文章に含まれる単語数が所定数以下の場合、質問データと回答データとの組の集合と会話データの集合とに基づいて、前記単語または文章に含まれる単語の特徴的な度合いを示す特徴度を算出し、
算出した前記特徴度に基づいて、前記単語または文章が、問い合わせであるか、または、問い合わせ以外であるかを判定する、ことを特徴とする付記１または２に記載の表示制御プログラム。

（付記４）前記表示する処理は、
前記問い合わせと判定した単語または文章を、前記問い合わせ以外と判定した単語または文章と背景色、背景模様、文字色、フォントの少なくともいずれかが異なるように表示する、ことを特徴とする付記１～３のいずれか一つに記載の表示制御プログラム。

（付記５）前記表示する処理は、
前記問い合わせと判定した単語または文章を表示し、前記問い合わせ以外と判定した単語または文章を非表示とする、ことを特徴とする付記１～３のいずれか一つに記載の表示制御プログラム。

（付記６）前記特徴度は、ＴＦ（ＴｅｒｍＦｒｅｑｕｅｎｃｙ）－ＩＤＦ（ＩｎｖｅｒｓｅＤｏｃｕｍｅｎｔＦｒｅｑｕｅｎｃｙ）アルゴリズムを用いて算出される、ことを特徴とする付記３に記載の表示制御プログラム。

（付記７）前記入力された単語または文章は、ユーザの情報処理端末に入力された単語または文章である、ことを特徴とする付記１～６のいずれか一つに記載の表示制御プログラム。

（付記８）入力された単語または文章に対応する回答を検索した結果、前記入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定し、
前記対応する回答がない単語または文章を一覧表示する際に、前記問い合わせと判定した単語または文章を、前記問い合わせ以外と判定した単語または文章とは異なる態様で表示する、
処理をコンピュータが実行することを特徴とする表示制御方法。

（付記９）入力された単語または文章に対応する回答を検索した結果、前記入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定する判定部と、
前記対応する回答がない単語または文章を一覧表示する際に、前記判定部によって前記問い合わせと判定された単語または文章を、前記判定部によって前記問い合わせ以外と判定された単語または文章とは異なる態様で表示する表示制御部と、
を有することを特徴とする情報処理装置。

１０１情報処理装置
１１０，１２０入力ワード
１１１，１２１分類結果
２００情報処理システム
２０１作業者端末
２０２情報処理端末
２１０ネットワーク
２２０ＦＡＱマスタ
２３０会話テキストマスタ
２４０解決不良テーブル
３００，４００バス
３０１，４０１ＣＰＵ
３０２，４０２メモリ
３０３ディスクドライブ
３０４ディスク
３０５，４０３通信Ｉ／Ｆ
３０６，４０６可搬型記録媒体Ｉ／Ｆ
３０７，４０７可搬型記録媒体
４０４ディスプレイ
４０５入力装置
８０１取得部
８０２学習部
８０３判定部
８０４表示制御部

Claims

入力された単語または文章に対応する回答を検索した結果、前記入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定し、
前記対応する回答がない単語または文章を一覧表示する際に、前記問い合わせと判定した単語または文章を、前記問い合わせ以外と判定した単語または文章とは異なる態様で表示する、
処理をコンピュータに実行させることを特徴とする表示制御プログラム。
前記判定する処理は、
問い合わせを示すラベルが付与された質問データと、問い合わせ以外を示すラベルが付与された会話データとを教師データとして機械学習を行って、入力データの特徴量から、問い合わせ、または、問い合わせ以外のいずれであるかを分類する分類器を用いて、前記単語または文章の特徴量に基づいて、当該単語または文章が、問い合わせであるか、または、問い合わせ以外であるかを判定する、ことを特徴とする請求項１に記載の表示制御プログラム。
前記単語または文章に含まれる単語数が所定数以下の場合、質問データと回答データとの組の集合と会話データの集合とに基づいて、前記単語または文章に含まれる単語の特徴的な度合いを示す特徴度を算出し、
算出した前記特徴度に基づいて、前記単語または文章が、問い合わせであるか、または、問い合わせ以外であるかを判定する、ことを特徴とする請求項１または２に記載の表示制御プログラム。
前記表示する処理は、
前記問い合わせと判定した単語または文章を、前記問い合わせ以外と判定した単語または文章と背景色、背景模様、文字色、フォントの少なくともいずれかが異なるように表示する、ことを特徴とする請求項１～３のいずれか一つに記載の表示制御プログラム。
前記表示する処理は、
前記問い合わせと判定した単語または文章を表示し、前記問い合わせ以外と判定した単語または文章を非表示とする、ことを特徴とする請求項１～３のいずれか一つに記載の表示制御プログラム。
入力された単語または文章に対応する回答を検索した結果、前記入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定し、
前記対応する回答がない単語または文章を一覧表示する際に、前記問い合わせと判定した単語または文章を、前記問い合わせ以外と判定した単語または文章とは異なる態様で表示する、
処理をコンピュータが実行することを特徴とする表示制御方法。
入力された単語または文章に対応する回答を検索した結果、前記入力された単語または文章のうち対応する回答がない単語または文章について、当該単語または文章の特徴量に基づいて、問い合わせであるか、または、問い合わせ以外であるかを判定する判定部と、
前記対応する回答がない単語または文章を一覧表示する際に、前記判定部によって前記問い合わせと判定された単語または文章を、前記判定部によって前記問い合わせ以外と判定された単語または文章とは異なる態様で表示する表示制御部と、
を有することを特徴とする情報処理装置。