JP7009912B2

JP7009912B2 - 回答出力プログラム、回答出力方法および情報処理装置

Info

Publication number: JP7009912B2
Application number: JP2017207625A
Authority: JP
Inventors: 章文中浜; 慎二生川
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2017-10-26
Filing date: 2017-10-26
Publication date: 2022-01-26
Anticipated expiration: 2037-10-26
Also published as: JP2019079438A

Description

本発明は、回答出力プログラム、回答出力方法および情報処理装置に関する。

近年、オペレータのスキル平準化や回答リードタイムの短縮化のため、ＦＡＱ（ＦｒｅｑｕｅｎｔｌｙＡｓｋｅｄＱｕｅｓｔｉｏｎ）システムを導入するコールセンタが増えている。また、外部にＦＡＱを公開して、コールセンタへの問い合わせ削減を図ることも行われている。

先行技術としては、例えば、複数の識別器各々の識別結果および真のクラスを２次学習データとして用いて、統合識別器の学習を行うものがある。また、追加素性情報候補が追加された新たな学習モデル情報の回答候補抽出の精度と、元の学習モデル情報の回答候補抽出の精度とを比較し、回答候補抽出の精度が所定値以上向上している場合には、新たな学習モデル情報をＤＢに保持させたままとする技術がある。また、操作履歴を示す履歴データを解析し、解析結果に基づいて、履歴データに含まれるキーワードを抽出して重み付けし、このキーワードをインデックスＤＢへ登録する技術がある。また、基準キーワードを含まない文献情報において、基準キーワードに対応する可能性のあるキーワードを検出し、基準キーワードの平均順位と対応キーワード候補の順位を比較することにより、基準キーワードに対応するキーワードを検出する技術がある。

特開２０１５－１１６８６号公報特開２００７－２１９９５５号公報特開２００５－１８５３０号公報特開２００７－１９９９０６号公報

しかしながら、従来技術では、入力された質問に対して回答候補を表示することができない場合がある。

一つの側面では、本発明は、入力された質問に対応する回答候補がなくても、他の質問を推定して回答候補を出力することを目的とする。

１つの実施態様では、第１の質問の入力を受け付け、受け付けた前記第１の質問に対応する回答候補がない場合、前記第１の質問に対応する回答候補がないときに後続して入力を受け付けた他の質問であって、前記他の質問に対して表示されたいずれかの回答候補が選択された前記他の質問を、前記第１の質問と対応付けて記憶する記憶部の記憶内容に基づく機械学習を行って、前記第１の質問に後続して入力される第２の質問を特定し、特定した前記第２の質問に対応する回答候補を出力する、処理をコンピュータに実行させ、前記特定する処理は、前記記憶部を参照して、ナイーブベイズ分類器による機械学習を行って、前記他の質問それぞれについて、前記第１の質問に後続して入力される確率を算出し、前記他の質問それぞれについて算出した前記確率に基づいて、前記第１の質問に後続して入力される前記第２の質問を特定する、回答出力プログラムが提供される。

本発明の一側面によれば、入力された質問に対応する回答候補がなくても、他の質問を推定して回答候補を出力することができる。

図１は、実施の形態にかかる回答出力方法の一実施例を示す説明図である。図２は、回答出力システム２００のシステム構成例を示す説明図である。図３は、情報処理装置１０１のハードウェア構成例を示すブロック図である。図４は、ＦＡＱマスタ２２０の記憶内容の一例を示す説明図である。図５は、アクセスログＤＢ２３０の記憶内容の一例を示す説明図である。図６は、教師データ（よゐこ）ＤＢ２４０の記憶内容の一例を示す説明図である。図７は、教師データ（わるいこ）ＤＢ２５０の記憶内容の一例を示す説明図である。図８は、教師データ（まいご）ＤＢ２６０の記憶内容の一例を示す説明図である。図９は、ＦＡＱ画面９００の画面例を示す説明図である。図１０は、情報処理装置１０１の機能的構成例を示すブロック図である。図１１は、アクセスログの具体例を示す説明図（その１）である。図１２は、教師データの具体例を示す説明図（その１）である。図１３は、アクセスログの具体例を示す説明図（その２）である。図１４は、教師データの具体例を示す説明図（その２）である。図１５は、分析ＤＢ１５００の記憶内容の一例を示す説明図である。図１６は、ＦＡＱの決定例を示す説明図である。図１７は、アクセスログの具体例を示す説明図（その３）である。図１８は、１ページ目ヒット率の時系列変化の一例を示す説明図である。図１９は、形態素を推定する方法の一実施例を示す説明図である。図２０は、情報処理装置１０１の教師データ生成処理手順の一例を示すフローチャート（その１）である。図２１は、情報処理装置１０１の教師データ生成処理手順の一例を示すフローチャート（その２）である。図２２は、情報処理装置１０１の回答出力処理手順の一例を示すフローチャート（その１）である。図２３は、情報処理装置１０１の回答出力処理手順の一例を示すフローチャート（その２）である。

以下に図面を参照して、本発明にかかる回答出力プログラム、回答出力方法および情報処理装置の実施の形態を詳細に説明する。

（実施の形態）
図１は、実施の形態にかかる回答出力方法の一実施例を示す説明図である。図１において、情報処理装置１０１は、質問に対応する回答候補を出力するコンピュータである。質問は、何らかの問題の解決方法を問いただすためのものである。質問は、例えば、商品やサービスについての質問である。質問は、単語または複数の単語の組み合わせによって表現されてもよいし、１または複数の文章によって表現されてもよい。

また、回答候補は、問題を解決するための情報である。すなわち、質問に対応する回答候補は、質問された問題の解決方法を示す回答の候補である。回答候補は、例えば、ＦＡＱである。ＦＡＱは、「頻繁に尋ねられる質問」の略であり、あらかじめ予想される質問に対して、質問と回答をまとめたものである。

ここで、コールセンタやサポートセンタでは、オペレータのスキル平準化や回答リードタイムの短縮化のため、ＦＡＱシステムが導入されていることが多い。ＦＡＱシステムを適切に運用すると、一次回答率や顧客満足度の向上につながるため、コールセンタ等においてＦＡＱシステムは重要な位置付けにある。

また、企業の中には、インターネット上に自社のＦＡＱを公開しているところもある。社外にＦＡＱサイトを公開することで、顧客自身がＦＡＱを閲覧できるようになるため、顧客の利便性の向上やコールセンタ等への問い合わせの削減が期待できる。

一方で、ＦＡＱの内容は陳腐化しやすいため、定期的な見直しを行うことが望ましいが、ＦＡＱの見直しにかかる運用負荷は大きい。例えば、ＦＡＱマスタに登録されるＦＡＱの数は、数千～数万個程度となることもあり、それらＦＡＱの内容を短期間に人手で見直すのは非常に負荷がかかる。

このため、ＦＡＱの見直し作業が、商品やサービスの名称変更や新規投入等に追随できず、質問に対して１件もＦＡＱを提示できない、いわゆる、０件ヒットを招くおそれがある。また、チャット形式で質問を受け付ける場合、タイプミスや変換ミスが生じていても確認や修正をせずに検索を始めてしまうケースがある。このような場合は、０件ヒットとなることが多い。

０件ヒットが発生すると、利用者は質問を入力し直して再検索することになる。しかし、利用者によっては、質問を入力し直すことが面倒なため、問題解決をあきらめてしまうこともある。したがって、利用者から入力された質問に対して、何らかの検索結果を提示することは重要である。一方で、質問に何ら関係のないＦＡＱを出力しても問題の解決にはならず、ひいては、コールセンタ等の信頼性の低下につながるおそれがある。

そこで、本実施の形態では、入力された質問に対応する回答候補がなくても、他の質問を推定して回答候補を出力する回答出力方法について説明する。以下、情報処理装置１０１の処理例について説明する。

（１）情報処理装置１０１は、第１の質問の入力を受け付ける。入力される質問は、単語または複数の単語の組み合わせであってもよいし、１または複数の文章であってもよい。質問を入力するユーザは、例えば、コールセンタ等のオペレータや、ＦＡＱサイトを利用する利用者である。図１の例では、第１の質問「Ｘ％＃」の入力を受け付けた場合を想定する。

（２）情報処理装置１０１は、受け付けた第１の質問に対応する回答候補の有無を判定する。回答候補は、例えば、ＦＡＱである。質問に対応する回答候補は、例えば、ＦＡＱシステムやＦＡＱサイトにおいて採用されている既存の検索アルゴリズムを用いて検索される、質問に対する検索結果（ＦＡＱ）である。

具体的には、例えば、情報処理装置１０１は、受け付けた第１の質問を形態素解析して形態素に分解する。つぎに、情報処理装置１０１は、ＦＡＱマスタ（例えば、後述の図２に示すＦＡＱマスタ２２０）から、所定の検索条件にしたがって、分解した形態素に対応するＦＡＱを検索する。ここで、ＦＡＱが検索されなかった場合、情報処理装置１０１は、第１の質問に対応する回答候補がないと判定する。

図１の例では、受け付けた第１の質問「Ｘ％＃」に対応する回答候補がないと判定された場合を想定する。なお、情報処理装置１０１は、受け付けた第１の質問に対応する回答候補を、他のコンピュータにアクセスして検索することにしてもよい。

（３）情報処理装置１０１は、回答候補がないと判定した場合、記憶部１１０を参照して、受け付けた第１の質問に後続して入力される第２の質問を特定する。具体的には、例えば、情報処理装置１０１は、記憶部１１０の記憶内容に基づく機械学習を行って、第１の質問に後続して入力される第２の質問を特定する。

ここで、機械学習とは、コンピュータが、データから学習して、パターンや傾向を導き出し、将来予測や意思決定を可能にすることである。記憶部１１０は、質問と対応付けて、当該質問に対応する回答候補がないときに後続して入力を受け付けた他の質問を記憶する。ここで、他の質問は、他の質問に対して表示されたいずれかの回答候補が選択された質問である。すなわち、記憶部１１０は、機械学習に用いる教師データを記憶する。

より詳細に説明すると、記憶部１１０は、質問に対応する回答候補がないときに後続して入力を受け付けた他の質問を、当該質問に対応付けた教師データ（まいご）を記憶する。また、他の質問は、例えば、他の質問に対して上位に表示された所定数Ｎの回答候補のいずれかが選択された質問であってもよい。

所定数Ｎは、任意に設定可能である。所定数Ｎは、例えば、質問に対する回答候補を表示する画面の１ページ目に表示される回答候補の上限数に設定される。ＦＡＱシステムやＦＡＱサイトでは、所定数Ｎは、３０程度の値に設定される。チャットボットでは、所定数Ｎは、５程度の値に設定される。

すなわち、他の質問は、他の質問に対して検索結果の１ページ目に表示されたいずれかの回答候補が利用者によって照会（選択）された質問であり、問題解決のための回答が得られた可能性がある質問である。このような他の質問を、先行して入力された質問に対応付けた教師データを用いて機械学習することで、第１の質問に後続して入力される質問であって、当該質問に対して１ページ目に表示されたいずれかの回答候補が選択される可能性が高い質問の特徴を導き出す。

図１の例では、第１の質問「Ｘ％＃」に後続して入力される第２の質問「ＸＸＸ」が特定された場合を想定する。

（４）情報処理装置１０１は、特定した第２の質問に対応する回答候補を出力する。図１の例では、情報処理装置１０１は、例えば、ＦＡＱマスタから、特定した第２の質問「ＸＸＸ」に対応する回答候補を検索する。ここでは、第２の質問「ＸＸＸ」に対応する回答候補１～５が検索された場合を想定する。この場合、情報処理装置１０１は、検索した回答候補１～５を出力する。

このように、情報処理装置１０１によれば、入力された第１の質問に対応する回答候補がなくても、過去のユーザの操作履歴をもとに、第１の質問に置き換わる第２の質問を推定して回答候補を出力することができる。第２の質問は、例えば、第１の質問に後続して入力される質問であって、当該質問に対して表示されたいずれかの回答候補が選択される可能性が高い質問である。このため、０件ヒットとなる質問が入力されても、問題解決につながるような適切な回答候補を出力することができる。

なお、情報処理装置１０１は、上記（３）において特定した第２の質問を、第１の質問と対応付けて記憶部１１０に記憶することにしてもよい。この場合、情報処理装置１０１は、再び第１の質問の入力を受け付けた場合に、記憶部１１０を参照して、第１の質問に対応する第２の質問を特定することにしてもよい。これにより、０件ヒットとなる質問が再度入力された際に、機械学習を実施することなく、他の質問を推定して回答候補を出力することが可能となる。

また、情報処理装置１０１は、上記（３）において特定した第２の質問に対応する回答候補を、第１の質問と対応付けて記憶部１１０に記憶することにしてもよい。この場合、情報処理装置１０１は、再び第１の質問の入力を受け付けた場合に、記憶部１１０を参照して、第１の質問に対応する回答候補を出力することにしてもよい。これにより、０件ヒットとなる質問が再度入力された際に、機械学習を実施することなく、当該質問に対応する回答候補を出力することが可能となる。

ただし、時間の経過とともに新たな教師データ（まいご）が記憶部１１０に蓄積され、ある質問に後続して入力される他の質問の傾向は変化する。したがって、第２の質問は、例えば、第１の質問に対応する回答候補がないと判定した際に、その都度特定することが望ましい。また、第１の質問と対応付けて記憶部１１０に記憶する第２の質問は、例えば、定期的に見直すことが望ましい。

（回答出力システム２００のシステム構成例）
つぎに、図１に示した情報処理装置１０１を含む回答出力システム２００のシステム構成例について説明する。回答出力システム２００は、例えば、コールセンタ等のＦＡＱシステムに適用されてもよく、また、インターネット上に公開されるＦＡＱサイトに適用されてもよい。

図２は、回答出力システム２００のシステム構成例を示す説明図である。図２において、回答出力システム２００は、情報処理装置１０１と、複数の端末２０１（図２の例では、３台）と、を含む。回答出力システム２００において、情報処理装置１０１および複数の端末２０１は、有線または無線のネットワーク２１０を介して接続される。ネットワーク２１０は、例えば、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、インターネットなどである。

ここで、情報処理装置１０１は、質問に対応する回答候補を出力する。以下の説明では、回答候補として「ＦＡＱ」を例に挙げて説明する場合がある。また、情報処理装置１０１は、ＦＡＱマスタ２２０、アクセスログＤＢ（Ｄａｔａｂａｓｅ）２３０、教師データ（よゐこ）ＤＢ２４０、教師データ（わるいこ）ＤＢ２５０および教師データ（まいご）ＤＢ２６０を有する。情報処理装置１０１は、例えば、サーバである。

なお、各種ＤＢ２２０，２３０，２４０，２５０，２６０等の記憶内容については、図４～図８を用いて後述する。

端末２０１は、回答出力システム２００のユーザが使用するコンピュータである。回答出力システム２００のユーザは、例えば、コールセンタのオペレータや、ＦＡＱサイトの利用者である。端末２０１は、例えば、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、スマートフォン、タブレット型ＰＣなどである。

（情報処理装置１０１のハードウェア構成例）
図３は、情報処理装置１０１のハードウェア構成例を示すブロック図である。図３において、情報処理装置１０１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）３０１と、メモリ３０２と、Ｉ／Ｆ（Ｉｎｔｅｒｆａｃｅ）３０３と、ディスクドライブ３０４と、ディスク３０５と、を有する。また、各構成部は、バス３００によってそれぞれ接続される。

ここで、ＣＰＵ３０１は、情報処理装置１０１の全体の制御を司る。メモリ３０２は、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）およびフラッシュＲＯＭなどを有する。具体的には、例えば、フラッシュＲＯＭがＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）のプログラムを記憶し、ＲＯＭがアプリケーションプログラムを記憶し、ＲＡＭがＣＰＵ３０１のワークエリアとして使用される。メモリ３０２に記憶されるプログラムは、ＣＰＵ３０１にロードされることで、コーディングされている処理をＣＰＵ３０１に実行させる。

Ｉ／Ｆ３０３は、通信回線を通じてネットワーク２１０に接続され、ネットワーク２１０を介して外部のコンピュータ（例えば、図２に示した端末２０１）に接続される。そして、Ｉ／Ｆ３０３は、ネットワーク２１０と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。Ｉ／Ｆ３０３には、例えば、モデムやＬＡＮアダプタなどを採用することができる。

ディスクドライブ３０４は、ＣＰＵ３０１の制御に従ってディスク３０５に対するデータのリード／ライトを制御する。ディスク３０５は、ディスクドライブ３０４の制御で書き込まれたデータを記憶する。ディスク３０５としては、例えば、磁気ディスク、光ディスクなどが挙げられる。

なお、情報処理装置１０１は、上述した構成部のほかに、例えば、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、入力装置、ディスプレイ等を有することにしてもよい。また、図２に示した端末２０１についても、情報処理装置１０１と同様のハードウェア構成により実現することができる。ただし、端末２０１は、上述した構成部のほかに、入力装置、ディスプレイ等を有する。

（各種ＤＢ２２０，２３０，２４０，２５０，２６０等の記憶内容）
つぎに、図４～図８を用いて、情報処理装置１０１が有する各種ＤＢ２２０，２３０，２４０，２５０，２６０等の記憶内容について説明する。

図４は、ＦＡＱマスタ２２０の記憶内容の一例を示す説明図である。図４において、ＦＡＱマスタ２２０は、ＦＡＱ番号、質問および回答のフィールドを有し、各フィールドに情報を設定することで、ＦＡＱ（例えば、ＦＡＱ４００－１，４００－２）をレコードとして記憶する。

ここで、ＦＡＱ番号は、ＦＡＱを一意に識別する識別子である。ＦＡＱ４００－＃の「＃」は、ＦＡＱ番号に対応する。質問は、あらかじめ予想される質問である。回答は、あらかじめ予想される質問に対する回答である。例えば、ＦＡＱ４００－１は、質問「ＰＣを初期状態に戻す方法を教えてください。」と、回答「トラブルが発生し正常に動作しなくなった場合などに、リカバリする方法は、次のとおりです。・・・」と、をまとめたものである。

図５は、アクセスログＤＢ２３０の記憶内容の一例を示す説明図である。図５において、アクセスログＤＢ２３０は、セッション番号、日時、タイプ、検索ワード、照会ＦＡＱ、順位および検索リストのフィールドを有する。各フィールドに情報を設定することで、アクセスログ、例えば、アクセスログ５００－１～５００－３がレコードとして記憶される。

ここで、セッション番号は、情報処理装置１０１と端末２０１とのセッションを一意に識別する識別子である。セッションは、２点間（装置間）の通信において、情報をやり取りするために設定する論理的な接続関係である。日時は、端末２０１において操作が行われた日時である。

タイプは、端末２０１において行われた操作のタイプである。タイプとしては、例えば、検索、照会などが挙げられる。タイプ「検索」は、検索ワードに対応するＦＡＱを検索する操作を表す。タイプ「照会」は、検索ワードに対するＦＡＱを選択する操作、すなわち、ＦＡＱの内容を照会する操作を表す。

検索ワードは、端末２０１において入力される質問に相当する。検索ワードは、単語または複数の単語の組み合わせであってもよいし、１または複数の文章であってもよい。照会ＦＡＱは、検索ワードに対する選択操作を受け付けたＦＡＱ、すなわち、照会されたＦＡＱのＦＡＱ番号である。

順位は、検索ワードに対してＦＡＱが表示された際に、当該ＦＡＱが上から何番目に表示されるかを示す順位である。検索リストは、検索ワードに基づきＦＡＱマスタ２２０（例えば、図４参照）から検索されたＦＡＱのＦＡＱ番号をリスト化したものである。

図６は、教師データ（よゐこ）ＤＢ２４０の記憶内容の一例を示す説明図である。図６において、教師データ（よゐこ）ＤＢ２４０は、日時、照会ＦＡＱおよび形態素解析後検索ワードのフィールドを有する。各フィールドに情報を設定することで、教師データ（よゐこ）、例えば、教師データ（よゐこ）６００－１，６００－２がレコードとして記憶される。

ここで、日時は、照会ＦＡＱが照会された日時である。照会ＦＡＱは、検索ワードに対して１ページ目に表示された際に選択操作を受け付けたＦＡＱ、すなわち、照会されたＦＡＱのＦＡＱ番号である。１ページ目に表示されるＦＡＱは、検索ワードに対するＦＡＱのうち上位Ｎ件のＦＡＱである。形態素解析後検索ワードは、照会ＦＡＱが照会されたときの検索ワードを形態素解析して検出された１または複数の形態素である。

図７は、教師データ（わるいこ）ＤＢ２５０の記憶内容の一例を示す説明図である。図７において、教師データ（わるいこ）ＤＢ２５０は、日時、非照会ＦＡＱおよび形態素解析後検索ワードのフィールドを有する。各フィールドに情報を設定することで、教師データ（わるいこ）、例えば、教師データ（わるいこ）７００－１～７００－３がレコードとして記憶される。

ここで、日時は、非照会ＦＡＱが照会されなかった日時、例えば、非照会ＦＡＱが照会されずに情報処理装置１０１と端末２０１とのセッションが切断された日時である。非照会ＦＡＱは、検索ワードに対して１ページ目に表示された際に選択操作を受け付けなかったＦＡＱ、すなわち、照会されなかったＦＡＱのＦＡＱ番号である。形態素解析後検索ワードは、非照会ＦＡＱが照会されなかったときの検索ワードを形態素解析して検出された１または複数の形態素である。

図８は、教師データ（まいご）ＤＢ２６０の記憶内容の一例を示す説明図である。図８において、教師データ（まいご）ＤＢ２６０は、日時、代替ワードおよび検索ワードのフィールドを有する。各フィールドに情報を設定することで、教師データ（まいご）、例えば、教師データ（まいご）８００－１がレコードとして記憶される。

ここで、日時は、検索ワードに対してＦＡＱマスタ２２０から１件もＦＡＱが検索されなかった日時、例えば、当該検索ワードに対応するＦＡＱを検索する操作が行われた日時である。代替ワードは、１件もＦＡＱが表示されなかった検索ワードに後続して入力を受け付けた他の検索ワードであって、当該他の検索ワードに対して１ページ目に表示されたいずれかのＦＡＱが選択された検索ワードである。検索ワードは、ＦＡＱマスタ２２０から１件もＦＡＱが検索されなかった質問である。検索ワードは、例えば、検索ワードを形態素解析して検出された１または複数の形態素によって表現されてもよい。

（ＦＡＱ画面９００の画面例）
つぎに、端末２０１に表示されるＦＡＱ画面９００の画面例について説明する。以下の説明では、端末２０１に表示される操作画面のボックス、ボタン等をユーザが選択する操作として、不図示の入力装置を用いたクリック操作を行う場合を例に挙げて説明する。

図９は、ＦＡＱ画面９００の画面例を示す説明図である。図９において、ＦＡＱ画面９００は、ＦＡＱを検索したり、ＦＡＱを照会したりする操作画面の一例である。ＦＡＱ画面９００において、ボックス９０１をクリックすると、検索ワードを入力することができる。図９の例では、検索ワード「ＦＪ１０初期化」が入力されている。

また、ＦＡＱ画面９００において、ボタン９０２をクリックすると、ボックス９０１に入力された検索ワードに対応するＦＡＱを検索することができる。具体的には、ボタン９０２をクリックすると、ボックス９０１に入力された検索ワードが、端末２０１から情報処理装置１０１に送信される。

この結果、情報処理装置１０１から端末２０１に検索ワードに対する検索結果が送信され、検索されたＦＡＱが表示エリア９１０にリスト化されて表示される。この際、上位Ｎ件のＦＡＱは、１ページ目に表示される。それ以外のＦＡＱは、２ページ以降に表示される。Ｎは、任意に設定可能であり、５～３０程度の値に設定される。ここでは、Ｎは「Ｎ＝５」である。

図９の例では、検索ワード「ＦＪ１０初期化」に対応するＦＡＱが検索された結果、上位５件のＦＡＱ９１１～９１５が、１ページ目の検索結果として表示エリア９１０に表示されている。なお、ＦＡＱ画面９００において、ボタン９０３をクリックすると、２ページ目の検索結果を表示することができる。

また、ＦＡＱ画面９００において、表示エリア９１０に表示されたいずれかのＦＡＱをクリックすると、当該ＦＡＱの内容を照会することができる。例えば、ＦＡＱ９１１をクリックすると、ＦＡＱ９１１の内容（質問と回答）を照会することができる。また、表示エリア９１０に表示されたいずれかのＦＡＱがクリックされると、当該ＦＡＱが選択されたことを示す選択結果が、端末２０１から情報処理装置１０１に送信される。

（情報処理装置１０１の機能的構成例）
図１０は、情報処理装置１０１の機能的構成例を示すブロック図である。図１０において、情報処理装置１０１は、受付部１００１と、検索部１００２と、決定部１００３と、出力制御部１００４と、生成部１００５と、判定部１００６と、特定部１００７と、記憶部１０１０と、を含む。受付部１００１～特定部１００７は制御部となる機能であり、具体的には、例えば、図３に示したメモリ３０２、ディスク３０５などの記憶装置に記憶されたプログラムをＣＰＵ３０１に実行させることにより、または、Ｉ／Ｆ３０３により、その機能を実現する。各機能部の処理結果は、例えば、メモリ３０２、ディスク３０５などの記憶装置に記憶される。

また、記憶部１０１０は、メモリ３０２、ディスク３０５などの記憶装置により実現される。例えば、記憶部１０１０は、各種ＤＢ２２０，２３０，２４０，２５０，２６０，１９００（後述の図１９参照）等を記憶する。なお、記憶部１０１０は、情報処理装置１０１とは異なる他のコンピュータが有することにしてもよい。この場合、情報処理装置１０１は、他のコンピュータにアクセスして、記憶部１０１０の記憶内容を参照することができる。

受付部１００１は、質問の入力を受け付ける。質問は、何らかの問題の解決方法を問いただすための検索ワードであり、単語または複数の単語の組み合わせであってもよいし、１または複数の文章であってもよい。質問の入力は、例えば、図９に示したＦＡＱ画面９００において行われる。具体的には、例えば、受付部１００１は、端末２０１から、ＦＡＱ画面９００に入力された検索ワードを受信することにより、検索ワードの入力を受け付ける。以下の説明では、質問を「検索ワード」と表記する場合がある。

検索部１００２は、検索ワードに対応するＦＡＱを検索する。具体的には、例えば、検索部１００２は、検索ワードを形態素解析して形態素に分解する。つぎに、検索部１００２は、図４に示したＦＡＱマスタ２２０から、所定の検索条件にしたがって、分解した形態素に対応するＦＡＱを検索する。

より詳細に説明すると、例えば、検索部１００２は、検索ワードを形態素解析して検出された形態素についてのＡＮＤ条件またはＯＲ条件を設定して、ＦＡＱマスタ２２０からＦＡＱを検索してもよい。この際、検索部１００２は、例えば、各ＦＡＱの過去のアクセス数（照会数）や検索ワードとの類似度を考慮して、アクセス数が多いＦＡＱや類似度が高いＦＡＱを検索することにしてもよい。

これにより、検索ワードに対応するＦＡＱを特定することができる。検索結果は、例えば、タイプ「検索」のアクセスログとして、図５に示したアクセスログＤＢ２３０に記憶される。具体的には、アクセスログのセッション番号には、検索ワードを受け付けた端末２０１と情報処理装置１０１とのセッションのセッション番号が設定される。アクセスログの日時には、検索ワードを受け付けた日時が設定される。アクセスログの検索ワードには、受け付けた検索ワードが設定される。アクセスログの照会ＦＡＱおよび順位は「空白」である。アクセスログの検索リストには、検索されたＦＡＱのＦＡＱ番号が設定される。ただし、検索ワードに対応するＦＡＱが１件も検索されなかった場合、アクセスログの検索リストには「－（ｎｕｌｌ）」が設定される。

決定部１００３は、教師データ（よゐこ）と教師データ（わるいこ）とを記憶する記憶部１０１０の記憶内容に基づく機械学習を行って、検索された複数のＦＡＱの中から、検索ワードに対する１または複数のＦＡＱを決定する。ここで、教師データ（よゐこ）は、質問に対する選択操作を受け付けたＦＡＱを当該質問に対応付けた情報である。教師データ（わるいこ）は、質問に対する選択操作を受け付けなかったＦＡＱを当該質問に対応付けた情報である。

具体的には、例えば、決定部１００３は、図６に示した教師データ（よゐこ）ＤＢ２４０を参照して、ナイーブベイズ分類器による機械学習を行って、検索された複数のＦＡＱそれぞれについて、第１の確率を算出する。第１の確率は、入力を受け付けた検索ワードに対してＦＡＱが表示された際に、当該ＦＡＱが選択される確率である。

これにより、検索された複数のＦＡＱそれぞれが、１ページ目に表示された際に照会される可能性の高さを判断する指標値、換言すれば、検索ワードとの関連性の強さを表す指標値を得ることができる。

また、決定部１００３は、図７に示した教師データ（わるいこ）ＤＢ２５０を参照して、ナイーブベイズ分類器による機械学習を行って、検索された複数のＦＡＱそれぞれについて、第２の確率を算出する。第２の確率は、入力を受け付けた検索ワードに対してＦＡＱが表示された際に、当該ＦＡＱが選択されない確率である。

これにより、検索された複数のＦＡＱそれぞれが、１ページ目に表示された際に照会されない可能性の高さを判断する指標値、換言すれば、検索ワードとの関連性の弱さを表す指標値を得ることができる。

そして、決定部１００３は、検索された複数のＦＡＱそれぞれについて算出した第１の確率と第２の確率とに基づいて、検索された複数のＦＡＱの中から、検索ワードに対する１または複数のＦＡＱを決定する。これにより、第１の確率および第２の確率の両方を考慮して、検索ワードに対して表示するＦＡＱを絞り込むことができる。

より詳細に説明すると、例えば、決定部１００３は、検索された複数のＦＡＱのうち第２の確率が閾値α以上のＦＡＱを除外したＦＡＱを、第１の確率が高い順にソートした１または複数のＦＡＱを、検索ワードに対する１または複数のＦＡＱに決定する。閾値αは、任意に設定可能である。閾値αは、例えば、単位を［％］とすると、８０程度の値に設定される。

また、例えば、決定部１００３は、第１の確率が高い上位Ｎ件のＦＡＱを選択し、選択したＦＡＱのうち第２の確率が閾値α以上のＦＡＱを、検索ワードに対する１または複数のＦＡＱに決定することにしてもよい。すなわち、決定部１００３は、第１の確率が高い上位Ｎ件のＦＡＱを絞り込んだ上で、第２の確率が閾値α以上のＦＡＱを除外する。

なお、第１および第２の確率を算出する具体的な処理内容については、図１５を用いて後述する。また、検索ワードに対するＦＡＱの決定例については、図１６を用いて後述する。

出力制御部１００４は、検索ワードに対する１または複数のＦＡＱを出力する。具体的には、例えば、出力制御部１００４は、検索ワードに対して、決定された１または複数のＦＡＱを出力する。各ＦＡＱには、各ＦＡＱの順位（表示順序）を特定可能な情報が付与される。より詳細に説明すると、例えば、出力制御部１００４は、端末２０１に対して、決定された１または複数のＦＡＱを送信することにより、ＦＡＱ画面９００の表示エリア９１０に、受け付けた検索ワードに対する１または複数のＦＡＱを表示する制御を行う。

また、受付部１００１は、検索ワードに対するＦＡＱの選択操作を受け付ける。ＦＡＱの選択操作は、ＦＡＱの内容を照会するための操作であり、例えば、図９に示したＦＡＱ画面９００において行われる。具体的には、例えば、受付部１００１は、端末２０１から、ＦＡＱ画面９００において選択（クリック）されたＦＡＱを示す選択結果を受信することにより、当該ＦＡＱの選択操作を受け付ける。

ＦＡＱの選択操作を受け付けた場合、タイプ「照会」のアクセスログがアクセスログＤＢ２３０に記憶される。具体的には、アクセスログのセッション番号には、検索ワードを受け付けた端末２０１と情報処理装置１０１とのセッションのセッション番号が設定される。アクセスログの日時には、ＦＡＱの選択操作を受け付けた日時が設定される。アクセスログの検索ワードには、受け付けた検索ワードが設定される。アクセスログの照会ＦＡＱには、選択操作を受け付けたＦＡＱのＦＡＱ番号が設定される。アクセスログの順位には、選択操作を受け付けたＦＡＱの順位が設定される。アクセスログの検索リストは「空白」である。これにより、検索ワードに対して表示された際に選択操作を受け付けたＦＡＱを示すアクセスログを蓄積することができる。

生成部１００５は、教師データ（よゐこ）を生成する。また、生成部１００５は、教師データ（わるいこ）を生成する。また、生成部１００５は、教師データ（まいご）を生成する。ここで、教師データ（まいご）は、検索ワードに対応するＦＡＱがないときに後続して入力を受け付けた他の検索ワードを、当該検索ワードに対応付けた情報である。ただし、他の検索ワードは、例えば、他の検索ワードに対して１ページ目に表示されたいずれかのＦＡＱが選択された検索ワードである。

具体的には、例えば、生成部１００５は、アクセスログＤＢ２３０から、セッション番号が同一のアクセスログを取得する。つぎに、生成部１００５は、取得したアクセスログの日時に基づいて、取得したアクセスログを時系列にソートする。そして、生成部１００５は、取得したアクセスログの中に、タイプ「照会」のアクセスログがあるか否かを判断する。

ここで、タイプ「照会」のアクセスログがある場合、生成部１００５は、当該アクセスログから特定される照会ＦＡＱの順位に基づいて、照会ＦＡＱが、１ページ目に表示されたＦＡＱ、すなわち、上位Ｎ件のＦＡＱであるか否かを判断する。ここで、１ページ目に表示されたＦＡＱである場合、タイプ「照会」のアクセスログから特定される照会ＦＡＱと形態素解析後検索ワードとを対応付けて表す教師データ（よゐこ）を生成する。形態素解析後検索ワードは、タイプ「照会」のアクセスログから特定される検索ワードを形態素解析して検出される１または複数の形態素である。

また、生成部１００５は、タイプ「検索」のアクセスログの検索リストを参照して、検索ワードに対して表示された際に照会されなかったＦＡＱ、すなわち、検索ワードに対する選択操作を受け付けなかったＦＡＱがあるか否かを判断する。ここで、照会されなかったＦＡＱがある場合、生成部１００５は、照会されなかったＦＡＱを非照会ＦＡＱとする教師データ（わるいこ）を生成する。教師データ（わるいこ）の形態素解析後検索ワードは、例えば、タイプ「照会」のアクセスログから特定される検索ワードから得られる。

また、生成部１００５は、タイプ「検索」のアクセスログの検索リストを参照して、ＦＡＱが１件も検索されなかった検索ワードがあるか否かを判断する。ここで、ＦＡＱが１件も検索されなかった検索ワードがある場合、生成部１００５は、取得したアクセスログの日時に基づいて、当該検索ワードに後続して入力を受け付けた他の検索ワードがあるか否かを判断する。ただし、他の検索ワードは、当該他の検索ワードに対して１ページ目に表示されたいずれかのＦＡＱが照会（選択）された検索ワードである。ここで、他の検索ワードがある場合、生成部１００５は、他の検索ワードを代替ワードとする教師データ（まいご）を生成する。教師データ（まいご）の形態素解析後検索ワードは、例えば、他の検索ワードを形態素解析して検出される１または複数の形態素である。

生成された教師データ（よゐこ）は、例えば、図６に示した教師データ（よゐこ）ＤＢ２４０に記憶される。生成された教師データ（わるいこ）は、例えば、図７に示した教師データ（わるいこ）ＤＢ２５０に記憶される。生成された教師データ（まいご）は、例えば、図８に示した教師データ（まいご）ＤＢ２６０に記憶される。

教師データ（よゐこ）、教師データ（わるいこ）および教師データ（まいご）の生成例については、図１１～図１４を用いて後述する。

なお、教師データ（よゐこ）と教師データ（わるいこ）とが蓄積されていない場合、情報処理装置１０１は、上述した第１および第２の確率を用いたＦＡＱの絞り込みを行うことができない。このため、運用開始からある程度の期間は、情報処理装置１０１は、検索ワードに対して、検索されたＦＡＱを出力することにしてもよい。この際、情報処理装置１０１は、例えば、検索された複数のＦＡＱを、過去のアクセス数（照会数）が多い順にソートして出力することにしてもよい。より詳細に説明すると、例えば、出力制御部１００４は、端末２０１に対して、検索されたＦＡＱを送信することにより、ＦＡＱ画面９００の表示エリア９１０に、受け付けた検索ワードに対するＦＡＱを表示する制御を行う。これにより、教師データ（よゐこ）と教師データ（わるいこ）とを蓄積することができる。

また、決定部１００３は、検索ワードに対する選択操作を受け付けたＦＡＱを示すアクセスログに基づいて、閾値αを調整することにしてもよい。具体的には、例えば、決定部１００３は、アクセスログＤＢ２３０内のタイプ「照会」のアクセスログに基づいて、検索ワードに対する上位Ｎ件のＦＡＱ、すなわち、１ページ目に表示されるＦＡＱのいずれかが選択される確率を算出する。

以下の説明では、１ページ目に表示されるＦＡＱのいずれかが選択される確率を「１ページ目ヒット率」と表記することがある。

１ページ目ヒット率の算出は、例えば、所定期間ごとに行う。所定期間は、任意に設定可能であり、例えば、数週間～数ヶ月程度の期間に設定される。この際、決定部１００３は、例えば、直近所定期間分のアクセスログに基づいて、１ページ目ヒット率を算出する。これにより、直近のアクセス傾向が反映された１ページ目ヒット率を算出することができる。

そして、決定部１００３は、算出した１ページ目ヒット率の時系列変化に基づいて、閾値αを調整する。より詳細に説明すると、例えば、決定部１００３は、１ページ目ヒット率が下降傾向にある場合に、閾値αを下げる。閾値αの下げ分は、任意に設定可能であり、例えば、単位を［％］とすると、１程度の値に設定される。

閾値αの調整例については、図１７および図１８を用いて後述する。

判定部１００６は、検索ワードに対応するＦＡＱの有無を判定する。具体的には、例えば、判定部１００６は、ＦＡＱマスタ２２０から検索ワードに対応するＦＡＱが１件も検索されなかった場合、いわゆる、０件ヒットの場合に、検索ワードに対応するＦＡＱがないと判定する。

また、判定部１００６は、決定部１００３によって検索ワードに対するＦＡＱが１件も決定されなかった場合に、検索ワードに対応するＦＡＱがないと判定することにしてもよい。より詳細に説明すると、例えば、判定部１００６は、上述した第１および第２の確率を用いたＦＡＱの絞り込みを行った結果、ＦＡＱが１件も残らなかった場合に、検索ワードに対応するＦＡＱがないと判定することにしてもよい。

特定部１００７は、検索ワードに対応するＦＡＱがないと判定された場合、教師データ（まいご）を記憶する記憶部１０１０の記憶内容に基づく機械学習を行って、当該検索ワードに後続して入力される他の検索ワードを特定する。以下の説明では、判定部１００６によってＦＡＱがないと判定された検索ワードを「０件ヒット検索ワード」と表記する場合がある。

具体的には、例えば、特定部１００７は、教師データ（まいご）ＤＢ２６０を参照して、ナイーブベイズ分類器による機械学習を行って、他の検索ワード（代替ワード）それぞれについて、０件ヒット検索ワードに後続して入力される第３の確率を算出する。そして、特定部１００７は、他の検索ワードそれぞれについて算出した第３の確率に基づいて、０件ヒット検索ワードに後続して入力される代替ワードを特定する。

より詳細に説明すると、例えば、特定部１００７は、第３の確率が最大の他の検索ワードを、代替ワードとして特定することにしてもよい。また、特定部１００７は、第３の確率が閾値β以上の他の検索ワードを、代替ワードとして特定することにしてもよい。閾値βは、任意に設定可能である。また、特定部１００７は、第３の確率が閾値β以上で、かつ、最大の他の検索ワードを、代替ワードとして特定することにしてもよい。

第３の確率を算出する具体的な処理内容については、図１５を用いて後述する。

出力制御部１００４は、特定された代替ワードに対応するＦＡＱを出力する。具体的には、例えば、まず、検索部１００２は、代替ワードに対応するＦＡＱを検索する。なお、複数の代替ワードが特定された場合、検索部１００２は、複数の代替ワードそれぞれについて、ＦＡＱを検索することにしてもよい。

つぎに、決定部１００３は、記憶部１０１０の記憶内容に基づく機械学習を行って、検索された複数のＦＡＱの中から、代替ワードに対する１または複数のＦＡＱを決定する。そして、出力制御部１００４は、代替ワードに対して、決定された１または複数のＦＡＱを出力する。なお、出力制御部１００４は、検索された代替ワードに対応するＦＡＱを出力することにしてもよい。

これにより、入力された検索ワードに対応するＦＡＱがなくても、過去のユーザの操作履歴（アクセスログ）をもとに、その検索ワード、すなわち、０件ヒット検索ワードに置き換わる代替ワードを推定してＦＡＱを出力することができる。

（教師データの生成例）
つぎに、図１１～図１４を用いて、教師データ（わるいこ）および教師データ（まいご）の生成例について説明する。ここでは、上位５件のＦＡＱが１ページ目に表示されるＦＡＱである場合を想定する（Ｎ＝５）。

図１１は、アクセスログの具体例を示す説明図（その１）である。図１２は、教師データの具体例を示す説明図（その１）である。図１１において、アクセスログ１１０１～１１０３は、時系列にソートされたセッション番号が同一のアクセスログの集合である。

この場合、生成部１００５は、アクセスログ１１０１～１１０３の中に、タイプ「照会」のアクセスログがあるか否かを判断する。ここで、アクセスログ１１０２，１１０３はタイプ「照会」のアクセスログである。このため、生成部１００５は、タイプ「照会」のアクセスログがあると判断する。

つぎに、生成部１００５は、タイプ「照会」のアクセスログ１１０２の順位に基づいて、照会ＦＡＱが、１ページ目に表示されたＦＡＱであるか否かを判断する。ここで、アクセスログ１１０２の順位は、「１」であり、５以下である。このため、生成部１００５は、アクセスログ１１０２の照会ＦＡＱが、１ページ目に表示されたＦＡＱであると判断する。

この場合、生成部１００５は、図１２に示すように、アクセスログ１１０２から特定される照会ＦＡＱ「０１１」と形態素解析後検索ワード「拡大、印刷」とを対応付けて表す教師データ（よゐこ）１２０１を生成する。

同様に、生成部１００５は、タイプ「照会」のアクセスログ１１０３の順位に基づいて、照会ＦＡＱが、１ページ目に表示されたＦＡＱであるか否かを判断する。ここで、アクセスログ１１０３の順位は、「２」であり、５以下である。このため、生成部１００５は、アクセスログ１１０３の照会ＦＡＱが、１ページ目に表示されたＦＡＱであると判断する。

この場合、生成部１００５は、図１２に示すように、アクセスログ１１０３から特定される照会ＦＡＱ「０１２」と形態素解析後検索ワード「拡大、印刷」とを対応付けて表す教師データ（よゐこ）１２０２を生成する。

また、生成部１００５は、タイプ「検索」のアクセスログ１１０１の検索リストを参照して、検索ワードに対して表示された際に照会されなかったＦＡＱ、すなわち、検索ワードに対する選択操作を受け付けなかったＦＡＱがあるか否かを判断する。ここで、ＦＡＱ番号「０１３」のＦＡＱは照会されていない。

このため、生成部１００５は、照会されなかったＦＡＱがあると判断する。この場合、生成部１００５は、図１２に示すように、照会されなかったＦＡＱ番号「０１３」のＦＡＱを非照会ＦＡＱとする教師データ（わるいこ）１２０３を生成する。

また、生成部１００５は、タイプ「検索」のアクセスログの検索リストを参照して、ＦＡＱが１件も検索されなかった検索ワードがあるか否かを判断する。ここでは、ＦＡＱが１件も検索されなかった検索ワードは存在しない。この場合、生成部１００５は、教師データ（まいご）を生成しない。

図１３は、アクセスログの具体例を示す説明図（その２）である。図１４は、教師データの具体例を示す説明図（その２）である。図１３において、アクセスログ１３０１～１３０４は、時系列にソートされたセッション番号が同一のアクセスログの集合である。

この場合、生成部１００５は、アクセスログ１３０１～１３０４の中に、タイプ「照会」のアクセスログがあるか否かを判断する。ここで、アクセスログ１３０３，１３０４はタイプ「照会」のアクセスログである。このため、生成部１００５は、タイプ「照会」のアクセスログがあると判断する。

つぎに、生成部１００５は、タイプ「照会」のアクセスログ１３０３の順位に基づいて、照会ＦＡＱが、１ページ目に表示されたＦＡＱであるか否かを判断する。ここで、アクセスログ１３０３の順位は、「１」であり、５以下である。このため、生成部１００５は、アクセスログ１３０３の照会ＦＡＱが、１ページ目に表示されたＦＡＱであると判断する。

この場合、生成部１００５は、図１４に示すように、アクセスログ１３０３から特定される照会ＦＡＱ「０１１」と形態素解析後検索ワード「拡大、印刷」とを対応付けて表す教師データ（よゐこ）１４０１を生成する。

同様に、生成部１００５は、タイプ「照会」のアクセスログ１３０４の順位に基づいて、照会ＦＡＱが、１ページ目に表示されたＦＡＱであるか否かを判断する。ここで、アクセスログ１３０４の順位は、「２」であり、５以下である。このため、生成部１００５は、アクセスログ１３０４の照会ＦＡＱが、１ページ目に表示されたＦＡＱであると判断する。

この場合、生成部１００５は、図１４に示すように、アクセスログ１３０４から特定される照会ＦＡＱ「０１２」と形態素解析後検索ワード「拡大、印刷」とを対応付けて表す教師データ（よゐこ）１４０２を生成する。

また、生成部１００５は、タイプ「検索」のアクセスログ１３０１，１３０２の検索リストを参照して、検索ワードに対して表示された際に照会されなかったＦＡＱ、すなわち、検索ワードに対する選択操作を受け付けなかったＦＡＱがあるか否かを判断する。ここで、ＦＡＱ番号「０１３」のＦＡＱは照会されていない。

このため、生成部１００５は、照会されなかったＦＡＱがあると判断する。この場合、生成部１００５は、図１４に示すように、照会されなかったＦＡＱ番号「０１３」のＦＡＱを非照会ＦＡＱとする教師データ（わるいこ）１４０３を生成する。

また、生成部１００５は、タイプ「検索」のアクセスログ１３０１，１３０２の検索リストを参照して、ＦＡＱが１件も検索されなかった検索ワードがあるか否かを判断する。ここでは、アクセスログ１３０１の検索リストは「－」であり、検索ワード「大きく印刷」はＦＡＱが１件も検索されなかった検索ワードである。

この場合、生成部１００５は、検索ワード「大きく印刷」に後続して入力を受け付けた他の検索ワードがあるか否かを判断する。ただし、他の検索ワードは、当該他の検索ワードに対して１ページ目に表示されたいずれかのＦＡＱが照会（選択）された検索ワードである。

ここで、検索ワード「拡大、印刷」は、検索ワード「大きく印刷」に後続して入力を受け付けた他の検索ワードである。また、検索ワード「拡大、印刷」は、当該他の検索ワードに対して１ページ目に表示されたＦＡＱ番号「００１，００２」のＦＡＱが照会（選択）された検索ワードである。このため、生成部１００５は、他の検索ワードがあると判断する。

この場合、生成部１００５は、図１４に示すように、他の検索ワード「拡大、印刷」を代替ワードとして、代替ワード「拡大、印刷」と検索ワード「大きく印刷」とを対応付けた教師データ（まいご）１４０４を生成する。

（第１、第２および第３の確率を算出する具体的な処理内容）
つぎに、図１５を用いて、ナイーブベイズ分類器による機械学習を行って、第１、第２および第３の確率を算出する具体的な処理内容について説明する。

図１５は、分析ＤＢ１５００の記憶内容の一例を示す説明図である。ここでは、第１の確率を例に挙げて、計算例について説明する。まず、決定部１００３は、教師データ（よゐこ）ＤＢ２４０を参照して、分析ＤＢ１５００を作成する。

分析ＤＢ１５００は、縦軸に「ＦＡＱ番号」、横軸に「キーワード」を設定し、キーワードごとに各ＦＡＱの照会回数を集計したものである。ただし、ＦＡＱ番号は、検索部１００２によって検索された複数のＦＡＱそれぞれのＦＡＱ番号である。キーワードは、教師データ（よゐこ）ＤＢ２４０内の教師データ（よゐこ）の形態素解析後検索ワードに含まれる形態素である。

ここでは、検索ワードを「キーワード１，キーワード２」とする。また、検索部１００２によって検索された検索ワード「キーワード１，キーワード２」に対応する複数のＦＡＱそれぞれのＦＡＱ番号を「１，２，３，４，５」とする。また、教師データ（よゐこ）ＤＢ２４０内の教師データ（よゐこ）の形態素解析後検索ワードに含まれる形態素を「キーワード１，キーワード２，キーワード３，キーワード４，キーワード５，キーワード６」とする。

具体的には、例えば、決定部１００３は、教師データ（よゐこ）ＤＢ２４０から未選択の教師データ（よゐこ）を選択する。ここで、選択された教師データ（よゐこ）の照会ＦＡＱを「１」とし、形態素解析後検索ワードにキーワード１、キーワード２が含まれるとする。この場合、決定部１００３は、ＦＡＱ番号「１」のキーワード１の照会回数をインクリメントする。また、決定部１００３は、ＦＡＱ番号「１」のキーワード２の照会回数をインクリメントする。決定部１００３は、教師データ（よゐこ）ＤＢ２４０から選択されていない未選択の教師データ（よゐこ）がなくなるまで、上述した一連の処理を繰り返す。

つぎに、決定部１００３は、分析ＤＢ１５００を参照して、検索された複数のＦＡＱそれぞれについて、第１の確率を算出する。具体的には、例えば、決定部１００３は、例えば、下記式（１）を用いて、検索された複数のＦＡＱそれぞれについて、第１の確率を算出することができる。

Ｐ（ＦＡＱ｜検索ワード）＝Ｐ（ＦＡＱ）Ｐ（検索ワード｜ＦＡＱ）・・・（１）

事後確率Ｐ（ＦＡＱ｜検索ワード）は、検索ワードを指定してＦＡＱを検索した場合、該当ＦＡＱが選択（照会）される確率を示す。すなわち、事後確率Ｐ（ＦＡＱ｜検索ワード）は、第１の確率に相当する。例えば、Ｐ（ＦＡＱ１｜事故）は、検索ワード「事故」を指定してＦＡＱを検索した場合、ＦＡＱ１が選択（照会）される確率を示す。

なお、検索ワードが複数のキーワードで構成される場合は、事後確率をそれぞれの確率の積で示す。例えば、Ｐ（ＦＡＱ１｜事故、車）は、検索ワード「事故」、「車」を指定してＦＡＱを検索した場合、ＦＡＱ１が選択される確率が、Ｐ（ＦＡＱ１）Ｐ（事故｜ＦＡＱ１）×Ｐ（ＦＡＱ１）Ｐ（車｜ＦＡＱ１）であることを示す。

事前確率Ｐ（ＦＡＱ）は、該当ＦＡＱが選ばれる確率（割合）を示す。例えば、ＦＡＱ総数が５０００で、検索ワード「事故」で検索する場合、Ｐ（ＦＡＱ１）は「１／５０００」である。なお、事前確率Ｐ（ＦＡＱ）は、推定における精度を向上させるため、検索ワードに含まれるＦＡＱの総数に置き換える。ＦＡＱ総数が５０００で、検索ワード「事故」でヒットしたことのあるＦＡＱの総数が１００とすると、検索ワード「事故」で検索する場合、Ｐ（ＦＡＱ１）は「１／１００」である。

尤度Ｐ（検索ワード｜ＦＡＱ）は、ＦＡＱが決まったとき、検索ワードが作成される確率を示す。例えば、Ｐ（事故｜ＦＡＱ１）は、ＦＡＱ１から検索ワード「事故」が作成される確率を示す。ＦＡＱ１をアクセスしたキーワードのアクセス数が１０００で、検索ワード「事故」が１０の場合は、Ｐ（事故｜ＦＡＱ１）は「１０／１０００」となる。

図１５に示した分析ＤＢ１５００をもとに算出される各ＦＡＱ１～５の第１の確率（Ｐ（ＦＡＱ｜キーワード１，２））は、以下の通りである。なお、「０」となる部分は「１」に置き換える（ラプラススムージング）。

Ｐ（ＦＡＱ１｜キーワード１，２）
＝Ｐ（キーワード１｜ＦＡＱ１）×Ｐ（ＦＡＱ１）×Ｐ（キーワード２｜ＦＡＱ１）×Ｐ（ＦＡＱ１）＝（１／２１）（１／２３）×（１２／２１）（１２／９６）
＝０．０００１５

Ｐ（ＦＡＱ２｜キーワード１，２）
＝Ｐ（キーワード１｜ＦＡＱ２）×Ｐ（ＦＡＱ２）×Ｐ（キーワード２｜ＦＡＱ２）×Ｐ（ＦＡＱ２）＝（１０／８５）（１０／２３）×（１／８５）（１／９６）
＝０．００００１

Ｐ（ＦＡＱ３｜キーワード１，２）
＝Ｐ（キーワード１｜ＦＡＱ３）×Ｐ（ＦＡＱ３）×Ｐ（キーワード２｜ＦＡＱ３）×Ｐ（ＦＡＱ３）＝（２／７）（２／２３）×（１／７）（１／９６）
＝０．０００１８

Ｐ（ＦＡＱ４｜キーワード１，２）
＝Ｐ（キーワード１｜ＦＡＱ４）×Ｐ（ＦＡＱ４）×Ｐ（キーワード２｜ＦＡＱ４）×Ｐ（ＦＡＱ４）＝（６／１２４）（６／２３）×（７７／１２４）（７７／９６）
＝０．００６２９

Ｐ（ＦＡＱ５｜キーワード１，２）
＝Ｐ（キーワード１｜ＦＡＱ５）×Ｐ（ＦＡＱ５）×Ｐ（キーワード２｜ＦＡＱ５）×Ｐ（ＦＡＱ５）＝（４／４４）（４／２３）×（６／４４）（６／９６）
＝０．０００１３

ただし、コンピュータ上では、桁数が小さくなりすぎると計算できなくなる可能性がある（オーバーフロー）。このため、決定部１００３は、算出した各値を対数に変換して、第１の確率をそれぞれ算出する。対数に変換した第１の確率は、以下の通りである。０に近いほど、確率が高いことを示す。

Ｐ（ＦＡＱ１｜キーワード１，２）
＝Ｌｏｇ（１／２１）（１／２３）＋Ｌｏｇ（１２／２１）（１２／９６）
＝－３．８３

Ｐ（ＦＡＱ２｜キーワード１，２）
＝Ｌｏｇ（１０／８５）（１０／２３）＋Ｌｏｇ（１／８５）（１／９６）
＝－５．２０

Ｐ（ＦＡＱ３｜キーワード１，２）
＝Ｌｏｇ（２／７）（２／２３）＋Ｌｏｇ（１／７）（１／９６）
＝－４．４３

Ｐ（ＦＡＱ４｜キーワード１，２）
＝Ｌｏｇ（６／１２４）（６／２３）＋Ｌｏｇ（７７／１２４）（７７／９６）
＝－２．２

Ｐ（ＦＡＱ５｜キーワード１，２）
＝Ｌｏｇ（４／４４）（４／２３）＋Ｌｏｇ（６／４４）（６／９６）
＝－３．８７

つぎに、決定部１００３は、ソフトマックス関数を利用して、対数表記した各ＦＡＱ１～５の第１の確率を、０～１００［％］の表記に変換する。具体的には、例えば、決定部１００３は、対数表記した各ＦＡＱ１～５の第１の確率のうち、絶対値の最大値Ｃ「－５．２０」を取得する。そして、決定部１００３は、以下のように、各ＦＡＱ１～５について、（最大値Ｃ－第１の確率）の値の指数を計算する。

Ｐ（ＦＡＱ１）＝ｅｘｐ（－３．８３－（－５．２０））＝３．９３
Ｐ（ＦＡＱ２）＝ｅｘｐ（－５．２０－（－５．２０））＝１．０
Ｐ（ＦＡＱ３）＝ｅｘｐ（－４．４３－（－５．２０））＝２．１６
Ｐ（ＦＡＱ４）＝ｅｘｐ（－２．２０－（－５．２０））＝２０．０９
Ｐ（ＦＡＱ５）＝ｅｘｐ（－３．８７－（－５．２０））＝３．４２

つぎに、決定部１００３は、各ＦＡＱ１～５の（最大値Ｃ－第１の確率）の値の指数の合計値Ｓを計算する。ここでは、指数の合計値Ｓは、「３０．０６」となる。

つぎに、決定部１００３は、以下のように、各ＦＡＱ１～５について、（最大値Ｃ－第１の確率）の値の指数を、指数の合計値Ｓで割った値を算出する。

Ｐ（ＦＡＱ１）＝３．９３／３０．０６＝０．１３
Ｐ（ＦＡＱ２）＝１．０／３０．０６＝０．０３
Ｐ（ＦＡＱ３）＝２．１６／３０．０６＝０．０７
Ｐ（ＦＡＱ４）＝２０．０９／３０．０６＝０．６７
Ｐ（ＦＡＱ５）＝３．４２／３０．０６＝０．１１

つぎに、決定部１００３は、以下のように、各ＦＡＱ１～５について、算出した値に１００を掛けることにより、第１の確率を０～１００［％］の表記に変換する。

Ｐ（ＦＡＱ１）＝１３［％］
Ｐ（ＦＡＱ２）＝３［％］
Ｐ（ＦＡＱ３）＝７［％］
Ｐ（ＦＡＱ４）＝６７［％］
Ｐ（ＦＡＱ５）＝１１［％］

このようにして、各ＦＡＱ１～５について、検索ワード「キーワード１，キーワード２」に対して各ＦＡＱ１～５が表示された際に、各ＦＡＱ１～５が選択（照会）される第１の確率を算出することができる。なお、１回も選択（照会）されたことがないＦＡＱについては、第１の確率は「０［％］」とする。

また、ここでは、第１の確率を例に挙げて説明したが、第２および第３の確率についても、同様にして求めることができる。

例えば、第２の確率の場合、決定部１００３は、教師データ（わるいこ）ＤＢ２５０を参照して、分析ＤＢ１５００を作成する。この場合、分析ＤＢ１５００は、縦軸に「ＦＡＱ番号」、横軸に「キーワード」を設定し、キーワードごとに各ＦＡＱが照会されなかった非照会回数を集計したものである。ただし、ＦＡＱ番号は、検索部１００２によって検索された複数のＦＡＱそれぞれのＦＡＱ番号である。キーワードは、教師データ（わるいこ）ＤＢ２５０内の教師データ（わるいこ）の形態素解析後検索ワードに含まれる形態素である。

具体的には、例えば、決定部１００３は、教師データ（わるいこ）ＤＢ２５０から未選択の教師データ（わるいこ）を選択する。ここで、選択された教師データ（わるいこ）の非照会ＦＡＱを「１」とし、形態素解析後検索ワードにキーワード１、キーワード２が含まれるとする。この場合、決定部１００３は、ＦＡＱ番号「１」のキーワード１の非照会回数をインクリメントする。また、決定部１００３は、ＦＡＱ番号「１」のキーワード２の非照会回数をインクリメントする。決定部１００３は、教師データ（よゐこ）ＤＢ２４０から選択されていない未選択の教師データ（よゐこ）がなくなるまで、上述した一連の処理を繰り返す。

これにより、キーワードごとに各ＦＡＱの非照会回数が記憶された分析ＤＢ１５００を作成することができる。そして、決定部１００３は、例えば、分析ＤＢ１５００を参照して、上記式（１）を用いて、検索された複数のＦＡＱそれぞれについて、第２の確率を算出する。ただし、事後確率Ｐ（ＦＡＱ｜検索ワード）は、検索ワードを指定してＦＡＱを検索した場合、該当ＦＡＱが選択（照会）されない確率を示す。事前確率Ｐ（ＦＡＱ）は、該当ＦＡＱが選ばれない確率（割合）を示す。尤度Ｐ（検索ワード｜ＦＡＱ）は、ＦＡＱが決まったとき、検索ワードが作成される確率を示す。なお、以降の第２の確率の具体的な計算手順は、第１の確率と同様のため、詳細な説明は省略する。

また、第３の確率の場合、特定部１００７は、教師データ（まいご）ＤＢ２６０を参照して、分析ＤＢ１５００を作成する。この場合、分析ＤＢ１５００は、縦軸に「代替ワード」、横軸に「形態素」を設定し、形態素ごとに各代替ワードが入力された入力回数を集計したものである。ただし、代替ワードは、教師データ（まいご）ＤＢ２６０内の教師データ（まいご）の代替ワードである。すなわち、代替ワードは、０件ヒット検索ワードに後続して入力された他の検索ワードに相当する。形態素は、０件ヒット検索ワードを形態素解析して検出される形態素である。０件ヒット検索ワードから形態素が検出されなかった場合には、例えば、０件ヒット検索ワードそのものを、横軸の形態素としてもよい。

具体的には、例えば、特定部１００７は、教師データ（まいご）ＤＢ２６０から未選択の教師データ（まいご）を選択する。そして、特定部１００７は、選択した教師データ（まいご）の検索ワードに、分析ＤＢ１５００内のいずれかの形態素が含まれる場合、その形態素について、選択した教師データ（まいご）の代替ワードの入力回数をインクリメントする。特定部１００７は、教師データ（まいご）ＤＢ２６０から選択されていない未選択の教師データ（まいご）がなくなるまで、上述した一連の処理を繰り返す。

これにより、形態素ごとに各代替ワードが入力された入力回数が記憶された分析ＤＢ１５００を作成することができる。そして、特定部１００７は、例えば、分析ＤＢ１５００を参照して、上記式（１）を用いて、分析ＤＢ１５００内の代替ワードそれぞれについて、第３の確率を算出する。

ただし、事後確率は、Ｐ（代替ワード｜検索ワード）となる。事前確率は、Ｐ（代替ワード）となる。尤度は、Ｐ（代替ワード）となる。事後確率Ｐ（代替ワード｜検索ワード）は、検索ワードに後続して代替ワードが入力される確率を示す。事前確率Ｐ（代替ワード）は、該当代替ワードがある確率（割合）を示す。尤度Ｐ（検索ワード｜代替ワード）は、代替ワードが決まったとき、検索ワードが作成される確率を示す。なお、以降の第３の確率の具体的な計算手順は、第１の確率と同様のため、詳細な説明は省略する。

（ＦＡＱの決定例）
つぎに、図１６を用いて、検索ワードに対するＦＡＱの決定例について説明する。

図１６は、ＦＡＱの決定例を示す説明図である。図１６において、第１のテーブル１６０１は、検索部１００２によって検索された複数のＦＡＱそれぞれについて算出された第１の確率を記憶する。第２のテーブル１６０２は、検索部１００２によって検索された複数のＦＡＱそれぞれについて算出された第２の確率を記憶する。

ここでは、検索ワードに対応するＦＡＱとして、ＦＡＱ番号が「００１～０１０」の１０件のＦＡＱが検索された場合を想定する。また、閾値αを「α＝８０」とする。また、ＦＡＱ番号が若いほど、既存の検索アルゴリズムで検索された際の優先度が高いものとする。例えば、既存の検索アルゴリズムでは、過去のアクセス数（照会数）が多いＦＡＱほど高い優先度が設定される。

この場合、決定部１００３は、例えば、第２のテーブル１６０２を参照して、第２の確率が閾値α以上のＦＡＱを特定する。ここでは、ＦＡＱ番号「００３，００５，００６，００８」のＦＡＱが特定される。つぎに、決定部１００３は、第１のテーブル１６０１から、特定したＦＡＱ番号「００３，００５，００６，００８」のＦＡＱのレコードを削除する。

そして、決定部１００３は、第１のテーブル１６０１を参照して、第１の確率が高い順にソートした残余のＦＡＱ、すなわち、ＦＡＱ番号「００１，００２，００７，００４，００９，０１０」のＦＡＱを、検索ワードに対する１または複数のＦＡＱに決定する。

この場合、出力制御部１００４は、端末２０１に対して、決定されたＦＡＱ番号「００１，００２，００７，００４，００９，０１０」のＦＡＱを送信する。ここで、ＦＡＱ画面９００において、上位５件のみ１ページ目に表示される場合（Ｎ＝５）、ＦＡＱ番号「００１，００２，００７，００４，００９」のＦＡＱは、この順番で１ページ目に表示され、ＦＡＱ番号「０１０」のＦＡＱは２ページ目に表示される。

例えば、過去のアクセス数（照会数）が多い順にＦＡＱを表示する場合に比べると、第１および第２の確率を用いてＦＡＱが絞り込まれた結果、ＦＡＱ番号「００３，００５，００６，００８」のＦＡＱが除外され、ＦＡＱ番号「００７，００９，０１０」のＦＡＱが繰り上がって１ページ目に表示される。

（閾値αの調整例）
つぎに、図１７および図１８を用いて、閾値αの調整例について説明する。ここでは、上位５件のＦＡＱが１ページ目に表示されるＦＡＱである場合を想定する（Ｎ＝５）。

図１７は、アクセスログの具体例を示す説明図（その３）である。図１７において、アクセスログ１７０１～１７０５は、時系列にソートされたセッション番号が同一のアクセスログの集合である。以下、アクセスログ１７０１～１７０５から、１ページ目ヒット率を算出する場合について説明する。

具体的には、例えば、決定部１００３は、下記式（２）を用いて、アクセスログ１７０１～１７０５から１ページ目ヒット率を算出する。ただし、Ｘは、照会されたＦＡＱが検索結果の１ページ目に存在する回数である。Ｙは、ＦＡＱの照会回数である。また、１ページ目ヒット率の単位は［％］である。

１ページ目ヒット率＝Ｘ／Ｙ×１００・・・（２）

より詳細に説明すると、決定部１００３は、タイプ「照会」のアクセスログ１７０２～１７０５を参照して、照会されたＦＡＱが検索結果の１ページ目に存在する回数Ｘを算出する。ここで、アクセスログ１７０２，１７０３の順位は、「１，２」であり、５以下である。一方、アクセスログ１７０４，１７０５の順位は、「４０，４５」であり、５より大きい。したがって、回数Ｘは「Ｘ＝２」となる。

また、決定部１００３は、タイプ「照会」のアクセスログ１７０２～１７０５を参照して、ＦＡＱの照会回数Ｙを算出する。ここでは、照会回数Ｙは、タイプ「照会」のアクセスログ１７０２～１７０５の数であり、「Ｙ＝４」である。このため、１ページ目ヒット率は、「５０［％］（＝２／４×１００）」となる。

決定部１００３は、１ページ目ヒット率の算出を、所定期間ごと、例えば、数週間～数ヶ月程度の期間ごとに行う。つぎに、決定部１００３は、所定期間ごとに算出した１ページ目ヒット率の推移を回帰分析して、１ページ目ヒット率の時系列変化を表す直線の傾きを算出する。そして、決定部１００３は、算出した傾きに応じて、閾値αを調整する。

図１８は、１ページ目ヒット率の時系列変化の一例を示す説明図である。図１８において、直線１８０１，１８０２は、１ページ目ヒット率の時系列変化を表す直線である。直線１８０１は、傾きが０より大きく、１ページ目ヒット率が上昇傾向にあることを示している。一方、直線１８０２は、傾きが０より小さく、１ページ目ヒット率が下降傾向にあることを示している。

例えば、決定部１００３は、１ページ目ヒット率の時系列変化を表す直線の傾きが０より大きい場合、１ページ目ヒット率が上昇傾向にあるため、閾値αを調整しない。また、決定部１００３は、１ページ目ヒット率の時系列変化を表す直線の傾きが０の場合、１ページ目ヒット率に変化がないため、閾値αを調整しない。

一方、決定部１００３は、１ページ目ヒット率の時系列変化を表す直線の傾きが０より小さい場合、１ページ目ヒット率が下降傾向にあるため、閾値αを調整する。具体的には、例えば、決定部１００３は、１ページ目ヒット率の時系列変化を表す直線の傾きが０より小さい場合、閾値αを１［％］下げる。

例えば、調整前の閾値αが「８０［％］」の場合、決定部１００３は、閾値αを「７９［％］」に変更する。１ページ目ヒット率が下降傾向にある場合、１ページ目のＦＡＱが照会されにくくなって、教師データ（わるいこ）の学習が進むと想定される。このため、教師データ（わるいこ）の反応をよくするため、閾値αを下げて、ＦＡＱをより多く削る方向に調整する。

なお、決定部１００３は、１ページ目ヒット率の時系列変化を表す直線の傾きの大きさに応じて、閾値αの下げ分を変更することにしてもよい。例えば、１ページ目ヒット率が大幅に下降していると判断できる程度に、直線の傾きが小さい場合、決定部１００３は、閾値αの下げ分を５［％］程度に変更することにしてもよい。

（形態素の推定）
つぎに、図１９を用いて、形態素を推定する処理について説明する。

図１９は、形態素を推定する方法の一実施例を示す説明図である。特定部１００７は、判定部１００６によって検索ワードに対応するＦＡＱがないと判定された場合、教師データ（まいご）ＤＢ２６０の記憶内容に基づく機械学習を行って、０件ヒット検索ワードに後続して入力される代替ワードを特定する。しかし、教師データ（まいご）が蓄積されるまでの間は、代替ワードを特定することができない。

例えば、パンチミス等によりデタラメな検索ワードが入力された場合、検索ワードから形態素が検出されず、０件ヒットとなることがある。また、この場合、当該検索ワードに対応する教師データ（まいご）は蓄積されていない可能性が高い。すなわち、パンチミス等によりデタラメな検索ワードが入力された場合、代替ワードを特定できず、０件ヒットとなることがある。

そこで、情報処理装置１０１は、代替ワードが特定されなかった場合に、当該検索ワードに対応する形態素を推定して、推定した形態素に対応するＦＡＱを検索することにしてもよい。

具体的には、例えば、まず、生成部１００５は、教師データ（形態素）を生成する。より詳細に説明すると、例えば、生成部１００５は、教師データ（よゐこ）ＤＢ２４０内の教師データ（よゐこ）の形態素解析後検索ワードから形態素を抽出する。そして、生成部１００５は、抽出した形態素と、当該形態素に含まれるそれぞれの文字とを対応付けた教師データ（形態素）を生成する。

一例として、形態素を「ＦＩＬＥ」とすると、形態素「ＦＩＬＥ」と、形態素「ＦＩＬＥ」に含まれるそれぞれの要素（文字）「“Ｆ”，“Ｉ”，“Ｌ”，“Ｅ”」とを対応付けた教師データ（形態素）１９０１が生成される。生成された教師データ（形態素）は、教師データ（形態素）ＤＢ１９００に記憶される。

また、生成部１００５は、例えば、教師データ（わるいこ）ＤＢ２５０内の教師データ（わるいこ）の形態素解析後検索ワードから形態素を抽出し、抽出した形態素と、当該形態素に含まれるそれぞれの文字とを対応付けた教師データ（形態素）を生成してもよい。また、生成部１００５は、例えば、教師データ（まいご）ＤＢ２６０内の教師データ（まいご）の代替ワードや検索ワードから形態素を抽出し、抽出した形態素と、当該形態素に含まれるそれぞれの文字とを対応付けた教師データ（形態素）を生成してもよい。

つぎに、特定部１００７は、検索ワードから形態素が検出されなかった場合、教師データ（形態素）ＤＢ１９００の記憶内容に基づく機械学習を行って、検索ワードに対応する形態素を特定する。ただし、検索ワードから形態素が検出されなかった場合であっても、ＦＡＱマスタ２２０からＦＡＱが検索されることもある。

すなわち、検索ワードから形態素が検出されなかった場合であっても、端末２０１に対して検索ワードに対応するＦＡＱを出力できる場合がある。このため、特定部１００７は、例えば、検索ワードから形態素が検出されず、かつ、検索ワードに対応するＦＡＱがないと判定された場合に、検索ワードに対応する形態素を特定することにしてもよい。

より具体的には、例えば、特定部１００７は、教師データ（形態素）ＤＢ１９００を参照して、ナイーブベイズ分類器による機械学習を行って、複数の形態素それぞれについて、第４の確率を算出する。第４の確率は、形態素が検出されなかった検索ワードに類似する度合いの高さを示す。

なお、第４の確率についても、第１の確率と同様にして求めることができる。まず、特定部１００７は、教師データ（形態素）ＤＢ１９００を参照して、分析ＤＢ１５００を作成する。この場合、分析ＤＢ１５００は、縦軸に「形態素」、横軸に「文字」を設定し、文字ごとの出現回数を集計したものである。ただし、形態素は、教師データ（形態素）ＤＢ１９００内の教師データ（形態素）の形態素である。文字は、教師データ（形態素）ＤＢ１９００内の教師データ（形態素）の形態素に含まれる文字である。

具体的には、例えば、特定部１００７は、教師データ（形態素）ＤＢ１９００から未選択の教師データ（形態素）を選択する。ここで、選択された教師データ（形態素）の形態素を「ＦＩＬＥ」とし、要素を「“Ｆ”，“Ｉ”，“Ｌ”，“Ｅ”」とする。この場合、特定部１００７は、分析ＤＢ１５００内の形態素「ＦＩＬＥ」の各要素「“Ｆ”，“Ｉ”，“Ｌ”，“Ｅ”」の出現回数をそれぞれインクリメントする。特定部１００７は、例えば、教師データ（形態素）ＤＢ１９００から選択されていない未選択の教師データ（形態素）がなくなるまで、上述した一連の処理を繰り返す。

これにより、形態素ごとに各要素の出現回数が記憶された分析ＤＢ１５００を作成することができる。そして、決定部１００３は、例えば、分析ＤＢ１５００を参照して、上記式（１）を用いて、複数の形態素それぞれについて、第４の確率を算出する。ただし、事後確率は、Ｐ（形態素｜文字）となる。事前確率は、Ｐ（形態素）となる。尤度は、Ｐ（形態素）となる。事後確率Ｐ（形態素｜文字）は、該当文字を含む形態素が入力される確率を示す。事前確率Ｐ（形態素）は、形態素（縦軸）に含まれる全要素中に該当文字が占める割合を示す。尤度Ｐ（形態素）は、形態素が決まったとき、該当文字が含まれる確率を示す。なお、以降の第４の確率の具体的な計算手順は、第１の確率と同様のため、詳細な説明は省略する。

そして、特定部１００７は、分析ＤＢ１５００内の複数の形態素それぞれについて算出した第４の確率に基づいて、検索ワードに対応する形態素を特定する。具体的には、例えば、特定部１００７は、第４の確率が最大の形態素を、形態ワードに対応する形態素として特定する。これにより、形態素解析により形態素が検出されなかった検索ワードに対応する形態素を推定することができる。

この場合、特定部１００７は、例えば、教師データ（まいご）を記憶する記憶部１０１０の記憶内容に基づく機械学習を行って、特定した形態素に後続して入力される代替ワードを特定する。そして、検索部１００２は、特定された代替ワードに対応するＦＡＱを検索する。

これにより、パンチミス等によりデタラメな検索ワードが入力された場合であっても、０件ヒットとなることを防ぐことができる。また、上述した説明では、特定部１００７が、特定した形態素に後続して入力される代替ワードを特定し、検索部１００２が、特定された代替ワードに対応するＦＡＱを検索することにしたが、これに限らない。例えば、検索部１００２は、特定された形態素に対応するＦＡＱを検索することにしてもよい。

なお、教師データ（よゐこ）、教師データ（わるいこ）のデータ構造は、ＦＡＱ番号と形態素解析後検索ワードのため、検索ワードから形態素が検出されなかった場合は、学習できず、第１および第２の確率を算出できない。つまり、第１および第２の確率を用いたＦＡＱの絞り込みを行うことができない。したがって、このような場合も、第１および第２の確率を用いたＦＡＱの絞り込みを行えるように、情報処理装置１０１は、検索ワードに対応する形態素を推定して、ＦＡＱを再検索することにしてもよい。

（情報処理装置１０１の教師データ生成処理手順）
つぎに、図２０および図２１を用いて、情報処理装置１０１の教師データ生成処理手順について説明する。情報処理装置１０１の教師データ生成処理は、例えば、２４時間程度の期間ごとに定期的に実行されてもよく、また、回答出力システム２００の管理者等が指定する所定のタイミングで実行されてもよい。

図２０および図２１は、情報処理装置１０１の教師データ生成処理手順の一例を示すフローチャートである。図２０のフローチャートにおいて、まず、情報処理装置１０１は、アクセスログＤＢ２３０から選択されていない未選択のセッション番号を選択する（ステップＳ２００１）。

つぎに、情報処理装置１０１は、アクセスログＤＢ２３０から、選択したセッション番号のアクセスログを取得する（ステップＳ２００２）。そして、情報処理装置１０１は、取得したアクセスログの日時に基づいて、取得したアクセスログを時系列にソートする（ステップＳ２００３）。

つぎに、情報処理装置１０１は、取得したアクセスログの中に、タイプ「照会」のアクセスログがあるか否かを判断する（ステップＳ２００４）。ここで、タイプ「照会」のアクセスログがない場合（ステップＳ２００４：Ｎｏ）、情報処理装置１０１は、図２１に示すステップＳ２１０１に移行する。

一方、タイプ「照会」のアクセスログがある場合（ステップＳ２００４：Ｙｅｓ）、情報処理装置１０１は、当該アクセスログから特定される照会ＦＡＱが、１ページ目に表示されたＦＡＱであるか否かを判断する（ステップＳ２００５）。ここで、１ページ目に表示されたＦＡＱではない場合（ステップＳ２００５：Ｎｏ）、情報処理装置１０１は、図２１に示すステップＳ２１０１に移行する。

一方、１ページ目に表示されたＦＡＱの場合（ステップＳ２００５：Ｙｅｓ）、情報処理装置１０１は、タイプ「照会」のアクセスログから特定される照会ＦＡＱと形態素解析後検索ワードとを対応付けて表す教師データ（よゐこ）を生成する（ステップＳ２００６）。そして、情報処理装置１０１は、生成した教師データ（よゐこ）を、教師データ（よゐこ）ＤＢ２４０に登録して（ステップＳ２００７）、図２１に示すステップＳ２１０１に移行する。

図２１のフローチャートにおいて、まず、情報処理装置１０１は、タイプ「検索」のアクセスログの検索リストを参照して、０件ヒットの検索ワードがあるか否かを判断する（ステップＳ２１０１）。ここで、０件ヒットの検索ワードがない場合（ステップＳ２１０１：Ｎｏ）、情報処理装置１０１は、ステップＳ２１０５に移行する。

一方、０件ヒットの検索ワードがある場合（ステップＳ２１０１：Ｙｅｓ）、情報処理装置１０１は、取得したアクセスログの日時に基づいて、０件ヒットの検索ワードに後続して入力を受け付けた他の検索ワードがあるか否かを判断する（ステップＳ２１０２）。ただし、他の検索ワードは、当該他の検索ワードに対して１ページ目に表示されたいずれかのＦＡＱが照会（選択）された検索ワードである。

ここで、他の検索ワードがない場合（ステップＳ２１０２：Ｎｏ）、情報処理装置１０１は、ステップＳ２１０５に移行する。一方、他の検索ワードがある場合（ステップＳ２１０２：Ｙｅｓ）、情報処理装置１０１は、他の検索ワードを代替ワードとする教師データ（まいご）を生成する（ステップＳ２１０３）。

そして、情報処理装置１０１は、生成した教師データ（まいご）を、教師データ（まいご）ＤＢ２６０に登録する（ステップＳ２１０４）。つぎに、情報処理装置１０１は、タイプ「検索」のアクセスログの検索リストを参照して、検索ワードに対して表示された際に照会されなかったＦＡＱがあるか否かを判断する（ステップＳ２１０５）。

ここで、照会されなかったＦＡＱがない場合（ステップＳ２１０５：Ｎｏ）、情報処理装置１０１は、ステップＳ２１０８に移行する。一方、照会されなかったＦＡＱがある場合（ステップＳ２１０５：Ｙｅｓ）、情報処理装置１０１は、照会されなかったＦＡＱを非照会ＦＡＱとする教師データ（わるいこ）を生成する（ステップＳ２１０６）。

そして、情報処理装置１０１は、生成した教師データ（わるいこ）を、教師データ（わるいこ）ＤＢ２５０に登録する（ステップＳ２１０７）。つぎに、情報処理装置１０１は、アクセスログＤＢ２３０から選択されていない未選択のセッション番号があるか否かを判断する（ステップＳ２１０８）。

ここで、未選択のセッション番号がある場合（ステップＳ２１０８：Ｙｅｓ）、情報処理装置１０１は、図２０に示したステップＳ２００１に戻る。一方、未選択のセッション番号がない場合（ステップＳ２１０８：Ｎｏ）、情報処理装置１０１は、本フローチャートによる一連の処理を終了する。

これにより、過去のユーザの操作履歴（アクセスログ）から教師データ（よゐこ）、教師データ（わるいこ）および教師データ（まいご）を生成することができる。なお、アクセスログＤＢ２３０の記憶内容は、例えば、情報処理装置１０１の教師データ生成処理の実行が完了すると、その都度リセットされる。

（情報処理装置１０１の回答出力処理手順）
つぎに、図２２および図２３を用いて、情報処理装置１０１の回答出力処理手順について説明する。

図２２および図２３は、情報処理装置１０１の回答出力処理手順の一例を示すフローチャートである。図２２のフローチャートにおいて、まず、情報処理装置１０１は、検索ワードの入力を受け付けたか否かを判断する（ステップＳ２２０１）。ここで、情報処理装置１０１は、検索ワードの入力を受け付けるのを待つ（ステップＳ２２０１：Ｎｏ）。

そして、情報処理装置１０１は、検索ワードの入力を受け付けた場合（ステップＳ２２０１：Ｙｅｓ）、検索ワードを形態素解析する（ステップＳ２２０２）。つぎに、情報処理装置１０１は、検索ワードを形態素解析した結果に基づいて、ＦＡＱマスタ２２０からＦＡＱを検索する（ステップＳ２２０３）。

つぎに、情報処理装置１０１は、教師データ（よゐこ）ＤＢ２４０を参照して、ナイーブベイズ分類器による機械学習を行って、検索された複数のＦＡＱそれぞれについて、第１の確率を算出する（ステップＳ２２０４）。つぎに、情報処理装置１０１は、教師データ（わるいこ）ＤＢ２５０を参照して、ナイーブベイズ分類器による機械学習を行って、検索された複数のＦＡＱそれぞれについて、第２の確率を算出する（ステップＳ２２０５）。

そして、情報処理装置１０１は、検索された複数のＦＡＱそれぞれについて算出した第１の確率と第２の確率とに基づいて、検索された複数のＦＡＱの中から、検索ワードに対する１または複数のＦＡＱを決定する（ステップＳ２２０６）。

つぎに、情報処理装置１０１は、検索ワードに対応するＦＡＱがあるか否かを判断する（ステップＳ２２０７）。具体的には、例えば、情報処理装置１０１は、ステップＳ２２０３においてＦＡＱが１件も検索されなかった場合、または、ステップＳ２２０６においてＦＡＱが１件も決定されなかった場合に、検索ワードに対応するＦＡＱがないと判定する。

ここで、検索ワードに対応するＦＡＱがある場合（ステップＳ２２０７：Ｙｅｓ）、情報処理装置１０１は、決定した検索ワードに対する１または複数のＦＡＱを出力して（ステップＳ２２０８）、本フローチャートによる一連の処理を終了する。一方、検索ワードに対応するＦＡＱがない場合（ステップＳ２２０７：Ｎｏ）、情報処理装置１０１は、図２３に示すステップＳ２３０１に移行する。

図２３のフローチャートにおいて、まず、情報処理装置１０１は、教師データ（まいご）ＤＢ２６０を参照して、ナイーブベイズ分類器による機械学習を行って、複数の代替ワードそれぞれについて、検索ワードに後続して入力される第３の確率を算出する（ステップＳ２３０１）。

そして、情報処理装置１０１は、複数の代替ワードそれぞれについて算出した第３の確率に基づいて、検索ワードに後続して入力される代替ワードを特定する（ステップＳ２３０２）。つぎに、情報処理装置１０１は、代替ワードが特定されたか否かを判断する（ステップＳ２３０３）。例えば、図２２に示したステップＳ２２０２において、検索ワードから形態素が検出されなかった場合に、代替ワードは特定されないことがある。

ここで、代替ワードが特定された場合（ステップＳ２３０３：Ｙｅｓ）、情報処理装置１０１は、図２２に示したステップＳ２２０２に戻る。この場合、情報処理装置１０１は、特定した代替ワードの形態素解析を実施する。

一方、代替ワードが特定されなかった場合（ステップＳ２３０３：Ｎｏ）、情報処理装置１０１は、教師データ（形態素）ＤＢ１９００を参照して、ナイーブベイズ分類器による機械学習を行って、複数の形態素それぞれについて、第４の確率を算出する（ステップＳ２３０４）。第４の確率は、検索ワードに類似する度合いの高さを示す。

そして、情報処理装置１０１は、複数の形態素それぞれについて算出した第４の確率に基づいて、検索ワードに対応する形態素を特定して（ステップＳ２３０５）、図２２に示したステップＳ２２０３に戻る。この場合、情報処理装置１０１は、特定した形態素に基づいて、ＦＡＱマスタ２２０からＦＡＱを検索する。

なお、ステップＳ２２０３において、ＦＡＱが１件も検索されなかった場合、情報処理装置１０１は、ステップＳ２３０４に移行することにしてもよい。また、ステップＳ２３０５からステップＳ２２０３への移行は、２回以上行わないこととする。このため、移行後のステップＳ２２０７において、検索ワードに対応するＦＡＱがない場合には（ステップＳ２２０７：Ｎｏ）、情報処理装置１０１は、例えば、検索結果が０件である旨の情報を出力する。

これにより、過去のユーザの操作履歴（アクセスログ）をもとに、検索ワードに対して表示するＦＡＱを最適化することができる。また、検索ワードに対応するＦＡＱがなくても、過去のユーザの操作履歴をもとに、その検索ワード、すなわち、０件ヒット検索ワードに置き換わる代替ワードを推定してＦＡＱを出力することができる。

以上説明したように、実施の形態にかかる情報処理装置１０１によれば、受け付けた検索ワードに対応するＦＡＱがない場合、教師データ（まいご）を記憶する記憶部１０１０の記憶内容に基づく機械学習を行って、当該検索ワードに後続して入力される代替ワードを特定し、特定した代替ワードに対応するＦＡＱを出力することができる。教師データ（まいご）は、検索ワードに対応するＦＡＱがないときに後続して入力を受け付けた他の検索ワードを、当該検索ワードに対応付けた情報である。他の検索ワードは、例えば、他の検索ワードに対して１ページ目（上位所定数Ｎ）に表示されたいずれかのＦＡＱが選択された検索ワードである。

これにより、入力された検索ワードに対応するＦＡＱがなくても、過去のユーザの操作履歴（アクセスログ）をもとに、その検索ワード、すなわち、０件ヒット検索ワードに置き換わる代替ワードを推定してＦＡＱを出力することができる。このため、商品やサービスの名称変更等にＦＡＱの見直し作業が追随できないような状況下や、検索時にタイプミスや変換ミスが生じた場合でも、問題解決につながるような適切なＦＡＱを表示することができる。

また、情報処理装置１０１によれば、記憶部１０１０を参照して、ナイーブベイズ分類器による機械学習を行って、教師データ（まいご）から特定される他の検索ワード（代替ワード）それぞれについて、第３の確率を算出することができる。第３の確率は、検索ワード（０件ヒット検索ワード）に後続して入力される確率である。そして、情報処理装置１０１によれば、他の検索ワードそれぞれについて算出した第３の確率に基づいて、検索ワード（０件ヒット検索ワード）に後続して入力される代替ワードを特定することができる。

これにより、問題解決につながるようなＦＡＱを得られるような代替ワードを精度よく推定することができる。また、ナイーブベイズ分類器による機械学習を利用することで、教師データ（まいご）の質と量により代替ワードの推定精度をコントロールすることができる。

また、情報処理装置１０１によれば、代替ワードが特定されなかった場合、教師データ（形態素）ＤＢ１９００の記憶内容に基づく機械学習を行って、検索ワードに対応する形態素を特定し、特定した形態素に対応するＦＡＱを出力することができる。

これにより、教師データ（まいご）が蓄積されるまでの間に、０件ヒット検索ワードが入力されても、当該０件ヒット検索ワードに関連する形態素を推定して、当該形態素に対応するＦＡＱを、検索ワードに対応するＦＡＱとして表示することができる。このため、教師データ（まいご）が蓄積されるまでの間に、パンチミス等によりデタラメな検索ワードが入力された場合であっても、検索ワードに関連するＦＡＱを表示することができる。

これらのことから、情報処理装置１０１によれば、ＦＡＱシステムやＦＡＱサイトにおける一次回答率や顧客満足度の向上を図ることができる。また、ＦＡＱを見直すことなく適切な検索結果を得ることができるため、ＦＡＱシステムやＦＡＱサイトの運用コストを削減することができる。

なお、本実施の形態で説明した回答出力方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本回答出力プログラムは、ハードディスク、フレキシブルディスク、ＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）－ＲＯＭ、ＭＯ（Ｍａｇｎｅｔｏ－Ｏｐｔｉｃａｌｄｉｓｋ）、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本回答出力プログラムは、インターネット等のネットワークを介して配布してもよい。

上述した実施の形態に関し、さらに以下の付記を開示する。

（付記１）第１の質問の入力を受け付け、
受け付けた前記第１の質問に対応する回答候補がない場合、質問に対応する回答候補がないときに後続して入力を受け付けた他の質問であって、前記他の質問に対して表示されたいずれかの回答候補が選択された前記他の質問を、前記質問と対応付けて記憶する記憶部の記憶内容に基づく機械学習を行って、前記第１の質問に後続して入力される第２の質問を特定し、
特定した前記第２の質問に対応する回答候補を出力する、
処理をコンピュータに実行させることを特徴とする回答出力プログラム。

（付記２）前記特定する処理は、
前記記憶部を参照して、ナイーブベイズ分類器による機械学習を行って、前記他の質問それぞれについて、前記第１の質問に後続して入力される確率を算出し、
前記他の質問それぞれについて算出した前記確率に基づいて、前記第１の質問に後続して入力される第２の質問を特定する、ことを特徴とする付記１に記載の回答出力プログラム。

（付記３）前記他の質問は、質問に対応する回答候補がないときに後続して入力を受け付けた他の質問であって、前記他の質問に対する上位所定数の回答候補のいずれかが選択された質問である、ことを特徴とする付記１または２に記載の回答出力プログラム。

（付記４）前記第２の質問が特定されなかった場合、質問を形態素解析して検出された形態素と、前記形態素に含まれるそれぞれの要素とを対応付けて記憶する第２の記憶部の記憶内容に基づく機械学習を行って、前記第１の質問に対応する形態素を特定し、
特定した前記形態素に対応する回答候補を出力する、
処理を前記コンピュータに実行させることを特徴とする付記１～３のいずれか一つに記載の回答出力プログラム。

（付記５）前記回答候補は、ＦＡＱ（ＦｒｅｑｕｅｎｔｌｙＡｓｋｅｄＱｕｅｓｔｉｏｎ）である、ことを特徴とする付記１～４のいずれか一つに記載の回答出力プログラム。

（付記６）前記特定する処理は、
前記他の質問のうち前記確率が最大の質問を、前記第１の質問に後続して入力される第２の質問として特定する、ことを特徴とする付記１～５のいずれか一つに記載の回答出力プログラム。

（付記７）第１の質問の入力を受け付け、
受け付けた前記第１の質問に対応する回答候補がない場合、質問に対応する回答候補がないときに後続して入力を受け付けた他の質問であって、前記他の質問に対して表示されたいずれかの回答候補が選択された前記他の質問を、前記質問と対応付けて記憶する記憶部の記憶内容に基づく機械学習を行って、前記第１の質問に後続して入力される第２の質問を特定し、
特定した前記第２の質問に対応する回答候補を出力する、
処理をコンピュータが実行することを特徴とする回答出力方法。

（付記８）第１の質問の入力を受け付け、
受け付けた前記第１の質問に対応する回答候補がない場合、質問に対応する回答候補がないときに後続して入力を受け付けた他の質問であって、前記他の質問に対して表示されたいずれかの回答候補が選択された前記他の質問を、前記質問と対応付けて記憶する記憶部の記憶内容に基づく機械学習を行って、前記第１の質問に後続して入力される第２の質問を特定し、
特定した前記第２の質問に対応する回答候補を出力する、
制御部を有することを特徴とする情報処理装置。

１０１情報処理装置
１１０，１０１０記憶部
２００回答出力システム
２０１端末
２１０ネットワーク
２２０ＦＡＱマスタ
２３０アクセスログＤＢ
２４０教師データ（よゐこ）ＤＢ
２５０教師データ（わるいこ）ＤＢ
２６０教師データ（まいご）ＤＢ
３００バス
３０１ＣＰＵ
３０２メモリ
３０３Ｉ／Ｆ
３０４ディスクドライブ
３０５ディスク
９００ＦＡＱ画面
１００１受付部
１００２検索部
１００３決定部
１００４出力制御部
１００５生成部
１００６判定部
１００７特定部
１１０１，１１０２，１１０３，１３０１，１３０２，１３０３，１３０４，１７０１，１７０２，１７０３，１７０４，１７０５アクセスログ
１５００分析ＤＢ
１９００教師データ（形態素）ＤＢ

Claims

第１の質問の入力を受け付け、
受け付けた前記第１の質問に対応する回答候補がない場合、前記第１の質問に対応する回答候補がないときに後続して入力を受け付けた他の質問であって、前記他の質問に対して表示されたいずれかの回答候補が選択された前記他の質問を、前記第１の質問と対応付けて記憶する記憶部の記憶内容に基づく機械学習を行って、前記第１の質問に後続して入力される第２の質問を特定し、
特定した前記第２の質問に対応する回答候補を出力する、処理をコンピュータに実行させ、
前記特定する処理は、
前記記憶部を参照して、ナイーブベイズ分類器による機械学習を行って、前記他の質問それぞれについて、前記第１の質問に後続して入力される確率を算出し、
前記他の質問それぞれについて算出した前記確率に基づいて、前記第１の質問に後続して入力される前記第２の質問を特定する、
ことを特徴とする回答出力プログラム。
前記他の質問は、質問に対応する回答候補がないときに後続して入力を受け付けた他の質問であって、前記他の質問に対する上位所定数の回答候補のいずれかが選択された質問である、ことを特徴とする請求項１に記載の回答出力プログラム。
前記第２の質問が特定されなかった場合、質問を形態素解析して検出された形態素と、前記形態素に含まれるそれぞれの要素とを対応付けて記憶する第２の記憶部の記憶内容に基づく機械学習を行って、前記第１の質問に対応する形態素を特定し、
特定した前記形態素に対応する回答候補を出力する、
処理を前記コンピュータに実行させることを特徴とする請求項１または２に記載の回答出力プログラム。
第１の質問の入力を受け付け、
受け付けた前記第１の質問に対応する回答候補がない場合、前記第１の質問に対応する回答候補がないときに後続して入力を受け付けた他の質問であって、前記他の質問に対して表示されたいずれかの回答候補が選択された前記他の質問を、前記第１の質問と対応付けて記憶する記憶部の記憶内容に基づく機械学習を行って、前記第１の質問に後続して入力される第２の質問を特定し、
特定した前記第２の質問に対応する回答候補を出力する、処理をコンピュータが実行し、
前記特定する処理は、
前記記憶部を参照して、ナイーブベイズ分類器による機械学習を行って、前記他の質問それぞれについて、前記第１の質問に後続して入力される確率を算出し、
前記他の質問それぞれについて算出した前記確率に基づいて、前記第１の質問に後続して入力される前記第２の質問を特定する、
ことを特徴とする回答出力方法。
第１の質問の入力を受け付け、
受け付けた前記第１の質問に対応する回答候補がない場合、前記第１の質問に対応する回答候補がないときに後続して入力を受け付けた他の質問であって、前記他の質問に対して表示されたいずれかの回答候補が選択された前記他の質問を、前記第１の質問と対応付けて記憶する記憶部の記憶内容に基づく機械学習を行って、前記第１の質問に後続して入力される第２の質問を特定し、
特定した前記第２の質問に対応する回答候補を出力する、制御部を有し、
前記制御部は、前記特定する処理で、前記記憶部を参照して、ナイーブベイズ分類器による機械学習を行って、前記他の質問それぞれについて、前記第１の質問に後続して入力される確率を算出し、
前記他の質問それぞれについて算出した前記確率に基づいて、前記第１の質問に後続して入力される前記第２の質問を特定する、
ことを特徴とする情報処理装置。