WO2023170810A1

WO2023170810A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2023170810A1
Application number: PCT/JP2022/010237
Authority: WO
Inventors: 康佑秋元; 邦紘竹岡
Original assignee: 日本電気株式会社
Priority date: 2022-03-09
Filing date: 2022-03-09
Publication date: 2023-09-14

Abstract

質問応答システムの学習に適切な質問と正答とのペアを提供するために、情報処理装置（１）は、判定対象の質問と正答とのペアである対象ペアを取得する取得部（１１）と、取得部（１１）が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行う判定部（１２）と、を備えている。

Description

情報処理装置、情報処理方法、およびプログラム

　本発明は、情報処理装置、情報処理方法、およびプログラムに関する。

　入力された質問に対する正答を出力する質問応答システムを学習させるために、教師データとなる質問と当該質問に対する正答とのペアを自動的に生成する技術が開示されている。

　特許文献１には、複数のラベルなしの質問および正答のペアから、学習効果の高いペアを選択するActive Learningに関する技術が開示されている。特許文献１の技術では、複数のラベルなしのペアを特徴量空間上にて分類し、個々の質問に対する損失関数の値を使って、分類されたペアから特徴的なペアを選択する構成が開示されている。

米国特許出願公開２０１６／０２５３５９６号明細書

　しかしながら、特許文献１の技術では、特徴的なペアを選択するために個々の質問に対する損失関数の値を使っている。一般的に、損失関数の値の算出には、ペアの特徴量への変換や機械学習により学習されたモデルによる処理などといった複雑な処理が含まれている。そのため、入力されるペアによっては、算出後の損失関数の値が設計者にとって意図しない結果となる場合がある。すなわち、特許文献１の技術では、損失関数の値の算出結果が意図しない結果となっていた場合に、当該結果を用いて特徴的なペアが選択されるため、学習効果の低いペアも選択される可能性があるという問題があった。

　本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的の一例は、質問応答システムの学習に適切な質問と正答とのペアを提供することにある。

　本発明の一側面に係る情報処理装置は、判定対象の質問と正答とのペアである対象ペアを取得する取得手段と、前記取得手段が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行う判定手段と、を備える。

　本発明の一側面に係る情報処理方法は、情報処理装置が、判定対象の質問と正答とのペアである対象ペアを取得することと、前記取得することにおいて取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行うことと、を含む。

　本発明の一側面に係るプログラムは、コンピュータを情報処理装置として機能させるプログラムであって、前記プログラムは、前記コンピュータを、判定対象の質問と正答とのペアである対象ペアを取得する取得手段と、前記取得手段が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行う判定手段と、として機能させる。

　本発明の一態様によれば、質問応答システムの学習に適切な質問と正答とのペアを提供することができる。

本発明の例示的実施形態１に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態１における対象ペアおよび類似ペアの一例を示す概念図である。本発明の例示的実施形態１に係る情報処理方法の流れを示すフロー図である。本発明の例示的実施形態２に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態２に係る情報処理装置が実行する処理の一例を示す図である。本発明の例示的実施形態３に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態３に係る本例示的実施形態に係る情報処理装置が実行する処理の一例を示す図である。本発明の例示的実施形態４に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態４に係る情報処理装置が表示する表示内容の一例を示す図である。本発明の各例示的実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。

　〔例示的実施形態１〕
　本発明の第１の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。

　（情報処理装置１の概要）
　本例示的実施形態に係る情報処理装置１は、質問応答システムの学習に用いられる質問および正答のペアの適切さを判定する装置である。

　質問応答システムとは、入力された質問に対する正答を出力するシステムである。質問応答システムは、一例として、質問と正答とをペアとする教師データによって学習済の学習モデルである。

　質問応答システムの具体的構成は限定されないが、一例として、ＣＮＮ（Convolution Neural Network）、ＲＮＮ（Recurrent Neural Network）、Ｔｒａｎｓｆｏｒｍｅｒ、またはそれらの組み合わせを用いることができる。また、ランダムフォレストやサポートベクターマシンのような非ニューラルネットワーク型のモデルを用いてもよい。

　質問応答システムの学習に用いられる質問と正答とのペアの適切さの一例として、質問応答システムの学習における当該質問と正答とのペアの有益さが挙げられる。ここで、有益であるかどうかは、同じ質問と正答とのペアであっても、質問応答システム毎に異なる場合がある。一例として、ある質問と正答とのペアが、ある質問応答システムでは学習済の教師データに含まれる場合、当該ある質問と正答とのペアは、当該ある質問応答システムにとって有益ではない。一方で、当該ある質問と正答とのペアが、ある質問応答システムとは異なる他の質問応答システムでは学習済の教師データに含まれない場合、当該ある質問と正答とのペアは当該他の質問応答システムにとって有益である。

　また、質問応答システムの学習に用いられる質問と正答とのペアの適切さの他の例として、ＦＡＱ（Frequently Asked Question）に用いられる質問と正答とのペアのように、質問に対する正答の主観的適切さ（当該分野の専門家が見て適切か否か）が挙げられる。

　一方、質問応答システムの学習に用いられる質問と正答とのペアに不適切な例として、質問の内容が解釈できない、質問が文法的に質問の形になっていない、および質問に対する正答が正しくない、などが挙げられる。

　（情報処理装置１の構成）
　本例示的実施形態に係る情報処理装置１の構成について、図１を参照して説明する。図１は、本例示的実施形態に係る情報処理装置１の構成を示すブロック図である。

　情報処理装置１は、図１に示すように、取得部１１および判定部１２を備えている。取得部１１および判定部１２は、本例示的実施形態において、それぞれ取得手段および判定手段を実現する構成である。

　取得部１１は、判定対象の質問と正答とのペアである対象ペアを取得する。取得部１１は、取得した対象ペアを判定部１２に供給する。

　判定部１２は、取得部１１が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行う。

　対象ペアに類似する１又は複数の類似ペアの一例として、対象ペアの質問と類似する質問を含むペア、対象ペアの正答と類似する正答を含むペア、または対象ペアの質問および正答と類似する質問および正答を含むペアが挙げられる。

　一例として、判定部１２は、対象ペアの質問と類似する質問を含む類似ペアの質問の適切さを示す情報を参照して、対象ペアの適切さの判定を行う。他の例として、判定部１２は、対象ペアの正答と類似する正答を含む類似ペアの正答の適切さを示す情報を参照して、対象ペアの適切さの判定を行う。さらに他の例として、判定部１２は、対象ペアの質問および正答と類似する質問および正答を含む類似ペアの質問および正答の適切さを示す情報を参照して、対象ペアの適切さの判定を行う。

　また、対象ペアに類似する１又は複数の類似ペアの一例について、図２を参照して説明する。図２は、本例示的実施形態における対象ペアおよび類似ペアの一例を示す概念図である。

　図２に示す例では、判定部１２は、各質問ｑ１～質問ｑ６と各正答ａ１～正答ａ６との各ペアＳＰ１～ペアＳＰ６が位置付けられている特徴空間に、質問Ｑと正答Ａとの対象ペアＴＰを位置付ける。判定部１２は、一例として、特徴空間における各ペアＳＰ１～ペアＳＰ６と対象ペアＴＰとの距離を類似度として、対象ペアＴＰとの距離が所定の距離よりも近いペアを、類似ペアとして特定する。図２に示す図では、判定部１２は、対象ペアＴＰから所定の距離の類似領域ＳＲに含まれる類似ペアＳＰ１、類似ペアＳＰ２、および類似ペアＳＰ３を特定する。

　図２に示す図では、類似ペアＳＰ１、類似ペアＳＰ２、および類似ペアＳＰ３のそれぞれに含まれる質問ｑ１～質問ｑ３と正答ａ１～正答ａ３との少なくとも何れかの適切さを示す情報は、スコアｓ１、スコアｓ２、およびスコアｓ３である。判定部１２は、一例として、スコアｓ１、スコアｓ２、およびスコアｓ３を参照して、対象ペアＴＰの適切さを判定する。

　以上のように、本例示的実施形態に係る情報処理装置１においては、判定対象の質問と正答とのペアである対象ペアを取得する取得部１１と、取得部１１が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、対象ペアの適切さの判定を行う判定部１２とを備える構成が採用されている。

　このため、本例示的実施形態に係る情報処理装置１によれば、対象ペアに類似する類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、対象ペアの適切さを判定するので、対象ペアのみを参照して適切さを判定する場合に比べて、不適切な対象ペアを適切であると判定する可能性が低くなる。

　より具体的な例として、個々の質問に対する損失関数の値を使って対象ペアの適切さを判定する場合、損失関数の値は複雑な処理によって算出されるため、意図しない値が算出される場合がある。当該構成では、不適切な対象ペアを適切であると判定する可能性が高くなる。

　一方、本例示的実施形態に係る情報処理装置１によれば、対象ペアのみではなく、対象ペアに類似する類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して対象ペアの適切さを判定するので、質問応答システムの学習に適切な質問と正答とのペアを提供することができる。

　（情報処理方法Ｓ１の流れ）
　本例示的実施形態に係る情報処理方法Ｓ１の流れについて、図３を参照して説明する。図３は、本例示的実施形態に係る情報処理方法Ｓ１の流れを示すフロー図である。

　（ステップＳ１１）
　ステップＳ１１において、取得部１１は、判定対象の質問と正答とのペアである対象ペアを取得する。取得部１１は、取得した対象ペアを、判定部１２に供給する。

　（ステップＳ１２）
　ステップＳ１２において、判定部１２は、ステップＳ１１において取得部１１が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、対象ペアの適切さの判定を行う。

　以上のように、本例示的実施形態に係る情報処理方法Ｓ１においては、ステップＳ１１において取得部１１が、判定対象の質問と正答とのペアである対象ペアを取得し、ステップＳ１２において判定部１２が、ステップＳ１１において取得された対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、対象ペアの適切さの判定を行うことを含む構成が採用されている。このため、本例示的実施形態に係る情報処理方法Ｓ１によれば、上述した情報処理装置１と同様の効果が得られる。

　〔例示的実施形態２〕
　本発明の第２の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態１にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を適宜省略する。

　（情報処理装置１Ａの構成）
　本例示的実施形態に係る情報処理装置１Ａの構成について、図４を参照して説明する。図４は、本例示的実施形態に係る情報処理装置１Ａの構成を示すブロック図である。

　情報処理装置１Ａは、図４に示すように、制御部１０Ａ、データベース２０Ａ、入出力部３０Ａ、および通信部４０Ａを備えている。

　データベース２０Ａには、制御部１０Ａが参照するデータが格納されている。一例として、データベース２０Ａには、図４に示すように、質問と正答とのペアＰと、ペアＰの適切さを示す情報の一例であるスコアＳとが関連付けて格納される。また、他の例として、データベース２０Ａには、図４に示すように、制御部１０Ａによって適切さを判定された判定済みの判定済ペアＤＰが格納される。

　ここで、質問および正答のペアＰの適切さを示す情報の一例であるスコアＳは、実数で表されてもよいし、離散的な値を取るカテゴリ値であってもよい。情報処理装置１ＡがスコアＳを取得する処理については、後述する。

　入出力部３０Ａは、データを取得または出力するためのインタフェースである。入出力部３０Ａは、取得したデータを制御部１０Ａに供給したり、制御部１０Ａから供給されたデータを出力したりする。入出力部３０Ａの一例として、データを取得するためのタッチパッド、キーボード、およびデータを出力するための表示装置が挙げられる。

　通信部４０Ａは、図示しないネットワークを介して他の装置と通信する通信モジュールである。一例として、通信部４０Ａは、制御部１０Ａから供給されたデータを、ネットワークを介して他の装置に出力したり、他の装置から出力されたデータを、ネットワークを介して取得し、制御部１０Ａに供給したりする。

　通信部４０Ａが他の装置と通信するために介するネットワークの具体的構成は本実施形態を限定するものではないが、一例として、無線ＬＡＮ（Local Area Network）、有線ＬＡＮ、ＷＡＮ（Wide Area Network）、公衆回線網、モバイルデータ通信網、または、これらのネットワークの組み合わせを用いることができる。

　（制御部１０Ａの機能）
　制御部１０Ａは、情報処理装置１Ａの各構成要素を制御する。制御部１０Ａは、図４に示すように、取得部１１および判定部１２としても機能する。取得部１１および判定部１２は、本例示的実施形態において、それぞれ取得手段および判定手段を実現する構成である。

　判定部１２は、取得部１１が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、対象ペアの適切さの判定を行う。判定部１２は、判定済ペアＤＰを、データベース２０Ａに格納する。

　ここで、類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報の一例として、類似ペアを質問応答システムの学習に利用する場合の有益さを示す情報が挙げられる。この場合、判定部１２は、対象ペアの適切さとして、対象ペアを質問応答システムの学習に利用する場合の有益さを判定する。当該構成により、判定部１２は、質問応答システムの学習に有益な質問および正答のペアを提供することができる。

　また、類似ペアを質問応答システムの学習に利用する場合の有益さの一例として、当該類似ペアを質問応答システムの学習に追加で利用することによって、より高い性能の質問応答システムが得られやすくなるかどうかが挙げられる。

　ここで、類似ペアの適切さを示す情報は、ユーザから取得する構成であってもよいし、所定のアルゴリズムによって算出されたものを用いてもよい。また、後述する、情報処理装置１ＡがスコアＳを取得する処理の一例として記載した処理を用いてもよい。

　また、類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報の他の例として、質問に対する正答の主観的適切さ（当該分野の専門家が見て適切か否か）を示す情報が挙げられる。

　また、判定部１２は、図４に示すように、検索部１２１および評価部１２２としても機能する。検索部１２１および評価部１２２は、本例示的実施形態において、それぞれ検索手段および評価手段を実現する構成である。

　検索部１２１は、質問と正答との複数のペアＰと、当該複数のペアＰの各々についての適切さを示す情報としてのスコアＳとが格納されたデータベース２０Ａを参照して、対象ペアとの類似度が所定の度合い以上である１又は複数の類似ペアを検索する。検索部１２１が類似ペアを検索する処理の一例については、後述する。

　評価部１２２は、検索部１２１が検索した類似ペアの各々についての適切さを示す情報としてのスコアＳから、対象ペアの適切さを評価する。評価部１２２が対象ペアの適切さを評価する処理の一例については、後述する。

　（情報処理装置１ＡがペアＰのスコアＳを取得する処理の一例）
　情報処理装置１ＡがペアＰのスコアＳを取得する処理の一例について、以下に説明する。

　情報処理装置１ＡがペアＰのスコアＳを取得する処理の一例として、情報処理装置１Ａは、入出力部３０Ａを介してスコアＳをユーザから取得する構成であってもよい。例えば、情報処理装置１Ａは、入出力部３０Ａを介して、ペアＰのスコアＳの入力をユーザに促す画像を出力し、当該画像に対するユーザの入力を取得してもよい。

　また、情報処理装置１ＡがペアＰのスコアＳを取得する処理の他の例として、情報処理装置１Ａは、ルールベースプログラムを使用する構成であってもよい。ルールベースプログラムの一例として、予め定められた単語が質問および正答の少なくとも何れかに含まれているか否かに応じてスコアＳを算出するルールベースプログラムが挙げられる。例えば、情報処理装置１Ａは、当該ルールベースプログラムにペアＰの質問および正答の少なくとも何れかを入力し、算出されたスコアＳを取得する構成であってもよい。

　また、情報処理装置１ＡがペアＰのスコアＳを取得する処理のさらに他の例として、情報処理装置１Ａは、既存の質問応答システムを使用する構成であってもよい。例えば、情報処理装置１Ａは、既存の質問応答システムに、ペアＰの質問を入力し、当該質問応答システムから出力される正答がペアＰの正答と一致する度合いを、スコアＳとして取得する構成であってもよい。当該構成において、情報処理装置１Ａはさらに、質問応答システムから出力される正答の確信度に応じたスコアＳを取得してもよい。例えば、情報処理装置１Ａは、質問応答システムから出力される正答の確信度が高い程、高いスコアＳを取得する構成であってもよい。

　また、情報処理装置１ＡがペアＰのスコアＳを取得する処理のさらに他の例として、ペアＰを入力として、ペアＰのスコアＳを出力する予測モデルを使用する構成であってもよい。当該構成において、情報処理装置１Ａは、ペアＰを予測モデルに入力し、予測モデルから出力されたスコアＳを取得する構成であってもよい。

　（検索部１２１が類似ペアを検索する処理の一例）
　検索部１２１が類似ペアを検索する処理の一例について、以下に説明する。

　検索部１２１は、一例として、複数のペアから１又は複数の類似ペアを検索するために、当該複数のペアと対象ペアとの類似度を参照してもよい。一例として、検索部１２１は、類似度を算出する類似度算出手段としても機能する構成であってもよいし、他の装置によって算出された類似度を参照する構成であってもよい。

　検索部１２１が類似度算出手段としても機能する場合、検索部１２１がペアＰと対象ペアとの類似度を算出する処理の一例について、以下に説明する。

　検索部１２１がペアＰと対象ペアとの類似度を算出する処理の一例として、ペアＰの質問または正答に含まれる文字列と、対象ペアの質問または正答に含まれる文字列とにおいて、一致する文字列の数を、対象ペアとペアＰとの類似度として算出する構成が挙げられる。当該構成では、検索部１２１は、類似度が所定の度合い以上（例えば、一致する文字列が５つ以上）のペアＰを、類似ペアであると特定する。換言すると、当該構成では、検索部１２１は、対象ペアの質問または正答に含まれる文字列と一致する文字列の多い質問または正答を含む類似ペアを検索する。

　検索部１２１がペアＰと対象ペアとの類似度を算出する処理の他の例として、複数の質問および正答のペアを入力として、当該複数の質問および正答のペアの間の類似度を出力する類似度予測モデルを使用する構成が挙げられる。具体的には、検索部１２１は、対象ペアおよびペアＰを類似度予測モデルに入力して、出力された類似度を取得する構成であってもよい。検索部１２１が使用する類似度予測モデルとして既知の学習モデルを用いることができ、一例として、既知の自然言語処理モデルが挙げられる。

　検索部１２１が類似度予測モデルを使用する場合、検索部１２１は、２つのペアと、当該２つのペアの類似度との組を複数含む教師データを用いて、類似度予測モデルを学習させる類似度予測モデル学習手段としても機能する構成であってもよい。

　また、検索部１２１がペアＰと対象ペアとの類似度を算出する処理のさらに他の例として、図２を参照して説明したように、検索部１２１は、特徴空間における対象ペアとペアＰとの距離を、類似度として算出してもよい。当該構成では、検索部１２１は、類似度が所定の度合い以上（例えば、特徴空間における対象ペアとペアＰとの距離が所定の距離以下）のペアＰを、類似ペアであると特定する。

　（評価部１２２が対象ペアの適切さを評価する評価処理の一例）
　評価部１２２が対象ペアの適切さを評価する評価処理の一例について、以下に説明する。

　評価部１２２が実行する評価処理の一例として、対象ペアおよび類似ペアのそれぞれの適切さを示す情報としてのスコアＳが所定の値以上の場合、評価部１２２は、対象ペアは適切であると評価してもよい。

　評価部１２２が実行する評価処理の他の例として、検索部１２１が検索した複数の類似ペアの各々についての適切さを示す情報としてのスコアＳの平均又は加重平均を取る処理が含まれていてもよい。

　例えば、評価部１２２は、複数の類似ペアのそれぞれのスコアＳの単純平均を算出する。そして、算出された単純平均が所定の値以上であった場合、評価部１２２は、対象ペアは適切であると評価してもよい。

　また、評価部１２２は、検索部１２１が参照した類似度を参照し、複数の類似ペアの類似度に応じた値を重み係数として、スコアＳの加重平均を算出してもよい。一例として、評価部１２２は、他の類似ペアより相対的に類似度の高い類似ペアに対しては大きい重み係数を設定し、他の類似ペアより相対的に類似度の低い類似ペアに対しては小さい重み係数を設定し、複数の類似ペアの加重平均を算出する。そして、算出された加重平均が所定の値以上であった場合、評価部１２２は、対象ペアは適切であると評価してもよい。

　このように、評価部１２２は、検索部１２１が検索した複数の類似ペアの各々についての適切さを示す情報としてのスコアＳの平均又は加重平均を取ることにより、対象ペアの適切さを適切に評価することができる。

　（情報処理装置１Ａが実行する処理の一例）
　情報処理装置１Ａが実行する処理の一例について、図５を参照して説明する。図５は、本例示的実施形態に係る情報処理装置１Ａが実行する処理の一例を示す図である。

　まず、取得部１１は、判定対象の質問と正答とのペアである対象ペアを取得する。一例として、取得部１１は、図５に示すように、質問「アメリカ合衆国の首都はどこ？」および正答「ワシントンＤ．Ｃ．」の対象ペアを取得する。取得部１１は、取得した対象ペアを判定部１２に供給する。

　判定部１２の検索部１２１は、データベース２０Ａを参照して、取得部１１から供給された対象ペアとの類似度が所定の度合い以上である１又は複数の類似ペアを検索する。そして、検索部１２１は、検索した１又は複数の類似ペアを、評価部１２２に供給する。一例として、検索部１２１は、図５に示すように、データベース２０Ａを参照して、類似ペアであるペア１およびペア２を検索する。検索部１２１が類似ペアを検索する処理については、上述した通りである。そして、検索部１２１は、検索したペア１およびペア２を、評価部１２２に供給する。

　評価部１２２は、検索部１２１から供給された類似ペアの各々についての適切さを示す情報から、対象ペアの適切さを評価する。一例として、評価部１２２は、図５に示すように、検索部１２１から供給された類似ペアであるペア１およびペア２の各々についての適切さを示す情報である適切度スコア「０」および「０．１」を取得する。そして、評価部１２２は、対象ペアの適切さを示す情報である適切度スコア「０．０５」を算出し、対象ペアの適切さを評価する。評価部１２２がスコアを取得する処理および適切さを評価する評価処理については、上述した通りである。

　（情報処理装置１Ａの効果）
　以上のように、本例示的実施形態に係る情報処理装置１Ａにおいては、質問と正答との複数のペアＰと、当該複数のペアＰの各々についての適切さを示す情報とが格納されたデータベース２０Ａを参照して、対象ペアとの類似度が所定の度合い以上である１又は複数の類似ペアを検索する検索部１２１と、検索部１２１が検索した類似ペアの各々についての適切さを示す情報から、対象ペアの適切さを評価する評価部１２２とを備える構成が採用されている。

　このため、本例示的実施形態に係る情報処理装置１Ａによれば、データベース２０Ａから対象ペアに類似する類似ペアを検索し、類似ペアの適切さを示す情報から、対象ペアの適切さを評価するので、対象ペアの適切さを示す情報のみを参照する場合に比べて、質問応答システムの学習に適切な質問と正答とのペアを提供することができる。

　〔例示的実施形態３〕
　本発明の第３の例示的実施形態について、図面を参照して詳細に説明する。なお、上述した例示的実施形態にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。

　（情報処理装置１Ｂの構成）
　本例示的実施形態に係る情報処理装置１Ｂの構成について、図６を参照して説明する。図６は、本例示的実施形態に係る情報処理装置１Ｂの構成を示すブロック図である。

　情報処理装置１Ｂは、図６に示すように、制御部１０Ｂ、データベース２０Ａ、入出力部３０Ａ、および通信部４０Ａを備えている。データベース２０Ａ、入出力部３０Ａ、および通信部４０Ａについては、上述した通りである。

　（制御部１０Ｂの機能）
　制御部１０Ｂは、情報処理装置１Ｂの各構成要素を制御する。制御部１０Ｂは、図６に示すように、取得部１１および判定部１２としても機能する。取得部１１および判定部１２は、本例示的実施形態において、それぞれ取得手段および判定手段を実現する構成である。

　また、判定部１２は、図６に示すように、予測部１２５および更新部１２６としても機能する。予測部１２５および更新部１２６は、本例示的実施形態において、それぞれ予測手段および更新手段を実現する構成である。

　予測部１２５は、質問と正答とのペアを入力とし、当該ペアの適切さを示す情報としてのスコアを出力する予測モデルを用いて、取得部１１から供給された対象ペアの適切さを予測する。予測部１２５が用いる予測モデルとして、既知の学習モデルを用いることができる。

　予測モデルの具体的構成は特に限定されないが、一例として、ＣＮＮ、ＲＮＮ、Ｔｒａｎｓｆｏｒｍｅｒ、またはそれらの組み合わせを用いることができる。また、ランダムフォレストやサポートベクターマシンのような非ニューラルネットワーク型のモデルを用いてもよい。

　更新部１２６は、質問と正答との複数のペアＰと、当該複数のペアＰの各々についての適切さを示す情報としてのスコアＳとが格納されたデータベース２０Ａを参照して、予測モデルのパラメータを更新する。換言すると、更新部１２６は、予測モデルにペアＰを予測モデルに入力したときに、予測モデルからスコアＳが出力されるように、予測モデルのパラメータを更新する。

　（情報処理装置１Ｂが実行する処理の一例）
　情報処理装置１Ｂが実行する処理の一例について、図７を参照して説明する。図７は、本例示的実施形態に係る情報処理装置１Ｂが実行する処理の一例を示す図である。

　まず、取得部１１は、判定対象の質問と正答とのペアである対象ペアを取得する。一例として、取得部１１は、図７に示すように、質問「アメリカ合衆国の首都はどこ？」および正答「ワシントンＤ．Ｃ．」の対象ペアを取得する。取得部１１は、取得した対象ペアを判定部１２に供給する。

　判定部１２の予測部１２５は、取得部１１から供給された対象ペアを予測モデルに入力し、対象ペアの適切さを示す情報としてのスコアを取得する。一例として、予測部１２５は、質問「アメリカ合衆国の首都はどこ？」および正答「ワシントンＤ．Ｃ．」の対象ペアを予測モデルに入力し、スコア「０．０５」を取得する。

　判定部１２が、データベース２０Ａを参照して対象ペアの適切さの判定を行う処理については、上述した通りである。

　また、判定部１２の更新部１２６は、質問と正答との複数のペアと、当該複数のペアの各々についての適切さを示す情報としてのスコアとが格納されたデータベース２０Ａを参照して、予測モデルのパラメータを更新する。一例として、更新部１２６は、ペア１～ペア１０と、ペア１～ペア１０の各々についての適切さを示す適切度スコアとが格納されたデータベース２０Ａを参照して、予測モデルのパラメータを更新する。

　（情報処理装置１Ｂの効果）
　以上のように、本例示的実施形態に係る情報処理装置１Ｂにおいては、質問と正答とのペアを入力とし、当該ペアの適切さを示す情報としてのスコアを出力する予測モデルを用いて、対象ペアの適切さを予測する予測部１２５と、質問と正答との複数のペアＰと、当該複数のペアＰの各々についての適切さを示す情報としてのスコアＳとが格納されたデータベース２０Ａを参照して、予測モデルのパラメータを更新する更新部１２６とを備える構成が採用されている。

　このため、本例示的実施形態に係る情報処理装置１Ｂによれば、上述した例示的実施形態に係る情報処理装置１および情報処理装置１Ａの奏する効果に加えて、質問と正答とのペアの適切さを示す情報を、適切に導出することができるという効果を奏する。

　〔例示的実施形態４〕
　本発明の第４の例示的実施形態について、図面を参照して詳細に説明する。なお、上述した実施形態にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。

　（情報処理システム１００の構成）
　本例示的実施形態に係る情報処理システム１００の構成について、図８を参照して説明する。図８は、本例示的実施形態に係る情報処理システム１００の構成を示すブロック図である。

　本例示的実施形態に係る情報処理システム１００は、図８に示すように、情報処理装置１Ｃおよび質問応答システム５０を含んで構成される。情報処理装置１Ｃおよび質問応答システム５０は、互いに通信可能に接続されている。

　情報処理システム１００では、入力された質問に対する正答を出力する質問応答システム５０を、情報処理装置１Ｃが学習させる構成である。また、情報処理装置１Ｃは、対象ペアと、判定した対象ペアの適切さを示す情報とを表示する。情報処理装置１Ｃが表示する表示内容の一例については、後述する。

　（質問応答システム５０）
　質問応答システム５０は、入力された質問に対する正答を出力するシステムである。質問応答システム５０の具体的構成は特に限定されないが、一例として、ＣＮＮ、ＲＮＮ、Ｔｒａｎｓｆｏｒｍｅｒ、またはそれらの組み合わせを用いることができる。また、ランダムフォレストやサポートベクターマシンのような非ニューラルネットワーク型のモデルを用いてもよい。

　（情報処理装置１Ｃの構成）
　情報処理装置１Ｃは、図８に示すように、制御部１０Ｃ、データベース２０Ａ、入出力部３０Ａ、および通信部４０Ａを備えている。データベース２０Ａ、入出力部３０Ａ、および通信部４０Ａについては、上述した通りである。入出力部３０Ａは、本例示的実施形態において、表示手段を実現する構成である。

　（制御部１０Ｃの機能）
　制御部１０Ｃは、情報処理装置１Ｃの構成要素を制御する。制御部１０Ｃは、図８に示すように、取得部１１、判定部１２、教師データ生成部１３、および学習部１４としても機能する。取得部１１、判定部１２、教師データ生成部１３、および学習部１４は、本実施形態において、それぞれ取得手段、判定手段、教師データ生成手段、および学習手段を実現する構成である。

　判定部１２は、取得部１１が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、対象ペアの適切さの判定を行う。判定部１２は、判定済ペアＤＰを、データベース２０Ａに格納する。また、判定部１２は、対象ペアと、判定した対象ペアの適切さを示す情報とを、入出力部３０Ａに供給する。

　ここで、判定部１２は、上述した実施形態における、検索部１２１および評価部１２２としても機能する構成であってもよいし、予測部１２５および更新部１２６としても機能する構成であってもよい。

　教師データ生成部１３は、判定部１２によって適切であると判定された対象ペアを含む教師データを生成する。一例として、教師データ生成部１３は、判定部１２によって適切であると判定された対象ペアに加えて、データベース２０Ａに格納されている質問および正答のペアＰのうち、関連付けられているスコアＳが所定の値以上のペアＰを、教師データに含めて生成してもよい。他の例として、教師データ生成部１３は、判定部１２によって適切であると判定された対象ペアに加えて、データベース２０Ａに格納されている判定済ペアＤＰのうち、適切であると判定された判定済ペアＤＰを教師データに含めて生成してもよい。

　学習部１４は、教師データ生成部１３によって生成された教師データを用いて、質問応答システム５０を学習させる。一例として、学習部１４は、通信部４０Ａを介して教師データを質問応答システム５０に出力することにより、質問応答システム５０を学習させる。

　（情報処理装置１Ｃが表示する表示内容の一例）
　情報処理装置１Ｃが表示する表示内容の一例について、図９を参照して説明する。図９は、本例示的実施形態に係る情報処理装置１Ｃが表示する表示内容の一例を示す図である。

　情報処理装置１Ｃの判定部１２は、対象ペアと、判定した対象ペアの適切さを示す情報とを、入出力部３０Ａに供給する。入出力部３０Ａは、判定部１２から取得した対象ペアと、判定した対象ペアの適切さを示す情報とを、出力する。

　一例として、入出力部３０Ａが画像を表示する表示装置である場合、入出力部３０Ａは、図９に示す表示内容を表示する。具体的には、入出力部３０Ａは、質問「アメリカ合衆国の首都はどこ？」および正答「ワシントンＤ．Ｃ．」の対象ペアと、当該対象ペアの適切さを示す情報である適切度「０．０５」を含む表示内容を表示する。

　さらに、入出力部３０Ａは、判定部１２が対象ペアの適切さを判定するときに参照した類似ペアおよび当該類似ペアの適切さを示す情報を取得した場合、当該類似ペアおよび類似ペアの適切さを示す情報を、表示内容に含める構成であってもよい。一例として、入出力部３０Ａは、図９に示すように、質問「日本の首都はどこ？」および正答「東京」の類似ペア１と、類似ペア１の適切さを示す情報である適切度スコア「０」と、質問「イギリスの首都はどこ？」および正答「ロンドン」の類似ペア２と、類似ペア２の適切さを示す情報である適切度スコア「０．１」とを含む表示内容を表示してもよい。

　（情報処理装置１Ｃの効果）
　以上のように、本例示的実施形態に係る情報処理装置１Ｃにおいては、判定部１２によって適切であると判定された対象ペアを含む教師データを生成する教師データ生成部１３と、教師データを用いて、質問応答システム５０を学習させる学習部１４とを備える構成が採用されている。

　このため、本例示的実施形態に係る情報処理装置１Ｃによれば、上述した例示的実施形態に係る情報処理装置１、情報処理装置１Ａ、および情報処理装置１Ｂの奏する効果に加えて、質問応答システム５０を適切な教師データを用いて学習させることができるという効果を奏する。

　また、本例示的実施形態に係る情報処理装置１Ｃにおいては、対象ペアと、判定部１２が判定した対象ペアの適切さを示す情報とを表示する入出力部３０Ａを備える構成が採用されている。このため、本例示的実施形態に係る情報処理装置１Ｃによれば、対象ペアおよび判定した対象ペアの適切さを示す情報を、ユーザに提示することができる。

　〔ソフトウェアによる実現例〕
　情報処理装置１、１Ａ、１Ｂ、１Ｃの一部又は全部の機能は、集積回路（ＩＣチップ）等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。

　後者の場合、情報処理装置１、１Ａ、１Ｂ、１Ｃは、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例（以下、コンピュータＣと記載する）を図１０に示す。コンピュータＣは、少なくとも１つのプロセッサＣ１と、少なくとも１つのメモリＣ２と、を備えている。メモリＣ２には、コンピュータＣを情報処理装置１、１Ａ、１Ｂ、１Ｃとして動作させるためのプログラムＰが記録されている。コンピュータＣにおいて、プロセッサＣ１は、プログラムＰをメモリＣ２から読み取って実行することにより、情報処理装置１、１Ａ、１Ｂ、１Ｃの各機能が実現される。

　プロセッサＣ１としては、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＭＰＵ（Micro Processing Unit）、ＦＰＵ（Floating point number Processing Unit）、ＰＰＵ（Physics Processing Unit）、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリＣ２としては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、又は、これらの組み合わせなどを用いることができる。

　なお、コンピュータＣは、プログラムＰを実行時に展開したり、各種データを一時的に記憶したりするためのＲＡＭ（Random Access Memory）を更に備えていてもよい。また、コンピュータＣは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータＣは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。

　また、プログラムＰは、コンピュータＣが読み取り可能な、一時的でない有形の記録媒体Ｍに記録することができる。このような記録媒体Ｍとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータＣは、このような記録媒体Ｍを介してプログラムＰを取得することができる。また、プログラムＰは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータＣは、このような伝送媒体を介してプログラムＰを取得することもできる。

　〔付記事項１〕
　本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。

　〔付記事項２〕
　上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。

　（付記１）
　判定対象の質問と正答とのペアである対象ペアを取得する取得手段と、前記取得手段が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行う判定手段と、を備える情報処理装置。

　（付記２）
　前記適切さを示す情報は、当該類似ペアを質問応答システムの学習に利用する場合の有益さを示す情報であり、前記判定手段は、前記対象ペアの適切さとして、当該対象ペアを質問応答システムの学習に利用する場合の有益さを判定する付記１に記載の情報処理装置。

　（付記３）
　前記判定手段は、質問と正答との複数のペアと、当該複数のペアの各々についての適切さを示す情報とが格納されたデータベースを参照して、前記対象ペアとの類似度が所定の度合い以上である１又は複数の前記類似ペアを検索する検索手段と、前記検索手段が検索した類似ペアの各々についての適切さを示す情報から、前記対象ペアの適切さを評価する評価手段とを備えている付記１又は２に記載の情報処理装置
　（付記４）
　前記評価手段による評価処理には、前記検索手段が検索した複数の類似ペアの各々についての適切さを示す情報としてのスコアの平均又は加重平均を取る処理が含まれる付記３に記載の情報処理装置。

　（付記５）
　前記判定手段は、質問と正答とのペアを入力とし、当該ペアの適切さを示す情報としてのスコアを出力する予測モデルを用いて、前記対象ペアの適切さを予測する予測手段を備えている付記１又は２に記載の情報処理装置。

　（付記６）
　前記判定手段は、質問と正答との複数のペアと、当該複数のペアの各々についての適切さを示す情報とが格納されたデータベースを参照して、前記予測モデルのパラメータを更新する更新手段を更に備えている付記５に記載の情報処理装置。

　（付記７）
　前記判定手段が適切と判定した対象ペアを含む教師データを生成する教師データ生成手段を更に備えている付記１から６の何れか１項に記載の情報処理装置。

　（付記８）
　前記教師データを用いて、質問応答システムを学習させる学習手段を備えている付記７に記載の情報処理装置。

　（付記９）
　前記対象ペアと、前記判定手段が判定した前記対象ペアの適切さを示す情報とを表示する表示手段を備えている付記１から８の何れか１項に記載の情報処理装置。

　（付記１０）
　情報処理装置が、判定対象の質問と正答とのペアである対象ペアを取得することと、前記取得することにおいて取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行うことと、を含む情報処理方法。

　（付記１１）
　コンピュータを情報処理装置として機能させるプログラムであって、前記プログラムは、前記コンピュータを、判定対象の質問と正答とのペアである対象ペアを取得する取得手段と、前記取得手段が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行う判定手段と、として機能させるプログラム。

　〔付記事項３〕
　上述した実施形態の一部又は全部は、更に、以下のように表現することもできる。

　少なくとも１つのプロセッサを備え、前記プロセッサは、判定対象の質問と正答とのペアである対象ペアを取得する取得処理と、前記取得処理において取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行う判定処理とを実行する情報処理装置。

　なお、この情報処理装置は、更にメモリを備えていてもよく、このメモリには、前記取得処理と、前記判定処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。

　１、１Ａ、１Ｂ、１Ｃ　情報処理装置
　１０Ａ、１０Ｂ、１０Ｃ　制御部
　１１　取得部
　１２　判定部
　１３　教師データ生成部
　１４　学習部
　１２１　検索部
　１２２　評価部
　１２５　予測部
　１２６　更新部

Claims

　判定対象の質問と正答とのペアである対象ペアを取得する取得手段と、
　前記取得手段が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行う判定手段と、
を備える情報処理装置。
　前記適切さを示す情報は、当該類似ペアを質問応答システムの学習に利用する場合の有益さを示す情報であり、
　前記判定手段は、前記対象ペアの適切さとして、当該対象ペアを質問応答システムの学習に利用する場合の有益さを判定する
請求項１に記載の情報処理装置。
　前記判定手段は、
　　質問と正答との複数のペアと、当該複数のペアの各々についての適切さを示す情報とが格納されたデータベースを参照して、前記対象ペアとの類似度が所定の度合い以上である１又は複数の前記類似ペアを検索する検索手段と、
　　前記検索手段が検索した類似ペアの各々についての適切さを示す情報から、前記対象ペアの適切さを評価する評価手段と
を備えている請求項１又は２に記載の情報処理装置。
　前記評価手段による評価処理には、
　　前記検索手段が検索した複数の類似ペアの各々についての適切さを示す情報としてのスコアの平均又は加重平均を取る処理が含まれる
請求項３に記載の情報処理装置。
　前記判定手段は、
　　質問と正答とのペアを入力とし、当該ペアの適切さを示す情報としてのスコアを出力する予測モデルを用いて、前記対象ペアの適切さを予測する予測手段
を備えている請求項１又は２に記載の情報処理装置。
　前記判定手段は、
　　質問と正答との複数のペアと、当該複数のペアの各々についての適切さを示す情報とが格納されたデータベースを参照して、前記予測モデルのパラメータを更新する更新手段
を更に備えている請求項５に記載の情報処理装置。
　前記判定手段が適切と判定した対象ペアを含む教師データを生成する教師データ生成手段を更に備えている請求項１から６の何れか１項に記載の情報処理装置。
　前記教師データを用いて、質問応答システムを学習させる学習手段を備えている
請求項７に記載の情報処理装置。
　前記対象ペアと、前記判定手段が判定した前記対象ペアの適切さを示す情報とを表示する表示手段を備えている
請求項１から８の何れか１項に記載の情報処理装置。
　情報処理装置が、
　判定対象の質問と正答とのペアである対象ペアを取得することと、
　前記取得することにおいて取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行うことと、
を含む情報処理方法。
　コンピュータを情報処理装置として機能させるプログラムであって、
　前記プログラムは、前記コンピュータを、
　判定対象の質問と正答とのペアである対象ペアを取得する取得手段と、
　前記取得手段が取得した対象ペアに類似する１又は複数の類似ペアに含まれる質問と正答との少なくとも何れかの適切さを示す情報を参照して、当該対象ペアの適切さの判定を行う判定手段と、
として機能させるプログラム。