WO2023223904A1

WO2023223904A1 - データ収集装置、学習装置、およびデータ収集方法

Info

Publication number: WO2023223904A1
Application number: PCT/JP2023/017530
Authority: WO
Inventors: 公朗百瀬
Original assignee: 株式会社アナリティックウェア
Priority date: 2022-05-17
Filing date: 2023-05-10
Publication date: 2023-11-23

Abstract

【課題】従来、大量の教師データを作成することが容易ではなかった。【解決手段】教師データを構成する元になる第一教師データ元情報が格納される元情報格納部１１２と、第一教師データ元情報を２以上の各ユーザ端末に送信する元情報送信部１４１と、第一教師データ元情報に対してユーザが入力した入力情報を含む第二教師データ元情報を、第一教師データ元情報に対応付く態様でユーザ端末２から受信する元情報受信部１２１と、第一教師データ元情報と第二教師データ元情報とを用いて、教師データを構成する教師データ構成部１３３と、教師データ構成部１３３が構成した教師データを蓄積する蓄積部１３４とを具備するデータ収集装置１により、機械学習の学習モデルを構築するための教師データを収集するためのプラットフォームを提供することにより、大量の教師データが収集可能となる。

Description

データ収集装置、学習装置、およびデータ収集方法

　本発明は、機械学習の学習モデルを作成するための教師データを収集するデータ収集装置等に関するものである。

　従来、画像に含まれるオブジェクトを予測したり、情報を分類したりする機械学習の技術があった（例えば、非特許文献１参照）。

"TensorFlow"、［online］、［令和４年４月３０日検索］、インターネット［URL：https://www.tensorflow.org/?hl=ja］

　しかしながら、従来技術においては、機械学習の学習モデルを構築するための教師データは、通常、大量に必要であり、その大量の教師データを作成したり、収集したりすることが容易ではなかった。

　本第一の発明のデータ収集装置は、機械学習の学習処理により学習モデルを構築するための教師データを構成する元になる第一教師データ元情報が格納される元情報格納部と、第一教師データ元情報を２以上の各ユーザ端末に送信する元情報送信部と、元情報送信部が送信し、ユーザ端末で処理された第一教師データ元情報に対してユーザが入力した入力情報を含む第二教師データ元情報を、第一教師データ元情報に対応付く態様でユーザ端末から受信する元情報受信部と、第一教師データ元情報と元情報受信部が受信した第二教師データ元情報とを用いて、機械学習の学習処理のために使用する教師データを構成する教師データ構成部と、教師データ構成部が構成した教師データを蓄積する蓄積部とを具備するデータ収集装置である。

　かかる構成により、機械学習の学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本第二の発明のデータ収集装置は、第一の発明に対して、第一教師データ元情報は、教師データを構成する要素情報を含み、第二教師データ元情報は、要素情報を識別するラベルであり、ユーザが要素情報に対して入力したラベルであり、教師データは、要素情報とラベルとを含む、データ収集装置である。

　かかる構成により、要素情報から当該要素情報のラベルを予測するための学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本第三の発明のデータ収集装置は、第一の発明に対して、第一教師データ元情報は、教師データを構成する要素情報を含み、第二教師データ元情報は、要素情報を変換した情報である変換情報であり、ユーザが要素情報に対して入力した変換情報であり、教師データは、要素情報と変換情報とを含む、データ収集装置である。

　かかる構成により、要素情報から当該要素情報を変換した変換情報を予測するための学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本第四の発明のデータ収集装置は、第三の発明に対して、要素情報は、第一言語の用語または文であり、変換情報は、第二言語の用語または文である、データ収集装置である。

　かかる構成により、第一言語の要素情報から当該第二言語に翻訳した変換情報を予測するための学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本第五の発明のデータ収集装置は、第一の発明に対して、第一教師データ元情報は、教師データを構成する要素情報を含み、第二教師データ元情報は、要素情報を説明する情報である説明情報であり、ユーザが要素情報に対して入力した説明情報であり、教師データは、要素情報と説明情報とを含む、データ収集装置である。

　かかる構成により、要素情報から当該要素情報を説明する説明情報を予測するための学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本第六の発明のデータ収集装置は、第一の発明に対して、第一教師データ元情報は、ユーザが入力情報を入力することを支援するプログラムを含み、元情報受信部は、ユーザ端末でプログラムが実行された後に、ユーザが入力した入力情報を含む第二教師データ元情報を受信する、データ収集装置である。

　かかる構成により、入力情報を入力することを支援するプログラムもユーザに提供できる。

　また、本第七の発明のデータ収集装置は、第六の発明に対して、プログラムは、要素情報のラベルを予測する機械学習の予測プログラムであり、第一教師データ元情報は、教師データを構成する要素情報を含み、第二教師データ元情報は、要素情報に対して予測プログラムが実行され得られたラベルをユーザが修正したラベルを含み、教師データは、要素情報とラベルとを含む、データ収集装置である。

　かかる構成により、要素情報から当該要素情報のラベルを予測するための学習モデルを構築するための教師データを容易に収集するためのプラットフォームを提供できる。

　また、本第八の発明のデータ収集装置は、第六の発明に対して、プログラムは、要素情報を変換する変換プログラムであり、第一教師データ元情報は、教師データを構成する要素情報を含み、第二教師データ元情報は、要素情報に対して予測プログラムが実行され得られた変換情報をユーザが修正した変換情報を含み、教師データは、要素情報と変換情報とを含む、データ収集装置である。

　かかる構成により、要素情報から当該要素情報を変換した変換情報を予測するための学習モデルを構築するための教師データを容易に収集するためのプラットフォームを提供できる。

　また、本第九の発明のデータ収集装置は、第八の発明に対して、変換プログラムは、機械翻訳プログラムであり、要素情報は、第一言語の用語または文であり、変換情報は、第二言語の用語または文である、データ収集装置である。

　かかる構成により、第一言語の要素情報から当該第二言語に翻訳した変換情報を予測するための学習モデルを構築するための教師データを容易に収集するためのプラットフォームを提供できる。

　また、本第十の発明のデータ収集装置は、第六の発明に対して、プログラムは、要素情報の説明情報を予測する機械学習の予測プログラムであり、第一教師データ元情報は、教師データを構成する要素情報を含み、第二教師データ元情報は、要素情報に対して予測プログラムが実行され得られた説明情報をユーザが修正した説明情報を含み、教師データは、要素情報と説明情報とを含む、データ収集装置である。

　かかる構成により、要素情報から当該要素情報を説明する説明情報を予測するための学習モデルを構築するための教師データを容易に収集するためのプラットフォームを提供できる。

　また、本第十一の発明のデータ収集装置は、第六の発明に対して、プログラムは、教師データを構成する正例と負例とを取得することを支援するプログラムであり、第二教師データ元情報は、プログラムを用いて、ユーザ端末で取得された正例と負例である、データ収集装置である。

　かかる構成により、正例か負例かを判断するための機械学習の学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本第十二の発明のデータ収集装置は、第一から第十一いずれか１つの発明に対して、元情報送信部は、２以上の各ユーザ端末に、同一の第一教師データ元情報を送信し、元情報受信部は、２以上の各ユーザ端末から、同一の第一教師データ元情報に対応する第二教師データ元情報を受信し、教師データ構成部は、元情報受信部が受信した２以上の各第二教師データ元情報に含まれる入力情報を用いて、予め決められたアルゴリズムにより、蓄積する教師データを構成する、データ収集装置である。

　かかる構成により、精度の高い学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本第十三の発明のデータ収集装置は、第十二の発明に対して、教師データ構成部は、元情報受信部が受信した２以上の第二教師データ元情報に含まれる入力情報を合成し、合成入力情報を取得する合成手段と、第一教師データ元情報が有する要素情報と合成入力情報とを有する教師データ構成する教師データ構成手段とを具備するデータ収集装置である。

　また、本第十四の発明のデータ収集装置は、第一から第十三いずれか１つの発明に対して、第一教師データ元情報は、データ属性値に対応付いており、ユーザごとに、１以上のユーザ属性値を含む１以上のユーザ情報が格納されるユーザ情報格納部と、データ属性値に対応するユーザ属性値を有する１以上のユーザ情報を決定するユーザ決定部とをさらに具備し、元情報送信部は、ユーザ決定部が決定した１以上の各ユーザ情報に対応するユーザ端末に第一教師データ元情報を送信する、データ収集装置である。

　かかる構成により、適切なユーザが入力した第二教師データ元情報を取得できる。

　また、本第十五の発明のデータ収集装置は、第一から第十四いずれか１つの発明に対して、元情報受信部が受信した第二教師データ元情報を、第二教師データ元情報を送信したユーザ端末とは異なるユーザ端末である他端末に送信する他端末送信部と、他端末から第二教師データ元情報に対する評価結果を受信する評価結果受信部と、評価結果が採用条件を満たすか否かを判断する判断部とをさらに具備し、教師データ構成部は、判断部が採用条件を満たすと判断した場合のみ、評価結果に対応する第二教師データ元情報を用いて、教師データを構成する、データ収集装置である。

　また、本第十六の発明のデータ収集装置は、第十五の発明に対して、評価結果を用いて、評価結果に対応する第二教師データ元情報に対応するユーザに対する評価であるユーザ評価を取得するユーザ評価部と、ユーザ評価を出力するユーザ評価出力部とをさらに具備するデータ収集装置である。

　かかる構成により、第二教師データ元情報を提供するユーザを評価できる。

　また、本第十七の発明のデータ収集装置は、第一から第十六いずれか１つの発明に対して、ユーザ端末からの第二教師データ元情報の送信に応じた報酬を特定する報酬情報を取得する報酬取得部と、報酬情報をユーザ端末を使用するユーザに対応付けて蓄積する報酬蓄積部とをさらに具備するデータ収集装置である。

　かかる構成により、第二教師データ元情報を提供するユーザに報酬を与えられる。

　また、本第十八の発明のデータ収集装置は、第一から第十六いずれか１つの発明に対して、前記元情報受信部が前記ユーザ端末から第二教師データ元情報を受信した場合に、他のユーザ端末から受信されていた入力情報を前記ユーザ端末に送信する他端末送信部をさらに具備する、データ収集装置である。

　かかる構成により、入力情報を送信したユーザに、他の入力情報の正しさの確認のために他の入力情報を送信できる結果、他の入力情報に対するユーザの正当な評価が得られやすくなる。

　また、本第十九の発明のデータ収集装置は、第十八の発明に対して、前記他端末送信部が送信した入力情報に対する評価結果を前記ユーザ端末から受信する評価結果受信部と、前記入力情報に対応付けて、前記評価結果を蓄積し、当該評価結果に応じて、前記入力情報に対して異なる処理を行う処理部とをさらに具備する、データ収集装置である。

　また、本第二十の発明の学習装置は、第一から第十九いずれか１つの発明に対して、データ収集装置と、データ収集装置が蓄積した２以上の教師データを用いて、機械学習の学習処理を行い、学習モデルを取得し、学習モデルを蓄積する学習部を具備する学習装置である。

　かかる構成により、機械学習の学習モデルを容易に構築できる。

　また、本第十九の発明の予測装置は、第十八の発明に対して、要素情報を受け付ける受付部と、学習装置と、要素情報を受け付ける受付部と、学習装置が取得した学習モデルと受付部が受け付けた要素情報とを用いて、機械学習の予測処理を行い、入力情報を取得する予測部と、入力情報を出力する予測結果出力部とを具備する予測装置である。

　かかる構成により、容易に構築した学習モデルを用いて、機械学習の予測処理ができる。

　本発明によるデータ収集装置によれば、機械学習の学習モデルを構築するための教師データを収集するためのプラットフォームを提供することにより、大量の教師データが収集可能となる。

実施の形態１におけるデータ収集装置システムＡの概念図同データ収集装置システムＡのブロック図同データ収集装置１のブロック図同データ収集装置１の動作例について説明するフローチャート同ユーザ決定処理の例について説明するフローチャート同教師データ構成処理の例について説明するフローチャート同複数入力情報処理の例について説明するフローチャート同ユーザ端末２の動作例について説明するフローチャート同ユーザ情報管理表を示す図同出力例を示す図同出力例を示す図同出力例を示す図同出力例を示す図同出力例を示す図実施の形態２における情報システムＢの概念図同情報システムＢのブロック図上記実施の形態におけるコンピュータシステムの概観図同コンピュータシステムのブロック図

　以下、データ収集装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。

　（実施の形態１）
　本実施の形態において、２以上のユーザ端末に、教師データを構成するための第一教師データ元情報を送信し、当該２以上の各ユーザ端末から入力情報を含む第二教師データ元情報を受信し、当該第一教師データ元情報と第二教師データ元情報とを用いて、教師データを構成し、蓄積するデータ収集装置について説明する。

　また、本実施の形態において、２以上のユーザ端末２に同一の第一教師データ元情報を送信し、当該同一の第一教師データ元情報に対する第二教師データ元情報を２以上の各ユーザ端末から受信し、当該第一教師データ元情報と２以上の第二教師データ元情報とを用いて、教師データを構成し、蓄積するデータ収集装置について説明する。

　また、本実施の形態において、２以上のユーザ端末２から受信した第二教師データ元情報が有する入力情報を合成した合成入力情報を取得し、当該合成入力情報を有する教師データを構成し、蓄積するデータ収集装置について説明する。

　また、本実施の形態において、ユーザ端末ごとにユーザ属性値（例えば、英語が専門であること）を管理しており、当該ユーザ属性値を用いて、第一教師データ元情報を送信するユーザ端末を決定するデータ収集装置について説明する。

　また、本実施の形態において、ユーザ端末から受信された第二教師データ元情報を、他のユーザ端末に送信し、当該他のユーザ端末からの評価結果を受信し、当該評価結果が採用条件を満たす場合のみ、当該第二教師データ元情報を採用して、教師データを構成するデータ収集装置について説明する。

　また、本実施の形態において、上記の評価結果を用いて、第二教師データ元情報を送信したユーザを評価できるデータ収集装置について説明する。

　さらに、本実施の形態において、第二教師データ元情報の送信に対する報酬を、ユーザに与えることができるデータ収集装置について説明する。

　なお、本明細書において、情報Ｘが情報Ｙに対応付いていることは、情報Ｘから情報Ｙを取得できること、または情報Ｙから情報Ｘを取得できることであり、その対応付けの方法は問わない。情報Ｘと情報Ｙとがリンク付いていても良いし、同じバッファに存在していても良いし、情報Ｘが情報Ｙに含まれていても良いし、情報Ｙが情報Ｘに含まれている等でも良い。

　図１は、本実施の形態におけるデータ収集装置システムＡの概念図である。データ収集装置システムＡは、データ収集装置１、および１または２以上のユーザ端末２を備える。

　データ収集装置１は、教師データを収集するためのサーバである。データ収集装置１は、例えば、いわゆるサーバであり、例えば、クラウドサーバ、ＡＳＰサーバ等である。

　ユーザ端末２は、ユーザが使用する端末である。ユーザは、ここでは、教師データを作成するための作業を行う者である。ユーザは、後述する入力情報を提供する者である。ユーザ端末２は、第一教師データ元情報を受信し、第二教師データ元情報を送信する端末である。ユーザ端末２は、例えば、いわゆるパーソナルコンピュータ、タブレット端末、スマートフォン等であり、その種類は問わない。

　データ収集装置１と１または２以上の各ユーザ端末２とは、インターネットやＬＡＮ等のネットワークにより通信可能である。

　図２は、本実施の形態におけるデータ収集装置システムＡのブロック図である。図３は、データ収集装置１のブロック図である

　データ収集装置１は、格納部１１、受信部１２、処理部１３、および送信部１４を備える。格納部１１は、ユーザ情報格納部１１１、元情報格納部１１２、および教師データ格納部１１３を備える。受信部１２は、元情報受信部１２１、および評価結果受信部１２２を備える。処理部１３は、ユーザ決定部１３１、判断部１３２、教師データ構成部１３３、蓄積部１３４、報酬取得部１３５、報酬蓄積部１３６、ユーザ評価部１３７、およびユーザ評価出力部１３８を備える。教師データ構成部１３３は、合成手段１３３１、および教師データ構成手段１３３２を備える。送信部１４は、元情報送信部１４１、および他端末送信部１４２を備える。

　ユーザ端末２は、端末格納部２１、端末受付部２２、端末処理部２３、端末送信部２４、端末受信部２５、および端末出力部２６を備える。

　データ収集装置１を構成する格納部１１には、各種の情報が格納される。各種の情報とは、例えば、後述するユーザ情報、後述する第一教師データ元情報、後述する教師データ、各種のプログラムである。

　各種のプログラムは、ユーザ端末２で実行されるプログラムである。各種のプログラムは、例えば、要素情報を用いるプログラムである。各種のプログラムは、例えば、要素情報に対して、予め決められた処理を行うプログラムである。各種のプログラムは、例えば、機械学習の予測プログラム、機械翻訳プログラム、音声合成プログラム、音声認識プログラムである。

　ユーザ情報格納部１１１には、１または２以上のユーザ情報が格納される。ユーザ情報は、ユーザに関する情報である。ユーザ情報は、例えば、ユーザ識別子、１または２以上のユーザ属性値を有する。ユーザ識別子とは、ユーザを識別する情報である。ユーザ識別子は、例えば、ユーザＩＤ、電話番号、メールアドレス、ユーザ端末識別子である。ユーザ端末識別子とは、ユーザ端末２を識別する情報である。ユーザ端末識別子は、例えば、ユーザ端末２と通信するための情報である送信先情報である。ユーザ端末識別子は、例えば、ユーザ端末２のＩＰアドレス、ＭＡＣアドレス、電話番号である。ユーザ属性値は、ユーザの特性と言っても良い。ユーザ属性値は、例えば、専門識別子、使用言語である。専門識別子とは、ユーザの専門を特定する情報である。専門識別子は、例えば、日英翻訳（例えば、「１」）、日中翻訳（例えば、「２」）、英日翻訳（例えば、「３」）である。使用言語とは、ユーザが使用している言語である。使用言語は、例えば、日本語、英語、中国語である。ユーザ属性値は、例えば、後述する報酬情報、後述するユーザ評価である。

　元情報格納部１１２には、１または２以上の第一教師データ元情報が格納される。第一教師データ元情報とは、教師データを構成する元になる情報である。教師データとは、機械学習の学習処理により学習モデルを構築するための情報である。

　第一教師データ元情報には、例えば、検査フラグ、複数人フラグ、合成フラグが対応づいていても良い。検査フラグとは、受信された第二教師データ元情報を他のユーザにより検査することを示す情報である。複数人フラグとは、複数人に第一教師データ元情報を送信することを示す情報である。合成フラグとは、複数のユーザ端末２から受信された第二教師データ元情報に含まれる入力情報を合成して、合成入力情報を構成することを示す情報である。

　なお、学習モデルとは、機械学習の学習処理により構成された情報であり、機械学習の予測処理に使用される情報である。学習モデルは、学習器、分類器、分類モデル等と言っても良い。学習モデルを構築したり、学習モデルを用いて予測処理したりする機械学習のアルゴリズムは、深層学習、ランダムフォレスト、決定木、ＳＶＭ、ＳＶＲ等、問わない。また、機械学習には、例えば、ＴｅｎｓｏｒＦｌｏｗのライブラリ、Ｒ言語のｒａｎｄｏｍ　ｆｏｒｅｓｔのモジュール、ｆａｓｔＴｅｘｔ、ＴｉｎｙＳＶＭ等の各種の機械学習の関数や、種々の既存のライブラリを用いることができる。

　第一教師データ元情報は、通常、要素情報を含む。要素情報は、教師データを構成する情報である。要素情報は、通常、教師データを構成する説明変数となる情報であるが、教師データを構成する目的変数となる情報でも良い。要素情報は、例えば、画像、映像（動画）、音情報、文字列である。要素情報は、例えば、分類を示すラベルが付されるべき情報（例えば、画像、映像）である。なお、ラベルは、要素情報を識別する情報である。ラベルは、通常、１または２以上の用語である。要素情報は、例えば、翻訳対象の用語、翻訳対象の１または２以上の文である。用語は、１または２以上の単語の集合である。要素情報は、例えば、説明される対象の情報（例えば、画像、映像）である。要素情報は、例えば、音声認識される対象の音情報（音声データ）である。要素情報は、例えば、音声合成される対象の文字列である。

　第一教師データ元情報は、ユーザが入力情報を入力することを支援するプログラムを含むことは好適である。入力情報を入力することを支援するプログラムは、例えば、要素情報を用いて、入力情報を予測する機械学習の予測プログラム、第一言語の要素情報を機械翻訳し、第二言語の入力情報の案を出力する機械翻訳プログラム、文字列である要素情報を音声合成し、音声データの案を出力する音声合成プログラム、または音声データである要素情報に対して、音声認識処理を行い、文字列の案を出力する音声認識プログラムである。

　第一教師データ元情報は、データ属性値に対応付いていることは好適である。データ属性値とは、第一教師データ元情報の属性値、または第一教師データ元情報が含む要素情報の属性値である。データ属性値は、例えば、翻訳対象の要素情報の第一言語を示す情報（例えば、「英語」「日本語」）、第一言語と第二言語とを示す情報（例えば、「日→英」、「中→日」）である。

　第一教師データ元情報には、第二教師データ元情報を送信したユーザに与える報酬を算出する元になる報酬元情報が対応付いていることは好適である。報酬元情報とは、報酬情報を取得する元になる情報である。報酬元情報は、例えば、入力情報を送信する場合の単価、１つの第二教師データ元情報に対する報酬金額、１つの第二教師データ元情報に対して与えるポイント数である。

　教師データ格納部１１３には、１または２以上の教師データが格納される。ここでの教師データは、教師データ構成部１３３が構成したデータである。ここでの教師データは、そのまま学習モジュールに与えられるデータ構造であることは好適であるが、そのまま学習モジュールに与えられるデータ構造でなくても良い。ここでの教師データは、そのまま学習モジュールに与えられるデータ構造の教師データに含まれるすべての情報を有することは好適である。

　教師データは、例えば、要素情報と入力情報とを含む。教師データは、例えば、要素情報と入力情報であるラベルとを含む。ラベルとは、要素情報（例えば、動物を撮影した画像）を識別する情報（例えば、「犬」「猫」「秋田犬」）である。教師データは、例えば、要素情報（例えば、第一言語の文）と変換情報（例えば、第一言語の文を第二言語に翻訳した文）とを含む。教師データは、例えば、要素情報（例えば、画像、映像）と説明情報（例えば、画像について説明する文、映像について説明する文）とを含む。

　受信部１２は、各種の情報を受信する。各種の情報とは、例えば、後述する第二教師データ元情報、後述する評価結果である。

　元情報受信部１２１は、１または２以上の各ユーザ端末２から第二教師データ元情報を受信する。かかるユーザ端末２は、後述する元情報送信部１４１が第一教師データ元情報を送信した端末である。

　第二教師データ元情報とは、教師データを構成する元になる情報である。第二教師データ元情報は入力情報を含む。第二教師データ元情報は入力情報でも良い。入力情報とは、ユーザ端末２で処理された第一教師データ元情報に対してユーザが入力した情報である。入力情報は、要素情報に対して、第一教師データ元情報が有するプログラムが処理し、出力された情報そのもの（例えば、機械翻訳結果）でも良いし、当該プログラムが処理し、出力された情報に対して、ユーザが修正した情報でも良い。ユーザが入力した情報とは、ユーザのユーザ端末２に対する操作により取得されて情報である。ユーザが入力した情報は、ユーザが手入力した情報でも良いし、ユーザが撮影した画像や映像であり、ユーザ端末２に取り込まれた画像や映像でも良いし、ユーザが発声した音声データであり、ユーザ端末２に取り込まれた音声データでも良い。ユーザが入力した情報は、ユーザの何らかの操作により、ユーザ端末２に存在するに至った情報であれば良い。

　第一教師データ元情報に対する処理とは、例えば、第一教師データ元情報の全部または一部（例えば、入力情報）を表示すること、第一教師データ元情報の全部または一部に対して変換処理を行うこと、第一教師データ元情報と図示しない学習モデルを用いて機械学習の予測処理を行い、予測結果を取得することである。なお、変換処理を行うプログラム、機械学習の予測処理を行うプログラムは、ユーザ端末２に送信される第一教師データ元情報に含まれていることは好適である。

　元情報受信部１２１は、通常、第二教師データ元情報を、第一教師データ元情報に対応付く態様でユーザ端末２から受信する。第一教師データ元情報に対応付く態様とは、例えば、第二教師データ元情報が第一教師データ元情報識別子を有することである。第一教師データ元情報に対応付く態様とは、例えば、第二教師データ元情報が要素情報を含むことである。なお、第一教師データ元情報識別子とは、第一教師データ元情報を識別する情報である。第一教師データ元情報を識別する情報は、第一教師データ元情報に含まれる要素情報を識別する情報でも良い。

　元情報受信部１２１は、例えば、ユーザ端末２でプログラムが実行された後に、ユーザが入力した入力情報を含む第二教師データ元情報を受信する。なお、ここでのプログラムは、例えば、要素情報を分類する機械学習の予測プログラムである。ここでのプログラムは、例えば、要素情報を分類する機械学習の予測プログラムと予測処理に用いる学習モデルである。ここでのプログラムは、例えば、要素情報を機械翻訳する機械翻訳のプログラムである。ここでのプログラムは、例えば、要素情報の説明情報を生成する機械学習の予測プログラムである。ここでのプログラムは、例えば、要素情報の説明情報を生成する機械学習の予測プログラムと予測処理に用いる学習モデルである。ここでのプログラムは、例えば、文字列である要素情報に対して音声合成処理を行うプログラムである。ここでのプログラムは、例えば、音声データである要素情報に対して音声認識処理を行うプログラムである。なお、プログラムの種類は問わない。

　元情報受信部１２１は、２以上の各ユーザ端末から、同一の第一教師データ元情報に対応する第二教師データ元情報を受信することは好適である。

　第二教師データ元情報は、例えば、要素情報を識別するラベルであり、ユーザが要素情報に対して入力したラベルを含む。第二教師データ元情報は、例えば、要素情報を変換した情報である変換情報であり、ユーザが要素情報に対して入力した変換情報を含む。第二教師データ元情報は、例えば、要素情報を説明する情報である説明情報であり、ユーザが要素情報に対して入力した説明情報を含む。

　第二教師データ元情報とは、例えば、要素情報に対して予測プログラムが実行され得られたラベルをユーザが修正したラベルを含む。第二教師データ元情報とは、例えば、要素情報に対して予測プログラムが実行され得られた変換情報をユーザが修正した変換情報を含む。第二教師データ元情報とは、例えば、要素情報に対して予測プログラムが実行され得られた説明情報をユーザが修正した説明情報を含む。

　第二教師データ元情報とは、例えば、プログラムを用いて、ユーザ端末２で取得された正例と負例である。なお、かかるプログラムは、正例と負例とを入力できるプログラムである。かかるプログラムは、正例と負例とを入力し、当該正例と負例とを含む第二教師データ元情報をデータ収集装置１に送信するプログラムである。なお、正例と負例との入力は、画像または映像の撮影でも良いし、文字列の入力でも良いし、音声データの取り込みでも良い。

　上述のプログラムは、例えば、要素情報のラベルを予測する機械学習の予測プログラム、要素情報を変換する変換プログラム、要素情報の説明情報を予測する機械学習の予測プログラム、教師データを構成する正例と負例とを取得することを支援するプログラムである。

　なお、正例は、識別したい対象の情報であり、例えば、ひび割れた壁の写真、クラックがある建造物の写真である。また、負例は、正例ではない情報であり、例えば、ひび割れていない壁の写真、クラックがない建造物の写真である。ただし、正例、負例のデータタイプ、内容等は問わない。なお、正例と負例とは逆でも良い。

　評価結果受信部１２２は、他端末から第二教師データ元情報に対する評価結果を受信する。なお、他端末とは、第二教師データ元情報を送信したユーザ端末２ではないユーザ端末２である。他端末とは、第二教師データ元情報を評価するユーザが使用するユーザ端末２である。

　評価結果受信部１２２は、他端末送信部１４２がユーザ端末２に送信した入力情報に対する評価結果を当該ユーザ端末２から受信しても良い。なお、かかるユーザ端末２は、当該入力情報を送信したユーザ端末２ではない。

　評価結果とは、第二教師データ元情報または第二教師データ元情報が有する入力情報に対する評価の結果を示す情報である。評価結果は、例えば、第二教師データ元情報または第二教師データ元情報が有する入力情報が正しいことを示す情報（例えば、真「１」）、第二教師データ元情報または第二教師データ元情報が有する入力情報が間違っていることを示す情報（例えば、偽「０」）、ユーザが入力した正しい入力情報である。

　処理部１３は、各種の処理を行う。各種の処理とは、例えば、ユーザ決定部１３１、判断部１３２、教師データ構成部１３３、蓄積部１３４、報酬取得部１３５、報酬蓄積部１３６、ユーザ評価部１３７、ユーザ評価出力部１３８が行う処理である。

　処理部１３は、送信部１４が送信した入力情報に対応付けて、受信部１２が受信した評価結果を蓄積する。そして、処理部１３は、蓄積した１または２以上の評価結果に応じて、当該評価結果に対応する入力情報に対して異なる処理を行う。

　なお、処理部１３が行う異なる処理の内容は問わない。処理部１３は、例えば、「正しい」との評価結果に対応する入力情報を教師データとして採用し、「正しくない」との評価結果に対応する入力情報を、教師データとして採用しない。また、処理部１３は、一の入力情報に対して、２以上の評価結果が存在する場合であり、当該２以上の評価結果の統計処理の結果が条件を満たす場合（例えば、「正しい」との評価結果の数または割合が閾値以上または閾値より多い場合）は、当該一の入力情報を教師データとして採用し、条件を満たさない場合（例えば、「正しくない」との評価結果の数または割合が閾値以上または閾値より多い場合）は、当該一の入力情報を教師データとして採用しない。

　また、教師データとして採用することは、例えば、教師データ格納部１１３に蓄積すること、学習モデルを構成する際に使用することである。教師データとして採用しないことは、例えば、教師データ格納部１１３に蓄積しないこと、学習モデルを構成する際に使用しないことである。

　また、処理部１３は、例えば、「正しい」との評価結果であれば、他のユーザ端末２に入力情報を送信し、「正しくない」との評価結果であれば、さらに別のユーザ端末２に入力情報を送信する。また、一の入力情報に対して、２以上の評価結果が存在する場合、処理部１３は、当該２以上の評価結果の統計処理の結果が条件を満たす場合（例えば、「正しい」との評価結果の数または割合が閾値以上または閾値より多い場合）は、他のユーザ端末２に入力情報を送信し、条件を満たさない場合（例えば、「正しくない」との評価結果の数または割合が閾値以上または閾値より多い場合）はさらに別のユーザ端末２に入力情報を送信する。

　ユーザ決定部１３１は、第一教師データ元情報を送信するユーザ端末２を決定する。ユーザ端末２を決定することは、例えば、ユーザ識別子を取得すること、送信先情報を取得することである。ユーザ端末２を決定することは、第一教師データ元情報を送信するユーザ端末２が決定できる処理であれば良い。

　ユーザ決定部１３１は、例えば、作業条件に合致する１以上のユーザ情報を決定する。なお、作業条件とは、第一教師データ元情報に対する入力情報を送信する作業を行えるための条件である。作業条件は、１以上のデータ属性値が、第一教師データ元情報と対になる１または２以上の各データ属性値を満足することである。ユーザ決定部１３１は、例えば、第一教師データ元情報と対になる１または２以上の各データ属性値を元情報格納部１１２から取得し、当該１以上のデータ属性値に対応するユーザ属性値を有する１以上のユーザ情報を決定する。例えば、データ属性値が「英語」である場合（例えば、翻訳する対象の第一言語が「英語」である場合）、ユーザ決定部１３１は、ユーザ属性値のうちの「専門」が「英日翻訳」であるユーザ属性値に対応するユーザ識別子をユーザ情報格納部１１１から取得する。

　ユーザ決定部１３１は、例えば、第一教師データ元情報を送信する候補のユーザ端末２から、ランダムに１または２以上のユーザ端末２を決定する。

　判断部１３２は、評価結果受信部１２２が受信した評価結果が採用条件を満たすか否かを判断する。採用条件とは、元情報受信部１２１が受信した第二教師データ元情報を採用して教師データを構成するための条件である。採用条件は、第二教師データ元情報が有する入力情報が正しいことを示す条件である。採用条件は、例えば、評価結果が「正しいことを示す情報」であること、評価結果に含まれる修正された入力情報が「ＮＵＬＬ」であることである。

　教師データ構成部１３３は、元情報送信部１４１が送信した第一教師データ元情報と元情報受信部１２１が受信した第二教師データ元情報とを用いて、機械学習の学習処理のために使用する教師データを構成する。第一教師データ元情報と第二教師データ元情報とを用いて教師データを構成することは、第一教師データ元情報の一部と第二教師データ元情報の一部とを用いて教師データを構成することも含むと考えても良い。

　教師データ構成部１３３は、例えば、第一教師データ元情報に含まれる要素情報と第二教師データ元情報に含まれる入力情報とを用いて、教師データを構成する。教師データ構成部１３３は、例えば、第一教師データ元情報に含まれる要素情報を説明変数とし、教師データ元情報に含まれる入力情報を目的変数とする教師データを構成する。教師データ構成部１３３は、例えば、第一教師データ元情報に含まれる要素情報を目的変数とし、教師データ元情報に含まれる入力情報を説明変数とする教師データを構成する。なお、教師データのデータ構造は問わない。教師データは、例えば、要素情報と入力情報とを要素とするベクトルである。

　教師データ構成部１３３は、元情報受信部１２１が受信した２以上の各第二教師データ元情報に含まれる入力情報を用いて、予め決められたアルゴリズムにより、蓄積する教師データを構成する。なお、ここで、教師データは、通常、一つである。

　予め決められたアルゴリズムとは、例えば、多数決である。つまり、元情報受信部１２１が受信した２以上の各第二教師データ元情報に含まれる入力情報が全て同じ情報でない場合、教師データ構成部１３３は、最も頻度が高い入力情報を、教師データを構成する際に使用する入力情報として決定する。また、予め決められたアルゴリズムとは、例えば、後述する合成である。

　教師データ構成部１３３は、判断部１３２が採用条件を満たすと判断した場合のみ、評価結果に対応する第二教師データ元情報を用いて、教師データを構成することは好適である。

　教師データ構成部１３３を構成する合成手段１３３１は、元情報受信部１２１が受信した２以上の第二教師データ元情報に含まれる入力情報を合成し、合成入力情報を取得する。なお、合成とは、元情報受信部１２１が受信した２以上の第二教師データ元情報のうちの２以上の各第二教師データ元情報の全部または一部を有する合成入力情報を取得することである。

　合成手段１３３１は、例えば、元情報受信部１２１が受信した２以上の各第二教師データ元情報に含まれる入力情報（例えば、画像を識別するラベル）をすべて含む情報を、教師データを構成する際に使用する入力情報として決定する。なお、かかるすべて含む情報は、合成入力情報である。

　合成手段１３３１は、例えば、元情報受信部１２１が受信した２以上の各第二教師データ元情報に含まれる入力情報（例えば、画像を識別するラベル）に対して、ユニーク処理した結果の情報をすべて含む情報を、合成入力情報として取得する。かかる場合、合成入力情報から重複する情報（例えば、重複するラベル）は除かれる。

　教師データ構成手段１３３２は、例えば、第一教師データ元情報が有する要素情報と合成手段１３３１が取得した合成入力情報とを有する教師データ構成する。

　蓄積部１３４は、教師データ構成部１３３が構成した教師データを蓄積する。蓄積部１３４は、例えば、教師データを教師データ格納部１１３に蓄積する。

　蓄積部１３４は、入力情報に対応付けて、評価結果受信部１２２が受信した評価結果を蓄積しても良い。かかる評価結果は、対応付く入力情報に対する評価結果である。

　報酬取得部１３５は、ユーザ端末２からの第二教師データ元情報の送信に応じた報酬を特定する報酬情報を取得する。報酬取得部１３５は、通常、ユーザ端末２に対応するユーザに対応付けて、報酬情報を取得する。報酬取得部１３５は、例えば、第二教師データ元情報が受信された場合に、当該第二教師データ元情報に対応する第一教師データ元情報と対になる報酬元情報を元情報格納部１１２から取得し、当該報酬元情報を用いて、報酬情報（例えば、報酬金額、報酬のポイント数）を取得する。

　第一教師データ元情報に応じて、報酬が異なることは好適である。例えば、要素情報である画像に対して、ラベルである入力情報を送信した場合より、要素情報である画像に対して、説明情報である入力情報を送信した場合の方が高額の報酬となる。報酬取得部１３５は、第二教師データ元情報の数が多いほど、大きな報酬となる報酬情報を取得することは好適である。報酬取得部１３５は、第二教師データ元情報に対する評価結果が高い（良好である）ほど、大きな報酬となる報酬情報を取得することは好適である。

　報酬蓄積部１３６は、報酬取得部１３５が取得した報酬情報を、第二教師データ元情報を送信したユーザ端末２を使用するユーザに対応付けて蓄積する。報酬蓄積部１３６は、例えば、報酬取得部１３５が取得した報酬情報を、第二教師データ元情報を送信したユーザ端末２に対応するユーザ識別子と対にして、ユーザ情報格納部１１１に蓄積する。なお、報酬情報の蓄積は、例えば、当該ユーザ識別子と対にして格納されている報酬情報に、報酬取得部１３５が取得した報酬情報を加算した新たな報酬情報を蓄積することである。　　　

　ユーザ評価部１３７は、評価結果受信部１２２が受信した１または２以上の評価結果を用いて、当該評価結果に対応する第二教師データ元情報に対応するユーザ（入力情報を作成したユーザ）に対する評価であるユーザ評価を取得する。

　ユーザ評価部１３７は、例えば、「入力情報が間違っていることを示す情報」である評価結果の数が多いほど、当該入力情報に対応するユーザの評価が低くなるユーザ評価を取得する。

　ユーザ評価出力部１３８は、ユーザ評価部１３７が取得したユーザ評価を出力する。ここで、出力とは、記録媒体への蓄積、外部の装置への送信、他の処理装置や他のプログラムなどへの処理結果の引渡しであるが、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力などを含む概念であっても良い。

　ユーザ評価出力部１３８は、例えば、ユーザ評価部１３７が取得したユーザ評価を、当該ユーザ評価に対応する入力情報に対応するユーザ識別子と対にして、ユーザ情報格納部１１１に蓄積する。ユーザ評価出力部１３８は、例えば、ユーザ評価部１３７が取得したユーザ評価を当該ユーザのユーザ端末２に送信する。

　送信部１４は、各種の情報を送信する。各種の情報は、例えば、第一教師データ元情報、第二教師データ元情報である。

　元情報送信部１４１は、教師データの元になる第一教師データ元情報をユーザ端末２に送信する。元情報送信部１４１は、通常、教師データの元になる第一教師データ元情報を２以上の各ユーザ端末に送信する。元情報送信部１４１は、２以上の各ユーザ端末に、同一の第一教師データ元情報を送信することは好適である。元情報送信部１４１は、ユーザ決定部１３１が決定した１以上の各ユーザ情報に対応するユーザ端末２に第一教師データ元情報を送信することは好適である。

　他端末送信部１４２は、元情報受信部１２１が受信した第二教師データ元情報を、当該第二教師データ元情報を送信したユーザ端末２とは異なるユーザ端末２である他端末に送信する。

　他端末送信部１４２は、元情報受信部１２１が第二教師データ元情報をユーザ端末２から受信したことに応じて、当該第二教師データ元情報に含まれる入力情報とは異なる入力情報であり、当該ユーザ端末２とは異なる他のユーザ端末２から受信された入力情報を、当該第二教師データ元情報を送信してきたユーザ端末２に送信することは好適である。かかることにより、第二教師データ元情報を送信したユーザに、すぐに他の入力情報を評価してもらえる。つまり、当該ユーザの判断の感覚が鈍らないタイミングで、他の入力情報を評価してもらえ、入力情報の精度の向上、入力情報（ラベリング）の揺らぎを少なくする等の効果がある。

　他端末送信部１４２は、検査条件に合致する第二教師データ元情報のみを、他端末に送信しても良い。

　なお、検査条件とは、第二教師データ元情報を検査する条件である。検査条件は、例えば、元情報送信部１４１が送信した第一教師データ元情報に、第二教師データ元情報を検査することを示す検査フラグが対応付いていることである。検査条件は、例えば、ユーザ評価が閾値以下または閾値より小さい（低い評価の）ユーザのユーザ端末２から受信された第二教師データ元情報であることである。ただし、検査条件は問わない。

　ユーザ端末２を構成する端末格納部２１には、各種の情報が格納される。各種の情報とは、例えば、ユーザ識別子、第一教師データ元情報、第二教師データ元情報、各種のプログラムである。

　端末受付部２２は、各種の情報や指示等を受け付ける。各種の情報や指示等とは、例えば、入力情報、ユーザの操作、出力された入力情報（第二教師データ元情報）に対する評価結果、出力された入力情報に対する修正、第二送信指示である。なお、出力された入力情報は、プログラムが自動取得した入力情報の候補の情報であり、ユーザにより修正される可能性のある情報である。また、出力された入力情報に対する修正は、入力情報である。

　第二送信指示とは、入力情報を有する第二教師データ元情報を、データ収集装置１に送信する指示である。

　なお、各種の情報や指示等の入力手段は、タッチパネルやキーボードやマウスやメニュー画面によるもの等、何でも良い。

　端末処理部２３は、各種の処理を行う。各種の処理は、例えば、受け付けられた情報や指示等を、送信する構造の情報や指示等にする処理である。各種の処理は、例えば、受信された情報を出力する構造の情報にする処理である。

　端末処理部２３は、例えば、受信された第一教師データ元情報が有する要素情報を出力する。

　端末処理部２３は、例えば、受信された第一教師データ元情報が有するプログラムを実行する。なお、プログラムを実行することは、プログラムをインストールした後に実行することも含む、とする。

　端末処理部２３は、例えば、受信された第一教師データ元情報が有する要素情報に対して、機械学習の予測プログラムを実行し、予測されたラベルを取得する。

　端末処理部２３は、例えば、受信された第一教師データ元情報が有する要素情報に対して、変換プログラムを実行し、予測された変換情報を取得する。

　端末処理部２３は、例えば、受信された第一教師データ元情報が有する要素情報に対して、機械翻訳プログラムを実行し、予測された翻訳結果を取得する。

　端末処理部２３は、例えば、受信された第一教師データ元情報が有する要素情報（音声データ）に対して、音声認識プログラムを実行し、予測された音声認識結果の文字列を取得する。

　端末処理部２３は、例えば、受信された第一教師データ元情報が有する要素情報（文字列）に対して、音声合成プログラムを実行し、予測された音声データを取得する。

　端末処理部２３は、例えば、受信された第一教師データ元情報が有する要素情報に対して、機械学習の予測プログラムを実行し、予測された説明情報を取得する。

　端末処理部２３は、例えば、受信された第一教師データ元情報が有するプログラムを実行し、正例と負例とを入力するための入力画面を出力する。

　端末処理部２３は、例えば、端末受付部２２が受け付けたユーザの操作に応じて、写真を撮影し、画像を取得する。なお、かかる画像は、正例または負例である。

　端末送信部２４は、各種の情報や指示等をデータ収集装置１に送信する。各種の情報や指示等は、例えば、第二教師データ元情報である。

　端末受信部２５は、各種の情報をデータ収集装置１から受信する。各種の情報は、例えば、第一教師データ元情報、第二教師データ元情報、検査情報である。

　端末出力部２６は、各種の情報を出力する。各種の情報は、例えば、第一教師データ元情報、第二教師データ元情報である。

　格納部１１、ユーザ情報格納部１１１、元情報格納部１１２、教師データ格納部１１３、学習モデル格納部３１、および端末格納部２１は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

　格納部１１等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部１１等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部１１等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部１１等で記憶されるようになってもよい。

　受信部１２、元情報受信部１２１、評価結果受信部１２２、および端末受信部２５は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。

　処理部１３、ユーザ決定部１３１、判断部１３２、教師データ構成部１３３、蓄積部１３４、報酬取得部１３５、報酬蓄積部１３６、ユーザ評価部１３７、ユーザ評価出力部１３８、合成手段１３３１、教師データ構成手段１３３２、および端末処理部２３は、通常、プロセッサやメモリ等から実現され得る。処理部１３等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。なお、プロセッサは、ＣＰＵ、ＭＰＵ、ＧＰＵ等であり、その種類は問わない。

　送信部１４、元情報送信部１４１、他端末送信部１４２、および端末送信部２４は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。

　端末受付部２２は、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。

　端末出力部２６は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。端末出力部２６は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。

　次に、データ収集装置システムＡの動作例について説明する。まず、データ収集装置１の動作例について、図４のフローチャートを用いて説明する。

　（ステップＳ４０１）データ収集装置１は、第一教師データ元情報を送信する指示である第一送信指示を受け付けたか否かを判断する。第一送信指示を受け付けた場合はステップＳ４０２に行き、第一送信指示を受け付けなかった場合はステップＳ４０８に行く。なお、第一送信指示の受け付けは、例えば、図示しない管理者の端末からの第一送信指示の受信、予め決まられた時刻になってことである。ただし、第一教師データ元情報を送信するためのトリガーは問わない。

　（ステップＳ４０２）処理部１３は、教師データを作成する対象の第一教師データ元情報であり、第一送信指示に対応する第一教師データ元情報を、元情報格納部１１２から取得する。

　（ステップＳ４０３）ユーザ決定部１３１は、ユーザ決定処理を行う。ユーザ決定処理の例について、図５のフローチャートを用いて説明する。なお、ユーザ決定処理とは、第一教師データ元情報を送信する１または２以上のユーザ端末２を決定する処理である。

　（ステップＳ４０４）元情報送信部１４１は、カウンタｉに１を代入する。

　（ステップＳ４０５）元情報送信部１４１は、ステップＳ４０３で決定されたユーザ端末２のうちで、ｉ番目のユーザ端末２が存在するか否かを判断する。ｉ番目のユーザ端末２が存在する場合はステップＳ４０６に行き、存在しない場合はステップＳ４０１に戻る。

　（ステップＳ４０６）元情報送信部１４１は、ｉ番目のユーザ端末２に対応する送信先情報（例えば、ＩＰアドレス、ＭＡＣアドレス、メールアドレス、電話番号）をユーザ情報格納部１１１から取得する。次に、元情報送信部１４１は、当該送信先情報が示す送信先に、ステップＳ４０２で取得された第一教師データ元情報を送信する。なお、送信される第一教師データ元情報は、第一教師データ元情報識別子を有することは好適である。

　（ステップＳ４０７）元情報送信部１４１は、カウンタｉを１、インクリメントする。ステップＳ４０５に戻る。

　（ステップＳ４０８）元情報受信部１２１は、ユーザ端末２から第二教師データ元情報を受信したか否かを判断する。第二教師データ元情報を受信した場合はステップＳ４０９に行き、受信しなかった場合はステップＳ４１８に行く。

　（ステップＳ４０９）判断部１３２は、ステップＳ４０８で受信された第二教師データ元情報が検査条件に合致するか否かを判断する。検査条件に合致する場合はステップＳ４１６に行き、検査条件に合致しない場合はステップＳ４１０に行く。

　（ステップＳ４１０）教師データ構成部１３３は、ステップＳ４０８で受信された第二教師データ元情報を用いて、教師データ構成処理を行う。教師データ構成処理の例について、図６のフローチャートを用いて説明する。

　（ステップＳ４１１）蓄積部１３４は、ステップＳ４１０で教師データが構成されたか否かを判断する。教師データが構成された場合はステップＳ４１２に行き、教師データが構成されなかった場合はステップＳ４１３に行く。

　（ステップＳ４１２）蓄積部１３４は、ステップＳ４１０で構成された教師データを教師データ格納部１１３に蓄積する。ステップＳ４１４に行く。ここで、蓄積部１３４は、教師データの元になった第一教師データ元情報に対応付けて、教師データを蓄積することは好適である。

　（ステップＳ４１３）蓄積部１３４は、ステップＳ４０８で受信された第二教師データ元情報が有する入力情報を、受信されたステップＳ４０８で受信された第二教師データ元情報に対応する第一教師データ元情報に対応付けて、図示しないバッファに蓄積する。

　（ステップＳ４１４）報酬取得部１３５は、ステップＳ４０８における第二教師データ元情報の受信に応じて、当該第二教師データ元情報を送信したユーザ端末２のユーザに対する報酬情報を取得する。

　（ステップＳ４１５）報酬蓄積部１３６は、ステップＳ４１４で取得された報酬情報を、当該第二教師データ元情報を送信したユーザ端末２のユーザのユーザ識別子に対応付けて、ユーザ情報格納部１１１に蓄積する。ステップＳ４０１に戻る。

　（ステップＳ４１６）処理部１３は、ステップＳ４０８で受信された第二教師データ元情報を用いて、他端末に送信する検査情報を構成する。なお、検査情報は、例えば、第二教師データ元情報を有する。検査情報は、例えば、第一教師データ元情報が有する要素情報を有する。検査情報は、例えば、要素情報と入力情報とを有する。

　（ステップＳ４１７）他端末送信部１４２は、検査情報を送信する他端末の送信先情報をユーザ情報格納部１１１から取得する。次に、他端末送信部１４２は、検査情報を、当該送信先情報が示す送信先に送信する。ステップＳ４０１に戻る。

　なお、取得される送信先情報は、検査者として予め決まっているユーザ（例えば、管理者、評価が高い一部のユーザ）の送信先情報でも良いし、ランダムに決定したユーザの送信先情報等でも良い。

　（ステップＳ４１８）評価結果受信部１２２は、ユーザ端末２から評価結果を受信したか否かを判断する。評価結果を受信した場合はステップＳ４１９に行き、評価結果を受信しなかった場合はステップＳ４０１に戻る。なお、受信される評価結果は、第二教師データ元情報に対応付いている。

　（ステップＳ４１９）判断部１３２は、ステップＳ４１８で受信された評価結果が採用条件を満たすか否かを判断する。採用条件を満たす場合はステップＳ４１０に行き、採用条件を満たさない場合はステップＳ４２０に行く。

　（ステップＳ４２０）教師データ構成部１３３は、ステップＳ４１８で受信された評価結果が修正された入力情報を含むか否かを判断する。入力情報を含む場合はステップＳ４２１に行き、入力情報を含まない場合はステップＳ４０１に戻る。

　（ステップＳ４２１）教師データ構成部１３３は、ステップＳ４１８で受信された評価結果が有する入力情報を取得する。また、教師データ構成部１３３は、ステップＳ４１８で受信された評価結果に対応する第一教師データ元情報が有する要素情報を取得する。次に、教師データ構成部１３３は、要素情報と入力情報とを有する教師データを構成する。ステップＳ４１２に行く。

　なお、図４のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

　次に、ステップＳ４０３のユーザ決定処理の例について、図５のフローチャートを用いて説明する。

　（ステップＳ５０１）ユーザ決定部１３１は、第一教師データ元情報と対になる１以上のデータ識別子を元情報格納部１１２から取得する。

　（ステップＳ５０２）ユーザ決定部１３１は、カウンタｉに１を代入する。

　（ステップＳ５０３）ユーザ決定部１３１は、ユーザ情報格納部１１１にｉ番目のユーザ情報が存在するか否かを判断する。ｉ番目のユーザ情報が存在する場合はステップＳ５０４に行き、存在しない場合は上位処理にリターンする。

　（ステップＳ５０４）ユーザ決定部１３１は、ｉ番目のユーザ情報に含まれる１以上のユーザ属性値をユーザ情報格納部１１１から取得する。

　（ステップＳ５０５）ユーザ決定部１３１は、ステップＳ５０１で取得した１以上のデータ識別子とステップＳ５０４で取得した１以上のユーザ属性値とが、作業条件に合致するか否かを判断する。作業条件に合致する場合はステップＳ５０６に行き、合致しない場合はステップＳ５０８に行く。

　（ステップＳ５０６）ユーザ決定部１３１は、ステップＳ５０４で取得した１以上のユーザ属性値と対になるユーザ識別子をユーザ情報格納部１１１から取得し、図示しないバッファに一時蓄積する。

　（ステップＳ５０７）ユーザ決定部１３１は、取得したユーザ識別子の数が上限に達したか否かを判断する。上限に達した場合は上位処理にリターンし、上限に達していない場合はステップＳ５０８に行く。

　（ステップＳ５０８）ユーザ決定部１３１は、カウンタｉを１、インクリメントする。ステップＳ５０３に戻る。

　次に、ステップＳ４１０の教師データ構成処理の例について、図６のフローチャートを用いて説明する。

　（ステップＳ６０１）教師データ構成部１３３は、第一教師データ元情報識別子を取得する。

　（ステップＳ６０２）教師データ構成部１３３は、元情報格納部１１２に、第一教師データ元情報識別子と対に、複数人フラグが格納されているか否かを判断する。複数人フラグが格納されている場合はステップＳ６０３に行き、格納されていない場合はステップＳ６１０に行く。

　（ステップＳ６０３）教師データ構成部１３３は、すべてのユーザ端末２から、入力情報を有する第二教師データ元情報を受信しているか否かを判断する。すべての入力情報が揃っている場合はステップＳ６０４に行き、揃っていない場合はステップＳ６０７に行く。

　（ステップＳ６０４）教師データ構成部１３３は、複数入力情報処理を行う。複数入力情報処理の例について、図７のフローチャートを用いて説明する。なお、複数入力情報処理とは、一の第一教師データ元情報に対する複数の入力情報を処理し、使用する入力情報を取得する処理である。

　（ステップＳ６０５）教師データ構成部１３３は、第一教師データ元情報が有する要素情報を取得する。

　（ステップＳ６０６）教師データ構成部１３３は、ステップＳ６０４で取得した入力情報とステップＳ６０５で取得したる要素情報とを有する教師データを構成する。上位処理にリターンする。

　（ステップＳ６０７）教師データ構成部１３３は、第一教師データ元情報識別子を取得する。

　（ステップＳ６０８）教師データ構成部１３３は、ステップＳ６０７で取得した第一教師データ元情報識別子に対応付けて、ステップＳ４０８で受信された第二教師データ元情報を一時蓄積する。

　（ステップＳ６０９）教師データ構成部１３３は、教師データフラグに「未完成」を代入する。上位処理にリターンする。

　（ステップＳ６１０）教師データ構成部１３３は、ステップＳ４０８で受信された第二教師データ元情報に対応する第一教師データ元情報の中に要素情報が存在するか否かを判断する。要素情報が存在する場合はステップＳ６１１に行き、要素情報が存在しない場合はステップＳ６１４に行く。

　（ステップＳ６１１）教師データ構成部１３３は、ステップＳ４０８で受信された第二教師データ元情報に対応する第一教師データ元情報の中から要素情報を取得する。

　（ステップＳ６１２）教師データ構成部１３３は、ステップＳ４０８で受信された第二教師データ元情報の中から入力情報を取得する。

　（ステップＳ６１３）教師データ構成部１３３は、ステップＳ６１１で取得した要素情報とステップＳ６１２で取得した入力情報とを有する教師データを構成する。上位処理にリターンする。

　（ステップＳ６１４）教師データ構成部１３３は、ステップＳ４０８で受信された第二教師データ元情報から正例と負例とを取得する。

　（ステップＳ６１５）教師データ構成部１３３は、ステップＳ６１４で取得した正例と負例とを教師データを構成する。上位処理にリターンする。

　次に、ステップＳ６０４の複数入力情報処理の例について、図７のフローチャートを用いて説明する。

　（ステップＳ７０１）教師データ構成部１３３は、すべての入力情報を取得する。

　（ステップＳ７０２）教師データ構成部１３３は、元情報格納部１１２に、第一教師データ元情報に対応付いて、合成フラグが格納されているか否かを判断する。合成フラグが格納されている場合はステップＳ７０３に行き、合成フラグが格納されていない場合はステップＳ７０５に行く。

　（ステップＳ７０３）教師データ構成部１３３は、ステップＳ７０１で取得したすべての入力情報に対して、ユニーク処理を行う。

　（ステップＳ７０４）教師データ構成部１３３は、ステップＳ７０３におけるユニーク処理の結果である１以上の入力情報を取得する。上位処理にリターンする。

　（ステップＳ７０５）教師データ構成部１３３は、ステップＳ７０１で取得したすべての入力情報の中で、最も出現頻度の高い一の入力情報を取得する。上位処理にリターンする。

　なお、図７のフローチャートのステップＳ７０３において、すべての入力情報に対してユニーク処理を行ったが、要約処理を行う等しても良い。なお、すべての入力情報である複数の文を要約する処理は、公知の自然言語処理により可能である。

　次に、ユーザ端末２の動作例について、図８のフローチャートを用いて説明する。

　（ステップＳ８０１）端末受信部２５は、データ収集装置１から第二教師データ元情報を受信したか否かを判断する。第二教師データ元情報を受信した場合はステップＳ８０２に行き、受信しなかった場合はステップＳ８０６に行く。なお、ここでの第二教師データ元情報の受信は、ユーザの操作による受信（プル型の通信）でも良い、プッシュ送信された第二教師データ元情報の受信でも良い。

　（ステップＳ８０２）端末処理部２３は、ステップＳ８０１において受信された第二教師データ元情報がプログラムを含むか否かを判断する。プログラムを含む場合はステップＳ８０３に行き、プログラムを含まない場合はステップＳ８０４に行く。

　（ステップＳ８０３）端末処理部２３は、ステップＳ８０１において受信された第二教師データ元情報が要素情報を含むか否かを判断する。要素情報を含む場合はステップＳ８０４に行き、要素情報を含まない場合はステップＳ８０５に行く。

　（ステップＳ８０４）端末処理部２３は、ステップＳ８０１において受信された第二教師データ元情報に含まれる要素情報を取得する。

　（ステップＳ８０５）端末処理部２３は、ステップＳ８０１において受信された第二教師データ元情報に含まれるプログラム、または端末格納部２１に格納されているプログラムを実行する。なお、ここで、端末処理部２３は、要素情報を取得している場合には、当該要素情報をプログラムに渡して、当該プログラムを実行する。ステップＳ８０１に戻る。

　（ステップＳ８０６）端末受付部２２は、入力情報を受け付けたか否かを判断する。入力情報を受け付けた場合はステップＳ８０７に行き、受け付けなかった場合はステップＳ８１１に行く。

　（ステップＳ８０７）端末処理部２３は、ステップＳ８０６で受け付けた入力情報を一時蓄積する。

　（ステップＳ８０８）端末受付部２２は、第二送信指示を受け付けたか否かを判断する。第二送信指示を受け付けた場合はステップＳ８０９に行き、受け付けなかった場合はステップＳ８０８に戻る。

　（ステップＳ８０９）端末処理部２３は、ステップＳ８０６で受け付けた入力情報を有する第二教師データ元情報を構成する。なお、第二教師データ元情報は、入力情報と第一教師データ元情報識別子とを有し、要素情報を有さないことは好適である。

　（ステップＳ８１０）端末送信部２４は、ステップＳ８０９で構成された第二教師データ元情報をデータ収集装置１に送信する。ステップＳ８０１に戻る。

　（ステップＳ８１１）端末受信部２５は、データ収集装置１から検査情報を受信したか否かを判断する。検査情報を受信した場合はステップＳ８１２に行き、検査情報を受信しなかった場合はステップＳ８０１に戻る。

　（ステップＳ８１２）端末処理部２３は、ステップＳ８１１で受信された検査情報を用いて、出力する検査情報を構成する。端末出力部２６は、当該検査情報を出力する。なお、検査情報は、通常、要素情報と入力情報とを有する。

　（ステップＳ８１３）端末受付部２２は、出力された検査情報に対する入力を受け付けたか否かを判断する。入力を受け付けた場合はステップＳ８１４に行き、入力を受け付けなかった場合はステップＳ８１３に戻る。なお、ここでの入力は、評価結果を構成するための情報である。

　（ステップＳ８１４）端末処理部２３は、ステップＳ８１３で受け付けられた入力を用いて、評価結果を構成する。なお、評価結果は、例えば、「正しい」「間違っている」「修正された入力情報」である。

　（ステップＳ８１５）端末送信部２４は、ステップＳ８１４で構成された評価結果をデータ収集装置１に送信する。ステップＳ８０１に戻る。

　なお、図８のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

　以下、本実施の形態におけるデータ収集装置システムＡの具体的な動作例について説明する。

　データ収集装置１のユーザ情報格納部１１１には、図９に示すユーザ情報管理表が格納されている、とする。ユーザ情報管理表は、「ＩＤ」「ユーザ識別子」「氏名」「送信先情報」「ユーザ属性値」を有する２以上のレコードを管理する。「ユーザ属性値」は、ここでは「専門識別子」「使用言語」「ユーザ評価」「報酬情報」を有する。「専門識別子」は、ユーザの専門を特定する情報であり、例えば、「日→英」は、日本語から英語への日英翻訳が専門であることを示す。「ユーザ評価」は、ここでは記号であるが、通常、数値である、とする。「報酬情報」は、ここでは記号であるが、通常、金額やポイントを示す数値である、とする。

　かかる場合、以下の４つの具体例について説明する。具体例１は、日本語の難解用語の英語訳をユーザに依頼し、ユーザ端末２から日本語の難解用語と英語訳とを有する第二教師データ元情報を受信する場合である。具体例２は、画像に対して、当該画像のラベルを付す作業を複数のユーザに依頼し、複数のユーザ端末２からラベルと第一教師データ元情報識別子（画像の識別子）とを有する第二教師データ元情報を受信し、複数のラベルを合成する場合である。具体例３は、ユーザ端末２に、クラックが入った外壁（正例）とクラックが入っていない外壁（負例）とのセットの画像の撮影および送信の作業をユーザに依頼する場合である。具体例４において、ユーザ端末２から目的とする情報（例えば、クラックが入った外壁の画像）を受信した後に、直ちに、他のユーザ端末２から受信した１以上の他の目的とする情報（例えば、クラックが入った外壁の画像）を送信し、目的とする情報であるか否か（クラックが入っているか否か）の評価結果を当該ユーザに入力してもらい、当該ユーザ端末２から評価結果を受信し、当該評価結果を送信した情報に対応付けて蓄積する。また、蓄積された１以上の評価結果のうち、「目的とする情報である」との評価結果が採用条件を満たす場合に、当該情報を採用する。なお、採用条件は、例えば、「目的とする情報である」との評価結果の数が閾値以上または閾値より多いこと、「目的とする情報である」との評価結果の割合が閾値以上または閾値より多いことである。

（具体例１）
　ここでは、データ収集装置１の格納部１１には、機械翻訳を行い、入力情報を入力し、第二教師データ元情報を送信するためのプログラムＡ（アプリＡ）が格納されている、とする。

　データ収集装置１は、第一送信指示「＜難解用語＞一蓮托生　＜データ属性値＞日→英」を受け付けたとする。

　次に、ユーザ決定部１３１は、当該第一送信指示が有するデータ属性値「日→英」に合致する専門識別子「日→英」と対になる送信先情報「送信先１」を、ユーザ情報管理表（図９）から取得する。

　次に、処理部１３は、格納部１１からプログラムＡを取得する。また、処理部１３は、本作業を識別する仕事ＩＤ「Ｗ１２５８」を生成する。また、処理部１３は、プログラムＡと要素情報である難解用語「一蓮托生」と仕事ＩＤ「Ｗ１２５８」とを有する第一教師データ元情報を構成する。

　次に、元情報送信部１４１は、当該第一教師データ元情報を送信先情報「送信先１」に対応する田中Ａ夫のユーザ端末２に送信する。

　次に、田中Ａ夫のユーザ端末２の端末受信部２５は、データ収集装置１から当該第一教師データ元情報を受信する。次に、端末処理部２３は、受信された第一教師データ元情報から要素情報「一蓮托生」を取得する。また、端末処理部２３は、受信された第一教師データ元情報からプログラムＡを取得する。そして、端末処理部２３は、プログラムＡに要素情報「一蓮托生」を渡し、プログラムＡを実行する。その結果、図１０に示す画面が田中Ａ夫のユーザ端末２に出力された、とする。つまり、プログラムＡに含まれる機械翻訳モジュールでは、日本語「一蓮托生」を「Ichirentakushou」と訳した、とする。

　次に、田中Ａ夫は、機械翻訳モジュールの自動翻訳結果は間違っているので、１００１のフィールドに、「Ichirentakushou」に代えて、正しい英語翻訳「To be in the same boat.」を入力し、送信ボタン１００２を指示した、とする。

　次に、端末処理部２３は、第二教師データ元情報「＜仕事ＩＤ＞Ｗ１２５８　＜ユーザ識別子＞Ｕ００１　＜要素情報＞一蓮托生　＜入力情報＞To be in the same boat.」を構成する。次に、端末送信部２４は、当該第二教師データ元情報をデータ収集装置１に送信する。

　次に、データ収集装置１の元情報受信部１２１は、田中Ａ夫のユーザ端末２から第二教師データ元情報「＜仕事ＩＤ＞Ｗ１２５８　＜ユーザ識別子＞Ｕ００１　＜要素情報＞一蓮托生　＜入力情報＞To be in the same boat.」を受信する。

　次に、処理部１３は、仕事ＩＤ「Ｗ１２５８」に対応付けて、第二教師データ元情報「＜ユーザ識別子＞Ｕ００１　＜要素情報＞一蓮托生　＜入力情報＞To be in the same boat.」を、図示しないバッファに一時蓄積する。

　次に、判断部１３２は、受信された第二教師データ元情報が検査条件に合致する、と判断した、とする。ここで、検査条件は、ユーザ識別子に対応するユーザ評価が閾値以上であること、であったとする。そして、判断部１３２は、ユーザ識別子「Ｕ００１」と対になるユーザ評価「Ｅ_１」をユーザ情報管理表（図９）から取得する。また、判断部１３２は、「Ｅ_１＜閾値」であると判断した、とする。

　次に、処理部１３は、受信された第二教師データ元情報を用いて、他端末に送信する検査情報「＜仕事ＩＤ＞Ｗ１２５８　＜要素情報＞一蓮托生　＜入力情報＞To be in the same boat.」を構成する。ここで、他端末送信部１４２は、データ属性値「日→英」に合致する専門識別子「日→英」と対になる送信先情報であり、「送信先１」ではない送信先情報「送信先２」を、ユーザ情報管理表（図９）から取得する。つまり、他端末送信部１４２は、他端末として、山田Ｂ子のユーザ端末２を決定する。次に、他端末送信部１４２は、送信先２が示す送信先に、当該検査情報を送信する。

　次に、山田Ｂ子のユーザ端末２は、当該検査情報を受信し、出力する。かかる出力例は、図１１である。

　そして、山田Ｂ子は、翻訳結果を確認し、「正しい」のチェックボックス１１０１にチェックを入力し、送信ボタン１１０２を指示した、とする。

　次に、ユーザ端末２の端末受付部２２は、山田Ｂ子のかかる入力を受け付ける。次に、端末処理部２３は、評価結果「＜仕事ＩＤ＞Ｗ１２５８　＜評価結果＞正しい」を構成する。次に、端末送信部２４は、当該評価結果をデータ収集装置１に送信する。

　次に、データ収集装置１の評価結果受信部１２２は、山田Ｂ子のユーザ端末２から評価結果「＜仕事ＩＤ＞Ｗ１２５８　＜評価結果＞正しい」を受信する。

　次に、判断部１３２は、受信された評価結果「正しい」が採用条件を満たす、と判断する。なお、ここでは、採用条件は「評価結果＝正しい」である、とする。

　次に、教師データ構成部１３３は、第二教師データ元情報「＜仕事ＩＤ＞Ｗ１２５８　＜ユーザ識別子＞Ｕ００１　＜要素情報＞一蓮托生　＜入力情報＞To be in the same boat.」から教師データ（一蓮托生，To be in the same boat.）を構成する。次に、蓄積部１３４は、当該教師データを教師データ格納部１１３に蓄積する。

　以上の処理を繰り返し、教師データ格納部１１３には、大量の教師データ（難解な日本語用語，難解な日本語用語の英語翻訳用語）が蓄積された、とする。

　以上、本具体例によれば、難解な日本語の用語を英語の用語に変換するための学習モデルを構築するための多数の教師データを収集できる。

（具体例２）
　ここでは、データ収集装置１の格納部１１には、要素情報である画像と入力情報を入力するフィールドとを有する画面を出力し、第二教師データ元情報を送信するためのプログラムＢ（アプリＢ）が格納されている、とする。

　データ収集装置１は、第一送信指示「＜画像＞ｆｉｌｅ１　＜送信人数＞３　＜合成フラグ＞ＯＮ」を受け付けたとする。ｆｉｌｅ１は、犬が撮影された画像ファイルである、とする。

　次に、ユーザ決定部１３１は、第一送信指示が有する送信人数「３」に従って、例えば、送信先情報「送信先１」「送信先２」「送信先３」を、ユーザ情報管理表（図９）から取得する。

　次に、処理部１３は、格納部１１からプログラムＢを取得する。また、処理部１３は、第一教師データ元情報識別子（仕事ＩＤ）「Ｗ１２６０」を生成した、とする。また、処理部１３は、仕事ＩＤ「Ｗ１２６０」とプログラムＢと要素情報である画像ファイル「ｆｉｌｅ１」とを有する第一教師データ元情報を構成する。また、処理部１３は、仕事ＩＤ「Ｗ１２６０」と対に、複数人フラグと合成フラグとを蓄積する。

　次に、元情報送信部１４１は、当該第一教師データ元情報を送信先情報「送信先１」に対応する田中Ａ夫、山田Ｂ子、および陳ＸＹの各ユーザ端末２に送信する。

　次に、３人の各ユーザのユーザ端末２の端末受信部２５は、データ収集装置１から当該第一教師データ元情報を受信する。次に、端末処理部２３は、受信された第一教師データ元情報から要素情報である画像ファイル「ｆｉｌｅ１」を取得する。また、各ユーザ端末２の端末処理部２３は、受信された第一教師データ元情報からプログラムＢを取得する。そして、端末処理部２３は、プログラムＢに要素情報「ｆｉｌｅ１」を渡し、プログラムＢを実行する。その結果、図１２に示す画面が各ユーザのユーザ端末２に出力された、とする。

　ここで、田中Ａ夫と山田Ｂ子とは入力情報を入力するフィールド１２に「秋田犬」を入力し、陳ＸＹはフィールド１２に「犬」を入力し、送信ボタン１２０２を指示した、とする。そして、３人の各ユーザのユーザ端末２は、フィールド１２に入力された要素情報と第一教師データ元情報識別子「Ｗ１２６０」とを有する第二教師データ元情報を構成し、データ収集装置１に送信する。

　次に、データ収集装置１の元情報受信部１２１は、３人の各ユーザのユーザ端末２から第二教師データ元情報を受信する。

　次に、教師データ構成部１３３は、元情報格納部１１２に、第一教師データ元情報識別子「Ｗ１２６０」と対に、複数人フラグが格納されている、と判断する。そして、教師データ構成部１３３は、すべての入力情報「秋田犬，秋田犬，犬」を取得する。また、教師データ構成部１３３は、元情報格納部１１２に、第一教師データ元情報「Ｗ１２６０」に対応付いて、合成フラグが格納されている、と判断する。次に、教師データ構成部１３３は、取得したすべての入力情報に対して、ユニーク処理を行い、入力情報「秋田犬，犬」を取得する。次に、教師データ構成部１３３は、第一教師データ元情報が有する要素情報（画像ファイル「ｆｉｌｅ１」）を取得する。次に、教師データ構成部１３３は、入力情報「秋田犬，犬」と要素情報（画像ファイル「ｆｉｌｅ１」）とを有する教師データを構成する。次に、蓄積部１３４は、当該教師データを教師データ格納部１１３に蓄積する。

　なお、ここで、入力情報は、目的変数でも良いし、説明変数でも良い。また、入力情報が目的変数である場合、要素情報は説明変数であり、入力情報が説明変数である場合、要素情報は目的変数である。

　以上の処理を繰り返し、教師データ格納部１１３には、大量の教師データ（画像，１または２以上のラベル）が蓄積された、とする。

　なお、具体例２において、入力情報を一つのラベルとする場合、教師データ構成部１３３は、すべての入力情報「秋田犬，秋田犬，犬」に対して、多数決のアルゴリズムを採用し、入力情報「秋田犬」と決定し、当該入力情報「秋田犬」と画像ファイル「ｆｉｌｅ１」からなる教師データを構成しても良い。

　また、具体例２において、プログラムＢは、画像を識別する機械学習の予測モジュールを含んでも良い。かかる場合、各ユーザのユーザ端末２で、画像ファイル「ｆｉｌｅ１」に対して、当該予測モジュールが実行され、当該画像の予測結果（例えば、「オオカミ」）がユーザ端末２のフィールド１２０１に表示される。そして、ユーザは、フィールド１２０１に表示された入力情報の候補を確認し、修正することとなる。

　以上、本具体例によれば、画像ファイルをラベリングするための学習モデルを構築するための多数の教師データを収集できる。

　また、本具体例によれば、ラベリから画像を生成するための学習モデルを構築するための多数の教師データを収集できる。

（具体例３）
　ここでは、データ収集装置１の格納部１１には、クラックの入った外壁の箇所とクラックが入っていない外壁の箇所との撮影を促し、撮影して、２つの画像を送信するプログラムＣ（アプリＣ）が格納されている、とする。

　データ収集装置１は、第一送信指示「＜プログラム＞プログラムＣ」を受け付けたとする。

　次に、ユーザ決定部１３１は、ユーザ情報管理表（図９）から、すべてのユーザの送信先情報を取得した、とする。つまり、ここでは、大量のユーザに以下の作業を依頼するものとする、

　次に、処理部１３は、格納部１１からプログラムＣを取得する。また、処理部１３は、送信する第一教師データ元情報を識別するユニークな第一教師データ元情報識別子(仕事ＩＤ)「Ｗ２５２２」を生成し、第一教師データ元情報に対応付けて蓄積した、とする。また、処理部１３は、第一教師データ元情報識別子「Ｗ２５２２」とプログラムＣを有する第一教師データ元情報を構成する。

　次に、元情報送信部１４１は、当該第一教師データ元情報をユーザ決定部１３１が取得した多数の送信先情報に対応する多数のユーザ端末２に送信する。

　次に、例えば、田中Ａ夫のユーザ端末２の端末受信部２５は、データ収集装置１から当該第一教師データ元情報を受信する。次に、端末処理部２３は、受信された第一教師データ元情報からプログラムＣを取得する。そして、端末処理部２３は、プログラムＣを実行する。その結果、図１３に示す画面が田中Ａ夫のユーザ端末２に出力された、とする。

　次に、田中Ａ夫は、図１３の画面に従って、図１３の領域１３０１に入るべき、クラックの入った外壁の箇所の画像を撮影するために、当該ユーザ端末２の画面をクラックの入った外壁の箇所に向け、撮影ボタン１３０２を指示した、とする。すると、端末受付部２２は、かかる指示を受け付け、端末処理部２３は、プログラムＣの撮影機能を実行し、クラックの入った外壁の箇所の画像を取得した、とする。

　また、田中Ａ夫は、図１３の画面に従って、図１３の領域１３０３に入るべき、クラックが入っていない外壁の箇所の画像を撮影するために、当該ユーザ端末２の画面をクラックの入っていない外壁の箇所に向け、撮影ボタン１３０４を指示した、とする。すると、端末受付部２２は、かかる指示を受け付け、端末処理部２３は、プログラムＣの撮影機能を実行し、クラックが入っていない外壁の箇所の画像を取得した、とする。

　以上により、田中Ａ夫のユーザ端末２は、クラックが入っていない外壁の箇所の画像（正例）と、クラックが入っていない外壁の箇所の画像（負例）とを取得できた。かかる出力例は、図１４である。

　次に、田中Ａ夫は、ユーザ端末２の画面の送信ボタン１４０１を指示した、とする。次に、端末受付部２２は、第二送信指示を受け付ける。次に、端末処理部２３は、撮影された正例の画像１４０２と負例の画像１４０３と第一教師データ元情報識別子「Ｗ２５２２」とを有する第二教師データ元情報を構成する。次に、端末送信部２４は、当該第二教師データ元情報をデータ収集装置１に送信する。

　また、他のユーザも、田中Ａ夫と同様に、クラックが入っていない外壁の箇所の画像（正例）と、クラックが入っていない外壁の箇所の画像（負例）とを撮影し、第二教師データ元情報をデータ収集装置１に送信した、とする。

　次に、データ収集装置１は、元情報受信部１２１は、多数の各ユーザ端末２から第二教師データ元情報を受信する。

　次に、教師データ構成部１３３は、各ユーザ端末２から送信された第二教師データ元情報から正例の画像と負例の画像とを取得する。次に、教師データ構成部１３３は、取得した正例の画像と負例の画像との組である教師データを、多数、構成する。

　次に、蓄積部１３４は、構成された多数の教師データを教師データ格納部１１３に蓄積する。

　なお、ここで、蓄積部１３４は、各ユーザ端末２から送信された正例の画像と負例の画像とを対応付けて、教師データ格納部１１３に蓄積することは好適であるが、正例の画像と負例の画像とを対応付けず、各画像が正例の画像か負例の画像かを区別できるように、教師データ格納部１１３に蓄積するだけでも良い。なお、正例の画像と負例の画像とを対応付けて蓄積する場合でも、蓄積部１３４は、どちらが正例の画像で、どうちらが負例の画像であるかは、区別できるように、蓄積する。

　以上、本具体例によれば、外壁におけるクラックの有無を識別するための学習モデルを構築するための多数の教師データを収集できた。

（具体例４）
　具体例３で述べたクラックの外壁の画像（例えば、図１４の１４０２）が多数のユーザ端末２から受信され、蓄積された、とする。

　そして、今、データ収集装置１の元情報受信部１２１が入力情報Ａ（例えば、クラックの入った壁の画像）を含む第二教師データ元情報を、ユーザＵのユーザ端末２から受信した、とする。そして、データ収集装置１の蓄積部１３４は、当該第二教師データ元情報を蓄積する。次に、他端末送信部１４２は、ユーザＵのユーザ端末２に、他のユーザ端末２から受信された入力情報Ｘを送信する。

　そして、ユーザＵのユーザ端末２は、第二教師データ元情報の送信後、すぐにデータ収集装置１から入力情報Ｘを受信し、出力する。

　次に、ユーザＵは、ユーザ端末２に出力された入力情報Ｘを見て、クラックが入っているように見えないと判断し、評価結果「正しくない」を入力した、とする。次に、ユーザ端末２は、評価結果「正しくない」を受け付け、当該評価結果「正しくない」を、入力情報Ｘの識別子（例えば、「Ｘ」）と対にして、データ収集装置１に送信する。

　次に、データ収集装置１の評価結果受信部１２２は、入力情報Ｘに対する評価結果「正しくない」をユーザ端末２から受信する。そして、蓄積部１３４は、評価結果受信部１２２が受信した評価結果を、入力情報Ｘに対応付けて蓄積する。

　このような処理を、ユーザＵだけではなく、他の多数のユーザにより行われた、とする。その結果、入力情報Ｘに対して、多数の評価結果が入力情報Ｘに対応付けて蓄積された、とする。

　次に、処理部１３は、評価結果「正しい」の割合が閾値以上である場合、入力情報Ｘを教師データとして採用するために、教師データ格納部１１３に蓄積する、とする。なお、かかる蓄積は、蓄積部１３４が行っても良い。

　以上、本具体例によれば、ユーザが入力情報を送信した後、すぐに、他の入力情報を評価する環境を提供できる結果、入力情報を評価しやくなる。その結果、適正な教師データを収集できることとなる。

　以上、本実施の形態によれば、機械学習の学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本実施の形態によれば、要素情報から当該要素情報のラベルを予測するための学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本実施の形態によれば、要素情報から当該要素情報を変換した変換情報を予測するための学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本実施の形態によれば、第一言語の要素情報から当該第二言語に翻訳した変換情報を予測するための学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本実施の形態によれば、要素情報から当該要素情報を説明する説明情報を予測するための学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本実施の形態によれば、入力情報を入力することを支援するプログラムもユーザに提供できる。

　また、本実施の形態によれば、精度の高い学習モデルを構築するための教師データを収集するためのプラットフォームを提供できる。

　また、本実施の形態によれば、適切なユーザが入力した第二教師データ元情報を取得できる。

　また、本実施の形態によれば、第二教師データ元情報を提供するユーザを評価できる。

　また、本実施の形態によれば、入力情報を評価しやくする環境を提供できる。

　さらに、本実施の形態によれば、第二教師データ元情報を提供するユーザに報酬を与えられる。

　なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ－ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態におけるデータ収集装置１を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、機械学習の学習処理により学習モデルを構築するための教師データを構成する元になる第一教師データ元情報が格納される元情報格納部にアクセス可能なコンピュータを、前記第一教師データ元情報を２以上の各ユーザ端末に送信する元情報送信部と、前記元情報送信部が送信し、前記ユーザ端末で処理された前記第一教師データ元情報に対してユーザが入力した入力情報を含む第二教師データ元情報を、前記第一教師データ元情報に対応付く態様で前記ユーザ端末から受信する元情報受信部と、前記第一教師データ元情報と前記元情報受信部が受信した前記第二教師データ元情報とを用いて、機械学習の学習処理のために使用する教師データを構成する教師データ構成部と、前記教師データ構成部が構成した前記教師データを蓄積する蓄積部として機能させるためのプログラムである。

　（実施の形態２）
　本実施の形態において、データ収集装置１により収集した複数の教師データを用いて、学習モデルを構築する学習装置について説明する。

　また、本実施の形態において、学習装置が構築した学習モデルを用いて、予測処理を行う予測装置について説明する。

　図１５は、本実施の形態における情報システムＢの概念図である。情報システムＢは、データ収集装置１、学習装置３、および予測装置４を備える。

　学習装置３、予測装置４は、例えば、いわゆるサーバであり、例えば、クラウドサーバ、ＡＳＰサーバ等である。ただし、学習装置３、予測装置４は、スタンドアロンの装置でも良い。

　ここでは、例えば、データ収集装置１と学習装置３と予測装置４とは、インターネットやＬＡＮ等のネットワークにより通信可能である。

　図１６は、本実施の形態における情報システムＢのブロック図である。学習装置３は、教師データ格納部１１３、学習モデル格納部３１、および学習部３２を備える。予測装置４は、学習モデル格納部３１、受付部４１、予測部４２、および予測結果出力部４３を備える。

　学習装置３を構成する学習部３２は、データ収集装置１が蓄積した２以上の教師データを用いて、機械学習の学習処理を行い、学習モデルを取得し、学習モデルを蓄積する。学習部３２は、学習モデル格納部３１に学習モデルを蓄積することは好適である。

　ここで、学習モデルを構築する機械学習のアルゴリズムは、深層学習、ランダムフォレスト、決定木、ＳＶＭ、ＳＶＲ等、問わない。また、機械学習には、例えば、ＴｅｎｓｏｒＦｌｏｗのライブラリ、Ｒ言語のｒａｎｄｏｍ　ｆｏｒｅｓｔのモジュール、ｆａｓｔＴｅｘｔ、ＴｉｎｙＳＶＭ等の各種の機械学習の関数や、種々の既存のライブラリを用いることができる。

　予測装置４を構成する受付部４１は、要素情報を受け付ける。要素情報は、例えば、ラベリングの対象の画像、翻訳対象の第一言語の用語または文、説明対象の画像、クラックが入っているか否かを判断する対象の外壁の撮影画像である。

　ここで、受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付け、撮影による画像の取得などを含む概念である。

　要素情報の入力手段は、タッチパネルやキーボードやマウスやカメラやメニュー画面によるもの等、何でも良い。

　予測部４２は、学習モデル格納部３１の学習モデルと受付部４１が受け付けた要素情報とを用いて、機械学習の予測処理を行い、入力情報を取得する。

　ここで、予測処理を行う機械学習のアルゴリズムは、深層学習、ランダムフォレスト、決定木、ＳＶＭ、ＳＶＲ等、問わない。また、機械学習には、例えば、ＴｅｎｓｏｒＦｌｏｗのライブラリ、Ｒ言語のｒａｎｄｏｍ　ｆｏｒｅｓｔのモジュール、ｆａｓｔＴｅｘｔ、ＴｉｎｙＳＶＭ等の各種の機械学習の関数や、種々の既存のライブラリを用いることができる。

　予測結果出力部４３は、予測部４２が取得した入力情報を出力する。ここで、出力とは、記録媒体への蓄積、外部の装置への送信、他の処理装置や他のプログラムなどへの処理結果の引渡し、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力などを含む概念である。

　学習モデル格納部３１は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

　学習モデル格納部３１に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が学習モデル格納部３１で記憶されるようになってもよく、通信回線等を介して送信された情報が学習モデル格納部３１で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部１１等で記憶されるようになってもよい。

　学習部３２、および予測部４２は、通常、プロセッサやメモリ等から実現され得る。学習部３２等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。なお、プロセッサは、ＣＰＵ、ＭＰＵ、ＧＰＵ等であり、その種類は問わない。
受付部４１は、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。

　受付部４１は、無線または有線の通信手段で実現されることが好適であるが、放送を受信する手段、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現されても良い。

　予測結果出力部４３は、無線または有線の通信手段で実現されても良いし、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現されても良い。かかる場合、予測結果出力部４３は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。

　なお、データ収集装置１は、学習装置３の学習モデル格納部３１と学習部３２とを具備しても良い。また、データ収集装置１は、予測装置４の受付部４１と予測部４２と予測結果出力部４３とを具備しても良い。

　以上、本実施の形態によれば、収集した教師データを用いて、学習モデルを構築できる。

　また、本実施の形態によれば、学習モデルを用いて、予測される入力情報を出力できる。

　なお、本実施の形態における学習装置３を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、データ収集装置が蓄積した２以上の教師データにアクセス可能なプログラムを、当該２以上の教師データを用いて、機械学習の学習処理を行い、学習モデルを取得し、当該学習モデルを蓄積する学習部として機能させるためのプログラムである。

　また、本実施の形態における予測装置４を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、学習装置３が取得した学習モデルにアクセス可能なコンピュータを、要素情報を受け付ける受付部と、前記受付部が受け付けた前記要素情報とを用いて、機械学習の予測処理を行い、入力情報を取得する予測部と、前記入力情報出力する予測結果出力部として機能させるためのプログラムである。

　また、図１７は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態のデータ収集装置１、ユーザ端末２、学習装置３、予測装置４を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図１７は、このコンピュータシステム３００の概観図であり、図１８は、システム３００のブロック図である。

　図１７において、コンピュータシステム３００は、ＣＤ－ＲＯＭドライブを含むコンピュータ３０１と、キーボード３０２と、マウス３０３と、モニタ３０４とを含む。

　図１８において、コンピュータ３０１は、ＣＤ－ＲＯＭドライブ３０１２に加えて、ＭＰＵ３０１３と、ＣＤ－ＲＯＭドライブ３０１２等に接続されたバス３０１４と、ブートアッププログラム等のプログラムを記憶するためのＲＯＭ３０１５と、ＭＰＵ３０１３に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのＲＡＭ３０１６と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク３０１７とを含む。ここでは、図示しないが、コンピュータ３０１は、さらに、ＬＡＮへの接続を提供するネットワークカードを含んでも良い。

　コンピュータシステム３００に、上述した実施の形態のデータ収集装置１等の機能を実行させるプログラムは、ＣＤ－ＲＯＭ３１０１に記憶されて、ＣＤ－ＲＯＭドライブ３０１２に挿入され、さらにハードディスク３０１７に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ３０１に送信され、ハードディスク３０１７に記憶されても良い。プログラムは実行の際にＲＡＭ３０１６にロードされる。プログラムは、ＣＤ－ＲＯＭ３１０１またはネットワークから直接、ロードされても良い。

　プログラムは、コンピュータ３０１に、上述した実施の形態のデータ収集装置１等の機能を実行させるオペレーティングシステム（ＯＳ）、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能（モジュール）を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム３００がどのように動作するかは周知であり、詳細な説明は省略する。

　なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理（ハードウェアでしか行われない処理）は含まれない。

　また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。

　また、上記各実施の形態において、一の装置に存在する２以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。

　また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。

　本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

　以上のように、本発明にかかるデータ収集装置１は、機械学習の学習モデルを構築するための教師データを収集するためのプラットフォームを提供することにより、大量の教師データが収集可能となるという効果を有し、当該プラットフォームを実現するサーバ等として有用である。

Claims

機械学習の学習処理により学習モデルを構築するための教師データを構成する元になる第一教師データ元情報が格納される元情報格納部と、
前記第一教師データ元情報を２以上の各ユーザ端末に送信する元情報送信部と、
前記元情報送信部が送信し、ユーザ端末で処理された前記第一教師データ元情報に対してユーザが入力した入力情報を含む第二教師データ元情報を、前記第一教師データ元情報に対応付く態様で前記ユーザ端末から受信する元情報受信部と、
前記第一教師データ元情報と前記元情報受信部が受信した前記第二教師データ元情報とを用いて、機械学習の学習処理のために使用する教師データを構成する教師データ構成部と、
前記教師データ構成部が構成した前記教師データを蓄積する蓄積部とを具備するデータ収集装置。
前記第一教師データ元情報は、前記教師データを構成する要素情報を含み、
前記第二教師データ元情報は、前記要素情報を識別するラベルであり、ユーザが前記要素情報に対して入力したラベルであり、
前記教師データは、前記要素情報と前記ラベルとを含む、請求項１記載のデータ収集装置。
前記第一教師データ元情報は、前記教師データを構成する要素情報を含み、
前記第二教師データ元情報は、前記要素情報を変換した情報である変換情報であり、ユーザが前記要素情報に対して入力した変換情報であり、
前記教師データは、前記要素情報と前記変換情報とを含む、請求項１記載のデータ収集装置。
前記要素情報は、第一言語の用語または文であり、
前記変換情報は、第二言語の用語または文である、請求項３記載のデータ収集装置。
前記第一教師データ元情報は、前記教師データを構成する要素情報を含み、
前記第二教師データ元情報は、前記要素情報を説明する情報である説明情報であり、ユーザが前記要素情報に対して入力した説明情報であり、
前記教師データは、前記要素情報と前記説明情報とを含む、請求項１記載のデータ収集装置。
前記第一教師データ元情報は、前記ユーザが前記入力情報を入力することを支援するプログラムを含み、
前記元情報受信部は、
前記ユーザ端末で前記プログラムが実行された後に、前記ユーザが入力した前記入力情報を含む前記第二教師データ元情報を受信する、請求項１記載のデータ収集装置。
前記プログラムは、要素情報のラベルを予測する機械学習の予測プログラムであり、
前記第一教師データ元情報は、前記教師データを構成する要素情報を含み、
前記第二教師データ元情報は、前記要素情報に対して前記予測プログラムが実行され得られたラベルを前記ユーザが修正したラベルを含み、
前記教師データは、前記要素情報と前記ラベルとを含む、請求項６記載のデータ収集装置。
前記プログラムは、要素情報を変換する変換プログラムであり、
前記第一教師データ元情報は、前記教師データを構成する要素情報を含み、
前記第二教師データ元情報は、前記要素情報に対して前記予測プログラムが実行され得られた変換情報を前記ユーザが修正した変換情報を含み、
前記教師データは、前記要素情報と前記変換情報とを含む、請求項６記載のデータ収集装置。
前記変換プログラムは、機械翻訳プログラムであり、
前記要素情報は、第一言語の用語または文であり、
前記変換情報は、第二言語の用語または文である、請求項８記載のデータ収集装置。
前記プログラムは、要素情報の説明情報を予測する機械学習の予測プログラムであり、
前記第一教師データ元情報は、前記教師データを構成する要素情報を含み、
前記第二教師データ元情報は、前記要素情報に対して前記予測プログラムが実行され得られた説明情報を前記ユーザが修正した説明情報を含み、
前記教師データは、前記要素情報と前記説明情報とを含む、請求項６記載のデータ収集装置。
前記プログラムは、前記教師データを構成する正例と負例とを取得することを支援するプログラムであり、
前記第二教師データ元情報は、前記プログラムを用いて、前記ユーザ端末で取得された正例と負例である、請求項６記載のデータ収集装置。
前記元情報送信部は、
２以上の各ユーザ端末に、同一の第一教師データ元情報を送信し、
前記元情報受信部は、
前記２以上の各ユーザ端末から、前記同一の第一教師データ元情報に対応する前記第二教師データ元情報を受信し、
前記教師データ構成部は、
前記元情報受信部が受信した前記２以上の各第二教師データ元情報に含まれる入力情報を用いて、予め決められたアルゴリズムにより、蓄積する前記教師データを構成する、請求項１記載のデータ収集装置。
前記教師データ構成部は、
前記元情報受信部が受信した前記２以上の第二教師データ元情報に含まれる入力情報を合成し、合成入力情報を取得する合成手段と、
前記第一教師データ元情報が有する要素情報と前記合成入力情報とを有する教師データ構成する教師データ構成手段とを具備する請求項１２記載のデータ収集装置。
前記第一教師データ元情報は、データ属性値に対応付いており、
ユーザごとに、１以上のユーザ属性値を含む１以上のユーザ情報が格納されるユーザ情報格納部と、
前記データ属性値に対応するユーザ属性値を有する１以上のユーザ情報を決定するユーザ決定部とをさらに具備し、
前記元情報送信部は、
前記ユーザ決定部が決定した１以上の各ユーザ情報に対応するユーザ端末に前記第一教師データ元情報を送信する、請求項１記載のデータ収集装置。
前記元情報受信部が受信した前記第二教師データ元情報を、当該第二教師データ元情報を送信したユーザ端末とは異なるユーザ端末である他端末に送信する他端末送信部と、
前記他端末から前記第二教師データ元情報に対する評価結果を受信する評価結果受信部と、
前記評価結果が採用条件を満たすか否かを判断する判断部とをさらに具備し、
前記教師データ構成部は、
前記判断部が前記採用条件を満たすと判断した場合のみ、当該評価結果に対応する第二教師データ元情報を用いて、前記教師データを構成する、請求項１記載のデータ収集装置。
前記評価結果を用いて、当該評価結果に対応する前記第二教師データ元情報に対応するユーザに対する評価であるユーザ評価を取得するユーザ評価部と、
前記ユーザ評価を出力するユーザ評価出力部とをさらに具備する請求項１５記載のデータ収集装置。
前記ユーザ端末からの前記第二教師データ元情報の送信に応じた報酬を特定する報酬情報を取得する報酬取得部と、
前記報酬情報を前記ユーザ端末を使用するユーザに対応付けて蓄積する報酬蓄積部とをさらに具備する請求項１記載のデータ収集装置。
前記元情報受信部が前記ユーザ端末から第二教師データ元情報を受信した場合に、他のユーザ端末から受信されていた入力情報を前記ユーザ端末に送信する他端末送信部をさらに具備する請求項１記載のデータ収集装置。
前記他端末送信部が送信した入力情報に対する評価結果を前記ユーザ端末から受信する評価結果受信部と、
前記入力情報に対応付けて、前記評価結果を蓄積し、当該評価結果に応じて、前記入力情報に対して異なる処理を行う処理部とをさらに具備する請求項１８記載のデータ収集装置。
請求項１から請求項１９いずれか一項に記載のデータ収集装置と、当該データ収集装置が蓄積した２以上の教師データを用いて、機械学習の学習処理を行い、学習モデルを取得し、当該学習モデルを蓄積する学習部を具備する学習装置。
機械学習の学習処理により学習モデルを構築するための教師データを構成する元になる第一教師データ元情報が格納される元情報格納部と、元情報送信部と、元情報受信部と、教師データ構成部と、蓄積部とにより実現されるデータ収集方法であって、
前記元情報送信部が、前記第一教師データ元情報を２以上の各ユーザ端末に送信する元情報送信ステップと、
前記元情報受信部が、前記元情報送信ステップで送信された、ユーザ端末で処理された前記第一教師データ元情報に対してユーザが入力した入力情報を含む第二教師データ元情報を、前記第一教師データ元情報に対応付く態様で前記ユーザ端末から受信する元情報受信ステップと、
前記教師データ構成部が、前記第一教師データ元情報と前記元情報受信部が受信した前記第二教師データ元情報とを用いて、機械学習の学習処理のために使用する教師データを構成する教師データ構成ステップと、
前記蓄積部が、前記教師データ構成ステップで構成された前記教師データを蓄積する蓄積ステップとにより実現されるデータ収集方法。