JPWO2018079020A1

JPWO2018079020A1 - 情報処理装置および情報処理方法

Info

Publication number: JPWO2018079020A1
Application number: JP2018547148A
Authority: JP
Inventors: 井手　直紀; 直紀井手
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2016-10-26
Filing date: 2017-08-18
Publication date: 2019-09-12
Anticipated expiration: 2037-08-18
Also published as: JP6911866B2; CN109844777A; US20190244132A1; EP3534303A1; WO2018079020A1; EP3534303A4; US11610148B2

Abstract

【課題】学習データのラベリング状況に応じた学習性能を予め予測する。【解決手段】入力される学習データに対する次元圧縮を行い、前記学習データに係るデータ分布図を生成するデータ分布提示部と、前記データ分布図と前記学習データに係るラベリング状況とに基づいて、学習性能を予測する学習性能予測部と、前記データ分布図および前記学習性能に係る表示を制御する表示制御部と、を備え、前記データ分布図は、前記学習データから構成されるクラスタの重なり情報、および各クラスタに属する前記学習データの数の情報を含む、情報処理装置が提供される。【選択図】図１２

Description

本開示は、情報処理装置および情報処理方法に関する。

近年、機械学習分野では、種々のアルゴリズムを用いた研究開発が行われている。上記のアルゴリズムには、例えば、半教師学習のように、ラベル付きの学習データとラベルのない学習データの両方を入力とする手法も存在する。非特許文献１によれば、手書き数字データの認識に半教師学習を用いた例が報告されている。

Diederik P. Kingma、外３名、「Semi-supervisedLearning with Deep Generative Models」、２０１４年１０月３１日、［Online］、［平成２８年９月７日検索］、インターネット<https://arxiv.org/pdf/1406.5298v2.pdf>

しかし、一般に、非特許文献１に記載されるような半教師学習は、全てのデータにラベルを付けて学習する教師あり学習と比較して、ラベルをつけていないことによる学習性能の劣化が懸念される。さらには、上記のような半教師学習では、どの程度、学習性能が劣化するかを予め予測することが困難である。このため、性能の向上を追求する場合、結局、すべてのデータにラベルを付けることも想定される。

そこで、本開示では、学習データのラベリング状況に応じた学習性能を予め予測することが可能な、新規かつ改良された装置が提案される。

本開示によれば、入力される学習データに対する次元圧縮を行い、前記学習データに係るデータ分布図を生成するデータ分布提示部と、前記データ分布図と前記学習データに係るラベリング状況とに基づいて、学習性能を予測する学習性能予測部と、前記データ分布図および前記学習性能に係る表示を制御する表示制御部と、を備え、前記データ分布図は、前記学習データから構成されるクラスタの重なり情報、および各クラスタに属する前記学習データの数の情報を含む、情報処理装置が提供される。

また、本開示によれば、プロセッサが、入力される学習データに基づく次元圧縮を行い、前記学習データに係るデータ分布図を生成することと、前記データ分布図と前記学習データに係るラベリング状況とに基づいて、学習性能を予測することと、前記データ分布図および前記学習性能に係る表示を制御することと、を含み、前記データ分布図は、前記学習データから構成されるクラスタの重なり情報、および各クラスタに属する前記学習データの数の情報を含む、情報処理方法が提供される。

以上説明したように本開示によれば、学習データのラベリングに応じた学習性能を予め予測することが可能となる。

なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

本開示の第１の実施形態に係る情報処理システムの構成例を示す図である。同実施形態に係るデータ収集装置１０の機能ブロック図である。同実施形態に係る情報処理サーバ２０の機能ブロック図である。同実施形態に係る情報処理端末３０の機能ブロック図である。同実施形態に係る学習装置４０の機能ブロック図である。同実施形態に係るデータ分布提示部により生成される学習データのプロット図の一例を示す図である。同実施形態に係るデータ分布提示部により生成される学習データのプロット図の一例を示す図である。同実施形態に係るデータ分布提示部により生成される分布イメージ図の一例である。同実施形態に係るデータ分布提示部により生成される分布重なり表の一例である。同実施形態に係る表示制御部の制御に基づいて出力部に表示されるラベリング候補の一例を示す図である。同実施形態に係る情報処理端末の出力部に表示されるユーザインタフェースの一例である。同実施形態に係る参照情報がセンサ情報である場合の例を示す図である。同実施形態に係る学習性能予測部による学習性能の予測について説明するための図である。同実施形態に係る各クラスタ数における最大学習性能の比較例を示す図である。同実施形態に係るＶＡＥを用いた半教師学習を行うニューラルネットワークのネットワーク構造を示す図である。同実施形態に係るラケットスポーツＡにおけるスイング種別の判定結果を示す図である。同実施形態に係るラケットスポーツＡおよびＢの判別タスクにおいて用いられた学習データのクラスタリング結果である。同実施形態に係るラケットスポーツＢにおけるスイング種別の判定結果を示す図である。同実施形態に係る類似性を有する異なる２つ以上のデータセットを用いた学習について説明するためのデータフロー図である。同実施形態に係る情報処理サーバ２０の動作の流れを示すフローチャートである。本開示の第２の実施形態に係る表示制御部がデータ収集装置の出力部に表示させるユーザインタフェースの一例である。同実施形態に係るラベリングの要否判定について説明するための図である。同実施形態に係るデータの収集とラベルの追加に係るタイミングを示す図である。同実施形態に係る情報処理サーバ２０の動作の流れを示すフローチャートである。本開示に係るハードウェア構成例である。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

なお、説明は以下の順序で行うものとする。
１．第１の実施形態
１．１．第１の実施形態の概要
１．２．システム構成例
１．３．データ収集装置１０の機能構成例
１．４．情報処理サーバ２０の機能構成例
１．５．情報処理端末３０の機能構成例
１．６．学習装置４０の機能構成例
１．７．データセットの加工
１．８．データ分布図の生成
１．９．ラベリング候補の選択
１．１０．ラベリングの実行
１．１１．学習性能の予測
１．１２．学習データに基づく学習
１．１３．本実施形態に係る半教師学習の効果
１．１４．情報処理サーバ２０の動作の流れ
２．第２の実施形態
２．１．第２の実施形態の概要
２．２．情報処理サーバ２０の機能構成例
２．３．ラベリングの要否判定
２．４．情報処理サーバ２０の動作の流れ
３．ハードウェア構成例
４．まとめ

＜１．第１の実施形態＞
＜＜１．１．第１の実施形態の概要＞＞
まず、本開示の第１の実施形態の概要について説明する。上述したとおり、近年では、情報処理技術の発展に伴い、種々のアルゴリズムを用いた学習が行われている。例えば、すべての入力にラベル付きの学習データを用いる教師あり学習では、比較的高い学習性能が期待されるが、入力する学習データの量に比例してラベリングの負担も増大することとなる。

一方、半教師学習では、入力にラベル付きの学習データとラベルのない学習データとを用いることで、教師あり学習と比べラベリングの負担を軽減することができる。しかし、半教師学習では、すべての学習データにラベリングを行った場合と比較して、どの程度、性能が劣化しているかが不明であるため、目標性能を確保するために必要なラベル付きデータの量を把握することが困難である。

また、能動学習では、性能向上に寄与すると予測される学習データ、すなわちラベリングすべき学習データを提示することが可能であるが、この場合、ある程度、認識器が完成していることが前提となる。一方、はじめに学習データの収集のみを行い、その後ラベリングを行う場合には、認識器が生成されていないため、ラベリングすべき学習データを提示することができない。

本実施形態に係る情報処理装置および情報処理方法は、上記の点に着目し発想されたものであり、学習データのラベリング状況に係る学習性能を予測することができる。このために、本実施形態に係る情報処理装置は、入力される学習データに基づく次元圧縮を行い、当該学習データに係るデータ分布図を生成する機能を有する。また、本実施形態に係る情報処理装置は、データ分布図と学習データに係るラベリング状況とに基づいて学習性能を予測する機能を有する。また、本実施形態に係るデータ分布図は、学習データから構成されるクラスタの重なり情報、および各クラスタに属する学習データの数、あるいは、分布の情報を含むことを特徴の一つとする。本実施形態に係る情報処理装置および情報処理方法によれば、ラベリングに伴う学習性能の向上を予め予測することにより、ラベリングに係る負担を最小限に抑えることが可能となる。

＜＜１．２．システム構成例＞＞
次に、本実施形態に係るシステム構成例について説明する。図１は、本実施形態に係る情報処理システムの構成例を示す図である。図１を参照すると、本実施形態に係る情報処理システムは、データ収集装置１０、情報処理サーバ２０、情報処理端末３０、および学習装置４０を含んで構成され得る。また、情報処理サーバ２０と、データ収集装置１０、情報処理端末３０、および学習装置４０とは、互いに情報通信が行えるように、ネットワーク５０を介して接続される。

（データ収集装置１０）
本実施形態に係るデータ収集装置１０は、情報処理サーバ２０に入力されるデータセットを収集する装置である。本実施形態に係るデータ収集装置１０は、例えば、ユーザにより入力されるデータセットを記憶する機能を有してもよいし、ネットワーク５０を介して、例えば、インターネットなどのネットワーク上からデータセットを動的に収集する機能を有してもよい。

また、本実施形態に係るデータ収集装置１０は、種々のセンサ情報を収集する機能を有してもよい。この場合、収集されたセンサ情報や当該センサ情報を加工した情報が上記のデータセットとして用いられ得る。

本実施形態に係るデータ収集装置１０は、上記のいずれかの機能を有する装置として定義できる。このため、本実施形態に係るデータ収集装置１０は、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、携帯電話、スマートフォン、タブレット、またはウェアラブルデバイスなどであってもよい。また、本実施形態に係るデータ収集装置１０は、センサ情報を収集する機能を有する種々のセンサ装置であってもよい。

（情報処理サーバ２０）
本実施形態に係る情報処理サーバ２０は、データ収集装置１０により収集されたデータセットから、学習装置４０の学習性能を予測する機能を有する情報処理装置である。より具体的には、本実施形態に係る情報処理サーバ２０は、データ収集装置１０が収集したデータセットに基づく学習データからデータ分布図を生成する機能を有する。また、上述したように、本実施形態に係る情報処理サーバ２０は、生成したデータ分布図と学習データに係るラベリング状況とに基づいて学習装置４０の学習性能を予測する機能を有する。また、本実施形態に係る情報処理サーバ２０は、上記のデータ分布図や予測した学習性能に係る表示制御を行う機能を有する。

（情報処理端末３０）
本実施形態に係る情報処理端末３０は、情報処理サーバ２０による制御に基づいて、上記のデータ分布図や予測された学習性能をユーザに提示する機能を有する。また、本実施形態に係る情報処理端末３０は、ユーザによる入力操作を受け付け、当該入力操作に係る情報を情報処理サーバ２０に送信する機能を有する。すなわち、本実施形態に係る情報処理端末３０は、学習データのラベリングや学習に係るユーザインタフェースをユーザに提供する情報処理装置である。本実施形態に係る情報処理端末３０は、例えば、ＰＣ、スマートフォン、タブレットなどであってよい。

（学習装置４０）
本実施形態に係る学習装置４０は、学習データに基づく学習を行う機能を有する。本実施形態に係る学習装置４０は、例えば、ニューラルネットワーク（ディープラーニング）による半教師学習を行ってよい。また、本実施形態に係る学習装置４０は、ドメイン適応や転移学習、弱教師学習などを行ってもよい。本実施形態に係る学習装置４０は、上記のような学習により得られたモデルを記録または出力する機能を有する。

（ネットワーク５０）
ネットワーク５０は、上述した各装置と情報処理サーバ２０とを接続する機能を有する。ネットワーク５０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）などを含んでもよい。また、ネットワーク５０は、ＩＰ−ＶＰＮ（ＩｎｔｅｒｎｔＰｒｏｔｏｃｏｌ−ＶｉｒｔｕａｌＰｒｉｖａｔｅＮｅｔｗｏｒｋ）などの専用回線網を含んでもよい。また、ネットワーク５０は、Ｗｉ−Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）など無線通信網を含んでもよい。

以上、本実施形態に係る情報処理システムの構成例について説明した。なお、図１を用いた上記の説明では、データ収集装置１０、情報処理サーバ２０、情報処理端末３０、および学習装置４０がそれぞれ独立した情報処理装置として実現される場合を例に述べたが、本実施形態に係る情報処理システムの構成は係る例に限定されない。例えば、本実施形態に係る情報処理サーバ２０は、データ収集装置１０、情報処理端末３０、学習装置４０が有する機能のいずれか、またはすべてを含むように構成されてもよい。例えば、本実施形態に係る情報処理サーバ２０は、データ収集機能と、学習性能の予測機能、および学習機能を有する情報処理装置として実現され得る。

一方、本実施形態に係る情報処理サーバ２０が有する各機能は、２台以上の情報処理装置により実現されてもよい。本実施形態に係るシステム構成例は、扱われる情報の特性やシステムの仕様、運用条件などに応じて柔軟に変形され得る。

＜＜１．３．データ収集装置１０の機能構成例＞＞
次に、本実施形態に係るデータ収集装置１０の機能構成例について詳細に説明する。図２は、本実施形態に係るデータ収集装置１０の機能ブロック図である。図２を参照すると、本実施形態に係るデータ収集装置１０は、入力部１１０、センサ部１２０、記憶部１３０、出力部１４０、および通信部１５０を備える。以下、上記に示す各構成について、当該構成が有する特徴を中心に説明する。

（入力部１１０）
入力部１１０は、ユーザによる入力操作を受け付ける機能を有する。本実施形態に係る入力部１１０は、例えば、ユーザによるデータセットの入力を受け付け、当該データセットを記憶部１３０に引き渡す。入力部１１０は、例えば、各種のボタン、キーボード、タッチパネル、マウス、スイッチなどにより実現され得る。また、入力部１１０は、マイクロフォンなどを含んでよい。

（センサ部１２０）
センサ部１２０は、学習データとして用いられる種々のセンサ情報を収集する機能を有する。このために、本実施形態に係るセンサ部１２０は、例えば、ＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）、Ｗｉ−Ｆｉ、加速度センサ、ジャイロセンサ、地磁気センサ、撮像センサ、マイクロフォン、各種のレーダや光センサ、時計などを含んで構成され得る。なお、本実施形態に係るセンサ部１２０は、上記以外のセンサを含んで構成されてもよい。本実施形態に係るセンサ部１２０は、収集するデータセットに応じたセンサを含んで構成され得る。また、センサ部１２０は、収集したセンサ情報を記憶部１３０に引き渡す。

（記憶部１３０）
記憶部１３０は、入力部１１０またはセンサ部１２０から引き渡されるデータセットを記憶する機能を有する。

（出力部１４０）
出力部１４０は、ユーザに視覚情報や聴覚情報を提示する機能を有する。このために、出力部１４０は、例えば、ディスプレイ装置やスピーカを含んで構成され得る。ここで、上記のディスプレイ装置は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）ディスプレイ装置、液晶ディスプレイ（ＬＣＤ：ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）装置、ＯＬＥＤ（ＯｒｇａｎｉｃＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ）装置、タッチパネル、プロジェクタなどにより実現されてもよい。

（通信部１５０）
通信部１５０は、情報処理サーバ２０との情報通信を行う機能を有する。具体的には、本実施形態に係る通信部１５０は、記憶部１３０に記憶されるデータセットを情報処理サーバ２０に送信する。また、通信部１５０は、情報処理サーバ２０は、情報処理サーバ２０以外の装置との情報通信を行ってもよい。例えば、通信部１５０は、制御部（図示しない）による制御に基づいて、ネットワーク上からデータセットを動的に収集してもよい。

以上、本実施形態に係るデータ収集装置１０の機能構成例について説明した。なお、上記で説明した機能構成はあくまで一例であり、本実施形態に係るデータ収集装置１０の構成は、図２を用いて説明した例に限定されない。本実施形態に係るデータ収集装置１０は、例えば、各構成を制御する制御部を備えてよい。また、データ収集装置１０は、図２に示される構成の一部を備えなくてもよい。本実施形態に係るデータ収集装置１０の構成は、収集する学習データの特性に応じて柔軟に変形され得る。

＜＜１．４．情報処理サーバ２０の機能構成例＞＞
次に、本実施形態に係る情報処理サーバ２０の機能構成例について説明する。図３は、本実施形態に係る情報処理サーバ２０の機能ブロック図である。図３を参照すると、本実施形態に係る情報処理サーバ２０は、学習データ入力部２１０、データ分布提示部２２０、ラベリング候補選択部２３０、ラベリング実行部２４０、学習性能予測部２５０、表示制御部２６０、および通信部２７０を備える。以下、上記に示す各構成の概要について説明する。

（学習データ入力部２１０）
学習データ入力部２１０は、データ収集装置１０により収集されたデータセットを学習データとしてデータ分布提示部に入力する機能を有する。本実施形態に係る学習データ入力部２１０の機能詳細については別途後述する。

（データ分布提示部２２０）
データ分布提示部２２０は、学習データ入力部２１０により入力される学習データに対する次元圧縮を行い、当該学習データに係るデータ分布図を生成する機能を有する。なお、本実施形態に係るデータ分布図には、高次元データを低次元データに射影してプロットした図や、学習データにより構成されるクラスタおよびクラスタ間の重なりの度合いを示す図表が含まれてよい。なお、既にラベリングが行われている学習データが存在する場合、データ分布提示部２２０は、付与されているラベルに応じて色付けを行うことで、ラベリングが行われている学習データとラベリングが行われていない学習データとを区別してもよい。本実施形態に係るデータ分布提示部２２０の機能詳細については別途後述する。

（ラベリング候補選択部２３０）
ラベリング候補選択部２３０は、データ分布提示部２２０により生成されるデータ分布図に基づいて、学習データからラベリング候補を選択する機能を有する。すなわち、本実施形態に係るラベリング候補選択部２３０は、ラベリングによる性能向上の効果が大きいと予測される学習データを選択することができる。なお、既にラベリングが行われている学習データが存在する場合、ラベリング候補選択部２３０は、当該学習データを加味してラベリング候補を選択することができる。本実施形態に係るラベリング候補選択部２３０の機能詳細については別途後述する。

（ラベリング実行部２４０）
ラベリング実行部２４０は、情報処理端末３０の出力部３２０に表示されるデータ分布図において選択された学習データと入力値とに基づいて、当該学習データのラベリングを行う機能を有する。

（学習性能予測部２５０）
学習性能予測部２５０は、データ分布図と学習データに係るラベリング状況とに基づいて、学習装置４０による学習性能を予測する機能を有する。この際、本実施形態に係る学習性能予測部２５０は、各クラスタにラベル付きの学習データが存在するか否か、や、クラスタ間の重なりが発生しているか否か、を判定することで、上記の学習性能を予測することができる。本実施形態に係る学習性能予測部２５０の機能詳細については別途後述する。

（表示制御部２６０）
表示制御部２６０は、データ分布提示部２２０が生成するデータ分布図や学習性能予測部２５０が予測する学習性能に係る表示を制御する機能を有する。また、本実施形態に係る表示制御部２６０は、ラベリング候補選択部２３０が選択したラベリング候補やユーザが選択した学習データに係る表示制御を行う機能を有する。すなわち、本実施形態に係る表示制御部２６０は、情報処理端末３０に表示されるユーザインタフェースの表示を制御する。本実施形態に係る表示制御部２６０の機能詳細については別途後述する。

（通信部２７０）
通信部２７０は、データ収集装置１０、情報処理端末３０、および学習装置４０との情報通信を行う機能を有する。具体的には、本実施形態に係る通信部２７０は、データ収集装置１０から収集されたデータセットを受信する。また、通信部２７０は、表示制御部２６０により生成される制御信号を情報処理端末３０に送信し、情報処理端末３０からユーザによる入力情報を受信する。また、通信部２７０は、学習データを学習装置４０に送信する。

以上、本実施形態に係る情報処理サーバ２０の機能構成例について説明した。なお、上記で説明した機能構成はあくまで一例であり、本実施形態に係る情報処理サーバ２０の構成は、図３を用いて説明した例に限定されない。上述したとおり、本実施形態に係る情報処理サーバ２０は、データ収集装置１０、情報処理端末３０、学習装置４０が有する機能のいずれか、またはすべてを含むように構成されてもよい。

また、情報処理サーバ２０が備える構成の一部は、別の装置の機能として実現することもできる。例えば、データ分布提示部２２０や学習性能予測部２５０は、情報処理サーバ２０とは異なる別の装置の機能として実現されてもよい。また、本実施形態に係る情報処理サーバ２０は、上記で説明した構成以外をさらに備えてもよい。本実施形態に係る情報処理サーバ２０の機能構成は、柔軟に変形され得る。

＜＜１．５．情報処理端末３０の機能構成例＞＞
次に、本実施形態に係る情報処理端末３０の機能構成例について詳細に説明する。図４は、本実施形態に係る情報処理端末３０の機能ブロック図である。図４を参照すると、本実施形態に係る情報処理端末３０は、入力部３１０、出力部３２０、および通信部３３０を備える。

（入力部３１０）
入力部３１０は、ユーザによる入力操作を受け付ける機能を有する。本実施形態に係る入力部３１０は、例えば、ユーザによる学習データの選択操作やラベルの入力操作を受け付ける。また、入力部３１０は、学習装置４０による学習に係るモデル構造やパラメータ、その他の学習設定の入力を受け付けてもよい。入力部３１０は、例えば、各種のボタン、キーボード、タッチパネル、マウス、スイッチなどにより実現され得る。

（出力部３２０）
出力部３２０は、学習データのラベリングや学習に係るユーザインタフェースをユーザに提供する機能を有する。より具体的には、本実施形態に係る出力部３２０は、情報処理サーバ２０の制御に基づいて、上記のユーザインタフェース上にデータ分布図や学習性能を表示する。このために、出力部３２０は、ディスプレイ装置を含んで構成され得る。上記のディスプレイ装置は、例えば、ＣＲＴディスプレイ装置、液晶ディスプレイ装置、ＯＬＥＤ装置、タッチパネル、プロジェクタなどにより実現されてもよい。また、本実施形態に係る出力部３２０は、ユーザに聴覚情報を提示する機能を有してもよい。この場合、出力部３２０は、スピーカなどを含んで構成される。

（通信部３３０）
通信部３３０は、情報処理サーバ２０との情報通信を行う機能を有する。具体的には、本実施形態に係る通信部３３０は、情報処理サーバ２０からユーザインタフェースの表示制御に係る制御信号を受信する。また、通信部３３０は、ユーザが選択した学習データの情報や入力されたラベルの情報を情報処理サーバ２０に送信する。また、通信部３３０は、入力された学習設定に係る情報を学習装置４０に送信してよい。

以上、本実施形態に係る情報処理端末３０の機能構成例について説明した。なお、上記で説明した機能構成はあくまで一例であり、本実施形態に係る情報処理端末３０の構成は、図４を用いて説明した例に限定されない。本実施形態に係る情報処理端末３０は、例えば、各構成を制御する制御部を備えてよい。本実施形態に係る情報処理端末３０の構成は、柔軟に変形され得る

＜＜１．６．学習装置４０の機能構成例＞＞
次に、本実施形態に係る学習装置４０の機能構成例について説明する。図５は、本実施形態に係る学習装置４０の機能ブロック図である。図５を参照すると、本実施形態に係る学習装置４０は、学習部４１０、認識器出力部４２０、および通信部４３０を備える。以下、上記に示す各構成の概要について説明する。

（学習部４１０）
学習部４１０は、学習データに基づく学習を行う機能を有する。上述したとおり、本実施形態に係る学習データには、ラベル付きの学習データとラベルのない学習データとが含まれてよい。本実施形態に係る学習部４１０は、例えば、上記の学習データに基づく半教師学習、ドメイン適応、弱教師学習などを行うことができる。なお、学習に係るモデル構造やパラメータ、その他の学習設定は、情報処理端末３０に表示されるユーザインタフェースを介して入力されてもよい。本実施形態に係る学習部４１０の機能詳細については別途後述する。

（認識器出力部４２０）
認識器出力部４２０は、学習部４１０による学習結果として得られた認識器を出力する機能を有する。本実施形態に係る認識器出力部は、認識器（モデル）の構造やパラメータ、および学習状況などをメモリやファイルなどに記録する。

（通信部４３０）
通信部４３０は、情報処理サーバ２０との情報通信を行う機能を有する。具体的には、本実施形態に係る通信部４３０は、情報処理サーバ２０から学習データを受信する。情報処理サーバ２０により学習データが別途の記憶装置に記憶された場合には、通信部４３０は、当該記憶装置のパスなどを受信してもよい。また、通信部４３０は、情報処理端末３０から学習設定に係る情報を受信してもよい。

以上、本実施形態に係る学習装置４０の機能構成例について説明した。なお、上記で説明した機能構成はあくまで一例であり、本実施形態に係る学習装置４０の構成は、図５を用いて説明した例に限定されない。本実施形態に係る学習装置４０は、例えば、各構成を制御する制御部を備えてよい。本実施形態に係る学習装置４０の構成は、柔軟に変形され得る。

＜＜１．７．データセットの加工＞＞
次に、本実施形態に係る学習データ入力部２１０が有する機能の詳細について説明する。上述したとおり、本実施形態に係る学習データ入力部２１０は、データ収集装置１０により収集されたデータセットを学習データとしてデータ分布提示部に入力する機能を有する。この際、本実施形態に係る学習データ入力部２１０は、収集されたデータセットに次元削減を目的とする加工を施し、加工後のデータを学習データとしてデータ分布提示部２２０に入力することができる。本実施形態に係る学習データ入力部は、例えば、ＰＣＡ（ＰｒｉｎｃｉｐａｌＣｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓ）、オートエンコーダ（ＡｕｔｏＥｎｃｏｄｅｒ）、ＶＡＥ（ＶａｒｉａｔｉｏｎａｌＡｕｔｏＥｎｃｏｄｅｒ）などの手法を用いて上記の加工を行うことができる。

例えば、学習データ入力部２１０は、ＰＣＡによりデータセットを第１主成分、第２主成分、第Ｎ主成分と加工してもよい。また、例えば、学習データ入力部２１０は、オートエンコーダにデータセットを入力し出力された結果を学習データとしてデータ分布提示部２２０に入力してもよい。また、ＶＡＥを用いる場合、エンコーダによる出力から平均パラメータを抽出し当該パラメータを学習データとして扱ってもよい。本実施形態に係る学習データ入力部２１０は、収集されたデータセットや学習のアルゴリズムに応じた加工を施すことができる。なお、データセットの性質や学習のアルゴリズムによっては、学習データ入力部２１０による加工は必ずしも行われなくてもよい。

＜＜１．８．データ分布図の生成＞＞
次に、本実施形態に係るデータ分布提示部２２０が有する機能の詳細について説明する。上述したとおり、本実施形態に係るデータ分布提示部２２０は、学習データ入力部２１０により入力される学習データに対する次元圧縮を行い、当該学習データに係るデータ分布図を生成する機能を有する。この際、本実施形態に係るデータ分布提示部２２０は、ＭＤＳ（Ｍｕｌｔｉ−ＤｉｍｅｎｔｉｏｎａｌＳｃａｌｉｎｇ）やｔＳＮＥ（ｔ−ｄｉｓｔｒｉｂｕｔｅｄＳｔｏｃｈａｓｔｉｃＮｅｉｇｈｂｏｒＥｍｂｅｄｄｉｎｇ）などの手法を用いて上記の次元圧縮を行ってもよい。

例えば、本実施形態に係るデータ分布提示部２２０は、ＭＤＳを用いて、多次元空間におけるデータ間の距離、あるいは、類似度を、距離尺度を維持しながら別次元の空間に射影することができる。また、例えば、本実施形態に係るデータ分布提示部２２０は、ｔＳＮＥを用いて、確率分布の距離尺度に基づく次元圧縮を行ってもよい。

なお、データ分布提示部２２０は、上記以外にも例えば、ＬＬＥ（ＬｏｃａｌｌｙＬｉｎｅａｒＥｍｂｅｄｄｉｎｇ）、ＬＴＳＡ（ＬｏｃａｌＴａｎｇｅｎｔＳｐａｃｅＡｌｉｇｎｍｅｎｔ）、ＨｅｓｓｉａｎＬＬＥ、ＭａｎｉｆｏｒＬＬｅ、Ｉｓｏｍａｐ、ＳｐｅｃｔｒａｌＥｍｂｅｄｄｉｎｇなどを用いて次元圧縮を行うこともできる。

図６Ａは、データ分布提示部２２０による次元圧縮処理により生成される学習データのプロット図の一例を示す図である。図６Ａに示すように、本実施形態に係るデータ分布提示部２２０は、ｔＳＮＥなどを用いて学習データを二次元平面上にプロットすることができる。このように、本実施形態に係るデータ分布図には、次元圧縮により可視化された学習データのプロット図が含まれてよい。

なお、データ分布提示部２２０は、点によるプロットの他、密度推定などを用いた図を生成してもよい。この場合、データ分布提示部２２０は、図６Ｂに示すような密度推定線を付加したデータ分布図を生成することができる。

さらには、データ分布提示部２２０は、密度推定処理を簡略化し、パラメトリックな分布推定を行ってもよい。データ分布提示部２２０は、例えば、混合ガウス分布やk−ｍｅａｎｓなどを用いることができる。この際、混合ガウス分布における混合数やｋ−ｍｅａｎｓにおけるｋの値は、ユーザにより設定されてもよい。

また、本実施形態に係るデータ分布提示部２２０は、図６Ａおよび図６Ｂに示したようなプロット図を簡略化した分布イメージ図を生成することもできる。図７は、データ分布提示部２２０により生成される分布イメージ図の一例である。図７には、次元圧縮により、二次元平面上に３つのクラスタが確認された場合の学習データの分布イメージが示されている。図７を参照すると、３つのクラスタＡ〜Ｃには、それぞれ９０、５０、６０の学習データにより構成されていることがわかる。また、クラスタＡおよびＢは、１０の学習データを共有していることがわかる。

さらには、本実施形態に係るデータ分布提示部２２０は、各クラスタに属する学習データの数を表にまとめた分布重なり表を生成してもよい。図８は、データ分布提示部２２０により生成される分布重なり表の一例である。図８に示すように、本実施形態に係る分布重なり表は、縦軸および横軸にクラスタのＩｄを配置し、縦軸および横軸の交差点に、対応するクラスタに属する学習データの数を示すものであってもよい。

例えば、図８には、クラスタＡ（縦軸）とクラスタＡ（横軸）の交差点に８０という数字が示されているが、これはクラスタＡのみに属する学習データが８０存在することを表している。また、図８には、クラスタＡ（縦軸）とクラスタＢ（横軸）の交差点に１０という数字が示されているが、これはクラスタＡとクラスタＢの両方に属する学習データが１０存在することを表している。

本実施形態に係るデータ分布提示部２２０は、低次元空間上のデータから図８に示すような分布重なり表を生成してもよいし、元の高次空間上の距離から計算し分布重なり表を生成してもよい。

以上説明したように、本実施形態に係るデータ分布提示部２２０は、入力される学習データに対する次元圧縮を行い、当該学習データに係るデータ分布図を生成することができる。また、本実施形態に係るデータ分布図には、次元圧縮により生成されるプロット図や、当該プロット図を簡略化した分布イメージ図、各クラスタに属する学習データの数を表にまとめた分布重なり表などを含んでよい。すなわち、本実施形態に係るデータ分布図は、学習データから構成されるクラスタの重なり情報、および各クラスタに属する学習データの数の情報を含んだ図と定義できる。

本実施形態に係るデータ分布提示部２２０が生成するデータ分布図が情報処理端末３０のユーザインタフェース上に表示されることで、ユーザが学習データの分布を視覚的に把握することが可能となる。なお、この際、表示制御部２６０は、データ分布提示部２２０が生成するいずれかのデータ分布図を情報処理端末３０の出力部３２０に表示させてもよいし、すべてのデータ分布図を表示させてもよい。また、表示制御部２６０は、ユーザの操作により各データ分布図の表示有無を切り替える制御を行ってもよい。

＜＜１．９．ラベリング候補の選択＞＞
次に、本実施形態に係るラベリング候補選択部２３０が有する機能の詳細について説明する。上述したとおり、本実施形態に係るラベリング候補選択部２３０は、データ分布提示部２２０が生成するデータ分布図に基づいて、学習データからラベリング候補を選択する機能を有する。

この際、本実施形態に係るラベリング候補選択部２３０は、データ分布図においてクラスタの重心付近に位置する学習データをラベリング候補として選択してもよい。重心付近とは、必ずしも厳密ではなくてよい。境界付近と比べて、重心付近のデータがよりクラスタを代表するラベルになっていると期待するためである。また、表示制御部２６０は、ラベリング候補選択部２３０が選択したラベリング候補を情報処理端末３０の出力部３２０に表示させる。

図９は、表示制御部２６０の制御に基づいて出力部３２０に表示されるラベリング候補の一例を示す図である。図９には、データ分布提示部２２０により生成されたデータ分布図が示されている。ここで、データ分布図には、クラスタＡ〜Ｃと、クラスタＡ〜Ｃにおいてラベリング候補選択部２３０が選択したラベリング候補ＣＡ１〜ＣＡ３とがそれぞれ示されている。

このように、本実施形態に係るラベリング候補選択部２３０は、各クラスタの重心付近に位置する学習データをラベリング候補として選択することができる。なお、クラスタに既にラベル付きの学習データが存在する場合には、ラベリング候補選択部２３０は、ラベル付きの学習データが存在しないクラスタにおける学習データを優先的にラベリング候補として選択してよい。本実施形態に係るラベリング候補選択部２３０が有する上記の機能によれば、性能向上に寄与すると予測される学習データをユーザが直観的に把握することが可能となる。

また、すべてのクラスにラベル付きの学習データが存在する場合には、本実施形態に係るラベリング候補選択部２３０は、より境界付近に位置する学習データをラベリング候補として選択してもよい。これは、本実施形態に係るラベリング候補選択部２３０が、誤認識率が高いと予測される学習データをラベリング候補として選択することで、境界付近の厳密な識別面を獲得するためである。ラベリング候補選択部２３０が有する上記の機能によれば、能動学習で行われるようなより効率のよいラベリングを実現することが可能である。

また、例えば、クラスタの共通部分にラベル付きの学習データが存在する場合などには、ラベリング候補選択部２３０は、当該学習データをラベリング候補として選択してもよい。すなわち、ラベリング候補選択部２３０は、誤認識率の要因となり得る学習データに係るラベルの削除または付け直しをユーザに促してもよい。

＜＜１．１０．ラベリングの実行＞＞
次に、本実施形態に係るラベリングの実行について詳細に説明する。上述したとおり、本実施形態に係るラベリング実行部２４０は、出力部３２０に表示されるデータ分布図において選択された学習データと入力値とに基づいて、当該学習データのラベリングを行う機能を有する。

図１０は、情報処理端末３０の出力部３２０に表示されるユーザインタフェースＩＦ１の一例である。出力部３２０は、表示制御部２６０による制御に基づいて、ユーザインタフェースＩＦ１を表示することができる。図１０を参照すると、本実施形態に係るユーザインタフェースＩＦ１は、３つの領域Ｒ１〜Ｒ３を含んでいる。

ここで、領域Ｒ１は、データ分布提示部２２０により生成されたデータ分布図を表示するための領域であってよい。図１０を参照すると、領域Ｒ１には、３つのクラスタを含むデータ分布図が示されている。また、当該データ分布図には、ラベリング候補選択部２３０が選択したラベリング候補ＣＡ４〜ＣＡ６が併せて表示されている。このように、本実施形態に係るラベリング候補選択部２３０は、１つのクラスタにおいて複数のラベリング候補を選択してもよい。

また、ユーザは、ラベリング候補選択部２３０が選択したラベリング候補の他、自らの操作によりラベリングを行う学習データを選択してよい。この場合、例えば、ユーザがデータ分布図においてクラスタをクリックしたことに基づいて、クリックしたポイント付近に位置する学習データがラベリング候補ＣＡ４〜ＣＡ６として表示されてもよい。この際、ユーザは続いて、ラベリング候補ＣＡ４〜ＣＡ６のうち任意の学習データを再度クリックすることで、実際にラベリングを行う学習データを選択することができる。なお、図１０では、ユーザまたはラベリング候補選択部２３０によりラベリング候補ＣＡ４が実際のラベリング対象として選択された場合の例を示している。

この際、本実施形態に係る表示制御部２６０は、選択された学習データに基づいて、当該学習データに対応する参照情報を出力部３２０に表示させることができる。図１０の領域Ｒ２には、表示制御部２６０の制御に基づいて表示される参照情報が示されている。ここで、本実施形態に係る参照情報は、学習データの内容をユーザが把握するための情報であってよい。図１０には、参照情報がネコの画像である場合の例が示されている。すなわち、図１０に示す一例は、学習装置４０が画像情報に基づく認識タスクを行う場合、表示制御部２６０が学習データの内容を示す画像をユーザに提示することを示している。

本実施形態に係る表示制御部２６０が有する上記の機能によれば、ユーザが、ユーザインタフェースＩＦ１に表示される参照情報を視認することで、学習データの内容を把握し、適切なラベリングを行うことが可能となる。図１０に示す一例では、ユーザは領域Ｒ２に表示される参照情報を視認し、領域Ｒ３において、学習データのラベルを、「Ｃａｔ」、と入力している。この際、ユーザは、自由入力を行ってもよいし、予め作成されたリストから選択してラベリングを行ってもよい。ラベリング実行部２４０は、入力されたラベルに基づいて、選択された学習データのラベリングを実行する。

なお、本実施形態に係る参照情報は、データ収集装置１０により収集されたオリジナルデータであってもよいし、オリジナルデータを基に適宜加工が施されたデータであってもよい。例えば、オリジナルデータが画像データである場合、本実施形態に係る参照情報は、上記のオリジナルデータの解像度を変更した画像データであってもよいし、トリミングを行った画像データであってもよい。

また、本実施形態に係る参照情報は、画像情報に限定されない。例えば、学習装置４０が収集されたセンサ情報に基づく認識タスクを行う場合、本実施形態に係る参照情報は、選択された学習データに対応するセンサ情報であってもよい。図１１は、本実施形態に係る参照情報がセンサ情報である場合の例を示す図である。図１１には、ユーザインタフェースＩＦ１の領域Ｒ２に表示される参照情報ｄ１が示されている。ここで、参照情報ｒ１は、例えば、加速度情報、ジャイロ情報、地磁気情報、気圧情報などを示す波形データであってよい。

また、この際、本実施形態に係る表示制御部２６０は、参照情報ｄ１に加え、参照情報ｒ１と同期した付随データｒ１を、参照情報ｄ１と関連付けて表示させることができる。図１１に示す一例では、付随データｒ１は、センサ情報である参照情報ｄ１と時間的に同期された動画データであってよい。すなわち、本実施形態に係る表示制御部２６０は、センサ情報の収集時に同時に録画された動画データを付随データとしてユーザインタフェース上に表示させることができる。

本実施形態に係る表示制御部２６０が有する上記の機能によれば、学習データがセンサ情報のように、ユーザが直観感的に把握することが困難なデータである場合であっても、ユーザによる適切なラベリングを補助することが可能となる。

なお、上記では、単一の学習データにラベリングを行う場合を例に説明したが、本実施形態に係るユーザインタフェースＩＦ１によれば、複数の学習データに同時にラベリングを行うことも可能である。この場合、本実施形態に係る表示制御部２６０は、ユーザまたはラベリング候補選択部２３０により選択された複数の学習データに対応する複数の参照情報を表示させることができる。また、ユーザは、表示される複数の参照情報を確認し、異なるラベルを付けるべき学習データを排除したうえで、残った複数の学習データに同時にラベリングを行うことが可能である。

＜＜１．１１．学習性能の予測＞＞
次に、本実施形態に係る学習性能予測部２５０の機能詳細について説明する。上述したとおり、本実施形態に係る学習性能予測部２５０は、データ分布提示部２２０が生成するデータ分布図と学習データに係るラベリング状況とに基づいて、学習装置４０の学習性能を予測する機能を有する。

本実施形態に係る学習性能予測部２５０は、例えば、ラベリング実行部２４０により学習データのラベリングが実行されたことに基づいて、上記の学習性能を予測してもよい。図１２は、本実施形態に係る学習性能予測部２５０による学習性能の予測について説明するための図である。

図１２には、データ分布提示部２２０により生成されたデータ分布図上に、学習性能予測部２５０が予測した学習性能が併せて表示される場合の例が示されている。ここで、図１２に示す一例は、クラスタＡに属する学習データｄｌ１にラベリングが行われた場合の学習性能の予測結果を示しており、また、各クラスタＡ〜Ｃを構成する学習データの数は、図８に示すとおりの構成であってよい。また、図１２に示す一例では、クラスタＡに属する学習データｄｌ１以外の学習データには、ラベリングが行われていないものとする。

この際、本実施形態に係る学習性能予測部２５０は、単一のクラスタのみに属するラベル付きの学習データが存在する場合、当該クラスタのみに属するラベルのない学習データは、当該ラベル付きの学習データと同一のクラスに分類されると予測してよい。

図１２に示す一例では、学習データｄｌ１は、クラスタＡのみに属している。このため、学習性能予測部２５０は、クラスタＡのみに属するラベルのない学習データ、すなわち、差集合Ａ−Ｂに属するラベルのない学習データは、すべて学習データｄｌ１と同一のクラスに分類されると予測できる。

また、本実施形態に係る学習性能予測部２５０は、あるクラスタにおいて、当該クラスタのみに属するラベル付きの学習データが存在しない場合、当該クラスタのみに属するラベルのない学習データが正しいクラスに分類される確率は、全クラスタ数の逆数に比例すると予測してよい。

上述したとおり、図１２に示す一例では、学習データｄｌ１のみにラベリングが行われている状況であり、クラスタＢまたはＣに属する学習データは、すべてラベルのない学習データであってよい。この際、本実施形態に係る学習性能予測部２５０は、クラスタＢのみに属する４０の学習データが正しいクラスに分類される確率は、全クラスタ数の逆数、すなわち、１／３であると予測することができる。つまり、学習性能予測部２５０は、クラスタＢのみに属する学習データ、すなわち、差集合Ｂ−Ａに属する４０の学習データのうち、正しいクラスに分類される学習データは１３データであると予測する。

また、同様に、学習性能予測部２５０は、クラスタＣのみに属する６０の学習データが正しいクラスに分類される確率は、１／３であると予測する。つまり、学習性能予測部２５０は、クラスタＣのみに属する学習データのうち、正しいクラスに分類される学習データは２０データであると予測してよい。

また、本実施形態に係る学習性能予測部２５０は、クラスタの共通部分に属するラベルのない学習データが正しいクラスに分類される確率は、前記共通部分を形成するクラスタ数の逆数に比例すると予測することができる。図１２に示す一例では、クラスタＡおよびＢにより形成される共通部分に１０の学習データが属している。この場合、学習性能予測部２５０は、ＡおよびＢの共通部分に属する１０の学習データが正しいクラスに分類される確率は、１／２であると予測することができる。つまり、学習性能予測部２５０は、ＡおよびＢの共通部分に属する１０の学習データのうち、正しいクラスに分類される学習データは１３データであると予測する。

以上の演算の結果、学習性能予測部２５０は、全体で１９０の学習データのうち、正しいクラスに分類される学習データは１１２データであり、正答率はおよそ６２％であると予測することができる。

次に、図１２の示す状態において、新たにクラスタＢのみに属する学習データにラベリングが行われた場合について述べる。また、この際、クラスタＢのみに属する学習データに付与されたラベルと、クラスタＡのみに属する学習データｄｌ１に係るラベルが同一であった場合を想定する。この場合、差集合Ａ−Ｂ、差集合Ｂ−Ａ、およびＡとＢの共通部分に属する計１３０の学習データは、すべて学習データｄｌ１と同一のクラスに分類されると予測できる。一方、上述の演算により、クラスタＣについては、６０データのうち２／３が誤分類されると予測されるため、全体の正答率は、１５０／１９０＝７９％と予測できる。

他方、図１２に示す状態において、クラスタＢのみに属する学習データに付与されたラベルが、クラスタＡのみに属する学習データｄｌ１に係るラベルとは異なる場合、ＡとＢの共通部に属する１０の学習データは、上述の演算により５０％が誤って分類されると予測される。なお、クラスタＣに属する学習データについては、他の例と同様に４０データが誤って分類されると予測されるため、全体の正答率は、１４５／１９０＝７６％と予測できる。また、上記の状態において、クラスタＣに属する学習データに新たにラベリングが行われた場合は、クラスタＣに属する６０の学習データは、すべて正しいクラスに分類されると予測される。この結果、誤って分類される学習データは、ＡおよびＢの共通部分に属する１０の学習データのうちの５０％、すなわち５データのみとなり、学習性能予測部２５０は、全体の正答率を、１８５／１９０＝９７％と予測する。

以上、本実施形態に係る学習性能予測部２５０による学習性能の予測方法について説明した。上述したように、本実施形態に係る学習性能予測部２５０は、データ分布図と学習データのラベリング状況とに基づいて、学習性能の予測を行うことができる。なお、図１２を用いた上記の説明では、学習データのラベリングが実行されたことに基づいて、学習性能予測部２５０による性能予測が行われる場合を例に説明した。一方、本実施形態に係る学習性能予測部２５０は、ラベリングが行われていない場合であっても、学習性能を予測することが可能である。

この場合、本実施形態に係るデータ分布提示部２２０は、クラスタ数の設定に係るハイパーパラメータをスイープし、各値を用いたクラスタリングを実行することで、クラスタ数の異なる複数のデータ分布図を生成してよい。続いて、本実施形態に係る学習性能予測部２５０は、上記の複数のデータ分布図に基づいて、各クラスタ数における最大学習性能の予測を行うことができる。この際、学習性能予測部２５０は、すべてのクラスタにラベル付きの学習データが存在する場合の学習性能を予測し、当該学習性能を最大学習性能としてよい。より正確には、学習性能予測部２５０は、すべてのクラスタにおいて、各クラスタのみに属するラベル付きの学習データが存在する場合の学習性能を、最大学習性能として予測することができる。

また、本実施形態に係る表示制御部２６０は、上記のクラスタ数と上記の最大学習性能とを関連付けて表示させてよい。この際、本実施形態に係る表示制御部２６０は、各クラスタ数における最大学習性能の比較を表示させることができる。

図１３は、各クラスタ数における最大学習性能の比較例を示す図である。本実施形態に係る表示制御部２６０は、例えば、図１３に示すようなグラフをユーザインタフェースＩＦ１上に表示させてもよい。図１３に示す一例では、横軸にクラスタ数が示されており、また、縦軸に予測された最大学習性能が示されている。また、図１３には、学習性能の許容値Ｔ１が破線により示されている。ここで、許容値Ｔ１は、許容され得る学習性能の最小値を示すものであり、例えば、ユーザなどにより予め設定される値であってよい。

ユーザは、図１３に示すようなグラフを確認することで、許容値を満たすために必要なクラスタ数、すなわち、ラベリングが必要な学習データの数を把握することができる。具体的には、図１３に示す一例では、クラスタ数が１０を超える場合、学習性能が許容値を上回ることを示している。ここで、上述したとおり、図１３に示される学習性能は、各クラスタのみに属するラベル付き学習データが存在する場合の最大学習性能であってよい。このため、ユーザは、許容値を超える学習性能を確保するためには、各クラスタのみに属する１０の学習データにラベリングを行えばよいことを把握できる。

また、図１３を参照すると、クラスタ数がＮ−２以上である場合、最大学習性能がほぼ変化しないことがわかる。すなわち、図１３に示すグラフは、クラスタ数がＮ−２以上である場合には、ラベリングの負担が増加する一方、得られる性能向上効果が低いことを示唆している。このように、本実施形態に係る学習性能予測部２５０がクラスタ数ごとの最大学習性能を予測することで、ユーザは、ラベリングにより得られる性能向上効果を視覚的に把握することができ、不要なラベリングを行う手間を省くことができる。例えば、ユーザは、図１３に示すようなグラフを確認したうえで、クラスタ数を決定し、生成されたデータ分布図に基づいて、各クラスタの重心付近に位置する学習データにラベリングを行ってもよい。この際、ユーザは、例えば、ｋ−ｍｅａｎｓにおけるｋの値を設定することで、上記のクラスタ数を制御することができる。ユーザは、ｋの値を小さく設定することで、ラベリングの負担を軽減することを優先してもよいし、ｋの値を大きく設定することで、学習性能の向上を優先してもよい。

また、本実施形態に係るクラスタ数の決定は、学習性能予測部２５０により動的に行われてもよい。すなわち、本実施形態に係る学習性能予測部２５０は、各クラスタ数における最大学習性能に基づいて最適クラスタ数を決定することができる。この際、学習性能予測部２５０は、上述した許容値や設定された優先モードなどに基づいて、上記の最適クラスタ数を決定してもよい。また、本実施形態に係るデータ分布提示部２２０は、上記の最適クラスタ数に基づいて、データ分布図を生成してよい。上述したように、データ分布図は、最適クラスタ数に基づいてｋの値を設定することで、生成するデータ分布図におけるクラスタ数を制御することができる。

＜＜１．１２．学習データに基づく学習＞＞
次に、学習装置４０による学習の詳細について説明する。上述したとおり、本実施形態に係る学習装置４０の学習部４１０は、ラベル付きの学習データとラベルのない学習データとに基づく学習を行う機能を有する。本実施形態に係る学習部４１０は、例えば、上記の学習データに基づく半教師学習、ドメイン適応、弱教師学習などを行ってもよい。なお、以下においては、学習部４１０が半教師学習を行う場合を例に説明する。

本実施形態に係る学習部４１０は、学習性能予測部２５０が予測した学習性能を正とし、当該学習性能を満たすために、例えば、ニューラルネットワークの設計や手法を変更しながら学習性能を向上させる機能を有する。この際、学習部４１０は、例えば、広く用いられるＶＡＥ、ＡＤＧＭ、ＳＤＧＭ、ＤＣＧＡＮ、ＬａｄｄｅｒＮｅｔ、ＶＡＴ、またはＡＡＥなどによる半教師学習を行ってもよい。学習部４１０は、学習データの性質などに基づいて、上記から有用な手法を選択し、当該手法に応じたニューラルネットワークを設計する機能を有してもよい。以下、上記に挙げた各方法について概要を説明する。

（ＶＡＥ）
ＶＡＥは、ＤＧＭ(ＤｅｅｐＧｅｎｅｒａｔｉｖｅＭｏｄｅｌｓ)を学習するために、変分ベイズとオートエンコーダを融合した手法である。ＶＡＥでは、一般的なオートエンコーダとは異なり、ロス関数に代えてモデルエビデンスの変分下限が用いられる。また、ＶＡＥでは、変分下限の計算のため、中間層に確率的な層（ガウスサンプリング層）を有することを特徴の一つとする。

ＶＡＥは従来、教師なし学習に用いられる手法であるが、本実施形態では、拡張されたＶＡＥを用いることで半教師学習を行うことができる。より具体的には、本実施形態に係る学習部４１０は、拡張されたラベル入力付きのＶＡＥと、認識モデルとを組み合わせることで半教師学習を行う。

図１４は、ＶＡＥを用いた半教師学習を行うニューラルネットワークＮＮ１のネットワーク構造を示す図である。図１４に示すように、ニューラルネットワークＮＮ１は、モデルＭ１およびモデルＭ２から構成される。

ここで、モデルＭ１は、教師なし学習による事前学習を行うＶＡＥである。より詳細には、モデルＭ１は、エンコーダｅ１により推論分布をモデル化し、デコーダｄ１により生成分布をモデル化することができる。この際、モデルＭ１の目的関数は、モデルエビデンスの変分下限により表現される。なお、上記目的関数に含まれる、内部変数ｚ_１による周辺化の処理はサンプリング積分により近似される。

また、モデルＭ２は、実際の半教師学習を行うモデルである。具体的には、モデルＭ２は、モデルＭ１が生成した特徴量を学習データとして半教師学習を行うことができる。すなわち、モデルＭ１による特徴抽出は、モデルＭ２に用いられる学習データの加工と見なすこともできる。

（ＡＤＧＭおよびＳＤＧＭ）
ＡＤＧＭは、ＡｕｘｉｌｉａｒｙＤｅｅｐＧｅｎｅｒａｔｉｖｅＭｏｄｅｌｓの略称である。また、ＳＤＧＭは、ＳｋｉｐＤｅｅｐＧｅｎｅｒａｔｉｖｅＭｏｄｅｌｓの略称であり、ＡＤＧＭと類似のグラフモデルで表される。ここで、上記のＡｕｘｉｌｉａｒｙは、確率的補助変数を表しており、当該確率的補助変数は、変分ベイズの推論分布推定などにおいて分布の表現力を向上させるために用いられる。

ＡＤＧＭおよびＳＤＧＭは、一括学習（ＥｎｄＴｏＥｎｄ）による半教師学習を実現するモデルである。なお、上述したＶＡＥを用いたモデルＭ２も単体で半教師学習を行うことができるが、性能向上のためには、モデルＭ１およびＭ２による二段階学習が望ましい。一方、ＡＤＧＭは、補助変数を用いてモデルＭ２の表現能力を増加させており、一括学習を実現することができる。

（ＤＣＧＡＮ）
ＤＣＧＡＮ（ＤｅｅｐＣｏｎｖｏｌｕｔｉｏｎａｌＧｅｎｅｒａｔｉｖｅＡｄｖｅｒｓａｒｉａｌＮｅｔｗｏｒｋ）は、ＧＡＮ（ＧｅｎｅｒａｔｉｖｅＡｄｖｅｒｓａｒｉａｌＮｅｔｗｏｒｋ）を精緻化したモデルである。ここで、ＧＡＮとは、生成モデルと判別モデル（真偽判別モデル）とを対向させて学習させる手法である。なお、真偽判別モデルとは、入力されたデータが真のデータであるか、生成モデルが生成した偽のデータであるかを判別する判別器のことを示す。ＧＡＮでは、生成モデルが真偽判別モデルによる誤判別を増加させるように動作し、真偽判別モデルは生成モデルが生成した偽のデータを偽物と見抜く率を向上させるように動作する。この結果、生成モデルは、真のデータにより近いデータを生成する能力を獲得する。

ＤＣＧＡＮでは、上記の真偽判別モデルを特徴抽出モデルとして用いることもできる。また、この特徴抽出モデルと、判別モデルを組み合わせて半教師学習も実現できる。具体的には、真偽判別モデルの各層の出力を接続し、ＳＶＭ（ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ）などの学習を行う。

（ＬａｄｄｅｒＮｅｔ）
ＬａｄｄｅｒＮｅｔは、はしご（Ｌａｄｄｅｒ）結合を有するデノイジングオートエンコーダと認識モデルとを組み合わせた手法である。ＬａｄｄｅｒＮｅｔでは、エンコーダと認識モデルとが重みを共有し、また、エンコーダとデコーダは同一の深さで構成され、同じ深さの階層間に結合を有する。なお、エンコーダからデコーダへの結合は、デノイジングの作用を有する演算により構成される。

（ＡＡＥ）
ＡＡＥ（ＡｄｖｅｒｓａｒｉａｌＡｕｔｏＥｎｃｏｄｅｒ）は、上述したＧＡＮにおける真偽判別モデルをＶＡＥの中間層に対する事前分布と推論分布の真偽判定に用いる手法である。ＡＡＥは、すなわち、中間層をラベルとスタイルに分離することで半教師学習を実現する。

以上、本実施形態に係る学習部４１０が採用し得るニューラルネットワークの構成について、例を挙げて説明した。上記に述べたニューラルネットワークは、認識モデル、生成モデル、推論モデル、また真偽判別モデルといった複数のモジュールを組み合わせ、同時に学習する構成である。なお、各モジュールに対応するネットワークは、ＣＮＮ、バッチノーマライゼーション、ＲＮＮ、ＲｅｓｉｄｕａｌＮｅｔなどのより簡素なモジュールの組み合わせにより構成され得る。学習部４１０は、上記で述べたようなモジュールを用いてニューラルネットワークを設計し、学習性能予測部２５０により予測された学習性能に近づくように学習を行うことができる。なお、実際の学習性能と予測値とが大きく乖離する場合には、ラベリングの不足が原因と予想されるため、ラベル付きの学習データを増やしたうえで、再度、学習部４１０に学習を行わせてもよい。

＜＜１．１３．本実施形態に係る半教師学習の効果＞＞
次に、本実施形態に係る半教師学習の効果について、具体例を挙げて説明する。以下では、学習装置４０にラケットスポーツＡおよびＢにおけるスイング種別の判別タスクを行わせた際の判別結果について述べる。

まず、ラケットスポーツＡにおけるスイング種別の判定タスクの結果について説明する。ここでは、ラケットに装着したデータ収集装置１０により、３軸方向の加速度および角速度をそれぞれ所定の周波数でサンプリングし、時系列の切り出し波形をデータセットとした。また、学習時には、９クラスのスイング動作に係るラベル付きの学習データを作成し学習装置４０に半教師学習を行わせ、テスト時には、学習データにない波形データからスイング動作の種別を推定させた。

図１５は、ラケットスポーツＡにおけるスイング種別の判定結果を示す図である。ここで、図１５には、縦軸に誤判別率が示されており、横軸にラベル付きの学習データの数が示されている。また、図１５には、半教師学習を行わせた際の判別結果ＬＣ１と教師あり学習を行わせた際の判別結果ＬＣ２とが示されている。図１５を参照すると、９０のラベル付きデータを用いた場合、半教師学習を行った場合の誤判別率は、教師あり学習を行った場合の誤判別率を大きく下回ることがわかる。なお、この際、半教師学習においては、９０のラベル付きデータと併せて１４４９０のラベルなしデータを用いた。

また、図１６の左側には、ラケットスポーツＡの判別タスクにおいて用いられた学習データのクラスタリング結果が示されている。なお、図１６に示すクラスタリング結果では、各クラスに対応する学習データを、数字を用いて模式的に表現している。図１６を参照すると、ラケットスポーツＡに係るクラスタリング結果では、一部クラスに対応するクラスタが分離して存在するものの、各クラスタの境界は明瞭であることがわかる。

ラケットスポーツＢにおけるスイング種別の判定タスクの結果について説明する。ラケットスポーツＢに係る判別タスクでは、ラケットスポーツＡの場合と同様に、データ収集装置１０により収集されたセンサ情報を加工し学習データに用いた。ただし、ラケットスポーツＢに係る判別タスクでは、１８クラスのスイング動作に係るラベル付きの学習データを作成し学習を行わせている。

図１７は、ラケットスポーツＢにおけるスイング種別の判定結果を示す図である。図１７には、図１５と同様に、縦軸に誤判別率が示されており、横軸にラベル付きの学習データの数が示されている。また、図１７には、半教師学習を行わせた際の判別結果ＬＣ３と教師あり学習を行わせた際の判別結果ＬＣ４とが示されている。図１７に示すように、ラケットスポーツＢに係る判別タスクにおいても、半教師学習を行った場合の誤判別率は、教師あり学習を行った場合の誤判別率を下回ることがわかる。

また、図１６の右側には、ラケットスポーツＢの判別タスクにおいて用いられた学習データのクラスタリング結果が示されている。図１６を参照すると、ラケットスポーツＢに係るクラスタリング結果では、ラケットスポーツＡのクラスタリング結果と比較してクラスタの重なりが目立つものの、各クラスタをおおまかに把握できることがわかる。

以上、本実施形態に係る半教師学習の効果について説明した。なお、上記では、ラケットスポーツＡおよびＢにおけるスイング種別の判別タスクについて述べたが、本実施形態に係る半教師学習は、例えば、手書き数字の判別タスクや行動認識の判別タスクに用いられてもよい。上述したように、本実施形態に係る半教師学習によれば、教師あり学習に比べ、より精度の高い判別を実現することが期待される。

また、本実施形態に係る学習部４１０は、類似性を有する異なる２つ以上のデータセットを用いて学習を行ってもよい。例えば、本実施形態に係る学習部４１０は、ラケットスポーツＡおよびＢに係るデータセットを統合し、半教師学習を行うこともできる。

上記で述べたラケットスポーツＡおよびＢは、互いに種別の異なるスポーツではあるが、ラケットに装着したデータ収集装置１０により、当該ラケットに加わる加速度やねじれを計測した時系列データを学習に用いる点で共通している。このような場合、本実施形態に係る学習部４１０は、収集されるデータセットの感度や系列の長さを同一にすることで、両スポーツにおいて収集されたデータセットを同一形式として扱うことができる。一方、この場合、ラケットスポーツＡおよびＢでは、スイング動作に係る種別、すなわちラベルが異なる。このように、本実施形態に係る類似性を有する異なるデータセットとは、例えば、上記の例のラケットスポーツの例にように、関節の動きなどの、共通背景を有するデータセットにおいて、それぞれラベリングルールが異なるものを指す。

図１８は、本実施形態に係る類似性を有する異なる２つ以上のデータセットを用いた学習について説明するためのデータフロー図である。図１８には、類似性を有する異なる２つのデータセットＤＳ１およびＤＳ２が示されている。ここで、データセットＤＳ１およびＤＳ２は、上述したように、ラケットスポーツＡおよびＢに係るデータであり得る。この場合、例えば、本実施形態に係る学習部４１０は、学習機能Ｆｕｎ１により、データセットＤＳ１およびＤＳ２に基づいて、ラケットスポーツＡに係るスイング種別判別の学習を行うことができる。この際、例えば、学習部４１０は、ラケットスポーツＢに付与されているラベルを使用せずに、ラケットスポーツＢのデータをラベルなしデータとして半教師学習に用いてもよい。また、認識器出力部４２０は、認識器出力機能Ｆｕｎ２により、学習結果として得られたラケットスポーツＡのスイング動作に係る認識器ＲＭ１を出力する。

以上、本実施形態に係る類似性を有する異なるデータセットに基づく学習について説明した。なお、本実施形態に係る類似性を有する異なるデータセットには、例えば、ラベリングルールの異なる元々同種のデータセットが含まれてよい。例えば、当初は３クラスによる識別を行っていた学習において、詳細化によりクラス数を９に増やした場合、各クラス数による学習に用いられるデータセットは、類似性を有する異なるデータセットといえる。

また、類似する認識対象であるものの一方のデータセットに対するラベリングが困難な場合も、本実施形態では、各データセットを、類似性を有する異なるデータセットとして扱うことができる。例えば、人間のバイタル情報から感情のラベルを取得したい場合において、プライバシー保護などの理由からデータを収集するのが困難な場合、動物のバイタル情報を用いてデータを割増し、学習を行うことが可能である。この場合、動物のバイタルデータは取得できても感情のラベルは取得が困難なため、半教師学習のようなラベルなしデータトラベルありデータを混在して学習する手法が必要である。また、このような例の他にも、ラベルを収集できない、あるいは、収集が困難なタスクに対し、計算機シミュレーションでラベル付きデータを擬似的に収集してもよい。

なお、図１８を用いた説明では、一方のデータセットのラベルを使用せずにラベルなしデータとして用いる場合を例に述べたが、本実施形態に係る学習部４１０は、例えば、両方のデータセットのラベルを用いて半教師学習を行ってもよい。また、両方のデータセットのラベルを使用せずにデータ分布を調べ、両データセットの分布の類似性などを比較することも可能である。

＜＜１．１４．情報処理サーバ２０の動作の流れ＞＞
次に、本実施形態に係る情報処理サーバ２０の動作の流れについて詳細に説明する。図１９は、情報処理サーバ２０の動作の流れを示すフローチャートである。

図１９を参照すると、まず、情報処理サーバ２０の通信部２７０は、データ収集装置１０からデータセットを受信する（Ｓ１１０１）。

次に、学習データ入力部２１０は、ステップＳ１１０１で受信したデータセットに次元削減を目的とする加工を施し、加工後のデータを学習データとしてデータ分布提示部２２０に入力する（Ｓ１１０２）。この際、学習データ入力部２１０は、上述したとおり、ＰＣＡ、ＡｕｔｏＥｎｃｏｄｅｒ、ＶＡＥなどの手法を用いて上記の加工を行うことができる。

次に、データ分布提示部２２０は、ステップＳ１１０２で次元削減された学習データに基づいてデータ分布図を生成する（Ｓ１１０３）。この際、本実施形態に係るデータ分布提示部２２０は、ＭＤＳやｔＳＮＥなどの手法を用いて次元圧縮を行ってもよい。また、表示制御部２６０は、ステップＳ１１０３において生成されたデータ分布図をインターフェースＩＦ１上に表示させる。

次に、ラベリング候補選択部２３０は、ステップＳ１１０３において生成されたデータ分布図に基づいて、学習データからラベリング候補を選択する（Ｓ１１０４）。この際、本実施形態に係るラベリング候補選択部２３０は、データ分布図においてクラスタの重心付近に位置する学習データをラベリング候補として選択してもよい。また、表示制御部２６０は、ステップＳ１１０４において選択されたラベリング候補をユーザインタフェースＩＦ１上に表示させる。

次に、ラベリング実行部２４０は、ユーザインタフェースＩＦ１上に表示されるデータ分布図において選択された学習データと入力値とに基づいて、当該学習データのラベリングを行う（Ｓ１１０５）。

次に、学習性能予測部２５０は、データ分布提示部２２０が生成するデータ分布図と学習データに係るラベリング状況とに基づいて、学習装置４０の学習性能を予測する（Ｓ１１０６）。

以上、本実施形態に係る情報処理サーバ２０の動作の流れについて説明した。なお、上記では、学習性能予測部２５０が、学習データのラベリングが行われたことに基づいて、学習性能を予測する場合を例に述べたが、上述したとおり、本実施形態に係る学習性能予測部２５０は、ラベリングが行われていない場合であっても、学習性能の予測を行うことができる。

＜２．第２の実施形態＞
＜＜２．１．第２の実施形態の概要＞＞
次に、本開示の第２の実施形態について説明する。ここでは、まず、本開示の第２の実施形態の概要について述べる。上記における第１の実施形態の説明では、情報処理サーバ２０が、データ収集装置１０により収集、蓄積されたデータセットに基づいて種々の処理を行う場合について述べた。一方、本開示の第２の実施形態に係る情報処理サーバ２０は、逐次収集されるデータに基づいて処理を行うことを特徴の一つとする。より具体的には、本実施形態に係る学習性能予測部２５０は、生成したデータ分布図と新たに入力された学習データとに基づいて、当該学習データに係るラベリングの要否判定を行う機能を有する。また、本実施形態に係る表示制御部２６０は、学習性能予測部２５０によるラベリングの要否判定に基づいて、新たに入力された学習データのラベリングを促すユーザインタフェースを表示させる機能を有する。以下、本実施形態に係る情報処理サーバ２０が有する上記の機能について詳細に説明する。

＜＜２．２．情報処理サーバ２０の機能構成例＞＞
まず、本実施形態に係る情報処理サーバ２０の機能構成例について説明する。ここでは、第１の実施形態に係る情報処理サーバ２０との差異について中心に述べ、重複する機能については説明を省略する。

（学習データ入力部２１０）
本実施形態に係る学習データ入力部２１０は、データ収集装置１０により逐次収集されるデータを学習データとしてデータ分布提示部２２０に入力する。なお、本実施形態に係るデータ収集装置１０は、例えば、ユーザの有するスマートフォンやタブレット、ＰＣ、携帯電話などであってよい。

（データ分布提示部２２０）
本実施形態に係るデータ分布提示部２２０は、学習データ入力部２１０により逐次入力される学習データに基づいてデータ分布図を生成する。

（学習性能予測部２５０）
本実施形態に係る学習性能予測部２５０は、データ分布提示部２２０により生成されたデータ分布図と新たに入力された学習データとに基づいて、当該学習データに係るラベリングの要否判定を行う。本実施形態に係る学習性能予測部２５０が有する上記の機能については、別途詳細に説明する。

（表示制御部２６０）
本実施形態に係る表示制御部２６０は、学習性能予測部２５０によるラベリングの要否判定に基づいて、新たに入力された学習データのラベリングを促すユーザインタフェースを表示させる。

図２０は、表示制御部２６０がデータ収集装置１０の出力部１４０に表示させるユーザインタフェースの一例である。上述したように、本実施形態に係るデータ収集装置１０は、ユーザが所持する種々の情報処理端末であってよい。なお、図２０は、収集されるデータが位置情報である場合の表示例を示している。図２０に示すように、本実施形態に係る表示制御部２６０は、新たに入力された学習データに対するラベリングを促すウィンドウＷ１を表示させることができる。また、この際、表示制御部２６０は、図２０に示すように、ユーザによるラベリングを補助するためのボタンｂ１〜ｂ３を表示させてもよい。

なお、図２０の一例では、表示制御部２６０がユーザに位置を選択させるメッセージを表示させる場合を示しているが、表示制御部２６０は、例えば、「ここは、Ｈｏｍｅですか？」、などメッセージを表示させることもできる。また、図２０には示していないが、表示制御部２６０は、キャンセルボタンなどをユーザインタフェースに配置してもよい。

（ラベリング実行部２４０）
本実施形態に係るラベリング実行部２４０は、表示制御部２６０により表示制御されるユーザインタフェースにおいて、ユーザが入力した情報に基づいて学習データのラベリングを行う機能を有する。すなわち、本実施形態に係るラベリング実行部２４０は、ユーザがラベルの入力を行った場合には、該当する学習データをラベル付きのデータセットへ追加し、ラベリングの入力が行われない場合には、上記の学習データをラベルなしのデータセットへと追加する。

＜＜２．３．ラベリングの要否判定＞＞
ここで、本実施形態に係るラベリングの要否判定について説明する。上述したとおり、本実施形態に係る学習性能予測部２５０は、データ分布図と新たに入力された学習データとに基づいて、当該学習データに係るラベリングの要否判定を行う機能を有する。

図２１は、本実施形態に係るラベリングの要否判定について説明するための図である。図２１には、判定時の前日におけるデータ分布図Ｆ３ａと、判定時におけるデータ分布図Ｆ３ｂとが示されている。ここで、前日におけるデータ分布図Ｆ３ａには、不明なクラスタＦが生成されたとする。この際、判定時におけるデータ分布図Ｆ３ｂにおいて、新たに入力された学習データＮＰ１が上記のクラスタＦに該当する場合、学習性能予測部２５０は、学習データＮＰ１に対するラベリングが必要であると判定する。すなわち、本実施形態に係る情報処理サーバ２０は、新たに入力された学習データが学習性能の向上に寄与するか否かを判定し、当該学習データが性能向上に寄与すると判定した場合には、当該学習データに対するラベリングをユーザに促すことができる。本実施形態に係る情報処理サーバ２０が有する上記の機能によれば、ユーザの負担を軽減しながらも、適切なタイミングでラベリングを要求することができる。

なお、図２２は、本実施形態に係るデータの収集とラベルの追加に係るタイミングを示す図である。図２２に示すように、本実施形態では、データが逐次収集される一方、ラベルの追加頻度は次第に減少していくことが予想される。このため、初期においては、ユーザによるラベルの追加負荷がある場合であっても、当該負荷は徐々に減少していくことが期待される。

以上、本実施形態に係るラベリングの要否判定について説明した。なお、ユーザによるラベルの入力が行われない場合にあっては、学習装置４０は、当該ラベルなしの学習データを必ずしも学習に用いなくてもよい。この際、学習装置４０は、ストレージなどへの負荷を軽減するために学習済みのラベルなしデータを消去してもよいし、現在のモデルにおけるパラメータを初期値に戻す処理を行ってもよい。また、学習装置４０は、まだ使用していないラベルなしデータのみで学習を行うこともできる。

また、一方、学習装置４０は、学習の精度を維持するために、学習済みのラベルなしデータは可能な限り保存してもよいし、上記のパラメータを毎度初期化してもよい。また、学習装置４０は、ランダムに選択したラベルなしデータを用いて学習を行うこともできる。本実施形態に係る学習装置４０は、上記に挙げた例の組み合わせや、その他の基準により選択した学習データを用いて学習を行うことが可能である。

＜＜２．４．情報処理サーバ２０の動作の流れ＞＞
次に、本実施形態に係る情報処理サーバ２０の動作の流れについて詳細に説明する。図２３は、本実施形態に係る情報処理サーバ２０の動作の流れを示すフローチャートである。

図２３を参照すると、まず、情報処理サーバ２０の学習データ入力部２１０は、逐次収集されるデータをデータ分布提示部２２０に入力する（Ｓ１２０１）。

次に、データ分布提示部２２０は、ステップＳ１２０１で入力されるデータに基づいて、データ分布図を生成する（Ｓ１２０２）。

次に、学習性能予測部２５０は、データ分布図と新たに入力された学習データとに基づいて、当該学習データに係るラベリングの要否判定を行う（Ｓ１２０３）。

ここで、学習性能予測部２５０によりラベリングが必要であると判定された場合、表示制御部２６０は、ユーザにラベリングを要求するユーザインタフェースをデータ収集装置１０に表示させる（Ｓ１２０４）。

次に、ラベリング実行部２４０は、ユーザによるラベルの入力情報に基づいて、データセットを更新し（Ｓ１２０５）、情報処理サーバ２０は一連の処理を終了する。

＜３．ハードウェア構成例＞
次に、本開示に係るデータ収集装置１０、情報処理サーバ２０、情報処理端末３０及び学習装置４０に共通するハードウェア構成例について説明する。図２４は、本開示に係るデータ収集装置１０、情報処理サーバ２０、情報処理端末３０及び学習装置４０のハードウェア構成例を示すブロック図である。図１４を参照すると、本開示に係る上記の各装置は、例えば、ＣＰＵ８７１と、ＲＯＭ８７２と、ＲＡＭ８７３と、ホストバス８７４と、ブリッジ８７５と、外部バス８７６と、インターフェース８７７と、入力装置８７８と、出力装置８７９と、ストレージ８８０と、ドライブ８８１と、接続ポート８８２と、通信装置８８３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

（ＣＰＵ８７１）
ＣＰＵ８７１は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ８７２、ＲＡＭ８７３、ストレージ８８０、又はリムーバブル記録媒体９０１に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。

（ＲＯＭ８７２、ＲＡＭ８７３）
ＲＯＭ８７２は、ＣＰＵ８７１に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ８７３には、例えば、ＣＰＵ８７１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。

（ホストバス８７４、ブリッジ８７５、外部バス８７６、インターフェース８７７）
ＣＰＵ８７１、ＲＯＭ８７２、ＲＡＭ８７３は、例えば、高速なデータ伝送が可能なホストバス８７４を介して相互に接続される。一方、ホストバス８７４は、例えば、ブリッジ８７５を介して比較的データ伝送速度が低速な外部バス８７６に接続される。また、外部バス８７６は、インターフェース８７７を介して種々の構成要素と接続される。

（入力装置８７８）
入力装置８７８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置８７８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置８７８には、マイクロフォンなどの音声入力装置が含まれる。

（出力装置８７９）
出力装置８７９は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）、ＬＣＤ、又は有機ＥＬ等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。

（ストレージ８８０）
ストレージ８８０は、各種のデータを格納するための装置である。ストレージ８８０としては、例えば、ハードディスクドライブ（ＨＤＤ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。

（ドライブ８８１）
ドライブ８８１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体９０１に記録された情報を読み出し、又はリムーバブル記録媒体９０１に情報を書き込む装置である。

（リムーバブル記録媒体９０１）
リムーバブル記録媒体９０１は、例えば、ＤＶＤメディア、Ｂｌｕ−ｒａｙ（登録商標）メディア、ＨＤＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体９０１は、例えば、非接触型ＩＣチップを搭載したＩＣカード、又は電子機器等であってもよい。

（接続ポート８８２）
接続ポート８８２は、例えば、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（ＳｍａｌｌＣｏｍｐｕｔｅｒＳｙｓｔｅｍＩｎｔｅｒｆａｃｅ）、ＲＳ−２３２Ｃポート、又は光オーディオ端子等のような外部接続機器９０２を接続するためのポートである。

（外部接続機器９０２）
外部接続機器９０２は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダ等である。

（通信装置８８３）
通信装置８８３は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（ＷｉｒｅｌｅｓｓＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（ＡｓｙｍｍｅｔｒｉｃＤｉｇｉｔａｌＳｕｂｓｃｒｉｂｅｒＬｉｎｅ）用のルータ、又は各種通信用のモデム等である。

＜４．まとめ＞
以上説明したように、本開示に係る情報処理サーバ２０は、入力される学習データに基づいてデータ分布図を生成し、ユーザにデータの分布状況を可視化して提示することができる。また、本開示に係る情報処理サーバ２０は、生成したデータ分布図に基づいて、学習性能を予測し、当該予想の結果をユーザに提示することができる。また、情報処理サーバ２０は、学習性能の向上に寄与する学習データを選択し、当該学習データをユーザに提示することができる。係る構成によれば、学習データのラベリング状況に応じた学習性能を予め予測することが可能となる。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

また、本明細書の情報処理サーバ２０の処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、情報処理サーバ２０の処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。

また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
入力される学習データに対する次元圧縮を行い、前記学習データに係るデータ分布図を生成するデータ分布提示部と、
前記データ分布図と前記学習データに係るラベリング状況とに基づいて、学習性能を予測する学習性能予測部と、
前記データ分布図および前記学習性能に係る表示を制御する表示制御部と、
を備え、
前記データ分布図は、前記学習データから構成されるクラスタの重なり情報、および各クラスタに属する前記学習データの数の情報を含む、
情報処理装置。
（２）
前記学習性能予測部は、単一のクラスタのみに属するラベル付きの学習データが存在する場合、当該クラスタのみに属するラベルのない学習データは、当該ラベル付きデータと同一のクラスに分類されると予測する、
前記（１）に記載の情報処理装置。
（３）
前記学習性能予測部は、あるクラスタにおいて、当該クラスタのみに属するラベル付きの学習データが存在しない場合、当該クラスタのみに属するラベルのない学習データが正しいクラスに分類される確率は、全クラスタ数の逆数に比例すると予測する、
前記（１）または（２）に記載の情報処理装置。
（４）
前記学習性能予測部は、クラスタの共通部分に属するラベルのない学習データが正しいクラスに分類される確率は、前記共通部分を形成するクラスタ数の逆数に比例すると予測する、
前記（１）〜（３）のいずれかに記載の情報処理装置。
（５）
前記学習性能予測部は、すべてのクラスタにおいて、各クラスタのみに属するラベル付き学習データが存在する場合の学習性能を、最大学習性能として予測し、
前記表示制御部は、クラスタ数と前記最大学習性能とを関連付けて表示させる、
前記（１）〜（４）のいずれかに記載の情報処理装置。
（６）
前記データ分布提示部は、クラスタ数の異なる複数の前記データ分布図を生成し、
前記学習性能予測部は、複数の前記データ分布図に基づいて、各クラスタ数における前記最大学習性能を予測し、
前記表示制御部は、各クラスタ数における前記最大学習性能の比較を表示させる、
前記（５）に記載の情報処理装置。
（７）
前記学習性能予測部は、前記クラスタ数と当該クラスタ数における前記最大学習性能とに基づいて最適クラスタ数を決定し、
前記データ分布提示部は、前記最適クラスタ数に基づいて前記データ分布図を生成する、
前記（６）に記載の情報処理装置。
（８）
前記データ分布図に基づいて、前記学習データからラベリング候補を選択するラベリング候補選択部、
をさらに備え、
前記ラベリング候補選択部は、前記クラスタの重心付近に位置する学習データを前記ラベリング候補として選択し、
前記表示制御部は、前記ラベリング候補を表示させる、
前記（１）〜（７）のいずれかに記載の情報処理装置。
（９）
前記データ分布図において選択された学習データと入力値とに基づいて、当該当該学習データのラベリングを行うラベリング実行部、
をさらに備える、
前記（１）〜（８）のいずれかに記載の情報処理装置。
（１０）
前記表示制御部は、選択された学習データに基づいて、当該学習データに対応する参照情報を表示させる、
前記（９）に記載の情報処理装置。
（１１）
前記表示制御部は、前記参照情報と、前記参照情報に同期した付随データとを関連付けて表示させる、
前記（１０）に記載の情報処理装置。
（１２）
前記学習性能予測部は、前記データ分布図と新たに入力された学習データとに基づいて、当該学習データに係るラベリングの要否判定を行う、
前記（１）〜（１１）のいずれかに記載の情報処理装置。
（１３）
前記表示制御部は、前記学習性能予測部による前記ラベリングの要否判定に基づいて、前記新たに入力された学習データのラベリングを促すユーザインタフェースを表示させる、
前記（１２）に記載の情報処理装置。
（１４）
前記学習データに基づく学習を行う学習部、
をさらに備える、
前記（１）〜（１３）のいずれかに記載の情報処理装置。
（１５）
前記学習部は、類似性を有する異なる２つ以上のデータセットを用いて前記学習を行う、
前記（１４）に記載の情報処理装置。
（１６）
前記類似性を有する異なる２つ以上のデータセットは、互いにラベリングルールの異なるデータセットである、
前記（１５）に記載の情報処理装置。
（１７）
前記学習部は、半教師学習またはドメイン適応による学習を行う、
前記（１４）〜（１６）のいずれかに記載の情報処理装置。
（１８）
前記学習データに対する次元削減を行い、前記データ分布提示部に入力する学習データ入力部、
をさらに備える、
前記（１）〜（１７）のいずれかに記載の情報処理装置。
（１９）
前記学習性能予測部は、前記学習データのラベリングが実行されたことに基づいて、前記学習性能を予想する、
前記（１）〜（１８）のいずれかに記載の情報処理装置。
（２０）
プロセッサが、
入力される学習データに基づく次元圧縮を行い、前記学習データに係るデータ分布図を生成することと、
前記データ分布図と前記学習データに係るラベリング状況とに基づいて、学習性能を予測することと、
前記データ分布図および前記学習性能に係る表示を制御することと、
を含み、
前記データ分布図は、前記学習データから構成されるクラスタの重なり情報、および各クラスタに属する前記学習データの数の情報を含む、
情報処理方法。

１０データ収集装置
１１０入力部
１２０センサ部
１３０記憶部
１４０出力部
１５０通信部
２０情報処理サーバ
２１０学習データ入力部
２２０データ分布提示部
２３０ラベリング候補選択部
２４０ラベリング実行部
２５０学習性能予測部
２６０表示制御部
２７０通信部
３０情報処理端末
３１０入力部
３２０出力部
３３０通信部
４０学習装置
４１０学習部
４２０認識器出力部
４３０通信部

Claims

入力される学習データに対する次元圧縮を行い、前記学習データに係るデータ分布図を生成するデータ分布提示部と、
前記データ分布図と前記学習データに係るラベリング状況とに基づいて、学習性能を予測する学習性能予測部と、
前記データ分布図および前記学習性能に係る表示を制御する表示制御部と、
を備え、
前記データ分布図は、前記学習データから構成されるクラスタの重なり情報、および各クラスタに属する前記学習データの数の情報を含む、
情報処理装置。
前記学習性能予測部は、単一のクラスタのみに属するラベル付きの学習データが存在する場合、当該クラスタのみに属するラベルのない学習データは、当該ラベル付きデータと同一のクラスに分類されると予測する、
請求項１に記載の情報処理装置。
前記学習性能予測部は、あるクラスタにおいて、当該クラスタのみに属するラベル付きの学習データが存在しない場合、当該クラスタのみに属するラベルのない学習データが正しいクラスに分類される確率は、全クラスタ数の逆数に比例すると予測する、
請求項１に記載の情報処理装置。
前記学習性能予測部は、クラスタの共通部分に属するラベルのない学習データが正しいクラスに分類される確率は、前記共通部分を形成するクラスタ数の逆数に比例すると予測する、
請求項１に記載の情報処理装置。
前記学習性能予測部は、すべてのクラスタにおいて、各クラスタのみに属するラベル付き学習データが存在する場合の学習性能を、最大学習性能として予測し、
前記表示制御部は、クラスタ数と前記最大学習性能とを関連付けて表示させる、
請求項１に記載の情報処理装置。
前記データ分布提示部は、クラスタ数の異なる複数の前記データ分布図を生成し、
前記学習性能予測部は、複数の前記データ分布図に基づいて、各クラスタ数における前記最大学習性能を予測し、
前記表示制御部は、各クラスタ数における前記最大学習性能の比較を表示させる、
請求項５に記載の情報処理装置。
前記学習性能予測部は、前記クラスタ数と当該クラスタ数における前記最大学習性能とに基づいて最適クラスタ数を決定し、
前記データ分布提示部は、前記最適クラスタ数に基づいて前記データ分布図を生成する、
請求項６に記載の情報処理装置。
前記データ分布図に基づいて、前記学習データからラベリング候補を選択するラベリング候補選択部、
をさらに備え、
前記ラベリング候補選択部は、前記クラスタの重心付近に位置する学習データを前記ラベリング候補として選択し、
前記表示制御部は、前記ラベリング候補を表示させる、
請求項１に記載の情報処理装置。
前記データ分布図において選択された学習データと入力値とに基づいて、当該当該学習データのラベリングを行うラベリング実行部、
をさらに備える、
請求項１に記載の情報処理装置。
前記表示制御部は、選択された学習データに基づいて、当該学習データに対応する参照情報を表示させる、
請求項９に記載の情報処理装置。
前記表示制御部は、前記参照情報と、前記参照情報に同期した付随データとを関連付けて表示させる、
請求項１０に記載の情報処理装置。
前記学習性能予測部は、前記データ分布図と新たに入力された学習データとに基づいて、当該学習データに係るラベリングの要否判定を行う、
請求項１に記載の情報処理装置。
前記表示制御部は、前記学習性能予測部による前記ラベリングの要否判定に基づいて、前記新たに入力された学習データのラベリングを促すユーザインタフェースを表示させる、
請求項１２に記載の情報処理装置。
前記学習データに基づく学習を行う学習部、
をさらに備える、
請求項１に記載の情報処理装置。
前記学習部は、類似性を有する異なる２つ以上のデータセットを用いて前記学習を行う、
請求項１４に記載の情報処理装置。
前記類似性を有する異なる２つ以上のデータセットは、互いにラベリングルールの異なるデータセットである、
請求項１５に記載の情報処理装置。
前記学習部は、半教師学習またはドメイン適応による学習を行う、
請求項１４に記載の情報処理装置。
前記学習データに対する次元削減を行い、前記データ分布提示部に入力する学習データ入力部、
をさらに備える、
請求項１に記載の情報処理装置。
前記学習性能予測部は、前記学習データのラベリングが実行されたことに基づいて、前記学習性能を予想する、
請求項１に記載の情報処理装置。
プロセッサが、
入力される学習データに基づく次元圧縮を行い、前記学習データに係るデータ分布図を生成することと、
前記データ分布図と前記学習データに係るラベリング状況とに基づいて、学習性能を予測することと、
前記データ分布図および前記学習性能に係る表示を制御することと、
を含み、
前記データ分布図は、前記学習データから構成されるクラスタの重なり情報、および各クラスタに属する前記学習データの数の情報を含む、
情報処理方法。