JP2017059031A

JP2017059031A - 情報処理装置、情報処理方法、及び、プログラム

Info

Publication number: JP2017059031A
Application number: JP2015184098A
Authority: JP
Inventors: 善行後藤; Yoshiyuki Goto
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2015-09-17
Filing date: 2015-09-17
Publication date: 2017-03-23
Anticipated expiration: 2035-09-17
Also published as: JP6551101B2; US20170083818A1

Abstract

【課題】所定の処理に係る適切な処理パラメータの決定、及び、処理時間の把握を短時間で行う。【解決手段】学習支援装置５００は、入力部５４０、及び、特定部５５０を含む。入力部５４０は、新たな学習データの入力を受け付ける。特定部５５０は、学習処理を学習データに対して実行した場合の学習処理に係る処理性能の履歴を用いて、新たな学習データに対応する学習処理に係る処理パラメータの値、及び、処理性能の値の内の少なくとも一方を特定し、出力する。【選択図】図１

Description

本発明は、情報処理装置、情報処理方法、及び、プログラムに関し、特に、学習処理等の所定の処理の実行を支援する、情報処理装置、情報処理方法、及び、プログラムに関する。

近年、非特許文献１に記載されているように、機械学習技術のビッグデータ分析への活用が多く見られるようになっている。非特許文献１に記載されている「日配品需要予測ソリューション」では、コンビニエンスストアや食品スーパー等の小売業において、機械学習により構築された予測モデルを用いて、賞味期限が短い日配品の廃棄や在庫切れによる販売機会損失を削減する。しかし、小売業が取り扱う日配品は多種多様であり、それらに対し限られた時間内で十分な精度の予測モデルを構築するためには、機械学習における適切な処理パラメータを得るためのパラメータチューニングが必要となる。

機械学習におけるモデル構築処理では、モデルを解析的に解くことは困難であり、一般的に、モデル更新を反復することによりモデルを構築する、反復計算が行われる。このようなモデル構築処理では、反復計算における反復回数や、反復計算を終了するための閾値等の処理パラメータの最適値を、試行錯誤的に決定する必要がある。１回のモデル構築処理には、通常のサーバマシンを使用しても数十分〜数十時間を要するため、適切な処理パラメータの決定には多大な時間がかかる。また、このようなモデル構築処理に要する時間を、ユーザ等が事前に把握することは難しい。

このようなモデル構築処理の支援に係る技術の一例が、特許文献１に記載されている。特許文献１に記載の「設計支援システム」は、処理対象のデータのサンプルデータに対して処理方式の処理時間を求め、処理対象のデータに対する当該処理方式の処理時間を予測する。

なお、関連技術として、特許文献２には、複数のパラメータを含む関係式において、パラメータの変化に対する他のパラメータの変化を表示する「動的相互関係評価システム」が記載されている。また、特許文献３には、クラスフィールドが既知の事例集合を用いてクラスフィールドが未知の事例集合のクラスフィールドを予測する予測装置が記載されている。特許文献４には、学習用の画像データを用いて、画像データの特徴データからパラメータを推定する関数群を作成し、推定対象の画像データの特徴データと関数群を用いて、パラメータを推定するパラメータ推定装置が記載されている。

特開２０１５−０１４８４７号公報特許第３６８２１５３号公報特開２０００−１５５６８１号公報特開２００８−２１７５２１号公報

「NEC、ビッグデータ分析技術を用いて適正な発注を実現する小売業向けソリューションを発売」、[online]、日本電気株式会社、[平成27年8月31日検索]、インターネット<URL: http://jpn.nec.com/press/201504/20150410_01.html>

上述の特許文献１に記載の技術では、処理対象のデータに対する処理方式の処理時間を求めるために、サンプルデータに対して処理方式の処理を行う必要があり、処理方式の内容やサンプルデータの量によっては処理時間を得るまでに時間を要する。また、特許文献１に記載の技術では、処理方式に係る処理パラメータを決定する方法については記載されていない。

本発明の目的は、上述の課題を解決し、所定の処理に係る適切な処理パラメータの決定、及び、処理時間の把握を短時間で行うことができる、情報処理装置、情報処理方法、及び、プログラムを提供することである。

本発明の情報処理装置は、第１のデータの入力を受け付ける、入力手段と、所定の処理を第２のデータに対して実行した場合の前記所定の処理に係る処理性能の履歴を用いて、前記第１のデータに対応する前記所定の処理に係る処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定し、出力する、特定手段と、を備える。

本発明の情報処理方法は、第１のデータの入力を受け付け、所定の処理を第２のデータに対して実行した場合の前記所定の処理に係る処理性能の履歴を用いて、前記第１のデータに対応する前記所定の処理に係る処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定し、出力する。

本発明のプログラムは、コンピュータに、第１のデータの入力を受け付け、所定の処理を第２のデータに対して実行した場合の前記所定の処理に係る処理性能の履歴を用いて、前記第１のデータに対応する前記所定の処理に係る処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定し、出力する、処理を実行させる。

本発明の効果は、所定の処理に係る適切な処理パラメータの決定、及び、処理時間の把握を短時間で行えることである。

本発明の実施の形態の特徴的な構成を示すブロック図である。本発明の実施の形態における、学習システム１の構成を示すブロック図である。本発明の実施の形態における、コンピュータにより実現された学習支援装置５００の構成を示すブロック図である。本発明の実施の形態における、収集処理を示すフローチャートである。本発明の実施の形態における、特定処理を示すフローチャートである。本発明の実施の形態における、学習データの例を示す図である。本発明の実施の形態における、処理パラメータの例を示す図である。本発明の実施の形態における、処理性能の例を示す図である。本発明の実施の形態における、特徴ベクトルの生成例を示す図である。本発明の実施の形態における、学習処理情報５３１の例を示す図である。本発明の実施の形態における、学習データの他の例を示す図である。本発明の実施の形態における、処理性能要件の例を示す図である。本発明の実施の形態における、特徴ベクトルの他の生成例を示す図である。本発明の実施の形態における、類似する特徴ベクトルの抽出例を示す図である。本発明の実施の形態における、表示画面５５１の例を示す図である。本発明の実施の形態における、表示画面５５１の他の例を示す図である。本発明の実施の形態における、表示画面５５１の他の例を示す図である。本発明の実施の形態における、表示画面５５１の他の例を示す図である。本発明の実施の形態における、表示画面５５１の他の例を示す図である。

はじめに、本発明の実施の形態における、所定の処理について説明する。

本発明の実施の形態においては、所定の処理として、機械学習による予測モデル（以下、単にモデルとも記載）の学習（構築）処理を実行する場合を例に説明する。

機械学習によるモデル構築処理では、入力されたデータに対してモデル更新処理を繰り返し、モデルパラメータの最適解を探索することでモデルを生成する。このようなモデル構築処理の方式としては、例えば、ニューラルネットワークや、サポートベクタマシン、非特許文献１に記載されている異種混合分析等、様々な方式が挙げられる。モデル構築処理により構築されたモデルにより、データの予測、識別、分類等が行われる。

モデル構築処理には、モデルの構築対象である、学習データが入力される。例えば、学習データとして、複数の属性の値の集合を１つのサンプルとして、複数のサンプルが入力される。複数の属性は、モデルにおける説明変数、及び、目的変数として用いられる。

モデル構築処理は、指定された処理パラメータに従って実行される。処理パラメータは、構築されるモデルの特性や、繰り返し処理の終了条件等、モデル構築処理の動作を指定するパラメータである。例えば、処理パラメータとして、モデルの特性を指定する「モデルの複雑さ」、「モデルの集約度」や、繰り返し処理の終了条件を指定する「収束判定条件」、「最大繰り返し回数」等が入力される。

モデル構築処理は、繰り返し処理の終了条件に達するまでモデル更新処理を繰り返し、モデルパラメータを更新する。そして、繰り返し処理の終了条件が満たされるとモデル構築処理は終了し、最終的なモデルパラメータが出力される。

次に、本発明の実施の形態の構成を説明する。ここでは、機械学習による予測モデルの構築をＷｅｂサービスにより提供する学習システム１を例に説明する。

図２は、本発明の実施の形態における、学習システム１の構成を示すブロック図である。学習システム１は、１以上のクライアント装置１００、サーバ装置２００、１以上の学習装置３００、モデル記憶装置４００、及び、学習支援装置５００を含む。クライアント装置１００とサーバ装置２００、クライアント装置１００と学習支援装置５００、サーバ装置２００と学習装置３００、及び、学習装置３００と学習支援装置５００は、ネットワーク等により接続される。

クライアント装置１００は、例えば、パーソナルコンピュータ等の端末装置である。クライアント装置１００は、サーバ装置２００を介して、学習装置３００へ、学習データ（以下、第２のデータとも記載）、及び、モデル構築処理に係る処理パラメータを指定した、モデル構築要求を送信する。また、クライアント装置１００は、学習支援装置５００へ、新たな学習データ（以下、第１のデータとも記載）を指定した、学習処理情報要求を送信する。学習処理情報要求は、新たな学習データに対するモデル構築処理に係る処理パラメータや処理性能（モデル構築処理の処理時間、モデルの評価指標）を取得するための要求である。

サーバ装置２００は、学習装置３００によるモデルの構築を、Ｗｅｂサービスによりクライアント装置１００へ提供する。サーバ装置２００は、クライアント装置１００から受信したモデル構築要求を学習装置３００に転送する。

学習装置３００は、サーバ装置２００から受信したモデル構築要求で指定された学習データに対して、指定された処理パラメータを用いてモデル構築処理を実行し、当該モデル構築処理に係る処理性能を算出する。

モデル記憶装置４００は、学習装置３００により構築されたモデルを記憶する。

学習支援装置５００は、学習処理情報収集部５１０、特徴ベクトル生成部５２０、学習処理情報記憶部５３０、入力部５４０、特定部５５０、及び、出力部５６０を含む。学習支援装置５００は、本発明の情報処理装置の一実施形態である。

学習処理情報収集部５１０は、学習装置３００から、モデル構築処理に係る学習データや、処理パラメータ、処理性能を収集する。

特徴ベクトル生成部５２０は、学習データの特徴（特性）を表す特徴量を算出し、算出した特徴量を要素として持つ特徴ベクトルを生成する。

学習処理情報記憶部５３０は、学習処理情報５３１を記憶する。学習処理情報５３１は、モデル構築処理の履歴に基づく情報である。例えば、学習処理情報５３１は、学習データに対して生成された特徴ベクトル、モデル構築処理に係る処理パラメータ、及び、当該学習データに対して当該処理パラメータを用いて実行したモデル構築処理の処理性能を関連付けた情報である。なお、学習処理情報記憶部５３０は、さらに、学習データと当該学習データに対して生成された特徴ベクトルを関連付けて記憶していてもよい。

入力部５４０は、クライアント装置１００から、学習処理情報要求の入力を受け付ける。

特定部５５０は、学習処理情報５３１から、学習処理情報要求で指定された新たな学習データの特徴ベクトルと類似度の高い特徴ベクトルを抽出し、当該抽出された特徴ベクトルに対応する処理パラメータや処理性能を特定する。

出力部５６０は、特定部５５０により特定された処理パラメータや処理性能を、学習処理情報要求に対する応答として、クライアント装置１００へ送信する。

なお、学習支援装置５００は、ＣＰＵ（Central Processing Unit）とプログラムを記憶した記憶媒体を含み、プログラムにもとづく制御によって動作するコンピュータであってもよい。

図３は、本発明の実施の形態における、コンピュータにより実現された学習支援装置５００の構成を示すブロック図である。

この場合、学習支援装置５００は、ＣＰＵ５０１、ハードディスクやメモリ等の記憶デバイス５０２（記憶媒体）、キーボード、ディスプレイ等の入出力デバイス５０３、及び、他の装置等と通信を行う通信デバイス５０４を含む。ＣＰＵ５０１は、学習処理情報収集部５１０、特徴ベクトル生成部５２０、入力部５４０、特定部５５０、及び、出力部５６０を実現するためのプログラムを実行する。記憶デバイス５０２は、学習処理情報記憶部５３０のデータ（学習処理情報５３１）を記憶する。入出力デバイス５０３は、クライアント装置１００からの学習処理情報要求の入力、及び、クライアント装置１００への学習処理情報要求に対する応答の出力を行う。通信デバイス５０４は、学習装置３００からモデル構築処理に係る、学習データや、処理性能、処理パラメータを受信する。

また、学習支援装置５００の各構成要素は、論理回路で実現されていてもよい。この場合、複数の構成要素が、１つの論理回路で実現されていてもよいし、それぞれ、複数の独立した論理回路で実現されていてもよい。

また、学習支援装置５００の各構成要素は、有線または無線で接続された複数の物理的な装置に分散的に配置されていてもよい。この場合、学習支援装置５００は、複数のコンピュータによる分散処理により実現されていてもよい。

次に、本発明の実施の形態の動作について説明する。

はじめに、本発明の実施の形態における、収集処理について説明する。

図４は、本発明の実施の形態における、収集処理を示すフローチャートである。

クライアント装置１００は、サーバ装置２００に、学習データ、及び、処理パラメータを指定した、モデル構築要求を送信する（ステップＳ１０１）。

図６は、本発明の実施の形態における、学習データの例を示す図である。図６の例では、学習データは、各属性（属性１、２、…）が列、属性値の集合（サンプル）が行に設定された表形式で表されている。また、図７は、本発明の実施の形態における、処理パラメータの例を示す図である。図７の例では、処理パラメータとして、Ｐ１、Ｐ２、…が指定されている。

例えば、クライアント装置１００は、図６の学習データ、及び、図７の処理パラメータを指定した、モデル構築要求を送信する。

サーバ装置２００は、クライアント装置１００から受信したモデル構築要求を、１以上の学習装置３００の内のいずれかに転送する（ステップＳ１０２）。

学習装置３００は、モデル構築要求で指定された学習データに対して、指定された処理パラメータを用いて、モデル構築処理を実行し、モデルを構築する（ステップＳ１０３）。学習装置３００は、構築したモデルを、モデル記憶装置４００に保存する。また、学習装置３００は、モデル構築処理の処理性能を算出する。ここで、学習装置３００は、処理性能として、モデル構築処理の処理時間、及び、モデル構築処理により構築されたモデルの評価指標を算出する。モデルの評価指標として、例えば、構築された予測モデルに学習データを適用して得られる予測値の平均二乗誤差や絶対誤差の最大値等、モデルの精度が算出される。

図８は、本発明の実施の形態における、処理性能の例を示す図である。図８の例では、処理性能として、処理時間、平均二乗誤差、及び、絶対誤差の最大値が示されている。例えば、学習装置３００は、図６の学習データに対して図７の処理パラメータでモデル構築処理を実行し、図８のように処理性能を算出する。

学習装置３００は、モデル構築処理に用いた学習データと処理パラメータ、及び、算出した処理性能を、各モデル構築処理を一意に識別可能な処理ＩＤ（Identifier）とともに、学習支援装置５００に送信する（ステップＳ１０４）。

例えば、学習装置３００は、処理ＩＤ「１００」とともに、図６の学習データ、図７の処理パラメータ、及び、図８の処理性能を送信する。

学習支援装置５００の学習処理情報収集部５１０は、学習装置３００から、処理ＩＤ、学習データ、処理パラメータ、及び、処理性能を受信（収集）する。

学習処理情報収集部５１０は、特徴ベクトル生成部５２０を用いて、収集した学習データの特徴ベクトルを生成する（ステップＳ１０５）。

ここで、特徴ベクトル生成部５２０は、学習データに対して、クレンジング、標準化、及び、相関の高い属性の除去等の前処理を行う。ここで、クレンジングとして、無効な値の削除や補完が行われる。また、標準化として、例えば、平均が０、分散が１になるような正規化が行われる。さらに、互いに相関の高い属性（説明変数）の内、いずれかの属性が削除される。

そして、特徴ベクトル生成部５２０は、前処理が行われた学習データについて、サンプル数、及び、属性数を特徴量として算出する。さらに、特徴ベクトル生成部５２０は、前処理が行われた学習データについて、属性値に係る特徴量を算出する。ここで、属性ごとに最大値、最小値、及び、最も強い周波数成分の周波数を算出が算出され、それら最大値、最小値、周波数の、属性間での最大値、平均値、最小値が、属性値に係る特徴量として用いられる。

特徴ベクトル生成部５２０は、算出したサンプル数、属性数、及び、属性値に係る特徴量を要素とする特徴ベクトルを生成する。

図９は、本発明の実施の形態における、特徴ベクトルの生成例を示す図である。例えば、特徴ベクトル生成部５２０は、図６の学習データに対して、図９のような特徴ベクトルを生成する。

なお、特徴ベクトル生成部５２０は、学習データの特徴を表すことができれば、例えば、主成分分析等により算出された主成分の値を特徴量として用いる等、他の特徴量を算出してもよい。

学習処理情報収集部５１０は、処理ＩＤ、生成された特徴ベクトル、収集した処理パラメータ、及び、処理性能を、学習処理情報記憶部５３０における学習処理情報５３１に追加して、学習処理情報５３１を更新する（ステップＳ１０６）。

図１０は、本発明の実施の形態における、学習処理情報５３１の例を示す図である。例えば、学習処理情報収集部５１０は、図１０のように、処理ＩＤ「１００」、図９の特徴ベクトル、図７の処理パラメータ、及び、図８の処理性能を、学習処理情報５３１に追加する。

以下、クライアント装置１００からのモデル構築要求に対して学習装置３００がモデル構築を行うたびに、ステップＳ１０１からの処理が実行される。そして、学習処理情報５３１には、特徴ベクトル、処理パラメータ、及び、処理性能の、様々な組み合わせが記録されていく。

次に、本発明の実施の形態における、特定処理について説明する。ここでは、クライアント装置１００が、学習処理情報要求として、新たな学習データと処理性能要件に対する処理パラメータを要求する場合を例に説明する。

図５は、本発明の実施の形態における、特定処理を示すフローチャートである。

クライアント装置１００は、学習支援装置５００に、新たな学習データ、及び、処理性能要件を指定した、学習処理情報要求を送信する（ステップＳ２０１）。処理性能要件は、処理性能（モデル構築処理の処理時間、構築されるモデルの評価指標）に係る要求条件である。

図１１は、本発明の実施の形態における、学習データの他の例を示す図である。図１２は、本発明の実施の形態における、処理性能要件の例を示す図である。図１２の例では、処理性能要件として、処理時間、平均二乗誤差、及び、絶対誤差の最大値についての要求条件が示されている。例えば、クライアント装置１００は、図１１の学習データと図１２の処理性能要件とを指定した学習処理情報要求を送信する。

学習支援装置５００の入力部５４０は、クライアント装置１００から、学習処理情報要求を受信する。

特定部５５０は、特徴ベクトル生成部５２０を用いて、受信した学習処理情報要求で指定された新たな学習データの特徴ベクトルを生成する（ステップＳ２０２）。

図１３は、本発明の実施の形態における、特徴ベクトルの他の生成例を示す図である。例えば、特徴ベクトル生成部５２０は、図１１の学習データに対して、図１３のように特徴ベクトルを生成する。

特定部５５０は、学習処理情報記憶部５３０の学習処理情報５３１から、学習処理情報要求で指定された新たな学習データの特徴ベクトルと類似する特徴ベクトルを抽出する（ステップＳ２０３）。ここで、特定部５５０は、例えば、新たな学習データとの間で、サンプル数、属性数の差分が、所定の差分閾値以下であり、属性値に係る特徴量のコサイン類似度が所定の類似度閾値以下の特徴ベクトルを抽出する。

図１４は、本発明の実施の形態における、類似する特徴ベクトルの抽出例を示す図である。例えば、特定部５５０は、図１０の学習処理情報５３１から、図１３の特徴ベクトルと類似する特徴ベクトルとして、図１４のように、処理ＩＤ「５０」、「１００」に対する特徴ベクトルを抽出する。

特定部５５０は、ステップＳ２０３で抽出された特徴ベクトルに関連付けられた処理パラメータや処理性能から、さらに、学習処理情報要求における指示内容に応じた処理パラメータや処理性能を特定する（ステップＳ２０４）。ここで、特定部５５０は、ステップＳ２０３で抽出された特徴ベクトルに関連付けられた処理パラメータの内、処理性能要件を満たす処理性能に関連付けられた処理パラメータを特定する。

例えば、図１４における、処理ＩＤ「５０」、「１００」に対する処理性能の内、処理ＩＤ「１００」に対する処理性能が、図１２の処理性能要件を満たす。したがって、特定部５５０は、処理ＩＤ「１００」に対する処理パラメータ「Ｐ１：４、Ｐ２：１．０、Ｐ３：０．００１、Ｐ４：１００」を、学習処理情報要求に応じた処理パラメータとして特定する。

特定部５５０は、ステップＳ２０４で特定された処理パラメータや処理性能を、学習処理情報要求に対する応答として、出力部５６０を介して、クライアント装置１００へ送信（出力）する（ステップＳ２０５）。

クライアント装置１００は、受信した処理パラメータや処理性能を、ユーザへ出力（表示）する（ステップＳ２０６）。

ここで、特定部５５０は、クライアント装置１００がユーザ等へ特定された処理パラメータや処理性能を表示するための表示画面５５１を生成して、クライアント装置１００へ送信し、ユーザに対して表示させてもよい。また、クライアント装置１００が、学習支援装置５００から受信した情報をもとに同様の表示画面５５１を生成し、ユーザに対して表示してもよい。

図１５は、本発明の実施の形態における、表示画面５５１の例を示す図である。図１５の例では、学習処理情報要求として指定した学習データ（入力値）、処理性能要件（入力値）に対して、特定された処理パラメータ（推奨値）が示されている。

例えば、特定部５５０は、図１５のような表示画面５５１を生成し、クライアント装置１００に表示させる。

ユーザは、図１５の表示画面５５１から得られる処理パラメータを、新たな学習データに対するモデル構築要求で指定することにより、当該新たな学習データに対して処理性能要件を満たしながらモデルを構築できる。

このように、ユーザは、新たな学習データに対して、処理性能要件を満たすような適切な処理パラメータを、処理パラメータを決定するための試行錯誤を行うことなく、短時間で取得できる。

また、特徴が類似している異なる学習データに対して、モデル構築を繰り返す場合、ある学習データに対して上述の特定処理により処理パラメータを決定すれば、他の学習データに対しても、同じ処理パラメータで同程度の処理性能を期待できる。したがって、この場合、適切な処理パラメータの決定に要する時間をさらに短縮できる。

以上により、本発明の実施の形態の動作が完了する。

なお、上述の説明では、クライアント装置１００が、学習処理情報要求として、新たな学習データ、及び、処理性能要件に対する処理パラメータを要求する場合を例に説明した。しかしながら、これに限らず、クライアント装置１００が、学習処理情報要求として、新たな学習データ、及び、特定の処理パラメータに対する処理性能を要求してもよい。この場合、特定部５５０は、新たな学習データの特徴ベクトルと類似する特徴ベクトルに関連付けられた処理性能から、例えば、特定の処理パラメータと一致または類似する処理パラメータに関連する処理性能を特定し、処理性能の推定値として送信する。

図１６は、本発明の実施の形態における、表示画面５５１の他の例を示す図である。図１６の例では、学習処理情報要求として指定した学習データ（入力値）、処理パラメータ（入力値）に対して、特定された処理性能（推定値）が示されている。ユーザは、図１６の表示画面５５１を参照し、新たな学習データに対して特定の処理パラメータを用いてモデル構築処理を行った場合の処理性能を把握することができる。

また、クライアント装置１００が、学習処理情報要求として、新たな学習データに対する処理パラメータ、及び、処理性能を要求してもよい。この場合、特定部５５０は、新たな学習データの特徴ベクトルと類似する特徴ベクトルに関連付けられた処理パラメータ、及び、処理性能の組を特定し、送信する。

図１７は、本発明の実施の形態における、表示画面５５１の他の例を示す図である。図１７の例では、学習処理情報要求として指定した学習データ（入力値）に対して、特定された処理パラメータ、及び、処理性能の組が示されている。ユーザは、図１７の表示画面５５１を参照し、新たな学習データに対して様々な処理パラメータを用いてモデル構築処理を行った場合の処理性能を把握することができる。

また、クライアント装置１００が、学習処理情報要求として、特定の処理パラメータに対する学習データ、及び、処理性能を要求してもよい。この場合、特定部５５０は、例えば、特定の処理パラメータと一致または類似する処理パラメータに関連付けられた特徴ベクトルに係る学習データ、及び、処理性能の組を特定し、送信する。

図１８は、本発明の実施の形態における、表示画面５５１の他の例を示す図である。図１８の例では、学習処理情報要求として指定した処理パラメータ（入力値）に対して、特定された学習データ、及び、処理性能の組が示されている。ユーザは、図１８の表示画面５５１を参照し、様々な学習データに対して、特定の処理パラメータを用いてモデル構築処理を行った場合の処理性能を把握することができる。

さらに、クライアント装置１００が、学習処理情報要求として、処理性能要件に対する学習データ、及び、処理パラメータを要求してもよい。この場合、特定部５５０は、処理性能要件を満たす処理性能に関連付けられた特徴ベクトルに係る学習データ、及び、処理パラメータの組を特定し、送信する。

図１９は、本発明の実施の形態における、表示画面５５１の他の例を示す図である。図１９の例では、処理性能要件（入力値）に対して、特定された学習データ、及び、処理パラメータの組が示されている。ユーザは、図１９の表示画面５５１を参照し、様々な学習データに対して、処理性能要件を満たすような、適切な処理パラメータを取得できる。

なお、図１５から図１９の表示画面５５１において、学習データの代わり、あるいは、学習データとともに、当該学習データの特徴量が表示されてもよい。

また、上述の説明では、特定部５５０が、学習処理情報５３１から、新たな学習データとの間でサンプル数、属性数の差分が所定の差分閾値以下であり、属性値に係る特徴量のコサイン類似度が所定の類似度閾値以下の特徴ベクトルを抽出した。一般に、モデル構築処理の処理時間は、学習データの特徴が類似し、サンプル数や属性数の差分がある程度の範囲であれば、サンプル数や属性数に依存し、それらに対して概ね線形に比例すると考えられる。したがって、新たな学習データ、及び、特定の処理パラメータに対する処理性能が要求された場合、特定部５５０は、抽出された特徴ベクトルに対する処理時間とサンプル数や属性数の差分を用いて、新たな学習データのより正確な処理時間を推定してもよい。

また、上述の説明では、学習支援装置５００が、クライアント装置１００からの学習処理情報要求で指定された学習データ、及び、処理性能要件に対して、処理パラメータを特定し、クライアント装置１００へ送信した。しかしながら、これに限らず、学習支援装置５００が、指定された学習データ、及び、特定された処理パラメータを含むモデル構築要求を学習装置３００に送信し、学習装置３００にモデルを構築させてもよい。この場合、学習支援装置５００は、ユーザから、特定された処理パラメータを用いたモデル構築の許可が、クライアント装置１００を介して得られたときに、モデル構築要求を送信してもよい。これにより、新たな学習データに対して、処理性能要件を満たすようなモデルの構築を、処理パラメータの決定のための試行錯誤をすることなく、実行できる。

また、本発明の実施の形態においては、所定の処理が機械学習によるモデルの構築処理である場合を例に説明した。しかしながら、これに限らず、入力されるデータに対して処理パラメータを用いて処理を行い、処理パラメータに応じて異なる処理性能（処理時間や評価指標等）が得られるのであれば、所定の処理は機械学習によるモデル構築処理以外の処理でもよい。例えば、所定の処理は画像データや映像データの解析処理でもよい。

次に、本発明の実施の形態の特徴的な構成を説明する。図１は、本発明の実施の形態の特徴的な構成を示すブロック図である。

図１を参照すると、学習支援装置５００（情報処理装置）は、入力部５４０、及び、特定部５５０を含む。入力部５４０は、新たな学習データ（第１のデータ）の入力を受け付ける。特定部５５０は、学習処理を学習データ（第２のデータ）に対して実行した場合の学習処理に係る処理性能の履歴を用いて、新たな学習データに対応する学習処理に係る処理パラメータの値、及び、処理性能の値の内の少なくとも一方を特定し、出力する。

次に、本発明の実施の形態の効果を説明する。

本発明の実施の形態によれば、所定の処理に係る適切な処理パラメータの決定、及び、処理時間の把握を短時間で行うことができる。その理由は、特定部５５０が、学習処理を学習データに対して実行した場合の学習処理に係る処理性能の履歴を用いて、新たな学習データに対応する学習処理に係る処理パラメータの値、及び、処理性能の値の内の少なくとも一方を特定し、出力するためである。

これにより、所定の処理に係る適切な処理パラメータの決定、及び、処理時間の把握に必要な、人的リソースやマシンリソースを削減できる。

以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

１学習システム
１００クライアント装置
２００サーバ装置
３００学習装置
４００モデル記憶装置
５００学習支援装置
５０１ＣＰＵ
５０２記憶デバイス
５０３入出力デバイス
５０４通信デバイス
５１０学習処理情報収集部
５２０特徴ベクトル生成部
５３０学習処理情報記憶部
５３１学習処理情報
５４０入力部
５５０特定部
５５１表示画面
５６０出力部

Claims

第１のデータの入力を受け付ける、入力手段と、
所定の処理を第２のデータに対して実行した場合の前記所定の処理に係る処理性能の履歴を用いて、前記第１のデータに対応する前記所定の処理に係る処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定し、出力する、特定手段と、
を備えた、情報処理装置。
前記特定手段は、前記第２のデータの特性、前記処理パラメータの値、及び、前記処理パラメータを用いて前記所定の処理を前記第２のデータに対して実行した場合の前記処理性能の値が関連付けられた処理情報をもとに、前記第１のデータの特性に対応する前記処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定する、
請求項１に記載の情報処理装置。
前記特定手段は、前記第１のデータの特性と前記処理情報における前記第２のデータの特性とを比較し、前記第１のデータの特性に類似する前記第２のデータの特性に関連付けられた前記処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定する、
請求項２に記載の情報処理装置。
前記入力手段は、前記第１のデータと前記処理性能に係る条件との入力を受け付け、
前記特定手段は、前記処理情報をもとに、前記第１のデータの特性に対応する前記処理パラメータの値の内、前記処理性能に係る条件を満たす前記処理性能に関連付けられた前記処理パラメータの値を特定する、
請求項２または３に記載の情報処理装置。
前記処理性能は、前記所定の処理の処理時間を含む、
請求項１乃至４のいずれかに記載の情報処理装置。
前記所定の処理は、データに対するモデルを構築する、学習処理であり、
前記処理性能は、前記学習処理により生成されたモデルの精度を含む、
請求項１乃至５のいずれかに記載の情報処理装置。
前記特性は、データに含まれる複数の属性の各々の最大値、最小値、及び、周波数の内の少なくとも一つを含む、
請求項２に記載の情報処理装置。
第１のデータの入力を受け付け、
所定の処理を第２のデータに対して実行した場合の前記所定の処理に係る処理性能の履歴を用いて、前記第１のデータに対応する前記所定の処理に係る処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定し、出力する、
情報処理方法。
前記特定する場合、前記第２のデータの特性、前記処理パラメータの値、及び、前記処理パラメータを用いて前記所定の処理を前記第２のデータに対して実行した場合の前記処理性能の値が関連付けられた処理情報をもとに、前記第１のデータの特性に対応する前記処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定する、
請求項８に記載の情報処理方法。
前記特定する場合、前記入力された前記第１のデータの特性と前記処理情報における前記第２のデータの特性とを比較し、前記第１のデータの特性に類似する前記第２のデータの特性に関連付けられた前記処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定する、
請求項９に記載の情報処理方法。
前記第１のデータの入力を受け付ける場合、前記第１のデータと前記処理性能に係る条件との入力を受け付け、
前記特定する場合、前記処理情報をもとに、前記第１のデータの特性に対応する前記処理パラメータの値の内、前記処理性能に係る条件を満たす前記処理性能に関連付けられた前記処理パラメータの値を特定する、
請求項９または１０に記載の情報処理方法。
コンピュータに、
第１のデータの入力を受け付け、
所定の処理を第２のデータに対して実行した場合の前記所定の処理に係る処理性能の履歴を用いて、前記第１のデータに対応する前記所定の処理に係る処理パラメータの値、及び、前記処理性能の値の内の少なくとも一方を特定し、出力する、
処理を実行させるプログラム。