WO2021153477A1

WO2021153477A1 - 情報処理装置、情報処理方法および情報処理プログラム

Info

Publication number: WO2021153477A1
Application number: PCT/JP2021/002366
Authority: WO
Inventors: 健人中田; 裕士堀口; 慎吾高松; 紘士飯田; 正典宮原; 将大吉田
Original assignee: ソニーグループ株式会社
Priority date: 2020-01-30
Filing date: 2021-01-25
Publication date: 2021-08-05
Also published as: EP4105789A1; EP4105789A4; US20230052020A1

Abstract

情報処理装置（１）は、学習部（３２）と、算出部（３３）と、提示部（３４）とを備える。学習部（３２）は、ユーザが所持する端末装置（１００）から取得した所定の新規データに基づく第１モデルと、記憶部（４）に予め記憶された共有データを追加データとして新規データに結合した結合データに基づく第２モデルとを学習する。算出部（３３）は、第１モデルに対する第２モデルの出力精度の改善度合いを示す改善度を算出する。提示部（３４）は、算出部（３３）によって算出された改善度に基づいた所定の提示情報を生成する。

Description

情報処理装置、情報処理方法および情報処理プログラム

　本開示は、情報処理装置、情報処理方法および情報処理プログラムに関する。

　従来、サーバに登録された複数のデータセットの中から、ユーザが保持しているデータに類似したデータセットを提供する技術がある（例えば、特許文献１参照）。例えば、ユーザは、提供されたデータセットを、自身のデータに追加して予測モデル等を学習する。

特表２０１９－５０７４４４号公報

　しかしながら、従来技術は、ユーザのデータに類似したデータセットを提供しているに過ぎないため、提供されたデータセットがモデルを学習する上で有用であるか否かはわからなかった。

　そこで、本開示では、モデル学習に有用なデータを提示することができる情報処理装置、情報処理方法および情報処理プログラムを提案する。

　上記の課題を解決するために、本開示に係る一形態の情報処理装置は、学習部と、算出部と、提示部とを備える。前記学習部は、ユーザが所持する端末装置から取得した所定の新規データに基づく第１モデルと、記憶部に予め記憶された共有データを追加データとして前記新規データに結合した結合データに基づく第２モデルとを学習する。前記算出部は、前記第１モデルに対する前記第２モデルの出力精度の改善度合いを示す改善度を算出する。前記提示部は、前記算出部によって算出された前記改善度に基づいた提示情報を生成する。

実施形態に係る情報処理方法の概要を示す図である。実施形態に係る情報処理方法の概要を示す図である。実施形態に係る情報処理システムの構成例を示す図である。実施形態に係る情報処理装置の構成例を示すブロック図である。統計データの生成処理を示す図である。メタ特徴量の算出処理を示す図である。結合データを生成するための結合処理を示す図である。時系列データである場合の結合データの結合処理を示す図である。推薦度情報の算出処理を示す図である。グラフ理論を用いた推薦度情報の算出処理を示す図である。ユーザ端末の画面表示の一例を示す図である。ユーザ端末の画面表示の一例を示す図である。実施形態に係る情報処理装置が実行する処理の処理手順を示すフローチャートである。実施形態に係る情報処理装置が実行する処理の処理手順を示すフローチャートである。実施形態に係る情報処理装置が実行する処理の処理手順を示すフローチャートである。本実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なる数字を付して区別する場合もある。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。

＜実施形態に係る情報処理方法の概要＞
　図１Ａおよび図１Ｂは、実施形態に係る情報処理方法の概要を示す図である。実施形態に係る情報処理方法は、情報処理装置１によって実行される。図１Ａに示すように、実施形態に係る情報処理装置１は、共有データデータベース（ＤＢ）を予め記憶部に記憶しており、ユーザ（ユーザ端末）から受け付けた新規データと、共有データＤＢに記憶された共有データとに基づいて、所定の提示情報を生成しユーザへ提示する。

　具体的には、情報処理装置１は、新規データと共有データとを結合した結合データに基づき学習したモデルの出力精度の改善度合いを示す改善度に基づいた提示情報を生成し、ユーザ（後述するユーザ端末１００）へ提示する。

　ここで、図１Ｂを用いて、改善度の算出処理について説明する。図１Ｂに示すように、情報処理装置１は、まず、ユーザから取得した新規データに基づいて第１モデルを学習（生成）する。

　つづいて、情報処理装置１は、共有データＤＢの中から選択した共有データを追加データとして新規データに結合した結合データに基づいて第２モデルを学習（生成）する。なお、追加データの選択は、例えば、ユーザによる指定や、共有データのメタ特徴量に基づいて行われるが、詳細については後述する。

　そして、情報処理装置１は、第１モデルに対する第２モデルの出力精度の改善度合いを示す改善度を算出する。つまり、情報処理装置１は、新規データに所定の追加データを結合することにより、第１モデルの出力に対して第２モデルの出力の精度がどの程度改善したかの度合いを改善度として算出する。なお、改善度の算出処理の詳細については後述する。

　これにより、例えば、改善度に基づいた提示情報として、改善度が高い（出力精度が向上する）追加データをユーザに提示（推薦）することができる。すなわち、実施形態に係る情報処理方法によれば、改善度を算出することで、ユーザに対してモデル学習に有用なデータ（共有データ）を提供することができる。

　なお、情報処理装置１は、追加データを提示情報として提示する場合に限らず、改善度の情報そのものをユーザへ提示してもよい。つまり、情報処理装置１は、追加データを追加することでモデルの精度がどの程度改善するかの情報を提示情報として提示する。これにより、ユーザは追加データによりどの程度モデル学習の改善が見込めるかを容易に判断できるため、ユーザにとってより効果的な追加データを新規データに追加してモデル学習を行うことができる。

　なお、情報処理装置１は、処理負荷軽減のため、既に記憶している共有データを用いて、改善度を推定する改善度モデルを予めに学習しておくことができるが、かかる点の詳細については後述する。

＜実施形態に係る情報処理システムの構成＞
　次に、図２を用いて、上述した情報処理装置１を含む情報処理システムの構成について説明する。図２は、実施形態に係る情報処理システムＳの構成を示す図である。図２に示すように、実施形態に係る情報処理システムＳは、情報処理装置１と、複数のユーザ端末１００とを含む。

　情報処理装置１および複数のユーザ端末１００は、ネットワークＮを介して接続される。ネットワークＮは、ＬＡＮ（Local　Area　Network）、ＷＡＮ（Wide　Area　Network）、電話網（携帯電話網、固定電話網等）、地域ＩＰ（Internet　Protocol）網、インターネット等の通信ネットワークである。ネットワークＮには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。

　情報処理装置１は、例えば、ユーザ端末１００に対して各種サービスを提供するサーバ装置である。例えば、情報処理装置１は、ユーザ端末１００に対してモデル学習に関するアプリケーションを提供する。具体的には、情報処理装置１は、ユーザ端末１００から受信した新規データに基づいてモデルを学習したり、モデルの出力精度の改善度を算出したり、上述した提示情報をユーザ端末１００へ提示したりする。なお、情報処理装置１が実行する各種処理の詳細については後述する。

　ユーザ端末１００は、ユーザによって利用される端末装置である。ユーザ端末１００は、例えば、スマートフォン、デスクトップ型ＰＣ（Personal　Computer）、ノート型ＰＣ、タブレット型端末、携帯電話機、ＰＤＡ（Personal　Digital　Assistant）、ウェアラブルデバイス（Wearable　Device）等である。ユーザ端末１００は、ユーザによって入力された新規データ（共有データ含む）や、各種要求を情報処理装置１へ送信したり、情報処理装置１から受信した各種情報を音声や画面表示により出力したりする。

＜実施形態に係る情報処理装置の構成＞
　次に、図３を用いて、実施形態に係る情報処理装置１の構成例について説明する。図３は、実施形態に係る情報処理装置１の構成例を示すブロック図である。図３に示すように、実施形態に係る情報処理装置１は、通信部２と、制御部３と、記憶部４とを備える。

　通信部２は、例えば、ＮＩＣ（Network　Interface　Card）等によって実現される。そして、通信部２は、所定のネットワークＮと有線または無線で接続され、ユーザ端末１００との間で情報の送受信を行う。

　制御部３は、例えば、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等によって、情報処理装置１内部に記憶されたプログラムがＲＡＭ等を作業領域として実行されることにより実現される。また、制御部３は、コントローラ（controller）であり、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路により実現される。　

　図３に示すように、制御部３は、取得部３１と、学習部３２と、算出部３３と、提示部３４とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部３の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

　記憶部４は、例えば、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。

　記憶部４は、例えば、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部４は、図３に示すように、共有データＤＢ４１と、メタ特徴情報４２と、履歴情報４３とを記憶する。

＜共有データＤＢ＞
　共有データＤＢ４１は、ユーザから取得した新規データに基づいて生成した共有データを複数含むデータベースである。なお、共有データの生成処理については、図４で後述する。

＜メタ特徴情報＞
　メタ特徴情報４２は、データの特徴量に関する情報である。具体的には、メタ特徴情報４２には、新規データや共有データから算出したメタ特徴量の情報が含まれる。なお、メタ特徴量の算出処理については、図５で後述する。

＜履歴情報＞
　履歴情報４３は、共有データＤＢ４１に含まれる共有データに対するユーザの行動履歴の情報である。具体的には、履歴情報４３は、後述する第２モデルを学習するために共有データに対してユーザが行った行動履歴の情報であり、例えば、共有データの検索回数（検索ヒット数）や、共有データの閲覧回数、追加データとして学習された回数、学習して得られた第２モデルのダウンロード回数、実際の第２モデルの運用実績（運用期間や、使用回数等）、第２モデルを採用したユーザによる共有データの評価情報等の情報が含まれる。

＜制御部＞
　次に、制御部３の各機能（取得部３１、学習部３２、算出部３３および提示部３４）について説明する。

　取得部３１は、各種データを取得する。例えば、取得部３１は、ユーザ端末１００から新規データを取得し、新規データに基づいて統計データを生成する。ここで、図４を用いて、統計データの生成処理について説明する。

　図４は、統計データの生成処理を示す図である。なお、図４では、新規データがテーブル型のデータである場合を例に挙げて説明するが、新規データは、画像データや、音声データ、グラフ構造データ等であってもよい。

　図４に示すように、取得部３１は、ユーザから取得した新規データに対して統計処理を施すことで統計データを生成する。図４に示す例では、統計データは、「カラム名」、「データタイプ」、「ユニーク数」および「欠損率」といった項目を含む。

　「カラム名」は、新規データにおける各項目名を示す情報である。「データタイプ」は、カラムである各項目のデータの型を示す情報であり、例えば、カテゴリカル値や、文字列、数値といった情報が入力される。「ユニーク数」は、カラムである各項目のデータの異なる値の数を示す情報である。「欠損率」は、カラムである各項目のデータの欠損率を示す情報である。

　なお、図４に示す統計データは一例であって、例えば、各カラムにおけるデータのカテゴリや、各カラムにおけるデータの要約値（最大値や、最小値、平均値、中央値、分散、偏差等）、複数のテーブルデータ間における連結候補等の情報が統計データに含まれてもよい。

　そして、取得部３１は、生成した統計データをユーザへ提示し、統計データの確認および訂正をユーザから受け付ける。なお、取得部３１は、ユーザから新規データの説明情報を受け付けてもよい。説明情報は、例えば、ユーザによって任意に入力されたテキスト情報や、データの説明に関する複数の選択肢の選択結果の情報であってもよい。例えば、取得部３１は、説明情報の解析結果を統計データとして生成してもよい。

　そして、取得部３１は、ユーザから統計データの訂正要求があった場合、訂正要求に基づいて統計データを訂正し、訂正後の統計データをユーザへ提示する。

　また、取得部３１は、ユーザから統計データの確認完了の通知を受け付けるとともに、共有データとして記憶するか、モデル学習を行うかの指示を受け付ける。例えば、取得部３１は、共有データとして記憶する記憶指示を受け付けた場合、新規データに統計データを対応付けた対応データを共有データとして共有データＤＢ４１に格納する。

　一方、取得部３１は、モデル学習を行う学習指示を受け付ける場合、新規データの中から、モデル学習に用いるカラムの指定およびモデルの出力となるカラムの指定を学習指示とともに受け付ける。取得部３１は、受け付けた学習指示の情報および対応データを学習部３２へ出力する。なお、以下では、後述する第１モデルを学習するための対応データを「学習データ」と称し、共有データＤＢ４１に格納された対応データを「共有データ」と称する。

　また、取得部３１は、生成した統計データに基づいて統計データの特徴量を算出する。取得部３１は、例えば、特徴量としてメタ特徴量を算出する。ここで、図５を用いて、メタ特徴量の算出処理について説明する。

　図５は、メタ特徴量の算出処理を示す図である。図５では、互いに連結関係にある２つの統計データを示しており、この２つの統計データは、１つの新規データから生成されることとする。

　まず、取得部３１は、統計データにおける各列（カラム名、データタイプ、ユニーク数、欠損率、最大値および連結）のデータを数値化（メタ特徴化）する。つづいて、取得部３１は、メタ特徴化された数値をカラム毎に集約してメタ特徴量を算出する。

　図５に示す例では、例えば、１行目のカラムのメタ特徴量は、[０，１，０，５，・・・]となる。つづいて、取得部３１は、カラム毎のメタ特徴量に基づいて、テーブル毎（すなわち、統計データ毎）のメタ特徴量を算出する。

　例えば、取得部３１は、カラム毎のメタ特徴量の和や、平均、単純結合等を行うことでテーブル毎のメタ特徴量を算出する。なお、テーブル毎のメタ特徴量では、モデルの出力となるカラムは除かれる。

　つづいて、取得部３１は、テーブル毎のメタ特徴量に基づいて、連結テーブル毎（すなわち、新規データまたは共有データ毎）のメタ特徴量を算出する。例えば、取得部３１は、テーブル毎のメタ特徴量の和や、平均、単純結合等を行うことで連結テーブル毎のメタ特徴量を算出する。

　取得部３１は、算出した各メタ特徴量をメタ特徴情報４２として記憶部４に記憶する。なお、取得部３１は、メタ特徴量に限らず、新規データおよび共有データの特徴が数値化された特徴量であれば任意の特徴量を採用可能である。

　なお、取得部３１は、既に記憶部４に記憶された共有データについて、ユーザ端末１００から更新要求があった場合に、更新要求に含まれる更新データに基づいて共有データを更新する。

　また、取得部３１は、所定の条件を満たす共有データに対して匿名化処理を施して記憶部４に記憶するようにしてもよい。例えば、取得部３１は、共有データに含まれる特定のカラムのデータの指定がユーザからあった場合、かかるカラムのデータを匿名化して記憶する。

　あるいは、取得部３１は、所定の匿名化アルゴリズム（ｋ－匿名化、ラプラスメカニズムによる差分プライバシー保証等）により自動で匿名化処理を施してもよい。なお、かかる場合、取得部３１は、匿名化処理を行う旨をユーザへ通知するようにしてもよい。

　学習部３２は、取得部３１によって取得された学習指示に基づいてモデルを学習する。なお、第１モデルおよび第２モデルの学習アルゴリズムは、任意のアルゴリズムを採用可能である。

　学習部３２は、学習指示によって指定されたカラムを出力とするモデルを学習する。具体的には、学習部３２は、新規データである学習データに基づいて第１モデルを学習する。より具体的には、学習部３２は、学習データのメタ特徴量を説明変数とし、指定されたカラムを目的変数として第１モデルを学習する。

　また、学習部３２は、共有データＤＢ４１に格納された共有データを追加データとして学習データに結合した結合データに基づいて第２モデルを学習する。具体的には、学習部３２は、結合データのメタ特徴量を算出し、算出したメタ特徴量を説明変数とし、指定されたカラムを目的変数として第２モデルを学習する。なお、学習部３２は、結合データのメタ特徴量の算出を取得部３１に指示してもよい。

　ここで、図６を用いて、結合データの結合処理について説明する。図６は、結合データを生成するための結合処理を示す図である。図６では、１つの学習データに対して２つの追加データを結合する場合を示す。なお、追加データは、学習データに類似する共有データが選択されるが、かかる選択処理については、図８で後述する。

　図６では、学習部３２は、学習データの統計データに追加データの統計データの一部のカラムデータを結合する場合を示している。具体的には、追加データ１のカラム名「資本金」のカラムデータと、追加データ２のカラム名「製品カテゴリ」のカラムデータとを学習データに結合する。なお、結合するカラムデータは、ユーザによって選択されたカラムデータであってもよく、所定のアルゴリズムによって選定されたカラムデータであってもよい。

　なお、学習部３２は、学習データおよび追加データが時系列のデータである場合において、学習データおよび追加データの時系列が一致しない場合、学習データの時系列と一致させるための追加データを生成して結合する。かかる点について、図７を用いて説明する。

　図７は、時系列データである場合の結合データの結合処理を示す図である。図７では、時刻毎のＡ社の株価の情報を含む学習データに対して、Ｂ社およびＤ社の株価を結合する場合について説明する。なお、図７において、学習データにおけるカラム名「時刻」と、追加データにおけるカラム名「時刻」とが異なる（時刻自体が異なる場合や、時間間隔が異なる場合等がある）こととする。

　例えば、学習部３２は、学習データの「時刻」と追加データの「時刻」とが１０分ずれている場合、追加データの「時刻」のズレ量である１０分を補正し、学習データの「時刻」に揃える。かかる場合、追加データの各カラムの株価データは、補正値である１０分に応じた値で補正してもよく、あるいは、外部サーバから補正後の時刻における株価データを取得してもよい。

　また、例えば、学習データの「時刻」が３０分間隔であるのに対し、追加データの「時刻」が６０分間隔である場合、３０分間隔の株価データを補間する。例えば、補間する株価データは、前後の株価データの平均値であってもよく、あるいは、外部サーバから取得した株価データであってもよい。

　すなわち、学習部３２は、時刻同期という前処理を追加データに施して学習データに結合させる。このように、追加データを時刻同期して学習データに結合することで、学習結果として生成される第２モデルの精度を向上させることができる。

　なお、学習部３２は、前処理として、時刻同期以外に、例えば、画像データや音声データ等では、後段のモデル学習で扱えるように数値化する前処理を施してもよい。

　図３に戻って、算出部３３について説明する。算出部３３は、第１モデルに対する第２モデルの出力精度の改善度合いを示す改善度を算出する。例えば、算出部３３は、第１モデルおよび第２モデルの精度評価指標の差異を改善度として算出することができる。

　なお、精度評価指標は、例えば、決定係数（Ｒ^２）や、ＲＭＳＥ（Root　Mean　Squared　Error）、ＭＡＥ（Mean　Absolute　Error）等の指標を用いることができる。

　なお、算出部３３は、ユーザから新規データとともに学習指示がある毎に、改善度を算出してもよく、あるいは、改善度を推定するモデル（改善度モデル）を予め学習しておいてもよい。

　具体的には、学習部３２は、まず、共有データＤＢ４１の中から、疑似的に学習データ（疑似新規データ）および追加データ（疑似追加データ）を選択し、疑似新規データに基づく疑似第１モデルと、前記疑似追加データに基づく疑似第２モデルとを学習する。

　そして、算出部３３は、疑似第１モデルおよび疑似第２モデルに基づき算出した疑似改善度に基づいて、改善度を出力とする改善度モデルを学習する。具体的には、算出部３３は、疑似第学習データの特徴量および疑似追加データの特徴量を説明変数とし、疑似改善度を目的変数として改善度モデルを学習する。

　これにより、ユーザによって新規データが入力された場合に、改善度モデルを用いることで、所定の追加データを追加した場合における改善度の算出処理を高速化できる。

　なお、算出部３３は、改善度モデルの説明変数として、疑似学習データおよび疑似追加データに対するユーザの行動履歴の情報（履歴情報４３）や、疑似第１モデルおよび疑似第２モデルの出力結果情報等を含ませてもよい。予測結果情報とは、精度評価指標や、モデルの出力を成功および失敗に分類した場合、各分類におけるデータの平均値や分散等の統計量、疑似学習データおよび疑似追加データにおける各カラムデータのモデルに対する寄与度（重要度）等の情報を含んだ情報である。

　提示部３４は、算出部３３によって算出された改善度に基づいた所定の提示情報を生成し、ユーザへ提示する。例えば、提示部３４は、ユーザによって新規データが入力された場合に、改善度モデルで推定された改善度が所定の条件を満たす追加データを提示情報として生成し、ユーザへ提示する。例えば、提示部３４は、改善度が所定の閾値以上の追加データを提示情報として生成し、提示する。

　つまり、提示部３４は、新規データを基にモデルを学習する場合、データを追加することでモデルの出力精度の改善が見込める追加データを提示する。

　また、提示部３４は、複数の追加データを提示情報として生成してユーザへ提示する場合、改善度に基づく推薦度情報を併せて生成し、提示する。推薦度情報は、データを追加することで改善の効果が高いことを示す情報であり、例えば、改善度およびメタ特徴量に基づいて算出される。ここで、図８を用いて、推薦度情報の算出処理について説明する。

　図８は、推薦度情報の算出処理を示す図である。図８の上段では、２次元のメタ特徴量空間に学習データおよび追加データをプロットした場合を示している。かかるメタ特徴量空間では、メタ特徴量が類似するほど、データ間の距離が短くなることとする。

　図８に示すように、まず、算出部３３は、メタ特徴量空間において、学習データと各追加データとの所定の距離指標を算出する。距離指標は、例えば、ハミング距離や、ユークリッド距離、マハラノビス距離等を用いることができる。

　つづいて、算出部３３は、追加データを距離指標により昇順でソートし、距離指標が小さい（距離が近い）所定数の追加データを選択する。なお、算出部３３は、距離指標が所定値以上の追加データを選択するようにしてもよい。ここで選択された追加データが提示情報としてユーザへ提示される。

　さらに、算出部３３は、改善度モデルを用いて、選択した追加データに含まれるカラム毎に改善度を推定する。換言すれば、学習部３２は、学習データと特徴量が類似する共有データを追加データとして結合することで、モデル学習や、改善度の算出等を行う。そして、算出部３３は、学習データを「ｕ」、距離指標により選択した追加データを「ａ」、選択した追加データにおける任意のカラムデータを「ｂ」、かかるカラムデータの改善度を「ｇ」とした場合に、学習データに対するカラムデータの推薦度指標ｆ_ａｂｂ（ｂ，ｕ）を、下記式（１）により算出する。

　そして、提示部３４は、算出した推薦度指標に基づいたカラムデータ毎の推薦度情報を提示情報と併せて表示する。なお、推薦度情報の具体的な提示態様については、図１１で後述する。

　このように、提示部３４は、改善度に基づく推薦度情報をユーザへ提示することで、改善効果の高い追加データ（カラムデータ）をユーザが把握できるため、モデル学習を効率良く行うことができる。

　なお、提示部３４は、推薦度指標に基づいた推薦度情報を提示する場合以外に、例えば、グラフ理論を用いた推薦度情報を提示してもよい。かかる点について、図９を用いて説明する。

　図９は、グラフ理論を用いた推薦度情報の算出処理を示す図である。図９に示すように、提示部３４は、まず、追加データの特徴量および追加データ間における改善度に基づいて、所定の空間におけるノードを追加データとし、改善度が所定値以上のノード間をリンクで結んだグラフを構築する。

　つづいて、提示部３４は、学習データの特徴量および各追加データとの改善度に基づいて、構築したグラフ上に学習データのノードおよびリンクを構築する。そして、提示部３４は、学習データまでのリンク数が所定数以下の追加データを推薦度情報の対象として決定する。例えば、提示部３４は、リンク数が少ない程、推薦度が高くなるような推薦度情報を提示する。例えば、図９に示すように、リンク数が２つ以下の追加データを推薦度情報の対象とする。

＜ユーザ端末のＵＩ＞
　次に、図１０および図１１を用いて、情報処理装置１からの情報に基づくユーザ端末１００の画面表示の一例について説明する。図１０および図１１は、ユーザ端末１００の画面表示の一例を示す図である。

　図１０の上段では、情報処理装置１から受信した統計データが表示された画面を示している。図１０の上段に示すように、ユーザ端末１００には、学習するモデルの出力に関する出力情報１０１や、統計データ１０２、統計データ内の特定のカラムを検索する検索窓１０３、処理実行ボタン１０４，１０５，１０６，１０７等が表示される。

　出力情報１０１には、ユーザが選択したモデルの出力となるカラム名の情報（予測ターゲット）や、出力されるデータタイプ（予測タイプ）、新規データに含まれるカラムデータの割合（予測値）等の情報が含まれる。

　統計データ１０２には、上述した統計データの情報が表示される。また、統計データ１０２の上部には検索窓１０３が配置され、統計データにおける特定のカラムを検索できるようになっている。

　処理実行ボタン１０４，１０５，１０６，１０７は、各種処理を実行するための表示ボタンである。処理実行ボタン１０４である「このデータを共有」は、新規データを共有データとして共有データＤＢ４１に格納するための処理を実行するボタンである。処理実行ボタン１０５である「追加データ検索」は、モデルの出力精度の改善が見込める追加データを検索するためのボタンである。処理実行ボタン１０６である「キャンセル」は、作業をキャンセルするためのボタンである。処理実行ボタン１０７である「学習と評価を実行」は、モデルの学習処理（および評価処理）を実行するためのボタンである。なお、評価処理とは、モデルの精度評価指標を算出処理である。

　ここで、ユーザが統計データ１０２の中から所定のカラムを選択して（チェックボックス）、処理実行ボタン１０５である「追加データ検索」を押下したとする。かかる場合、情報処理装置１は、選択されたカラムを新規データとし、出力情報１０１をモデルの出力として、第１モデルおよび第２モデルを学習するとともに、改善度を算出する。そして、情報処理装置１は、改善度に基づいた推薦度情報が所定の条件を満たす追加データを推薦結果として表示する。

　図１０の下段には、推薦結果の画面の一例を示しており、追加データとして、「株式データセット」、「天気データセット」、「製品データセット」を示している。なお、データセットとは、複数のカラムデータを含んでいることを示している。

　また、図１０の下段に示すように、各追加データには、追加データの項目例（カラム）等といった説明等の付加情報１１０が付加されて表示されている。つまり、情報処理装置１は、提示情報として追加データを提示する場合、追加データに関する所定の付加情報を併せて生成し、提示する。なお、付加情報として、例えば、追加データのカラム名や、データサイズ、カラム毎の統計データ、追加データにおける各カラムの要素値（代表値や、ヒストグラム等）、追加データに対して過去の他ユーザによって使用された前処理方法、追加データを実際に使用した他ユーザの評価や、閲覧数、学習実行数、モデル運用数等の情報が表示される。

　また、図１０の下段には、追加データを追加するための追加ボタン１１１や、推薦された追加データを追加してモデル学習を実行するための実行ボタン１１２や、所定の条件により選別された無償の共有データ（追加データ）を表示する画面と、有償の共有データ（追加データ）を表示する画面とを切り替えるための切替ボタン１１３が表示される。

　ここで、ユーザが製品データセットの追加ボタン１１１を押下したとする。図１１には、追加ボタン１１１を押下した場合にユーザ端末１００に表示される画面を示している。

　図１１に示すように、追加ボタン１１１（図１０）が押下された場合、追加データに含まれる各カラムデータの詳細が表示される。図１１に示す画面では、追加データの詳細情報１２０や、チェックボックス１２１、追加ボタン１２２等が表示される。

　詳細情報１２０には、追加データに含まれるカラム毎の統計データおよび「推薦度」の情報が表示される。「推薦度」は、上述した推薦度情報であり、星の数によって表現される。図１１では、上述した推薦度指標が高いほど、星の数が多くなるように表現されている。

　図１１では、ユーザは、カラム名「製品カテゴリ」が選択されており（チェック状態であり）、この状態でユーザが追加ボタン１２２を押下した場合、カラムデータである「製品カテゴリ」が追加データとして学習データに追加される。

＜処理フロー＞
　次に、図１２～図１４を用いて、実施形態に係る情報処理装置１が実行する処理の処理手順について説明する。図１２～図１４は、実施形態に係る情報処理装置１が実行する処理の処理手順を示すフローチャートである。図１２では、情報処理装置１が実行する共有データの登録処理を示し、図１３では、提示情報の提示処理を示し、図１４では、改善度モデルの学習処理を示す。

　まず、図１２を用いて、共有データの登録処理について説明する。

　図１２に示すように、まず、情報処理装置１の制御部３は、ユーザ端末１００から新規データを取得する（ステップＳ１０１）。

　つづいて、制御部３は、取得した新規データの統計データを算出し（ステップＳ１０２）、統計データをユーザ端末１００へ提示する（ステップＳ１０３）。

　つづいて、制御部３は、ユーザ端末１００から新規データを共有データとして登録する登録要求があったとする（ステップＳ１０４）。なお、制御部３は、統計データの訂正要求等があった場合には、必要に応じて統計データを訂正する。

　つづいて、制御部３は、所定の匿名化アルゴリズム、または、ユーザからの指定により、必要に応じて、新規データおよび統計データに含まれるデータに対して匿名化処理を施す（ステップＳ１０５）。

　つづいて、制御部３は、新規データおよび統計データを対応付けた対応データを共有データとして共有データＤＢ４１に記憶し（ステップＳ１０６）、登録処理を終了する。

　次に、図１３を用いて、提示情報の提示処理について説明する。
　図１３に示すように、まず、制御部３は、ユーザ端末１００から新規データを取得する（ステップＳ２０１）。

　つづいて、制御部３は、新規データに基づいて学習するモデル（第１モデルおよび第２モデル）の出力対象の指定を受け付ける（ステップＳ２０２）。

　つづいて、制御部３は、新規データに基づいて統計データを算出することで、統計データおよび新規データを対応付けた対応データである学習データを生成する（ステップＳ２０３）。

　つづいて、制御部３は、学習データの特徴量であるメタ特徴量を算出する（ステップＳ２０４）。

　つづいて、制御部３は、学習データを説明変数とし、ステップＳ２０２で指定された出力対象を目的変数とする第１モデルを学習する（ステップＳ２０５）。

　つづいて、制御部３は、学習データとメタ特徴量が類似する共有データを追加データとして選択する（ステップＳ２０６）。

　つづいて、制御部３は、学習データに追加データを結合した結合データを説明変数とし、ステップＳ２０２で指定された出力対象を目的変数とする第２モデルを学習する（ステップＳ２０７）。

　つづいて、制御部３は、第１モデルに対する第２モデルの出力精度の改善度合いを示す改善度を算出する（ステップＳ２０８）。

　つづいて、制御部３は、算出した改善度に基づいた所定の提示情報をユーザへ提示し（ステップＳ２０９）、提示処理を終了する。

　次に、図１４を用いて、改善度モデルの学習処理について説明する。

　まず、制御部３は、記憶部４に記憶された共有データＤＢ４１に含まれる共有データのメタ特徴量を算出する（ステップＳ３０１）。

　つづいて、制御部３は、共有データＤＢ４１の中から、疑似的な新規データ（疑似新規データ）となる共有データを選択し、選択した疑似的な新規データである共有データのメタ特徴量に基づいて疑似的な追加データ（疑似追加データ）となる共有データを選択する（ステップＳ３０２）。

　つづいて、制御部３は、疑似新規データに基づいて疑似的な第１モデル（疑似第１モデル）を学習し、疑似新規データおよび疑似追加データに基づいて疑似的な第２モデル（疑似第２モデル）を学習する（ステップＳ３０３）。

　つづいて、制御部３は、疑似第１モデルおよび疑似第２モデルに基づいて疑似改善度を算出する（ステップＳ３０４）。

　つづいて、制御部３は、疑似新規データおよび疑似追加データの履歴情報４３を取得する（ステップＳ３０５）。

　つづいて、制御部３は、疑似新規データのメタ特徴量および疑似追加データのメタ特徴量、疑似第１モデルおよび疑似第２モデルの精度評価指標の情報、履歴情報４３を説明変数とし、疑似改善度を目的変数とする改善度モデルを学習し（ステップＳ３０６）、処理を終了する。

＜ハードウェア構成例＞
　続いて、図１５を参照して、本実施形態に係る情報処理装置１等のハードウェア構成の一例について説明する。図１５は、本実施形態に係る情報処理装置１のハードウェア構成の一例を示すブロック図である。　

　図１５に示すように、情報処理装置１は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）９０１、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）９０２、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）９０３、ホストバス９０５、ブリッジ９０７、外部バス９０６、インタフェース９０８、入力装置９１１、出力装置９１２、ストレージ装置９１３、ドライブ９１４、接続ポート９１５、及び通信装置９１６を備える。情報処理装置１は、ＣＰＵ９０１に替えて、又はこれと共に、電気回路、ＤＳＰ若しくはＡＳＩＣ等の処理回路を備えてもよい。　

　ＣＰＵ９０１は、演算処理装置、及び制御装置として機能し、各種プログラムに従って情報処理装置１内の動作全般を制御する。また、ＣＰＵ９０１は、マイクロプロセッサであってもよい。ＲＯＭ９０２は、ＣＰＵ９０１が使用するプログラム及び演算パラメータ等を記憶する。ＲＡＭ９０３は、ＣＰＵ９０１の実行において使用するプログラム、及びその実行において適宜変化するパラメータ等を一時記憶する。ＣＰＵ９０１は、例えば、取得部３１、学習部３２、算出部３３および提示部３４の機能を実行してもよい。　

　ＣＰＵ９０１、ＲＯＭ９０２及びＲＡＭ９０３は、ＣＰＵバスなどを含むホストバス９０５により相互に接続されている。ホストバス９０５は、ブリッジ９０７を介して、ＰＣＩ（Ｐｅｒｉｐｈｅｒａｌ　Ｃｏｍｐｏｎｅｎｔ　Ｉｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス９０６に接続されている。なお、ホストバス９０５、ブリッジ９０７、及び外部バス９０６は、必ずしも分離構成されなくともよく、１つのバスにこれらの機能が実装されてもよい。　

　入力装置９１１は、例えば、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチ又はレバー等のユーザによって情報が入力される装置である。または、入力装置９１１は、赤外線又はその他の電波を利用したリモートコントロール装置であってもよく、情報処理装置１の操作に対応した携帯電話又はＰＤＡ等の外部接続機器であってもよい。さらに、入力装置９１１は、例えば、上記の入力手段を用いてユーザにより入力された情報に基づいて入力信号を生成する入力制御回路などを含んでもよい。　

　出力装置９１２は、情報をユーザに対して視覚的又は聴覚的に通知することが可能な装置である。出力装置９１２は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）ディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ＥＬ（ＥｌｅｃｔｒｏＬｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイ装置、レーザープロジェクタ、ＬＥＤ（Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）プロジェクタ又はランプ等の表示装置であってもよく、スピーカ又はヘッドホン等の音声出力装置等であってもよい。　

　出力装置９１２は、例えば、情報処理装置１による各種処理にて得られた結果を出力してもよい。具体的には、出力装置９１２は、情報処理装置１による各種処理にて得られた結果を、テキスト、イメージ、表、又はグラフ等の様々な形式で視覚的に表示してもよい。または、出力装置９１２は、音声データ又は音響データ等のオーディオ信号をアナログ信号に変換して聴覚的に出力してもよい。　

　ストレージ装置９１３は、情報処理装置１の記憶部の一例として形成されたデータ格納用の装置である。ストレージ装置９１３は、例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等により実現されてもよい。例えば、ストレージ装置９１３は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出装置、及び記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置９１３は、ＣＰＵ９０１が実行するプログラム、各種データ及び外部から取得した各種のデータ等を格納してもよい。

　ドライブ９１４は、記憶媒体用リーダライタであり、情報処理装置１に内蔵又は外付けされる。ドライブ９１４は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記憶媒体に記録されている情報を読み出して、ＲＡＭ９０３に出力する。また、ドライブ９１４は、リムーバブル記憶媒体に情報を書き込むことも可能である。　

　接続ポート９１５は、外部機器と接続されるインタフェースである。接続ポート９１５は、外部機器とのデータ伝送可能な接続口であり、例えばＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）であってもよい。　

　通信装置９１６は、例えば、ネットワークＮに接続するための通信デバイス等で形成されたインタフェースである。通信装置９１６は、例えば、有線若しくは無線ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）、Ｂｌｕｅｔｏｏｔｈ（登録商標）又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード等であってもよい。また、通信装置９１６は、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ又は各種通信用のモデム等であってもよい。通信装置９１６は、例えば、インターネット又は他の通信機器との間で、例えばＴＣＰ／ＩＰ等の所定のプロトコルに則して信号等を送受信することができる。　

　なお、ネットワーク４０は、情報の有線又は無線の伝送路である。例えば、ネットワーク４０は、インターネット、電話回線網若しくは衛星通信網などの公衆回線網、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、又はＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などを含んでもよい。また、ネットワーク４０は、ＩＰ－ＶＰＮ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ－Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）などの専用回線網を含んでもよい。　

　なお、情報処理装置１に内蔵されるＣＰＵ、ＲＯＭ及びＲＡＭなどのハードウェアに対して、上述した本実施形態に係る情報処理装置１の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供することが可能である。　

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。　

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

＜変形例＞
　また、上記情報処理プログラムをインターネット等のネットワーク上のサーバ装置が備えるディスク装置に格納しておき、コンピュータにダウンロード等できるようにしてもよい。また、上述の機能を、ＯＳ（Operating　System）とアプリケーションソフトとの協働により実現してもよい。この場合には、ＯＳ以外の部分を媒体に格納して配布してもよいし、ＯＳ以外の部分をサーバ装置に格納しておき、コンピュータにダウンロード等できるようにしてもよい。

　また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。

　また、上述の実施形態は、処理内容を矛盾させない領域で適宜組み合わせることが可能である。また、上述の実施形態のフローチャート及びシーケンス図に示された各ステップは、適宜順序を変更することが可能である。

＜まとめ＞
　以上説明したように、本開示の一実施形態によれば、本実施形態に係る情報処理装置１は、学習部３２と、算出部３３と、提示部３４とを備える。学習部３２は、ユーザが所持する端末装置（ユーザ端末１００）から取得した所定の新規データに基づく第１モデルと、記憶部４に予め記憶された共有データを追加データとして新規データに結合した結合データに基づく第２モデルとを学習する。算出部３３は、第１モデルに対する第２モデルの出力精度の改善度合いを示す改善度を算出する。提示部３４は、算出部３３によって算出された改善度に基づいた所定の提示情報を生成する。

　これにより、ユーザに対してモデル学習に有用なデータ（共有データ）を提示することができる。

　学習部３２は、新規データと特徴量が類似する共有データを追加データとして結合する。

　これにより、ユーザの新規データとは無関係、すなわち、ユーザが普段収集しない（できない）ような追加データを追加してモデル学習が行われることを回避できる。換言すれば、ユーザによって有用（収集が容易）なデータを追加データとして提示できる。

　学習部３２は、記憶部４に記憶された共有データの中から、疑似新規データおよび疑似追加データを選択し、疑似新規データに基づく疑似第１モデルと、疑似追加データに基づく疑似第２モデルとを学習する。算出部３３は、疑似第１モデルおよび疑似第２モデルに基づき算出した疑似改善度に基づいて改善度を出力とする改善度モデルを学習する。

　これにより、改善度を出力するモデルを事前に学習できるため、新規データが入力される度に第１モデルおよび第２モデルを学習して改善度を算出する必要が無くなるため、モデル学習の処理負荷を軽減できる。

　算出部３３は、疑似新規データの特徴量および疑似追加データの特徴量を説明変数とし、疑似改善度を目的変数として改善度モデルを学習する。

　これにより、特徴量に基づいた改善度モデルを学習できるため、高精度なモデルを生成することができる。

　算出部３３は、疑似新規データおよび疑似追加データに対するユーザの行動履歴の情報を説明変数としてさらに含む。

　これにより、生成される改善度モデルの精度をさらに向上させることができる。

　提示部３４は、改善度が所定の条件を満たす追加データを提示情報として生成する。

　これにより、例えば、モデルの改善が見込める可能性が高い追加データを提示情報として提示することができる。

　提示部３４は、複数の追加データを提示情報として生成する場合、改善度に基づく推薦度情報を併せて生成する。

　これにより、追加データ毎にどの程度の改善効果が見込めるかをデータの追加前に把握できるため、ユーザがより効果的な追加データを選択した効率良くモデル学習を行うことができる。

　提示部３４は、提示情報として追加データを生成する場合、追加データに関する所定の付加情報を併せて生成する。

　これにより、ユーザが追加データを追加する際の判断材料として付加情報を見ることができるため、ユーザが所望する追加データの選択を容易化できる。

　新規データおよび追加データは、時系列のデータである。学習部３２は、新規データおよび追加データの時系列が一致しない場合、新規データの時系列と一致させるための追加データを生成して結合する。

　これにより、第１モデルおよび第２モデルのデータの時系列を揃えることができるため、第１モデルおよび第２モデルから算出される改善度の精度を高めることができる。

　情報処理装置１は、ユーザ端末１００から共有データとして新規データを取得する取得部３１をさらに備える。

　これにより、共有データＤＢ４１が随時更新（追加および更新）されていくため、共有データを用いたモデル学習処理や、改善度算出処理の精度を向上させることができる。

　取得部３１は、所定の条件を満たす共有データに対して匿名化処理を施して記憶部４に記憶する。

　これにより、例えば、顧客情報や個人情報等が他ユーザに公開されることを回避できる。

　学習部３２は、追加データに対して所定の前処理を施した後に新規データと結合する。

　これにより、モデル学習をする際に最適な前処理を追加データに施すことができるため、モデル学習の精度を高めることができる。

　以上、本開示の各実施形態について説明したが、本開示の技術的範囲は、上述の各実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

　また、本明細書に記載された各実施形態における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　ユーザが所持する端末装置から取得した所定の新規データに基づく第１モデルと、記憶部に予め記憶された共有データを追加データとして前記新規データに結合した結合データに基づく第２モデルとを学習する学習部と、
　前記第１モデルに対する前記第２モデルの出力精度の改善度合いを示す改善度を算出する算出部と、
　前記算出部によって算出された前記改善度に基づいた提示情報を生成する提示部と
　を備える情報処理装置。
（２）
　前記学習部は、
　前記新規データと特徴量が類似する前記共有データを前記追加データとして結合する、
　前記（１）に記載の情報処理装置。
（３）
　前記学習部は、
　前記記憶部に記憶された前記共有データの中から、疑似新規データおよび疑似追加データを選択し、前記疑似新規データに基づく疑似第１モデルと、前記疑似追加データに基づく疑似第２モデルとを学習し、
　前記算出部は、
　前記疑似第１モデルおよび前記疑似第２モデルに基づき算出した疑似改善度に基づいて前記改善度を出力とする改善度モデルを学習する、
　前記（１）または（２）に記載の情報処理装置。
（４）
　前記算出部は、
　前記疑似新規データの特徴量および前記疑似追加データの特徴量を説明変数とし、前記疑似改善度を目的変数として改善度モデルを学習する、
　前記（３）に記載の情報処理装置。
（５）
　前記算出部は、
　前記疑似新規データおよび前記疑似追加データに対するユーザの行動履歴の情報を前記説明変数としてさらに含む、
　前記（４）に記載の情報処理装置。
（６）
　前記提示部は、
　前記改善度が所定の条件を満たす前記追加データを前記提示情報として生成する、
　前記（１）～（５）のいずれか１つに記載の情報処理装置。
（７）
　前記提示部は、
　複数の前記追加データを前記提示情報として生成する場合、前記改善度に基づく推薦度情報を併せて生成する、
　前記（６）に記載の情報処理装置。
（８）
　前記提示部は、
　前記提示情報として前記追加データを生成する場合、前記追加データに関する所定の付加情報を併せて生成する、
　前記（６）または（７）に記載の情報処理装置。
（９）
　前記新規データおよび前記追加データは、時系列のデータであって、
　前記学習部は、
　前記新規データおよび前記追加データの時系列が一致しない場合、前記新規データの時系列と一致させるための前記追加データを生成して結合する、
　前記（１）～（８）のいずれか１つに記載の情報処理装置。
（１０）
　前記端末装置から前記共有データとして前記新規データを取得する取得部をさらに備える、
　前記（１）～（９）のいずれか１つに記載の情報処理装置。
（１１）
　前記取得部は、
　所定の条件を満たす前記共有データに対して匿名化処理を施して前記記憶部に記憶する
　前記（１０）に記載の情報処理装置。
（１２）
　前記学習部は、
　前記追加データに対して所定の前処理を施した後に前記新規データと結合する、
　前記（１）～（１１）のいずれか１つに記載の情報処理装置。
（１３）
　ユーザが所持する端末装置から取得した所定の新規データに基づく第１モデルと、記憶部に予め記憶された共有データを追加データとして前記新規データに結合した結合データに基づく第２モデルとを学習する学習工程と、
　前記第１モデルに対する前記第２モデルの出力精度の改善度合いを示す改善度を算出する算出工程と、
　前記算出工程によって算出された前記改善度に基づいた提示情報を生成する提示部と
　を含む情報処理方法。
（１４）
　ユーザが所持する端末装置から取得した所定の新規データに基づく第１モデルと、記憶部に予め記憶された共有データを追加データとして前記新規データに結合した結合データに基づく第２モデルとを学習する学習手順と、
　前記第１モデルに対する前記第２モデルの出力精度の改善度合いを示す改善度を算出する算出手順と、
　前記算出手順によって算出された前記改善度に基づいた提示情報を生成する提示手順と
　をコンピュータに実行させる情報処理プログラム。

　１　　　情報処理装置
　２　　　通信部
　３　　　制御部
　４　　　記憶部
　３１　　取得部
　３２　　学習部
　３３　　算出部
　３４　　提示部
　１００　ユーザ端末

Claims

　ユーザが所持する端末装置から取得した所定の新規データに基づく第１モデルと、記憶部に予め記憶された共有データを追加データとして前記新規データに結合した結合データに基づく第２モデルとを学習する学習部と、
　前記第１モデルに対する前記第２モデルの出力精度の改善度合いを示す改善度を算出する算出部と、
　前記算出部によって算出された前記改善度に基づいた提示情報を生成する提示部と
　を備える情報処理装置。
　前記学習部は、
　前記新規データと特徴量が類似する前記共有データを前記追加データとして結合する、
　請求項１に記載の情報処理装置。
　前記学習部は、
　前記記憶部に記憶された前記共有データの中から、疑似新規データおよび疑似追加データを選択し、前記疑似新規データに基づく疑似第１モデルと、前記疑似追加データに基づく疑似第２モデルとを学習し、
　前記算出部は、
　前記疑似第１モデルおよび前記疑似第２モデルに基づき算出した疑似改善度に基づいて前記改善度を出力とする改善度モデルを学習する、
　請求項１に記載の情報処理装置。
　前記算出部は、
　前記疑似新規データの特徴量および前記疑似追加データの特徴量を説明変数とし、前記疑似改善度を目的変数として改善度モデルを学習する、
　請求項３に記載の情報処理装置。
　前記算出部は、
　前記疑似新規データおよび前記疑似追加データに対するユーザの行動履歴の情報を前記説明変数としてさらに含む、
　請求項４に記載の情報処理装置。
　前記提示部は、
　前記改善度が所定の条件を満たす前記追加データを前記提示情報として生成する、
　請求項１に記載の情報処理装置。
　前記提示部は、
　複数の前記追加データを前記提示情報として生成する場合、前記改善度に基づく推薦度情報を併せて生成する、
　請求項６に記載の情報処理装置。
　前記提示部は、
　前記提示情報として前記追加データを生成する場合、前記追加データに関する所定の付加情報を併せて生成する、
　請求項６に記載の情報処理装置。
　前記新規データおよび前記追加データは、時系列のデータであって、
　前記学習部は、
　前記新規データおよび前記追加データの時系列が一致しない場合、前記新規データの時系列と一致させるための前記追加データを生成して結合する、
　請求項１に記載の情報処理装置。
　前記端末装置から前記共有データとして前記新規データを取得する取得部をさらに備える、
　請求項１に記載の情報処理装置。
　前記取得部は、
　所定の条件を満たす前記共有データに対して匿名化処理を施して前記記憶部に記憶する
　請求項１０に記載の情報処理装置。
　前記学習部は、
　前記追加データに対して所定の前処理を施した後に前記新規データと結合する、
　請求項１に記載の情報処理装置。
　ユーザが所持する端末装置から取得した所定の新規データに基づく第１モデルと、記憶部に予め記憶された共有データを追加データとして前記新規データに結合した結合データに基づく第２モデルとを学習する学習工程と、
　前記第１モデルに対する前記第２モデルの出力精度の改善度合いを示す改善度を算出する算出工程と、
　前記算出工程によって算出された前記改善度に基づいた提示情報を生成する提示工程と
　を含む情報処理方法。
　ユーザが所持する端末装置から取得した所定の新規データに基づく第１モデルと、記憶部に予め記憶された共有データを追加データとして前記新規データに結合した結合データに基づく第２モデルとを学習する学習手順と、
　前記第１モデルに対する前記第２モデルの出力精度の改善度合いを示す改善度を算出する算出手順と、
　前記算出手順によって算出された前記改善度に基づいた提示情報を生成する提示手順と
　をコンピュータに実行させる情報処理プログラム。