WO2021085188A1

WO2021085188A1 - バイアス調整装置、情報処理装置、情報処理方法及び情報処理プログラム

Info

Publication number: WO2021085188A1
Application number: PCT/JP2020/039133
Authority: WO
Inventors: 由幸小林; アンドリューシン; 顕生早川; 臣克高柳; 洋貴鈴木
Original assignee: ソニー株式会社
Priority date: 2019-10-29
Filing date: 2020-10-16
Publication date: 2021-05-06
Also published as: EP4053758A1; EP4053758A4; US20220358313A1; CN114730388A

Abstract

本開示に係るバイアス調整装置は、学習用データを用いた機械学習による識別モデルに関するバイアス調整装置であり、第１の学習用データで学習された識別モデルの第１の識別精度と、第１の学習用データに対してデータ数を調整された第２の学習用データで学習された識別モデルの第２の識別精度を算出する演算部と、第１の識別精度と第２の識別精度に基づいて、学習用データの数に対する識別精度の変化を予測する予測部と、予測された識別精度の変化に基づいて、当該予測された識別精度の変化が所定の目標値となるように学習に用いるデータ数を調整する、又は、識別モデルを変更する制御部と、を備える。

Description

バイアス調整装置、情報処理装置、情報処理方法及び情報処理プログラム

　本開示は、バイアス調整装置、情報処理装置、情報処理方法及び情報処理プログラムに関する。

　様々な技術分野において、機械学習を利用した情報処理が活用されており、ニューラルネットワーク等のモデルを学習する技術が提供されてきている。例えば、データから認識対象を認識する認識器（モデル）を学習する技術が提供されている（例えば、特許文献１参照）。

特開２０１７－１３０１９６号公報

　従来技術によれば、学習により生成した認識器による認識対象の精度を測定する。

　しかしながら、従来技術は、データが調整された学習によるモデルを用いることでモデルの学習に関連する処理を適切に実行可能にすることができるとは限らない。例えば、従来技術は、認識器による認識対象の精度を測定しているに過ぎず、例えばモデルの精度とデータとの関係等を示すような情報を生成すること、またはデータの調整により所望のモデルの学習を可能にすること等は難しい。そのため、データが調整された学習によるモデルを用いることでモデルの学習に関連する処理を適切に実行可能にすることが望まれている。

　そこで、本開示では、データが調整された学習によるモデルを用いることでモデルの学習に関連する処理を適切に実行可能にすることができるバイアス調整装置、情報処理装置、情報処理方法及び情報処理プログラムを提案する。

　上記の課題を解決するために、本開示に係る一形態のバイアス調整装置は、学習用データを用いた機械学習による識別モデルに関するバイアス調整装置であり、第１の学習用データで学習された前記識別モデルの第１の識別精度と、前記第１の学習用データに対してデータ数を調整された第２の学習用データで学習された前記識別モデルの第２の識別精度を算出する演算部と、前記第１の識別精度と前記第２の識別精度に基づいて、前記学習用データの数に対する識別精度の変化を予測する予測部と、前記予測された識別精度の変化に基づいて、当該予測された識別精度の変化が所定の目標値となるように前記学習に用いるデータ数を調整する、又は、前記識別モデルを変更する制御部と、を備える。

本開示の実施形態に係る情報処理の一例を示す図である。本開示の実施形態に係る情報処理の一例を示す図である。本開示の実施形態に係る情報処理装置の構成例を示す図である。本開示の実施形態に係るデータ情報記憶部の一例を示す図である。本開示の実施形態に係るモデル情報記憶部の一例を示す図である。本開示の実施形態に係るモデルの一例を示す図である。本開示の実施形態に係る情報処理の手順を示すフローチャートである。本開示の実施形態に係る情報処理の手順を示すフローチャートである。精度情報の表示の一例を示す図である。目標精度とデータ数との関係を示す図である。目標精度とデータ数との関係の表示の一例を示す図である。情報処理システムの処理の概念図の一例を示す図である。本開示の変形例に係る情報処理システムの構成例を示す図である。本開示の変形例に係る情報処理装置の構成例を示す図である。情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、この実施形態により本願にかかるバイアス調整装置、情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　以下に示す項目順序に従って本開示を説明する。
　　１．実施形態
　　　１－１．本開示の実施形態に係る情報処理の概要
　　　　１－１－１．情報処理の効果及び想定等
　　　　１－１－２．精度例及び複数の精度
　　　１－２．実施形態に係る情報処理装置の構成
　　　　１－２－１．モデル例
　　　１－３．実施形態に係る情報処理の手順
　　　１－４．表示例
　　　１－５．目標精度（目標値）
　　　　１－５－１．目標精度（目標値）とデータ数の関係
　　　　１－５－２．目標精度（目標値）に関する表示例
　　　１－６．情報処理システムの処理の概念図
　　２．その他の実施形態
　　　２－１．変形例
　　　２－２．その他の構成例
　　　２－３．その他
　　３．本開示に係る効果
　　４．ハードウェア構成

［１．実施形態］
［１－１．本開示の実施形態に係る情報処理の概要］
　図１及び図２は、本開示の実施形態に係る情報処理の一例を示す図である。具体的には、図１は、４つのカテゴリを対象とした情報処理の一例を示す図である。図２は、１つのカテゴリを対象とした情報処理の手順の一例を示す図である。本開示の実施形態に係る情報処理は、図３に示す情報処理装置１００によって実現される。図３に示す情報処理装置１００は、バイアス調整装置の一例である。

　情報処理装置１００は、実施形態に係る情報処理を実行する情報処理装置である。例えば、情報処理装置１００は、実施形態に係るバイアス調整処理を実行するバイアス調整装置である。なお、情報処理装置１００によるバイアス調整処理の詳細は、図１０において詳述する。情報処理装置１００は、学習に用いるデータの数（データ数）を調整しながら、識別モデル（以下、単に「モデル」ともいう）を学習し、学習したモデルの識別精度（以下、単に「精度」ともいう）に関する精度情報を生成する。情報処理装置１００は、データ数を調整する対象に応じて学習用データのデータ数を調整する。例えば、学習用データは、少なくとも、人種、性別、住所、収入、又は、学歴に関するデータである。以下では、データ数を調整する前の学習用データにより学習されたモデルを「第１モデル」と称し、学習用データのデータ数が調整されたデータ（以下「調整後データ」ともいう）により学習されたモデルを「第２モデル」と称する場合がある。以下では、調整前の学習用データを「第１の学習用データ」と記載し、調整後の学習用データ（調整後データ）を「第２の学習用データ」と記載する場合がある。また、第１の学習用データで学習されたモデル（識別モデル）の識別精度を「第１の識別精度」と記載し、第２の学習用データで学習されたモデル（識別モデル）の識別精度を「第２の識別精度」と記載する場合がある。図１及び図２の例では、情報処理装置１００は、学習用データ（以下「データセット」ともいう）を用いて第１モデルを学習し、データセットから対象に応じてデータ数を減らした調整後データを用いて第２モデルを学習する場合を一例として説明する。なお、図１及び図２は一例であり、データ数の調整は、データ数を減らすことに限らず、所望の精度情報を生成可能であれば、データ数を増やすこと等どのような調整であってもよい。

　また、図１及び図２の例では、情報処理装置１００は、人種を対象として、人種を区分する「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の４つのカテゴリを一例とした場合の処理について説明する。なお、図１及び図２は一例であり、人種は５つ以上のカテゴリに区分されてもよい。また、対象は人種に限らず、性別や年齢や地域等、どのような対象であってもよい。例えば、対象が性別である場合、「男性」や「女性」といったカテゴリに区分される。対象は、２つ以上のカテゴリに区分されるものであれば、どのようなものであってもよい。

　図１の例では、情報処理装置１００は、データ情報記憶部１４１（図４参照）に記憶されたデータセットＤＳ１を用いて、画像認識に用いるモデルを学習する。データセットＤＳ１には、モデルの入力となるデータと、そのデータが入力された場合に期待するモデルの出力（以下「正解情報」ともいう）のペアが多数含まれる。例えば、データセットＤＳ１には、データＤＴ１～ＤＴ８等の複数のデータと各データに対応する正解情報とが含まれる。なお、データセットＤＳ１には、「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の４つのカテゴリのいずれにも該当しないデータが含まれてもよい。

　図１の例では、情報処理装置１００は、モデル情報記憶部１４２（図５参照）に記憶されたモデルＭ１に対応するネットワーク（ニューラルネットワーク等）の構造を設計する。情報処理装置１００は、画像認識に用いるモデルＭ１のネットワークの構造（ネットワーク構造）を設計する。例えば、情報処理装置１００は、予め記憶部１４（図３参照）に記憶された各用途に対応するネットワークの構造に関する情報を基に、画像認識に用いるモデルＭ１のネットワークの構造を生成してもよい。例えば、情報処理装置１００は、画像認識に用いるモデルＭ１のネットワークの構造情報を、外部装置から取得してもよい。

　データセットＤＳ１には、複数の画像と、各画像の認識結果として期待される出力（正解情報）とのペアが含まれる。例えば、データセットＤＳ１には、人種Ａの男性が撮像された画像であるデータＤＴ１と、データＤＴ１に対応する正解情報とのペアが含まれる。また、例えば、データセットＤＳ１には、人種Ｂの女性が撮像された画像であるデータＤＴ２と、データＤＴ２に対応する正解情報とのペアが含まれる。なお、データＤＴ１、ＤＴ２等の正解情報は、「人種Ａ」、「人種Ｂ」といったカテゴリ自体に限らず、画像に含まれる事象や物体等の認識結果であれば、どのような正解情報（正解ラベル）であってもよい。例えば、データＤＴ１は「人種Ａ」の人が撮像された画像であり、正解情報は「卒業式」といった「人種Ａ」とは異なる正解情報（正解ラベル）であってもよい。

　情報処理装置１００は、用意したデータセットで、設計したニューラルネットワークを学習する。情報処理装置１００は、データセットＤＳ１を用いて、モデルＭ１のネットワークを学習する。例えば、情報処理装置１００は、データセットＤＳ１を用いて、モデルＭ１のネットワークの重み等のパラメータを学習する。情報処理装置１００は、モデルＭ１のネットワークのパラメータを学習し、モデルＭ１に対応する第１モデルや第２モデルを生成する。例えば、第１モデルや第２モデルは、同様のネットワーク構造を有し、重み等のパラメータが異なるモデルである。例えば、モデルＭ１に対応する第１モデルや第２モデルは、モデルＭ１のネットワーク構造を有し、重み等のパラメータが異なるモデルである。

　また、情報処理装置１００は、生成した第１モデルや第２モデルの性能（「精度」ともいう）を所定の評価用データを用いて測定する。例えば、情報処理装置１００は、学習用データとは別途用意された評価用データを用いて、第１モデルや第２モデルの精度（精度指標）を測定する。例えば、情報処理装置１００は、学習用データと異なる別途固定の評価用データで第１モデルや第２モデルを評価する。情報処理装置１００は、データセットにより学習した第１モデルの精度（「第１精度」ともいう）や調整後データにより学習した第２モデルの精度（「第２精度」ともいう）に基づいて、モデルの精度を示す精度情報を生成する。ここでいう精度は、種々の指標であってもよく、以下では正確度（Ａｃｃｕｒａｃｙ）を一例として説明するが、精度についての詳細は後述する。

　情報処理装置１００は、各カテゴリに対応する評価用データを用いて、各カテゴリに対するモデルの精度を測定する。例えば、情報処理装置１００は、カテゴリ「人種Ａ」に対応する精度の測定には、カテゴリ「人種Ａ」に対応する評価用データ（「人種Ａ評価用データ」ともいう）を用いる。人種Ａ評価用データには、カテゴリ「人種Ａ」に対応するデータと、そのデータの正解情報とのペアが多数含まれる。また、情報処理装置１００は、カテゴリ「人種Ｂ」に対応する精度の測定には、カテゴリ「人種Ｂ」に対応する評価用データ（「人種Ｂ評価用データ」ともいう）を用いる。人種Ｂ評価用データには、カテゴリ「人種Ｂ」に対応するデータと、そのデータの正解情報とのペアが多数含まれる。

　また、情報処理装置１００は、カテゴリ「人種Ｃ」に対応する精度の測定には、カテゴリ「人種Ｃ」に対応する評価用データ（「人種Ｃ評価用データ」ともいう）を用いる。人種Ｃ評価用データには、カテゴリ「人種Ｃ」に対応するデータと、そのデータの正解情報とのペアが多数含まれる。また、情報処理装置１００は、カテゴリ「人種Ｄ」に対応する精度の測定には、カテゴリ「人種Ｄ」に対応する評価用データ（「人種Ｄ評価用データ」ともいう）を用いる。人種Ｄ評価用データには、カテゴリ「人種Ｄ」に対応するデータと、そのデータの正解情報とのペアが多数含まれる。なお、上記は一例であり、評価用データは、上記に限らず所望の精度評価（測定）が可能であれば、例えば共通の評価用データを用いる等、どのようなデータであってもよい。

　情報処理装置１００は、各カテゴリに対応するモデルや評価用情報を用いて、グラフＧＲ１１に示すような精度情報を生成する。グラフＧＲ１１中の実線で示す円である測定ＭＲ１１～ＭＲ１３や予測線ＬＮ１がカテゴリ「人種Ａ」に対応するモデルの精度を示す情報に対応する。また、グラフＧＲ１１中の点線で示す円である測定ＭＲ２１～ＭＲ２３や予測線ＬＮ２がカテゴリ「人種Ｂ」に対応するモデルの精度を示す情報に対応する。また、グラフＧＲ１１中の一点鎖線で示す円である測定ＭＲ３１～ＭＲ３３や予測線ＬＮ３がカテゴリ「人種Ｃ」に対応するモデルの精度を示す情報に対応する。また、グラフＧＲ１１中の二点鎖線で示す円である測定ＭＲ４１～ＭＲ４３や予測線ＬＮ４がカテゴリ「人種Ｄ」に対応するモデルの精度を示す情報に対応する。なお、情報処理装置１００は、各カテゴリの情報を色により識別可能にしてもよい。例えば、情報処理装置１００は、カテゴリ「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の４つのカテゴリに対応する情報のそれぞれを、青、緑、黄色、赤といった異なる色で示す情報を生成してもよい。

　ここから、図２に示すカテゴリ「人種Ａ」を対象とする処理を基に、各カテゴリを対象とする処理を具体的に説明する。まず、情報処理装置１００は、データセットＤＳ１を対象として画像認識に用いるモデルＭ１の第１モデルを学習する。グラフＧＲ１中の測定ＭＲ１１に対応する横軸「ｌｏｇ（データ数）」の位置がその時点での学習に用いているカテゴリ「人種Ａ」に対応するデータ数（現状データ数）を示す。データセットＤＳ１には、測定ＭＲ１１に対応する横軸「ｌｏｇ（データ数）」の位置に対応するデータ数のカテゴリ「人種Ａ」のデータが含まれることを示す。なお、グラフの横軸は、対数（ｌｏｇ）に限らず、種々のスケール（目盛）であってもよい。

　そして、情報処理装置１００は、学習した第１モデルについて、カテゴリ「人種Ａ」に対応する精度を測定する（ステップＳ１１）。情報処理装置１００は、第１モデルについて、人種Ａ評価用データを用いて、カテゴリ「人種Ａ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１中の測定ＭＲ１１に示すような測定結果を得る。情報処理装置１００は、測定精度情報ＩＮＦ１やグラフＧＲ１に示すように、第１モデルについて、カテゴリ「人種Ａ」に対応する精度を「ＶＬ１」であると測定する。すなわち、情報処理装置１００は、データセットＤＳ１全体を用いて学習したモデル（第１モデル）の場合、カテゴリ「人種Ａ」に対応する精度を「ＶＬ１」であると測定する。なお、以下では、精度を「ＶＬ１」、「ＶＬ２」等の抽象的な符号で示すが、精度が具体的な数値であるものとする。

　そして、情報処理装置１００は、データ数を調整する（ステップＳ１２）。情報処理装置１００は、データセットＤＳ１のうち、カテゴリ「人種Ａ」に対応するデータ数を減らす。例えば、情報処理装置１００は、データセットＤＳ１に含まれるカテゴリ「人種Ａ」に対応するデータ数を半分（５０％）に減らす。なお、情報処理装置１００は、半分に限らず、種々の基準を基にデータ数を調整してもよい。例えば、情報処理装置１００は、１０％ずつ減らしてもよい。情報処理装置１００は、データセットＤＳ１に含まれるカテゴリ「人種Ａ」に対応するデータ数が「１００００」である場合、カテゴリ「人種Ａ」に対応するデータ数を「５０００」に減らす。例えば、情報処理装置１００は、ランダムにカテゴリ「人種Ａ」に対応するデータを選択し、カテゴリ「人種Ａ」に対応するデータ数を減らす。これにより、情報処理装置１００は、データ数が調整された調整後データセットＡＳ１を生成する。

　そして、情報処理装置１００は、調整後データセットＡＳ１を対象として画像認識に用いるモデルＭ１の第２モデルを学習する。情報処理装置１００は、データセットＤＳ１からカテゴリ「人種Ａ」に対応するデータが減らされた調整後データセットＡＳ１を対象として画像認識に用いるモデルＭ１の第２モデルを学習する。

　そして、情報処理装置１００は、学習した第２モデルについて、カテゴリ「人種Ａ」に対応する精度を測定する（ステップＳ１３）。情報処理装置１００は、第２モデルについて、人種Ａ評価用データを用いて、カテゴリ「人種Ａ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ２中の測定ＭＲ１２に示すような測定結果を得る。情報処理装置１００は、測定精度情報ＩＮＦ２やグラフＧＲ２に示すように、第２モデルについて、カテゴリ「人種Ａ」に対応する精度を「ＶＬ２」であると測定する。すなわち、情報処理装置１００は、調整後データセットＡＳ１を用いて学習したモデル（第２モデル）の場合、カテゴリ「人種Ａ」に対応する精度を「ＶＬ２」であると測定する。

　そして、情報処理装置１００は、データ数を調整する（ステップＳ１４）。例えば、情報処理装置１００は、所定の条件を満たすまでデータ数を調整する。例えば、情報処理装置１００は、所定の閾値未満になるまでデータ数を減らす。例えば、情報処理装置１００は、対象とするカテゴリのデータ数が所定の閾値未満になった場合、そのカテゴリを対象とする測定処理を終了する。なお、情報処理装置１００は、上記に限らず種々の条件に基づいて、測定処理を終了してもよい。例えば、情報処理装置１００は、後述する予測線を描くに足りる測定（プロット）ができた場合に、そのカテゴリを対象とする測定処理を終了してもよい。

　図２の例では、情報処理装置１００は、調整後データセットＡＳ１のうち、カテゴリ「人種Ａ」に対応するデータ数を減らす。例えば、情報処理装置１００は、調整後データセットＡＳ１に含まれるカテゴリ「人種Ａ」に対応するデータ数を半分に減らす。情報処理装置１００は、調整後データセットＡＳ１に含まれるカテゴリ「人種Ａ」に対応するデータ数が「５０００」である場合、カテゴリ「人種Ａ」に対応するデータ数を「２５００」に減らす。これにより、情報処理装置１００は、調整後データセットＡＳ１からデータ数がさらに調整された調整後データセットＡＳ２を生成する。

　そして、情報処理装置１００は、調整後データセットＡＳ２を対象として画像認識に用いるモデルＭ１の第２モデルを学習する。なお、以下では、調整後データセットＡＳ１により学習された第２モデルと区別して説明するために、調整後データセットＡＳ２により学習された第２モデルを「第３モデル」ともいう。情報処理装置１００は、調整後データセットＡＳ１からカテゴリ「人種Ａ」に対応するデータがさらに減らされた調整後データセットＡＳ２を対象として画像認識に用いるモデルＭ１の第３モデルを学習する。

　そして、情報処理装置１００は、学習した第３モデルについて、カテゴリ「人種Ａ」に対応する精度を測定する（ステップＳ１５）。情報処理装置１００は、第３モデルについて、人種Ａ評価用データを用いて、カテゴリ「人種Ａ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ３中の測定ＭＲ１３に示すような測定結果を得る。情報処理装置１００は、測定精度情報ＩＮＦ３やグラフＧＲ３に示すように、第３モデルについて、カテゴリ「人種Ａ」に対応する精度を「ＶＬ３」であると測定する。すなわち、情報処理装置１００は、調整後データセットＡＳ２を用いて学習したモデル（第３モデル）の場合、カテゴリ「人種Ａ」に対応する精度を「ＶＬ３」であると測定する。図２の例では、情報処理装置１００は、所定の条件を満たしたと判定し、データ数を調整し、学習したモデルの精度を測定する処理を終了する。例えば、情報処理装置１００は、所定の条件を満たしたと判定し、データ数を調整し、学習したモデルの精度を測定する処理を終了する。

　そして、情報処理装置１００は、モデルの精度変化を予測する（ステップＳ１６）。情報処理装置１００は、測定ＭＲ１１～測定ＭＲ１３に示す情報を基にモデルの精度変化を予測する。情報処理装置１００は、カテゴリ「人種Ａ」に対応するモデルの精度の予測する関数を導出する。情報処理装置１００は、予測精度情報ＦＣＩ１に示すように、カテゴリ「人種Ａ」に対応するモデルの精度の予測線ＬＮ１に対応する関数ＦＣ１を導出する。このように、情報処理装置１００は、学習用データのデータ数を増やした場合のカテゴリ「人種Ａ」に対応するモデルの精度変化の予測を示す予測線ＬＮ１を生成する。

　例えば、情報処理装置１００は、グラフＧＲ４に示すように、測定ＭＲ１１～測定ＭＲ１３に対応する点を通る線（予測線ＬＮ１）に対応する関数を導出する。情報処理装置１００は、フィッティングに関する種々の技術を適宜用いて、予測線ＬＮ１に対応する関数ＦＣ１を生成してもよい。情報処理装置１００は、線形予想等により、予測線ＬＮ１に対応する関数ＦＣ１を生成してもよい。例えば、情報処理装置１００は、最小二乗法等の種々の技術を適宜用いて、予測線ＬＮ１に対応する関数ＦＣ１を導出してもよい。また、情報処理装置１００は、機械学習に関する技術を用いて、予測線ＬＮ１に対応する関数ＦＣ１を導出してもよい。なお、情報処理装置１００が導出する関数ＦＣ１は、線形関数であってもよいし、非線形関数であってもよい。

　このように、情報処理装置１００は、得られたデータ数と（精度）指標の関係から、データを増やした場合の指標の改善幅を予測する。そして、情報処理装置１００は、評価結果（測定結果）、予測結果のそれぞれについて、横軸をデータ数、縦軸を（精度）指標とし、グラフを生成する。例えば、情報処理装置１００は、図１に示すグラフＧＲ１１を生成し、表示する。情報処理装置１００は、カテゴリ「人種Ａ」に対応するデータを増やした場合の精度の予測線ＬＮ１を表示する。

　上述した処理により、情報処理装置１００は、カテゴリ「人種Ａ」に対応する精度情報を生成する。具体的には、情報処理装置１００は、カテゴリ「人種Ａ」について、グラフＧＲ４に示すように、測定した精度や予測した精度を含む精度情報を生成する。

　図１に戻って、説明を続ける。情報処理装置１００は、カテゴリ「人種Ａ」を対象とした図２に示す処理と同様に、他のカテゴリ「人種Ｂ」、「人種Ｃ」、「人種Ｄ」についても処理を行うことにより、グラフＧＲ１１に示すような、４つのカテゴリについて測定した精度や予測した精度を含む精度情報を生成する。

　例えば、情報処理装置１００は、カテゴリ「人種Ｂ」についても、カテゴリ「人種Ａ」を対象とした図２に示す処理と同様に処理を行う。情報処理装置１００は、データセットＤＳ１を対象として画像認識に用いるモデルＭ１の第１モデルを学習する。グラフＧＲ１１中の測定ＭＲ２１に対応する横軸「ｌｏｇ（データ数）」の位置がその時点での学習に用いているカテゴリ「人種Ｂ」に対応するデータ数（現状データ数）を示す。データセットＤＳ１には、測定ＭＲ２１に対応する横軸「ｌｏｇ（データ数）」の位置に対応するデータ数のカテゴリ「人種Ｂ」のデータが含まれることを示す。

　情報処理装置１００は、第１モデルについて、人種Ｂ評価用データを用いて、カテゴリ「人種Ｂ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１１中の測定ＭＲ２１に示すような測定結果を得る。

　そして、情報処理装置１００は、データセットＤＳ１のうち、カテゴリ「人種Ｂ」に対応するデータ数を減らして、第２モデルを学習する。情報処理装置１００は、第２モデルについて、人種Ｂ評価用データを用いて、カテゴリ「人種Ｂ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１１中の測定ＭＲ２２に示すような測定結果を得る。そして、情報処理装置１００は、測定ＭＲ２２の測定時点からカテゴリ「人種Ｂ」に対応するデータ数をさらに減らして、第２モデル（第３モデル）を学習する。情報処理装置１００は、第３モデルについて、人種Ｂ評価用データを用いて、カテゴリ「人種Ｂ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１１中の測定ＭＲ２３に示すような測定結果を得る。

　そして、情報処理装置１００は、測定ＭＲ２１～測定ＭＲ２３に示す情報を基にモデルの精度変化を予測する。情報処理装置１００は、カテゴリ「人種Ｂ」に対応するモデルの精度の予測する予測線ＬＮ２を導出する。

　また、情報処理装置１００は、データセットＤＳ１を対象として画像認識に用いるモデルＭ１の第１モデルを学習する。グラフＧＲ１１中の測定ＭＲ３１に対応する横軸「ｌｏｇ（データ数）」の位置がその時点での学習に用いているカテゴリ「人種Ｃ」に対応するデータ数（現状データ数）を示す。データセットＤＳ１には、測定ＭＲ３１に対応する横軸「ｌｏｇ（データ数）」の位置に対応するデータ数のカテゴリ「人種Ｃ」のデータが含まれることを示す。

　情報処理装置１００は、第１モデルについて、人種Ｃ評価用データを用いて、カテゴリ「人種Ｃ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１１中の測定ＭＲ３１に示すような測定結果を得る。

　そして、情報処理装置１００は、データセットＤＳ１のうち、カテゴリ「人種Ｃ」に対応するデータ数を減らして、第２モデルを学習する。情報処理装置１００は、第２モデルについて、人種Ｃ評価用データを用いて、カテゴリ「人種Ｃ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１１中の測定ＭＲ３２に示すような測定結果を得る。そして、情報処理装置１００は、測定ＭＲ３２の測定時点からカテゴリ「人種Ｃ」に対応するデータ数をさらに減らして、第２モデル（第３モデル）を学習する。情報処理装置１００は、第３モデルについて、人種Ｃ評価用データを用いて、カテゴリ「人種Ｃ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１１中の測定ＭＲ３３に示すような測定結果を得る。

　そして、情報処理装置１００は、測定ＭＲ３１～測定ＭＲ３３に示す情報を基にモデルの精度変化を予測する。情報処理装置１００は、カテゴリ「人種Ｃ」に対応するモデルの精度の予測する予測線ＬＮ３を導出する。

　また、情報処理装置１００は、データセットＤＳ１を対象として画像認識に用いるモデルＭ１の第１モデルを学習する。なお、情報処理装置１００は、４つのカテゴリ全てについて、共通の第１モデルを用いてもよい。グラフＧＲ１１中の測定ＭＲ４１に対応する横軸「ｌｏｇ（データ数）」の位置がその時点での学習に用いているカテゴリ「人種Ｄ」に対応するデータ数（現状データ数）を示す。データセットＤＳ１には、測定ＭＲ４１に対応する横軸「ｌｏｇ（データ数）」の位置に対応するデータ数のカテゴリ「人種Ｄ」のデータが含まれることを示す。

　情報処理装置１００は、第１モデルについて、人種Ｄ評価用データを用いて、カテゴリ「人種Ｄ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１１中の測定ＭＲ４１に示すような測定結果を得る。

　そして、情報処理装置１００は、データセットＤＳ１のうち、カテゴリ「人種Ｄ」に対応するデータ数を減らして、第２モデルを学習する。情報処理装置１００は、第２モデルについて、人種Ｄ評価用データを用いて、カテゴリ「人種Ｄ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１１中の測定ＭＲ４２に示すような測定結果を得る。そして、情報処理装置１００は、測定ＭＲ４２の測定時点からカテゴリ「人種Ｄ」に対応するデータ数をさらに減らして、第２モデル（第３モデル）を学習する。情報処理装置１００は、第３モデルについて、人種Ｄ評価用データを用いて、カテゴリ「人種Ｄ」に対応する精度を測定する。情報処理装置１００は、グラフＧＲ１１中の測定ＭＲ４３に示すような測定結果を得る。

　そして、情報処理装置１００は、測定ＭＲ４１～測定ＭＲ４３に示す情報を基にモデルの精度変化を予測する。情報処理装置１００は、カテゴリ「人種Ｄ」に対応するモデルの精度の予測する予測線ＬＮ４を導出する。

　上述した処理により、情報処理装置１００は、カテゴリ「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の４つのカテゴリの各々に対応するモデルの精度を示すグラフＧＲ１１を生成する。

　そして、情報処理装置１００は、生成したグラフＧＲ１１を表示する。なお、情報処理装置１００は、グラフＧＲ１１に限らず、文字情報などの種々の形式により精度情報を表示してもよいが、この点についての詳細は後述する。

[１－１－１．情報処理の効果及び想定等]
　上述したように、情報処理装置１００は、複数のカテゴリの各々に対応するモデルの精度の測定結果やモデルの精度の予測結果を含む精度情報を生成する。具体的には、情報処理装置１００は、カテゴリ「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の各々に対応するモデルの精度の測定結果やモデルの精度の予測結果を含む精度情報を生成する。これにより、情報処理装置１００は、データの調整によりモデルの精度に関する情報を適切に生成することができる。このように、情報処理装置１００は、データが調整された学習によるモデルを用いることでモデルの学習に関連する処理を適切に実行可能にすることができる。なお、図１及び図２の例では、情報処理装置１００は、カテゴリごとにデータ数を調整する処理を一例として説明したが、データ全体の数を調整して処理を行ってもよい。

　そして、情報処理装置１００は、生成した精度情報を表示する。情報処理装置１００は、生成したグラフＧＲ１１を表示する。これにより、情報処理装置１００は、どの程度データを増やせば各カテゴリにおける精度的差を解消できるかを示す情報を表示することができる。そのため、情報処理装置１００が表示する情報を視認したユーザは、この後どの程度データを増やせば各カテゴリにおける精度的差を解消できるかを把握し、本質的にどのカテゴリで精度を出すのが難しいかを把握することができる。

　図１の例では、情報処理装置１００は、カテゴリ「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の各々の精度情報を表示することにより、各カテゴリについてモデルの精度改善の難度を示すことができる。情報処理装置１００は、各カテゴリの予測線の傾きにより、各カテゴリについてモデルの精度改善の難度を示すことができる。

　例えば、グラフＧＲ１１に示すように、カテゴリ「人種Ｃ」の予測線の傾きが小さいため、ユーザは、カテゴリ「人種Ｃ」が精度改善の難度が高いカテゴリであることを認識することができる。例えば、モデルＭ１は、カテゴリ「人種Ｃ」についてバイアス（偏り）が生じ、その改善の難度が高いことを示す。

　上述のように、予測線の傾きが緩やかな問題は、データが増えても精度が低い。そのため、そのような問題はデータのノイズが大きい、あるいは本質的に難しい問題であると捉えることができる。図１の例では、例えば、人種Ａはデータを増やすことで人種Ｂと同程度まで精度を改善可能であることを示す。また、人種Ｃ、Ｄで精度を出すのは本質的に難しいことを示し、差別意図がなくても精度が出せないことを示すことができる。

　ここで、下記文献等に開示されるように、ディープラーニング（Deep　Learning）の持つ特性として、データの数の対数に比例して性能が（天井知らずで）向上すると想定される。
　・Exploring　the　Limits　of　Weakly　Supervised　Pretraining,　　Dhruv　Mahajan,　Ross　Girshick,　Vignesh　Ramanathan,　Kaiming　He,　Manohar　Paluri,　Yixuan　Li,　Ashwin　Bharambe,　Laurens　van　der　Maaten　<https://arxiv.org/abs/1805.00932>

　情報処理装置１００は、図１及び図２に示すように、データ数の増加に伴い、性能（精度）が向上することを示す予測線を導出し、学習用データのデータ数を増やした場合のモデルの精度変化の予測を示す精度情報を生成する。

　例えば、ＡＩ（Artificial　Intelligence）／ディープラーニングにおける倫理に関する問題がある。例えば、Ｆａｉｒｎｅｓｓ（公平性）、Ｂｉａｓ（偏り）についての問題がある。このような問題としては、特定の人をゴリラなど、いわゆる類人猿に誤認識することや、特定の地域ではローンの審査が通らないことや、特定の人種で画像認識性能が出ないこと等が挙げられる。このような問題の背景には、ＡＩが差別的判定を行っていたり、特定の地域に対するバイアスがあったり、特定の地域に対するバイアスがあったりする可能性が想定される。

　ここで、上記のような問題には、文化の問題と技術的問題の両面が混ざっている場合がある。例えば、文化の問題として、差別的判定が行われるように学習されている可能性や特定の地域のローン審査が通らないように学習された可能性やある人種だけ差別的に学習データが少ないなど、原因のある可能性が想定される。また、例えば、技術的問題として、本質的に誤分類しやすいデータである可能性や本質的にその地域にローンが通り辛い理由がある可能性や物理的に特定の人種の認識が難しい可能性が想定される。

　そこで、情報処理装置１００は、モデルの精度の関連する問題が、技術で何とかなる問題かどうかを切り分けるために用いることができる情報を生成する。例えば、情報処理装置１００は、技術的に改善できる場合はどの程度の改善が見込めるかについての指針が得られるような情報を生成する。例えば、情報処理装置１００は、特にデータを増やすことでバイアスが改善するのかどうか、その場合どの程度データを増やせばよいのかなどの指針となる情報を生成する。そして、情報処理装置１００は、生成した情報を表示する。図１の例では、情報処理装置１００は、グラフＧＲ１１を表示することで、ユーザに上記の問題に関する指針となる情報を提供する。

　上述したような機能は、例えばディープラーニングなど、機械学習を用いた技術の開発者が利用するツール（例えば図１２中のツールＴＬ１等）の機能として提供される。ユーザは上述したような機能を利用することで、技術の開発段階で、どの程度バイアスが存在するのか、技術的に解決可能な課題であるのか、あるいは解決のためにどの程度の労力が必要であるのかを知ることができる。

　ここで、ディープラーニングの技術を用いる開発者は、学習したモデルのバイアスやフェアネスを簡単に分析することやバイアスやフェアネス改善の指針を得ることを望むことが多い。また、ディープラーニングはブラックボックスである側面があり、そのままではバイアスやフェアネスを分かりやすい形で可視化できないという問題がある。そこで、情報処理装置１００は、バイアスやフェアネスを分かりやすい形で可視化するための情報を生成する。

　上述のように、情報処理装置１００は、バイアスを改善したい対象のカテゴリ毎（例えば男女、人種など）にデータ数を変更しながら学習を行う。そして、情報処理装置１００は、それぞれのデータ数がどのように変化した場合に、バイアス、フェアネスなどの指標がどのように変化するかを示す情報を生成する。これにより、情報処理装置１００は、バイアスやフェアネスを分かりやすい形で可視化する機能を実現する。例えば、情報処理装置１００は、各カテゴリの学習用データ数を横軸、バイアスなどの指標を縦軸に取り、この後各カテゴリのデータ数を増やすとどのように指標が改善するかの予測値を提示する。

　例えば、情報処理装置１００は、データ数を変えながら学習、評価を繰り返すデータ数のバイアス、フェアネスに及ぼす影響を評価し、データを増やした場合の指標の改善幅を予測する。また、情報処理装置１００は、予測により得られた結果を表示する。例えば、情報処理装置１００は、カテゴリ毎にループし、元のデータ数から半分、さらに半分とデータを減らしながら、指定回数学習と、バイアスやフェアネスに関連する（精度）指標の算出（測定）を行う。また、情報処理装置１００は、得られたデータ数と指標の関係から、このあとデータを増やした場合の指標の改善幅を予測する。また、情報処理装置１００は、評価結果、予測結果のそれぞれについて、横軸をデータ数、縦軸を指標とし、グラフ表示する。これにより、情報処理装置１００は、データの持つバイアスや、フェアネスと、問題の持つ本質的な難易度などを分かりやすく切り分けることができる。例えば、情報処理装置１００は、物理的要因があってフェアにできない等の問題の持つ本質的な原因と、データの持つバイアスや、フェアネス等の原因とを分かりやすく切り分けることができる。

[１－１－２．精度例及び複数の精度]
　上述したように、精度は、正確度に限らず、種々の指標であってもよい。例えば、精度は、再現率（Ｒｅｃａｌｌ）、適合率（Ｐｒｅｃｉｓｉｏｎ）、Ｆ値（Ｆ－ｍｅａｓｕｒｅ）等の種々の指標であってもよい。また、物体検知等に用いられるモデルが対象となる場合、精度は、物体検出精度、物体検出位置の誤差、物体検出サイズの誤差などであってもよい。例えば、情報処理装置１００は、学習するモデルの用途に応じて、精度として用いる指標を決定してもよい。

　また、情報処理装置１００は、複数の指標に対応するモデルの複数の精度を示す精度情報を生成してもよい。例えば、情報処理装置１００は、複数の指標に対応するモデルの測定結果や予測結果を示す精度情報を生成してもよい。例えば、情報処理装置１００は、「再現率」と「適合率」との２つの指標に対応するモデルの測定結果や予測結果を示す精度情報を生成してもよい。情報処理装置１００は、複数の精度のうち、ユーザが指定した一の精度を表示してもよい。

　また、情報処理装置１００は、複数の精度を切り替え可能に表示してもよい。例えば、情報処理装置１００は、「再現率」と「適合率」のうち、ユーザが「再現率」を指定した場合、「再現率」に対応する精度情報を表示してもよい。また、情報処理装置１００は、「再現率」と「適合率」のうち、ユーザが「適合率」を指定した場合、「適合率」に対応する精度情報を表示してもよい。なお、上記は一例であり、情報処理装置１００は、複数の精度を種々の態様により表示してもよい。例えば、情報処理装置１００は、複数の精度を同時に表示してもよい。

　精度指標はアプリケーション（用途）によって複数あり得る。そのため、情報処理装置１００は、上述のように、それぞれの（精度）指標に対して同様にグラフを生成することにより、ユーザの指定に応じて切り替えて表示することができる。

［１－２．実施形態に係る情報処理装置の構成］
　次に、実施形態に係る情報処理を実行する情報処理装置の一例である情報処理装置１００の構成について説明する。図３は、本開示の実施形態に係る情報処理装置１００の構成例を示す図である。例えば、図３に示す情報処理装置１００は、バイアス調整装置の一例である。情報処理装置１００は、後述するバイアス調整装置としての機能を実現するコンピュータである。

　図３に示すように、情報処理装置１００は、通信部１１と、入力部１２と、表示部１３と、記憶部１４と、制御部１５とを有する。図３の例では、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部１２（例えば、キーボードやマウス等）や、各種情報を表示するための表示部１３（例えば、液晶ディスプレイ等）を有する。

　通信部１１は、例えば、ＮＩＣ（Network　Interface　Card）や通信回路等によって実現される。通信部１１は、通信網Ｎ（インターネット等）と有線又は無線で接続され、通信網Ｎ（ネットワークＮ）を介して、他の装置等との間で情報の送受信を行う。

　入力部１２は、ユーザから各種操作が入力される。入力部１２は、ユーザによる入力を受け付ける。入力部１２は、ユーザによる学習方法の選択を受け付けてもよい。入力部１２は、情報処理装置１００に設けられたキーボードやマウスやタッチパネルを介してユーザからの各種操作を受け付けてもよい。入力部１２は、ユーザによる目標精度（目標値）の入力を受け付ける。入力部１２は、ユーザによる目標精度の指定を受け付ける。入力部１２は、ユーザによる目標精度の数値の指定を受け付ける。入力部１２は、図１０に示す目標精度ＴＡ１の指定を受け付ける。

　表示部１３は、各種情報を表示する。表示部１３は、ディスプレイ等の表示装置（表示部）であり、各種情報を表示する。表示部１３は、演算部１５３により測定された情報を表示する。表示部１３は、予測部１５４により予測された情報を表示する。表示部１３は、生成部１５５により生成された情報を表示する。

　表示部１３は、予測された識別精度の変化をグラフ、又は、テキストで表示する。表示部１３は、精度情報を表示する。表示部１３は、精度情報を文字として表示する。表示部１３は、精度情報を数値として表示する。表示部１３は、精度情報を図として表示する。表示部１３は、精度情報をグラフとして表示する。表示部１３は、第１軸を精度とし、第２軸をデータ数とするグラフを表示する。表示部１３は、モデルの精度と目標精度との関係を示す情報を表示する。表示部１３は、モデルの精度におけるデータ数と、目標精度におけるデータ数との関係を示す情報を表示する。

　表示部１３は、複数の精度を切り替え可能に表示する。表示部１３は、複数の精度のうち、一の精度を表示する。表示部１３は、ユーザにより指定された一の精度を表示する。表示部１３は、図１に示すグラフＧＲ１１を表示する。

　また、情報処理装置１００は、表示部１３に限らず、情報を出力する機能構成を有してもよい。なお、情報処理装置１００は、情報を音声として出力する機能を有してもよい。例えば、情報処理装置１００は、音声を出力するスピーカー等の音声出力部を有してもよい。

　記憶部１４は、例えば、ＲＡＭ（Random　Access　Memory)、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部１４は、データ情報記憶部１４１と、モデル情報記憶部１４２と、精度情報記憶部１４３とを有する。図示を省略するが、精度情報記憶部１４３には、測定や予測したモデルの精度に関する各種情報が格納される。例えば、精度情報記憶部１４３には、図１０に示す目標精度ＴＡ１を示す数値等の目標精度に関する各種情報が記憶される。

　データ情報記憶部１４１は、データに関する各種情報を記憶する。図４は、本開示の実施形態に係るデータ情報記憶部の一例を示す図である。例えば、データ情報記憶部１４１は、学習に用いる学習用データや精度評価（測定）に用いる評価用データ等の種々のデータに関する各種情報を記憶する。図４に、実施形態に係るデータ情報記憶部１４１の一例を示す。図４の例では、データ情報記憶部１４１は、「データセットＩＤ」、「データＩＤ」、「データ」、「対象＃１（カテゴリ）」、「対象＃２（カテゴリ）」といった項目が含まれる。なお、「対象＃１（カテゴリ）」、「対象＃２（カテゴリ）」に限らず、「対象＃３（カテゴリ）」、「対象＃４（カテゴリ）」等が含まれてもよい。「対象＃１」～「対象＃Ｎ」の数は、精度評価の対象の数であってもよい。図４の例では、人種及び性別のみを図示するが、データ情報記憶部１４１に記憶される学習用データは、少なくとも、人種、性別、住所、収入、又は、学歴に関するデータである。データ情報記憶部１４１の「対象＃３（カテゴリ）」は住所に関するものであり、「対象＃４（カテゴリ）」は収入に関するものであり、「対象＃５（カテゴリ）」は学歴に関するものであってもよい。

　「データセットＩＤ」は、データセットを識別するための識別情報を示す。「データＩＤ」は、オブジェクトを識別するための識別情報を示す。また、「データ」は、データＩＤにより識別されるオブジェクトに対応するデータを示す。すなわち、図４の例では、オブジェクトを識別するデータＩＤに対して、オブジェクトに対応するベクトルデータ（データ）が対応付けられて登録されている。

　「対象＃１（カテゴリ）」や「対象＃２（カテゴリ）」は、対応するデータの各対象に対応するカテゴリを示す。「対象＃１（カテゴリ）」は、対象「人種」に関する各データのカテゴリを示す。「対象＃２（カテゴリ）」は、対象「性別」に関する各データのカテゴリを示す。

　図４の例では、データセットＩＤ「ＤＳ１」により識別されるデータセット（データセットＤＳ１）には、データＩＤ「ＤＩＤ１」、「ＤＩＤ２」、「ＤＩＤ３」等により識別される複数のデータが含まれることを示す。データＩＤ「ＤＩＤ１」、「ＤＩＤ２」、「ＤＩＤ３」等により識別される各データ（学習用データ）は、少なくとも、人種、性別、住所、収入、又は、学歴に関する情報が含まれる。

　データＩＤ「ＤＩＤ１」により識別されるデータＤＴ１は、対象「人種」に関するカテゴリが「人種Ａ」であり、対象「性別」に関するカテゴリが「男性」であることを示す。この場合、データＤＴ１は、人種Ａであり、男性である人間に関するデータであることを示す。例えば、データＤＴ１は、人種Ａの男性が撮像された画像であってもよい。

　また、データＩＤ「ＤＩＤ２」により識別されるデータＤＴ２は、対象「人種」に関するカテゴリが「人種Ｂ」であり、対象「性別」に関するカテゴリが「女性」であることを示す。この場合、データＤＴ２は、人種Ｂであり、女性である人間に関するデータであることを示す。例えば、データＤＴ１は、人種Ｂの女性が撮像された画像であってもよい。

　なお、データ情報記憶部１４１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。データ情報記憶部１４１は、各データに対応する正解情報（正解ラベル）を各データに対応付けて記憶する。なお、「対象＃１（カテゴリ）」、「対象＃２（カテゴリ）」といった対象自体が正解情報として用いられてもよい。

　また、データ情報記憶部１４１は、各データが学習用データであるかや、評価用データであるかを特定可能に記憶する。例えば、データ情報記憶部１４１は、学習用データと評価用データとを区別可能に記憶する。データ情報記憶部１４１は、各データが学習用データや評価用データであるかを識別する情報を記憶してもよい。情報処理装置１００は、学習用データとして用いられる各データと正解情報とに基づいて、モデルを学習する。情報処理装置１００は、評価用データとして用いられる各データと正解情報とに基づいて、モデルの精度を測定する。情報処理装置１００は、評価用データを入力した場合にモデルが出力する出力結果と、正解情報とを比較した結果を収集することにより、モデルの精度を測定する。

　実施形態に係るモデル情報記憶部１４２は、モデルに関する情報を記憶する。例えば、モデル情報記憶部１４２は、モデル（ネットワーク）の構造を示す情報（モデルデータ）を記憶する。図５は、本開示の実施形態に係るモデル情報記憶部の一例を示す図である。図５に、実施形態に係るモデル情報記憶部１４２の一例を示す。図５に示した例では、モデル情報記憶部１４２は、「モデルＩＤ」、「用途」、「モデルデータ」といった項目が含まれる。

　「モデルＩＤ」は、モデルを識別するための識別情報を示す。「用途」は、対応するモデルの用途を示す。「モデルデータ」は、モデルのデータを示す。図５では「モデルデータ」に「ＭＤＴ１」といった概念的な情報が格納される例を示したが、実際には、モデルに含まれるネットワークに関する情報や関数等、そのモデルを構成する種々の情報が含まれる。

　図５に示す例では、モデルＩＤ「Ｍ１」により識別されるモデル（モデルＭ１）は、用途が「識別モデル（画像認識）」であることを示す。モデルＭ１は、識別モデルであり、画像認識に用いられることを示す。また、モデルＭ１のモデルデータは、モデルデータＭＤＴ１であることを示す。

　なお、モデル情報記憶部１４２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、モデル情報記憶部１４２は、学習処理により学習（生成）された第１モデルや第２モデルの情報を記憶する。モデル情報記憶部１４２は、学習処理により学習（生成）されたモデルＭ１に対応する第１モデルや第２モデルのパラメータ情報を記憶する。

　図３に戻り、説明を続ける。制御部１５は、例えば、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等によって、情報処理装置１００内部に記憶されたプログラム（例えば、本開示に係る情報処理プログラム）がＲＡＭ（Random　Access　Memory）等を作業領域として実行されることにより実現される。また、制御部１５は、コントローラ（controller）であり、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路により実現されてもよい。

　図３に示すように、制御部１５は、取得部１５１と、学習部１５２と、演算部１５３と、予測部１５４と、生成部１５５と、送信部１５６とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１５の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

　取得部１５１は、各種情報を取得する。取得部１５１は、外部の情報処理装置から各種情報を取得する。取得部１５１は、記憶部１４から各種情報を取得する。取得部１５１は、入力部１２により受け付けられた情報を取得する。

　取得部１５１は、記憶部１４から各種情報を取得する。取得部１５１は、データ情報記憶部１４１やモデル情報記憶部１４２や精度情報記憶部１４３から各種情報を取得する。

　取得部１５１は、学習用データを取得する。取得部１５１は、データ情報記憶部１４１からデータセットＤＳ１を取得する。取得部１５１は、評価用データを取得する。取得部１５１は、データ情報記憶部１４１から評価用データを取得する。取得部１５１は、データ情報記憶部１４１から人種Ａ評価用データ、人種Ｂ評価用データ、人種Ｃ評価用データ、人種Ｄ評価用データを取得する。

　取得部１５１は、モデルを取得してもよい。取得部１５１は、モデルのネットワーク構造を示す情報を取得してもよい。取得部１５１は、モデルを提供する外部の情報処理装置や記憶部１４からモデルを取得する。例えば、取得部１５１は、モデルＭ１をモデル情報記憶部１４２から取得する。例えば、取得部１５１は、モデルＭ１のネットワーク構造を示す情報をモデル情報記憶部１４２から取得する。

　取得部１５１は、学習部１５２が学習した各種情報を取得する。取得部１５１は、演算部１５３が測定した各種情報を取得する。取得部１５１は、予測部１５４が予測した各種情報を取得する。取得部１５１は、生成部１５５が生成した各種情報を取得する。

　取得部１５１は、機械学習によるモデルの学習に用いる学習用データを取得する。取得部１５１は、複数のカテゴリの各々に対応するデータを含む学習用データを取得する。取得部１５１は、モデルの精度の目標を示す目標精度を取得する。取得部１５１は、入力部１２により受け付けられた目標精度を取得する。取得部１５１は、一の精度を指定する指定情報を取得する。

　学習部１５２は、学習処理を行う。学習部１５２は、各種学習を行う。学習部１５２は、取得部１５１により取得された情報に基づいて、各種情報を学習する。学習部１５２は、モデルを学習（生成）する。学習部１５２は、モデル等の各種情報を学習する。学習部１５２は、学習によりモデルを生成する。学習部１５２は、種々の機械学習に関する技術を用いて、モデルを学習する。例えば、学習部１５２は、モデル（ネットワーク）のパラメータを学習する。学習部１５２は、種々の機械学習に関する技術を用いて、モデルを学習する。

　学習部１５２は、各種学習を行う。学習部１５２は、記憶部１４に記憶された情報に基づいて、各種情報を学習する。学習部１５２は、データ情報記憶部１４１やモデル情報記憶部１４２に記憶された情報に基づいて、モデルを学習する。

　学習部１５２は、ネットワークのパラメータを学習する。例えば、学習部１５２は、モデルＭ１のネットワークのパラメータを学習する。学習部１５２は、モデルＭ１のネットワークのパラメータを学習することにより、モデルＭ１に対応する第１モデルや第２モデルを学習する。

　学習部１５２は、データ情報記憶部１４１に記憶された学習用データ（教師データ）に基づいて、学習処理を行うことにより、第１モデルや第２モデルを生成する。学習部１５２は、データ情報記憶部１４１に記憶された学習用データを用いて、学習処理を行うことにより、第１モデルを生成する。学習部１５２は、データ情報記憶部１４１に記憶された学習用データを調整したデータを用いて、学習処理を行うことにより、第２モデルを生成する。例えば、学習部１５２は、画像認識に用いられるモデルを生成する。学習部１５２は、モデルＭ１のネットワークのパラメータを学習し、モデルＭ１に対応する第１モデルや第２モデルを生成する。また、学習部１５２は、ネットワーク構造の異なる第１モデルと第２モデルとを生成してもよい。

　学習部１５２による学習の手法は特に限定されないが、例えば、ラベル情報（人種等）と画像群とを紐づけた学習用データを用意し、その学習用データを多層ニューラルネットワークに基づいた計算モデルに入力して学習してもよい。また、例えばＣＮＮ（Convolutional　Neural　Network）、３Ｄ－ＣＮＮ等のＤＮＮ（Deep　Neural　Network）に基づく手法が用いられてもよい。学習部１５２は、映像等の動画像（動画）のような時系列データを対象とする場合、再帰型ニューラルネットワーク（Recurrent　Neural　Network：ＲＮＮ）やＲＮＮを拡張したＬＳＴＭ（Long　Short-Term　Memory　units）に基づく手法を用いてもよい。

　学習部１５２は、学習により生成した第１モデルや第２モデルをモデル情報記憶部１４２に格納する。学習部１５２は、モデルＭ１のネットワークに対応する第１モデルや第２モデル等を生成する。この場合、学習部１５２は、生成した第１モデルや第２モデル等をモデルＭ１に対応付けてモデル情報記憶部１４２に格納する。学習部１５２は、学習用データとして用いられる各データと正解情報とに基づいて、モデルを学習する。

　学習部１５２は、学習用データにより第１モデルを学習する。学習部１５２は、学習に用いるデータのデータ数を調整する。学習部１５２は、データ数を調整する対象に応じて学習用データのデータ数が調整された調整後データにより第２モデルを学習する。学習部１５２は、学習用データからデータ数が減らされた調整後データにより第２モデルを学習する。学習部１５２は、学習用データから所定の基準に基づいてデータ数が減らし、調整した調整後データにより第２モデルを学習する。

　学習部１５２は、対象に関する区分を示すカテゴリに応じて学習用データのデータ数が調整された調整後データにより第２モデルを学習する。学習部１５２は、対象の複数のカテゴリのうち、一のカテゴリに応じて学習用データのデータ数が調整された調整後データにより第２モデルを学習する。

　学習部１５２は、学習用データのうち、一のカテゴリに対応するデータ数が調整された調整後データにより第２モデルを学習する。学習部１５２は、学習用データのうち、一のカテゴリに対応するデータ数が減らされた調整後データにより第２モデルを学習する。学習部１５２は、複数のカテゴリごとに学習用データのデータ数が調整された複数の調整後データの各々により第２モデルを学習する。

　図１及び図２の例では、学習部１５２は、データセットＤＳ１を対象として画像認識に用いるモデルＭ１の第１モデルを学習する。学習部１５２は、調整後データセットＡＳ１を対象として画像認識に用いるモデルＭ１の第２モデルを学習する。学習部１５２は、データセットＤＳ１からカテゴリ「人種Ａ」に対応するデータが減らされた調整後データセットＡＳ１を対象として画像認識に用いるモデルＭ１の第２モデル（第３モデル）を学習する。学習部１５２は、調整後データセットＡＳ２を対象として画像認識に用いるモデルＭ１の第２モデルを学習する。学習部１５２は、調整後データセットＡＳ１からカテゴリ「人種Ａ」に対応するデータがさらに減らされた調整後データセットＡＳ２を対象として画像認識に用いるモデルＭ１の第３モデルを学習する。

　演算部１５３は、演算処理を行う。演算部１５３は、各種情報を算出する処理を行う。演算部１５３は、第１の学習用データで学習された識別モデルの第１の識別精度を算出する。演算部１５３は、第１の学習用データに対してデータ数を調整された第２の学習用データで学習された識別モデルの第２の識別精度を算出する。演算部１５３は、測定処理を行う測定部として機能する。演算部１５３は、各種測定を行う。演算部１５３は、取得部１５１により取得された情報に基づいて、各種情報を測定する。演算部１５３は、記憶部１４に記憶された情報に基づいて、各種情報を測定する。演算部１５３は、データ情報記憶部１４１やモデル情報記憶部１４２や精度情報記憶部１４３に記憶された情報に基づいて、各種情報を測定する。演算部１５３は、各種判定を行う。演算部１５３は、取得部１５１により取得された情報に基づいて、各種情報を判定する。演算部１５３は、記憶部１４に記憶された情報に基づいて、各種情報を判定する。

　演算部１５３は、評価用データを用いてモデルの精度を測定する。演算部１５３は、第１モデルや第２モデルの精度を測定する。演算部１５３は、測定したモデルの精度に関する情報を精度情報記憶部１４３に格納する。演算部１５３は、評価用データとして用いられる各データと正解情報とに基づいて、モデルの精度を測定する。演算部１５３は、評価用データを入力した場合にモデルが出力する出力結果と、正解情報との比較結果を収集することにより、モデルの精度を測定する。

　演算部１５３は、評価用データを用いて第１モデルの第１精度を測定する。演算部１５３は、評価用データを用いて第２モデルの第２精度を測定する。演算部１５３は、一のカテゴリに対応する評価用データを用いて第１モデルの第１精度を測定する。演算部１５３は、一のカテゴリに対応する評価用データを用いて第２モデルの第２精度を測定する。演算部１５３は、複数のカテゴリの各々に対応する評価用データを用いて第１モデルの複数の第１精度を測定する。演算部１５３は、複数のカテゴリの各々に対応する複数の第２精度を測定する。

　図１及び図２の例では、演算部１５３は、学習した第１モデルについて、カテゴリ「人種Ａ」に対応する精度を測定する。演算部１５３は、人種Ａ評価用データを用いて、カテゴリ「人種Ａ」に対応する精度を測定する。演算部１５３は、第１モデルについて、カテゴリ「人種Ａ」に対応する精度を「ＶＬ１」であると測定する。演算部１５３は、第２モデルについて、カテゴリ「人種Ａ」に対応する精度を「ＶＬ２」であると測定する。演算部１５３は、第３モデルについて、カテゴリ「人種Ａ」に対応する精度を「ＶＬ３」であると測定する。

　予測部１５４は、予測処理を行う。予測部１５４は、各種情報を予測する。予測部１５４は、外部の情報処理装置から取得された情報に基づいて、各種情報を予測する。予測部１５４は、記憶部１３４に記憶された情報に基づいて、各種情報を予測する。予測部１５４は、データ情報記憶部１４１やモデル情報記憶部１４２や精度情報記憶部１４３に記憶された情報に基づいて、各種情報を予測する。予測部は、第１の学習用データで学習された識別モデルの第１の識別精度と、第２の学習用データで学習された識別モデルの第２の識別精度に基づいて、学習用データ数に対する識別精度の変化を予測する。

　予測部１５４は、第１モデルや第２モデルの精度を予測する。予測部１５４は、予測したモデルの精度に関する情報を精度情報記憶部１４３に格納する。予測部１５４は、演算部１５３による測定結果に基づいて、モデルの精度を予測する。予測部１５４は、演算部１５３による測定結果に基づいて、予測線を予測する。

　予測部１５４は、第１精度と、第２精度とに基づいて、対象に応じてデータ数を調整した場合のモデルの精度変化を予測する。予測部１５４は、学習用データのデータ数を増やした場合のモデルの精度変化を予測する。予測部１５４は、学習用データのデータ数を増やした場合のモデルの精度の予測線を予測する。

　図１及び図２の例では、予測部１５４は、測定ＭＲ１１～測定ＭＲ１３に示す情報を基にモデルの精度変化を予測する。予測部１５４は、カテゴリ「人種Ａ」に対応するモデルの精度を予測する関数を導出する。予測部１５４は、カテゴリ「人種Ａ」に対応するモデルの精度の予測線ＬＮ１に対応する関数ＦＣ１を導出する。

　生成部１５５は、バイアス調整に関連する各種制御を行う制御部として機能する。生成部１５５は、バイアス調整の処理を行うバイアス調整制御部として機能する。生成部１５５は、予測部１５４により予測された識別精度の変化に基づいて、予測された識別精度の変化が所定の目標値（目標精度）となるように学習に用いるデータ数を調整する。また、生成部１５５は、予測部１５４により予測された識別精度の変化に基づいて、識別モデルを変更する。生成部１５５は、学習に用いるデータ数の調整により目標精度の達成が難しい場合、識別モデルを変更する。生成部１５５は、目標精度の達成するために必要なデータ数の増加が所定の閾値以上である場合識別モデルを変更する。例えば、生成部１５５は、モデルのネットワーク構造を変更することにより、識別モデルを変更する。例えば、生成部１５５は、モデルの層の深さ（数）やノード（図６中の各円に対応）の数を変更することにより、識別モデルを変更する。生成部１５５は、各種生成を行う。生成部１５５は、取得部１５１により取得された情報に基づいて、各種情報を生成する。生成部１５５は、記憶部１４に記憶された情報に基づいて、各種情報を生成する。生成部１５５は、データ情報記憶部１４１やモデル情報記憶部１４２や精度情報記憶部１４３に記憶された情報に基づいて、各種情報を生成する。

　生成部１５５は、表示部１３に表示する各種情報を生成する。生成部１５５は、表示部１３に表示する文字情報やグラフといった画像情報などの各種情報を生成する。

　なお、生成部１５５は、図１に示すグラフＧＲ１１等の画面に関する情報（画像）を画像に関連する種々の従来技術を適宜用いて生成する。生成部１５５は、図１に示すグラフＧＲ１１等の画像をＧＵＩに関する種々の従来技術を適宜用いて生成する。例えば、生成部１５５は、ＣＳＳ、ＪａｖａＳｃｒｉｐｔ（登録商標）、ＨＴＭＬ、あるいは、上述した情報表示や操作受付等の情報処理を記述可能な任意の言語によりグラフＧＲ１１等の画像を生成してもよい。

　生成部１５５は、学習用データにより学習されるモデルである第１モデルの第１精度と、データ数を調整する対象に応じて学習用データのデータ数が調整された調整後データにより学習されるモデルである第２モデルの第２精度とに基づいて、モデルの精度を示す精度情報を生成する。生成部１５５は、学習用データからデータ数が減らされた調整後データにより学習される第２モデルに基づいて、精度情報を生成する。生成部１５５は、第１精度と、第２精度とに基づいて、対象に応じたデータ数の調整によるモデルの精度変化を示す精度情報を生成する。

　生成部１５５は、評価用データを用いて測定される第１モデルの第１精度と、評価用データを用いて測定される第２モデルの第２精度とに基づいて、精度情報を生成する。生成部１５５は、第１精度と、第２精度とに基づいて、対象に応じてデータ数を調整した場合のモデルの精度変化の予測を示す精度情報を生成する。生成部１５５は、学習用データのデータ数を増やした場合のモデルの精度変化の予測を示す精度情報を生成する。生成部１５５は、学習用データのデータ数を増やした場合のモデルの精度の予測線を含む精度情報を生成する。

　生成部１５５は、対象に関する区分を示すカテゴリに応じて学習用データのデータ数が調整された調整後データにより学習される第２モデルの第２精度に基づいて、カテゴリに関する精度情報を生成する。生成部１５５は、対象の複数のカテゴリのうち、一のカテゴリに応じて学習用データのデータ数が調整された調整後データにより学習される第２モデルの第２精度に基づいて、一のカテゴリに対するモデルの精度を示すモデルの精度情報を生成する。生成部１５５は、学習用データのうち、一のカテゴリに対応するデータ数が調整された調整後データにより学習される第２モデルの第２精度に基づいて、精度情報を生成する。

　生成部１５５は、学習用データのうち、一のカテゴリに対応するデータ数が減らされた調整後データにより学習される第２モデルの第２精度に基づいて、精度情報を生成する。生成部１５５は、一のカテゴリに対する第１モデルの第１精度と、一のカテゴリに対する第２モデルの第２精度とに基づいて、精度情報を生成する。

　生成部１５５は、一のカテゴリに対応する評価用データを用いて測定される第１モデルの第１精度と、一のカテゴリに対応する評価用データを用いて測定される第２モデルの第２精度とに基づいて、精度情報を生成する。生成部１５５は、複数のカテゴリごとに学習用データのデータ数が調整された複数の調整後データの各々により学習される複数の第２モデルの複数の第２精度に基づいて、複数のカテゴリの各々に対するモデルの精度を示す精度情報を生成する。

　生成部１５５は、複数のカテゴリの各々に対応する第１モデルの複数の第１精度と、複数のカテゴリの各々に対応する複数の第２モデルの複数の第２精度とに基づいて、精度情報を生成する。生成部１５５は、複数のカテゴリの各々に対応する評価用データを用いて測定される第１モデルの複数の第１精度と、複数のカテゴリの各々に対応する複数の第２精度とに基づいて、精度情報を生成する。

　生成部１５５は、複数のカテゴリの各々に対応する複数の第１精度と、複数のカテゴリの各々に対応する複数の第２精度とに基づいて、モデルの精度に関する複数のカテゴリ間の関係を示す精度情報を生成する。生成部１５５は、複数のカテゴリにおけるモデルの精度の偏りを示す精度情報を生成する。生成部１５５は、複数のカテゴリの各々のモデルの精度改善の難度を示す精度情報を生成する。生成部１５５は、複数の指標に対応するモデルの複数の精度を示す精度情報を生成する。

　図１の例では、生成部１５５は、カテゴリ「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の各々を対象に処理を行うことにより、グラフＧＲ１１に示すような、４つのカテゴリについて測定した精度や予測した精度を含む精度情報を生成する。

　送信部１５６は、各種情報を送信する。送信部１５６は、各種情報の提供を行う。送信部１５６は、外部の情報処理装置へ各種情報を提供する。送信部１５６は、外部の情報処理装置へ各種情報を送信する。送信部１５６は、記憶部１４に記憶された情報を送信する。送信部１５６は、データ情報記憶部１４１やモデル情報記憶部１４２や精度情報記憶部１４３に記憶された情報を送信する。送信部１５６は、生成部１５５により生成された情報を送信する。

［１－２－１．モデル例］
　上述したように、情報処理装置１００は、種々の形式のモデル（関数）を用いてもよい。例えば、情報処理装置１００は、ＳＶＭ（Support　Vector　Machine）等の回帰モデルやニューラルネットワーク（neural　network）等、任意の形式のモデル（関数）を用いてもよい。情報処理装置１００は、非線形の回帰モデルや線形の回帰モデル等、種々の回帰モデルを用いてもよい。

　この点について、図６を用いて、モデルのネットワーク構造の一例を説明する。図６は、本開示の実施形態に係るモデルの一例を示す図である。図６に示すネットワークＮＷ１は、入力層ＩＮＬと出力層ＯＵＴＬとの間に複数（多層）の中間層を含むニューラルネットワークを示す。例えば、情報処理装置１００は、図６に示すネットワークＮＷ１のパラメータを学習してもよい。

　図６に示すネットワークＮＷ１は、モデルＭ１のネットワークに対応し、画像認識に用いられるニューラルネットワーク（モデル）を示す概念的な図である。例えば、ネットワークＮＷ１は、入力層ＩＮＬ側から例えば画像が入力された場合に、出力層ＯＵＴＬからその認識結果を出力する。例えば、情報処理装置１００は、ネットワークＮＷ１中の入力層ＩＮＬに情報を入力することにより、出力層ＯＵＴＬから入力に対応する認識結果を出力させる。

　なお、図６では、モデル（ネットワーク）の一例としてネットワークＮＷ１を示すが、ネットワークＮＷ１は、用途等に応じて種々の形式であってもよい。例えば、情報処理装置１００は、図６に示すネットワークＮＷ１の構造を有するモデルＭ１のパラメータ（重み）を学習することにより、モデルＭ１に対応する第１モデルや第２モデルを学習する。

［１－３．実施形態に係る情報処理の手順］
　次に、図７及び図８を用いて、実施形態に係る情報処理の手順について説明する。図７及び図８は、本開示の実施形態に係る情報処理の手順を示すフローチャートである。具体的には、図７は、情報処理の手順の概要を示すフローチャートである。また、図８は、情報処理の手順の詳細を示すフローチャートである。

　まず、図７を用いて、本開示の実施形態に係る情報処理の流れの概要について説明する。図７に示すように、情報処理装置１００は、機械学習によるモデルの学習に用いる学習用データを取得する（ステップＳ１０１）。例えば、情報処理装置１００は、データセットＤＳ１を取得する。

　情報処理装置１００は、学習用データにより学習される第１モデルの第１精度と、調整後データにより学習される第２モデルの第２精度とに基づいて、モデルの精度を示す精度情報を生成する（ステップＳ１０２）。例えば、情報処理装置１００は、学習用データにより学習される第１モデルの第１精度と、調整後データにより学習される第２モデルの第２精度とに基づいて、モデルの精度を示すグラフＧＲ１１を生成する。そして、情報処理装置１００は、生成したモデルの精度を示す精度情報を表示してもよい。

　次に、図８用いて、本開示の実施形態に係る情報処理の流れの詳細について説明する。図８に示すように、情報処理装置１００は、カテゴリＩｎｄｅｘ、ｉを０で初期化する（ステップＳ２０１）。例えば、情報処理装置１００は、繰り返し処理に用いる変数であるカテゴリ「ｉ」の値を「０」に初期化する。図１の例では、例えば、カテゴリ「０」が「人種Ａ」に対応し、カテゴリ「１」が「人種Ｂ」に対応し、カテゴリ「２」が「人種Ｃ」に対応し、カテゴリ「３」が「人種Ｄ」に対応する。

　そして、情報処理装置１００は、学習データセットを初期化する（ステップＳ２０２）。例えば、情報処理装置１００は、データセットＤＳ１を学習データセットに設定する。

　そして、情報処理装置１００は、モデルの学習と精度評価を行う（ステップＳ２０３）。例えば、情報処理装置１００は、データセットＤＳ１を学習データセットに設定した直後においては、データセットＤＳ１全体を用いてモデル（第１モデル）を学習し、そのモデルの精度評価を行う。例えば、情報処理装置１００は、全データからスタートする。また、情報処理装置１００は、データ数調整後においては、データセットＤＳ１からデータ数が調整された調整後データセットを用いてモデル（第２モデル）を学習し、そのモデルの精度評価を行う。

　情報処理装置１００は、十分に少ない数のデータでの学習を行ったかどうかを判定する（ステップＳ２０４）。情報処理装置１００は、十分に少ない数のデータでの学習を行っていない場合（ステップＳ２０４；Ｎｏ）、カテゴリｉの学習用データセットのデータ（のみ）を間引く（ステップＳ２０５）。例えば、「ｉ」が「０」であり、カテゴリ「０」である場合、学習用データセットのうち、カテゴリ「人種Ａ」に対応するデータ数を減らす。また、「ｉ」が「１」であり、カテゴリ「１」である場合、学習用データセットのうち、カテゴリ「人種Ｂ」に対応するデータ数を減らす。

　情報処理装置１００は、ステップＳ２０５において対応するカテゴリのデータを間引いた後、ステップＳ２０３に戻り、間引いた後のデータ（調整後データ）を用いて処理を繰り返す。

　情報処理装置１００は、十分に少ない数のデータでの学習を行った場合（ステップＳ２０４；Ｙｅｓ）、全てのカテゴリで評価を完了したかどうかを判定する（ステップＳ２０６）。情報処理装置１００は、全てのカテゴリで評価を完了していない場合（ステップＳ２０６；Ｎｏ）、次のカテゴリへ（ｉ＋＋）処理を移行する（ステップＳ２０７）。例えば、「ｉ」が「０」である場合、「ｉ」に１を加算し「ｉ」を「１」に更新する。この場合、「ｉ」を「０」から「１」へ更新することにより、カテゴリ「人種Ａ」を対象とする処理が完了した後、カテゴリ「人種Ｂ」を対象とする処理に移行する。

　情報処理装置１００は、ステップＳ２０７において処理の対象を次のカテゴリへ移行した後、ステップＳ２０２に戻り、次のカテゴリを対象として処理を繰り返す。

　情報処理装置１００は、全てのカテゴリで評価を完了した場合（ステップＳ２０６；Ｙｅｓ）、処理を終了する。

　例えば、情報処理装置１００は、図８に示すような処理手順により、カテゴリ毎にループし、元のデータ数から半分、さらに半分とデータを減らしながら、指定回数学習と、バイアスやフェアネスに関連する（精度）指標の算出を行う。例えば、情報処理装置１００は、人種をカテゴリとした画像からの顔検出の場合、各人種の学習データを半分に減らしながら検出精度をプロットする。

［１－４．表示例］
　図９を用いて、精度情報の表示について説明する。図９は、精度情報の表示の一例を示す図である。

　図９のグラフＧＲ２１は、図１のグラフＧＲ１１に対応する。図９のグラフＧＲ２１は、図１のグラフＧＲ１１のうち、学習用データ全体を用いて生成した第１モデルの各カテゴリに対する精度を示す情報と、各カテゴリの予測線を表示する場合を示す。具体的には、グラフＧＲ２１は、図１のグラフＧＲ１１中の各カテゴリ「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の測定ＭＲ１１～ＭＲ４１や予測線ＬＮ１～ＬＮ４を表示する例を示す。

　情報処理装置１００は、グラフＧＲ２１を生成する。情報処理装置１００は、モデルの精度に関する複数のカテゴリ間の関係を示すグラフＧＲ２１を生成する。情報処理装置１００は、グラフＧＲ２１を表示部１３に表示する。

　表示部１３に表示されたグラフＧＲ２１を確認したユーザは、カテゴリ「人種Ａ」の現状の精度と、データの増減に応じた精度の変化を示す予測線とから、カテゴリ「人種Ａ」の精度改善の難度を把握することができる。例えば、表示部１３に表示されたグラフＧＲ２１を確認したユーザは、カテゴリ「人種Ａ」の予測線の傾きから、カテゴリ「人種Ａ」の精度改善の難度を把握することができる。また、カテゴリ「人種Ｂ」、「人種Ｃ」、「人種Ｄ」についても、カテゴリ「人種Ａ」と同様に、グラフＧＲ２１は、現状の精度と、データの増減に応じた精度の変化を示す予測線とから、各カテゴリの精度改善の難度を把握することができる。

　例えば、カテゴリ「人種Ｃ」の予測線の傾きが小さいため、ユーザは、カテゴリ「人種Ｃ」が精度改善の難度が高いカテゴリであることを認識することができる。例えば、カテゴリ「人種Ｄ」については、現状の精度がカテゴリ「人種Ｃ」の現状の精度より低いが、予測線の傾きがカテゴリ「人種Ｃ」の予測線の傾きよりも大きいため、ユーザは、カテゴリ「人種Ｄ」が精度改善の難度が、カテゴリ「人種Ｃ」よりも高くないカテゴリであることを認識することができる。

　なお、図９は一例であり、情報処理装置１００は、各カテゴリ「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」について、データ数を調整したデータで生成された第２モデルの測定ＭＲ１２～ＭＲ４２、ＭＲ１３～ＭＲ４３等も表示してもよい。

［１－５．目標精度（目標値）］
　ここから、図１０及び図１１を用いて、目標精度（目標値）について説明する。

［１－５－１．目標精度（目標値）とデータ数の関係］
　まず、図１０を用いて、目標精度を含むグラフ表示について説明する。図１０は、目標精度とデータ数との関係を示す図である。具体的には、図１０は、目標精度と各カテゴリの精度を含むグラフを示す図である。

　図１０に示すグラフＧＲ３１には、各カテゴリ「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の測定ＭＲ１１～ＭＲ４１や予測線ＬＮ１～ＬＮ４と、目標精度ＴＡ１とが含まれる。情報処理装置１００は、グラフＧＲ３１を生成する。情報処理装置１００は、グラフＧＲ３１を表示部１３に表示してもよい。

　情報処理装置１００は、グラフＧＲ３１により、各カテゴリ「人種Ａ」、「人種Ｂ」、「人種Ｃ」、「人種Ｄ」の精度と目標精度ＴＡ１との関係を直感的に把握可能にユーザに情報提供することができる。図１０の例では、グラフＧＲ３１は、カテゴリ「人種Ｂ」は、既に目標精度ＴＡ１に達しており、残りのカテゴリ「人種Ａ」、「人種Ｃ」、「人種Ｄ」は、目標精度ＴＡ１に達していないことを示す。

　また、グラフＧＲ３１は、カテゴリ「人種Ａ」、「人種Ｃ」、「人種Ｄ」の各々が目標精度ＴＡ１に達するために必要なデータ数を示す。例えば、カテゴリ「人種Ａ」については、グラフＧＲ３１中の測定ＭＲ１１に対応する横軸「ｌｏｇ（データ数）」の位置がその時点での学習用データに含まれるカテゴリ「人種Ａ」に対応するデータ数（現状データ数）を示す。また、カテゴリ「人種Ａ」については、グラフＧＲ３１中の予測線ＬＮ１と目標精度ＴＡ１との交点に対応する横軸「ｌｏｇ（データ数）」の位置が、目標精度ＴＡ１を達成するために必要なカテゴリ「人種Ａ」に対応するデータ数（必要データ数）を示す。

　表示部１３に表示されたグラフＧＲ３１を確認したユーザは、カテゴリ「人種Ａ」の現状データ数と、カテゴリ「人種Ａ」の必要データ数とから、カテゴリ「人種Ａ」についての目標精度ＴＡ１と現状の精度との関係を把握することができる。また、表示部１３に表示されたグラフＧＲ３１を確認したユーザは、カテゴリ「人種Ａ」について、目標精度ＴＡ１を達成するためにどの程度データ数を増加させる必要があるかを把握することができる。また、カテゴリ「人種Ｃ」、「人種Ｄ」についても、カテゴリ「人種Ａ」と同様に、グラフＧＲ３１は、現状データ数と必要データ数とから、目標精度ＴＡ１を達成するためにどの程度データ数を増加させる必要があるかを示す。

　情報処理装置１００は、図１０に示すような各カテゴリの精度と目標精度ＴＡ１との関係に基づいて、バイアス調整処理を行ってもよい。例えば、情報処理装置１００の制御部１５の生成部１５５等は、予測された識別精度の変化に基づいて、当該予測された識別精度の変化が所定の目標値となるように学習に用いるデータ数を調整したり、識別モデルを変更したりしてもよい。

　図１０の例では、情報処理装置１００は、カテゴリ「人種Ａ」、「人種Ｃ」、「人種Ｄ」については、目標精度ＴＡ１に達していないため、カテゴリ「人種Ａ」、「人種Ｃ」、「人種Ｄ」に対応するデータ数を増加させてもよい。例えば、情報処理装置１００は、カテゴリ「人種Ａ」の測定ＭＲ１１と予測線ＬＮ１とに基づいて、カテゴリ「人種Ａ」が目標精度ＴＡ１に達するまでに必要なデータ数（必要データ数）を算出してもよい。

　そして、情報処理装置１００は、算出した必要データ数の情報を基に、カテゴリ「人種Ａ」のデータ数を調整してもよい。この場合、情報処理装置１００は、必要データ数分のカテゴリ「人種Ａ」のデータを増加するように調整処理を行う。例えば、情報処理装置１００は、データ情報記憶部１４１（図４参照）中に、学習に未使用のカテゴリ「人種Ａ」のデータが有る場合、そのデータのうち必要データ数分のデータを学習に用いてもよい。

　また、情報処理装置１００は、学習用データの提供サービスを行う外部装置にデータを要求し、外部装置から必要なデータを取得してもよい。例えば、情報処理装置１００は、カテゴリ「人種Ａ」を示す情報と必要データ数とを外部装置に送信することにより、外部装置から必要データ数分の「人種Ａ」に対応するデータを取得してもよい。情報処理装置１００は、カテゴリ「人種Ｃ」、「人種Ｄ」についても、カテゴリ「人種Ａ」と同様に、必要データ数を算出し、データ情報記憶部１４１（図４参照）や外部装置から必要データ数分の「人種Ｃ」、「人種Ｄ」に対応するデータを取得してもよい。

　また、情報処理装置１００は、目標精度を超えるカテゴリ（超過カテゴリ）がある場合、その超過カテゴリのデータ数を減らすことにより、超過カテゴリの識別精度（精度）を目標精度ＴＡ１に近づけてもよい。このように、情報処理装置１００は、データ数を増やすことのみに限らず、データ数を減らすことにより、データ数を調整することにより、所望の精度に近づける。これにより、情報処理装置１００は、全てのカテゴリの識別精度（精度）を目標精度ＴＡ１に近づけ、カテゴリ間での制度のばらつきを抑制することができる。

　また、情報処理装置１００は、予測された識別精度の変化に基づいて、モデルを変更してもよい。情報処理装置１００は、学習に用いるデータ数の調整により目標精度の達成が難しい場合、モデルを変更する。情報処理装置１００は、目標精度の達成するために必要なデータ数の増加が所定の閾値以上である場合モデルを変更する。図１０の例では、情報処理装置１００は、カテゴリ「人種Ｃ」の測定ＭＲ３１と予測線ＬＮ３とに基づいて、カテゴリ「人種Ｃ」が目標精度ＴＡ１に達するまでに必要なデータ数（必要データ数ＮＭ）を算出し、必要データ数ＮＭと閾値（閾値ＴＨ）とを比較する。情報処理装置１００は、必要データ数ＮＭと閾値ＴＨと比較した結果、必要データ数ＮＭが閾値ＴＨ以上である場合、モデルを変更する。

　なお、情報処理装置１００は、種々の条件を基にモデルを変更するかどうかを決定してもよい。例えば、情報処理装置１００は、目標精度の達成が不可能なカテゴリがある場合、モデルを変更してもよい。例えば、情報処理装置１００は、必要データ数が算出不可能なカテゴリがある場合、モデルを変更してもよい。例えば、情報処理装置１００は、必要データ数が無限大となるカテゴリがある場合、モデルを変更してもよい。例えば、情報処理装置１００は、予測線の傾きが０であり、目標精度の達成が不可能なカテゴリがある場合、モデルを変更してもよい。このように、情報処理装置１００は、データの調整ではバイアスの解消が難しい場合に、モデル自体を変更することにより、バイアスを解消する可能性を高めることができる。

　情報処理装置１００は、種々の態様によりモデルを変更する。例えば、情報処理装置１００は、モデルのネットワーク構造を変更することにより、モデルを変更する。例えば、情報処理装置１００は、モデルの層数やノード数を変更することにより、モデルを変更する。図１０の例では、情報処理装置１００は、モデルＭ１のネットワーク構造（第１ネットワーク構造）を他のネットワーク構造（第２ネットワーク構造）に変更することにより、モデルＭ１からモデルＭ５１に変更する。例えば、情報処理装置１００は、モデルＭ１よりも層数やノード数が多いモデルＭ５１に変更する。例えば、情報処理装置１００は、モデル情報記憶部１４２（図５参照）から用いるモデルを選択してもよい。例えば、情報処理装置１００は、モデルＭ１を他のモデルに変更する場合、モデル情報記憶部１４２中のモデルのうち、モデルＭ１と同じ用途のモデル（例えばモデルＭ５１等）を選択してもよい。なお、情報処理装置１００は、上記のようなネットワーク構造の変更に限らず、種々のいわゆるハイパーパラメータを変更することにより、モデルを変更してもよい。例えば、情報処理装置１００は、活性化関数や最適化アルゴリズムなどの計算アルゴリズム（学習アルゴリズム）などの種々のハイパーパラメータを変更してもよい。情報処理装置１００は、記憶部１４（図３参照）に変更する順番を示す情報を記憶してもよい。例えば、情報処理装置１００は、モデルを変更する場合、学習アルゴリズム、ネットワークの構造の順に変更することを示す情報を記憶してもよい。この場合、情報処理装置１００は、学習アルゴリズムを変更してもバイアスが解消できない場合に、モデルのネットワーク構造を変更してもよい。

［１－５－２．目標精度（目標値）に関する表示例］
　次に図１１を用いて目標精度に関する表示例について説明する。図１１は、目標精度とデータ数との関係の表示の一例を示す図である。

　図１１の例では、情報処理装置１００は、各カテゴリに対応する精度と目標精度との関係を文字情報として示す精度情報ＣＨ１を生成する。情報処理装置１００は、精度情報ＣＨ１を表示部１３に表示する。精度情報ＣＨ１は、各カテゴリに対応する精度が目標精度に達するまでに必要なデータ数を文字情報として示す。例えば、カテゴリ「人種Ａ」については、目標精度を達成するためには、現状のデータ数の十倍のデータが必要であることを示す。すなわち、カテゴリ「人種Ａ」に対応する精度が、目標精度を達成するためには、カテゴリ「人種Ａ」に対応するデータが、現状の１０倍必要であることを示す。

　また、カテゴリ「人種Ｃ」については、目標精度を達成するためには、現状のデータ数の一万倍のデータが必要であることを示す。また、カテゴリ「人種Ｄ」については、目標精度を達成するためには、現状のデータ数の百倍のデータが必要であることを示す。また、図１１の例では、既に目標精度を達成しているカテゴリ「人種Ｂ」については、情報を非表示にする場合を示す。このように、既に目標精度を達成しているカテゴリについては情報を非表示にすることにより、精度目標を達成していることを示してもよい。

　なお、目標精度を達成したカテゴリについても情報を表示してもよい。図１１の例では、カテゴリ「人種Ｂ」については、「目標精度達成済」といった既に目標精度を達成したことを示す情報や、「現状の精度は０．９です」といった現状の精度を示す情報を表示してもよい。

　例えば、情報処理装置１００は、ユーザが目標精度を入力すると、推定した予測線を元に目標精度を達成するために必要なデータ数を表示する。これにより、情報処理装置１００は、目標精度の達成に必要なデータ数を表示することができる。また、情報処理装置１００は、特定のカテゴリを減らしていくのではなく、データ全体を減らして描画してもよい。このように、情報処理装置１００は、予測された識別精度の変化をグラフ、又は、テキストで表示する。

［１－６．情報処理システムの処理の概念図］
　次に、図１２を用いて、情報処理システムの処理について概念的に説明する。図１２は、情報処理システムの処理の概念図の一例を示す図である。

　図１２の例では、学習用データセットや学習モデルを含む入力情報ＩＮ１が、モデルを学習し、学習したモデルの精度を測定するツールＴＬ１に入力される。例えば、ツールＴＬ１は、ＡＩのバイアス、フェアネス分析ツールであり、モデルのバイアス（偏り）、フェアネス（公平性）の分析に用いられる機能を有する。例えば、ツールＴＬ１の機能は、情報処理装置１００の取得部１５１、学習部１５２、演算部１５３、予測部１５４及び生成部１５５により実現されてもよい。

　入力情報ＩＮ１の入力に応じて、ツールＴＬ１は、分析結果ＯＵＴ１を生成する。図１２の例でツールＴＬ１により生成される分析結果ＯＵＴ１は、図１中のグラフＧＲ１１に対応する。例えば、ツールＴＬ１による分析結果ＯＵＴ１を表示する機能は、情報処理装置１００の表示部１３により実現されてもよい。分析結果ＯＵＴ１は、ユーザに提示する情報の一例を示す。

　例えば、ディープラーニング開発者等の情報処理装置１００のユーザは、手持ちのデータセットでディープラーニングベースのモデル（画像認識機など）を学習する。そして、学習したモデルに対して、開発者が本発明の実現する機能を実行する。情報処理システム１は、あとどのくらいデータを増やすと性能が向上するかの予測を表示する。

　例えば、ＡＩ等の開発者がツールＴＬ１のユーザとして想定される。このような、ユーザニーズとして、バイアスやフェアネスを改善するための指針を得ることや、バイアスやフェアネスを改善する難易度を知ること等が挙げられる。情報処理装置１００により実現されるツールＴＬ１の機能により、上述するようなユーザニーズに対する適切な情報をユーザに提供することができる。

［２．その他の実施形態］
　上述した各実施形態に係る処理は、上記各実施形態以外にも種々の異なる形態（変形例）にて実施されてよい。データの提供方法を決定する情報処理装置は、上述した例に限らず、種々の態様であってもよい。この点について以下説明する。なお、以下では、実施形態に係る情報処理装置１００と同様の点については、適宜説明を省略する。

［２－１．変形例］
　例えば、上述した例では、情報処理を行う情報処理装置が情報処理装置１００である例を示したが、情報処理装置と、情報を表示する端末装置とは別体であってもよい。この点について、図１３及び図１４を用いて説明する。図１３は、本開示の変形例に係る情報処理システムの構成例を示す図である。図１４は、本開示の変形例に係る情報処理装置の構成例を示す図である。

　図１３に示すように、情報処理システム１には、端末装置１０と、情報処理装置１００Ａとが含まれる。端末装置１０及び情報処理装置１００Ａは通信網Ｎを介して、有線又は無線により通信可能に接続される。なお、図１３に示した情報処理システム１には、複数台の端末装置１０や、複数台の情報処理装置１００Ａが含まれてもよい。この場合、情報処理装置１００Ａは、通信網Ｎを介して端末装置１０と通信し、端末装置１０への情報の提供やユーザが端末装置１０を介して指定したパラメータ等の情報を基に、モデルの学習を行なったりしてもよい。

　端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、例えば、ノート型ＰＣ（Personal　Computer）や、デスクトップＰＣや、スマートフォンや、タブレット型端末や、携帯電話機や、ＰＤＡ（Personal　Digital　Assistant）等により実現される。なお、端末装置１０は、情報処理装置１００Ａが提供する情報を表示可能であればどのような端末装置であってもよい。端末装置１０は、クライアント端末である。

　また、端末装置１０は、ユーザによる操作を受け付ける。図１３に示す例において、端末装置１０は、情報処理装置１００Ａが提供する情報を画面に表示する。また、端末装置１０は、ユーザによる操作を示す情報等の情報を情報処理装置１００Ａへ送信する。例えば、端末装置１０は、ユーザによる学習処理の実行を指示する指示情報を情報処理装置１００Ａへ送信する。端末装置１０は、情報処理装置１００Ａから受信した情報を表示する。端末装置１０は、情報処理装置１００Ａから受信した精度情報を表示する。端末装置１０は、モデルの精度の測定結果や予測結果を示す精度情報を表示する。端末装置１０は、情報処理装置１００Ａから受信したグラフを表示する。

　情報処理装置１００Ａは、端末装置１０に情報を提供したり、端末装置１０から情報を取得したりする点で情報処理装置１００と相違する以外は、情報処理装置１００と同様の情報処理を実現する。情報処理装置１００Ａは、クライアント端末である端末装置１０にサービスを提供するサーバである。例えば、情報処理装置１００Ａは、端末装置１０から取得した指示情報を基に、精度情報を生成する生成処理を行い、生成した精度情報を端末装置１０へ送信する。

　図１４に示すように、情報処理装置１００Ａは、通信部１１と、記憶部１４と、制御部１５Ａとを有する。通信部１１は、通信網Ｎ（インターネット等）と有線又は無線で接続され、通信網Ｎを介して、端末装置１０との間で情報の送受信を行う。この場合、情報処理装置１００Ａは、情報処理装置１００のような情報を表示する機能を有しなくてもよい。なお、情報処理装置１００Ａは、情報処理装置１００Ａの管理者等が利用する入力部（例えば、キーボードやマウス等）や表示部（例えば、液晶ディスプレイ等）を有してもよい。

　制御部１５Ａは、例えば、ＣＰＵやＭＰＵ等によって、情報処理装置１００Ａ内部に記憶されたプログラム（例えば、本開示に係る情報処理プログラム）がＲＡＭ等を作業領域として実行されることにより実現される。また、制御部１５Ａは、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現されてもよい。

　図１４に示すように、制御部１５Ａは、取得部１５１Ａと、学習部１５２と、演算部１５３と、予測部１５４と、生成部１５５と、送信部１５６Ａとを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１５Ａの内部構成は、図１４に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

　取得部１５１Ａは、取得部１５１と同様に各種情報を取得する。取得部１５１Ａは、端末装置１０から各種情報を取得する。取得部１５１Ａは、端末装置１０からユーザの操作情報を取得する。取得部１５１Ａは、記憶部１４から各種情報を取得する。

　送信部１５６Ａは、送信部１５６と同様に各種情報の提供を行う。送信部１５６Ａは、端末装置１０に各種情報を提供する。送信部１５６Ａは、端末装置１０へ各種情報を送信する。送信部１５６Ａは、生成部１５５により生成された情報を端末装置１０に提供する。送信部１５６Ａは、端末装置１０に表示させる情報を端末装置１０に送信する。

［２－２．その他の構成例］
　また、上述した各実施形態や変形例に係る処理は、上記実施形態や変形例以外にも種々の異なる形態（変形例）にて実施されてよい。例えば、モデルを学習する装置（学習装置）と、モデルを用いて精度を測定する装置（測定装置）と、モデルの精度を予測する装置（予測装置）と、精度情報を生成する装置（生成装置）とは別体であってもよいし、一体であってもよい。例えば、モデルを用いて精度を測定する装置（測定装置）と、モデルの精度を予測する装置（予測装置）と、精度情報を生成する装置（生成装置）とは一体であってもよい。この場合、情報処理システムは、測定処理、予測処理、及び生成処理を行う情報処理装置と、学習処理を行う学習装置とを含んでもよい。なお、上記は一例であり、情報処理システムは種々の構成により実現されてもよい。

［２－３．その他］
　また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

　また、上述してきた各実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

　また、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

［３．本開示に係る効果］
　上述のように、本開示に係るバイアス調整装置（実施形態では情報処理装置１００、１００Ａ）は、学習用データを用いた機械学習による識別モデルに関するバイアス調整装置であり、演算部（実施形態では演算部１５３）と、予測部（実施形態では予測部１５４）と、制御部（実施形態では生成部１５５）とを備える。演算部は、第１の学習用データで学習された識別モデルの第１の識別精度と、第１の学習用データに対してデータ数を調整された第２の学習用データで学習された識別モデルの第２の識別精度を算出する。予測部は、第１の識別精度と第２の識別精度に基づいて、学習用データの数に対する識別精度の変化を予測する。制御部は、予測された識別精度の変化に基づいて、当該予測された識別精度の変化が所定の目標値となるように学習に用いるデータ数を調整する、又は、識別モデルを変更する。

　これにより、本開示に係るバイアス調整装置は、学習用データを調整して学習した識別モデルの第１の識別精度と第２の識別精度に基づいて、学習用データの数に対する識別精度の変化を予測し、予測された識別精度の変化に基づいて、学習に用いるデータ数を調整する、又は、識別モデルを変更することで、バイアスの影響が抑制されたモデルを生成することが可能となる。したがって、バイアス調整装置は、データが調整された学習によるモデルを用いることでモデルの学習に関連する処理を適切に実行可能にすることができる。

　また、バイアス調整装置は、表示部（実施形態では表示部１３）を有する。表示部は、予測された識別精度の変化をグラフ、又は、テキストで表示する。これにより、バイアス調整装置は、予測された識別精度の変化を種々の態様により表示することで、適切な情報提供を行うことができる。したがって、バイアス調整装置は、データが調整された学習によるモデルを用いることでモデルの学習に関連する処理を適切に実行可能にすることができる。

　また、学習用データは、少なくとも、人種、性別、住所、収入、又は、学歴に関するデータである。これにより、バイアス調整装置は、人種、性別、住所、収入、又は、学歴に関連するバイアスを適切に予測することができる。

　上述のように、本開示に係る情報処理装置（実施形態では情報処理装置１００、１００Ａ）は、取得部（実施形態では取得部１５１）と、生成部（実施形態では生成部１５５）とを備える。取得部は、機械学習によるモデルの学習に用いる学習用データを取得する。生成部は、学習用データにより学習されるモデルである第１モデルの第１精度と、データ数を調整する対象に応じて学習用データのデータ数が調整された調整後データにより学習されるモデルである第２モデルの第２精度とに基づいて、モデルの精度を示す精度情報を生成する。

　これにより、本開示に係る情報処理装置は、第１モデルの第１精度と、第２モデルの第２精度との２つの精度を用いてモデルの精度を示す精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。したがって、情報処理装置は、データが調整された学習によるモデルを用いることでモデルの学習に関連する処理を適切に実行可能にすることができる。

　また、生成部は、学習用データからデータ数が減らされた調整後データにより学習される第２モデルに基づいて、精度情報を生成する。これにより、情報処理装置は、学習用データからデータ数が減らした場合に精度がどのなるかを示す精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、第１精度と、第２精度とに基づいて、対象に応じたデータ数の調整によるモデルの精度変化を示す精度情報を生成する。これにより、情報処理装置は、対象に応じたデータ数の調整によるモデルの精度変化を示す精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、評価用データを用いて測定される第１モデルの第１精度と、評価用データを用いて測定される第２モデルの第２精度とに基づいて、精度情報を生成する。これにより、情報処理装置は、評価用データを用いて測定した精度を用いて精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、第１精度と、第２精度とに基づいて、対象に応じてデータ数を調整した場合のモデルの精度変化の予測を示す精度情報を生成する。これにより、情報処理装置は、対象に応じてデータ数を調整した場合のモデルの精度変化の予測を示す精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、学習用データのデータ数を増やした場合のモデルの精度変化の予測を示す精度情報を生成する。これにより、情報処理装置は、学習用データのデータ数を増やした場合のモデルの精度変化の予測を示す精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、学習用データのデータ数を増やした場合のモデルの精度の予測線を含む精度情報を生成する。これにより、情報処理装置は、学習用データのデータ数を増やした場合のモデルの精度の予測線を含む精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、対象に関する区分を示すカテゴリに応じて学習用データのデータ数が調整された調整後データにより学習される第２モデルの第２精度に基づいて、カテゴリに関する精度情報を生成する。これにより、情報処理装置は、カテゴリに関する精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、対象の複数のカテゴリのうち、一のカテゴリに応じて学習用データのデータ数が調整された調整後データにより学習される第２モデルの第２精度に基づいて、一のカテゴリに対するモデルの精度を示すモデルの精度情報を生成する。これにより、情報処理装置は、対象の複数のカテゴリのうち一のカテゴリに対するモデルの精度を示すモデルの精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、学習用データのうち、一のカテゴリに対応するデータ数が調整された調整後データにより学習される第２モデルの第２精度に基づいて、精度情報を生成する。これにより、情報処理装置は、学習用データのうち、一のカテゴリに対応するデータ数が調整して精度を測定し、精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、取得部は、複数のカテゴリの各々に対応するデータを含む学習用データを取得する。生成部は、学習用データのうち、一のカテゴリに対応するデータ数が減らされた調整後データにより学習される第２モデルの第２精度に基づいて、精度情報を生成する。これにより、情報処理装置は、学習用データのうち、一のカテゴリに対応するデータ数が減らして精度を測定し、精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、一のカテゴリに対する第１モデルの第１精度と、一のカテゴリに対する第２モデルの第２精度とに基づいて、精度情報を生成する。これにより、情報処理装置は、学習用データのうち、一のカテゴリに対する第１モデルの第１精度と、一のカテゴリに対する第２モデルの第２精度とを用いて、一のカテゴリの精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、一のカテゴリに対応する評価用データを用いて測定される第１モデルの第１精度と、一のカテゴリに対応する評価用データを用いて測定される第２モデルの第２精度とに基づいて、精度情報を生成する。これにより、情報処理装置は、一のカテゴリに対応する評価用データを用いて測定した精度を用いて精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、複数のカテゴリごとに学習用データのデータ数が調整された複数の調整後データの各々により学習される複数の第２モデルの複数の第２精度に基づいて、複数のカテゴリの各々に対するモデルの精度を示す精度情報を生成する。これにより、情報処理装置は、複数のカテゴリの各々に対するモデルの精度を示す精度情報を生成することで、カテゴリ間での比較が可能となるため、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、複数のカテゴリの各々に対応する第１モデルの複数の第１精度と、複数のカテゴリの各々に対応する複数の第２モデルの複数の第２精度とに基づいて、精度情報を生成する。これにより、情報処理装置は、複数のカテゴリの各々の第１精度と第２精度とを用いて、各カテゴリの精度情報を生成することで、カテゴリ間での比較が可能となるため、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、複数のカテゴリの各々に対応する評価用データを用いて測定される第１モデルの複数の第１精度と、複数のカテゴリの各々に対応する複数の第２精度とに基づいて、精度情報を生成する。これにより、情報処理装置は、複数のカテゴリの各々に対応する評価用データを用いて測定した精度を用いて精度情報を生成することで、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、生成部は、複数のカテゴリの各々に対応する複数の第１精度と、複数のカテゴリの各々に対応する複数の第２精度とに基づいて、モデルの精度に関する複数のカテゴリ間の関係を示す精度情報を生成する。これにより、情報処理装置は、モデルの精度に関する複数のカテゴリ間の関係を示す精度情報を生成することで、カテゴリ間でのバイアスやフェアネスがどのような状態であるかを把握可能となるため、データの調整によりモデルの精度に関する情報を適切に生成することができる。

　また、情報処理装置は、表示部（実施形態では表示部１３）を有する。表示部は、精度情報を表示する。これにより、情報処理装置は、モデルの精度に関する適切な情報提供を行うことができる。

［４．ハードウェア構成］
　上述してきた各実施形態に係る情報処理装置１００、１００Ａ等の情報機器は、例えば図１５に示すような構成のコンピュータ１０００によって実現される。図１５は、情報処理装置１００、１００Ａ等の情報処理装置の機能を実現するコンピュータ１０００の一例を示すハードウェア構成図である。以下、実施形態に係る情報処理装置１００を例に挙げて説明する。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read　Only　Memory）１３００、ＨＤＤ（Hard　Disk　Drive）１４００、通信インターフェイス１５００、及び入出力インターフェイス１６００を有する。コンピュータ１０００の各部は、バス１０５０によって接続される。

　ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムをＲＡＭ１２００に展開し、各種プログラムに対応した処理を実行する。

　ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

　ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、ＨＤＤ１４００は、プログラムデータ１４５０の一例である本開示に係る情報処理プログラムを記録する記録媒体である。

　通信インターフェイス１５００は、コンピュータ１０００が外部ネットワーク１５５０（例えばインターネット）と接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、通信インターフェイス１５００を介して、他の機器からデータを受信したり、ＣＰＵ１１００が生成したデータを他の機器へ送信したりする。

　入出力インターフェイス１６００は、入出力デバイス１６５０とコンピュータ１０００とを接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェイス１６００は、所定の記録媒体（メディア）に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばＤＶＤ（Digital　Versatile　Disc）、ＰＤ（Phase　change　rewritable　Disk）等の光学記録媒体、ＭＯ（Magneto-Optical　disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

　例えば、コンピュータ１０００が実施形態に係る情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされた情報処理プログラムを実行することにより、制御部１５等の機能を実現する。また、ＨＤＤ１４００には、本開示に係る情報処理プログラムや、記憶部１４内のデータが格納される。なお、ＣＰＵ１１００は、プログラムデータ１４５０をＨＤＤ１４００から読み取って実行するが、他の例として、外部ネットワーク１５５０を介して、他の装置からこれらのプログラムを取得してもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　学習用データを用いた機械学習による識別モデルに関するバイアス調整装置において、
　第１の学習用データで学習された前記識別モデルの第１の識別精度と、前記第１の学習用データに対してデータ数を調整された第２の学習用データで学習された前記識別モデルの第２の識別精度を算出する演算部と、
　前記第１の識別精度と前記第２の識別精度に基づいて、前記学習用データの数に対する識別精度の変化を予測する予測部と、
　前記予測された識別精度の変化に基づいて、当該予測された識別精度の変化が所定の目標値となるように前記学習に用いるデータ数を調整する、又は、前記識別モデルを変更する制御部と、
　を備えるバイアス調整装置。
（２）
　前記予測された識別精度の変化をグラフ、又は、テキストで表示する表示部、
　を備える前記（１）に記載のバイアス調整装置。
（３）
　前記学習用データは、少なくとも、人種、性別、住所、収入、又は、学歴に関するデータである前記（１）または（２）に記載のバイアス調整装置。
（４）
　機械学習によるモデルの学習に用いる学習用データを取得する取得部と、
　前記学習用データにより学習される前記モデルである第１モデルの第１精度と、データ数を調整する対象に応じて前記学習用データのデータ数が調整された調整後データにより学習される前記モデルである第２モデルの第２精度とに基づいて、前記モデルの精度を示す精度情報を生成する生成部と、
　を備える情報処理装置。
（５）
　前記生成部は、
　前記学習用データからデータ数が減らされた前記調整後データにより学習される前記第２モデルに基づいて、前記精度情報を生成する
　前記（４）に記載の情報処理装置。
（６）
　前記生成部は、
　前記第１精度と、前記第２精度とに基づいて、前記対象に応じたデータ数の調整による前記モデルの精度変化を示す前記精度情報を生成する
　前記（４）または（５）に記載の情報処理装置。
（７）
　前記生成部は、
　評価用データを用いて測定される前記第１モデルの前記第１精度と、前記評価用データを用いて測定される前記第２モデルの前記第２精度とに基づいて、前記精度情報を生成する
　前記（４）～（６）のいずれか１項に記載の情報処理装置。
（８）
　前記生成部は、
　前記第１精度と、前記第２精度とに基づいて、前記対象に応じてデータ数を調整した場合の前記モデルの精度変化の予測を示す前記精度情報を生成する
　前記（４）～（７）のいずれか１項に記載の情報処理装置。
（９）
　前記生成部は、
　前記学習用データのデータ数を増やした場合の前記モデルの精度変化の予測を示す前記精度情報を生成する
　前記（４）～（８）のいずれか１項に記載の情報処理装置。
（１０）
　前記生成部は、
　前記学習用データのデータ数を増やした場合の前記モデルの精度の予測線を含む前記精度情報を生成する
　前記（４）～（９）のいずれか１項に記載の情報処理装置。
（１１）
　前記生成部は、
　前記対象に関する区分を示すカテゴリに応じて前記学習用データのデータ数が調整された前記調整後データにより学習される前記第２モデルの前記第２精度に基づいて、前記カテゴリに関する前記精度情報を生成する
　前記（４）～（１０）のいずれか１項に記載の情報処理装置。
（１２）
　前記生成部は、
　前記対象の複数のカテゴリのうち、一のカテゴリに応じて前記学習用データのデータ数が調整された前記調整後データにより学習される前記第２モデルの前記第２精度に基づいて、前記一のカテゴリに対する前記モデルの精度を示す前記モデルの前記精度情報を生成する
　前記（１１）に記載の情報処理装置。
（１３）
　前記生成部は、
　前記学習用データのうち、前記一のカテゴリに対応するデータ数が調整された前記調整後データにより学習される前記第２モデルの前記第２精度に基づいて、前記精度情報を生成する
　前記（１２）に記載の情報処理装置。
（１４）
　前記取得部は、
　前記複数のカテゴリの各々に対応するデータを含む前記学習用データを取得し、
　前記生成部は、
　前記学習用データのうち、前記一のカテゴリに対応するデータ数が減らされた前記調整後データにより学習される前記第２モデルの前記第２精度に基づいて、前記精度情報を生成する
　前記（１２）または（１３）に記載の情報処理装置。
（１５）
　前記生成部は、
　前記一のカテゴリに対する前記第１モデルの前記第１精度と、前記一のカテゴリに対する前記第２モデルの前記第２精度とに基づいて、前記精度情報を生成する
　前記（１２）～（１４）のいずれか１項に記載の情報処理装置。
（１６）
　前記生成部は、
　前記一のカテゴリに対応する評価用データを用いて測定される前記第１モデルの前記第１精度と、前記一のカテゴリに対応する評価用データを用いて測定される前記第２モデルの前記第２精度とに基づいて、前記精度情報を生成する
　前記（１５）に記載の情報処理装置。
（１７）
　前記生成部は、
　前記複数のカテゴリごとに前記学習用データのデータ数が調整された複数の調整後データの各々により学習される複数の第２モデルの複数の第２精度に基づいて、前記複数のカテゴリの各々に対する前記モデルの精度を示す前記精度情報を生成する
　前記（１２）～（１６）のいずれか１項に記載の情報処理装置。
（１８）
　前記生成部は、
　前記複数のカテゴリの各々に対応する前記第１モデルの複数の第１精度と、前記複数のカテゴリの各々に対応する前記複数の第２モデルの前記複数の第２精度とに基づいて、前記精度情報を生成する
　前記（１７）に記載の情報処理装置。
（１９）
　前記生成部は、
　前記複数のカテゴリの各々に対応する評価用データを用いて測定される前記第１モデルの前記複数の第１精度と、前記複数のカテゴリの各々に対応する前記複数の第２精度とに基づいて、前記精度情報を生成する
　前記（１８）に記載の情報処理装置。
（２０）
　前記生成部は、
　前記複数のカテゴリの各々に対応する前記複数の第１精度と、前記複数のカテゴリの各々に対応する前記複数の第２精度とに基づいて、前記モデルの精度に関する前記複数のカテゴリ間の関係を示す前記精度情報を生成する
　前記（１８）または（１９）に記載の情報処理装置。
（２１）
　前記生成部は、
　前記複数のカテゴリにおける前記モデルの精度の偏りを示す前記精度情報を生成する
　前記（２０）に記載の情報処理装置。
（２２）
　前記生成部は、
　前記複数のカテゴリの各々の前記モデルの精度改善の難度を示す前記精度情報を生成する
　前記（２０）または（２１）に記載の情報処理装置。
（２３）
　前記モデルを学習する学習部、
　を備える
　前記（４）～（２２）のいずれか１項に記載の情報処理装置。
（２４）
　前記精度情報を表示する表示部、
　を備える
　前記（４）～（２３）のいずれか１項に記載の情報処理装置。
（２５）
　前記表示部は、
　前記精度情報を文字として表示する
　前記（２４）に記載の情報処理装置。
（２６）
　前記表示部は、
　前記精度情報を数値として表示する
　前記（２４）または（２５）に記載の情報処理装置。
（２７）
　前記表示部は、
　前記精度情報を図として表示する
　前記（２４）～（２６）のいずれか１項に記載の情報処理装置。
（２８）
　前記表示部は、
　前記精度情報をグラフとして表示する
　前記（２４）～（２７）のいずれか１項に記載の情報処理装置。
（２９）
　前記表示部は、
　第１軸を精度とし、第２軸をデータ数とする前記グラフを表示する
　前記（２８）に記載の情報処理装置。
（３０）　
前記取得部は、
　前記モデルの精度の目標を示す目標精度を取得し、
　前記表示部は、
　前記モデルの精度と前記目標精度との関係を示す情報を表示する
　前記（２４）～（２９）のいずれか１項に記載の情報処理装置。
（３１）
　前記表示部は、
　前記モデルの精度におけるデータ数と、前記目標精度におけるデータ数との関係を示す情報を表示する
　前記（３０）に記載の情報処理装置。
（３２）
　ユーザによる前記目標精度の入力を受け付ける入力部、
　を備え、
　前記取得部は、
　前記入力部により受け付けられた前記目標精度を取得する
　前記（３０）または（３１）に記載の情報処理装置。
（３３）
　前記生成部は、
　複数の指標に対応する前記モデルの複数の精度を示す前記精度情報を生成し、
　前記表示部は、
　前記複数の精度を切り替え可能に表示する
　前記（２４）～（３２）のいずれか１項に記載の情報処理装置。
（３４）
　前記表示部は、
　前記複数の精度のうち、一の精度を表示する
　前記（３３）に記載の情報処理装置。
（３５）
　前記取得部は、
　前記一の精度を指定する指定情報を取得する
　前記（３４）に記載の情報処理装置。
（３６）
　前記表示部は、
　ユーザにより指定された前記一の精度を表示する
　前記（３４）または（３５）に記載の情報処理装置。
（３７）
　機械学習によるモデルの学習に用いる学習用データを取得し、
　前記学習用データにより学習される前記モデルである第１モデルの第１精度と、データ数を調整する対象に応じて前記学習用データのデータ数が調整された調整後データにより学習される前記モデルである第２モデルの第２精度とに基づいて、前記モデルの精度を示す精度情報を生成する、
　処理を実行する情報処理方法。
（３８）
　機械学習によるモデルの学習に用いる学習用データを取得し、
　前記学習用データにより学習される前記モデルである第１モデルの第１精度と、データ数を調整する対象に応じて前記学習用データのデータ数が調整された調整後データにより学習される前記モデルである第２モデルの第２精度とに基づいて、前記モデルの精度を示す精度情報を生成する、
　処理を実行させる情報処理プログラム。

　１００、１００Ａ　情報処理装置（バイアス調整装置）
　１１　通信部
　１２　入力部
　１３　表示部（ディスプレイ）
　１４　記憶部
　１４１　データ情報記憶部
　１４２　モデル情報記憶部
　１４３　精度情報記憶部
　１５、１５Ａ　制御部
　１５１、１５１Ａ　取得部
　１５２　学習部
　１５３　演算部（測定部）
　１５４　予測部
　１５５　生成部（制御部）
　１５６、１５６Ａ　送信部

Claims

　学習用データを用いた機械学習による識別モデルに関するバイアス調整装置において、
　第１の学習用データで学習された前記識別モデルの第１の識別精度と、前記第１の学習用データに対してデータ数を調整された第２の学習用データで学習された前記識別モデルの第２の識別精度を算出する演算部と、
　前記第１の識別精度と前記第２の識別精度に基づいて、前記学習用データの数に対する識別精度の変化を予測する予測部と、
　前記予測された識別精度の変化に基づいて、当該予測された識別精度の変化が所定の目標値となるように前記学習に用いるデータ数を調整する、又は、前記識別モデルを変更する制御部と、
　を備えるバイアス調整装置。
　前記予測された識別精度の変化をグラフ、又は、テキストで表示する表示部、
　を備える請求項１に記載のバイアス調整装置。
　前記学習用データは、少なくとも、人種、性別、住所、収入、又は、学歴に関するデータである請求項１に記載のバイアス調整装置。
　機械学習によるモデルの学習に用いる学習用データを取得する取得部と、
　前記学習用データにより学習される前記モデルである第１モデルの第１精度と、データ数を調整する対象に応じて前記学習用データのデータ数が調整された調整後データにより学習される前記モデルである第２モデルの第２精度とに基づいて、前記モデルの精度を示す精度情報を生成する生成部と、
　を備える情報処理装置。
　前記生成部は、
　前記学習用データからデータ数が減らされた前記調整後データにより学習される前記第２モデルに基づいて、前記精度情報を生成する
　請求項４に記載の情報処理装置。
　前記生成部は、
　前記第１精度と、前記第２精度とに基づいて、前記対象に応じたデータ数の調整による前記モデルの精度変化を示す前記精度情報を生成する
　請求項４に記載の情報処理装置。
　前記生成部は、
　評価用データを用いて測定される前記第１モデルの前記第１精度と、前記評価用データを用いて測定される前記第２モデルの前記第２精度とに基づいて、前記精度情報を生成する
　請求項４に記載の情報処理装置。
　前記生成部は、
　前記第１精度と、前記第２精度とに基づいて、前記対象に応じてデータ数を調整した場合の前記モデルの精度変化の予測を示す前記精度情報を生成する
　請求項４に記載の情報処理装置。
　前記生成部は、
　前記学習用データのデータ数を増やした場合の前記モデルの精度変化の予測を示す前記精度情報を生成する
　請求項４に記載の情報処理装置。
　前記生成部は、
　前記学習用データのデータ数を増やした場合の前記モデルの精度の予測線を含む前記精度情報を生成する
　請求項４に記載の情報処理装置。
　前記生成部は、
　前記対象に関する区分を示すカテゴリに応じて前記学習用データのデータ数が調整された前記調整後データにより学習される前記第２モデルの前記第２精度に基づいて、前記カテゴリに関する前記精度情報を生成する
　請求項４に記載の情報処理装置。
　前記生成部は、
　前記対象の複数のカテゴリのうち、一のカテゴリに応じて前記学習用データのデータ数が調整された前記調整後データにより学習される前記第２モデルの前記第２精度に基づいて、前記一のカテゴリに対する前記モデルの精度を示す前記モデルの前記精度情報を生成する
　請求項１１に記載の情報処理装置。
　前記生成部は、
　前記学習用データのうち、前記一のカテゴリに対応するデータ数が調整された前記調整後データにより学習される前記第２モデルの前記第２精度に基づいて、前記精度情報を生成する
　請求項１２に記載の情報処理装置。
　前記取得部は、
　前記複数のカテゴリの各々に対応するデータを含む前記学習用データを取得し、
　前記生成部は、
　前記学習用データのうち、前記一のカテゴリに対応するデータ数が減らされた前記調整後データにより学習される前記第２モデルの前記第２精度に基づいて、前記精度情報を生成する
　請求項１２に記載の情報処理装置。
　前記生成部は、
　前記一のカテゴリに対する前記第１モデルの前記第１精度と、前記一のカテゴリに対する前記第２モデルの前記第２精度とに基づいて、前記精度情報を生成する
　請求項１２に記載の情報処理装置。
　前記生成部は、
　前記一のカテゴリに対応する評価用データを用いて測定される前記第１モデルの前記第１精度と、前記一のカテゴリに対応する評価用データを用いて測定される前記第２モデルの前記第２精度とに基づいて、前記精度情報を生成する
　請求項１５に記載の情報処理装置。
　前記生成部は、
　前記複数のカテゴリごとに前記学習用データのデータ数が調整された複数の調整後データの各々により学習される複数の第２モデルの複数の第２精度に基づいて、前記複数のカテゴリの各々に対する前記モデルの精度を示す前記精度情報を生成する
　請求項１２に記載の情報処理装置。
　前記精度情報を表示する表示部、
　を備える
　請求項４に記載の情報処理装置。
　機械学習によるモデルの学習に用いる学習用データを取得し、
　前記学習用データにより学習される前記モデルである第１モデルの第１精度と、データ数を調整する対象に応じて前記学習用データのデータ数が調整された調整後データにより学習される前記モデルである第２モデルの第２精度とに基づいて、前記モデルの精度を示す精度情報を生成する、
　処理を実行する情報処理方法。
　機械学習によるモデルの学習に用いる学習用データを取得し、
　前記学習用データにより学習される前記モデルである第１モデルの第１精度と、データ数を調整する対象に応じて前記学習用データのデータ数が調整された調整後データにより学習される前記モデルである第２モデルの第２精度とに基づいて、前記モデルの精度を示す精度情報を生成する、
　処理を実行させる情報処理プログラム。