WO2023002648A1

WO2023002648A1 - 情報処理方法及び情報処理システム

Info

Publication number: WO2023002648A1
Application number: PCT/JP2022/003897
Authority: WO
Inventors: 知伸辻川; 愉希夫大渕; 由幸小林
Original assignee: ソニーグループ株式会社
Priority date: 2021-07-23
Filing date: 2022-02-01
Publication date: 2023-01-26
Also published as: EP4375890A1; CN117730332A

Abstract

機械学習モデルの学習に用いられる学習データの評価結果を提示する。　機械学習モデルの学習に用いられる学習データに関する処理を行う情報処理方法は、学習データに対する前記機械学習モデルの推論結果に基づいて各学習データの特性を決定する決定ステップと、前記決定した特性に基づく学習データの評価結果を提示する提示ステップを有する。前記決定ステップでは、学習データに対して前記機械学習モデルが出力するラベル毎に期待値に基づいて、学習データに対応する物体の質量や大きさ、引力や斥力などの作用力といった物理特性を決定する。

Description

情報処理方法及び情報処理システム

　本明細書で開示する技術（以下、「本開示」とする）は、機械学習モデルの学習に関する処理を行う情報処理方法及び情報処理システムに関する。

　人工知能は、膨大なデータを分析したり推定したりすることができ、例えば画像認識や音声認識、自然言語処理に活用される。人工知能は、ニューラルネットワークなどで構成される機械学習モデルに学習を行うことで実現される。膨大量の学習用のデータセットを用いてディープラーニングを行うことによって、人間の能力を超える推論を実現する人工知能を得ることができる。しかしながら、人工知能が推論結果に至った過程がブラックボックス化されて、その判断の根拠が分かり難いという問題がある。また、学習データに偏りがあるなど、不公平性な学習データを用いて学習を行うと、機械学習モデルの学習効率が低下することや、正しく推論するように機械学習モデルを学習できないことが懸念される。

　最近では、ディープラーニングした機械学習モデルの判断根拠を可視化する技術として、Ｇｒａｄ－ＣＡＭ（Ｇｒａｄｉｅｎｔ－ｗｅｉｇｈｔｅｄ　Ｃｌａｓｓ　Ａｃｔｉｖａｔｉｏｎ　Ｍａｐｐｉｎｇ）などが開発されている。例えば、画像認識処理において、誤ったラベルが推論された際の入力画像である誤推論画像を、推論の正解ラベルのスコアが最大となるように変更しながら、リファイン画像を生成する際に、Ｇｒａｄ－ＣＡＭ法を用いることで推論の際に注目した誤推論画像の各画像部分の注目度合いを示すマップを生成するように記述された解析プログラムが提案されている（特許文献１を参照のこと）。また、モデルに対する各学習データの正解回数を蓄積し、正解回数が閾値以上となった学習データを学習対象から除外することによって、学習処理に要する計算量を削減する学習装置が提案されている（特許文献２を参照のこと）。

特開２０２０－１９７８７５号公報特開２０１８－１９４９１９号公報

Ｇｒａｄ－ＣＡＭ：　Ｖｉｓｕａｌ　Ｅｘｐｌａｎａｔｉｏｎｓ　ｆｒｏｍ　Ｄｅｅｐ　Ｎｅｔｗｏｒｋｓ　ｖｉａ　Ｇｒａｄｉｅｎｔ－ｂａｓｅｄ　Ｌｏｃａｌｉｚａｔｉｏｎ　＜ｈｔｔｐｓ：／／ａｒｘｉｖ．ｏｒｇ／ａｂｓ／１６１０．０２３９１＞ "Ｗｈｙ　Ｓｈｏｕｌｄ　Ｉ　Ｔｒｕｓｔ　Ｙｏｕ？"：　Ｅｘｐｌａｉｎｉｎｇ　ｔｈｅ　Ｐｒｅｄｉｃｔｉｏｎｓ　ｏｆ　Ａｎｙ　Ｃｌａｓｓｉｆｉｅｒ　＜ｈｔｔｐｓ：／／ａｒｘｉｖ．ｏｒｇ／ａｂｓ／１６０２．０４９３８＞Ｉｎｔｅｒｐｒｅｔａｂｉｌｉｔｙ　Ｂｅｙｏｎｄ　Ｆｅａｔｕｒｅ　Ａｔｔｒｉｂｕｔｉｏｎ：　Ｑｕａｎｔｉｔａｔｉｖｅ　Ｔｅｓｔｉｎｇ　ｗｉｔｈ　Ｃｏｎｃｅｐｔ　Ａｃｔｉｖａｔｉｏｎ　Ｖｅｃｔｏｒｓ　（ＴＣＡＶ）　＜ｈｔｔｐｓ：／／ａｒｘｉｖ．ｏｒｇ／ｐｄｆ／１７１１．１１２７９．ｐｄｆ＞

　本開示の目的は、機械学習モデルの学習に用いられる学習データに関する処理を行う情報処理方法及び情報処理システムを提供することにある。

　本開示は、上記課題を参酌してなされたものであり、その第１の側面は、機械学習モデルの学習に用いられる学習データに関する処理を行う情報処理方法であって、
　学習データに対する前記機械学習モデルの推論結果に基づいて各学習データの特性を決定する決定ステップと、
　前記決定した特性に基づく学習データの評価結果を提示する提示ステップと、
を有する情報処理方法である。

　前記決定ステップでは、学習データに対して前記機械学習モデルが出力するラベル毎の期待値に基づいて、各学習データに対応する物体の物理特性を決定するとともに、決定された物理特性をそれぞれ持つ物体間の物理シミュレーション演算を実施する。具体的には、前記決定ステップでは、正解ラベルの期待値の大小に基づいて学習データに対応する物体の質量を決定し、期待値が高いラベル又は期待値が低いラベルの一致不一致に基づいて各学習データに対応する物体間に作用する引力や斥力を決定し、これらの物理特性に基づいて物理シミュレーション演算により各物体の動き情報を算出する。そして、前記提示ステップでは、前記決定ステップで算出された動き情報に基づいて、表示装置の画面上に表示された各物体を動かす。

　第１の側面に係る情報処理方法は、前記表示装置に画面上に表示された物体に対するユーザの操作を入力する入力ステップをさらに有していてもよい。ユーザは、前記入力ステップにおいて前記画面上で削除する操作が行われた物体に対応する学習データを、前記機械学習モデルの学習対象から除外することができる。このようにして、ユーザ毎のカスタムのデータセットを作成することができる。

　また、本開示の第２の側面は、機械学習モデルの学習に用いられる学習データに関する処理を行う情報処理システムであって、
　学習データに対する前記機械学習モデルの推論結果に基づいて各学習データの特性を決定する決定部と、
　前記決定した特性に基づく学習データの評価結果を提示する提示部と、
を含む情報処理システムである。

　但し、ここで言う「システム」とは、複数の装置（又は特定の機能を実現する機能モジュール）が論理的に集合した物のことを言い、各装置や機能モジュールが単一の筐体内にあるか否かは特に問わない。すなわち、複数の部品又は機能モジュールからなる１つの装置も、複数の装置の集合体も、「システム」に相当する。

　前記決定部は、学習データに対して前記機械学習モデルが出力するラベル毎の期待値に基づいて、各学習データに対応する物体の物理特性を決定するとともに、決定された物理特性をそれぞれ持つ物体間の物理シミュレーション演算を実施して、各物体の動き情報を算出する。そして、前記提示部は、前記決定ステップで算出された動き情報に基づいて、表示装置の画面上に表示された各物体を動かす。

　第２の側面に係る情報処理システムは、１又は複数の装置で構成される。例えば、情報処理装置は、前記決定部を含む第１の装置と、前記提示部を含む第２の装置を含む。前記第２の装置は、前記決定した特性に基づく学習データの評価結果を画面に表示する表示装置と、前記画面に対するユーザの操作を入力する入力部を含んでもよい。また、情報処理システムは、学習データを用いた学習により前記機械学習モデルを更新するモデル更新部を含む第３の装置をさらに含んでもよい。

　本開示によれば、機械学習モデルの学習に用いられる学習データの評価結果を提示するための処理を行う情報処理方法及び情報処理システムを提供することができる。

　なお、本明細書に記載された効果は、あくまでも例示であり、本開示によりもたらされる効果はこれに限定されるものではない。また、本開示が、上記の効果以外に、さらに付加的な効果を奏する場合もある。

　本開示のさらに他の目的、特徴や利点は、後述する実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。

図１は、学習システム１００の機能的構成例を示した図である。図２は、機械学習モデル２００の構成例を示した図である。図３は、機械学習モデル２００の学習回数（エポック数）に応じた推論結果の推移を例示した図である。図４は、図３に例示した学習データに対する推論結果に対して決定された物理特性を示した図である。図５は、各学習データに対応する物体からなる力学モデルを例示した図である。図６は、機械学習モデルの学習に使用した学習データの評価結果を表示するＧＵＩ画面の構成例を示した図である。図７は、図６に示したＧＵＩ画面上でＧＵＩ操作が行われる様子を示した図である。図８は、図６に示したＧＵＩ画面上でＧＵＩ操作が行われる様子を示した図である。図９は、機械学習モデルの学習中に、ＧＵＩ画面上で学習データの評価結果が変化する様子を示した図である。図１０は、Ｇｒａｄ－ＣＡＭアルゴリズムに基づいて計算したヒートマップ表示付き判断根拠画像の例を示した図である。図１１は、Ｇｒａｄ－ＣＡＭアルゴリズムに基づいて計算したヒートマップ表示付き判断根拠画像の他の例を示した図である。図１２は、学習データの詳細情報を表示するＧＵＩ操作の一例を示した図である。図１３は、学習データの詳細情報を表示するＧＵＩ操作の一例を示した図である。図１４は、学習データ評価部１２０において実施される処理手順を示したフローチャートである。図１５は、情報処理システム１５００のハードウェア構成例を示した図である。

　以下、図面を参照しながら本開示について、以下の順に従って説明する。

Ａ．概要
Ｂ．システム構成
Ｃ．学習データの評価
　Ｃ－１．学習データに対する物理特性の決定
　Ｃ－２．学習データに対する評価結果の提示
　Ｃ－３．機械学習モデルによる推論の判断の根拠の明示
　Ｃ－４．詳細情報の提示方法ついて
　Ｃ－５．処理手順
Ｄ．システム構成

Ａ．概要
　人工知能は、例えばニューラルネットワークやサポートベクタ回帰、ガウス過程回帰などの型を用いたモデルからなる。本明細書では、便宜上、ニューラルネットワーク型のモデルを利用した実施形態を中心に説明するが、本開示は特定のモデル型に限定されず、ニューラルネットワーク以外のモデルに対しても同様に適用可能である。人工知能の利用は、モデルの学習を行う「学習フェーズ」と学習済みのモデルを使って推論を行う「推論フェーズ」からなる。推論は、画像認識や音声認識などの認識処理や、事象の推定や予測を行う予測処理を含む。以下では主に画像分類などの分類問題に人工知能を適用する実施例について説明する。

　人工知能の学習フェーズでは、モデルに入力されるデータ（以下、「入力データ」とも言う）と、入力データに対してモデルに推定させたいラベルとの組み合わせからなるデータセットを用いて、各入力データに対応する正解のラベルを出力できるように、誤差逆伝播などの学習アルゴリズムによってモデルの学習が行われる。そして、人工知能の推論フェーズでは、学習フェーズにおいて学習済みのモデル（以下、「学習済みモデル」とも言う）は、入力データに対して適切なラベルを出力する。

　学習中のモデルに与える影響が大きい学習データを用いることで、より効率的にモデルの学習を行うことができると考えられる。そこで、本開示では、モデルの学習中に学習データを評価し、且つ評価結果をユーザに提示する方法及びシステムについて提案する。ここで言うユーザは、具体的には機械学習モデルの開発者である。本開示では、学習データの評価として、個々の学習データのランク付けを計算したり、学習データ間の関係を評価したりし、さらにこのような評価結果をコンピュータのＧＵＩ（Ｇｒａｐｈｉｃａｌ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）画面を利用してユーザに提示する。したがって、ユーザは、ＧＵＩ画面を通じて、学習中の機械学習モデルに使用する学習データに課題があることを把握したり、問題のある学習データを取捨選択したりすることができ、学習のやり直しによる時間ロスを少なくすることができる。すなわち、ユーザは、学習データが与える影響を視覚的に確認しながら、機械学習モデルの学習を進めることができる。

Ｂ．システム構成
　図１には、本開示を適用した学習システム１００の機能的構成例を示している。図示の学習システム１００は、例えばエッジデバイスに搭載して用いられるが、学習システム１００の機能の一部又は全部がクラウド又は大規模演算が可能な演算装置上に構築されてもよい。以下では、学習システム１００は、物体認識や顔認識など、主に画像分類を行う機械学習モデルの学習を行うものとして説明する。但し、本開示はこれに限定されるものではなく、学習システム１００は画像分類以外の推論を行う機械学習モデルの学習を行うものであっても構わない。

　図示の学習システム１００は、学習データ保持部１０１と、モデル更新部１０２と、モデルパラメータ保持部１０３と、推論部１１１と、データ入力部１１２と、入力データ処理部１１３を備えている。このうち、学習データ保持部１０１と、モデル更新部１０２と、モデルパラメータ保持部１０３は機械学習モデルの学習フェーズにおいて動作し、推論部１１１と、データ入力部１１２と、入力データ処理部１１３は学習済みモデルを用いた推論フェーズにおいて動作する。学習システム１００は、例えばエッジデバイスに搭載して用いられるが、学習システム１００の機能の一部又は全部がクラウド又は大規模演算が可能な演算装置上に構築されてもよい。

　また、本実施形態では、学習システム１００には、機械学習モデルの学習に使用する学習データを提供する学習データ提供部１３０と、モデル更新部１０２において機械学習モデルの学習に使用した学習データを評価する学習データ評価部１２０がさらに装備されている。学習データ評価部１２０は、物理シミュレーション演算部１２１と、評価結果提示部１２２と、判断根拠計算部１２３を含んでいる。学習データ評価部１２０は、学習システム１００と同一のシステムであってもよいし、学習システム１００とは独立して構成されたシステムであってもよい。学習データ評価部１２０を実現するシステムは、例えばエッジデバイスに搭載して用いられるが、このシステムの機能の一部又は全部がクラウド又は大規模演算が可能な演算装置上に構築されてもよい。

　学習データ提供部１３０は、モデル更新部１０２がモデルの学習に使用する学習データを供給する。学習データは、基本的に、学習対象となるモデルに入力する入力データｘと、入力データｘに対して正解となる正解ラベルｙを組み合わせたデータセット（ｘ，ｙ）からなる。例えば、モデル更新部１０２が画像分類用の機械学習モデルの学習を行う場合、学習データ提供部１３０は例えばデジタルカメラであれば、撮像した画像と正解ラベル（撮像画像の被写体が何であるか）の組み合わせからなる学習データを提供する。例えば多数のデジタルカメラでそれぞれ撮像された画像からなる学習データが、インターネットなどの広域ネットワークを介して学習システム１００に提供される。

　学習データ保持部１０１は、モデル更新部１０２がモデルの学習に使用する学習データを蓄積している。個々の学習データは、学習対象となるモデルに入力する入力データと、そのモデルが推論すべき正解のラベルを組み合わせたデータセットからなる。学習データ保持部１０１は、学習データ提供部１３０から提供されたデータセットを蓄積するが、その他のソースから得られたデータセットを蓄積していてもよい。モデル更新部１０２がディープラーニングを行う場合には、学習データ保持部１０１には厖大量のデータセットが蓄積される。

　後述するように本実施形態では、ユーザの判断でカスタムのデータセットを生成することができる。このため、学習データ保持部１０１は、ユーザ毎にカスタマイズされたデータセットを例えばユーザ毎の識別情報と紐付けして、学習データ提供部１３０から提供され又はその他のソースから取得した一般的なデータセットとは区別して保持するようにしてもよい。

　モデル更新部１０２は、学習データ保持部１０１から学習データを逐次読み出して、学習の対象となる機械学習モデルの学習を行って、機械学習モデルを更新する。機械学習モデルは、例えばニューラルネットワークで構成されるが、サポートベクタ回帰、ガウス過程回帰などの型を用いたモデルであってもよい。ニューラルネットワークで構成される機械学習モデルは、画像などのデータ（説明変数）を入力する入力層と、入力データに対する推論結果となるラベル（目的変数）を出力する出力層と、入力層と出力層の間の１又は複数の中間層（又は隠れ層）の多層で構成される。各層はそれぞれニューロンに相当する複数のノードからなる。層と層の間にあるノード間の結合は重みを持ち、入力層に入力されたデータは、層から層へ渡る過程で値が変換されていく。モデル更新部１０２は、例えば、入力データに対して機械学習モデルから出力されるラベルと、入力データに対応する既知の正解ラベルとの誤差に基づいて定義される損失関数を計算し、この損失関数が最小となるように誤差逆伝播により、モデルパラメータ（ノード間の重み係数など）を更新しながら、機械学習モデルの学習を実施する。なお、機械学習モデルの学習処理は計算量が膨大であることから、複数のＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）又は複数の計算ノードを用いた分散学習を実施するようにしてもよい。

　そして、モデル更新部１０２は、学習結果として得られたモデルパラメータを、モデルパラメータ保持部１０３に格納する。モデルパラメータは、モデルを規定する変動要素であり、例えばニューラルネットワークモデルのノード間に与える結合重み係数などである。

　推論部１１１と、データ入力部１１２と、入力データ処理部１１３は、学習済みのモデルの推論フェーズを実施する。データ入力部１１２は、エッジデバイスが備えるセンサにより取得されるセンサ情報を入力する。入力データ処理部１１３は、データ入力部１１２から入力されたデータを、モデル（例えば、ニューラルネットワークモデル）に入力可能となるデータ形式となるようにデータ処理して、推論部１１１に入力する。推論部１１１は、モデルパラメータ保持部１０３から読み出したモデルパラメータを設定したモデルすなわち学習済みモデルを使って、入力データから推論したラベルを出力する。

　学習データ評価部１２０は、モデル更新部１０２において機械学習モデルの学習に使用した各学習データを評価する。学習データ評価部１２０は、物理シミュレーション演算部１２１と、評価結果提示部１２２を含んでいる。

　物理シミュレーション演算部１２１は、学習中のモデルによる学習データの推論結果に基づいて、各学習データの物理特性を決定する。具体的には、物理シミュレーション演算部１２１は、機械学習モデルによる各学習データの推論結果に基づいて学習データに作用する力を決定する。ここで言う力には、学習データの質量（重力）や浮力、他の学習データとの間に作用する引力又は斥力が含まれる。また、物理シミュレーション演算部１２１は、作用力だけでなく、学習データの大きさ（体積）や形状などの物理量も決定してもよい。そして、物理シミュレーション演算部１２１は、学習中のモデルによる推論結果に応じて決定した各学習データの作用力の大きさなどの物理量に基づいて物理シミュレーション演算を実施して、各学習データの動きを決定する。物理シミュレーション演算の一例はＦＤ（Ｆｏｒｃｅ－Ｄｉｒｅｃｔｅｄ）法である。そして、評価結果提示部１２２は、物理シミュレーション演算に基づいて決定された動き情報に基づいて、各学習データに対応する物体を複数配置して視覚的にランク付けしたＧＵＩ画面を提示する。このＧＵＩ画面上では、ドラッグやドロップを始めとする各学習データに対応する物体に対するＧＵＩ操作が可能である。評価結果提示部１２２は、ＧＵＩ画面を表示する表示装置や、ＧＵＩ画面に対するユーザ操作を行うための入力装置（マウスやタッチパネル、キーボードなど）を含んでいてもよい。

　判断根拠計算部１２３は、モデル更新部１０２において学習中の機械学習モデルによる学習データに対する推論の判断の根拠を計算する。例えば、Ｇｒａｄ－ＣＡＭ（Ｇｒａｄｉｅｎｔ－ｗｅｉｇｈｔｅｄ　Ｃｌａｓｓ　Ａｃｔｉｖａｔｉｏｎ　Ｍａｐｐｉｎｇ）（例えば、非特許文献１を参照のこと）、ＬＩＭＥ（Ｌｏｃａｌ　Ｉｎｔｅｒｐｒｅｔａｂｌｅ　Ｍｏｄｅｌ－ａｇｎｏｓｔｉｃ　Ｅｘｐｌａｎａｔｉｏｎｓ）（例えば、非特許文献２を参照のこと）、ＬＩＭＥの発展形であるＳＨＡＰ（ＳＨａｐｌｅｙ　Ａｄｄｉｔｉｖｅ　ｅｘＰｌａｎａｔｉｏｎｓ）、ＴＣＡＶ（Ｔｅｓｔｉｎｇ　ｗｉｔｈ　Ｃｏｎｃｅｐｔ　Ａｃｔｉｖａｔｉｏｎ　Ｖｅｃｔｏｒｓ）（例えば、非特許文献３を参照のこと）などのうち１又は複数のＸＡＩアルゴリズムを使って、機械学習モデルの推論の判断の根拠を計算する。Ｇｒａｄ－ＣＡＭ、ＬＩＭＥ／ＳＨＡＰ、ＴＣＡＶをそれぞれ用いた根拠計算方法の詳細については後述に譲る。そして、評価結果提示部１２２は、ＧＵＩ画面上での各学習データに対応する物体への操作（例えばマウスオーバーやマウスボタンの押下操作）などに応じて、学習データに対する機械学習モデルの推論の判断の根拠をさらに提示するようにしてもよい。但し、Ｇｒａｄ－ＣＡＭ、ＬＩＭＥ／ＳＨＡＰ、ＴＣＡＶなどのＸＡＩアルゴリズムを用いた機械学習モデルの判断根拠計算は、学習データ評価部１２０ではなく学習システム１００内で実施して、判断根拠の計算結果を学習システム１００から学習データ評価部１２０へ渡すようにしてもよい。

　学習回数に応じて、学習中のモデルによる学習データの推論結果は逐次変化していくことが想定される。したがって、学習の度に、物理シミュレーション演算部１２１は各学習データの物理特性を決定して物理シミュレーション演算を実施し、評価結果提示部１２２はＧＵＩ画面を更新していくものとする。

Ｃ．学習データの評価
　学習データ評価部１２０は、モデル更新部１０２において機械学習モデルの学習に使用した学習データを評価する。本実施形態では、学習データ評価部１２０は、物理シミュレーション演算部１２１と、評価結果提示部１２２を含んでいる。物理シミュレーション演算部１２１は、学習中のモデルによる学習データの推論結果に基づいて各学習データの物理特性を決定し、さらに物理シミュレーション演算により各学習データの２次元平面又は３次元空間上の動き情報を算出する。そして、評価結果提示部１２２は、物理シミュレーション演算に基づいて決定された動き情報に基づいて、各学習データに対応する物体を配置したＧＵＩ画面を提示する。このＣ項では、学習データ評価部１２０において実現される処理について詳細に説明する。

　以下の説明では、モデル更新部１０２では、図２に示すような機械学習モデル２００の学習を行うことを想定している。機械学習モデル２００は、例えばニューラルネットワークで構成され、学習データ保持部１０１から読み出された学習データを用いて機械学習モデル２００の学習を行う。図３に示す例では、機械学習モデル２００が画像分類を行う。すなわち、機械学習モデル２００への入力データは画像であり、機械学習モデル２００は画像に含まれる被写体があらかじめ定義されたラベル１～５のいずれかであるかを推論して、ラベル毎の期待値（又は尤度）を出力する。例えば、ラベル１は馬、ラベル２は猫、ラベル３は犬、ラベル４は牛、ラベル５は鳥である。

　また、機械学習モデル２００は、学習回数（又は、エポック数）に応じて、同じ学習データに対する推論結果が推移していくことが想定される。例えば、学習回数が少なく、学習があまり進んでいない状態では、機械学習モデル２００は正解ラベルに対して低い期待値を出力するとともに不正解ラベルに対して高い閾値を出力するが、学習の進捗状態に応じて、機械学習モデル２００は徐々に正解ラベルに対してより高い期待値を出力するように推移していく。

　図３には、機械学習モデル２００の、同じ学習データに対する学習回数（エポック数）に応じた推論結果の推移を例示している。図３に示す例では、学習データはラベル３を正解とする入力画像についての機械学習モデル２００の推論結果であり、学習回数毎に機械学習モデル２００から出力される各ラベル１～５の期待値を示している（但し、図面の簡素化のため、学習回数Ｅ１、Ｅ２、Ｅ３についてのみ具体的な期待値を記入し、その他の学習回数については詳細を省略している）。

　機械学習モデル２００は、学習が進んでいない学習回数Ｅ１回目では正解のラベル３に対して「０．１」という低い期待値を出力する一方、不正解のラベル１に対して「０．５」という高い期待値を出力する。その後、学習回数がＥ２回、Ｅ３回増加するにつれて機械学習モデル２００の学習が進み、正解のラベル３に対して「０．５」、「０．８」と徐々に高い期待値を出力するようになっていき、不正解のラベル１に対して「０．１」、「０．０」と辞書所に低い期待値を出力するようになっていく。

Ｃ－１．学習データに対する物理特性の決定
　物理シミュレーション演算部１２１は、モデル更新部１０２において学習した機械学習モデルによる学習データの推論結果に基づいて、各学習データの物理特性を決定する。学習回数に応じて同じ学習データに対する推論結果が推移していくことから、物理シミュレーション演算部１２１は、例えば所定個数の学習データを使用してモデルパラメータを更新する度（又は、エポック毎）に、機械学習モデル２００による各学習データの推論結果に基づいて、各学習データの物理特性を決定する。

　物理シミュレーション演算部１２１は、学習データに対して、機械学習モデル２００による推論結果に応じた物理特性を決定する。図３を参照しながら説明したように、機械学習モデル２００による学習データの推論結果は、入力データに対する各ラベルの期待値からなる。そこで、物理シミュレーション演算部１２１は、正解ラベルの期待値に基づいて、学習データに対して質量（重力）や浮力、他の学習データとの間に作用する引力又は斥力、大きさ（体積）や形状などの物理量を決定する。したがって、後段の評価結果提示部１２２では、各学習データを、物理シミュレーション演算部１２１によって決定された物理特性を持つ物体として表現することができるようになる。

　具体的には、物理シミュレーション演算部１２１は、正解ラベルに対する期待値が低い学習データに対して軽い質量や小さなサイズを決定し、正解ラベルに対する期待値が高い学習データに対して重い質量や大きなサイズを決定する。したがって、重い物体は下へ沈もうとし、軽い物体は上に浮かぼうとするという性質を利用して、学習データの推論結果を表現することを期待する。また、学習回数が増えるにつれて正解ラベルの期待値が徐々に増加していく場合には、学習データには最初は軽い質量が決定されるが、その後に重い質量に更新されていく。なお、浮力は物体のサイズに応じて決定されてもよいし、物体のサイズに応じずに正解ラベルに対する期待値のみに基づいて決定されてもよい。

　また、物理シミュレーション演算部１２１は、機械学習モデル２００から高い期待値が出力されたラベルが一致する学習データの間では引力が作用し、同じラベルに対して機械学習モデル２００から低い期待値が出力された学習モデルと逆に高い期待値が出力された学習モデルの間では斥力が作用するように、学習データ間に作用する引力及び斥力を決定する。したがって、同じラベルに対して高い期待値を有する学習データ同士が引力で引き付けられ。同じラベルに対して高い期待値を有する学習データと低い期待値を有する学習データが斥力で離れようとする性質を利用して、学習データの推論結果を表現することを期待する。また、学習回数が増えるにつれて正解ラベルの期待値が徐々に増加していく学習データの場合には、その学習データは、最初は不正解のラベルの学習データと引き寄せ合うが、その後に正解ラベルが同じ学習データと引き寄せ合うようになっていく。

　図４には、図３に示した、ある学習データに対する学習回数（エポック数）に応じた推論結果の推移例に、物理シミュレーション演算部１２１によって決定された物理特性を記入して示している。

　学習が進んでいない学習回数がＥ１回目では、機械学習モデル２００がこの学習データの推論を行い、正解のラベル３に対して「０．１」という低い期待値を出力する。したがって、物理シミュレーション演算部１２１は、この時点では、正解ラベルに対して出力する期待値が低いので、この学習データに対して軽い質量や小さなサイズを決定する。物理シミュレーション演算部１２１は、この学習データに対して大きな浮力が作用することをさらに決定してもよい。また、機械学習モデル２００が不正解のラベル１に対して「０．５」という最も高い期待値を出力したので、物理シミュレーション演算部１２１は、ラベル１に対して高い期待値を持つ他の学習データとこの学習データとの間で作用する引力を決定する。また、機械学習モデル２００がラベル３～５に対して「０．１」という平均値より低い期待値を出力したので、物理シミュレーション演算部１２１は、ラベル３～５に対して逆に高い期待値を持つ他の学習データとこの学習データとの間で作用する斥力を決定する。他方、機械学習モデル２００がラベル２に対して「０．２」という平均的な期待値を出力したので、物理シミュレーション演算部１２１は、ラベル２に対して高い期待値を持つ他の学習データとこの学習データとの間では引力も斥力も作用しないと決定する。

　学習の進捗が中程度の学習回数がＥ２回目では、機械学習モデル２００がこの学習データの推論を行い、正解のラベル３に対して「０．５」という中間的な期待値を出力する。したがって、物理シミュレーション演算部１２１は、この時点では、正解ラベルに対して出力する期待値が十分高くはないので、この学習データに対して中間的な質量やサイズを決定する。物理シミュレーション演算部１２１は、この学習データに作用する浮力を低くしてもよい。また、機械学習モデル２００が正解のラベル３に対して「０．５」という最も高い期待値を出力したので、物理シミュレーション演算部１２１は、ラベル３に対して高い期待値を持つ他の学習データとこの学習データとの間で作用する引力を決定する。また、機械学習モデル２００が不正解のラベル１及びラベル４に対しそれぞれ「０．１」、不正解のラベル５に対して「０．０」という平均値よりも低い期待値を出力したので、物理シミュレーション演算部１２１は、各ラベル１、４、５に対して逆に高い期待値を持つ他の学習データとこの学習データとの間で作用する斥力を決定する。他方、機械学習モデル２００が不正解のラベル２に対して「０．３」という平均値より高い期待値を出力したので、物理シミュレーション演算部１２１は、ラベル２に対して高い期待値を持つ他の学習データとこの学習データとの間で作用する引力を決定する。

　学習の最終段階に近い学習回数がＥ３回目では、機械学習モデル２００がこの学習データの推論を行い、正解のラベル３に対して「０．８」という最も高い期待値を出力する。したがって、物理シミュレーション演算部１２１は、正解ラベルに対して出力する期待値が最も高いので、この学習データに対して重い質量や大きなサイズを決定する。物理シミュレーション演算部１２１は、この学習データに作用する浮力を極めて小さくしてもよい。また、機械学習モデル２００が正解のラベル３に対して「０．８」という最も高い期待値を出力したので、物理シミュレーション演算部１２１は、ラベル３に対して高い期待値を持つ他の学習データとこの学習データとの間で作用する引力を決定する。また、機械学習モデル２００が不正解のラベル１及びラベル５に対しそれぞれ「０．０」、ラベル２及びラベル４に対して「０．１」という平均値よりも低い期待値を出力したので、物理シミュレーション演算部１２１は、各ラベル１、２、４、５に対して逆に高い期待値を持つ他の学習データとこの学習データとの間で作用する斥力を決定する。学習の成果として、正解のラベル３に対して十分高い期待値を出力できるようになったので、この学習データに重い質量が与えられるようになった。また、学習の成果として、この学習データとラベル２に対する期待が高い学習データ群との間では、Ｅ２回目では引力が作用していたがＥ３回目では斥力が作用するようになっている。

　そして、物理シミュレーション演算部１２１は、各学習データを、決定した引力や斥力、質量、大きさなどの物理特性を持つ物体として扱い、物理シミュレーション演算により各学習データに対応する物体の２次元平面又は３次元空間上の動き情報を算出する。物理シミュレーション演算の一例は、Ｆｏｒｃｅ－Ｄｉｒｅｃｔｅｄ（ＦＤ）法である。

　ここで、ｉ番目の学習データに対応する物体Ｄ_iの位置情報を（ｘ_i，ｙ_i，ｚ_i）とし、物理シミュレーション演算部１２１がｉ番目の学習データに対する機械学習モデル２００の推論結果（又は、正解ラベルの期待値）に基づいて決定した物体Ｄ_iの質量をＭ_i、大きさをＳ_i、浮力をＢ_iとする。また、ｉ番目の学習データに対応する物体Ｄ_iとｊ番目の学習データに対応する物体Ｄ_jとの間では（但し、ｉ≠ｊとする）、下式（１）で表される引力又は斥力Ｇ_ijが作用する。

　但し、上式（１）において、ｋは定数（例えば万有引力定数）、ｒ_ijはｉ番目の学習データに対応する物体Ｄ_iとｊ番目の学習データに対応する物体Ｄ_j間の距離である。また、δ_ijは、機械学習モデル２００が、ｉ番目の学習データに対して最も高い期待値及び低い期待値をそれぞれ推論したラベルと、ｊ番目の学習データに対して最も高い期待値を推論したラベルの一致に基づいて、１、０、又は－１の値をとる。δ_ij＝１は、ｉ番目の学習データとｊ番目の学習データにおいて期待値が最も高いラベルが一致する場合に、各々の学習データに対応する物体Ｄ_iと物体Ｄ_j間に引力が作用することを表す。また、δ_ij＝－１は、ｉ番目の学習データとｊ番目の学習データの一方において最も期待値が高いラベルと他方において期待値が最も低いラベルが一致する場合に、各々の学習データに対応する物体Ｄ_iと物体Ｄ_j間に斥力が作用することを表す。また、δ_ij＝０は、ｉ番目の学習データとｊ番目の学習データの間でラベルの期待値に相関がないので、各々の学習データに対応する物体Ｄ_iと物体Ｄ_j間に力が作用しないことを表す。

　したがって、ｉ番目の学習データに対応する物体Ｄ_iに作用する力Ｆ_iは、下式（２）のように、他の各学習データに対応する物体Ｄ_jとの間で作用する力（引力又は斥力）Ｇ_ijの合計と、物体Ｄ_iの質量Ｍ_iに応じた重力Ｍ_iｇ、及び物体Ｄ_iの浮力Ｂ_iの合力として表される。

　物理シミュレーション演算部１２１は、機械学習モデル２００の学習に使用した各学習データに対応する物体に上式（２）に示すような力が作用するという力学モデルを設定する。そして、物理シミュレーション演算部１２１は、物理シミュレーション演算により各物体の２次元又は３次元の動き情報を計算する。

　図５には、それぞれ学習データに対応する３つの物体Ｄ_i、Ｄ_j、及びＤ_kからなる力学モデルを例示している。図５に示す例では、物体Ｄ_iと物体Ｄ_j間には引力が作用し、物体Ｄ_iと物体Ｄ_k間には斥力が作用するが物体Ｄと物体Ｄ_k間には引力も斥力も作用しないことを想定している。また、説明の便宜上、各物体Ｄ_i、Ｄ_j、及びＤ_kの重力と浮力を省略している。図５では、物体Ｄ_i、Ｄ_j、及びＤ_kからなる力学モデルを、スプリングで物体間を接続したスプリングシステムとして表している。物体間を接続する各スプリングには、圧縮又は伸長のいずれかの方向に復元力が作用している。例えばＦｏｒｃｅ－Ｄｉｒｅｃｔｅｄ法を用いて物理シミュレーション演算を実施した場合、このようなスプリングシステムにおいて位置エネルギーが最小となるように、各学習データに対応する物体の位置を算出することができる。もちろん、このスプリングシステムにおいて各物体に重力及び浮力を作用されても、Ｆｏｒｃｅ－Ｄｉｒｅｃｔｅｄ法などの物理シミュレーション演算を実施して、位置エネルギーが最小となるように各物体の位置を算出することができる。

Ｃ－２．学習データに対する評価結果の提示
　評価結果提示部１２２は、物理シミュレーション演算部１２１が機械学習モデル２００による推論結果に基づいて決定した学習データ毎の物理特性に基づいて、各学習データを機械学習モデル２００の学習に使用する際の評価結果を提示する。上記Ｃ－１項で説明したように、物理シミュレーション演算部１２１は、機械学習モデル２００による推論結果に応じた学習データの物理特性を決定し、各学習データを決定した物理特性を持つ物体とみなして物理シミュレーション演算により各学習データに対応する物体の２次元平面又は３次元空間上の動き情報を算出する。そして、評価結果提示部１２２は、物理シミュレーション演算に基づいて決定された動き情報に基づいて、各学習データに対応する物体を配置したＧＵＩ画面を提示する。このＧＵＩ画面上では、学習データ毎の物体は、機械学習モデル２００の推論結果に応じて決定された大きさを持つ物体として表示され、物理シミュレーション演算によって算出された動き情報に従って動かされる。

　図６には、評価結果提示部１２２が、物理シミュレーション演算部１２１における物理シミュレーション演算の結果に基づいて各学習データを表す物体をマッピングしたＧＵＩ画面の表示例を示す。図６に示す例では、図面の簡素化のため、各学習データに対応する物体をすべて円又は球で示しているが、物体は四角形のブロックや立方体などその他の形状であってもよい。もちろん、学習データ毎に異なる形状の物体で表してもよい。また、学習データの正解ラベルに応じて物体を色分けして表示してもよい。

　正解ラベルに対する期待値が高い学習データに対応する物体は、重くなるので、図６に示すＧＵＩ画面上では下へ沈もうとする。また、期待値が高いラベルが一致する学習データ同士の物体間では、強い引力が作用して引き寄せ合うので、同ＧＵＩ画面上ではより近くにマッピングされる。他方、正解ラベルに対する期待値が低い学習データに対応する物体は、軽くなるので、同ＧＵＩ画面上では上に浮かぼうとする。また、軽い物体に作用する引力は小さいので、期待値が高いラベルが一致する他の学習データに対応する物体に引き寄せられることはなく、他の物体から離間した場所にマッピングされるようにしてもよい。したがって、評価結果提示部１２２は、学習に使用された各学習データの評価結果を視覚的にランク付けして表示したＧＵＩ画面と言うことができる。

　図６中で、例えば参照番号６０１で示す物体は、正解ラベルに対して低い期待値を出力した学習モデルに対応し、軽く小さなサイズであり、他の物体から離間した場所にマッピングされている。物体６０１に対応する学習データに対する機械学習モデル２００の推論結果では、正解ラベルに対する期待値が低い。

　ユーザ（例えば機械学習モデル２００の開発者）は、図６に示すような、各学習データの評価結果を視覚的にランク付けして表示したＧＵＩ画面上で、課題のある学習データに対応する物体６０１を把握することができる。また、ユーザは、例えば図７に示すように物体６０１を所定のエリア外に移動するＧＵＩ操作を行うことによって、該当する学習データを学習データ保持部１０１から削除することができる。なお、物体６０１をＧＵＩ画面内で移動したりエリアから物体６０１を除外したりするＧＵＩ操作に合わせて、効果音を出力するようにしてもよい。

　ユーザは、ＧＵＩ操作を通じて削除された学習データを、以後は機械学習モデル２００の学習に使用しないようにして、学習のやり直しによる時間ロスを少なくすることができる。また、物体をエリア外に移動させるＧＵＩ操作を通じて削除した１以上の学習データを除外して、ユーザの判断でカスタムのデータセットを生成することができる。また、学習データ保持部１０１は、ユーザ毎にカスタマイズされたデータセットを例えばユーザ毎の識別情報と紐付けして、学習データ提供部１３０から提供され又はその他のソースから取得した一般的なデータセットとは区別して保持するようにしてもよい。

　図８には、図６に示すＧＵＩ画面上で、ユーザが学習データを削除する他のＧＵＩ操作例を示している。既に述べたように、物理シミュレーション演算部１２１は正解ラベルの期待値が低い学習データに対応する物体に軽い質量及び小さいサイズを決定し、このため物理シミュレーション演算を実施すると他の物体との引力が小さく、又は浮力によってＧＵＩ画面の上方に浮揚する。例えばユーザが、正解ラベルの期待値として許容される下限の閾値や、許容される物体の質量の加減の閾値を、自身の要望に基づいて設定すると、図８中の参照番号８０１で示すように、ユーザが設定した閾値を表す閾値ラインが表示される。あるいは、ユーザがＧＵＩ画面に対してドラッグ操作などを行って、閾値ライン８０１の位置を直接指示するようにしてもよい。この閾値ライン８０１を超えてＧＵＩ画面の上方に浮揚している物体は、機械学習モデル２００の学習に使用するには課題がある学習データに対応する物体であり、自動削除の対象となる。なお、ユーザが自身の要望に基づいて閾値ラインの位置を調整するのではなく、システムであらかじめ設定した閾値に基づいて閾値ライン８０１の位置を決定して、閾値ライン８０１を超える物体に対応する学習データを自動削除の対象としてもよい。また、閾値ライン８０１を設定することで、閾値ライン８０１を超えた位置にある１以上の学習データを除外して、ユーザの判断でカスタムのデータセットを生成することができる。

　図７及び図８を参照しながら説明したように、機械学習モデル２００の学習に使用するには課題のある学習データを、ユーザの要望に応じて削除したり、自動的に削除したりすることができる。また、ユーザは、ＧＵＩ画面を通じて、削除の対象となる学習データを視覚的に確認することができる。そして、ＧＵＩ画面上で削除操作が行われた学習データを除外して、モデル更新部１０２は機械学習モデルの学習を進めることができる。

　ここで、図４を参照すると、学習の初期段階（Ｅ１回目の学習）では正解ラベルに対する期待値が低くても、Ｅ２回目、Ｅ３回目と学習が進むにつれて、正解ラベルに対する期待値が高くなっていくこともある。正解ラベルに対する期待値が高い学習データに対応する物体は、重く大きなサイズとなるので、図６に示すＧＵＩ画面上では下へ沈もうとする。また、期待値が高いラベルが一致する学習データ同士の物体間では、強い引力が作用して引き寄せ合うので、同ＧＵＩ画面上ではより近くにマッピングされる。例えば、図９に示すように、ある学習データは、Ｅ１回目の学習後では正解ラベルの期待値が低いために参照番号６０１で示す物体で表されていたが、Ｅ２回目、Ｅ３回目の学習後では正解ラベルの期待値が徐々に高くなり、参照番号９０２で示す大きく重い物体、参照番号９０３で示すさらに大きく且つ重い物体に推移していくことが想定される。

　したがって、評価結果提示部１２２は、図９に示すようなＧＵＩ画面を通じて、機械学習モデル２００の学習中に動的に変化していく各学習データの評価結果を、視覚的にランク付けして表示することができる。モデル更新部１０２において学習中の機械学習モデル２００が学習データを推論する度に物理特性の決定及び物理シミュレーション演算を実施してＧＵＩ画面を更新すると、ユーザにとっては、学習データに対応する物体が自律的に動いているように見える。ユーザ（例えば機械学習モデル２００の開発者）は、図９に示すようなＧＵＩ画面を通じて、学習回数毎の各学習データの評価結果の変化を観察しながら、各学習データの取捨選択を適切に行うことができる。例えば、図９に示すＧＵＩ画面中で、物体６０１に対応する学習データは、学習回数毎に正解ラベルの期待値が大きくなり、これに応じて対応する物体の質量が増大してＧＵＩ画面内で徐々に下降していくことから、機械学習モデル２００の学習に使用する上で問題はないことを確認することができる。ユーザは、物体９０３に対応する学習データを削除する必要がない、又は機械学習モデル２００の学習に使用すべきであることを把握することができる。なお、機械学習モデル２００の学習の進捗とともに学習データに対応する物体が徐々に移動する動作に合わせて、効果音を出力するようにしてもよい。

　なお、物理シミュレーション演算によって得られた、物体に働く力が平衡状態とならない場合は、複数の物体が密に凝集したり、画面の端部周辺に表示されたりする可能性がある。その場合は、ユーザが適切に学習データに対応する物体を認識できるように、物体間に距離を取ったり、物体と画面端の間に距離を取ったりしてもよい。また、物体が周期的な動きを見せるような状態になった場合は、周期的運動による平均位置を算出してＧＵＩ画面中に表示してもよい。また、ＧＵＩ画面中の物体の運動を一時停止させるようなコマンドが入力可能であってもよく、そのようなコマンドに対応するアイコンなどをＧＵＩ画面中に表示してもよい。

Ｃ－３．機械学習モデルによる推論の判断の根拠の明示
　人工知能が推論結果に至った過程がブラックボックス化されて、その判断の根拠が分かり難いという問題がある。そこで、本実施形態では、判断根拠計算部１２３が機械学習モデル２００による学習データに対する推論の判断の根拠を計算し、評価結果提示部１２２が学習データに対する機械学習モデルの推論の判断の根拠をさらに提示するようになっている。

　判断根拠計算部１２３は、例えば、Ｇｒａｄ－ＣＡＭ、ＬＩＭＥ、ＬＩＭＥの発展形であるＳＨＡＰ、ＴＣＡＶなどの各種のＸＡＩ（ｅＸｐｌａｉｎａｂｌｅ　ＡＩ）アルゴリズムを使って、機械学習モデル２００の推論の判断の根拠を計算する。判断根拠計算部１２３は、機械学習モデル２００が最も高い期待値を出力した推論ラベルに対して、１又は複数のＸＡＩアルゴリズムを使って判断の根拠を計算する。もちろん、判断根拠計算部１２３が２番目以降に高い期待値のラベルについてもさらに判断根拠を計算するようにしてもよい。

　ここで、Ｇｒａｄ－ＣＡＭは、出力層においてクラス分類の推論結果となるラベルから勾配を逆にたどる（クラス分類に至るまでの各特徴マップの貢献を算出し、その重みを以って逆伝播していく）方法によって、入力画像データのうちクラス分類に寄与した場所を推定するアルゴリズムであり、クラス分類に寄与した場所をヒートマップのように可視化することができる。あるいは、入力画像データの画素の位置情報を最終畳み込み層まで保持させて、最後の判別出力への位置情報の影響度を得ることで、元の入力画像のうち影響の強い部分をヒートマップ表示するようにしてもよい。ニューラルネットワークで構成される機械学習モデルにおいて、入力画像に対して画像認識を行ってクラスｃを出力した場合に、Ｇｒａｄ－ＣＡＭアルゴリズムに基づいて判断根拠を計算する方法（ヒートマップを生成する方法）について、以下で説明しておく。

Ｇｒａｄ－ＣＡＭについて：
　クラスｃの勾配ｙ_cが特徴マップの活性化Ａ_kであると仮定すると、下式（３）に示すようにニューロンの重要度の重みが与えられる。

　そして、最終的な畳み込み層の順伝播出力にチャネル毎の重みを乗算して、活性化関数ＲｅＬＵを介して、下式（４）に示すようにＧｒａｄ－ＣＡＭが計算される。

　図１０には、判断根拠計算部１２３がＧｒａｄ－ＣＡＭアルゴリズムに基づいて計算したヒートマップ表示付き判断根拠画像の例を示している。図１０に示す例では、入力された画像データ１０００のうち、機械学習モデル２００が最も高い期待値を出力した推論ラベルの根拠となった部分にヒートマップ１００１が重畳されている。元の入力画像は、犬と猫が一緒に写っている画像であり、正解ラベルを「犬（ラベル３）」とした学習データとして、機械学習モデル２００の学習に用いられる。ユーザは、図１０に示すようなヒートマップ表示付き画像データを参照して、ヒートマップが表示されている領域が正解ラベルを表しているかどうかに基づいて、元の入力画像を学習データに使用することに課題があるかどうかを把握することができる。図１０に示す例では、正解ラベルである「犬」を正しくヒートマップ表示しているので、ユーザは、この入力画像を学習データとして使用することに問題ないと判断することができる。

　他方、図１１には、図１０と同じ入力画像１１００に対して判断根拠計算部１２３がＧｒａｄ－ＣＡＭアルゴリズムに基づいて計算したヒートマップ表示付き判断根拠画像の他の例を示している。図１１に示す例では、機械学習モデル２００が最も高い期待値を出力した推論ラベルは「犬」であるが、入力画像１１００のうち犬ではなく猫の領域にヒートマップ１１０１が表示されている。ユーザは、図１１に示すような、推論ラベルとは異なる領域にヒートマップが表示された画像データを参照して、元の入力画像を学習データに使用することに課題があることを把握することができる。

ＬＩＭＥについて：
　ＬＩＭＥは、特定の入力データ項目（特徴量）を変化させた際にニューラルネットワークの出力結果が反転又は大きく変動すれば、その項目を「判定における重要度が高い」と推定する。例えば、判断根拠計算部１２３は、モデル更新部１０２が学習を行っている機械学習モデルにおける推論の理由（根拠）を示すために局所近似する他のモデル（根拠用モデル）を生成する。判断根拠計算部１２３は、入力画像とその入力情報に対応する出力結果との組合せを対象に、局所的に近似する根拠用モデルを生成する。そして、判断根拠計算部１２３は、根拠用モデルを用いて、学習中の機械学習モデルが最も高い期待値を出力した推論ラベルに関する根拠情報を生成して、図１０に示したような根拠画像をＧｒａｄ－ＣＡＭアルゴリズムと同様に生成することができる。

ＴＣＡＶについて：
　ＴＣＡＶは、訓練済みモデルの予測に対するＣｏｎｃｅｐｔ（人間が簡単に理解できるような概念）の重要度を計算するアルゴリズムである。例えば、判断根拠計算部１２３は、入力情報（病理画像データ）を複製したり、変更を加えたりした複数の入力情報を生成して、根拠情報の生成対象となるモデル（説明対象モデル）に、複数の入力情報の各々を入力し、各入力情報に対応する複数の出力情報を説明対象モデルから出力させる。次いで、判断根拠計算部１２３は、複数の入力情報の各々と、対応する複数の出力情報の各々との組合せ（ペア）を学習用データとして、根拠用モデルを学習して、対象入力情報を対象として別の解釈可能なモデルで局所近似する根拠用モデルを生成する。そして、判断根拠計算部１２３は、モデル更新部１０２により学習中の機械学習モデルからラベルが出力されると、根拠用モデルを用いて、その出力ラベルに関する根拠情報を生成して、図１０に示したような根拠画像を同様に生成することができる。

　もちろん、判断根拠計算部１２３は、上述したＧｒａｄ－ＣＡＭ、ＬＩＭＥ／ＳＨＡＰ、ＴＣＡＶ以外のアルゴリズムに基づいて、モデル更新部１０２により学習中の機械学習モデルの出力ラベルに関する根拠を計算するようにしてもよい。

Ｃ－４．詳細情報の提示方法ついて
　図６を参照しながら既に説明したように、評価結果提示部１２２は、、物理シミュレーション演算部１２１が学習データ毎に決定した物理特性、及び決定した物理特性に基づく物理シミュレーション演算の結果に基づいて、各学習データを表す物体をマッピングしたＧＵＩ画面をユーザに提示する。このようなＧＵＩ画面は、各学習データに対する評価結果を視覚的にランク付けして表示しており、ユーザはＧＵＩ画面を通じて学習データについての課題の有無などを直感的に把握することができる。但し、学習データを除外するか否かを判断する際には、視覚的には低ランクに位置付けされていても、ユーザは学習データについてより詳細な情報を確認したいという要望がある。

　一方、学習データは、画像（画像ファイル名）と正解ラベル、さらには学習中の機械学習モデルによる推論結果（ラベル毎の期待値）、といった詳細情報を有する。また、判断根拠計算部１２３は、機械学習モデル２００が最も高い期待値を出力した推論ラベルに対して、１又は複数のＸＡＩアルゴリズムを使って判断の根拠を計算する。付言すれば、機械学習モデルによる推論結果に基づいて決定した物理特性を評価するという上記方法以外に手法をさらに用いて各学習データを評価するようにしてもよい。

　そこで、図６に示したような、各学習データの評価結果を表示するＧＵＩ画面上で、ユーザの要望に応じて、学習データの詳細情報や、ＸＡＩアルゴリズムによる評価結果、異なる手法による評価結果などを表示する。

　図１２には、学習データの詳細情報を表示するＧＵＩ操作の一例を示している。図１２に示す例では、ユーザは、各学習データの評価結果を表示するＧＵＩ画面上で、自身が着目する物体の上で、例えばマウスオーバーやマウスボタンの押下操作、タッチ操作などを実施する。このマウス操作に応答して、操作の対象となった物体に対応する画像データの詳細情報を記述している吹き出し１２０１がポップアップ表示する。

　また、図１３には、ＧＵＩ画面上で、物体へのマウス操作に応答して表示される、学習データの詳細情報をさらに具体的に示している。図１３に示す吹き出し１３０１内には、入力データとなる画像のファイル名と、入力データに対応する正解ラベル、習中の機械学習モデルによる推論結果（ラベル毎の期待値）、入力された画像、最も高い期待値が出力された推論ラベルに対する１以上のＸＡＩアルゴリズムを用いて算出された判断根拠が表示される。吹き出し１３０１内にすべてのデータを同時に表示できない場合には、吹き出し１３０１の例えば右端縁にスライダーバー１３０２を設けて、表示範囲を移動できるようにしてもよい。

Ｃ－５．処理手順
　図１４には、学習データ評価部１２０において実施される処理手順をフローチャートの形式で示している。図１４に示す処理手順では、モデル更新部１０２において学習中の機械学習モデル２００が学習データを推論する度に物理特性の決定及び物理シミュレーション演算を実施して、ＧＵＩ画面（図６～図９を参照のこと）を更新することを想定している。

　学習システム１００では、モデル更新部１０２が学習データを使用してモデルパラメータを更新する度に、学習データ評価部１２０に対して機械学習モデルを更新したことを通知する。学習データ評価部１２０は、学習システム１００から機械学習モデルの更新を行ったことが通知されると（ステップＳ１４０１）、後続の学習データの評価処理を開始する。

　学習データ評価部１２０は、基本的には、モデル更新部１０２において機械学習モデルの学習に使用したすべての学習データを評価対象とする。もちろん、機械学習モデルの学習に使用した学習データの一部を評価対象としたり、使用した学習データの一部を評価対象から除外したりしてもよい。

　未評価の学習データがまだ残っている場合には（ステップＳ１４０２のＹｅｓ）、学習データ評価部１２０はそのうちの１つを対象データとして選択して（ステップＳ１４０３）、その対象データの推論を計算する（Ｓ１４０４）。ステップＳ１４０４では、学習中の機械学習モデルを使って、対象データの順シミュレーション（ｆｏｒｗａｒｄ）の算出を行うようにしてもよいし、モデル更新部１０２から学習中の機械学習モデルの推論結果を取得するようにしてもよい。

　図３を参照しながら既に説明したように、機械学習モデルの推論結果は、対象データに対する機械学習モデルの出力ラベル毎の期待値からなる。続いて、物理シミュレーション演算部１２１は、対象データに対する機械学習モデルの推論結果に基づいて、対象データの質量や大きさ、他の学習データ間の作用力（引力又は斥力）といった物理特性を決定する（ステップＳ１４０５）。

　次いで、物理シミュレーション演算部１２１は、すべての対象データについての物理特性を決定すると（ステップＳ１４０２のＮｏ）、各対象データに対応する物体に対して物理シミュレーション演算を実施する（ステップＳ１４０６）。例えばＦｏｒｃｅ－Ｄｉｒｅｃｔｅｄ法を用いて物理シミュレーション演算を実施し、位置エネルギーが最小となるような各対象データに対応する物体の動きを算出する。

　そして、評価結果提示部１２２は、ステップＳ１４０６において物理シミュレーション演算に基づいて決定された動き情報に基づいて、各対象データに対応する物体を複数配置して視覚的にランク付けしたＧＵＩ画面を提示する（ステップＳ１４０７）。モデル更新部１０２において学習中の機械学習モデル２００が学習データを推論する度に物理特性の決定及び物理シミュレーション演算を実施してＧＵＩ画面を更新すると、ユーザにとっては、学習データに対応する物体が自律的に動いているように見える（例えば図９を参照のこと）。

Ｄ．システム構成
　図１５には、学習データ評価部１２０として動作する情報処理システム１５００のハードウェア構成例を示している。情報処理システム１５００は、例えばパーソナルコンピュータを用いて構成されるが、機能的には学習データ評価部１２０は、物理シミュレーション演算部１２１と、評価結果提示部１２２と、判断根拠計算部１２３等の機能モジュールを含んでいる。情報処理システム１５００は、学習システム１００と同一のシステムであってもよいし、学習システム１００とは独立して構成されたシステムであってもよい。

　図示の情報処理システム１５００は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１５０１と、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１５０２と、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１５０３と、ホストバス１５０４と、ブリッジ１５０５と、拡張バス１５０６と、インターフェース部１５０７と、入力装置１５０８と、出力装置１５０９と、ストレージ装置１５１０と、ドライブ１５１１と、通信装置１５１３を含んでいる。

　ＣＰＵ１５０１は、演算処理装置及び制御装置として機能し、各種プログラムに従って情報処理システム１５００の動作全般を制御する。また、情報処理システム１５００は、演算処理装置としてＣＰＵ１５０１以外にも、ＧＰＵやＧＰＧＰＵ（Ｇｅｎｅｒａｌ－ｐｕｒｐｏｓｅ　ｃｏｍｐｕｔｉｎｇ　ｏｎ　ｇｒａｐｈｉｃｓ　ｐｒｏｃｅｓｓｉｎｇ　ｕｎｉｔｓ）をさらに含んでもよい。

　ＲＯＭ１５０２は、ＣＰＵ１５０１が使用するプログラム（基本入出力システムなど）や演算パラメータなどを不揮発的に格納している。ＲＡＭ１５０３は、ＣＰＵ１５０１の実行において使用するプログラムをロードしたり、プログラム実行において適宜変化する作業データなどのパラメータを一時的に格納したりするのに使用される。ＲＡＭ１５０３にロードしてＣＰＵ１５０１において実行するプログラムは、例えば各種アプリケーションプログラムやオペレーティングシステム（ＯＳ）である。

　ＣＰＵ１５０１とＲＯＭ１５０２とＲＡＭ１５０３は、ＣＰＵバスなどから構成されるホストバス１５０４により相互に接続されている。そして、ＣＰＵ１５０１は、ＲＯＭ１５０２及びＲＡＭ１５０３の協働的な動作により、ＯＳが提供する実行環境下で各種アプリケーションプログラムを実行して、さまざまな機能やサービスを実現することができる。本実施形態では、ＣＰＵ１５０１とＲＯＭ１５０２及びＲＡＭ１５０３の協働的動作により、学習データ評価部１２０としての機能を実現し、機械学習モデルの学習に使用した学習データの物理特性決定及び物理シミュレーション演算、物理シミュレーション演算結果に基づく学習データの評価結果のＧＵＩ画面提示、機械学習モデルによる学習データの推論の根拠計算などを実現する。

　ホストバス１５０４は、ブリッジ１５０５を介して拡張バス１５０６に接続されている。拡張バス１５０６は、例えばＰＣＩ－ＳＩＧ（Ｐｅｒｉｐｈｅｒａｌ　Ｃｏｍｐｏｎｅｎｔ　Ｉｎｔｅｒｃｏｎｎｅｃｔ　Ｓｐｅｃｉａｌ　Ｉｎｔｅｒｅｓｔ　Ｇｒｏｕｐ）によって規格策定されるＰＣＩ、又はＰＣＩｅ（ＰＣＩ　Ｅｘｐｒｅｓｓ）である。但し、情報処理システム１５００がホストバス１５０４、ブリッジ１５０５及び拡張バス１５０６によって回路コンポーネントを分離される構成する必要はなく、単一のバス（図示しない）によってほぼすべての回路コンポーネントが相互接続される実装であってもよい。

　インターフェース１５０７は、拡張バス１５０６の規格に則って、入力装置１５０８、出力装置１５０９、ストレージ装置１５１０、ドライブ１５１１、通信装置１５１３といった外部装置又は周辺装置を接続する。但し、情報処理システム１５００が学習データ評価部１２０として動作するために、図１５に示す外部装置又は周辺装置がすべて必須であるとは限らず、また図示しない外部装置又は周辺装置を情報処理システム１５００がさらに含んでもよい。

　入力装置１５０８は、ユーザからの入力に基づいて入力信号を生成し、ＣＰＵ１５０１に出力する入力制御回路などから構成される。入力装置１５０８は、例えばマウス、キーボード、タッチパネル、ボタン、マイクロホン、スイッチ及びレバーのうち少なくともいずれか１つである。入力装置１５０８は、例えばユーザ（機械学習モデルの開発者）がＧＵＩ画面（図７を参照のこと）上で学習データに対応する物体の操作を行ったり、その他の指示を入力したりするために用いられる。

　出力装置１５０９は、例えば、液晶ディスプレイ（ＬＣＤ）装置、有機ＥＬ（Ｅｌｅｃｔｒｏ－Ｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイ装置、及びＬＥＤ（Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）などの表示装置を含み、映像データなどの各種データをイメージ又はテキストで表示する。また、出力装置１５０９は、スピーカ及びヘッドホンなどの音声出力装置を含み、音声データなどを音声に変換して出力する。

　ストレージ装置１５１０は、例えば、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）やＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）といった大容量記憶装置で構成される。ストレージ装置１５１０は、ＣＰＵ１５０１で実行されるプログラムや各種データなどのファイルを格納する。

　リムーバブル記憶媒体１５１２は、例えば磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのカートリッジ式で構成される記憶媒体である。ドライブ１５１１は、装填したリムーバブル記憶媒体１５１３に対して読み出し及び書き込み動作を行う。ドライブ１５１１は、リムーバブル記録媒体１５１２から読み出したデータをＲＡＭ１５０３に出力したり、ＲＡＭ１５０３上のデータをリムーバブル記録媒体１５１２に書き込んだりする。ドライブ１５１１は、情報処理システム１５００の筐体に内蔵される場合と、外付けされる場合がある。

　通信装置１５１３は、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）やインターネットなどの外部ネットワークに接続するためのデバイスであり、例えばネットワークインターフェースカード（ＮＩＣ）で構成される。

　以上、特定の実施形態を参照しながら、本開示について詳細に説明してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。

　本明細書では、主に画像分類を行う機械学習モデルの学習を行う学習システムに本開示を適用した実施形態を中心に説明してきたが、本開示の要旨はこれに限定されるものではない。例えば、音声認識、文字認識、データ生成などさまざまな推論を行う機械学習モデルを対象として、本開示に係る学習データの評価を実施することができる。また、機械学習モデルは、ニューラルネットワークで構成される他、サポートベクタ回帰、ガウス過程回帰などの型を用いたモデルであってもよい。

　要するに、例示という形態により本開示について説明してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本開示の要旨を判断するためには、特許請求の範囲を参酌すべきである。

　なお、本開示は、以下のような構成をとることも可能である。

（１）機械学習モデルの学習に用いられる学習データに関する処理を行う情報処理方法であって、
　学習データに対する前記機械学習モデルの推論結果に基づいて各学習データの特性を決定する決定ステップと、
　前記決定した特性に基づく学習データの評価結果を提示する提示ステップと、
を有する情報処理方法。

（２）前記決定ステップでは、前記機械学習モデルの推論結果に基づいて各学習データに対応する物体の物理特性を決定するとともに、決定された物理特性をそれぞれ持つ物体間の物理シミュレーション演算を実施し、
　前記提示ステップでは、前記物理シミュレーション演算の結果に基づいて、各学習データに対応する物体を提示する、
上記（１）に記載の情報処理方法。

（３）前記決定ステップでは、学習データに対して前記機械学習モデルが出力するラベル毎の期待値に基づいて、学習データに対応する物体の物理特性を決定する、
上記（２）に記載の情報処理方法。

（４）前記決定ステップでは、正解ラベルの期待値に基づいて学習データに対応する物体の質量、浮力、又は大きさを決定する、
上記（３）に記載の情報処理方法。

（４－１）前記決定ステップでは、正解ラベルの期待値が大きい学習データに対応する物体が重く又は大きくなり、正解ラベルの期待値が小さい学習データに対応する物体が軽く又は小さくなるように、各学習データの物理特性を決定する、
上記（４）に記載の情報処理方法。

（５）前記決定ステップでは、正解ラベルの期待値に基づいて各学習データに対応する物体間に作用する引力又は斥力のうち少なくとも一方を決定する、
上記（３）又は（４）のいずれかに記載の情報処理方法。

（５－１）前記決定ステップでは、期待値が高いラベルが一致する学習データに対応する物体間に作用する引力を決定する、
上記（５）に記載の情報処理方法。

（５－２）前記決定ステップでは、同じラベルに対して低い期待値が出力された学習モデルに対応する物体と逆に高い期待値が出力された学習モデルに対応する物体間に作用する斥力を決定する、
上記（５）又は（５－１）のいずれかに記載の情報処理方法。

（６）前記決定ステップでは、各学習データに対応する物体に決定した物理特性に基づいて、前記物理シミュレーション演算により各物体の動き情報を算出し、
　前記提示ステップでは、前記決定ステップで算出された動き情報に基づいて、表示装置の画面上に各物体を動かして表示させる、
上記（２）乃至（５）のいずれかに記載の情報処理方法。

（７）前記表示装置に画面上に表示された物体に対するユーザの操作を入力する入力ステップをさらに有する、
上記（６）に記載の情報処理方法。

（７－１）前記入力ステップにおいて前記画面上で削除する操作が行われた物体に対応する学習データを、前記機械学習モデルの学習対象から除外する、
上記（７）に記載の情報処理方法。

（８）前記機械学習モデルの更新を行う度に、前記決定ステップにより各学習データの特性を決定して、前記提示ステップにより学習データの評価結果を提示する、
上記（１）乃至（７）のいずれかに記載の情報処理方法。

（９）機械学習モデルの学習に用いられる学習データに関する処理を行う情報処理システムであって、
　学習データに対する前記機械学習モデルの推論結果に基づいて各学習データの特性を決定する決定部と、
　前記決定した特性に基づく学習データの評価結果を提示する提示部と、
を含む情報処理システム。

（１０）前記決定部は、前記機械学習モデルの推論結果に基づいて各学習データに対応する物体の物理特性を決定するとともに、決定された物理特性をそれぞれ持つ物体間の物理シミュレーション演算を実施し、
　前記提示部は、前記物理シミュレーション演算の結果に基づいて、各学習データに対応する物体を提示する、
上記（９）に記載の情報処理システム。

（１１）前記決定部は、学習データに対して前記機械学習モデルが出力するラベル毎の期待値に基づいて、学習データに対応する物体の物理特性を決定する、
上記（１０）に記載の情報処理システム。

（１２）前記決定部は、正解ラベルの期待値に基づいて学習データに対応する物体の質量、浮力、又は大きさを決定する、
上記（１１）に記載の情報処理システム。

（１２－１）前記決定部は、正解ラベルの期待値が大きい学習データに対応する物体が重く又は大きくなり、正解ラベルの期待値が小さい学習データに対応する物体が軽く又は小さくなるように決定する、
上記（１２）に記載の情報処理システム。

（１３）前記決定部は、正解ラベルの期待値に基づいて各学習データに対応する物体間に作用する引力又は斥力のうち少なくとも一方を決定する、
上記（１１）又は（１２）のいずれかに記載の情報処理システム。

（１３－１）前記決定部は、期待値が高いラベルが一致する学習データに対応する物体間に作用する引力を決定する、
上記（１３）に記載の情報処理システム。

（１３－２）前記決定部は、同じラベルに対して低い期待値が出力された学習モデルに対応する物体と逆に高い期待値が出力された学習モデルに対応する物体間に作用する斥力を決定する、
上記（１３）又は（１３－１）のいずれかに記載の情報処理システム。

（１４）前記決定部は、各学習データに対応する物体に決定した物理特性に基づいて、前記物理シミュレーション演算により各物体の動き情報を算出し、
　前記提示部は、前記決定部が算出された動き情報に基づいて、表示装置の画面上に各物体を動かして表示させる、
上記（１０）乃至（１３）のいずれかに記載の情報処理システム。

（１５）前記表示装置に画面上に表示された物体に対するユーザの操作を入力する入力部をさらに含む、
上記（１４）に記載の情報処理システム。

（１５－１）前記入力部において前記画面上で削除する操作が行われた物体に対応する学習データを、前記機械学習モデルの学習対象から除外する、
上記（１５）に記載の情報処理システム。

（１６）前記提示部は、前記画面上に表示された物体に対して前記入力部を通じて所定の操作が行われたことに応答して、前記物体に対応する学習データに関する詳細情報をさらに提示する、
上記（１５）に記載の情報処理システム。

（１６－１）学習データに対する前記機械学習モデルの推論の判断の根拠を計算する計算部をさらに備え、
　前記提示部は、計算部によって計算された判断根拠を含む前記詳細情報を提示する、
上記（１６）に記載の情報処理システム。

（１７）前記機械学習モデルの更新を行う度に、前記決定部が各学習データの特性を決定して、前記提示部が学習データの評価結果を提示する、
上記（９）乃至（１６）のいずれかに記載の情報処理システム。

（１８）前記決定部を含む第１の装置と、
　前記提示部を含む第２の装置と、
を含む、
上記（９）乃至（１７）のいずれかに記載の情報処理システム。

（１９）前記第２の装置は、前記決定した特性に基づく学習データの評価結果を画面に表示する表示装置と、前記画面に対するユーザの操作を入力する入力部を含む、
上記（１８）に記載の情報処理システム。

（２０）学習データを用いた学習により前記機械学習モデルを更新するモデル更新部を含む第３の装置をさらに含む、
上記（１８）又は（１９）のいずれかに記載の情報処理システム。

　１００…学習システム、１０１…学習データ保持部、１０２…モデル更新部
　１０３…モデルパラメータ保持部、１１１…推論部
　１１２…データ入力処理部、１２０…学習データ評価部
　１２１…物理シミュレーション演算部、１２２…評価結果提示部
　１２３…判断根拠計算部、１３０…学習データ提供部
　１５００…情報処理システム、１５０１…ＣＰＵ、１５０２…ＲＯＭ
　１５０３…ＲＡＭ、１５０４…ホストバス、１５０５…ブリッジ、
　１５０６…拡張バス、１５０７…インターフェース部
　１５０８…入力装置、１５０９…出力装置、１５１０…ストレージ装置
　１５１１…ドライブ、１５１２…リムーバブル記録媒体
　１５１３…通信装置

Claims

　機械学習モデルの学習に用いられる学習データに関する処理を行う情報処理方法であって、
　学習データに対する前記機械学習モデルの推論結果に基づいて各学習データの特性を決定する決定ステップと、
　前記決定した特性に基づく学習データの評価結果を提示する提示ステップと、
を有する情報処理方法。
　前記決定ステップでは、前記機械学習モデルの推論結果に基づいて各学習データに対応する物体の物理特性を決定するとともに、決定された物理特性をそれぞれ持つ物体間の物理シミュレーション演算を実施し、
　前記提示ステップでは、前記物理シミュレーション演算の結果に基づいて、各学習データに対応する物体を提示する、
請求項１に記載の情報処理方法。
　前記決定ステップでは、学習データに対して前記機械学習モデルが出力するラベル毎の期待値に基づいて、学習データに対応する物体の物理特性を決定する、
請求項２に記載の情報処理方法。
　前記決定ステップでは、正解ラベルの期待値に基づいて学習データに対応する物体の質量、浮力、又は大きさを決定する、
請求項３に記載の情報処理方法。
　前記決定ステップでは、正解ラベルの期待値に基づいて各学習データに対応する物体間に作用する引力又は斥力のうち少なくとも一方を決定する、
請求項３に記載の情報処理方法。
　前記決定ステップでは、各学習データに対応する物体に決定した物理特性に基づいて、前記物理シミュレーション演算により各物体の動き情報を算出し、
　前記提示ステップでは、前記決定ステップで算出された動き情報に基づいて、表示装置の画面上に各物体を動かして表示させる、
請求項２に記載の情報処理方法。
　前記表示装置に画面上に表示された物体に対するユーザの操作を入力する入力ステップをさらに有する、
請求項６に記載の情報処理方法。
　前記機械学習モデルの更新を行う度に、前記決定ステップにより各学習データの特性を決定して、前記提示ステップにより学習データの評価結果を提示する、
請求項１に記載の情報処理方法。
　機械学習モデルの学習に用いられる学習データに関する処理を行う情報処理システムであって、
　学習データに対する前記機械学習モデルの推論結果に基づいて各学習データの特性を決定する決定部と、
　前記決定した特性に基づく学習データの評価結果を提示する提示部と、
を含む情報処理システム。
　前記決定部は、前記機械学習モデルの推論結果に基づいて各学習データに対応する物体の物理特性を決定するとともに、決定された物理特性をそれぞれ持つ物体間の物理シミュレーション演算を実施し、
　前記提示部は、前記物理シミュレーション演算の結果に基づいて、各学習データに対応する物体を提示する、
請求項９に記載の情報処理システム。
　前記決定部は、学習データに対して前記機械学習モデルが出力するラベル毎の期待値に基づいて、学習データに対応する物体の物理特性を決定する、
請求項１０に記載の情報処理システム。
　前記決定部は、正解ラベルの期待値に基づいて学習データに対応する物体の質量、浮力、又は大きさを決定する、
請求項１１に記載の情報処理システム。
　前記決定部は、正解ラベルの期待値に基づいて各学習データに対応する物体間に作用する引力又は斥力のうち少なくとも一方を決定する、
請求項１１に記載の情報処理システム。
　前記決定部は、各学習データに対応する物体に決定した物理特性に基づいて、前記物理シミュレーション演算により各物体の動き情報を算出し、
　前記提示部は、前記決定部が算出された動き情報に基づいて、表示装置の画面上に各物体を動かして表示させる、
請求項１０に記載の情報処理システム。
　前記表示装置に画面上に表示された物体に対するユーザの操作を入力する入力部をさらに含む、
請求項１４に記載の情報処理システム。
　前記提示部は、前記画面上に表示された物体に対して前記入力部を通じて所定の操作が行われたことに応答して、前記物体に対応する学習データに関する詳細情報をさらに提示する、
請求項１５に記載の情報処理システム。
　前記機械学習モデルの更新を行う度に、前記決定部が各学習データの特性を決定して、前記提示部が学習データの評価結果を提示する、
請求項９に記載の情報処理システム。
　前記決定部を含む第１の装置と、
　前記提示部を含む第２の装置と、
を含む、
請求項９に記載の情報処理システム。
　前記第２の装置は、前記決定した特性に基づく学習データの評価結果を画面に表示する表示装置と、前記画面に対するユーザの操作を入力する入力部を含む、
請求項１８に記載の情報処理システム。
　学習データを用いた学習により前記機械学習モデルを更新するモデル更新部を含む第３の装置をさらに含む、
請求項１８に記載の情報処理システム。