JP7348945B2

JP7348945B2 - 情報処理方法、および、情報処理システム

Info

Publication number: JP7348945B2
Application number: JP2021505506A
Authority: JP
Inventors: グドフスキーデニス; ホジキンソンアレック; 拓也山口; 宗太郎築澤
Original assignee: Panasonic Intellectual Property Corp of America
Current assignee: Panasonic Intellectual Property Corp of America
Priority date: 2019-03-14
Filing date: 2019-11-25
Publication date: 2023-09-21
Anticipated expiration: 2039-11-25
Also published as: US20210241021A1; CN112840360A; JPWO2020183807A1; EP3940626A1; EP3940626A4; WO2020183807A1; US11995150B2

Description

本発明は、情報処理方法、および、情報処理システムに関する。

機械学習を利用した画像の識別処理において、既存の学習画像に対して、画像特徴量の類似度が低い画像を訓練データに追加することで、画像の識別精度を向上させる技術がある（特許文献１参照）。

なお、識別処理は、推論処理ともいわれる。推論処理には、識別処理のほか、検出処理も含まれる。

特開２０１７－２２４１８４号公報

しかしながら、特許文献１のような従来技術では、推論器によっては推論の性能があまり向上しないことがある。言い換えると、学習の効率がよくないという問題がある。

そこで、本発明は、推論器による推論の性能を効率よく向上させることができる情報処理方法などを提供する。

本発明の一態様に係る情報処理方法は、コンピュータにより実行される情報処理方法であって、第１データと、推論器の訓練に用いられた訓練データに含まれていない第２データとを取得し、前記訓練データを用いた機械学習により訓練された前記推論器に前記第１データを入力して得られる第１関連データを用いて、前記推論器に前記第１データを入力して前記推論器から出力される第１出力データに対する前記第１データの各部分の寄与である第１寄与を算出し、前記推論器に前記第２データを入力して得られる第２関連データを用いて、前記推論器に前記第２データを入力して前記推論器から出力される第２出力データに対する前記第２データの各部分の寄与である第２寄与を算出し、前記第１寄与と前記第２寄与との類似度にしたがって、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する。

なお、これらの包括的または具体的な態様は、システム、装置、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよく、システム、装置、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

本発明の情報処理方法は、推論器による推論の性能を効率よく向上させることができる。

図１は、認識器の処理を示す概念図である。図２は、モデルの生成のための機械学習による訓練に用いられる訓練データの例を示す説明図である。図３は、認識器による認識の結果の例を示す説明図である。図４は、実施の形態における処理システムの構成の第一例を示すブロック図である。図５は、実施の形態における処理システムの構成の第二例を示すブロック図である。図６は、実施の形態における算出部による寄与度の算出と、類似度の算出とを具体的に示す説明図である。図７は、実施の形態における決定部による追加データの決定方法の第一例を示す説明図である。図８は、実施の形態における決定部による追加データの決定方法の第二例を示す説明図である。図９は、実施の形態における決定部による追加データの決定方法の第三例を示す説明図である。図１０は、実施の形態における処理システムが実行する処理の第一例を示すフロー図である。図１１は、実施の形態における処理システムが実行する処理の第二例を示すフロー図である。図１２は、実施の形態の変形例１における処理システムが実行する処理を示すフロー図である。図１３は、実施の形態の変形例２における処理システムが実行する処理を示すフロー図である。

（本発明の基礎となった知見）
本発明者は、「背景技術」の欄において記載した、推論処理に関し、以下の問題が生じることを見出した。

機械学習を利用した推論処理を実行する推論器の性能を向上させるには、訓練データの拡充が有効である。訓練データは、画像と、当該画像が示す情報であるラベルとを含む。訓練データの拡充には、一般に、推論器の訓練に用いられた訓練データに含まれていない新たなデータを追加した、新たな訓練データが用いられる。新たなデータを追加するには、既知の画像にラベルを付す作業が必要である。ラベルを付す作業は、例えば人手によりなされる。

ここで、既知の画像は容易に用意され得るが、そのような既知の画像のうち、推論器による推論の性能の向上、又は、推論器の誤動作の修正に有効なデータがどれであるかを特定することは困難であるのが現状である。そのため、推論の性能の向上、又は、誤動作の修正のために、推論の性能の向上、又は、誤動作の修正に貢献する画像であるか否かに関わらず、新たなデータを大量に追加することが行われている。しかし、大量のデータを生成し追加するには、画像にラベルを付す作業などを大量に行う必要があり、工数又は時間の観点で効率がよくない。

このように、現状、推論器による推論の性能を向上させる際の効率がよくないという問題がある。

これに対し、上述したような従来技術では、画像特徴量の類似度が低い画像を訓練データとして選んでいる。

しかし、画像特徴量の類似度が低くても、当該画像を用いて訓練される推論器にとって有効なデータであるとは限らない。そのため、推論器によっては推論の性能があまり向上しないことがある。言い換えると、依然として、学習の効率がよくないという問題がある。

このような問題を解決するために、本発明の一態様に係る情報処理方法は、コンピュータにより実行される情報処理方法であって、第１データと、推論器の訓練に用いられた訓練データに含まれていない第２データとを取得し、前記訓練データを用いた機械学習により訓練された前記推論器に前記第１データを入力して得られる第１関連データを用いて、前記推論器に前記第１データを入力して前記推論器から出力される第１出力データに対する前記第１データの各部分の寄与である第１寄与を算出し、前記推論器に前記第２データを入力して得られる第２関連データを用いて、前記推論器に前記第２データを入力して前記推論器から出力される第２出力データに対する前記第２データの各部分の寄与である第２寄与を算出し、前記第１寄与と前記第２寄与との類似度にしたがって、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する。

上記態様によれば、第１データと類似した寄与を有する第２データを訓練データに追加すべきと決定する。寄与とは、推論器による推論の処理において、推論の結果に影響を与えたことを示している。そのため、当該推論器にとって、推論の結果に与える影響が第１データと類似している第２データを選出することができる。そして、選出された第２データを訓練データとして用いて当該推論器を訓練すれば、第１データおよび当該第１データと類似したデータに対して当該推論器が誤推論することが抑制されやすくなる。また、当該推論器にとって有効なデータが訓練データに追加されることにより、無作為に大量のデータを追加することを回避できる。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。

例えば、前記第１データは、前記推論器の誤推論データであってもよい。

上記態様によれば、誤推論データと類似した寄与を有する第２データを訓練データに追加すべきと決定する。そして、この決定に基づいて上記第２データが追加された訓練データを用いて推論器を訓練すれば、誤推論したデータと類似したデータに対して再び誤推論することが抑制され得る。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。

例えば、前記第２データを追加すべきと決定された場合、前記第２データが追加された前記推論器の訓練データを用いて前記推論器を訓練してもよい。

上記態様によれば、第２データを訓練データに追加すべきという決定に基づいて第２データが追加された訓練データによって推論器が訓練される。これにより、第１データと類似したデータに対して再び誤推論することが実際に抑制できる。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。

例えば、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する際には、複数の前記第２データのうち、前記第１寄与と前記第２寄与との類似度が高い前記第２データが、他の前記第２データより優先的に前記推論器の訓練データに追加されるように、前記第２データを前記推論器の訓練データに追加すべきか否かを決定してもよい。

上記態様によれば、予め用意された複数の第２データのうちから、第１データと寄与がより一層類似する第２データを選択して、訓練データに追加すべきという決定をすることができる。よって、上記態様によれば、推論器による推論の性能をより一層効率よく向上させることができる。

例えば、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する際には、複数の前記第１データそれぞれについての前記第１寄与を含む複数の前記第１寄与を算出し、算出した前記複数の前記第１寄与それぞれと前記第２寄与との類似度を含む複数の類似度を用いて算出される代表値にしたがって、前記第２データを前記推論器の訓練データに追加すべきか否かを決定してもよい。

上記態様によれば、複数の第１データがある場合には、複数の第１データそれぞれについて算出される複数の類似度から算出される代表値を用いて、訓練データに追加すべき第２データを決定する。複数の第１データがある場合、複数の類似度が算出されるが、どの第２データを訓練データに追加すべきであるかについて、複数の類似度を用いて決定することが難しい。そこで、複数の類似度から算出される代表値を用いることで、どの第２データを訓練データに追加すべきであるかを容易に決定することができる。よって、上記態様によれば、推論器による推論の性能をより容易に向上させることができる。

例えば、前記複数の類似度は、前記複数の前記第１寄与それぞれと、複数の前記第２データそれぞれについての前記第２寄与を含む複数の前記第２寄与それぞれと、の類似度を含み、前記代表値を算出する際には、前記複数の前記第１データごとに、前記複数の類似度から所定数の類似度を選択し、前記複数の第２データごとに、選択された前記所定数の類似度を用いて前記代表値を算出し、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する際には、算出した複数の前記代表値にしたがって、当該第２データを前記推論器の訓練データに追加すべきか否かを決定してもよい。

上記態様によれば、複数の第１データがある場合に、特定の第１データばかりに寄与が類似した第２データが訓練データに追加されると決定されることを抑制できる。複数の第１データがある場合に、特定の第１データばかりに寄与が類似した第２データが訓練データに追加されると決定されることがある。その場合、その特定の第１データに類似したデータに対して再び誤推論することが抑制できる一方、複数の第１データのうちその特定の第１データを除く第１データについては、再び誤推論することが抑制されないことになり、複数の第１データについて均等に誤推論を抑制することができない。上記態様によれば、複数の第１データについて均等に誤推論を抑制することができる。よって、上記態様によれば、複数の第１データについて均等に、推論器による推論の性能を効率よく向上させることができる。

例えば、前記推論器は、識別器又は検出器であってもよい。

上記態様によれば、識別器による識別処理における誤識別、又は、検出器による検出処理における誤検出を抑制できる。よって、上記態様によれば、識別器による識別の精度、又は、検出器による検出の精度を効率よく向上させることができる。

例えば、前記第１データおよび前記第２データは、センシングデータであってもよい。

上記態様によれば、センシングデータを対象とした推論の性能を効率よく向上させることができる。

例えば、前記第１関連データは、前記第１出力データであり、前記第２関連データは、前記第２出力データであってもよい。

上記態様によれば、第１関連データとして第１出力データを用いて、より容易に、推論器による推論の性能を効率よく向上させることができる。

例えば、前記推論器の訓練データに追加すべきと決定された前記第２データを示す情報を提示装置を介して提示してもよい。

上記態様によれば、訓練データに追加すべきと決定された第２データを示す情報が提示される。提示装置は、上記情報に基づいて第２データをユーザに提示し、第２データを示す情報についてのラベルの入力をユーザから受け付ける。このように入力されたラベルを用いて、訓練データへのデータの追加がなされる。よって、追加すべきデータのラベルをユーザから受け付けることに基づいて、推論器による推論の性能をより一層効率よく向上させることができる。

また、本発明の一態様に係る情報処理システムは、第１データと、推論器の訓練に用いられた訓練データに含まれていない第２データとを取得する取得部と、（ａ）前記訓練データを用いた機械学習により訓練された前記推論器に前記第１データを入力して得られる第１関連データを用いて、前記推論器に前記第１データを入力して前記推論器から出力される第１出力データに対する前記第１データの各部分の寄与である第１寄与を算出し、（ｂ）前記推論器に前記第２データを入力して得られる第２関連データを用いて、前記推論器に前記第２データを入力して前記推論器から出力される第２出力データに対する前記第２データの各部分の寄与である第２寄与を算出する、算出部と、前記第１寄与と前記第２寄与との類似度にしたがって、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する決定部とを備える。

上記態様によれば、上記情報処理方法と同様の効果を奏する。

なお、これらの包括的または具体的な態様は、システム、装置、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよく、システム、装置、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。

以下、実施の形態について、図面を参照しながら具体的に説明する。

なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

（実施の形態）
本実施の形態において、推論器による推論の性能を効率よく向上させることができる情報処理システム、及び、情報処理方法などについて説明する。

まず、図１～図３を参照しながら、認識器１０の動作の概要を説明する。

図１は、認識器１０の処理を示す概念図である。

図１に示されるように、認識器１０は、入力データが入力されると、入力データに対する認識処理を実行し、その実行結果を出力データとして出力する装置である。入力データが画像である場合を例として説明するが、入力データは、画像のほかにも、音声又は文章を用いることもできる。入力データが画像である場合、認識処理は、入力データである画像に何が示されているかを認識する処理である。

なお、認識器１０は推論器の一例である。推論器の他の例は検出器である。検出器は、入力データが入力されると、入力データに対する検出処理を実行し、その実行結果を出力データとして出力する装置である。入力データが画像である場合、検出処理は、例えば、入力データである画像において、特定の被写体を検出する処理である。

入力データは、認識器１０による認識の対象となる画像データである。

認識器１０は、機械学習による訓練によって生成された認識モデルであり、認識処理の実行に用いられる。認識器１０は、内部に複数のパラメータを有しており、適切なパラメータが設定されることにより、入力データに対して適切な出力データを出力するように訓練されて生成されたものである。認識器１０は、例えば、ニューラルネットワークの数理モデルであり、より具体的には、ＳＳＤ（ＳｉｎｇｌｅＳｈｏｔｍｕｌｔｉｂｏｘＤｅｔｅｃｔｏｒ）、Ｆａｓｔｅｒ－ＲＣＮＮ（ＦａｓｔｅｒＲｅｇｉｏｎ－ｂａｓｅｄＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）、又は、ＹＯＬＯ（ＹｏｕＯｎｌｙＬｏｏｋＯｎｃｅ）等のような物体検出方法に対応する認識モデルが用いられてもよい。

出力データは、認識器１０が出力するデータであって、認識器１０による認識の結果を示す。出力データは、具体的には、入力データである画像に何が示されているかを示す。

図２は、認識器１０の生成のための機械学習による訓練に用いられる訓練データの例を示す説明図である。ここでは、認識器１０が、０から９までの１０個の数字が描かれた画像を入力データとして取得し、その画像に描かれた数字を認識して出力する場合を例として説明する。

図２に示されるように、訓練データは、画像とラベルとの組を複数含む。

訓練データに含まれる画像は、０から９までの１０個の数字が描かれた画像である。訓練データには、１つの数字をさまざまなパターンで描いた画像が含まれており、例えば数千個～数万個の画像が含まれている。

ラベルは、当該ラベルと組になっている画像につき１つ付されており、その画像に描かれた数字を示している。

認識器１０は、図２に示される訓練データを用いた機械学習により生成される。具体的には、認識器１０は、訓練データに含まれる画像が入力データとして入力された場合に、入力された画像と組になっているラベルの数値を出力するように、内部パラメータが調整されることにより生成されたものである。

図３は、認識器１０による認識の結果の例を示す説明図である。図３には、認識器１０に入力データを入力したときに出力される出力データの例が示されている。

例えば、認識器１０は、図３に示される入力データ１（つまり「５」が描かれた画像）が入力された場合、出力データとして「５」を出力したことが示されている。また、認識器１０は、図３に示される入力データ２（つまり「１」が描かれた画像）が入力された場合、出力データとして「１」を出力したことが示されている。

これらは、それぞれ、入力された画像に描かれた数字と同じ数字を認識器１０が認識したことを示しており、認識器１０が正しい認識をしたことを意味している。

一方、例えば、認識器１０は、図３に示される入力データ３（つまり「４」が描かれた画像）が入力された場合、出力データとして「７」を出力したことが示されている。また、認識器１０は、図３に示される入力データ４（つまり「１」が描かれた画像）が入力された場合、出力データとして「９」を出力したことが示されている。

これらは、それぞれ、入力された画像に描かれた数字と異なる数字を認識器１０が認識したことを示しており、認識器１０が誤認識をしたことを意味している。

認識器１０が誤認識をしたことが判明した場合、そのような誤認識を防ぐことが想定される。そのような誤認識を防ぐには、訓練データの拡充が有効である。訓練データの拡充には、認識器１０の訓練に用いられた訓練データに含まれていない新たなデータを追加した、新たな訓練データを用いて、認識器１０を生成することが行われる。

しかし、追加すべき新たなデータを決定することは難しい。例えば、図３に示される入力データ３（つまり「４」が描かれた画像）が入力された場合に、出力データとして「４」を出力するようにするには、「４」又は「７」が描かれた画像であって入力データ３とは異なる画像を含むデータを訓練データに追加するとよいとも考えられるが、具体的にどのような画像を追加するのが適切であるのかを特定することは難しい。

本実施の形態の処理システムは、上記のように認識器１０が誤認識をした場合に、その後、そのような誤認識を防ぐためにどのようなデータを訓練データに追加すべきかを適切に決定することによって、認識器１０による認識の精度を効率よく向上させることができる情報処理システムである。

以降において、本実施の形態における処理システムについて説明する。

まず、本実施の形態における処理システムについて説明する。

図４は、本実施の形態における処理システムの構成の第一例を示すブロック図である。

図４に示されるように、処理システム２０Ａは、取得部５１と、算出部５２と、決定部５３とを備える情報処理システムである。

取得部５１は、コンピュータによって、第１データと、推論器の訓練に用いられた訓練データに含まれていない第２データとを取得する。

算出部５２は、コンピュータによって、（ａ）機械学習を用いて訓練された推論器に第１データを入力して得られる第１関連データを用いて、推論器に第１データを入力して推論器から出力される第１出力データに対する第１データの各部分の寄与である第１寄与を算出し、（ｂ）推論器に第２データを入力して得られる第２関連データを用いて、推論器に第２データを入力して推論器から出力される第２出力データに対する第２データの各部分の寄与である第２寄与を算出する。

決定部５３は、コンピュータによって、第１寄与と第２寄与との類似度にしたがって、第２データを推論器の訓練データに追加すべきか否かを決定する。

次に、本実施の形態における処理システムについてより詳細に説明する。

図５は、本実施の形態における処理システムの構成の第二例を示すブロック図である。

図５に示されるように、処理システム２０は、制御部２１と、蓄積部２２と、算出部２３と、決定部２４と、訓練部２５とを備える。処理システム２０は、認識器１０に接続されており、認識器１０にデータを入力したり、認識器１０からデータを取得したりする。また、処理システム２０は、管理装置３０に接続されている。処理システム２０は、例えば、コンピュータにより実現される。

制御部２１は、認識器１０に入力データを入力し、また、認識器１０が出力する出力データを取得する処理部である。

具体的には、制御部２１は、第１データと第２データとを少なくとも認識器１０に提供することで、認識器１０に入力する。ここで、第１データは、例えば、評価用データであって、認識器１０に入力され、認識器１０が誤認識したデータ（以下、誤認識データともいう）である。制御部２１は、例えば以下のようにして誤認識データを得る。

制御部２１は、画像に描かれた数字が既知である画像（評価用画像ともいう）を入力データとして認識器１０に入力して得られる出力データである数字と、上記入力データである画像に描かれた数字とを比較する。制御部２１は、これらの数字が一致しない場合、上記入力データを、認識器１０による誤認識がなされたデータ、つまり誤認識データとする。制御部２１は、このようにして誤認識データを取得する。

また、第２データは、認識器１０の訓練（言い換えれば、認識器１０の生成のために行われた訓練）に用いられた訓練データに含まれていないデータである。制御部２１は、蓄積部２２に蓄積されている画像を、第２データとして取得する。第２データは、後に訓練データに追加される候補であるので、候補データともいう。

蓄積部２２は、画像を蓄積している記憶装置である。蓄積部２２に蓄積されている画像には、ラベルが付されていない。蓄積部２２に蓄積されている画像は、制御部２１により、第２データとして取得される。

なお、第１データおよび第２データの具体例は、センシングデータであり、より具体的には、カメラによるセンシング（撮像）によって取得した画像データである。

算出部２３は、認識器１０に入力データを入力して出力される出力データに対する、入力データの各部分の寄与を算出する処理部である。具体的には、算出部２３は、認識器１０に第１データを入力して得られる第１関連データを用いて、認識器１０に第１データを入力して認識器１０から出力される第１出力データに対する第１データの各部分の寄与である第１寄与を算出する。また、算出部２３は、認識器１０に第２データを入力して得られる第２関連データを用いて、認識器１０に第２データを入力して認識器１０から出力される第２出力データに対する第２データの各部分の寄与である第２寄与を算出する。

ここで、第１データが画像である場合、「第１データの各部分」とは第１データを構成する各画素である。また、「第１出力データに対する第１データの各部分の寄与」とは、認識器１０がその認識結果である数字を認識したことに対して、第１データを構成する各画素がどの程度寄与したかを示す量である。この量を数値化したものを、寄与した度合い、つまり寄与度ともいう。「第２データの各部分」および「第２出力データに対する第２データの各部分の寄与」についても同様である。

なお、第１関連データ及び第２関連データの具体例は、第１出力データ及び第２出力データである。また、第１関連データ及び第２関連データは、第１データ及び第２データをそれぞれ推論器に入力した場合の推論器の中間層がそれぞれ出力したデータであってもよい。当該中間層は、最終層（言い換えると出力層）に近い層であってよい。

決定部２４は、算出部２３が算出した第１寄与と第２寄与との類似度にしたがって、第２データを認識器１０の訓練データに追加すべきか否かを決定する処理部である。決定部２４は、第２データを訓練データに追加すべきと決定した場合には、第２データを示す情報を管理装置３０に提供する。

訓練部２５は、認識器１０を生成する処理部である。訓練部２５は、訓練データ格納部２６を有しており、訓練データ格納部２６に格納された訓練データを用いた機械学習により認識器１０を生成する。具体的には、認識器１０は、訓練データ格納部２６に格納された訓練データの画像が入力データとして入力された場合に、訓練データ上でその画像に付されたラベルの数値を出力データとして出力するように、内部パラメータを調整することによって生成される。

また、訓練部２５は、訓練データ格納部２６に新たな訓練データ（追加データともいう）を追加する。訓練部２５は、管理装置３０から、追加データを追加する指示（追加指示ともいう）を受ける。追加指示には、第２データを特定する情報と、その第２データに描かれた数字であるラベルとが含まれている。訓練部２５は、追加指示に含まれる情報に基づいて第２データを蓄積部２２から取得し、取得した第２データと追加指示に含まれるラベルとを組にして、訓練データに追加する。訓練部２５は、第２データを追加すべきという決定が決定部２４によってなされた場合、新たな訓練データが追加された後に訓練データ格納部２６に格納されている訓練データを用いて、認識器１０を訓練する。

管理装置３０は、第２データを示す情報が決定部２４から提供された場合、その情報をユーザＵに提示する。ここで、管理装置３０は提示装置に相当する。ユーザＵは、提示された情報に基づいて、第２データに描かれている数字を判断し、判断した数字をラベルとして管理装置３０に入力する。

管理装置３０は、第２データに含まれている数字を示すラベルをユーザＵから受け付ける。管理装置３０は、第２データを特定する情報と、ラベルとを含む追加指示を訓練部２５に送信する。管理装置３０がこのように送信した追加指示により、訓練部２５による訓練データの生成がなされる。

図６は、本実施の形態における算出部２３による寄与度の算出と、類似度の算出とを具体的に示す説明図である。

図６に示される画像３１は、認識器１０に入力される入力データの一例であり、例えば、認識器１０が誤認識したデータである。すなわち、画像３１は、「４」が描かれた画像であるが、認識器１０は画像３１を「４」と異なる数字である「７」と識別したものとする。

算出部２３は、画像３１を認識器１０に入力して得られる関連データを取得する。関連データは、認識器１０の出力データである。算出部２３は、関連データに基づいて寄与度３５を算出する。寄与度３５は、出力データに対する入力データの各部分の寄与の度合いである。例えば、寄与度３５は、画像３１を構成する画素ごとに、画像３１が認識器１０によって所定の数字と認識されるのに寄与した度合いである。なお、所定の数字は、認識器１０が出力データとして出力した「７」であってもよいし、入力データに描かれた「４」であってもよい。寄与度３５は、グレースケールで表現されている。白が最も寄与度が高い画素を示しており、黒が最も寄与度が低い画素を示しており、グレーは、白に近いほど、寄与度がより高い画素であることを示している。

図６に示される画像３２は、認識器１０に入力される入力データの一例であり、蓄積部２２に蓄積されているが、訓練データには含まれていない画像の一例である。画像３２は、「４」が描かれた画像であるが、ラベルが付されていない。

算出部２３は、画像３２を認識器１０に入力して得られる関連データを取得し、また、関連データに基づいて寄与度３６を算出する。関連データもまた、認識器１０の出力データである。例えば、寄与度３６は、画像３２に含まれる画素ごとに、画像３２が認識器１０によって所定の数字と認識されるのに寄与した度合いである。なお、所定の数字は、上記のように認識器１０に画像３１が入力されて関連データが出力されたときに使用された所定の数字と同じである。

算出部２３は、寄与度３５と寄与度３６との類似度を算出する。類似度の算出は、公知の技術によりなされ、具体例として、固定次元のベクトルにプーリングしたうえで、内積又はコサイン距離を算出することでなされる。なお、算出部２３は、類似度を所定の数値範囲で表現するように、適切な演算により数値範囲を変更してもよい。ここでは、類似度を１～１０までの整数により１０段階で表現するとする。類似度１は、類似度が最も低いことを意味し、類似度１０は、類似度が最も高いことを意味することとする。

図７は、本実施の形態における決定部２４による追加データの決定方法の第一例を示す説明図である。図７には、一例として、１つの誤認識データがある場合に、蓄積部２２に含まれている複数の画像Ｐ、Ｑ、Ｒ及びＳのうちのどれを訓練データに追加すべきかを決定する方法が示されている。

算出部２３は、上記１つの誤認識データの寄与度と、蓄積部２２に含まれている複数の候補データである画像Ｐ、Ｑ、Ｒ及びＳの寄与度それぞれとの類似度を算出する。ここでは、画像Ｐ、Ｑ、Ｒ及びＳについての寄与度の類似度が、それぞれ、６、７、５及び１となったとする（図７の（ａ）参照）。

決定部２４は、候補データを訓練データに追加すべきか否かを決定するときに、蓄積部２２に含まれる複数の候補データのうち、１つの誤認識データの寄与度と、当該候補データについての寄与度との類似度が高い候補データを、より優先的に訓練データに追加するように上記決定をする。

例えば、決定部２４は、寄与度の類似度が大きいデータから順に、優先度１、２、・・・を割り当てる。ここで優先度は、数値が小さいほど、より優先されることを意味している。具体的には、決定部２４は、類似度が最大である７である画像Ｑの優先度を１とし、類似度が７の次に大きい６である画像Ｐの優先度を２とし、以下同様に、画像Ｒ及びＳの優先度をそれぞれ３及び４とする。

そして、決定部２４は、類似度が高い画像から順に所定数個、つまり優先度が小さい画像から所定数個の画像を選択して訓練データに追加する。例えば、訓練データに追加する画像の個数が２である場合、決定部２４は、優先度が１及び２である画像Ｑ及びＰが訓練データにされるように、画像Ｐ及びＱについて訓練データに追加すべきと決定し、画像Ｒ及びＳについて訓練データに追加すべきでないと決定する。

なお、誤認識データが複数ある場合には、複数の誤認識データに基づいて、訓練データに追加すべき画像を決定する。このような場合の追加データの決定方法について、２つの例を以下で説明する。

（１）すべての候補データの類似度を利用する例
図８は、本実施の形態における決定部２４による追加データの決定方法の第二例を示す説明図である。

図８には、一例として、３つの誤認識データＡ、Ｂ及びＣがある場合に、蓄積部２２に含まれている複数の候補データである画像Ｐ、Ｑ、Ｒ及びＳのうちのどれを訓練データに追加すべきかを決定する方法が示されている。

算出部２３は、上記３つの誤認識データＡ、Ｂ及びＣの寄与度と、蓄積部２２に含まれている複数の候補データである画像Ｐ、Ｑ、Ｒ及びＳそれぞれの寄与度との類似度を算出する。ここでは、誤認識データＡの寄与度と、画像Ｐ、Ｑ、Ｒ及びＳそれぞれについての寄与度との類似度が６、７、５及び１となったとする。また、誤認識データＢの寄与度と、画像Ｐ、Ｑ、Ｒ及びＳそれぞれについての寄与度との類似度が２、２、３及び４となったとする。また、誤認識データＣの寄与度と、画像Ｐ、Ｑ、Ｒ及びＳそれぞれについての寄与度との類似度が１、３、１及び３となったとする（図８参照）。

決定部２４は、複数の誤認識データそれぞれについての寄与度を含む複数の寄与度を算出し、算出した複数の寄与度それぞれと、候補データについての寄与度との類似度を含む複数の類似度から算出される代表値にしたがって、上記決定をする。

例えば、複数の類似度の代表値は、複数の類似度のうちの最大値を用いることができる。図８の例では、画像Ｐについての類似度の代表値は、誤認識データＡ、Ｂ及びＣそれぞれの寄与度と、画像Ｐの寄与度との類似度である６、２及び１の最大値である６である。同様に、画像Ｑ、Ｒ及びＳについての類似度の代表値は、それぞれ、７、５及び４である。

そして、決定部２４は、類似度の代表値が高いデータから順に所定数個のデータを訓練データに追加すべきと決定する。訓練データに追加すべきデータを決定する処理については、誤認識データが１つである場合（図７参照）と同様であるので、説明を省略する。

なお、複数の類似度の代表値として、複数の類似度の平均値を用いることもできる。

このようにして、誤認識データが複数ある場合に、すべての候補データの類似度を利用して、訓練データに追加すべき画像を決定することができる。

（２）誤認識データごとに所定数個の候補データの類似度を利用する例
図９は、実施の形態における決定部２４による追加データの決定方法の第三例を示す説明図である。

図９には、図８に示される類似度が算出された後、誤認識データごとに所定数個の候補データを利用する方法が示されている。

ここで、複数の類似度は、複数の第１寄与それぞれと、複数の第２データそれぞれについての第２寄与を含む複数の第２寄与それぞれと、の類似度を含んでいる。

そして、決定部２４は、代表値を算出する際には、複数の第１データごとに、複数の類似度から所定数の類似度を選択し、複数の第２データごとに、選択された所定数の類似度を用いて代表値を算出する。そして、決定部２４は、第２データを訓練データに追加すべきか否かを決定する際には、算出した複数の代表値にしたがって、当該第２データを訓練データに追加すべきか否かを決定する。

例えば、所定数が２である場合、決定部２４は、誤認識データＡ、Ｂ及びＣについてそれぞれ２個の類似度を選択する。２個の類似度の選択の仕方は、例えば類似度が大きいデータをより優先的に選択する方法を採用することができ、この方法を説明するが、これに限られない。

決定部２４は、誤認識データＡについて、比較的大きい２個の類似度として、類似度７（画像Ｑに相当）と、類似度６（画像Ｐに相当）とを選択する。ここで、選択されなかったデータである画像Ｒ及びＳについては、類似度を考慮しないという意味で「Ｎ／Ａ」と記載している（図９参照）。

同様に、決定部２４は、誤認識データＢについて、比較的大きい２個の類似度として、類似度４（画像Ｓに相当）と、類似度３（画像Ｒに相当）とを選択する。また、決定部２４は、誤認識データＣについて、比較的大きい２個の類似度として、類似度３（画像Ｑに相当）及び類似度３（画像Ｓに相当）を選択する。

そして、決定部２４は、上記のように決定した類似度を用いて類似度の代表値を算出する。具体的には、決定部２４は、画像Ｐ、Ｑ、Ｒ及びＳについて、選択しなかったデータつまり「Ｎ／Ａ」と記載されたデータを除外して類似度の代表値を、６、７、３及び４と算出する。

そして、決定部２４は、類似度の代表値が高いデータから順に所定数個のデータを選択して訓練データに追加する。訓練データに追加すべきデータを選択する処理については、誤認識データが１つである場合（図７参照）と同様であるので、説明を省略する。

このようにすることで、特定の誤認識データばかりに寄与度が類似した候補データが訓練データに追加されると決定されることを抑制できる。誤認識データと、蓄積部２２に蓄積されている画像Ｐ、Ｑ、Ｒ及びＳとの類似度によっては、誤認識データＡ、Ｂ及びＣのうち、誤認識データＡばかりに寄与が類似した候補データが訓練データに追加されることがある（図８参照）。その場合、誤認識データＡに類似した画像に対して再び誤推論することが抑制できる一方、誤認識データＢ及びＣに類似した画像については、再び誤推論することが抑制されない。そこで、上記のように選択しなかったデータを除外して類似度の代表値を算出することで、複数の誤認識データＡ、Ｂ及びＣについて均等に誤推論を抑制することができる。

以上のように構成された処理システムの処理の方法、つまり情報処理方法を説明する。

図１０は、本実施の形態における処理システムが実行する処理の第一例を示すフロー図である。

図１０に示される処理は、コンピュータにより実行される情報処理方法である。

図１０に示されるように、ステップＳ１において、第１データと、推論器の訓練に用いられた訓練データに含まれていない第２データとを取得する。

ステップＳ２において、機械学習を用いて訓練された推論器に第１データを入力して得られる第１関連データを用いて、推論器に第１データを入力して推論器から出力される第１出力データに対する第１データの各部分の寄与である第１寄与を算出する。

ステップＳ３において、推論器に第２データを入力して得られる第２関連データを用いて、推論器に第２データを入力して推論器から出力される第２出力データに対する第２データの各部分の寄与である第２寄与を算出する。

ステップＳ４において、第１寄与と第２寄与との類似度にしたがって、第２データを推論器の訓練データに追加すべきか否かを決定する。

図１１は、本実施の形態における処理システムが実行する処理を示すフロー図である。

ステップＳ１０１において、制御部２１は、評価用データを取得し、取得した評価用データを入力データとして認識器１０に入力し、出力データを取得する。また、算出部２３は、上記入力データを認識器１０に入力して得られる関連データを取得する。

ステップＳ１０２において、制御部２１は、ステップＳ１０１で取得した出力データと、評価用データに付されているラベルとが一致するか否かを判定し、一致していないと判定した場合に、ステップＳ１０１で認識器１０に入力した評価用データを誤認識データとして選別する。

ステップＳ１０３において、算出部２３は、ステップＳ１０２で選別した誤認識データについて、ステップＳ１０１で取得した関連データを用いて、ステップＳ１０１で取得した出力データに対する入力データの各部分の寄与度を算出する。

ステップＳ１０４において、制御部２１は、蓄積部２２に蓄積されているデータを候補データとして取得し、取得した候補データを入力データとして認識器１０に入力し、出力データを取得する。また、算出部２３は、上記入力データを認識器１０に入力して得られる関連データを取得する。

ステップＳ１０５において、算出部２３は、ステップＳ１０４で認識器１０に入力した候補データについて、ステップＳ１０４で取得した関連データを用いて、ステップＳ１０４で取得した出力データに対する入力データの各部分の寄与度を算出する。

ステップＳ１０６において、算出部２３は、ステップＳ１０３で算出した寄与度と、ステップＳ１０４で算出した寄与度との類似度を算出する。

ステップＳ１０７において、決定部２４は、候補データのうち、誤認識データの寄与度との類似度が高いデータを追加データとして決定する。決定部２４は、決定した追加データを特定する情報を管理装置３０に送信し、ユーザＵに提示する。ユーザＵは、追加データを参照し、追加データに付すラベルを管理装置３０に入力する。管理装置３０は、入力されたラベルを訓練部２５に、通信回線を通じて送信するなどして提供する。

ステップＳ１０８において、訓練部２５は、追加データに付すラベルを管理装置３０から、通信回線を通じて受信するなどして取得する。

ステップＳ１０９において、訓練部２５は、ラベルを付した追加データを訓練データに追加する。

ステップＳ１１０において、訓練部２５は、ステップＳ１０９で追加データを追加した訓練データを用いて機械学習によって認識器１０を生成する。ステップＳ１１０を終えたら、図１１に示される一連の処理を終了する。

以上の処理によって、処理システムは、認識器１０による認識の精度を効率よく向上させることができる。

（変形例１）
本変形例では、推論器による推論の性能を効率よく向上させることができる情報処理方法について、認識器１０の性能を所定以上に向上させることができる技術を説明する。

本変形例に係る処理システムの構成は、実施の形態における処理システム２０の構成と同じである（図５参照）。

本変形例に係る処理システムが実行する処理について、実施の形態における処理システム２０におけるものと異なる部分について説明する。なお、本変形例に係る処理システムが実行する処理のうち、実施の形態における処理システム２０における処理（図１１参照）と同じ処理については、同じ符号を付し、詳細な説明を省略する。

図１２は、本変形例における処理システムが実行する処理を示すフロー図である。

図１２に示されるステップＳ１０１～ステップＳ１１０は、図１１に示される処理と同じである。

ステップＳ１１１において、制御部２１は、ステップＳ１１０で生成された認識器１０の性能の評価を行う。性能の評価では、制御部２１は、評価用データを入力データとして認識器１０に入力し、出力データを取得する。そして、評価用データに予め付されているラベルと出力データとが一致する割合を性能値として算出する。例えば、評価用データの個数が１００であり、１００のうち９５の評価用データについてラベルと出力データとが一致し、１００のうち５の評価データについてラベルと出力データとが一致しない場合、性能値として「９５％」と算出する。

ステップＳ１１２において、制御部２１は、ステップＳ１１１で評価された性能が所定以上であるか否かを判定する。具体的には、制御部２１は、ステップＳ１１１で算出した性能値と所定値（例えば９０％）との大小比較をし、性能値が所定値以上であると判定した場合に、性能が所定以上であると判定する。認識器１０の性能が所定以上であると判定した場合（ステップＳ１１２でＹｅｓ）には、図１２に示された一連の処理を終了し、そうでない場合（ステップＳ１１２でＮｏ）には、ステップＳ１０１を再び実行する。

このようにすることで、認識器１０の性能が所定以上になるまで訓練データを追加し、認識器１０の性能を所定以上に向上させることができる。

なお、ステップＳ１１２において性能値が所定以上でないと判定されることが所定回数以上続いた場合には、ステップＳ１０１を実行せずに処理を中止してもよい。その場合、処理を中止したことを示すエラーメッセージを提示してもよい。

以上の一連の処理により、処理システムは、認識器による認識の精度を効率よく向上させる際に、認識器の性能を所定以上に向上させることができる。

（変形例２）
本変形例では、推論器による推論の性能を効率よく向上させることができる情報処理方法について、推論の性能の向上を繰り返し実行する技術を説明する。

図１３は、本変形例における処理システムが実行する処理を示すフロー図である。

ここで、蓄積部２２には、繰り返し新たな画像が蓄積される前提である。例えば、蓄積部２２は、車載カメラによる数分おきのセンシングにより得られた画像が、通信回線を経由して蓄積されるとする。

ステップＳ１２１において、制御部２１は、蓄積部２２に所定数以上のデータが蓄積されているか否かを判定する。蓄積されていると判定した場合（ステップＳ１２１でＹｅｓ）には、ステップＳ１２２を実行し、そうでない場合（ステップＳ１２１でＮｏ）には、ステップＳ１２１を再び実行する。すなわち、制御部２１は、蓄積部２２に所定数以上のデータが蓄積されるまでステップＳ１２１で待機する。なお、所定数は例えば１０００程度とする。

図１３に示されるステップＳ１０１～ステップＳ１１０は、図１１に示される処理と同じである。

ステップＳ１２２において、制御部２１は、蓄積部２２に蓄積されているデータを消去する。

ステップＳ１２２を終えたら、制御部２１は再びステップＳ１２１を実行する。このようにすることで、処理システム２０は、蓄積部２２に他の手段によりデータが蓄積されていく状況において、所定数以上のデータが蓄積部２２に蓄積されるごとに、ステップＳ１０１～Ｓ１１０の処理によって追加データを訓練データに追加する。

以上の一連の処理により、処理システムは、認識器による認識の精度を効率よく向上させる際に、認識の精度を繰り返し向上させることができる。

以上のように、実施の形態及び各変形例に示される情報処理方法は、第１データと類似した寄与を有する第２データを訓練データに追加すべきと決定する。寄与とは、推論器による推論の処理において、推論の結果に影響を与えたことを示している。そのため、当該推論器にとって、推論の結果に与える影響が第１データと類似している第２データを選出することができる。そして、選出された第２データを訓練データとして用いて当該推論器を訓練すれば、第１データおよび当該第１データと類似したデータに対して当該推論器が誤推論することが抑制されやすくなる。また、当該推論器にとって有効なデータが訓練データに追加されることにより、無作為に大量のデータを追加することを回避できる。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。

また、誤推論データと類似した寄与を有する第２データを訓練データに追加すべきと決定する。そして、この決定に基づいて上記第２データが追加された訓練データを用いて推論器を訓練すれば、誤推論したデータと類似したデータに対して再び誤推論することが抑制され得る。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。

また、第２データを訓練データに追加すべきという決定に基づいて第２データが追加された訓練データによって推論器が訓練される。これにより、第１データと類似したデータに対して再び誤推論することが実際に抑制できる。よって、上記態様によれば、推論器による推論の性能を効率よく向上させることができる。

また、予め用意された複数の第２データのうちから、第１データと寄与がより一層類似する第２データを選択して、訓練データに追加すべきという決定をすることができる。よって、上記態様によれば、推論器による推論の性能をより一層効率よく向上させることができる。

また、複数の第１データがある場合には、複数の第１データそれぞれについて算出される複数の類似度から算出される代表値を用いて、訓練データに追加すべき第２データを決定する。複数の第１データがある場合、複数の類似度が算出されるが、どの第２データを訓練データに追加すべきであるかについて、複数の類似度を用いて決定することが難しい。そこで、複数の類似度から算出される代表値を用いることで、どの第２データを訓練データに追加すべきであるかを容易に決定することができる。よって、上記態様によれば、推論器による推論の性能をより容易に向上させることができる。

また、複数の第１データがある場合に、特定の第１データばかりに寄与が類似した第２データが訓練データに追加されると決定されることを抑制できる。複数の第１データがある場合に、特定の第１データばかりに寄与が類似した第２データが訓練データに追加されると決定されることがある。その場合、その特定の第１データに類似したデータに対して再び誤推論することが抑制できる一方、複数の第１データのうちその特定の第１データを除く第１データについては、再び誤推論することが抑制されないことになり、複数の第１データについて均等に誤推論を抑制することができない。上記態様によれば、複数の第１データについて均等に誤推論を抑制することができる。よって、上記態様によれば、複数の第１データについて均等に、推論器による推論の性能を効率よく向上させることができる。

また、識別器による識別処理における誤識別、又は、検出器による検出処理における誤検出を抑制できる。よって、上記態様によれば、識別器による識別の精度、又は、検出器による検出の精度を効率よく向上させることができる。

また、センシングデータを対象とした推論の性能を効率よく向上させることができる。

また、第１関連データとして第１出力データを用いて、より容易に、推論器による推論の性能を効率よく向上させることができる。

また、訓練データに追加すべきと決定された第２データを示す情報が提示される。提示装置は、上記情報に基づいて第２データをユーザに提示し、第２データを示す情報についてのラベルの入力をユーザから受け付ける。このように入力されたラベルを用いて、訓練データへのデータの追加がなされる。よって、追加すべきデータのラベルをユーザから受け付けることに基づいて、推論器による推論の性能をより一層効率よく向上させることができる。

なお、上記実施の形態及び各変形例において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記実施の形態及び各変形例の処理システムなどを実現するソフトウェアは、次のようなプログラムである。

すなわち、このプログラムは、コンピュータに、コンピュータにより実行される情報処理方法であって、第１データと、推論器の訓練に用いられた訓練データに含まれていない第２データとを取得し、前記訓練データを用いた機械学習により訓練された前記推論器に前記第１データを入力して得られる第１関連データを用いて、前記推論器に前記第１データを入力して前記推論器から出力される第１出力データに対する前記第１データの各部分の寄与である第１寄与を算出し、前記推論器に前記第２データを入力して得られる第２関連データを用いて、前記推論器に前記第２データを入力して前記推論器から出力される第２出力データに対する前記第２データの各部分の寄与である第２寄与を算出し、前記第１寄与と前記第２寄与との類似度にしたがって、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する情報処理方法を実行させるプログラムである。

以上、一つまたは複数の態様に係る処理システムなどについて、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、一つまたは複数の態様の範囲内に含まれてもよい。

本発明は、推論器による推論の性能を効率よく向上させる処理システムに利用可能である。

１０認識器
２０、２０Ａ処理システム
２１制御部
２２蓄積部
２３、５２算出部
２４、５３決定部
２５訓練部
２６訓練データ格納部
３０管理装置
３１、３２、Ｐ、Ｑ、Ｒ、Ｓ画像
３５、３６寄与度
５１取得部
Ａ、Ｂ、Ｃ誤認識データ
Ｕユーザ

Claims

コンピュータにより実行される情報処理方法であって、
第１データと、推論器の訓練に用いられた訓練データに含まれていない第２データとを取得し、
前記訓練データを用いた機械学習により訓練された前記推論器に前記第１データを入力して得られる第１関連データを用いて、前記推論器に前記第１データを入力して前記推論器から出力される第１出力データに対する前記第１データの各部分の寄与である第１寄与を算出し、
前記推論器に前記第２データを入力して得られる第２関連データを用いて、前記推論器に前記第２データを入力して前記推論器から出力される第２出力データに対する前記第２データの各部分の寄与である第２寄与を算出し、
前記第１寄与と前記第２寄与との類似度にしたがって、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する
情報処理方法。
前記第１データは、前記推論器の誤推論データである
請求項１に記載の情報処理方法。
前記第２データを追加すべきと決定された場合、前記第２データが追加された前記推論器の訓練データを用いて前記推論器を訓練する
請求項１又は２に記載の情報処理方法。
前記第２データを前記推論器の訓練データに追加すべきか否かを決定する際には、
複数の前記第２データのうち、前記第１寄与と前記第２寄与との類似度が高い前記第２データが、他の前記第２データより優先的に前記推論器の訓練データに追加されるように、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する
請求項１～３のいずれか１項に記載の情報処理方法。
前記第２データを前記推論器の訓練データに追加すべきか否かを決定する際には、
複数の前記第１データそれぞれについての前記第１寄与を含む複数の前記第１寄与を算出し、
算出した前記複数の前記第１寄与それぞれと前記第２寄与との類似度を含む複数の類似度を用いて算出される代表値にしたがって、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する
請求項１～４のいずれか１項に記載の情報処理方法。
前記複数の類似度は、前記複数の前記第１寄与それぞれと、複数の前記第２データそれぞれについての前記第２寄与を含む複数の前記第２寄与それぞれと、の類似度を含み、
前記代表値を算出する際には、
前記複数の前記第１データごとに、前記複数の類似度から所定数の類似度を選択し、
前記複数の第２データごとに、選択された前記所定数の類似度を用いて前記代表値を算出し、
前記第２データを前記推論器の訓練データに追加すべきか否かを決定する際には、
算出した複数の前記代表値にしたがって、当該第２データを前記推論器の訓練データに追加すべきか否かを決定する
請求項５に記載の情報処理方法。
前記推論器は、識別器又は検出器である
請求項１～６のいずれか１項に記載の情報処理方法。
前記第１データおよび前記第２データは、センシングデータである
請求項１～７のいずれか１項に記載の情報処理方法。
前記第１関連データは、前記第１出力データであり、
前記第２関連データは、前記第２出力データである
請求項１～８のいずれか１項に記載の情報処理方法。
前記推論器の訓練データに追加すべきと決定された前記第２データを示す情報を提示装置を介して提示する
請求項１～９のいずれか１項に記載の情報処理方法。
第１データと、推論器の訓練に用いられた訓練データに含まれていない第２データとを取得する取得部と、
（ａ）前記訓練データを用いた機械学習により訓練された前記推論器に前記第１データを入力して得られる第１関連データを用いて、前記推論器に前記第１データを入力して前記推論器から出力される第１出力データに対する前記第１データの各部分の寄与である第１寄与を算出し、（ｂ）前記推論器に前記第２データを入力して得られる第２関連データを用いて、前記推論器に前記第２データを入力して前記推論器から出力される第２出力データに対する前記第２データの各部分の寄与である第２寄与を算出する、算出部と、
前記第１寄与と前記第２寄与との類似度にしたがって、前記第２データを前記推論器の訓練データに追加すべきか否かを決定する決定部とを備える
情報処理システム。