JP7383684B2 - 情報処理装置、情報処理方法、並びにプログラム - Google Patents

情報処理装置、情報処理方法、並びにプログラム Download PDF

Info

Publication number
JP7383684B2
JP7383684B2 JP2021199409A JP2021199409A JP7383684B2 JP 7383684 B2 JP7383684 B2 JP 7383684B2 JP 2021199409 A JP2021199409 A JP 2021199409A JP 2021199409 A JP2021199409 A JP 2021199409A JP 7383684 B2 JP7383684 B2 JP 7383684B2
Authority
JP
Japan
Prior art keywords
processing
image
information processing
processed
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021199409A
Other languages
English (en)
Other versions
JP2023084981A (ja
Inventor
良介 齋竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2021199409A priority Critical patent/JP7383684B2/ja
Publication of JP2023084981A publication Critical patent/JP2023084981A/ja
Application granted granted Critical
Publication of JP7383684B2 publication Critical patent/JP7383684B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、情報処理装置、情報処理方法、並びにプログラムに関し、特に、画像分類AIを再学習させる情報処理装置、情報処理方法、並びにプログラムに関する。
従来より、精度の高い画像分類AIを生成するために、入力画像を学習データとして用いて画像分類AIの再学習を行い、その再学習によって生成されたモデルを検証するということを繰り返すことが行われている。また、再学習の際には、検証結果に基づいて精度向上に必要な学習データを見極め、用意する必要があり、既存の画像に加工を施すことで学習データとすることも行われている。
画像分類AIの性能を向上させるため学習データとして用いる入力画像に加工を施す手法として、入力画像の一部を隠すように他の値で置き換える手法が提案されている。
非特許文献1には、入力画像内のランダムな位置を、大きさと値がランダムな矩形で置き換えることが記載されている。
非特許文献2には、入力画像内のランダムな位置を中心として、正方形領域を0で置き換えることが記載されている。
Z.Zhong,L.Zheng,G.Kang,S.Li,and Y.Yang,"Random Erasing Data Augmentation", in arXiv:1708.04896,2017 T.Devries and G.W.Taylor."Improved regularization of convolutional neural networks with cutout." arXiv preprint arXiv: 1708.04552, 2017.5
非特許文献1,2に記載の技術では、学習データとして用いる入力画像に施す加工位置がランダムであるため、入力画像における、画像分類AIの性能向上に寄与しそうな領域が分かっていても、その領域を指定してピンポイントで加工することができない。
そこで、本発明では、画像分類AIの精度向上に資する学習データを効率的に生成することができる情報処理装置、情報処理方法、並びにプログラムを提供することを目的とする。
上記課題を解決するため、本発明に係る情報処理装置は、学習済みモデルによる予測ラベルの出力処理の対象となる複数の入力画像のうち、加工を施す対象の画像を受け付ける加工受付手段と、前記学習済みモデルの予測根拠となった特徴領域を取得する取得手段と、前記加工受付手段により加工を施す対象の画像として受け付けた画像であって、第1の確率で選択された画像に対して、前記特徴領域の少なくとも一部のピクセルの値を、第1の所定値に置換する第1の加工処理を行い、前記複数の入力画像のうち、前記加工受付手段により加工を施す対象の画像として受け付けていない画像であって、第2の確率で選択された画像に対して、当該画像の一部のピクセルの値を、第2の所定値に置換する第2の加工処理を行う処理手段と、前記第1及び第2の加工処理が行われた画像を用いて、学習済みモデルの再学習を行うための学習データを更新する更新手段と、を備えることを特徴とする。
本発明によれば、画像分類AIの精度向上に資する学習データを効率的に生成することができる。
本発明の実施形態に係る情報処理装置を含むAI予測根拠表示システムのシステム構成の一例を示す図である。 情報処理装置のハードウェア構成の一例を示すブロック図である。 本発明の実施形態に係る再学習/評価処理の一例を示すフローチャートである。 図3のステップS301で表示装置において表示される、結果分析画面である。 学習データに追加するための入力画像のパスが登録される学習テーブルである。 加工を施した後に学習データに追加又は置換するための入力画像のパスが登録される加工テーブルである。 評価データ又は学習データから削除するための入力画像のパスが登録される削除テーブルである。 図4のステップS411,S412において実行されるデータ加工処理の一例を示すフローチャートである。 図4のステップS411,S412において実行されるデータ加工処理の他の例を示すフローチャートである。 入力画像、予測根拠画像、及び加工画像の例を示す図である。
以下、図面を参照して、本発明の実施形態を詳細に説明する。
図1は、本発明の実施形態に係る情報処理装置101を含むAI予測根拠表示システム1のシステム構成の一例を示す図である。
AI予測根拠表示システム1は、情報処理装置101と、外部装置102とを備え、これらがネットワーク110を介して通信可能に接続されたシステムである。
情報処理装置101は、ユーザにより操作される装置であり、後述する再学習/評価処理(図3)の処理対象となる入力画像やこれに紐づくデータを結果分析画面(図4)に表示すると共に、ユーザによるこの画面上の各種ボタンの押下を受け付ける。
外部装置102は、上記再学習/評価処理の処理対象となる入力画像やこれに紐づくデータの管理などを行う。
尚、本発明の実施形態においては、情報処理装置101が図3のフローチャートで示す処理を実行するものとして説明するが、外部装置102が実行する形態であってもよい。また、処理対象の画像の管理など、外部装置102で行うものとして説明した処理について、情報処理装置101で行ってもよい。
図2は、情報処理装置101のハードウェア構成の一例を示すブロック図である。尚、外部装置102は、情報処理装置101と同様のハードウェア構成を有する為、重複した説明は省略する。
図2において、情報処理装置101は、CPU201、ROM202、RAM203、記憶装置204、入力制御部205、音声制御部206、ビデオ制御部207、メモリ制御部208、および通信I/F制御部209を備える。これらのデバイスやコントローラはシステムバス200を介して互いに接続する。
CPU201は、システムバス200に接続される各デバイスやコントローラを統括的に制御する。
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ213からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
記憶装置204は、SSDやHDD等にからなり、後述する画像分類AI等を保持する。
入力制御部205は、キーボード、タッチパネル、マウス等のポインティングデバイス等からなる入力装置210からの入力を制御する。例えば、入力装置210がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でのタッチ操作)をすることにより、各種の指示を行うことができる。尚、この場合のタッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
音声制御部206は、マイクやスピーカ等の音声入出力装置211への音声入出力を制御する。
ビデオ制御部207は、ディスプレイやプロジェクタ等からなる表示装置212への表示を制御する。この場合のディスプレイには、本体と一体になったノート型パソコンのディスプレイも含まれるものとする。尚、表示装置212が、前述のタッチ操作を受け付け可能な装置である場合、入力装置210としての役割も兼用する。また、ビデオ制御部207は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能であり、そのビデオメモリの領域としてRAM203の一部を利用してもよいし、別途専用のビデオメモリを設けてもよい。
メモリ制御部208は、外部メモリ213へのアクセスを制御する。外部メモリ213としては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する記憶装置であれば特に限定されない。例えば、外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等が外部メモリ213として利用可能である。
通信I/F制御部209は、ネットワーク110を介して外部機器と接続・通信するものであり、ネットワーク110での通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の4G回線、5G回線等を用いた通信が可能である。
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、表示装置212上での表示を可能としている。また、CPU201は、表示装置212上の不図示のマウスカーソル等でのユーザ指示の受付も可能とする。
次に図3のフローチャートを用いて、本発明の実施形態に係る再学習/評価処理について説明する。
この処理は、情報処理装置101のCPU201が所定の制御プログラムを読み出すことにより実行される。この処理では、画像分類AIの予測結果に関する情報が結果分析画面(図4)に表示される。また、結果分析画面上でユーザから受け付けた操作(学習・加工・削除ボタンの押下)に応じて学習データや評価データが更新された後、その更新後の学習データや評価データを用いて画像分類AIの再学習や評価が行われる。学習データや評価データについては後述する。
まずステップS301では、CPU201は、外部装置102から、入力画像及びこれに紐づくデータ、具体的には、正解ラベル、予測ラベル、及びヒートマップの情報を取得し、RAM203に保存する。その後、CPU201は、入力画像及びこれに紐づくデータに基づき、表示装置212の結果分析画面(図4:表示手段)に、正解ラベル、予測ラベル、入力画像、及び予測根拠画像を表示するよう制御する。
ここで正解ラベルとは、ユーザ等により予め定められた、入力画像に対する画像分類AIによる推論の正解を示すラベルである。
画像分類AIは、外部装置102内の学習部(図1において不図示)で予め学習させ、記憶装置204にて保持するConvolutional Neural Network(CNN)を用いた学習済みモデルである。なお、ここでは画像分類AIにCNNを用いているがこれに限定されず、例えば、サポートベクタマシン等の公知の他のアルゴリズムを用いてもよい。
CPU201は、入力画像(及びその正解ラベル)を外部から受信すると、記憶装置204から画像分類AIを読み出し、受信した入力画像を読み出した画像分類AIに入力することで、入力画像から推論される予測ラベルを出力する。CPU201は、複数の入力画像と、これらの夫々に紐づくデータとして、正解ラベル及び予測ラベルを、本処理の前に予め外部装置102に送信する。
ヒートマップは、入力画像における、画像分類AIの予測根拠となった特徴領域であり、CPU201が公知の技術であるGrad-CAMを用いてヒートマップを算出する。CPU201は、このヒートマップの情報を複数の入力画像の夫々に紐づく情報として、本処理の前に予め外部装置102に送信する。なお、ここではヒートマップの算出にGrad-CAMを用いているがこれに限定されず、例えば、RISE、Score-CAM、XRAI、Group-CAM等の公知の他のアルゴリズムを用いてもよい。
このように、CPU201は、入力画像及びこれに紐づく正解ラベル、予測ラベル、及びヒートマップの情報を、本処理の前に予め、外部装置102に保存しておく。尚、入力画像は、学習データであるか評価データであるかを示す情報を紐づけて登録しておく等の方法により、学習データであるか評価データであるかを特定可能に管理されているものとする。また、本実施例では、CPU201がヒートマップを算出したが、本処理の前に予め外部装置102にヒートマップの情報が保存されれば、これに限定されない。例えば、CPU201は、外部で算出されたヒートマップを取得するようにしてもよい。
予測根拠画像は、ヒートマップを入力画像に重畳し、画像分類AIの予測根拠を可視化した画像である。予測根拠画像においてヒートマップには色が付される。具体的には予測根拠の程度が高い程、ヒートマップの特徴領域は暖色系の色が付され、予測根拠の程度が低い程、ヒートマップの特徴領域は寒色系の色が付される。例えば、ヒートマップの特徴領域は予測根拠の程度が高い順に、赤色、オレンジ色、黄色、黄緑色、水色が付される。
ステップS302では、CPU201は、ステップS301で受け付けた入力画像(対象)が評価データであるか否かを判定する。この判定の結果、対象が評価データである場合(ステップS302でYES)、ステップS303に進み、そうでない場合、ステップS305に進む。
ステップS303では、CPU201は、図4の結果分析画面の学習ボタン405が押下されたか否かを判定する。この判定の結果、学習ボタン405が押下された場合(ステップS303でYES)、ステップS304に進み、そうでない場合、ステップS305に進む。
ステップS304では、CPU201は、対象の入力画像及びその正解ラベルを用いて再学習をさせることで画像分類AIの精度を向上させるために、対象の入力画像のパスを学習テーブル(図5)に登録する。例えば、対象の予測ラベルが間違っている場合、対象の入力画像及びその正解ラベルを用いて、画像分類AIを再学習させることで、同じような間違いをしなくなる効果が期待できる。後述するデータ加工処理の場合と比較すると、もともとの予測根拠に関わらず画像分類AIが出力する予測ラベルを正すことができるため、予測根拠は正しいが、予測ラベルが間違っている場合に適すると考えられる。
ステップS305では、CPU201は、図4の結果分析画面の加工ボタン406が押下されたか否かを判定する。この判定の結果、加工ボタン406が押下された場合(ステップS305でYES)、ステップS306に進み、そうでない場合、ステップS307に進む。
ステップS306では、CPU201(登録手段)は、データ加工処理を実行するために、対象の入力画像のパスを加工テーブル(図6)に登録する。尚、データ加工処理とは、不適切な部分が予測根拠となる特徴部分となった場合、入力画像におけるその不適切な部分を単一の値に置き換えるなどの加工を施す処理を指す。
ここで、後述する図8に例示するデータ加工処理は、エクスポートボタン408(図4)が押下された際、加工テーブルにパスが登録された全ての入力画像に対して行うことを想定した処理である。また後述する図9に例示するデータ加工処理は、加工自体の一貫性を予測根拠としてしまうことを防ぐために、加工する確率を設定できるようにしたものであり、画像分類AIの再学習に用いる対象の入力画像を用いてに対して行うことを想定した処理である。このように、予測根拠が不適切である場合、入力画像に加工を施した後、これを用いて画像分類AIの再学習を行うことで、画像分類AIが正しい予測根拠を学習し、正しい予測を行うことが期待できる。前述した再学習処理の場合と比較すると、データ加工処理は、予測根拠を正すことができるため、予測根拠が間違っているため、予測ラベルも間違っている場合に適すると考えられる。
ステップS307では、CPU201は、図4の結果分析画面の削除ボタン407が押下されたか否かを判定する。この判定の結果、削除ボタン407が押下された場合(ステップS307でYES)、ステップS308に進み、そうでない場合、ステップS309に進む。ここで、削除ボタン407は、ユーザが、対象の入力画像を学習データや評価データとして用いると画像分類AIの再学習や評価に悪影響を及ぼすため、学習データや評価データから対象の入力画像を削除する削除処理を行いたい場合に押下されるボタンである。ここで、対象の入力画像が画像分類AIの再学習や評価に悪影響を及ぼす場合とは、例えば、入力情報に含まれる入力画像が、学習や評価に関係のない画像である場合や、対象物が大きすぎる又は小さすぎる画像である場合などである。
ステップS308では、CPU201は、上記削除処理を実行するために、対象の入力画像のパスを削除テーブル(図7)に登録する。
ステップS309では、CPU201は、図4の結果分析画面のエクスポートボタン408(更新受付手段)が押下されたか否かを判定する。この判定の結果、エクスポートボタン408が押下された場合(ステップS309でYES)、ステップS310に進み、そうでない場合、ステップS301に戻る。
ステップS310では、CPU201は、対象の入力画像が評価データであるか否かを判定する。この判定の結果、対象が評価データである場合(ステップS310でYES)、ステップS311に進み、そうでない場合、すなわち対象が学習データである場合(ステップS310でNO)、ステップS312に進む。
ステップS311では、CPU201(更新手段)は、学習テーブルに対象の入力画像のパスが登録されている場合は、対象の入力画像を評価データから学習データに変更する。すなわち、学習ボタン405の押下後、エクスポートボタン408の押下を学習結果表示部400が受け付けた場合、対象の入力画像の保存先を外部装置102の評価データ用フォルダから学習データ用フォルダに移動する。また、CPU201は、加工テーブルに対象の入力画像のパスが登録されている場合は、データ加工処理により対象の入力画像を加工し、加工後の入力画像を評価データから学習データに変更する。すなわち、加工ボタン406の押下後、エクスポートボタン408の押下を学習結果表示部400が受け付けた場合、上記加工後、対象の入力画像の保存先を外部装置102の評価データ用フォルダから学習データ用フォルダに移動する。さらにCPU201は、削除テーブルに対象の入力画像のパスが登録されている場合は、対象の入力画像を評価データから削除する。すなわち、削除ボタン407の押下後、エクスポートボタン408の押下を学習結果表示部400が受け付けた場合、対象の入力画像を、現在保存されている外部装置102の評価データ用フォルダから削除する。その後、ステップS313に進む。
このように、対象が評価データである場合、評価データだけでなく学習データも更新される。尚、この場合、削除ボタン407のみ押下された後エクスポートボタン408が押下されると、学習データは更新されないため、後述のステップS313において画像分類AIの再学習は行わなくてもよい。
ステップS312では、CPU201(更新手段)は、加工テーブルに対象の入力画像のパスが登録されている場合は、データ加工処理によりその対象の入力画像を加工し、加工後の入力画像で学習データとしての対象の入力画像を置換する。すなわち、上記加工後の対象の入力画像で、外部装置102の学習データ用フォルダにある対象の入力画像を置換する。またCPU201は、削除テーブルに対象の入力画像のパスが登録されている場合は、対象の入力画像を学習データから削除する。すなわち、対象の入力画像を、現在保存されている外部装置102の学習データ用フォルダから削除する。その後、ステップS313に進む。
このように、対象が学習データである場合、学習データのみが更新され、評価データは更新されない。このため、対象が学習データである場合、後述のステップS313において画像分類AIの評価は行わなくてもよい。
ステップS313では、CPU201は、外部装置102の学習データ用フォルダから学習データを出力し、画像分類AIの再学習を行う。また、CPU201は、外部装置102の評価データ用フォルダから評価データを出力し、画像分類AIの評価を行う。その後、本処理を終了する。
尚、本実施形態では、画像分類AIの再学習は情報処理装置101のCPU201が実行したが、更新後の学習データを用いて画像分類AIの再学習が行われるのであれば、かかる実施形態に限定されない。例えば、CPU201は、外部装置102に画像分類AIの再学習の実行指示を行い、外部装置102から再学習後の画像分類AI(又は、その内部パラメータ)を取得するようにしてもよい。同様に、画像分類AIの評価は情報処理装置101のCPU201が実行したが、更新後の評価データを用いて画像分類AIの評価が行われるのであれば、かかる実施形態に限定されない。例えば、CPU201は、外部装置102に画像分類AIの評価の実行指示を行い、外部装置102からその評価結果を取得するようにしてもよい。
図4は、図3のステップS301で表示装置212において表示される結果分析画面である。
結果分析画面は、入力画像毎の学習結果表示部400a~400d(以下、「学習結果表示部400」と総称する)、及びエクスポートボタン408を有する。
学習結果表示部400は、正解ラベル表示部401、予測ラベル表示部402、入力画像表示部403、予測根拠画像表示部404、学習ボタン405、加工ボタン406、及び削除ボタン407からなる。
正解ラベル表示部401は、入力画像の正解ラベルを表示する。
予測ラベル表示部402は、画像分類AIの予測ラベルを表示する。
入力画像表示部403は、入力画像を表示する。
予測根拠画像表示部404は、予測根拠画像を表示する。
このように、図4の結果分析画面という一つの画面に、正解ラベル、予測ラベル、入力画像、予測根拠画像が比較可能に表示される。これにより、ユーザは図4の結果分析画面により簡単に学習結果の妥当性を判断することで可能となる。
学習ボタン405は、入力画像のパスを学習テーブルに登録する指示を受け付けるボタンである。
加工ボタン406(加工受付手段)は、入力画像のパスを加工テーブルに登録する指示(登録指示)を受け付けるボタンである。
削除ボタン407は、入力画像のパスを削除テーブルに登録する指示を受け付けるボタンである。
エクスポートボタン408は、学習テーブル、加工テーブル、削除テーブルに登録された入力画像を処理し、学習データ及び/又は評価データを更新した後に出力する旨の指示(更新指示)を受け付けるボタンである。
ユーザは、学習結果表示部400に表示される学習結果が妥当でないと判断した場合、図4の結果分析画面の学習ボタン405、加工ボタン406、削除ボタン407の少なくとも1つを押下した後、エクスポートボタン408を押下する。かかる学習結果表示部400への操作のみで、ユーザは、簡単に画像分類AIの精度向上施策を実施することができる。具体的な精度改善施策として、入力画像の学習データとしての追加、入力画像の学習データ及び評価データとしての加工、入力画像の学習データ及び評価データからの削除を行うことができる。
図5は、学習データに追加するための入力画像のパスが登録される学習テーブルである。
図6は、加工を施した後に学習データに追加又は置換するための入力画像のパスが登録される加工テーブルである。
図7は、評価データ又は学習データから削除するための入力画像のパスが登録される削除テーブルである。
次に図8のフローチャートを用いて、図4のステップS411,S412において実行されるデータ加工処理の一例について説明する。この処理は、エクスポートボタン408(図4)が押下された際、加工テーブルにパスが登録された全ての入力画像に対して実行される。すなわちこの処理では、誤った予測根拠をもとに画像分類AIの学習が行われないように、加工テーブルにパスが登録された全ての入力画像が加工される。
この処理は、情報処理装置101のCPU201が所定の制御プログラムを読み出すことにより実行される。
まずステップS801では、CPU201は、加工テーブルにパスが登録されている入力画像の一つを、加工対象に決定する。ここで加工対象として決定された入力画像の例を図10(A)に示す。この入力画像では、左の穴の位置が設計位置からずれているため、その正解ラベルは「異常」である。よって、この入力画像から画像分類AIにより推論される予測ラベルも「異常」であることが望ましい。また、その予測根拠画像のヒートマップには、左の穴の位置に近い程、暖色系の色(予測根拠の程度が高いことを示す色)が付されるが望ましい。
ステップS802では、CPU201は、ヒートマップのうち、設定値1A(所定の基準)より大きな値を持つピクセルの座標を取得する。ヒートマップの各ピクセルは0~1の間の値をとる。また、設定値1Aは、ヒートマップの各ピクセルの予測根拠となった程度が所定の基準を満たすか否かを判定するためのしきい値であって、0より大きく1より小さい値を持つ。予測根拠画像の例を図10(B)に示す。この予測根拠画像では、右の穴の周辺を予測根拠としており、誤った予測根拠により予測ラベルが出力されたことがわかる。ステップS802ではこのような画像に対して処理を行う。
ステップS803では、CPU201は、入力画像のうち、ステップS802で取得した全ての座標のピクセルの値を設定値2A(第1の所定値)に置換する加工を行う。図10(C)に、図10(a)の入力画像に対しステップS803の加工を行った画像(加工画像)を示す。この加工画像では、設定値2Aとして黒が指定されて加工が行われている。
ステップS804では、CPU201は、加工テーブルにパスが登録されている全ての入力画像に対してステップS803の加工が終了したか否かを判定する。判定の結果、全ての入力画像に対してステップS803の加工が終了した場合(ステップS804でYES)、本処理を終了する一方、そうでない場合(ステップS804でNO)、ステップS801に戻る。
次に図9のフローチャートを用いて、図4のステップS411,S412において実行されるデータ加工処理の他の例について説明する。この処理では、入力画像の加工自体の一貫性が、ヒートマップの算出に影響することを防ぐために、入力画像の加工が一定の確率で行われる。また、本処理は、エクスポートボタン408(図4)が押下された際、加工テーブルにパスが登録されている入力画像だけでなく外部装置102に保存される全ての入力画像に対して、本処理の加工が確率的に行われる。本処理は特に追加学習の際に適用することを想定している。すなわちこの処理では、誤った予測根拠をもとに画像分類AIの学習が行われないように、情報処理装置101にある全ての入力画像の加工の適用を確率的に行う。
この処理は、情報処理装置101のCPU201が所定の制御プログラムを読み出すことにより実行される。
まずステップS901では、CPU201は、外部装置102に保存される入力画像の1つを取得する。
ステップS902では、CPU201は、ステップS901で取得した入力画像のパスが加工テーブルに登録されているか否かを判定する。判定の結果、加工テーブルに登録されている場合(ステップS902でYES)、ステップS903に進み、そうでない場合(ステップS902でNO)、ステップS906に進む。
ステップS903では、CPU201は、乱数を生成し、その生成した乱数が設定値1Bより大きいか(第1の確率であるか)否かを判定する。ここで生成される乱数及び設定値1Bは共に0から1の値をとる。判定の結果、乱数が設定値1Bより大きい場合は(ステップS903でYES)、ステップS901で取得した入力画像の加工を行うべく、ステップS904に進み、そうでない場合は(ステップS903でNO)、本処理を終了する。このように、加工の適用を確率的にすることで、加工自体の一貫性がヒートマップの算出に影響を与えることを防ぐ役割が期待される。
ステップS904では、CPU201は、ヒートマップのうち、設定値2B(所定の基準)より大きい値を持つピクセルの座標を取得し、ステップS905に進む。ヒートマップの各ピクセルは0~1の間の値をとる。また、設定値2Bは、ヒートマップの各ピクセルの予測根拠となった程度が所定の基準を満たすか否かを判定するためのしきい値であって、0より大きく1より小さい値を持つ。
ステップS905では、CPU201は、ステップS901で取得した入力画像における、ステップS904で取得した全ての座標のピクセルの値を設定値3B(第1の所定値)に置換する加工を行った後、本処理を終了する。
ステップS906では、CPU201は、乱数を生成し、その生成した乱数が設定値1Bより大きいか(第2の確率であるか)否かを判定する。判定の結果、乱数が設定値1Bより大きい場合は(ステップS906でYES)、ステップS901で取得した入力画像の加工を行うべく、ステップS907に進み、そうでない場合は(ステップS906でNO)、本処理を終了する。このように、外部装置102に保存される入力画像のうち、加工テーブルにはパスが登録されていない入力画像にも確率的に加工を施すことで、加工自体の一貫性がヒートマップの算出に影響を与えることを防ぐ役割が期待される。尚、ステップS906の判定に使用した設定値は、ステップS903の判定に使用した設定値1Bと同一としたが、異なる設定値であってもよい。
ステップS907では、CPU201は、ステップS901で取得した入力画像におけるピクセルをランダムに選択し、そのランダムに選択されたピクセルの値を設定値3B(第2の所定値)で置換した後、本処理を終了する。尚、ここでランダムに選択されるピクセルの数自体も、ランダムに設定された値としてもよいし、固定値としてもよい。
(その他の実施形態)
尚、本実施形態では、1つ以上の機能を実現するプログラムを、ネットワークまたは記憶媒体を介してシステムまたは装置のコンピュータに供給し、そのシステムまたは装置のシステム制御部がプログラムを読出し実行する処理でも実現可能である。システム制御部は、1つまたは複数のプロセッサーまたは回路を有し、実行可能命令を読み出し実行するために、分離した複数のシステム制御部または分離した複数のプロセッサーまたは回路のネットワークを含みうる。
プロセッサーまたは回路は、中央演算処理装置(CPU)、マイクロプロセッシングユニット(MPU)、グラフィクスプロセッシングユニット(GPU)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)を含みうる。また、プロセッサーまたは回路は、デジタルシグナルプロセッサ(DSP)、データフロープロセッサ(DFP)、またはニューラルプロセッシングユニット(NPU)を含みうる。
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
1 AI予測根拠表示システム
101 情報処理装置
102 外部装置
110 ネットワーク
201 CPU
212 表示装置
405 学習ボタン
406 加工ボタン
407 削除ボタン
408 エクスポートボタン

Claims (7)

  1. 学習済みモデルによる予測ラベルの出力処理の対象となる複数の入力画像のうち、加工を施す対象の画像を受け付ける加工受付手段と、
    前記学習済みモデルの予測根拠となった特徴領域を取得する取得手段と、
    前記加工受付手段により加工を施す対象の画像として受け付けた画像であって、第1の確率で選択された画像に対して、前記特徴領域の少なくとも一部のピクセルの値を、第1の所定値に置換する第1の加工処理を行い、前記複数の入力画像のうち、前記加工受付手段により加工を施す対象の画像として受け付けていない画像であって、第2の確率で選択された画像に対して、当該画像の一部のピクセルの値を、第2の所定値に置換する第2の加工処理を行う処理手段と、
    前記第1及び第2の加工処理が行われた画像を用いて、学習済みモデルの再学習を行うための学習データを更新する更新手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記第2の加工処理は、前記複数の入力画像のうち、前記加工受付手段により加工を施す対象として受け付けていない画像であって、前記第2の確率で選択された画像に対して、ランダムに選択された領域にあるピクセルの値を、前記第2の所定値に置換する処理を含むことを特徴とする請求項1に記載の情報処理装置。
  3. 記複数の入力画像のうち、前記加工受付手段が登録指示を受け付けた画像を、加工を施す対象の画像として登録する登録手段と、
    前記学習済みモデルの再学習を行うための学習データを更新する更新指示を受け付ける更新受付手段と、
    を備え、
    前記更新手段は、前記更新受付手段が前記更新指示を受け付けた場合、前記処理手段により前記第1及び第2の加工処理を行い、前記第1及び第2の加工処理が行われた画像を用いて前記学習データを更新することを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記複数の入力画像、前記予測ラベル、前記特徴領域を前記入力画像に重畳した予測根拠画像、及び予め定められた前記入力画像に対する、前記学習済みモデルに入力した際の推論の正解を示す正解ラベルを比較可能に一つの画面に表示する表示手段を備えることを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記特徴領域の少なくとも一部のピクセルは、当該特徴領域のうち予測根拠となった程度が所定の基準を満たす領域に位置するピクセルであることを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 情報処理装置の情報処理方法であって、
    学習済みモデルによる予測ラベルの出力処理の対象となる複数の入力画像のうち、加工を施す対象の画像を受け付ける加工受付ステップと、
    前記学習済みモデルの予測根拠となった特徴領域を取得する取得ステップと、
    前記加工受付ステップにおいて加工を施す対象の画像として受け付けた画像であって、第1の確率で選択された画像に対して、前記特徴領域の少なくとも一部のピクセルの値を、第1の所定値に置換する第1の加工処理を行い、前記複数の入力画像のうち、前記加工受付ステップにおいて加工を施す対象の画像として受け付けていない画像であって、第2の確率で選択された画像に対して、当該画像の一部のピクセルの値を、第2の所定値に置換する第2の加工処理を行う処理ステップと、
    前記第1及び第2の加工処理が行われた画像を用いて、学習済みモデルの再学習を行うための学習データを更新する更新ステップと、
    を備えることを特徴とする情報処理方法。
  7. コンピュータを、請求項1乃至のいずれか1項に記載の情報処理装置の各手段として機能させる、コンピュータにより実行可能なプログラム。
JP2021199409A 2021-12-08 2021-12-08 情報処理装置、情報処理方法、並びにプログラム Active JP7383684B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021199409A JP7383684B2 (ja) 2021-12-08 2021-12-08 情報処理装置、情報処理方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021199409A JP7383684B2 (ja) 2021-12-08 2021-12-08 情報処理装置、情報処理方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2023084981A JP2023084981A (ja) 2023-06-20
JP7383684B2 true JP7383684B2 (ja) 2023-11-20

Family

ID=86775566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021199409A Active JP7383684B2 (ja) 2021-12-08 2021-12-08 情報処理装置、情報処理方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP7383684B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020194446A (ja) 2019-05-29 2020-12-03 株式会社アーク情報システム プログラム、情報処理方法及び情報処理装置
JP2020197833A (ja) 2019-05-31 2020-12-10 楽天株式会社 データ拡張システム、データ拡張方法、及びプログラム
WO2021130888A1 (ja) 2019-12-25 2021-07-01 日本電気株式会社 学習装置、推定装置および学習方法
JP2021117548A (ja) 2020-01-22 2021-08-10 富士通株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020194446A (ja) 2019-05-29 2020-12-03 株式会社アーク情報システム プログラム、情報処理方法及び情報処理装置
JP2020197833A (ja) 2019-05-31 2020-12-10 楽天株式会社 データ拡張システム、データ拡張方法、及びプログラム
JP2021120914A (ja) 2019-05-31 2021-08-19 楽天グループ株式会社 データ拡張システム、データ拡張方法、及びプログラム
WO2021130888A1 (ja) 2019-12-25 2021-07-01 日本電気株式会社 学習装置、推定装置および学習方法
JP2021117548A (ja) 2020-01-22 2021-08-10 富士通株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Terrance DeVries, Graham W. Taylor,Improved Regularization of Convolutional Neural Networks with Cutout,[online],2017年08月15日,[retrieved on 2023.06.20], Retrieved from the Internet : <url: https://arxiv.org/pdf/1708.04552v1.pdf>
Zhun Zhong et al.,Random Erasing Data Augmentation,[online],2017年08月16日,[retrieved on 2023.06.20], Retrieved from the Internet : <url: https://arxiv.org/pdf/1708.04896v1.pdf>

Also Published As

Publication number Publication date
JP2023084981A (ja) 2023-06-20

Similar Documents

Publication Publication Date Title
JP6970553B2 (ja) 画像処理装置、画像処理方法
TWI675314B (zh) 智慧設備的控制方法及裝置
CN112115894B (zh) 手部关键点检测模型的训练方法、装置及电子设备
CN112148171B (zh) 一种界面切换方法、装置及电子设备
WO2022228465A1 (zh) 界面显示方法、装置、电子设备及存储介质
US20240089331A1 (en) Display Method, Related Device, and Non-Transitory Readable Storage Medium
JP7379684B2 (ja) 画像生成方法及び装置並びにコンピュータプログラム
JP3706743B2 (ja) 関心領域抽出方法及び装置並びに記憶媒体
CN113343812A (zh) 手势识别方法、装置、存储介质及电子设备
US11507181B2 (en) Input apparatus having virtual keys set on reference plane
TWI505173B (zh) 提高手持裝置觸碰鍵盤辨識率的系統和方法
US20110037731A1 (en) Electronic device and operating method thereof
JP7383684B2 (ja) 情報処理装置、情報処理方法、並びにプログラム
JP2006260021A (ja) 表示制御装置およびその表示画面の縮小方法
JP2016099976A (ja) 計算機、計算サーバ、プログラム、および計算機システム
US10114518B2 (en) Information processing system, information processing device, and screen display method
US10839570B2 (en) Graph display method, electronic device, and recording medium for displaying modified expression in different ways in response to determining whether condition regarding modified expression is satisfied
CN109753217B (zh) 动态键盘操作方法、装置、存储介质及电子设备
WO2019201223A1 (zh) 屏幕显示的切换方法以及装置及存储介质
JP2023084980A (ja) 情報処理装置、情報処理方法、並びにプログラム
CN112286430B (zh) 图像处理方法、装置、设备及介质
JP2010128567A (ja) カーソル移動制御方法及び装置、プログラム
JP2014209326A (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP6249077B2 (ja) 計算機、データ出力方法、およびプログラム
KR20190134885A (ko) 이미지 태깅 장치 및 이를 이용한 이미지 태깅 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220721

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231010

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231108

R150 Certificate of patent or registration of utility model

Ref document number: 7383684

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150