JP2019079167A - 情報処理装置、情報処理システム、情報処理方法、及び、プログラム - Google Patents

情報処理装置、情報処理システム、情報処理方法、及び、プログラム Download PDF

Info

Publication number
JP2019079167A
JP2019079167A JP2017204228A JP2017204228A JP2019079167A JP 2019079167 A JP2019079167 A JP 2019079167A JP 2017204228 A JP2017204228 A JP 2017204228A JP 2017204228 A JP2017204228 A JP 2017204228A JP 2019079167 A JP2019079167 A JP 2019079167A
Authority
JP
Japan
Prior art keywords
information processing
training data
image data
unit
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017204228A
Other languages
English (en)
Inventor
昂平 吉田
Kohei Yoshida
昂平 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP2017204228A priority Critical patent/JP2019079167A/ja
Publication of JP2019079167A publication Critical patent/JP2019079167A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】環境変化に柔軟に対応することで高い分類精度を維持する。【解決手段】情報処理装置は、データ取得部110と、分類部130と、判定部140と、通知部150を備える。データ取得部110は、画像データを取得する。分類部130は、第1訓練データセットに基づく機械学習により生成された識別器を含み、その識別器がデータ取得部110で取得された画像データのクラスを識別することでその画像データを分類する。判定部140は、分類部130が画像データを分類するときに、識別器の更新の要否を判定する。通知部150は、判定部140での判定結果に応じて、第1訓練データセットに含まれる複数の訓練データの少なくとも1つの変更又は削除を促す通知を行う。【選択図】図3

Description

本明細書の開示は、情報処理装置、情報処理システム、情報処理方法、及び、プログラムに関する。
画像データを分類する分類問題では、機械学習が一般に利用されている。機械学習には様々なものがあるが、分類されるべきクラスが既知である訓練データを用いた機械学習については、例えば、特許文献1に記載されている。
特許文献1には、訓練データ等の不足により過学習が生じることを学習時に検知し、訓練データ等の追加をユーザに促す技術が記載されている。
特開2016−133895号公報
ところで、訓練データを用いて機械学習を行っても、学習後に生じた環境変化により、訓練データが分類されるべきクラスが学習時と運用時では異なることがある。特許文献1に記載の技術では、このようなケースにおいて分類精度が低下してしまう。
以上のような実情を踏まえ、本発明の一側面に係る目的は、環境変化に柔軟に対応することで高い分類精度を維持する技術を提供することである。
本発明の一態様に係る情報処理装置は、データ取得部と、分類部と、判定部と、通知部を備える。データ取得部は、画像データを取得する。分類部は、第1訓練データセットに基づく機械学習により生成された識別器を含み、前記識別器が前記データ取得部で取得された前記画像データのクラスを識別することで前記画像データを分類する。判定部は、前記分類部が前記画像データを分類するときに、前記識別器の更新の要否を判定する。通知部は、前記判定部での判定結果に応じて、前記第1訓練データセットに含まれる複数の訓練データの少なくとも1つの変更又は削除を促す通知を行う。
本発明の一態様に係る情報処理システムは、上記態様に記載の情報処理装置と、サンプルを撮像する撮像装置と、を備え、前記撮像装置は、前記サンプルの前記画像データを前記データ取得部へ出力する。
本発明の一態様に係る情報処理方法は、画像データを取得し、第1訓練データセットに基づく機械学習により生成された識別器が前記画像データのクラスを識別することで、前記画像データを分類し、前記画像データが分類されるときに、前記識別器の更新の要否を判定し、前記識別器の更新の要否についての判定結果に応じて、前記第1訓練データセットに含まれる複数の訓練データの少なくとも1つの変更又は削除を促す通知を行う。
本発明の一態様に係るプログラムは、情報処理装置に、画像データを取得し、第1訓練データセットに基づく機械学習により生成された識別器が前記画像データのクラスを識別することで、前記画像データを分類し、前記画像データが分類されるときに、前記識別器の更新の要否を判定し、前記識別器の更新の要否についての判定結果に応じて、前記第1訓練データセットに含まれる複数の訓練データの少なくとも1つの変更又は削除を促す通知を行う処理を実行させる。
上記の態様によれば、環境変化に柔軟に対応することで高い分類精度を維持することができる。
情報処理システム1の構成を例示した図である。 サーバ20のハードウェア構成を例示したブロック図である。 サーバ20の機能構成を例示したブロック図である。 分類部130の機能構成を例示した図である。 訓練データセットTSと特徴ベクトルセットFSの構成を例示した図である。 学習処理の一例を示すフローチャートである。 特徴空間に2つの訓練データの特徴ベクトルをプロットした図である。 特徴空間にすべての訓練データの特徴ベクトルをプロットした図である。 特徴空間に分離超平面HPと拮抗領域Rを形成された様子を示した図である。 分類処理の一例を示すフローチャートである。 画像データの特徴ベクトルFB1を特徴空間にプロットした図である。 画像データの特徴ベクトルFB2を特徴空間にプロットした図である。 画像データの特徴ベクトルFB3を特徴空間にプロットした図である。 訓練データを削除して分離超平面HPを更新した様子を示した図である。 画像データの特徴ベクトルFB6を特徴空間にプロットした図である。 訓練データを変更して分離超平面HPを更新した様子を示した図である。 通知画面61を例示した図である。 情報処理システム2の構成を例示した図である。
[第1の実施形態]
図1は、本実施形態に係る情報処理システム1の構成を例示した図である。情報処理システム1は、サンプルSを撮像し、得られたサンプルSの画像データを分類するシステムである。情報処理システム1の用途は特に限定しないが、情報処理システム1は、例えば、サンプルSの画像データを良品クラスと不良品クラスのいずれかへ分類することでサンプルSの検査を行う検査システムであってもよい。
情報処理システム1は、サンプルSを撮像してサンプルSの画像データを生成する撮像装置の一例である顕微鏡10と、サンプルSの画像データを分類する情報処理装置の一例であるサーバ20と、を備えている。顕微鏡10とサーバ20は、図1では、例えばUSB(Universal Serial Bus)ケーブルなどの有線ケーブルで接続されている。ただし、顕微鏡10とサーバ20は、相互にデータをやり取りできるように構成されていればよく、有線に限らず無線により通信可能に接続されてもよい。
情報処理システム1は、さらに、サーバ20が行う通知に従って通知画面を表示する表示装置の一例であるディスプレイ30と、サーバ20への指示を入力する入力装置の一例であるキーボード40と、を備えてもよい。ディスプレイ30は、例えば、液晶ディスプレイ、有機EL(Organic Electro-Luminescence)ディスプレイなどである。ディスプレイ30及びキーボード40は、図1では、例えばUSBケーブルなどの有線ケーブルでサーバ20に接続されている。ただし、ディスプレイ30及びキーボード40は、サーバ20と相互にデータをやり取りできるように構成されていればよく、有線に限らず無線により通信可能に接続されてもよい。
なお、サーバ20は、ネットワークを介して接続された、情報処理システム1の外部にあるノート型コンピュータ50、タブレット端末60、スマートフォンなどのクライアント端末へ通知を行ってもよい。情報処理システム1の利用者は、これらのクライアント端末からサーバ20への指示を入力してもよい。その場合、クライアント端末は、サーバ20が行う通知に従って通知画面を表示する表示装置であり、サーバ20へ指示を入力する入力装置である。図1では、サーバ20とクライアント端末の間のネットワークは無線ネットワークとして記載されているが、有線ネットワークであってもよい。
図2は、サーバ20のハードウェア構成を例示したブロック図である。サーバ20は、例えば、標準的なコンピュータである。サーバ20は、図2に示すように、プロセッサ21、メモリ22、ストレージ23、インタフェース装置24、及び、可搬記憶媒体26が挿入される可搬記憶媒体駆動装置25を備え、これらがバス27によって相互に接続されている。
プロセッサ21は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor)などであり、プログラムを実行してプログラムされた処理を行う電気回路である。メモリ22は、例えば、RAM(Random Access Memory)であり、プログラムの実行の際に、ストレージ23または可搬記憶媒体26に記憶されているプログラムまたはデータを一時的に記憶する。
ストレージ23は、例えば、ハードディスク、フラッシュメモリであり、主に各種データやプログラムの記憶に用いられる。インタフェース装置24は、例えば、ネットワークカード(NIC)であり、サーバ20以外の装置(例えば、顕微鏡10、ディスプレイ30、キーボード40、ノート型コンピュータ50、タブレット端末60など)と信号をやり取りする回路である。
可搬記憶媒体駆動装置25は、光ディスクやコンパクトフラッシュ(登録商標)等の可搬記憶媒体26を収容するものである。可搬記憶媒体26は、ストレージ23を補助する役割を有する。ストレージ23及び可搬記憶媒体26は、それぞれプログラムを記憶した非一過性のコンピュータ読取可能記憶媒体の一例である。
図2に示す構成は、サーバ20のハードウェア構成の一例であり、サーバ20はこの構成に限定されるものではない。サーバ20は、汎用装置ではなく専用装置であってもよい。サーバ20は、プログラムを実行するプロセッサの代わりに又は加えて、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの電気回路を備えてもよく、それらの電気回路により、後述する図6及び図10に示す情報処理の全部または一部が行われてもよい。
図3は、サーバ20の機能構成を例示したブロック図である。図4は、分類部130の機能構成を例示した図である。図5は、訓練データセットTSと特徴ベクトルセットFSの構成を例示した図である。
サーバ20は、図3に示すように、データ取得部110と、指示取得部120と、分類部130と、判定部140と、通知部150を備えている。図3に示す機能構成は、例えば、プロセッサ21がプログラムを実行することにより行われるソフトウェア処理によって実現される。ただし、ハードウェア処理により実現されてもよい。
データ取得部110は、顕微鏡10で生成された画像データを取得する。また、データ取得部110は、機械学習のための訓練データを取得する。データ取得部110は、取得したデータを分類部130へ出力する。
図5に示すように、機械学習用の訓練データTDは、例えば、訓練画像データMと訓練画像データMのクラスを示すクラスラベルCとを含んでいる。訓練データTDは単一の画像ファイルであってもよく、クラスラベルCは画像ファイルのヘッダに含まれても良い。また、訓練データTDは、訓練画像データMとクラスラベルCに加えて、訓練画像データMから算出される特徴ベクトルFBを含んでも良い。
特徴ベクトルFBとは、特徴量を成分とするベクトルである。特徴ベクトルFBは、図5に示すように、複数の特徴量(F1、F2、・・・)を含んでいる。特徴量とは、画像の特徴を表す量であり、これらに限らないが、例えば、画像に含まれる特徴領域の面積、幅、高さ、位置情報(x座標、y座標)、輝度情報(例えば、平均輝度、最大輝度、輝度分布、輝度の標準偏差など)、コントラスト、形状情報(円形度、長軸の半径、短軸の半径)、向き(主軸の角度)などである。
なお、本明細書では、図5に示すように、複数の訓練データTDを含む訓練データTDの集合を訓練データセットTSと記し、複数の特徴ベクトルFBを含む特徴ベクトルFBの集合を特徴ベクトルセットFSと記す。
指示取得部120は、外部装置からサーバ20へ入力された指示を取得する。指示は、例えば、学習済みの複数の訓練データの少なくとも1つを変更又は削除する指示である。指示取得部120は、取得した指示を分類部130へ出力する。
分類部130は、図4に示すように、特徴量算出部131と、学習部132と、識別器である識別部133と、訓練データ更新部134を備えていて、訓練DB135及び特徴量DB136に対してデータを読み書きする。また、分類部130は、これらの構成要素を用いて、学習時と運用時で異なる処理を行う。
訓練データが入力される学習時においては、分類部130は、訓練データセットに基づいて機械学習を行って識別器を生成する。機械学習に用いられる訓練データセットは、例えば、データ取得部110によって取得される。
なお、分類部130に含まれる識別器のアルゴリズムは特に限定しないが、例えば、サポートベクターマシン(SVM)、ニューラルネットワーク(NN)などの訓練データを用いるアルゴリズムである。また、識別器は、複数のアルゴリズムによる識別結果を用いて画像データのクラスを識別してもよい。
運用時においては、分類部130は、訓練データセットに基づく機械学習により生成された識別器がデータ取得部110で取得された画像データのクラスを識別することで画像データを分類する。また、分類部130は、学習済みの複数の訓練データの少なくとも1つを変更又は削除する指示が入力されると、指示に従って学習済みの訓練データセットを更新し、更新された訓練データセットに基づいて、学習時と同様に機械学習を行うことで識別器を更新する。そして、更新された識別器が画像データのクラスを識別することでその画像データを分類する。
判定部140は、分類部130が画像データを分類するときに、識別器の更新の要否を判定し、判定結果を通知部150へ出力する。具体的には、判定部140は、分類部130が画像データを分類するときに算出される、分類結果についての確からしさに基づいて、識別器の更新の要否を判定する。より具体的には、分類結果についての確からしさが比較的低いときに識別器の更新が必要であると判定する。
判定部140は、例えば、特徴量算出部131が画像データから算出した複数の特徴量からなる特徴ベクトルと、識別器が有する分離超平面との距離に基づいて、識別器の更新の要否を判定してもよい。また、判定部140は、例えば、識別器が画像データのクラスを識別するときに画像データから算出した分類スコアに基づいて、識別器の更新の要否を判定してもよい。なお、分離超平面と分類スコアについては後述する。
さらに、判定部140は、例えば、学習済みの複数の訓練データに含まれる複数の訓練画像データから算出される複数の特徴ベクトルの各々と識別器が有する分離超平面との距離に基づいて、複数の訓練データから少なくとも1つの訓練データを選択してもよい。
通知部150は、判定部140での判定結果に応じて、学習済みの訓練データセットに含まれる複数の訓練データの少なくとも1つの変更又は削除を促す通知を行う。通知部150は、情報処理システム1に含まれる装置(例えば、ディスプレイ30)へ通知を行ってもよい。また、通知部150は、ネットワークを介して接続された情報処理システム1外の端末(例えば、ノート型コンピュータ50、タブレット端末60など)へ通知を行ってもよい。
また、通知部150が行う通知の態様は特に限定しない。通知部150は、複数の訓練データの少なくとも1つの変更又は削除を促す通知画面を表示装置(ディスプレイ30、ノート型コンピュータ50、タブレット端末60など)に表示させてもよい。この場合、通知部150は、判定部140が選択した少なくとも1つの訓練データに対応する少なくとも1つの訓練画像を含む通知画面を表示装置に表示させてもよい。また、通知部150は、図示しないスピーカーなどへ通知を行い、音声で利用者に複数の訓練データの少なくとも1つの変更又は削除を促してもよい。
以上のように構成された情報処理装置であるサーバ20及び情報処理システム1は、画像データを分類するときに識別器の更新要否を判定し、判定結果に基づいて訓練データセットの更新を促す通知を行う。このため、通知を受けた利用者は、必要に応じて訓練データセットの更新を指示することが可能であり、識別器の判定基準を変化させることができる。従って、サーバ20及び情報処理システム1によれば、環境変化にも柔軟に対応することが可能であり、その結果、高い分類精度を維持することができる。
また、サーバ20は、画像データを分類するときに算出される分類結果についての確からしさに基づいて、識別器の更新の要否を判定する。つまり、分類結果についての確からしさが比較的低いときに識別器の更新が必要であると判定する。確からしさが比較的低い分類結果が算出される画像データは、一般に環境変化によって分類されるべきクラスが変化しやすいことが予想される。このため、確からしさが比較的低い分類結果が得られたときに識別器の更新を促すことで、分類精度に影響を及ぼす環境変化に対して適切なタイミングで対応することができる。従って、さらに安定的に高い分類精度を維持することができる。
以下、サーバ20及び情報処理システム1が行う処理の一例を具体的に説明する。この例では、サーバ20及び情報処理システム1は、画像に写っている特徴領域がヨゴレであるかとキズであるかを判定する検査装置及び検査システムであり、画像データをクラス“ヨゴレ”、または、クラス“キズ”に分類する。
図6は、学習処理の一例を示すフローチャートである。図7は、特徴空間に2つの訓練データの特徴ベクトルをプロットした図である。図8は、特徴空間にすべての訓練データの特徴ベクトルをプロットした図である。図9は、特徴空間に分離超平面HPと拮抗領域Rを形成された様子を示した図である。まず、図6から図9を参照しながら、サーバ20が行う学習処理の一例について説明する。
図6に示す学習処理が開始されると、サーバ20は、訓練データを取得する(ステップS1)。ここでは、データ取得部110が、例えば、サーバ20のストレージ23に格納されている複数の訓練データの一つを読み出すことで、訓練データを取得する。訓練データには、図5に示すように、訓練画像データとクラスラベルが含まれている。
次に、サーバ20は、訓練データに含まれる訓練画像データから特徴領域を特定する(ステップS2)。ここでは、特徴量算出部131が、例えば、訓練画像データに対応する訓練画像を二値化して特徴領域を特定する。又は、特徴量算出部131は、二値化する代わりにエッジ処理を訓練画像に対して行い特徴領域を特定してもよい。さらに、特徴量算出部131は、二値化処理又はエッジ処理の前に特徴領域を際立たせるための任意のフィルタ処理を行ってもよい。なお、特徴領域は、例えば、画像に含まれている欠陥が疑われる領域であり、キズやヨゴレなどを含んでいる領域である。
特徴領域が特定されると、サーバ20は、特徴領域から特徴ベクトルを算出する(ステップS3)。ここでは、特徴量算出部131が、例えば、訓練画像データのうちの特徴領域に対応するデータから複数の特徴量を算出し、算出した複数の特徴量を成分とする特徴ベクトルを算出する。この例では、複数の特徴量として、特徴領域の面積と特徴領域の平均輝度を算出する。
特徴ベクトルが算出されると、サーバ20は、訓練データと特徴ベクトルを記録する(ステップS4)。ここでは、特徴量算出部131が、例えば、ステップS1で取得した訓練データを訓練DB135に記録し、ステップS3で算出した特徴ベクトルを特徴量DB136に記録する。このとき、特徴量算出部131は、図5に示すように、訓練データと特徴ベクトルを関連付けて記録する。
その後、サーバ20は、すべての訓練データを取得済みか否かを判定し(ステップS5)、すべての訓練データが取得済みではないと判定した場合には、ステップS1からステップS5の処理を繰り返す。
すべての訓練データが取得済みと判定されると、サーバ20は、機械学習を行う(ステップS6)。ここでは、学習部132が、例えば、ステップS1で取得した複数の訓練データを含む訓練データセット(以降、第1訓練データセットと記す。)に基づく機械学習により識別器である識別部133を生成する。
より具体的に説明すると、学習部132は、まず、訓練DB135と特徴量DB136から互いに関連付けられた特徴ベクトルとクラスラベルを1つずつ順番に読み出して、図7及び図8に示すように、特徴空間にプロットする。ここで、特徴空間とは、例えば、特徴ベクトルの各成分(特徴量)を軸とする空間であるが、より高次元の空間であってもよい。
図7及び図8に示す黒丸は、クラス“キズ”を示すクラスラベルに関連付けられた特徴ベクトルである。または、図7及び図8に示す黒四角は、クラス“ヨゴレ”を示すクラスラベルに関連付けられた特徴ベクトルである。なお、これらの記号は、他の図(図9、11−16)でも同様である。
特徴空間へのプロットが終了すると、学習部132は、分離超平面HPと拮抗領域Rを算出する。ここで、分離超平面HPとは、特徴空間をクラス毎に分離する境界面のことである。拮抗領域Rとは、分類スコアがほぼ拮抗している領域のことである。分類スコアとは、学習部132により生成された識別器により画像データのクラスを識別するときにクラス毎に算出される値であり、そのクラスへの分類がその程度確からしいかを示す値である。各クラスの分類スコアが0.0から1.0の値をとり、全クラスの分類スコアの合計が1.0となる場合であれば、例えば、最も高い値を有する分類スコア(一位の分類スコア)が0.6以下であり、二番目に高い値を有する分類スコア(二位の分類スコア)との差が0.2以内である領域を拮抗領域Rとして算出してもよい。
なお、図9には、識別器のアルゴリズムとしてSVMを採用し、マージン最大化という基準で算出した分離超平面HPが記載されている。ただし、識別器のアルゴリズムは特に限定されず、例えば、ニューラルネットワークなど他のアルゴリズムが採用されてもよい。
最後に、学習部132は、分離超平面、拮抗領域R、その他の識別器のパラメータを記録することで機械学習が終了し、これにより、識別器が生成される。
図10は、分類処理の一例を示すフローチャートである。図11は、画像データの特徴ベクトルFB1を特徴空間にプロットした図である。図12は、画像データの特徴ベクトルFB2を特徴空間にプロットした図である。図13は、画像データの特徴ベクトルFB3を特徴空間にプロットした図である。図14は、訓練データを削除して分離超平面HPを更新した様子を示した図である。図15は、画像データの特徴ベクトルFB6を特徴空間にプロットした図である。図16は、訓練データを変更して分離超平面HPを更新した様子を示した図である。図17は、通知画面61を例示した図である。図10から図17を参照しながら、サーバ20が行う分類処理の一例について説明する。
図10に示す分類処理が開始されると、サーバ20は、顕微鏡10がサンプルSを撮像するように顕微鏡10を制御する(ステップS11)。これにより、顕微鏡10は、サンプルSを撮像し、サンプルSの画像データをサーバ20へ出力する。
サーバ20は、顕微鏡10が送信した画像データを取得する(ステップS12)。ここでは、データ取得部110が画像データを取得する。
画像データを取得すると、サーバ20は、特徴領域を特定し(ステップS13)、特徴ベクトルを算出する(ステップS14)。ここでは、特徴量算出部131が画像データから特徴領域を特定し、画像データのうちの特徴領域に対応するデータから複数の特徴量を算出し、特徴ベクトルを算出する。なお、ステップS13、ステップS14の処理は、対象とするデータが訓練画像データではなく顕微鏡10が取得した画像データである点を除き、図6のステップS2、ステップS3の処理と同様である。
特徴ベクトルが算出されると、サーバ20は、画像データのクラスを識別する(ステップS15)。ここでは、機械学習により生成された識別器である識別部133が、ステップS14で算出した特徴ベクトルを入力として用いて、画像データのクラスを識別する。この際、各クラスの分類スコアも算出される。
その後、サーバ20は、分類スコアが拮抗しているか否かを判定する(ステップS16)。ここでは、判定部140が、例えば、ステップS15で算出された分類スコアに基づいて分類スコアが拮抗しているか否かを判定してもよい。また、判定部140が、例えば、ステップS14で算出された特徴ベクトルと識別器(識別部133)が有する分離超平面HPとの距離に基づいて分類スコアが拮抗しているかを判定してもよい。
サーバ20は、分類スコアが拮抗していないと判定すると、画像データをステップS15で識別したクラスに分類し(ステップS17)、図10に示す分類処理を終了する。例えば、図11に示すように、ステップS14で算出した特徴ベクトルFB1が拮抗領域Rに属していない場合が、このケースに相当する。
一方、サーバ20は、分類スコアが拮抗していると判定すると、更新候補の訓練データを選択し(ステップS18)、少なくとも1つの訓練データの変更又は削除を促す通知を行う(ステップS19)。つまり、この例では、サーバ20は、ステップS16において、識別器の更新の要否を判定している。
ステップS18では、サーバ20は、分離超平面HPと拮抗領域Rに及ぼす影響が大きい訓練データを更新候補の訓練データとして選択する。具体的には、判定部140が、例えば、学習済みの複数の訓練画像データから算出される複数の特徴ベクトルの各々と識別器が有する分離超平面HPとの距離に基づいて、複数の訓練データから少なくとも1つの訓練データを選択する。さらに具体的には、判定部140は、例えば、図12、図13及び図15に示すように、分離超平面HPからの距離が最も近い特徴ベクトル(FB4、FB5)に対応する訓練データをクラス毎に1つずつ選択してもよい。
ステップS19では、サーバ20は、例えば、ネットワークを介して接続されているクライアント端末(ノート型コンピュータ50、タブレット端末60など)へメールを送信してもよい。この際、サーバ20は複数の宛先に通知してもよく、スコアの拮抗度合いに応じて通知先を選択してもよい。また、サーバ20は、例えば、図17に示すような、学習済みの複数の訓練データの少なくとも1つの変更又は削除を促す通知画面61を表示装置(図17ではタブレット端末60)に表示させてもよい。
図17に示す通知画面61には、ステップS12で取得した画像データに対応する画像であるサンプル画像M1と、訓練画像M2、訓練画像M3が表示されている。サンプル画像M1上の“ヨゴレ?”は、ステップS15で識別したクラス(ここでは、“ヨゴレ”)の情報に基づいて表示される。訓練画像M2と訓練画像M3は、ステップS18で判定部140が選択した訓練データに対応する画像であり、訓練画像M2はクラス“キズ”の訓練画像であり、訓練画像M3はクラス“ヨゴレ”の訓練画像である。通知画面61には、さらに、訓練画像M2又は訓練画像M3の少なくとも一方の変更又は削除を指示するための操作ボタンが設けられている。
サーバ20は、通知を行うと、通知先からの指示を取得するまで待機し(ステップS20)、指示を取得すると、取得した指示が訓練データの変更または削除を指示する更新指示であるか否かを判定する(ステップS21)。
ステップS21で指示が更新指示でないと判定すると、サーバ20は、画像データをステップS15で識別したクラスに分類し(ステップS25)、図10に示す分類処理を終了する。例えば、図12に示すように、ステップS14で算出した特徴ベクトルFB2が拮抗領域Rに属しているものの、ステップS15でのクラスの識別に誤りがないと利用者が判断した場合が、このケースに相当する。この場合、利用者は、例えば、図17に示す通知画面61でサンプル画像M1のクラスが正しく識別されていることを確認し、キャンセルボタンを押下すればよい。
一方、ステップS21で指示が更新指示であると判定すると、サーバ20は、指示に従って学習済みの訓練データセットを更新する(ステップS22)。以降、更新後の訓練データセットを、図5の学習処理により学習済みの訓練データセット(第1訓練データセット)と区別するために、第2訓練データセットと記す。例えば、図13及び図15に示すように、ステップS14で算出した特徴ベクトル(FB3、FB6)が拮抗領域Rに属し、且つ、ステップS15でのクラスの識別に誤りがあると利用者が判断した場合が、このケースに相当する。この場合、利用者は、例えば、図17に示す通知画面61でサンプル画像M1のクラスが正しく識別されていないことを確認し、変更ボタン又は削除ボタンを押下すればよい。
ステップS22では、サーバ20の訓練データ更新部134は、指示が学習済みの複数の訓練データの少なくとも1つを変更する指示であるとき、その指示により特定される少なくとも1つの訓練データに含まれるクラスラベルを更新する。また、訓練データ更新部134は、指示が学習済みの複数の訓練データの少なくとも1つを削除する指示であるとき、第1訓練データセットを、学習済みの複数の訓練データのうちの指示により特定される少なくとも1つの訓練データを除く残りの訓練データを含む第2訓練データセットへ更新する。
その後、サーバ20は、第2訓練データセットに基づいて機械学習を行い(ステップS23)、識別器を更新する。ステップS23の処理は、第1訓練データセットの代わりに第2訓練データセットが学習に使用される点を除き、図6のステップS6の処理と同様である。
これにより、図14及び図16に示すように分離超平面HPも更新される。なお、図14は、特徴ベクトルFB5に対応する訓練データを削除した例を、図16は、特徴ベクトルFB5に対応する訓練データのクラスラベルを“ヨゴレ”から“キズ”に変更した例を示している。
ステップS23の再学習が終了すると、サーバ20は、画像データのクラスを識別する(ステップS24)。ここでは、更新された識別器である識別部133が、ステップS14で算出した特徴ベクトルを入力として用いて、画像データのクラスを識別する。
最後に、サーバ20は、画像データをステップS24で識別したクラスに分類し(ステップS25)、図10に示す分類処理を終了する。
本実施形態によれば、例えば、検査システムにおいて、運用開始後に欠陥の基準がより厳しい基準に変更された場合であっても、厳しい基準に合わせて訓練データのクラスラベルを変更することや、訓練データとして適当ではなくなったデータを削除することができる。これにより、訓練データを入力し直すことなく再学習が可能となる。従って、管理者に過度な負担を強いることなく検査基準の変更という環境変化にも柔軟に対応することが可能であり、その結果、高い分類精度を維持することができる。
また、本実施形態によれば、例えば、検査システムにおいて、運用開始後に光源などの装置が劣化した結果、運用開始時に比べて得られる画像データのコントラストや輝度が低くなってしまう場合であっても、装置環境に合わせて訓練データを更新することができる。運用開始後にサンプルの特性が変化した結果、得られる画像データのコントラストや輝度が運用開始時とは異なるものになってしまう場合であっても、サンプルの特性に合わせて訓練データを更新することができる。これにより、訓練データを入力し直すことなく再学習が可能となる。従って、管理者に過度な負担を強いることなく装置環境やサンプルの特性の変化にも柔軟に対応することが可能であり、その結果、高い分類精度を維持することができる。
[第2の実施形態]
図18は、本実施形態に係る情報処理システム2の構成を例示した図である。情報処理システム2は、顕微鏡10の代わりにカメラ11を備える点と、搬送装置70を備える点が、情報処理システム1とは異なる。
カメラ11は、サンプルSを撮像してサンプルSの画像データを生成する撮像装置の一例である。カメラ11は、例えば、CCDイメージセンサ、CMOSイメージセンサなどの撮像素子を備えている。搬送装置70は、サンプルSを搬送する装置である。搬送装置70は、例えば、複数のベルトコンベア(ベルトコンベア71、ベルトコンベア72、ベルトコンベア73、ベルトコンベア74)を含んでも良い。
情報処理システム2では、サーバ20は、カメラ11で生成されたサンプルSの画像データを分類し、分類結果に基づいて搬送装置70を制御する。例えば、画像データをクラスAに分類したときとクラスBに分類したときでベルトコンベア72の回転を反転させてもよい。これにより、搬送装置70は、サーバ20が分類した画像データのクラスに応じて、サンプルSの搬送先(D1、D2)を変更してもよい。
以上のように構成された情報処理システム2によっても、情報処理システム1と同様の効果を得ることができる。
上述した実施形態は、発明の理解を容易にするための具体例を示したものであり、本発明の実施形態はこれらに限定されるものではない。上述した実施形態の一部を他の実施形態に適用しても良い。情報処理装置、情報処理システム、情報処理方法、及び、プログラムは、特許請求の範囲の記載を逸脱しない範囲において、さまざまな変形、変更が可能である。
上述した実施形態では、判定部140が分離超平面からの距離が近い訓練データを選択する例を示したが、判定部140は異なる基準で訓練データを選択してもよい、例えば、訓練画像の撮像日時などに基づいて更新候補となる訓練データを選択してもよい。
上述した実施形態では、訓練データ更新部134が指示により特定された訓練データを更新する例を示したが、訓練データ更新部134は、特定された訓練データに類似する訓練データを合わせて更新してもよい。例えば、類似するか否かは、分類スコアや特徴ベクトルに基づいて判断してもよく、訓練画像の撮像日時に基づいて判断しても良い。
1、2・・・情報処理システム、10・・・顕微鏡、11・・・カメラ、20・・・サーバ、21・・・プロセッサ、22・・・メモリ、23・・・ストレージ、24・・・インタフェース装置、25・・・可搬記憶媒体駆動装置、26・・・可搬記憶媒体、27・・・バス、30・・・ディスプレイ、40・・・キーボード、50・・・ノート型コンピュータ、60・・・タブレット端末、61・・・通知画面、70・・・搬送装置、71、72、73、74・・・ベルトコンベア、110・・・データ取得部、120・・・指示取得部、130・・・分類部、131・・・特徴量算出部、132・・・学習部、133・・・識別部、134・・・訓練データ更新部、135・・・訓練DB、136・・・特徴量DB、140・・・判定部、150・・・通知部、C・・・クラスラベル、F1、F2・・・特徴量、FB、FB1、FB2、FB3、FB4、FB5、FB6・・・特徴ベクトル、FS・・・特徴ベクトルセット、HP・・・分離超平面、M・・・訓練画像データ、M1・・・サンプル画像、M2、M2・・・訓練画像、M3・・・訓練画像、R・・・拮抗領域、S・・・サンプル、TS・・・訓練データセット、TD・・・訓練データ

Claims (14)

  1. 画像データを取得するデータ取得部と、
    第1訓練データセットに基づく機械学習により生成された識別器を含み、前記識別器が前記データ取得部で取得された前記画像データのクラスを識別することで前記画像データを分類する分類部と、
    前記分類部が前記画像データを分類するときに、前記識別器の更新の要否を判定する判定部と、
    前記判定部での判定結果に応じて、前記第1訓練データセットに含まれる複数の訓練データの少なくとも1つの変更又は削除を促す通知を行う通知部と、を備える
    ことを特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置において、
    前記判定部は、前記分類部が前記画像データを分類するときに算出される、分類結果についての確からしさに基づいて、前記識別器の更新の要否を判定する
    ことを特徴とする情報処理装置。
  3. 請求項2に記載の情報処理装置において、
    前記分類部は、前記画像データから算出された複数の特徴量からなる特徴ベクトルと、前記識別器が有する分離超平面との距離に基づいて、前記識別器の更新の要否を判定する
    ことを特徴とする情報処理装置。
  4. 請求項2に記載の情報処理装置において、
    前記判定部は、前記識別器が前記画像データのクラスを識別するときに前記画像データから算出した分類スコアに基づいて、前記識別器の更新の要否を判定する
    ことを特徴とする情報処理装置。
  5. 請求項1乃至請求項4に記載の情報処理装置において、さらに、
    前記複数の訓練データの少なくとも1つを変更又は削除する指示を取得する指示取得部を備え、
    前記分類部は、
    前記指示取得部が取得した前記指示に従って前記第1訓練データセットを第2訓練データセットへ更新し、
    前記第2訓練データセットに基づいて機械学習を行うことで前記識別器を更新し、
    前記更新された識別器が前記画像データのクラスを識別することで前記画像データを分類する
    ことを特徴とする情報処理装置。
  6. 請求項5に記載の情報処理装置において、
    前記複数の訓練データの各々は、訓練画像データと、前記訓練画像データのクラスを示すクラスラベルと、を含み、
    前記分類部は、前記指示が前記複数の訓練データの少なくとも1つを変更する指示であるとき、前記指示により特定される少なくとも1つの訓練データに含まれるクラスラベルを更新する
    ことを特徴とする情報処理装置。
  7. 請求項5または請求項6に記載の情報処理装置において、
    前記分類部は、前記指示が前記複数の訓練データの少なくとも1つを削除する指示であるとき、前記第1訓練データセットを、前記複数の訓練データのうちの前記指示により特定される少なくとも1つの訓練データを除く残りの訓練データを含む前記第2訓練データセットへ更新する
    ことを特徴とする情報処理装置。
  8. 請求項1乃至請求項7のいずれか1項に記載の情報処理装置において、
    前記通知部は、前記複数の訓練データの少なくとも1つの変更又は削除を促す通知画面を表示装置に表示させる
    ことを特徴とする情報処理装置。
  9. 請求項8に記載の情報処理装置において、
    前記判定部は、前記複数の訓練データに含まれる複数の訓練画像データから算出される複数の特徴ベクトルの各々と前記識別器が有する分離超平面との距離に基づいて、前記複数の訓練データから少なくとも1つの訓練データを選択し、
    前記通知部は、前記判定部が選択した前記少なくとも1つの訓練データに対応する少なくとも1つの訓練画像を含む前記通知画面を前記表示装置に表示させる
    ことを特徴とする情報処理装置。
  10. 請求項1乃至請求項9のいずれか1項に記載の情報処理装置において、
    前記通知部は、ネットワークを介して接続された端末へ前記通知を行う
    ことを特徴とする情報処理装置。
  11. 請求項1乃至請求項10のいずれか1項に記載の情報処理装置と、
    サンプルを撮像する撮像装置と、を備え、
    前記撮像装置は、前記サンプルの前記画像データを前記データ取得部へ出力する
    ことを特徴とする情報処理システム。
  12. 請求項11に記載の情報処理システムにおいて、さらに、
    前記サンプルを搬送する搬送装置を備え、
    前記搬送装置は、前記情報処理装置が分類した前記サンプルの前記画像データのクラスに応じて、前記サンプルの搬送先を変更する
    ことを特徴とする情報処理システム。
  13. 画像データを取得し、
    第1訓練データセットに基づく機械学習により生成された識別器が前記画像データのクラスを識別することで、前記画像データを分類し、
    前記画像データが分類されるときに、前記識別器の更新の要否を判定し、
    前記識別器の更新の要否についての判定結果に応じて、前記第1訓練データセットに含まれる複数の訓練データの少なくとも1つの変更又は削除を促す通知を行う
    ことを特徴とする情報処理方法。
  14. 情報処理装置に、
    画像データを取得し、
    第1訓練データセットに基づく機械学習により生成された識別器が前記画像データのクラスを識別することで、前記画像データを分類し、
    前記画像データが分類されるときに、前記識別器の更新の要否を判定し、
    前記識別器の更新の要否についての判定結果に応じて、前記第1訓練データセットに含まれる複数の訓練データの少なくとも1つの変更又は削除を促す通知を行う
    処理を実行させることを特徴とするプログラム。
JP2017204228A 2017-10-23 2017-10-23 情報処理装置、情報処理システム、情報処理方法、及び、プログラム Pending JP2019079167A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017204228A JP2019079167A (ja) 2017-10-23 2017-10-23 情報処理装置、情報処理システム、情報処理方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017204228A JP2019079167A (ja) 2017-10-23 2017-10-23 情報処理装置、情報処理システム、情報処理方法、及び、プログラム

Publications (1)

Publication Number Publication Date
JP2019079167A true JP2019079167A (ja) 2019-05-23

Family

ID=66628806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017204228A Pending JP2019079167A (ja) 2017-10-23 2017-10-23 情報処理装置、情報処理システム、情報処理方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP2019079167A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021079440A1 (ja) * 2019-10-23 2021-04-29 富士通株式会社 作成方法、作成プログラム及び情報処理装置
KR102282343B1 (ko) * 2020-01-16 2021-07-28 성균관대학교산학협력단 평행 초평면을 이용한 데이터 포인트 분류 방법 및 장치
WO2022003974A1 (ja) * 2020-07-03 2022-01-06 株式会社ソニー・インタラクティブエンタテインメント 追加撮影要否通知装置、追加撮影要否通知方法及びプログラム
JP7456289B2 (ja) 2020-05-28 2024-03-27 富士通株式会社 判定プログラム、判定方法および情報処理装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021079440A1 (ja) * 2019-10-23 2021-04-29 富士通株式会社 作成方法、作成プログラム及び情報処理装置
JPWO2021079440A1 (ja) * 2019-10-23 2021-04-29
KR102282343B1 (ko) * 2020-01-16 2021-07-28 성균관대학교산학협력단 평행 초평면을 이용한 데이터 포인트 분류 방법 및 장치
JP7456289B2 (ja) 2020-05-28 2024-03-27 富士通株式会社 判定プログラム、判定方法および情報処理装置
WO2022003974A1 (ja) * 2020-07-03 2022-01-06 株式会社ソニー・インタラクティブエンタテインメント 追加撮影要否通知装置、追加撮影要否通知方法及びプログラム
JP7457809B2 (ja) 2020-07-03 2024-03-28 株式会社ソニー・インタラクティブエンタテインメント 追加撮影要否通知装置、追加撮影要否通知方法及びプログラム

Similar Documents

Publication Publication Date Title
JP2019079167A (ja) 情報処理装置、情報処理システム、情報処理方法、及び、プログラム
US9785699B2 (en) Photograph organization based on facial recognition
US10489687B2 (en) Classification method, classification module and computer program product using the same
US9230192B2 (en) Image classification using images with separate grayscale and color channels
WO2019107157A1 (ja) 棚割情報生成装置及び棚割情報生成プログラム
JP2017211259A (ja) 検査装置、検査方法、及びプログラム
US20150193698A1 (en) Data processing device
US10762391B2 (en) Learning device, learning method, and storage medium
JP7054436B2 (ja) 検出システム、情報処理装置、評価方法及びプログラム
JP6584250B2 (ja) 画像分類方法、分類器の構成方法および画像分類装置
JP7059883B2 (ja) 学習装置、画像生成装置、学習方法、及び学習プログラム
JP2020042737A (ja) モデル更新支援システム
US20150347369A1 (en) Annotation display assistance device and method of assisting annotation display
JP2019159820A (ja) 検査装置、画像識別装置、識別装置、検査方法、及び検査プログラム
US8942478B2 (en) Information processing apparatus, processing method therefor, and non-transitory computer-readable storage medium
CN111310826A (zh) 样本集的标注异常检测方法、装置及电子设备
JP2018077712A (ja) 情報処理装置及び情報処理プログラム
JPWO2019159409A1 (ja) 搬送物の追跡装置、搬送物の計数装置、搬送物の追跡方法、搬送物の計数方法、搬送物の追跡システム、および搬送物の計数システム
KR20220067363A (ko) 이미지 분석 서버, 이미지 분석 서버를 이용한 객체 카운팅 방법 및 객체 카운팅 시스템
JP2022014793A (ja) 情報処理装置、情報処理方法、及びプログラム
WO2021033310A1 (ja) 処理装置、処理方法及びプログラム
US10321089B2 (en) Image preproduction apparatus, method for controlling the same, and recording medium
US20230306630A1 (en) Image analysis server, object counting method using image analysis server, and object counting syste
JPWO2020136761A1 (ja) 情報処理装置、情報処理方法、およびプログラム
US11095814B2 (en) Image processing apparatus and image processing method