JP2020030695A - 教師データ生成装置及び機械学習システム - Google Patents
教師データ生成装置及び機械学習システム Download PDFInfo
- Publication number
- JP2020030695A JP2020030695A JP2018156642A JP2018156642A JP2020030695A JP 2020030695 A JP2020030695 A JP 2020030695A JP 2018156642 A JP2018156642 A JP 2018156642A JP 2018156642 A JP2018156642 A JP 2018156642A JP 2020030695 A JP2020030695 A JP 2020030695A
- Authority
- JP
- Japan
- Prior art keywords
- teacher data
- image
- learning
- unit
- data generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【課題】検査員と同等以上の信頼性の高い検査精度を達成するには、教師データの品質を向上させ、機械学習の精度を向上させる教師データ生成装置を提供する。【解決手段】機械学習システム1において、機械学習に用いられる教師データを生成する教師データ生成装置2であって、ユーザにより人的評価が行われた画像を特定し、特定した画像を教師データとすることで教師データを生成する。【選択図】図1
Description
本発明は、教師データ生成装置及び機械学習システムに関する。
製品や製品部品等の検査対象の不良品検査は、人間(検査員)の目視により行われている。ただし、検査員による不良品検査は熟練を要する。そのため、検査員と同等以上の信頼性の高い不良品検査の検査装置が求められている。
下記特許文献1には、学習用画像(教師データ)を機械学習することによって抽出した特徴量に基づいて、検査対象を撮像した検査画像から該検査対象の不良品検査を行う検査装置が開示されている。
しかしながら、検査員と同等以上の信頼性の高い検査精度を達成するには、教師データの品質を向上させ、機械学習の精度をさらに向上させる必要がある。なお、このような問題は不良品検査に限られた問題ではなく、目視で行われていた検査や判定を機械学習で行う場合に共通する問題である。
本発明は、このような事情に鑑みてなされたもので、その目的は、機械学習の精度を向上させることである。
本発明の一態様は、機械学習に用いられる教師データを生成する教師データ生成装置であって、ユーザにより人的評価が行われた画像を特定し、特定した画像を前記教師データとすることで前記教師データを生成することを特徴とする、教師データ生成装置である。
本発明の一態様は、上述の教師データ生成装置であって、第1の画像に対してユーザが注視している注視点を特定する注視点特定部と、前記第1の画像のうち、前記注視点を含む所定範囲の画像を前記教師データとする教師データ生成部とを備える。
本発明の一態様は、上述の教師データ生成装置であって、前記教師データ生成部は、前記第1の画像を複数の画像に分割する分割部と、前記分割部により分割された前記複数の画像を、前記注視点を含まない第2の画像と、前記注視点を含む第3の画像と、に分類してそれぞれを前記教師データとする分類部と、を備える。
本発明の一態様は、上述の教師データ生成装置と、上記教師データ生成装置により生成された前記教師データを用いて機械学習を行うことにより、検査画像から異常箇所を判別する学習モデルを生成する学習装置と、を備えることを特徴とする機械学習システムである。
本発明の一態様は、上述の機械学習システムであって、前記学習装置は、前記第2の画像及び前記第3の画像のそれぞれを前記教師データとして用いることでニューラルネットワークの学習モデルを生成する学習部を備える。
本発明の一態様は、上述の機械学習システムであって、前記学習部は、前記第2の画像及び前記第3の画像のそれぞれを用いて前記ニューラルネットワークにおける重みを更新することで前記重みを最適化する重み調整部と、前記重み調整部において前記第3の画像を用いて前記重みを更新する場合の学習率を、前記第2の画像を用いて前記重みを更新する場合よりも高い値に設定する学習率設定部と、を備える。
以上説明したように、本発明によれば、機械学習の精度を向上させることができる。
以下、本発明の一実施形態に係る教師データ生成装置及び機械学習システムを、図面を用いて説明する。
図1は、本発明の一実施形態に係る機械学習システム1の概略構成の一例を示す図である。本発明の一実施形態に係る機械学習システム1は、撮像装置Aにより撮像された撮像画像から教師データを生成し、その生成した教師データを用いて機械学習を行うシステムである。なお、本実施形態に係る機械学習は、深層学習や強化学習を含む。なお、撮像画像は、本発明の「第1の画像」の一例である。
撮像装置Aは、例えば、製品や製品部品等の検査対象を撮像し、その撮像した撮像画像を機械学習システム1に送信する。この検査対象の検査とは、検査対象の異常の有無を判定することであって、例えば、外観検査や非破壊検査、超音波検査、X線検査、CT(Computed Tomography)検査、MRI(Magnetic Resonance Imaging)検査、核医学検査等である。
以下に、本発明の一実施形態に係る機械学習システム1の構成について、説明する。
図1に示すように、機械学習システム1は、教師データ生成装置2、格納部3、及び学習装置4を備える。
図1に示すように、機械学習システム1は、教師データ生成装置2、格納部3、及び学習装置4を備える。
教師データ生成装置2は、撮像装置Aが撮像した撮像画像に基づいて、機械学習に用いられる教師データを生成する。そして、教師データ生成装置2は、生成した教師データを格納部3に格納する。なお、教師データ生成装置2は、CPU又はMPUなどのマイクロプロセッサ、MCUなどのマイクロコントローラなどにより構成されてよい。
格納部3は、教師データ生成装置2に生成された教師データを格納する、例えば、データベースである。格納部3は、HDD(Hard Disk Drive)やメモリ等で構成される。
学習装置4は、格納部3に格納された教師データを用いて機械学習を行うことにより、検査画像から異常箇所を判別する学習モデルを生成する。例えば、検査画像とは、検査対象の検査を行うにあたり、撮像装置Aにより撮像された検査対象の撮像画像であって、異常の有無が不明である画像である。なお、学習装置4は、CPU又はMPUなどのマイクロプロセッサ、MCUなどのマイクロコントローラなどにより構成されてよい。
以下に、本発明の一実施形態に係る教師データ生成装置2の構成について、図2を用いて説明する。図2は、本発明の一実施形態に係る教師データ生成装置2の概略構成の一例を示す図である。
教師データ生成装置2は、表示装置5、注視点特定部6、及び教師データ生成部7を備える。
表示装置5は、撮像装置Aが撮像した撮像画像を表示画面に表示する。例えば、表示装置5は、パーソナルコンピュータ用のモニタである。ただし、表示装置5は、撮像画像を表示可能であればよく、デジタルスチルカメラ、デジタルビデオカメラなどの撮像機器の表示デバイスであってよい。他にも、表示装置5は、携帯電話機などの携帯機器の表示デバイスであってもよいし、ヘッドマウントディスプレイであってもよい。
注視点特定部6は、表示装置5に表示されている撮像画像に対してユーザが注視している点(以下、「注視点」という。)を特定する。ここで、本実施形態に係るユーザとは、表示装置5に表示されている撮像画像から、上記検査対象の異常の有無を検査する検査員である。例えば、CT画像から腫瘍の有無を検査する画像検査においては、検査員とは医者である。
例えば、注視点特定部6は、ユーザの視線を計測する視線計測手段61を備え、ユーザが表示装置5の表示画面に表示されている撮像画像を確認している場合に、視線計測手段61によりユーザの視線を計測することで注視点を特定する。
例えば、視線計測手段61は、表示装置5の前面側に設けられており、「サーチコイル法」、「強膜トラッカー法」、「EOG(Electrooculography)法」、「角膜反射法」、「瞳孔−角膜反射法」、又は「明/暗瞳孔法」等の公知の技術を用いて、ユーザの視線を計測する。そして、注視点特定部6は、例えば、視線計測手段61により計測されたユーザの視線から注視点の座標を求めることで、当該注視点を特定する。
教師データ生成部7は、ユーザにより人的評価が行われた画像を教師データとすることで教師データを生成する。例えば、教師データ生成部7は、撮像画像のち、注視点特定部6により特定された注視点を含む所定範囲の画像を教師データとする。以下に、本発明の一実施形態に係る教師データ生成部7の構成について、具体的に説明する。
教師データ生成部7は、分割部71及び分類部72を備える。
分割部71は、表示装置5に表示されている撮像画像を複数の画像(以下、「分割画像」という。)に分割する。また、本実施形態に係る複数の分割画像には、正解ラベルが付与されている。本実施形態に係る正解ラベルとは、分割画像に映っている検査対象の箇所が「正常」であるか「異常」であるかを表すものである。なお、各分割画像に付与される正解ラベルは、分割前に付与されてもよいし、分割後に付与されてもよい。さらに、本実施形態では、各分割画像に正解ラベルが付与されていればよく、その付与の方法に関しては特に限定されない。
分類部72は、分割部71により分割された複数の分割画像を、注視点を含まない通常画像と、注視点を含む重要画像と、に分類してそれぞれを教師データとして格納部3に格納する。なお、通常画像は、本発明の「第2の画像」の一例である。また、重要画像は、本発明の「第3の画像」の一例である。
以下に、本発明の一実施形態に係る教師データ生成装置2の教師データの生成方法について説明する。
例えば、図3に示すように、視線計測手段61として、赤外線の光源及び赤外線カメラが表示画面の前面に設けられており、ユーザの眼球に近赤外線を照射する。そして、赤外線カメラは、角膜による赤外線の反射画像を撮影し、瞳孔の画像及び赤外線の反射画像を用いて視線を計測する。注視点特定部6は、視線計測手段61によって計測された視線に基づいて、表示装置5に表示されている撮像画像Fに対してユーザが注視している注視点Pを特定する。例えば、この注視点Pとは、検査員が検査対象を目視で異常の有無を判断する場合において注視する箇所であって、異常もしくは異常と間違いやすい箇所に相当する。
次に、分割部71により撮像画像Fがグリッド状に複数の分割画像に分割され、分類部72は、複数の分割画像を、注視点特定部6により特定された注視点Pが含まれる重要画像と、注視点Pを含まない通常画像とに分類する。ここで、分類とは、複数の分割画像のそれぞれを重要画像であるか通常画像であるかを区分することであって、注視点Pを含む分割画像に対して注視点の情報を付帯情報として付加し、注視点を含まない分割画像に対して注視点の情報を付帯情報として付加しないことも含む。
例えば、図4に示すように、分割部71が撮像画像Fを複数の分割画像F1〜F30に分割し、注視点特定部6が特定した注視点Pが分割画像F8、F9、及びF24のそれぞれに含まれているとする。さらに、複数の分割画像F1〜F30には検査対象の箇所が「正常」であるか「異常」であるかを表す正解ラベルが付与されており、分割画像F1〜F9,F11〜15,F17〜F23,F25〜F30に「正常」の正解ラベルが付与され、分割画像F10,F16,F24に「異常」の正解ラベルが付与されている。
この場合には、分類部72は、注視点が含まれている分割画像F8、F9、及びF24を重要画像に分類し、注視点Pが含まれない分割画像F1〜F7、F10〜F23及びF25〜F30を通常画像に分類する。そして、分類部72は、分類した重要画像と通常画像とを格納部3に格納する。
次に、本発明の一実施形態に係る学習装置4の構成について、図5を用いて説明する。図5は、本発明の一実施形態に係る学習装置4の概略構成の一例を示す図である。
図5に示すように、学習装置4は、学習部8及び格納部9を備える。
学習部8は、格納部3に格納された教師データである通常画像及び重要画像のそれぞれを用いることで、検査画像から検査対象の異常箇所を判別するニューラルネットワークの学習モデルを生成する学習処理を行う。そして、学習部8は、生成した学習モデルを格納部9に格納する。
学習部8は、格納部3に格納された教師データである通常画像及び重要画像のそれぞれを用いることで、検査画像から検査対象の異常箇所を判別するニューラルネットワークの学習モデルを生成する学習処理を行う。そして、学習部8は、生成した学習モデルを格納部9に格納する。
格納部9には、学習装置4で生成された学習モデルが格納される。格納部9は、HDD(Hard Disk Drive)やメモリ等で構成される。
以下に、本発明の一実施形態に係る学習装置4の構成について、説明する。
図5に示すように、学習装置4は、教師データ取得部10、ニューラルネットワーク11、誤差算出部12、重み調整部13、及び学習率設定部14を備える。
図5に示すように、学習装置4は、教師データ取得部10、ニューラルネットワーク11、誤差算出部12、重み調整部13、及び学習率設定部14を備える。
教師データ取得部10は、格納部3から通常画像及び重要画像を教師データとして取得する。
ニューラルネットワーク11は、検査画像に検査対象の異常箇所が映っているか否かを判定してその判定結果を出力する学習モデルである。ニューラルネットワーク11は、学習処理において、通常画像及び重要画像を用いて各エッジの重みが最適化されることで、判定結果の確信度を高めていく。このニューラルネットワークのパラメータである重みを最適化することが、本実施形態に係る機械学習の「学習」である。この重みの最適化の方法は、種々の方法を採用可能であるが、本実施形態では、誤差逆伝播法を用いる場合について説明する。
誤差算出部12は、学習部8がニューラルネットワーク11の入力層に通常画像や重要画像の画像データ(例えば、画像のピクセル値)を入力データとして入力することで出力層から出力される結果と、その入力層に入力した画像データに付されていた正解(正解ラベル)との誤差を、損失関数(例えば、二乗誤差関数)を用いて画像データごとに算出する。
重み調整部13は、誤差算出部12で算出される誤差が小さくなるように勾配降下法を用いてニューラルネットワーク11の重みを更新することで当該重みを最適化する。
学習率設定部14は、重み調整部13の勾配降下法の学習率を設定する。この学習率とは、重みの更新量を示すものである。より具体的には、学習率設定部14は、重み調整部13において重要画像を用いて重みを更新する場合の学習率を、通常画像を用いて重みを更新する場合よりも高い値に設定する。これにより,注視点が集中するような箇所、すなわち異常もしくは異常と間違いやすい箇所について重点的に学習が進むため、異常の未検知率が低くなる。
以下に、本発明の一実施形態に係る学習装置4の学習処理の動作について、図6を用いて説明する。図6は、本発明の一実施形態に係る学習装置4の学習処理の動作のフロー図である。
教師データ取得部10は、格納部3から通常画像と重要画像とを取得する(ステップS101)。次に、学習率設定部14は、ニューラルネットワーク11の入力層に入力される画像が、教師データ取得部10で取得された通常画像及び重要画像のいずれかであるかを判定する(ステップS102)。
学習率設定部14は、ニューラルネットワーク11の入力層に入力される画像が通常画像である場合には学習率を第1の値に設定する(ステップS103)。したがって、学習部8は、通常画像を学習する場合には、第1の値に設定された学習率で誤差逆伝播法により学習処理を行う。
一方、学習率設定部14は、ニューラルネットワーク11の入力層に入力される画像が重要画像である場合には、学習率を第1の値よりも高い第2の値に設定する。したがって、学習部8は、重要画像を学習する場合には、第1の値よりも高い値に設定された学習率で誤差逆伝播法により学習処理を行う(ステップS104)。
一方、学習率設定部14は、ニューラルネットワーク11の入力層に入力される画像が重要画像である場合には、学習率を第1の値よりも高い第2の値に設定する。したがって、学習部8は、重要画像を学習する場合には、第1の値よりも高い値に設定された学習率で誤差逆伝播法により学習処理を行う(ステップS104)。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
(変形例1)
上記実施形態では、教師データ生成装置2は、視線計測手段61が表示装置5の前面側に設けられる場合について説明したが、本発明はこれに限定されない。例えば、視線計測手段61は、ユーザの頭部に装着可能な眼鏡型のウェアラブルデバイスで構成されてもよい。
上記実施形態では、教師データ生成装置2は、視線計測手段61が表示装置5の前面側に設けられる場合について説明したが、本発明はこれに限定されない。例えば、視線計測手段61は、ユーザの頭部に装着可能な眼鏡型のウェアラブルデバイスで構成されてもよい。
(変形例2)
上記実施形態では、教師データ生成装置2は、ユーザの視線を計測することで注視点を特定したが、本発明はこれに限定されない。例えば、表示画面に撮像画像が表示されている場合において、注視点特定部6は、ユーザが表示画面に対して行った所定の操作を検出することで注視点を特定してもよい。この所定の操作とは、例えば、表示画面がタッチパネルで構成されている場合のタッチ操作である。具体的には、ユーザは、表示画面に対して注視点の位置を指やペン等で接触することで注視点を指定する。したがって、注視点特定部6は、表示画面のどの位置に指やペンが接触したかを特定することで、注視点を特定してもよい。
上記実施形態では、教師データ生成装置2は、ユーザの視線を計測することで注視点を特定したが、本発明はこれに限定されない。例えば、表示画面に撮像画像が表示されている場合において、注視点特定部6は、ユーザが表示画面に対して行った所定の操作を検出することで注視点を特定してもよい。この所定の操作とは、例えば、表示画面がタッチパネルで構成されている場合のタッチ操作である。具体的には、ユーザは、表示画面に対して注視点の位置を指やペン等で接触することで注視点を指定する。したがって、注視点特定部6は、表示画面のどの位置に指やペンが接触したかを特定することで、注視点を特定してもよい。
(変形例3)
上記実施形態に係るニューラルネットワーク11は、複数の隠れ相を持つ、いわゆる多層ニューラルネットワーク(ディープラーニング)であってもよい。
上記実施形態に係るニューラルネットワーク11は、複数の隠れ相を持つ、いわゆる多層ニューラルネットワーク(ディープラーニング)であってもよい。
(変形例4)
上記実施形態では、正解ラベルが付与された重要画像を用いたが、本発明はこれに限定されない。すなわち、学習装置4が機械学習するためのデータとして、人的評価が行われた画像を生成すればよく、正解ラベルが付与されていなくてもよい。この場合には、例えば、学習装置4は、本実施形態のような教師あり学習ではなく、教師なし学習を行うことになる。
上記実施形態では、正解ラベルが付与された重要画像を用いたが、本発明はこれに限定されない。すなわち、学習装置4が機械学習するためのデータとして、人的評価が行われた画像を生成すればよく、正解ラベルが付与されていなくてもよい。この場合には、例えば、学習装置4は、本実施形態のような教師あり学習ではなく、教師なし学習を行うことになる。
(変形例5)
上記実施形態では、教師データ生成部7は、第1の画像である撮像画像に対して当該撮像画像の人的評価に関する付帯情報を付加したものを教師データとすることで教師データを生成してもよい。例えば、教師データ生成部7は、撮像画像に注視点を付帯情報として付加したものを教師データとしてもよい。具体的には、教師データ生成部7は、複数の分割画像のうち、注視点を含む分割画像に当該注視点を含むことを示す情報を付帯情報として付加したものを教師データとしてもよい。
上記実施形態では、教師データ生成部7は、第1の画像である撮像画像に対して当該撮像画像の人的評価に関する付帯情報を付加したものを教師データとすることで教師データを生成してもよい。例えば、教師データ生成部7は、撮像画像に注視点を付帯情報として付加したものを教師データとしてもよい。具体的には、教師データ生成部7は、複数の分割画像のうち、注視点を含む分割画像に当該注視点を含むことを示す情報を付帯情報として付加したものを教師データとしてもよい。
(変形例6)
上記実施形態では、教師データ生成部7は、複数の分割画像に対して付帯情報として重要度を付加してもよい。この重要度は、学習装置4に対して学習させるデータとしてどの程度重要かを示す度合であって、ユーザにより設定される。この場合には、学習装置4は、重要度が高い分割画像ほど、学習率を高い値に設定して学習処理を実行してもよい。
上記実施形態では、教師データ生成部7は、複数の分割画像に対して付帯情報として重要度を付加してもよい。この重要度は、学習装置4に対して学習させるデータとしてどの程度重要かを示す度合であって、ユーザにより設定される。この場合には、学習装置4は、重要度が高い分割画像ほど、学習率を高い値に設定して学習処理を実行してもよい。
(変形例7)
上記実施形態では、分割部71は、撮像画像をグリッド状に分割したが、本発明はこれに限定されず、任意の形状の画像に分割可能である。
上記実施形態では、分割部71は、撮像画像をグリッド状に分割したが、本発明はこれに限定されず、任意の形状の画像に分割可能である。
(変形例8)
上記実施形態では、学習装置4に学習させる重要画像及び通常画像のそれぞれの数を調整し、通常画像よりも重要画像の数を多く用意して学習装置4に学習させてもよい。これより、効率的な機械学習を実施することができる。なお、重要画像及び通常画像のそれぞれの数の調整は、教師データ生成部7が行ってもよいし、学習装置4が行ってもよい。
上記実施形態では、学習装置4に学習させる重要画像及び通常画像のそれぞれの数を調整し、通常画像よりも重要画像の数を多く用意して学習装置4に学習させてもよい。これより、効率的な機械学習を実施することができる。なお、重要画像及び通常画像のそれぞれの数の調整は、教師データ生成部7が行ってもよいし、学習装置4が行ってもよい。
(変形例9)
上記実施形態では、学習装置4は、重要画像を学習する場合には、通常画像を学習する場合に比べて学習率を高い値に設定したが、本発明はこれに限定されない。例えば、学習装置4は、重要画像を学習する場合には、通常画像を学習する場合に比べて、ニューラルネットワーク11の重みをx倍にしてもよい。具体的には、学習部8は、誤差算出部12で差算出された誤差の値をx倍することで、逆伝播の値もx倍にしてもよい。
上記実施形態では、学習装置4は、重要画像を学習する場合には、通常画像を学習する場合に比べて学習率を高い値に設定したが、本発明はこれに限定されない。例えば、学習装置4は、重要画像を学習する場合には、通常画像を学習する場合に比べて、ニューラルネットワーク11の重みをx倍にしてもよい。具体的には、学習部8は、誤差算出部12で差算出された誤差の値をx倍することで、逆伝播の値もx倍にしてもよい。
以上、説明したように、本実施形態に係る教師データ生成装置2は、第1の画像のうち、ユーザ(例えば、検査員)により人的評価が行われた画像を特定し、その特定した画像を教師データとすることで前記教師データを生成する。
このような構成によれば、教師データの品質を向上させることができ、機械学習の精度を向上させることができる。
また、教師データ生成装置2は、撮像画像に対してユーザが注視している注視点を特定する注視点特定部6を備えてもよい。そして、教師データ生成部7は、撮像画像のうち、注視点を含む所定範囲の画像を教師データとしてもよい。この所定範囲は、注視点を含む範囲であれば特に限定されない。
このような構成によれば、例えば、検査員がどの位置を見て異常又は正常と判断しているのかといった情報を教師データに反映させることが可能になり、教師データの品質を向上させることができる。
また、教師データ生成部7は、撮像画像を複数の画像に分割して、その複数の画像を、注視点を含まない通常画像と、注視点を含む重要画像と、に分類してそれぞれを教師データとしてもよい。
このような構成によれば、注視点を含まない通常画像も有効に活用しながら、教師データの品質を向上させることができる。
また、本実施形態に係る機械学習システム1は、教師データ生成装置2と、教師データ生成装置2により生成された教師データを用いて機械学習を行うことにより、検査画像から異常箇所を判別する学習モデルを生成する学習装置4を備える。
そして、学習装置4は、通常画像及び重要画像のそれぞれを教師データとして用いることでニューラルネットワークの学習モデルを生成する学習部8を備える。
そして、学習装置4は、通常画像及び重要画像のそれぞれを教師データとして用いることでニューラルネットワークの学習モデルを生成する学習部8を備える。
このような構成によれば、注視点が集中するような箇所、すなわち異常もしくは異常と間違いやすい箇所について機械学習を行うことができ、機械学習の精度を向上させることができる。
また、学習部8は、通常画像及び重要画像のそれぞれを用いてニューラルネットワークにおける重みを更新することで重みを最適化する重み調整部13と、重み調整部13において重要画像を用いて重みを更新する場合の学習率を、通常画像を用いて重みを更新する場合よりも高い値に設定する学習率設定部14と、を備える。
このような構成によれば、注視点が集中するような箇所、すなわち異常もしくは異常と間違いやすい箇所について重点的に機械学習を行うことができ、機械学習の精度を向上させることができる。
また、上述した実施形態における教師データ生成部7や学習装置4の全部または一部をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
例えば、教師データ生成部7における上記のプログラムは、例えば、コンピュータに、ユーザにより人的評価が行われた画像を教師データとすることで教師データを生成する教師データ生成ステップを実行させてもよい。
また、このプログラムは、例えば、コンピュータに、撮像画像を複数の画像に分割する分割ステップと、分割ステップにより分割された複数の画像を、注視点を含まない通常画像と、注視点を含む重要画像と、に分類してそれぞれを教師データとする分類ステップと、を実行させてもよい。
また、このプログラムは、例えば、コンピュータに、撮像画像を複数の画像に分割する分割ステップと、分割ステップにより分割された複数の画像を、注視点を含まない通常画像と、注視点を含む重要画像と、に分類してそれぞれを教師データとする分類ステップと、を実行させてもよい。
さらに、学習装置4における上記のプログラムは、例えば、コンピュータに、通常画像及び重要画像のそれぞれを用いてニューラルネットワークにおける重みを更新することで重みを最適化する重み調整ステップと、重み調整ステップにおいて重要画像を用いて重みを更新する場合の学習率を、通常画像を用いて重みを更新する場合よりも高い値に設定する学習率設定ステップと、を実行させてもよい。
1 機械学習システム
2 教師データ生成装置
3,9 格納部
4 学習装置
5 表示装置
6 注視点特定部
7 教師データ生成部
12 誤差算出部
13 重み調整部
14 学習率設定部
71 分割部
72 分類部
2 教師データ生成装置
3,9 格納部
4 学習装置
5 表示装置
6 注視点特定部
7 教師データ生成部
12 誤差算出部
13 重み調整部
14 学習率設定部
71 分割部
72 分類部
Claims (6)
- 機械学習に用いられる教師データを生成する教師データ生成装置であって、
ユーザにより人的評価が行われた画像を特定し、特定した画像を前記教師データとすることで前記教師データを生成することを特徴とする、教師データ生成装置。 - 第1の画像に対してユーザが注視している注視点を特定する注視点特定部と、
前記第1の画像のうち、前記注視点を含む所定範囲の画像を前記教師データとする教師データ生成部と、
を備えることを特徴とする、請求項1に記載の教師データ生成装置。 - 前記教師データ生成部は、
前記第1の画像を複数の画像に分割する分割部と、
前記分割部により分割された前記複数の画像を、前記注視点を含まない第2の画像と、前記注視点を含む第3の画像と、に分類してそれぞれを前記教師データとする分類部と、
を備えることを特徴とする、請求項2に記載の教師データ生成装置。 - 請求項3に記載の教師データ生成装置と、
前記教師データ生成装置により生成された前記教師データを用いて機械学習を行うことにより、検査画像から異常箇所を判別する学習モデルを生成する学習装置と、
を備えることを特徴とする機械学習システム。 - 前記学習装置は、前記第2の画像及び前記第3の画像のそれぞれを前記教師データとして用いることでニューラルネットワークの学習モデルを生成する学習部を備えることを特徴とする請求項4に記載の機械学習システム。
- 前記学習部は、
前記第2の画像及び前記第3の画像のそれぞれを用いて前記ニューラルネットワークにおける重みを更新することで前記重みを最適化する重み調整部と、
前記重み調整部において前記第3の画像を用いて前記重みを更新する場合の学習率を、前記第2の画像を用いて前記重みを更新する場合よりも高い値に設定する学習率設定部と、
を備えることを特徴とする請求項5に記載の機械学習システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018156642A JP2020030695A (ja) | 2018-08-23 | 2018-08-23 | 教師データ生成装置及び機械学習システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018156642A JP2020030695A (ja) | 2018-08-23 | 2018-08-23 | 教師データ生成装置及び機械学習システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020030695A true JP2020030695A (ja) | 2020-02-27 |
Family
ID=69622922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018156642A Pending JP2020030695A (ja) | 2018-08-23 | 2018-08-23 | 教師データ生成装置及び機械学習システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020030695A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023074184A1 (ja) | 2021-10-28 | 2023-05-04 | パナソニックIpマネジメント株式会社 | アノテーション支援システム及びそれを利用した外観検査用モデルの学習支援システム |
-
2018
- 2018-08-23 JP JP2018156642A patent/JP2020030695A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023074184A1 (ja) | 2021-10-28 | 2023-05-04 | パナソニックIpマネジメント株式会社 | アノテーション支援システム及びそれを利用した外観検査用モデルの学習支援システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021221508B2 (en) | Digital visual acuity eye examination for remote physician assessment | |
Bhaskaranand et al. | The value of automated diabetic retinopathy screening with the EyeArt system: a study of more than 100,000 consecutive encounters from people with diabetes | |
CN106157297B (zh) | 图像处理装置和图像处理方法 | |
JP7348918B2 (ja) | 眼内レンズ選択のためのシステム及び方法 | |
CN109191451B (zh) | 异常检测方法、装置、设备和介质 | |
US10799110B2 (en) | Personal monitoring for vision loss from macular degeneration | |
CN102209488A (zh) | 图像处理设备、图像处理方法、程序和程序记录介质 | |
US11925416B2 (en) | Method of performing an eye examination test | |
JP2017522104A (ja) | 目状態決定システム | |
JP5995415B2 (ja) | 医療診断支援装置、情報処理方法及びプログラム | |
JP2017010577A (ja) | 医療診断支援装置及び医療診断支援方法 | |
JP2020030695A (ja) | 教師データ生成装置及び機械学習システム | |
WO2020152555A1 (en) | Systems and methods for intraocular lens selection using emmetropia zone prediction | |
US20240120071A1 (en) | Quantifying and visualizing changes over time to health and wellness | |
US20230284899A1 (en) | Head-Mounted System for Measuring Ptosis | |
US12014823B2 (en) | Methods and systems for computer-aided diagnosis with deep learning models | |
US20240036641A1 (en) | Ocular anomaly detection via concurrent presentation of stimuli to both eyes | |
Berchuck et al. | Estimating Rates of Progression and Predicting Future Visual Fields in Glaucoma Using a Deep Variational Autoencoder Short Title: Variational Autoencoder in Glaucoma | |
Wong et al. | The Role of Telemedicine in Strabismus Assessment: A Narrative Review and Meta-Analysis | |
KR20240043488A (ko) | 멀티모달 딥 러닝 모델을 이용한 녹내장 환자의 미래 시야 예측 방법 | |
WO2023200846A1 (en) | Retinal distance-screening using machine learning | |
Nittala et al. | Automated detection of diabetic retinopathy lesions on ultrawidefield pseudocolour images. | |
Soares de Camargo et al. | Influence of automated disc margin determination on Stratus OCT optic nerve head measurements |