JP2019191973A - 学習画像生成装置及び学習画像生成方法、並びに画像認識装置及び画像認識方法 - Google Patents

学習画像生成装置及び学習画像生成方法、並びに画像認識装置及び画像認識方法 Download PDF

Info

Publication number
JP2019191973A
JP2019191973A JP2018084620A JP2018084620A JP2019191973A JP 2019191973 A JP2019191973 A JP 2019191973A JP 2018084620 A JP2018084620 A JP 2018084620A JP 2018084620 A JP2018084620 A JP 2018084620A JP 2019191973 A JP2019191973 A JP 2019191973A
Authority
JP
Japan
Prior art keywords
image
learning
machine learning
dimensional cad
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018084620A
Other languages
English (en)
Other versions
JP7017462B2 (ja
Inventor
強 芦田
Tsuyoshi Ashida
強 芦田
陽 岡本
Akira Okamoto
陽 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2018084620A priority Critical patent/JP7017462B2/ja
Publication of JP2019191973A publication Critical patent/JP2019191973A/ja
Application granted granted Critical
Publication of JP7017462B2 publication Critical patent/JP7017462B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】CADデータから学習画像を生成する学習画像生成装置及び学習画像方法、並びにその学習画像を用いて画像認識を行う画像認識装置及び画像認識方法を提供する。【解決手段】画像認識システム1において、画像認識装置3は、第1物体の撮像画像及び当該第1物体の3次元CAD画像を含む教師データを用いて機械学習を実行し、前記3次元CAD画像を入力とし、前記撮像画像を出力とする機械学習モデルを構築するモデル構築手段と、前記第1物体とは異なる形状を有する第2物体の3次元CAD画像を入力として前記機械学習モデルに与えることにより、前記第2物体の模倣画像を、前記第2物体の画像認識の学習画像として生成する画像生成手段とを備えている。【選択図】図1

Description

本発明は、CADデータから学習画像を生成する学習画像生成装置及び学習画像生成方法、並びにその学習画像を用いて画像認識を行う画像認識装置及び画像認識方法に関する。
物体を撮像して得られた画像から当該物体を認識する画像認識において、機械学習が近年利用され始めている。その場合、高い認識精度を達成するためには、認識対象となる物体の撮像画像を学習画像として大量に保有していることが必要になる。しかし、例えば、各種製品の製造工程における各種部品を認識対象とする場合では、新たに製造された部品及び製造数が少ない部品等については撮像画像を十分に用意することができず、学習画像を必要量確保することが困難なことがある。そこで、部品のCADデータを用いてCG画像である学習画像を生成する技術が提案されている。
上記のようにCADデータから学習画像を生成する技術として、CADデータのポリゴン表現の結合部をエッジとして扱い、そのエッジを用いて学習画像を生成する手法が知られている。その他にも、対象物体の輝度画像及び距離画像から対象物体の輝度分布モデルを推定し、その輝度分布モデルに基づいて学習画像を生成する手法が提案されている(特許文献1及び2を参照。)。
特許第6126437号公報 特開2017−120672号公報
しかしながら、上記の従来技術の前者については、対象物体を撮像する環境が変わり、光源位置及びその向きが異なると、エッジ抽出処理の精度が低下するため、良質な学習画像を得ることができないという問題がある。また、後者については、距離画像を取得するために高価な測定装置が必要になることに加え、対象物体との距離が大きく離れている又は対象物体が巨大なものである等の場合は適用することができないという問題がある。
本発明は斯かる事情に鑑みてなされたものであり、その主たる目的は、上記課題を解決することができる学習画像生成装置及び学習画像生成方法、並びに画像認識装置及び画像認識方法を提供することにある。
上述した課題を解決するために、本発明の一の態様の学習画像生成装置は、第1物体の撮像画像及び当該第1物体の3次元CAD画像を含む教師データを用いて機械学習を実行し、前記3次元CAD画像を入力とし、前記撮像画像を出力とする機械学習モデルを構築するモデル構築手段と、前記第1物体とは異なる形状を有する第2物体の3次元CAD画像を入力として前記機械学習モデルに与えることにより、前記第2物体の模倣画像を、前記第2物体の画像認識の学習画像として生成する画像生成手段とを備える。
この態様において、前記撮像画像における第1物体の角度と一致するように、前記第1物体の3次元CAD画像の角度を調整する調整手段をさらに備え、前記モデル構築手段は、前記調整手段により角度が調整された前記3次元CAD画像を用いて前記機械学習を実行するように構成されていてもよい。
また、上記態様において、前記第1物体の3次元CAD画像における第1物体の表面凹凸のコントラストを強調する凹凸強調手段をさらに備え、前記モデル構築手段は、前記凹凸強調手段により表面凹凸が強調された第1物体の3次元CAD画像を用いて前記機械学習を実行するように構成されていてもよい。
また、上記態様において、前記第1物体の3次元CAD画像における第1物体の輪郭線を強調する輪郭線強調手段をさらに備え、前記モデル構築手段は、前記輪郭線強調手段により輪郭線が強調された第1物体の3次元CAD画像を用いて前記機械学習を実行するように構成されていてもよい。
また、上記態様において、前記モデル構築手段は、前記機械学習モデルを用いて前記第1物体の模倣画像を生成する生成手段と、生成した模倣画像と前記第1物体の撮像画像とを識別する識別手段とを具備しており、前記識別手段による識別結果を用いて前記機械学習を実行するように構成されていてもよい。
また、上記態様において、前記第1物体及び前記第2物体とは異なる形状を有する第3物体の撮像画像及び当該第3物体の3次元CAD画像を含む教師データを用いて機械学習を実行し、前記3次元CAD画像を入力とし、前記撮像画像を出力とする第2機械学習モデルを構築する第2モデル構築手段をさらに備え、前記画像生成手段は、前記第2物体の形状が前記第1物体よりも前記第3物体の形状に近い場合に、前記取得した3次元CAD画像を入力として前記第2機械学習モデルに与えることにより、前記第2物体の模倣画像を生成するように構成されていてもよい。
また、上記態様において、前記機械学習モデルは、畳み込み層及びプーリング層を含む畳み込みニューラルネットワークであってもよい。
本発明の一の態様の画像認識装置は、上記態様の学習画像生成装置により生成された学習画像及び前記第1物体の撮像画像と、前記第1物体及び前記第2物体の形状に関する形状情報とを含む教師データによって機械学習を実行し、前記学習画像及び前記撮像画像を入力とし、前記形状情報を出力とする機械学習モデルを構築するモデル構築手段と、撮像装置により得られた物体の撮像画像を取得する画像取得手段と、取得した撮像画像を入力として前記機械学習モデルに与え、前記機械学習モデルから出力される形状情報を取得する形状情報取得手段と、取得した形状情報に基づいて、前記撮像画像における物体を認識する画像認識手段とを備える。
本発明の一の態様の学習画像生成方法は、第1物体の撮像画像及び当該第1物体の3次元CAD画像を含む教師データを用いて機械学習を実行し、前記3次元CAD画像を入力とし、前記撮像画像を出力とする機械学習モデルを構築するステップと、前記第1物体とは異なる形状を有する第2物体の3次元CAD画像を入力として前記機械学習モデルに与えることにより、前記第2物体の模倣画像を、前記第2物体の画像認識の学習画像として生成するステップとを有する。
本発明の一の態様の画像認識方法は、請求項9に記載に記載された学習画像生成方法により生成された学習画像及び前記第1物体の撮像画像と、前記第1物体及び前記第2物体の形状に関する形状情報とを含む教師データによって機械学習を実行し、前記学習画像及び前記撮像画像を入力とし、前記形状情報を出力とする機械学習モデルを構築するステップと、撮像装置により得られた物体の撮像画像を取得するステップと、取得した撮像画像を入力として前記機械学習モデルに与え、前記機械学習モデルから出力される形状情報を取得するステップと、取得した形状情報に基づいて、前記撮像画像における物体を認識するステップとを有する。
本発明によれば、画像認識用の学習画像をCADデータから生成することができる。
実施の形態に係る画像認識装置を備える画像認識システムの構成を示すブロック図。 実施の形態に係る画像認識装置が備える制御部の構成を示すブロック図。 第1学習モードにおける前処理器の動作の流れを示すフローチャート。 第1学習モードにおける画像生成器の動作の流れを示すフローチャート。 3次元CAD画像の一例を示す図。 撮像画像の一例を示す図。 撮像画像に合わせて角度が調整された3次元CAD画像の一例を示す図。 第1学習モードにおける画像識別器の動作の流れを示すフローチャート。 画像生成モードにおける画像生成器の動作の流れを示すフローチャート。 3次元CAD画像の一例。 模倣画像の一例。 第2学習モードにおける学習器の動作の流れを示すフローチャート。 3次元CAD画像の一例を示す図。
以下、本発明の好ましい実施の形態を、図面を参照しながら説明する。なお、以下では、各種製品の製造工程における部品を画像認識の対象とした場合を例示する。
[画像認識システムの構成]
図1は、本実施の形態の画像認識装置を備える画像認識システムの構成を示すブロック図である。画像認識システム1は、認識対象の物体の撮像画像を取得する撮像装置2と、撮像装置2にて取得された撮像画像を用いて画像認識を実行する画像認識装置3と、画像認識装置3の処理結果を出力する出力装置4と、各種入力操作を行うための入力装置5とを備えている。
画像認識装置3は、例えばパーソナルコンピュータ等で構成され、制御部31と、記憶部32とを備えている。制御部31は、後述する各処理を実現するコンピュータプログラムを実行するとともに各装置を制御する。記憶部32は、当該コンピュータプログラム及び各種のデータを記憶する。この記憶部32には、撮像装置2により取得された各部品の撮像画像を格納する撮像画像データベース(DB)32aと、認識対象の物体である各部品の3次元CAD画像を格納する3次元CAD画像データベース(DB)32bとが設けられている。この3次元CAD画像は、各部品を設計する際に作成された3次元CADデータのスクリーンショットである。
図2は、画像認識装置3が備える制御部31の構成を示す機能ブロック図である。図2に示すように、制御部31は、3次元CAD画像に対して前処理を施す前処理器31aと、撮像画像と前処理器31aから入力された3次元CAD画像とを用いて後述する模倣画像(学習画像)を生成する画像生成器31bと、画像生成器31bによって生成された模倣画像と撮像画像とを識別する画像識別器31cと、画像生成器31bによって生成された学習画像を用いて機械学習を行う学習器31dと、学習器31dによる学習の結果得られた機械学習モデルを用いて画像認識を行う画像認識器31eとを備えている。これらの前処理器31a、画像生成器31b、画像識別器31c、学習器31d、及び画像認識器31eは、コンピュータプログラムのモジュールとして実現される。
上述したように構成された画像認識装置3は、本発明の学習画像生成装置としての機能を兼ねている。上記の前処理器31a、画像生成器31b及び画像識別器31cが、当該学習画像生成装置に相当する。以下では、画像認識装置3の動作の説明を、(1)撮像画像及び3次元CAD画像を用いて機械学習を行うことにより、学習画像を生成するための機械学習モデルである画像生成モデルを構築する第1学習モード、(2)その画像生成モデルを用いて学習画像を生成する画像生成モード、(3)生成された学習画像を用いて機械学習を行うことにより、画像認識を行うための機械学習モデルである画像認識モデルを構築する第2学習モード、(4)画像認識を実行する画像認識モードの4つに分けて行う。なお、このうち、(1)第1学習モード及び(2)画像生成モードにおける動作は本発明の学習画像生成装置としての動作に相当し、(3)第2学習モード及び(4)画像認識モードにおける動作が本発明の画像認識装置としての動作に相当する。
[画像認識装置の動作]
(1)第1学習モード
第1学習モードにおいては、前処理器31a、画像生成器31b及び画像識別器31cの各モジュールがそれぞれ後述する処理を実行する。これにより、部品の撮像画像及び3次元CAD画像を用いた機械学習が行われ、その結果画像生成モデルが構築される。
図3は、第1学習モードにおける前処理器31aの動作の流れを示すフローチャートである。図3に示すとおり、前処理器31aはまず、撮像画像DB32aに撮像画像が存在する部品の3次元CAD画像の入力を、3次元CAD画像DB32bから受け付ける(S101)。
次に、前処理器31aは、入力された3次元CAD画像における部品の表面に設けられている凹凸のコントラストを強調する処理を実行する(S102)。この場合の凹凸には、部品に形成されている貫通/非貫通の孔及び各種形状の突起物等が含まれる。
後に行われる画像認識においては、上記のような部品の表面に設けられている凹凸の位置及び大きさ等のような局所的な特徴に注目して各部品を認識する必要が生じる。そのため、認識性能を高めるために、それらの局所的な特徴が、画像認識に利用される学習画像において正確に再現されることが好ましい。しかし、特に小さな凹凸については潰れてしまい、正確に再現されないことがある。本実施の形態の場合、上記のステップS102により部品の凹凸のコントラストを強調させることによって、当該凹凸を正確に表現した学習画像を生成することが可能になる。
次に、前処理器31aは、入力された3次元CAD画像における部品の輪郭線を強調する処理を実行する(S103)。この処理は、例えば鮮鋭化フィルタを用いることにより行われる。
学習画像において部品の輪郭線がぼやける等した場合、認識性能の低下を招くおそれがある。本実施の形態の場合、上記のステップS103により部品の輪郭線を強調させることによって、当該輪郭線を正確に表現した学習画像を生成し、後に行われる画像認識の精度を高めることができる。
最後に、前処理器31aは、以上のように前処理が施された3次元CAD画像を画像生成器31bに出力し(S104)、処理を終了する。
画像生成器31bは、上記のとおり前処理が施された3次元CAD画像を用いて、次の処理を実行する。図4は、第1学習モードにおける画像生成器31bの動作の流れを示すフローチャートである。図4に示すとおり、画像生成器31bはまず、前処理器31aから3次元CAD画像の入力を、撮像画像DB32aから当該3次元CAD画像の部品に係る撮像画像の入力を、それぞれ受け付ける(S201)。
次に、画像生成器31bは、入力された撮像画像における部品の角度と一致するように、3次元CAD画像の角度を調整する(S202)。この処理の詳細について、図5乃至図7を参照しながら説明する。図5は前処理器31aから入力された3次元CAD画像の一例であり、図6は撮像画像DB32aから入力された撮像画像の一例である。これらの画像に表されている部品は同一部品である。ステップS202において、画像生成器31bは、図5に示す3次元CAD画像の角度を、図6に示す撮像画像の部品の角度と一致するように調整する。その結果、図5に示す3次元CAD画像は、図7に示す3次元CAD画像へと変換される。これにより、3次元CAD画像における部品が、撮像画像における部品と同じ見え方になる。この処理を行うことによって、画像認識の精度向上に寄与する学習構造を生成することができる。
上記の3次元CAD画像の角度の調整は、オペレータによる操作を介して行われる。具体的には、オペレータが入力装置5を用いて3次元CAD画像の角度を操作し、画像生成器31bがその操作に応じて当該3次元CAD画像の角度を変更する。但し、オペレータの操作を介することなく、画像生成器31bが自動的に角度の調整を行ってもよい。例えば、3次元CAD画像及び撮像画像の両画像における部品の輪郭線の位置等の情報を用いることにより、角度調整を自動的に行うことが可能である。
画像生成器31bは、以上のようにして角度が合わせられた撮像画像及び3次元CAD画像のペアを複数生成する。これらの画像のペアが、機械学習に用いられる教師データとなる。
なお、ペアとされた両画像を水平/垂直方向に反転させたり、輝度値を調整したりすることにより、教師データの数を増やすようにしてもよい。これによって、より適切な機械学習モデルを得ることが可能になる。
次に、画像生成器31bは、上記のようにして用意された教師データを用いて機械学習を実行する(S203)。これにより、学習画像を生成するための機械学習モデルである画像生成モデルが構築される。この画像生成モデルは、複数の畳み込み層と、複数のプーリング層と、複数の全結合層とを含む畳み込みニューラルネットワーク(Convolutional Neural Network)であって、教師データである3次元CAD画像を入力とし、同じく撮像画像を出力とするモデルである。
上記のようにして画像生成モデルが構築された後、画像生成器31bは、学習回数が所定回数に達する等の所定の終了条件を満たすか否かを判定する(S204)。ここで、終了条件を満たしたと判定した場合(S204でYES)、画像生成器31bは処理を終了する。
他方、終了条件を満たしていないと判定した場合(S204でNO)、画像生成器31bは、教師データとして用いられている3次元CAD画像を入力として画像生成モデルに与えることにより、その3次元CAD画像に表されている物体の撮像画像を模倣した画像である模倣画像を生成し(S205)、その模倣画像を画像識別器31cに出力する(S206)。
図8は、第1学習モードにおける画像識別器31cの動作の流れを示すフローチャートである。図8に示すとおり、画像識別器31cは、画像生成器31bから模倣画像の入力を、撮像画像DB32aから当該模倣画像の部品に係る撮像画像の入力を、それぞれ受け付ける(S301)。
次に、画像識別器31cは、入力された模倣画像及び撮像画像のペアを用いて機械学習を実行する(S302)。これにより、画像を識別するための機械学習モデルである画像識別モデルが構築される。この画像識別モデルは、上記の画像生成モデルと同様に畳み込みニューラルネットワークであって、模倣画像を入力とし、その模倣画像と撮像画像との識別結果を出力とするモデルである。ここで、入力された模倣画像が画像生成器31bにより生成された画像であると正しく判定できた場合は識別できたことを示す情報が、反対にその模倣画像がペアとなっている撮像画像であると間違って判定した場合は識別できなかったことを示す情報が、識別結果として出力される。
上記のようにして画像識別モデルが構築された後、画像識別器31cは、模倣画像を入力として当該画像識別モデルに与えることにより、その模倣画像と撮像画像との識別結果を生成し(S303)、その識別結果を画像生成器31bに出力する(S304)。
図4に戻り、画像生成器31bは、画像識別器31cから識別結果の入力を受け付け(S207)、ステップS203に戻り機械学習を繰り返す。このとき、画像生成器31bは、入力された識別結果が模倣画像と撮像画像との識別ができたことを示すものであった場合、画像識別器31cが両画像を識別できなくなるようにパラメータを調整して、機械学習を実行する。この機械学習の繰り返しは、ステップS204において終了条件を満たしたと判定されるまで行われる。
その後、上記と同様にしてステップS205及びS206が実行され、画像生成器31bから画像識別器31cに対して模倣画像が出力される。この入力を受け付けた画像識別器31cは、ステップS302を実行して機械学習を行う。このとき、画像識別器31cは、入力された模倣画像と撮像画像とを識別することができるようにパラメータを調整して、機械学習を実行する。
上記のようにして画像生成器31b及び画像識別器31cが互いに競い合うようにして機械学習を繰り返すことにより、画像生成器31bは高精度の画像生成モデル、すなわち撮像画像に極めて近い模倣画像を生成可能な画像生成モデルを構築することができる。
(2)画像生成モード
画像生成モードにおいては、画像生成器31bが、第1学習モードにおいて構築された画像生成モデルを用いて学習画像を生成する。
図9は、画像生成モードにおける画像生成器31bの動作の流れを示すフローチャートである。図9に示すように、画像生成器31bは、3次元CAD画像DB32bから3次元CAD画像の入力を受け付ける(S401)。この3次元CAD画像は、撮像画像が存在しない部品に係る3次元CAD画像である。
次に、画像生成器31bは、入力された3次元CAD画像を入力として画像生成モデルに与えることにより、上記部品の模倣画像を生成する(S402)。
図10は、ステップS401にて入力が受け付けられた3次元CAD画像の一例であり、図11は、ステップS402にて生成された模倣画像の一例である。これらの図10及び図11に示すように、3次元CAD画像に表されている部品に似た形状の模倣画像が得られる。この模倣画像は、撮像画像が存在しない当該部品の画像認識に利用される学習画像となる。
次に、画像生成器31bは、生成した学習画像(模倣画像)を学習器31dに対して出力する(S403)。これにより、画像生成モードは終了し、第2学習モードに移行する。
(3)第2学習モード
第2学習モードにおいては、学習器31dが、画像生成モードにより生成された学習画像を用いて機械学習を行い、画像認識モデルを構築する。
図12は、第2学習モードにおける学習器31dの動作の流れを示すフローチャートである。図12に示すように、学習器31dは、撮像画像DB32aから撮像画像の入力を、画像生成器31bから学習画像の入力を、それぞれ受け付ける(S501)。このとき、これらの画像に表されている部品の形状に関する形状情報の入力も受け付ける(S501)。この形状情報は、当該部品の設計に用いられた3次元CADデータから得られたものである。これらの撮像画像及び学習画像並びに部品の形状情報が、機械学習に用いられる教師データとなる。
なお、第1学習モードの場合と同様に、各画像を水平/垂直方向に反転させたり、輝度値を調整したりすることにより、教師データの数を増やすようにしてもよい。これにより、より適切な機械学習モデルを得ることができる。
次に、学習器31dは、上記のようにして用意された教師データを用いて機械学習を実行する(S502)。これにより、画像認識を行うための機械学習モデルである画像認識モデルが構築される。この画像認識モデルは、画像生成モデルの場合と同様に畳み込みニューラルネットワークであって、教師データである撮像画像及び学習画像を入力とし、同じく部品の形状情報を出力とするモデルである。
上記のようにして画像認識モデルが構築された後、学習器31dは、その画像認識モデルを画像認識器31eに出力する(S503)。これにより、第2学習モードは終了し、画像認識モードに移行する。
(4)画像認識モード
画像認識モードにおいては、画像認識器31eが、第2学習モードにより生成された画像認識モデルを用いて画像認識を行い、その認識結果を出力装置4に出力する。より具体的に説明すると、画像認識器31eは、撮像装置2によって取得された部品の撮像画像を入力として画像認識モデルに与え、その部品の形状情報を取得し、その形状情報に基づいて当該部品の認識を行う。当該部品について学習画像としての撮像画像が事前に用意できなかった場合でも、本実施の形態では、その部品の模倣画像を学習画像として利用することができるため、適切な画像認識モデルを構築することができる。そのため、そのような部品についても精度良く認識することが可能になる。
(その他の実施の形態)
上述した実施の形態においては、機械学習モデルを、複数の畳み込み層と、複数のプーリング層と、複数の全結合層とを含む畳み込みニューラルネットワークとしたが、これに限定されるものではない。これ以外の構成のニューラルネットワークであってもよい。但し、画像認識精度の観点からは、少なくとも1つずつ、畳み込み層及びプーリング層を含む畳み込みニューラルネットワークであることが好ましい。また、サポートベクタマシン、決定木等のニューラルネットワーク以外の機械学習モデルを用いることもできる。
また、上述した実施の形態においては、画像認識装置が学習画像生成装置の機能を兼ねているが、これに限定されるわけではなく、画像認識装置と学習画像生成装置とが別々のコンピュータで実現されていてもよい。
また、上述した実施の形態においては、画像生成器31bが1つの画像生成モデルを構築しているが、これを複数構築するようにしてもよい。その場合、例えば次のような処理が行われる。まず第1学習モードにおいて、画像生成器31bが、教師データとしての撮像画像及び3次元CAD画像のペアを複数生成した後、部品の形状に応じて各ペアを複数のグループに分類する。例えば、図5に示すような平板状の基台を備える部品のグループと、図13に示すような折り曲げ形状を有する基台を備える部品のグループとに各ペアが分類される。その後、画像生成器31bがグループ毎に機械学習を実行し(S203)、それ以降の処理を上記の実施の形態と同様に行うことにより、グループ毎に画像生成モデルが構築される。その後の画像生成モードにおいては、画像生成器31bが、ステップS401にて入力を受け付けた3次元CAD画像に表されている部品と形状が類似する部品のグループを特定し、その特定したグループに係る画像生成モデルを用いて模倣画像を生成する(S402)。なお、形状が類似しているか否かの判断はオペレータが行ってもよく、また、SIFT(Scaled Invariance Feature Transform)及びHOG(Histograms of Oriented Gradient)等の局所特徴量のユークリッド距離、又は画像内における部品の充填率等を用いて画像生成器31bが自動的に行ってもよい。このように、認識対象の物体の形状に応じて複数の画像生成モデルを構築し、それらを適切に使い分けることにより、良質な学習画像を生成することが可能になる。
1 画像認識システム
2 撮像装置
3 画像認識装置
31 制御部
31a 前処理器
31b 画像生成器
31c 画像識別器
31d 学習器
31e 画像認識器
32 記憶部
32a 撮像画像データベース
32b 3次元CAD画像データベース
4 出力装置
5 入力装置

Claims (10)

  1. 第1物体の撮像画像及び当該第1物体の3次元CAD画像を含む教師データを用いて機械学習を実行し、前記3次元CAD画像を入力とし、前記撮像画像を出力とする機械学習モデルを構築するモデル構築手段と、
    前記第1物体とは異なる形状を有する第2物体の3次元CAD画像を入力として前記機械学習モデルに与えることにより、前記第2物体の模倣画像を、前記第2物体の画像認識の学習画像として生成する画像生成手段と
    を備える、学習画像生成装置。
  2. 前記撮像画像における第1物体の角度と一致するように、前記第1物体の3次元CAD画像の角度を調整する調整手段をさらに備え、
    前記モデル構築手段は、前記調整手段により角度が調整された前記3次元CAD画像を用いて前記機械学習を実行するように構成されている、
    請求項1に記載の学習画像生成装置。
  3. 前記第1物体の3次元CAD画像における第1物体の表面凹凸のコントラストを強調する凹凸強調手段をさらに備え、
    前記モデル構築手段は、前記凹凸強調手段により表面凹凸が強調された第1物体の3次元CAD画像を用いて前記機械学習を実行するように構成されている、
    請求項1又は2に記載の学習画像生成装置。
  4. 前記第1物体の3次元CAD画像における第1物体の輪郭線を強調する輪郭線強調手段をさらに備え、
    前記モデル構築手段は、前記輪郭線強調手段により輪郭線が強調された第1物体の3次元CAD画像を用いて前記機械学習を実行するように構成されている、
    請求項1乃至3の何れかに記載の学習画像生成装置。
  5. 前記モデル構築手段は、
    前記機械学習モデルを用いて前記第1物体の模倣画像を生成する生成手段と、
    生成した模倣画像と前記第1物体の撮像画像とを識別する識別手段と
    を具備しており、
    前記識別手段による識別結果を用いて前記機械学習を実行するように構成されている、
    請求項1乃至4の何れかに記載の学習画像生成装置。
  6. 前記第1物体及び前記第2物体とは異なる形状を有する第3物体の撮像画像及び当該第3物体の3次元CAD画像を含む教師データを用いて機械学習を実行し、前記3次元CAD画像を入力とし、前記撮像画像を出力とする第2機械学習モデルを構築する第2モデル構築手段をさらに備え、
    前記画像生成手段は、前記第2物体の形状が前記第1物体よりも前記第3物体の形状に近い場合に、前記取得した3次元CAD画像を入力として前記第2機械学習モデルに与えることにより、前記第2物体の模倣画像を生成するように構成されている、
    請求項1乃至5の何れかに記載の学習画像生成装置。
  7. 前記機械学習モデルは、畳み込み層及びプーリング層を含む畳み込みニューラルネットワークである、
    請求項1乃至6の何れかに記載の学習画像生成装置。
  8. 請求項1乃至7に記載された学習画像生成装置により生成された学習画像及び前記第1物体の撮像画像と、前記第1物体及び前記第2物体の形状に関する形状情報とを含む教師データによって機械学習を実行し、前記学習画像及び前記撮像画像を入力とし、前記形状情報を出力とする機械学習モデルを構築するモデル構築手段と、
    撮像装置により得られた物体の撮像画像を取得する画像取得手段と、
    取得した撮像画像を入力として前記機械学習モデルに与え、前記機械学習モデルから出力される形状情報を取得する形状情報取得手段と、
    取得した形状情報に基づいて、前記撮像画像における物体を認識する画像認識手段と
    を備える、画像認識装置。
  9. 第1物体の撮像画像及び当該第1物体の3次元CAD画像を含む教師データを用いて機械学習を実行し、前記3次元CAD画像を入力とし、前記撮像画像を出力とする機械学習モデルを構築するステップと、
    前記第1物体とは異なる形状を有する第2物体の3次元CAD画像を入力として前記機械学習モデルに与えることにより、前記第2物体の模倣画像を、前記第2物体の画像認識の学習画像として生成するステップと
    を有する、学習画像生成方法。
  10. 請求項9に記載に記載された学習画像生成方法により生成された学習画像及び前記第1物体の撮像画像と、前記第1物体及び前記第2物体の形状に関する形状情報とを含む教師データによって機械学習を実行し、前記学習画像及び前記撮像画像を入力とし、前記形状情報を出力とする機械学習モデルを構築するステップと、
    撮像装置により得られた物体の撮像画像を取得するステップと、
    取得した撮像画像を入力として前記機械学習モデルに与え、前記機械学習モデルから出力される形状情報を取得するステップと、
    取得した形状情報に基づいて、前記撮像画像における物体を認識するステップと
    を有する、画像認識方法。

JP2018084620A 2018-04-26 2018-04-26 学習画像生成装置及び学習画像生成方法、並びに画像認識装置及び画像認識方法 Active JP7017462B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018084620A JP7017462B2 (ja) 2018-04-26 2018-04-26 学習画像生成装置及び学習画像生成方法、並びに画像認識装置及び画像認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018084620A JP7017462B2 (ja) 2018-04-26 2018-04-26 学習画像生成装置及び学習画像生成方法、並びに画像認識装置及び画像認識方法

Publications (2)

Publication Number Publication Date
JP2019191973A true JP2019191973A (ja) 2019-10-31
JP7017462B2 JP7017462B2 (ja) 2022-02-08

Family

ID=68390437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018084620A Active JP7017462B2 (ja) 2018-04-26 2018-04-26 学習画像生成装置及び学習画像生成方法、並びに画像認識装置及び画像認識方法

Country Status (1)

Country Link
JP (1) JP7017462B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022208623A1 (ja) * 2021-03-29 2022-10-06 ヤマハ発動機株式会社 対象物員数検査用の学習モデル生成方法及びプログラム
WO2023286847A1 (ja) * 2021-07-15 2023-01-19 京セラ株式会社 認識モデル生成方法及び認識モデル生成装置
WO2023074124A1 (ja) * 2021-10-28 2023-05-04 株式会社 Sai 建屋内構造物認識システム及び建屋内構造物認識方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170148226A1 (en) * 2015-11-19 2017-05-25 Kla-Tencor Corporation Generating simulated images from design information
JP2017120672A (ja) * 2017-04-07 2017-07-06 キヤノン株式会社 画像処理装置および画像処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170148226A1 (en) * 2015-11-19 2017-05-25 Kla-Tencor Corporation Generating simulated images from design information
JP2017120672A (ja) * 2017-04-07 2017-07-06 キヤノン株式会社 画像処理装置および画像処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022208623A1 (ja) * 2021-03-29 2022-10-06 ヤマハ発動機株式会社 対象物員数検査用の学習モデル生成方法及びプログラム
JP7481575B2 (ja) 2021-03-29 2024-05-10 ヤマハ発動機株式会社 対象物員数検査用の学習モデル生成方法及びプログラム
WO2023286847A1 (ja) * 2021-07-15 2023-01-19 京セラ株式会社 認識モデル生成方法及び認識モデル生成装置
WO2023074124A1 (ja) * 2021-10-28 2023-05-04 株式会社 Sai 建屋内構造物認識システム及び建屋内構造物認識方法

Also Published As

Publication number Publication date
JP7017462B2 (ja) 2022-02-08

Similar Documents

Publication Publication Date Title
CN110147721B (zh) 一种三维人脸识别方法、模型训练方法和装置
US9710912B2 (en) Method and apparatus for obtaining 3D face model using portable camera
KR101997500B1 (ko) 개인화된 3d 얼굴 모델 생성 방법 및 장치
CN108701234A (zh) 车牌识别方法及云系统
CN108197618B (zh) 用于生成人脸检测模型的方法和装置
CN109934847B (zh) 弱纹理三维物体姿态估计的方法和装置
EP3905194A1 (en) Pose estimation method and apparatus
JP5505409B2 (ja) 特徴点生成システム、特徴点生成方法および特徴点生成プログラム
JP2023515654A (ja) 画像最適化方法及びその装置、コンピュータ記憶媒体、コンピュータプログラム並びに電子機器
KR100896643B1 (ko) Aam을 이용한 3차원 얼굴 모델링 방법 및 시스템,그리고 이에 적용되는 장치
CN108229419A (zh) 用于聚类图像的方法和装置
CN111742342A (zh) 图像生成方法、图像生成装置以及图像生成系统
CN111008935B (zh) 一种人脸图像增强方法、装置、系统及存储介质
KR101829733B1 (ko) 2차원 이미지를 3차원 그래픽 모델로 변환하는 방법
JP2019191973A (ja) 学習画像生成装置及び学習画像生成方法、並びに画像認識装置及び画像認識方法
CN108388889B (zh) 用于分析人脸图像的方法和装置
CN111091075A (zh) 人脸识别方法、装置、电子设备及存储介质
JP2019091436A (ja) 3d配置のタイプに応じた2d画像の分類
KR20080058366A (ko) 피처 추출을 위한 마이크로구조의 모델링을 위한 방법 및시스템
CN111680544B (zh) 人脸识别方法、装置、系统、设备及介质
CN110930503A (zh) 一种服装三维模型建立方法、系统、存储介质及电子设备
CN112966685A (zh) 用于场景文本识别的攻击网络训练方法、装置及相关设备
EP2990995A2 (en) Line parametric object estimation
CN111368763A (zh) 基于头像的图像处理方法、装置及计算机可读存储介质
CN106997580B (zh) 图片处理方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220127

R150 Certificate of patent or registration of utility model

Ref document number: 7017462

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150