JP7200713B2 - 機械学習用教師データ作成支援方法、及び機械学習用教師データ作成支援プログラム - Google Patents

機械学習用教師データ作成支援方法、及び機械学習用教師データ作成支援プログラム Download PDF

Info

Publication number
JP7200713B2
JP7200713B2 JP2019017973A JP2019017973A JP7200713B2 JP 7200713 B2 JP7200713 B2 JP 7200713B2 JP 2019017973 A JP2019017973 A JP 2019017973A JP 2019017973 A JP2019017973 A JP 2019017973A JP 7200713 B2 JP7200713 B2 JP 7200713B2
Authority
JP
Japan
Prior art keywords
label information
machine learning
image
teacher data
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019017973A
Other languages
English (en)
Other versions
JP2020126414A (ja
JP2020126414A5 (ja
Inventor
康敬 水戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2019017973A priority Critical patent/JP7200713B2/ja
Publication of JP2020126414A publication Critical patent/JP2020126414A/ja
Publication of JP2020126414A5 publication Critical patent/JP2020126414A5/ja
Application granted granted Critical
Publication of JP7200713B2 publication Critical patent/JP7200713B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、物体の認識、識別、分類等の処理を行うための機械学習に使用される教師データの生成を支援する教師データ作成支援方法、及び、コンピュータにより教師データの生成を支援するための教師データ作成支援プログラムに関する。
近年、様々な生産・製造現場において部品や完成品をピックアップするためにピッキングロボットが広く利用されている。例えば電子機器の製造現場では、各種の電子部品を自動的にピッキングし、回路基板上で部品毎に決められた位置に装填するようなロボットが利用されている。こうしたロボットの分野では、最近、乱雑に置かれた部品をピックアップするランダムピッキングと呼ばれる技術を搭載したものが一般的である。ランダムピッキングでは、ピックアップ動作の前に、カメラにより撮影された画像において、どのような部品がどの位置に、どの方向を向いた状態で存在しているのかを認識することが必要である。このような認識のために機械学習を用いた物体認識技術が利用されており、最近では、特にディープラーニング(深層学習)を用いた物体認識技術が主流になりつつある。
ディープラーニングを用いた画像処理のアルゴリズムとしては、畳み込みニューラルネットワーク(Convolutional Neural Network:以下「CNN」と略す )を用いたものが主流であり、CNNを利用して画像内に存在する物体の検出と認識を実施するのに好適なR-CNN(Regions with CNN features)、ピクセル単位で物体を認識するFCN(Fully Convolutional Neural Network)などがよく知られている(非特許文献1参照)。ディープラーニングを代表とする教師あり機械学習法では、識別器として用いられるモデル関数を学習するために多数の教師データが用いられる。
一例として、乱雑に置かれた複数の電子部品を識別するための機械学習を考える。この場合の教師データは、様々な向きを向いて様々な位置に置かれた電子部品を撮影した画像とその画像内に存在する各電子部品の位置と向きとを示す正解データとが組になったものである。学習効果を高めるには、位置や向きが様々である電子部品が撮影された多数の画像を用いた教師データが使用されることが好ましい。
シャオチン・レン(Shaoqing Ren)、ほか3名、「ファースター・アール-シーエヌエヌ:トゥワーズ・リアル-タイム・オブジェクト・デテクション・ウィズ・リジョン・プロポーザル・ネットワークス(Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks)」、米国コーネル大学ライブラリー、[online]、インターネット<URL: https://arxiv.org/pdf/1506.01497.pdf>
上記のような教師データを作成するために、従来は次のような方法が採られている。
(1)実際に複数個の電子部品を平面上にランダムに置き、その状態をカメラで撮影して画像を取得する。
(2)作業者が、(1)で取得された画像上で観察される各部品について、その位置(位置座標)と向きの情報(正解データ)を手作業で入力する。こうした作業は一般にアノテーションと呼ばれ、入力作業を支援するアノテーションツールも市販されている。例えば、こうした正解データは画像に対応するxmlファイルで表現される。
(3)上記(1)及び(2)の作業を多数回(通常、数十回~数百回)繰り返す。
上述したように学習効果を高めるには教師データは多い方が好ましいが、上述した従来の方法による教師データ作成は非常に手間と時間が掛かる。特に、(2)における手入力でのアノテーション作業は、いかに便利なアノテーションツールを使用したとしてもかなり手間の掛かる作業である。それ故に、そうした作業自体をアウトソーシングすることも行われているが、時間とコストが掛かることは避けられない。
本発明はこうした課題を解決するためになされたものであり、その目的とするところは、多数の教師データを作業者に大きな負担を強いることなく効率的に作成することができる機械学習用教師データ作成支援方法、及び機械学習用教師データ作成支援プログラムを提供することである。
上記課題を解決するために成された本発明に係る機械学習用教師データ作成支援方法は、複数の認識対象物が配置された画像に対し機械学習を用いた画像処理を行うための学習モデルを構築する際に使用される教師データを作成する教師データ作成支援方法であって、
数の認識対象物が配置された状態を撮影した画像と、該画像中の各認識対象物について、位置、向き、認識対象物自体の形態又は態様、の少なくとも一つの項目に関して正解であるラベル情報を取得する基本情報取得ステップと、
記複数の認識対象物のそれぞれについて、前記ラベル情報として与えられている、画像中での位置、向き、それ自体の形態又は態様、の少なくとも一つの項目に関し、それぞれ異なる複数のバリエーションを加えた複数のラベル情報を生成する事前ラベル情報生成ステップと、
前記事前ラベル情報生成ステップにおいて生成された複数のラベル情報にそれぞれ合わせて、前記基本情報取得ステップで取得された画像中の認識対象物の位置、向き、それ自体の形態又は態様、の少なくとも一つを変更した複数の画像を画像加工処理により作成する画像加工処理ステップと、
前記事前ラベル情報生成ステップにおいて生成されたラベル情報と、それに対応して前記画像加工処理ステップで作成された画像と、を組として所定形式の教師データを出力する教師データ出力ステップと、
を有し、前記事前ラベル情報生成ステップでは、実験計画法の一つであるラテン方格法を用いて、認識対象物に対する異なる複数のバリエーションを加えたラベル情報の割り当てを決定することを特徴としている。
また上記課題を解決するために成された本発明に係る機械学習用教師データ作成支援プログラムは、上記発明に係る教師データ作成支援方法をコンピュータを用いて実現するためのコンピュータプログラムであり、
複数の認識対象物が配置された画像に対し機械学習を用いた画像処理を行うための学習モデルを構築する際に使用される教師データを、コンピュータにより作成するための教師データ作成支援プログラムであって、
数の認識対象物が配置された状態を撮影した画像と、該画像中の各認識対象物について、位置、向き、認識対象物自体の形態又は態様、の少なくとも一つの項目に関して正解であるラベル情報を取得する基本情報取得ステップと、
記複数の認識対象物のそれぞれについて、前記ラベル情報として与えられている、画像中での位置、向き、それ自体の形態又は態様、の少なくとも一つの項目に関し、それぞれ異なる複数のバリエーションを加えた複数のラベル情報を生成するものであって、実験計画法の一つであるラテン方格法を用いて、認識対象物に対する異なる複数のバリエーションを加えたラベル情報の割り当てを決定する事前ラベル情報生成ステップと、
前記事前ラベル情報生成ステップにおいて生成された複数のラベル情報にそれぞれ合わせて、前記基本情報取得ステップで取得された画像中の認識対象物の位置、向き、それ自体の形態又は態様、の少なくとも一つを変更した複数の画像を画像加工処理により作成する画像加工処理ステップと、
前記事前ラベル情報生成ステップにおいて生成されたラベル情報と、それに対応して前記画像加工処理ステップで作成された画像と、を組として所定形式の教師データを出力する教師データ出力ステップと、
をコンピュータに実行させることを特徴としている。
本発明における機械学習の手法は、画像中の認識対象物についての検出、認識、識別等の処理が可能であれば特にその方法やアルゴリズムを問わないが、好適な例は、前述のR-CNN、FCN等を含むディープラーニングである。このほか、サポートベクターマシン(Support Vector Machine:SVM)、ランダムフォレスト(Random Forest)、アダブースト(AdaBoost)などを用いることもできる。
本発明に係る教師データ作成支援プログラムをコンピュータで実行することにより実施される教師データ作成支援方法において、基本情報取得ステップでは、認識対象物を実際に撮影した画像と、その画像中の認識対象物についてのラベル情報とが基本情報として取得される。
本発明の一態様として、上記基本情報取得ステップは、
数の認識対象物を撮影して画像を取得する基本画像取得ステップと、
前記基本画像取得ステップで取得された画像中の各認識対象物について、位置、向き、認識対象物自体の形態又は態様、の少なくとも一つの項目に関するラベル情報を作業者が入力するラベル情報入力ステップと、
を含むものとすることができる。
この場合、例えば作業者がカメラやCCDスキャナ等の撮像装置で認識対象物を撮影し、撮影した画像中の認識対象物の位置や向き等に関するラベル情報を作業者(撮影した作業者と同一とは限らない)が入力する。即ち、アノテーション作業を作業者が手入力で行うことになるが、1枚の画像中に現れている複数の認識対象物についてのラベル情報を入力しさえすればよいので、それほど大きな手間は掛からない。
また別の態様としては、数の認識対象物をどのような位置にどのような向きで置くのかを、装置(コンピュータ)が例えば画像により作業者に指示し、作業者がその指示に従って認識対象物を置いたうえで撮影を行って画像を取得するようにしてもよい。この場合、取得された画像中の認識対象物の位置や向きに関するラベル情報は既に装置が保有しているから、改めて作業者が入力を行う必要はない。即ち、この場合には、作業者の手入力によるアノテーション作業は実質的に不要である。
なお、本発明において、認識対象物自体の形態又は態様とは、認識対象物の形状、色、又は大きさのいずれかであるものとすることができる。
事前ラベル情報生成ステップでは、上記基本情報に含まれる画像中の複数の認識対象物のそれぞれについて、ラベル情報として与えられている、画像中での位置、向き、それ自体の形態又は態様、の少なくとも一つの項目に関し、それぞれ異なる複数のバリエーションを加えた複数のラベル情報を自動的に生成する。例えば、認識対象物の向きに関し、それぞれ異なる複数のバリエーションを加えた複数のラベル情報とは、上記基本情報に含まれる画像中の認識対象物の向きを角度0°として、0~360°の間で所定角度間隔の角度を表す値である。具体的には、所定角度間隔が30°であれば、0°、30°、60°、90°、…、300°、330°が、向きに関して複数のバリエーションが加えられたラベル情報である。
事前ラベル情報生成ステップで複数のラベル情報が生成されたあと、画像加工処理ステップでは、その複数のラベル情報にそれぞれ合わせて、基本情報取得ステップで取得された画像中の認識対象物の位置、向き、それ自体の形態又は態様、の少なくとも一つを変更した複数の画像を画像加工処理により作成する。例えば上述したように認識対象物の向きに関して複数のラベル情報が与えられている場合には、それぞれのラベル情報を目標として、認識対象物の向きがそのラベル情報に合うように認識対象物を適宜に回転させた画像を画像加工処理により作成する。また、位置に関して複数のラベル情報が与えられている場合には、認識対象物がそのラベル情報に合った位置に来るように認識対象物を適移動させた画像を画像加工処理により作成する。そして、教師データ出力ステップでは、事前ラベル情報生成ステップにおいて生成されたラベル情報と、それに対応して画像加工処理ステップで作成された画像と、を組として例えばxml等の所定の形式の言語で表現したファイルを作成し、これを教師データとして出力する。
即ち、従来の一般に画像に関する教師データを生成する際には、まず認識対象物の位置や向きを変えた多数の画像を取得したあと、各画像中に現れている認識対象物についてのラベル情報を作業者が手入力していた。これに対し、本発明では、その手順を入れ替え、認識対象物の位置や向きが異なる複数のラベル情報を先に自動的に生成しておき、そのラベル情報に合うような画像を画像加工処理により作成する。この画像加工処理は、図形の回転、移動、拡大・縮小など、一般的な画像加工でよく、加工対象も決まっているから、ほぼ自動的に処理を進めることができる。これにより、作業者がすべき実質的な作業は殆ど不要になる。
本発明における事前ラベル情報生成ステップでは、実験計画法の一つであるラテン方格法を用いて、認識対象物に対する異なる複数のバリエーションを加えたラベル情報の割り当てを決定する。
周知のように、実験計画法は効率的な実験等を行うために実験条件等を決めるのに用いられるものであるから、これを利用することで、学習効果が高くなるような教師データを効率的に作成するのに適切な条件、つまりはラベル情報の割り当てを決めることができる。実験計画法による実験の割り当てには、完全無作為法、ラテン方格法、乱塊法、直交表(直交配置法)、分割区法、枝分かれ分類法などの各種の方法がある。
ラテン方格法は乱塊法の一種であり、一般に誤差の自由度が小さいため精度向上のためには反復等を行う必要があるものの、少ない実験数で以て効率的に実験結果を得ることができるという利点がある。本発明のように教師データ作成のためのラベル情報の生成においては、教師データを用いた学習を繰り返すことで学習の精度を向上させることができるため、上記の誤差の自由度の小ささは実際上問題とならない。一方で、少ない実験数で済むということは、教師データの数が少なくて済むということであり、教師データの作成に要する時間を短縮することができるという利点がある。こうしたことから、本発明において、前記実験計画法としてラテン方格法を用いるとよい。
また、本発明では、
前記基本情報取得ステップで得られるラベル情報は、位置、向き、認識対象物自体の形態又は態様、のうちの二つの項目を含み、
前記事前ラベル情報生成ステップでは、前記二つの項目に関し、それぞれ異なる複数のバリエーションを加えた複数のラベル情報を生成するために、その各項目に関してそれぞれラテン方格法による割り当てを行うようにするとよい。
このように、ラテン方格法による割り当てを2段階で行うことにより、処理が複雑になるのを避けつつ、効率的な学習が行えるような教師データを作成することができる。
本発明によれば、従来は大変な手間が掛かっていた、アノテーション作業を伴う教師データの作成作業を、作業者に大きな負担を強いることなく効率的に行うことができる。それにより、作業者の手間を軽減することができるとともに、教師データの作成に要する時間を短縮することができる。また、正解であるラベル情報の入力ミスなどの作業ミスも軽減することができるので、ラベル付けが正確になされた教師データを用意することができ、機械学習の精度を高めることができる。
本発明に係る教師データ作成支援方法を利用して作成される教師データを学習に使用する機械学習システムの全体構成図。 図1中の教師データ作成部のブロック構成図。 教師データ作成部における作業及び処理の手順を示すフローチャート。 電子部品(コンデンサ)の撮影画像の一例を示す図。 ラテン方格法を用いて作成した、8個の電子部品についてそれぞれの角度が相違する角度パターンを示す図。 図5に示した角度パターンの一つ(識別番号:#1)に従って各電子部品の角度を変更する画像加工処理の説明図。 ラテン方格法を用いて作成した、8個の電子部品についてそれぞれの位置を入れ替える位置パターンを示す図。 8個の電子部品が配置される画像中の位置を示す模式図。 図7に示した8種類の位置パターンにそれぞれ対応する8個の電子部品の配置状態を示す模式図。
以下、本発明に係る機械学習用教師データ作成支援方法、及びそのためのコンピュータプログラムの一実施例について、添付図面を参照して説明する。
図1は、本発明に係る教師データ作成支援方法により作成される教師データを使用して機械学習を実行するとともに、その学習により作成される学習モデルを用いて画像認識を実施する機械学習システムの一例の全体構成図である。図2は図1中の教師データ作成部のブロック構成図である。ここでは、この機械学習システムは、所定の電子部品をランダムピッキングするために、乱雑に置かれた電子部品を撮影した画像に対し、その画像中の電子部品の位置と向きとを認識するものである。即ち、本発明における認識対象物は、ここでは電子部品である。
図1に示すように、この機械学習システムは、教師データ作成部1、学習実行部2、及び画像認識部4、を備える。
概略的に説明すると、教師データ作成部1は、学習材料である教師データを多数作成する。教師データは、同種の電子部品が多数写っている画像と、この画像中の各電子部品の位置と向き(角度)とを示すラベル情報とが組となったものである。学習実行部2はその多数の教師データを用いて、所定の機械学習アルゴリズムによる学習を実行し、学習済みモデル3を作成する。学習の際には例えば確率的勾配降下法などの既知の手法を用いることができる。作成された学習済みモデル3は画像認識部4に組み込まれ、画像認識部4はこの学習済みモデル3を利用し、入力された処理対象画像において電子部品を検出してその位置を認識するとともに向きなどを認識し、その結果を出力する。
機械学習アルゴリズムとしては、画像中の物体の検出や認識に適したものであればよく、一般的には、ニューラルネットワークを用いた機械学習法であるCNN、R-CNN、FCNなどのディープラーニングが好適である。また、それ以外でも、サポートベクターマシン、ランダムフォレスト、アダブーストなどの各種の機械学習法を用いることができる。なお、ニューラルネットワークを用いた機械学習アルゴリズムを用いる場合、学習済みモデル3とは、多層ネットワークに含まれる複数の畳み込み層におけるフィルタの係数(重み)である。
また、図1に示したシステムの実体はパーソナルコンピュータ、より性能の高いワークステーション、或いは、そうしたコンピュータと通信回線を介して接続された高性能なコンピュータを含むコンピュータシステムなどであり、そうしたコンピュータ単体又はコンピュータシステムに搭載されているソフトウェアを該コンピュータで実行することにより、図1に示した各ブロックの機能が具現化される。
図2に示すように、教師データ作成部1は、コンピュータ10と、これに付設されるカメラ16、入力部17、表示部18などから構成される。入力部17は一般にはキーボードやポインティングデバイス(マウスなど)等であるが、画面へのタッチ操作により入力が行えるものであってもよい。そして、コンピュータ10にインストールされた専用のソフトウェアを該コンピュータ10で動作させることで、基本ラベル情報入力支援部11、ラベル情報自動生成部12、画像加工処理部13、教師データファイル作成部14、データ保存部15などの機能ブロックが具現化される。上記ソフトウェアが本発明に係る機械学習用教師データ作成支援プログラムに相当するものである。こうしたプログラムは、CD-ROM、DVD-ROM、メモリカード、USBメモリ(ドングル)などの記憶媒体に収録されてユーザに提供されるか、或いは、インターネットなどの通信回線を介したデータ転送の形式で、ユーザに提供されるものとすることもできる。
次に、図3~図9を参照して、教師データ作成部1おいて教師データが作成される際の、作業者による作業と自動的な処理とについて説明する。図3はこの作業と処理の手順を示すフローチャートである。
この例では、認識対象物である電子部品は、一般的な積層セラミックコンデンサ(以下単に「コンデンサ」という)であるものとする。コンデンサは、本体部と、2本の足部(リード端子部)と、を有しており、向きの認識が必要である。また、本体部の形状の個体差は殆ど無いものの、2本の足部は曲がっていたり開き角度がばらばらであったりするため個体差がある。そのため、個体差がある複数のコンデンサについての教師データを作成することが必要である。
まず作業者は、N個のコンデンサが無地背景の平板上に載置された状態の画像をカメラ16により撮影し、得られた画像データをコンピュータ10に入力する(ステップS1)。入力された画像は基本画像としてデータ保存部15に保存される。ここでは、Nを8とするが、「8」に限るものではなく、例えばその2倍の「16」等でもよい。後述するように、向き(角度)に関するラベル情報を自動生成する際の角度間隔を(360/N)°としている都合上、Nは360を容易に割り切れる値とするとよい。
図4は、8個のコンデンサを撮影した画像の一例を示す図である。8個のコンデンサは本体部を右方、足部を左方に向けた、左右に延伸する状態で、互いにほぼ平行に載置されている。但し、上述したように、各コンデンサの足部の曲がりや開き度合いは様々であり、その点で形状に個体差があるということができる。このようにコンデンサに個体差があっても、画像中でコンデンサを的確に検出し、その位置と向きとを認識する必要があるため、想定される様々な個体差がある複数のコンデンサを撮影している。図4中に記載したように、ここでは、8個のコンデンサにそれぞれ識別子としてA~Hの英文字を付している。即ち、A~Hの英文字とコンデンサの外観(具体的には足部の曲がりや開き具合)とは対応している。
なお、仮に外観上で全く個体差がない場合又は個体差が無視できる程度である場合には、この例のように、同種の複数個の電子部品を撮影する必要はなく、1個のみの撮影を行えば十分である。
基本ラベル情報入力支援部11は、上記ステップS1においてデータ保存部15に保存されたデータを用いて、上述したように8個のコンデンサが写っている基本画像を再現し、これを表示部18の画面上に表示する。作業者は表示部18でその基本画像を視認し、その基本画像に写っている各コンデンサについて、位置(位置座標)の情報及び向き(角度)の情報を入力部17から入力する。つまりは、正解であるラベル情報を入力するアノテーションの作業を実行する。入力されたラベル情報はデータ保存部15に保存される(ステップS2)。
各部品(ここではコンデンサ)の位置の情報は、例えば作業者が表示された基本画像上で各コンデンサの本体部の中心位置をクリック操作したり、或いは各コンデンサの本体部の外輪郭をポインティングデバイスでなぞったりすることで、入力されるようにしておくことができる。図4の例では、A~Hの英文字記号が識別番号として付された各コンデンサは全て右向きに互いに平行に置かれているから、このときの向きを角度0°とし、角度0~360°で向きを表現するものとする。
ラベル情報自動生成部12は、A~Hの識別番号が付されたN個のコンデンサが互いに異なるN個の角度を採るような角度パターン、つまりは角度に関するラベル情報をラテン方格法を用いて決定する(ステップS3)。ここで、このN個の角度とは0~360°の角度範囲を八つに等角度間隔で分割したときの角度であり、具体的には、0°、45°、90°、135°、180°、225°、270°、315°の八つである。図5は、識別番号#1~#8を付した8種類の角度パターンにおける、N個のコンデンサ(A~H)と角度(0°~315°)との関係を示す2次元テーブルである。ラテン方格法では、このテーブルにおいて、縦方向にも横方向にも同じ識別番号が付されたコンデンサは一回のみしか現れない。したがって、#1~#8の識別番号が付された8種類の角度パターンでは、任意の識別番号が付されたコンデンサは必ず異なる角度になり、且つ8種類の角度が必ず1回ずつ現れる。
続いて、ラベル情報自動生成部12は、A~Hの識別番号として付されたN個のコンデンサが、画像中に定められた互いに異なるN個の位置に配置される位置パターン、つまりは位置に関するラベル情報を、ステップS3と同様にラテン方格法を用いて決定する(ステップS4)。ここで、画像中のN個の位置とは、図8に示すように、1枚の画像100中に予め設定された8個の領域であり、ここではその位置を示す識別番号を[1]、[2]、…としている。図7は、識別番号(1)~(8)を付した8種類の位置パターンにおける、N個のコンデンサ(A~H)と画像中の位置([1]~[8])との関係を示す2次元テーブルである。ラテン方格法では、このテーブルにおいて、縦方向にも横方向にも同じ識別記号が付された位置は一回のみしか現れない。したがって、(1)~(8)の識別番号が付された8種類の位置パターンでは、任意の識別番号が付されたコンデンサは必ず異なる位置になり、且つ8種類の位置が必ず1回ずつ現れる。
画像加工処理部13は、ステップS3で生成された角度に関するラベル情報に合わせて、ステップS1で得られた基本画像中の各コンデンサの向きを変化させた、つまりは回転させた画像を画像加工処理により作成する(ステップS5)。ここでは、識別番号がA~Hである8個のコンデンサは、画像100中で図6(a)に示すように、つまりは図8に[1]~[8]で示した位置に、配置されているものとする。図6(b)は、図4に示した基本画像中の各コンデンサを、図6(a)中の各位置に配置した画像である。そして、この識別番号がA~Hである8個のコンデンサの向き、つまり角度を、図5に示した8種類の角度パターン(#1~#8)に合わせて変化させることで8種類の1次加工画像を生成する。図6(c)は、識別番号が#1である角度パターンのラベル情報に合わせて各コンデンサの向きを変化させた1次加工画像である。ステップS5の処理では、このような1次加工画像が8枚作成される。
次いで画像加工処理部13は、ステップS4で生成された位置に関するラベル情報に合わせて、ステップS5で作成された8枚の1次加工画像それぞれにおいて、各コンデンサの位置を入れ替えた画像を画像加工処理により作成する(ステップS6)。図9は、図7に示されている8種類の位置パターンにそれぞれ対応する、1枚の画像100中の8個のコンデンサの配置状態を示す図である。このステップS6では、図6(c)に示されているような、角度に関するラベル情報に応じて各コンデンサの向きが変更されたあとの1枚の1次加工画像に対し、図9に示すように各コンデンサの向きはそのままで位置の入れ替えが行われ、8枚の2次加工画像が作成される。したがって、8枚の1次加工画像から8×8=64枚の2次加工画像が作成される。
上記のようにして生成されたN×N枚、ここでは64枚の2次加工画像にはそれぞれ、一つの角度パターンつまりは角度に関するラベル情報と、一つの位置パターンつまりは位置に関するラベル情報とが対応付けられる。64枚の2次加工画像に対し角度パターンと位置パターンとの組み合わせは必ず異なるものとなるから、64枚の2次加工画像に対してラベル情報は必ず異なるものとなる。教師データファイル作成部14は、その64枚の2次加工画像とラベル情報とを対応付け、2次加工画像毎にN個のコンデンサの位置(位置座標)情報と向き(角度)情報とを付与したアノテーションxmlファイルを作成し、それをデータ保存部15に保存する(ステップS7)。
上記一連の処理により、1枚の基本画像から64個の教師データが自動的に生成され、教師データ作成部1は作成されたアノテーションxmlファイルを教師データとして学習実行部2に出力する。
なお、上記実施例の処理においてNの値は任意であり、例えばNの数をさらに増やして例えば12或いは16としてもよい。その場合、角度パターンにおける角度間隔は30°或いは22.5°である。
また、上記実施例の処理では、ステップS3、S4においてラベル情報の割り当てを決めるために、実験計画法の一つであるラテン方格法を用いた。実験計画法には様々な方法があり、ラテン方格法は一般に、誤差の自由度が小さいため精度向上のためには反復等を行う必要があるものの、少ない実験数で以て効率的に実験結果を得ることができるという利点があることが知られている。ここでは、誤差の自由度の小ささは実際上問題とならないので、専ら効率性を重視してラテン方格法を利用しているが、ラテン方格法に限らず実験計画法における他の方法を採用しても構わない。具体的には、完全無作為法、乱塊法、直交表(直交配置法)、分割区法、枝分かれ分類法などを用いることができる。
また、上記実施例で挙げたコンデンサ、抵抗器のような部品の場合には、ピックアップする際に方向性(向き、角度)を認識する必要があるが、例えば円盤状の部品などの場合には方向性を認識する必要がないこともある。その場合には、向きに関するラベル情報は存在しない。一方で、認識対象物によっては、色、模様、外形状、大きさなどの形態や態様を認識する必要がある場合もある。こうした場合には、そうした認識対象物の形態や態様に関するラベル情報が必要であり、それに関して様々に異なるラベル情報が自動的に生成されることになる。
また、認識対象物が電子部品やそのほかの部品に限らないのは言うまでもない。また例えば、製造された各種の製品、農産物・水産物、配送品など様々な認識対象物を適用することが可能である。
また、上記実施例はあくまでも本発明の一例にすぎず、上述した様々な例に限らず、本発明の趣旨の範囲でさらに適宜変形、修正、追加を行っても本願特許請求の範囲に包含されることは明らかである。
1…教師データ作成部
2…学習実行部
3…学習済みモデル
4…画像認識部
10…コンピュータ
11…基本ラベル情報入力支援部
12…ラベル情報自動生成部
13…画像加工処理部
14…教師データファイル作成部
15…データ保存部
16…カメラ
17…入力部
18…表示部

Claims (10)

  1. 複数の認識対象物が配置された画像に対し機械学習を用いた画像処理を行うための学習モデルを構築する際に使用される教師データを作成する教師データ作成支援方法であって、
    数の認識対象物が配置された状態を撮影した画像と、該画像中の各認識対象物について、位置、向き、認識対象物自体の形態又は態様、の少なくとも一つの項目に関して正解であるラベル情報を取得する基本情報取得ステップと、
    記複数の認識対象物のそれぞれについて、前記ラベル情報として与えられている、画像中での位置、向き、それ自体の形態又は態様、の少なくとも一つの項目に関し、それぞれ異なる複数のバリエーションを加えた複数のラベル情報を生成する事前ラベル情報生成ステップと、
    前記事前ラベル情報生成ステップにおいて生成された複数のラベル情報にそれぞれ合わせて、前記基本情報取得ステップで取得された画像中の認識対象物の位置、向き、それ自体の形態又は態様、の少なくとも一つを変更した複数の画像を画像加工処理により作成する画像加工処理ステップと、
    前記事前ラベル情報生成ステップにおいて生成されたラベル情報と、それに対応して前記画像加工処理ステップで作成された画像と、を組として所定形式の教師データを出力する教師データ出力ステップと、
    を有し、前記事前ラベル情報生成ステップでは、実験計画法の一つであるラテン方格法を用いて、認識対象物に対する異なる複数のバリエーションを加えたラベル情報の割り当てを決定することを特徴とする機械学習用教師データ作成支援方法。
  2. 請求項1に記載の機械学習用教師データ作成支援方法であって、
    前記基本情報取得ステップは、
    数の認識対象物を撮影して画像を取得する基本画像取得ステップと、
    前記基本画像取得ステップで取得された画像中の各認識対象物について、位置、向き、認識対象物自体の形態又は態様、の少なくとも一つの項目に関するラベル情報を作業者が入力するラベル情報入力ステップと、
    を含むことを特徴とする機械学習用教師データ作成支援方法。
  3. 請求項1又は2に記載の機械学習用教師データ作成支援方法であって、
    前記認識対象物自体の形態又は態様は、認識対象物の形状、色、又は大きさのいずれかであることを特徴とする機械学習用教師データ作成支援方法。
  4. 請求項に記載の機械学習用教師データ作成支援方法であって、
    前記基本情報取得ステップで得られるラベル情報は、位置、向き、認識対象物自体の形態又は態様、のうちの二つの項目を含み、
    前記事前ラベル情報生成ステップでは、前記二つの項目に関し、それぞれ異なる複数のバリエーションを加えた複数のラベル情報を生成するために、その各項目に関してそれぞれラテン方格法による割り当てを行うことを特徴とする機械学習用教師データ作成支援方法。
  5. 請求項1~のいずれか1項に記載の機械学習用教師データ作成支援方法であって、
    前記機械学習は畳み込みニューラルネットワークを利用したディープラーニングであることを特徴とする機械学習用教師データ作成支援方法。
  6. 複数の認識対象物が配置された画像に対し機械学習を用いた画像処理を行うための学習モデルを構築する際に使用される教師データを、コンピュータにより作成するための教師データ作成支援プログラムであって、
    数の認識対象物が配置された状態を撮影した画像と、該画像中の各認識対象物について、位置、向き、認識対象物自体の形態又は態様、の少なくとも一つの項目に関して正解であるラベル情報を取得する基本情報取得ステップと、
    記複数の認識対象物のそれぞれについて、前記ラベル情報として与えられている、画像中での位置、向き、それ自体の形態又は態様、の少なくとも一つの項目に関し、それぞれ異なる複数のバリエーションを加えた複数のラベル情報を生成するものであって、実験計画法の一つであるラテン方格法を用いて、認識対象物に対する異なる複数のバリエーションを加えたラベル情報の割り当てを決定する事前ラベル情報生成ステップと、
    前記事前ラベル情報生成ステップにおいて生成された複数のラベル情報にそれぞれ合わせて、前記基本情報取得ステップで取得された画像中の認識対象物の位置、向き、それ自体の形態又は態様、の少なくとも一つを変更した複数の画像を画像加工処理により作成する画像加工処理ステップと、
    前記事前ラベル情報生成ステップにおいて生成されたラベル情報と、それに対応して前記画像加工処理ステップで作成された画像と、を組として所定形式の教師データを出力する教師データ出力ステップと、
    をコンピュータに実行させることを特徴とする機械学習用教師データ作成支援プログラム。
  7. 請求項に記載の機械学習用教師データ作成支援プログラムであって、
    前記基本情報取得ステップは、
    数の認識対象物に対する撮影画像の入力を受け付けて記憶する基本画像取得ステップと、
    前記基本画像取得ステップにおいて記憶した画像中の各認識対象物について、位置、向き、認識対象物自体の形態又は態様、の少なくとも一つの項目に関するラベル情報を作業者に入力させるラベル情報入力ステップと、
    を含むことを特徴とする機械学習用教師データ作成支援プログラム。
  8. 請求項又はに記載の機械学習用教師データ作成支援プログラムであって、
    前記認識対象物自体の形態又は態様は、認識対象物の形状、色、又は大きさのいずれかであることを特徴とする機械学習用教師データ作成支援プログラム。
  9. 請求項に記載の機械学習用教師データ作成支援プログラムであって、
    前記基本情報取得ステップで得られるラベル情報は、位置、向き、認識対象物自体の形態又は態様、のうちの二つの項目を含み、
    前記事前ラベル情報生成ステップでは、前記二つの項目に関し、それぞれ異なる複数のバリエーションを加えた複数のラベル情報を生成するために、その各項目に関してそれぞれラテン方格法による割り当てを行うことを特徴とする機械学習用教師データ作成支援プログラム。
  10. 請求項のいずれか1項に記載の機械学習用教師データ作成支援プログラムであって、
    前記機械学習は畳み込みニューラルネットワークを利用したディープラーニングであることを特徴とする機械学習用教師データ作成支援プログラム。
JP2019017973A 2019-02-04 2019-02-04 機械学習用教師データ作成支援方法、及び機械学習用教師データ作成支援プログラム Active JP7200713B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019017973A JP7200713B2 (ja) 2019-02-04 2019-02-04 機械学習用教師データ作成支援方法、及び機械学習用教師データ作成支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019017973A JP7200713B2 (ja) 2019-02-04 2019-02-04 機械学習用教師データ作成支援方法、及び機械学習用教師データ作成支援プログラム

Publications (3)

Publication Number Publication Date
JP2020126414A JP2020126414A (ja) 2020-08-20
JP2020126414A5 JP2020126414A5 (ja) 2021-07-29
JP7200713B2 true JP7200713B2 (ja) 2023-01-10

Family

ID=72084030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019017973A Active JP7200713B2 (ja) 2019-02-04 2019-02-04 機械学習用教師データ作成支援方法、及び機械学習用教師データ作成支援プログラム

Country Status (1)

Country Link
JP (1) JP7200713B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117063061A (zh) 2021-03-29 2023-11-14 雅马哈发动机株式会社 对象物个数检查用学习模型生成方法及程序
US11409951B1 (en) 2021-09-24 2022-08-09 International Business Machines Corporation Facilitating annotation of document elements

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014006804A (ja) 2012-06-26 2014-01-16 Honda Motor Co Ltd サンプリング装置、サンプリング方法、近似モデル生成装置、近似モデル生成方法及びプログラム
JP2014199584A (ja) 2013-03-29 2014-10-23 キヤノン株式会社 画像処理装置および画像処理方法
JP2018116599A (ja) 2017-01-20 2018-07-26 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP2018163554A (ja) 2017-03-27 2018-10-18 富士通株式会社 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014006804A (ja) 2012-06-26 2014-01-16 Honda Motor Co Ltd サンプリング装置、サンプリング方法、近似モデル生成装置、近似モデル生成方法及びプログラム
JP2014199584A (ja) 2013-03-29 2014-10-23 キヤノン株式会社 画像処理装置および画像処理方法
JP2018116599A (ja) 2017-01-20 2018-07-26 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP2018163554A (ja) 2017-03-27 2018-10-18 富士通株式会社 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冨安 寛 外2名,パラメータ設計を用いた錠剤識別系の構築,情報処理学会論文誌 第35巻 第12号,社団法人情報処理学会,1994年12月15日,pp. 2694-2702

Also Published As

Publication number Publication date
JP2020126414A (ja) 2020-08-20

Similar Documents

Publication Publication Date Title
US11120254B2 (en) Methods and apparatuses for determining hand three-dimensional data
JP5879725B2 (ja) 板金工程作業支援システム
KR102347623B1 (ko) 컴퓨터 프로그램 생성 장치 및 컴퓨터 프로그램 생성 방법
KR101397522B1 (ko) 증강 현실 기반의 정맥 주사 훈련 시뮬레이터 시스템 및 방법
JP7200713B2 (ja) 機械学習用教師データ作成支援方法、及び機械学習用教師データ作成支援プログラム
JP2019525365A5 (ja)
JP2019046095A (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
CN106446888B (zh) 摄像模组多标识符识别方法及设备
CN113744394B (zh) 鞋楦三维建模方法、装置、设备及存储介质
WO2015001967A1 (ja) 画像処理フィルタの作成装置及びその方法
US11461921B2 (en) Program, system, electronic device, and method for recognizing three-dimensional object
JP2013145525A (ja) 物品取り出し判定装置、物品取り出し判定システム、物品取り出しシステム、物品取り出し判定プログラムおよび物品取り出し判定方法
JP6471835B2 (ja) 情報処理装置、制御方法、及びプログラム
CN104995591A (zh) 图像处理设备及程序
CN112950528A (zh) 证件姿态确定方法、模型训练方法、装置、服务器及介质
JP6425405B2 (ja) 情報処理装置、方法、プログラム
Widiaty et al. Implementation of markerless augmented reality method to visualise philosophy of batik based on Android
JP7386007B2 (ja) 画像処理方法、画像処理装置及び画像処理機器
JP2009216480A (ja) 三次元位置姿勢計測方法および装置
JP2017174228A (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN106354516B (zh) 追踪设备的方法及装置
CN115250616A (zh) 校正系统、信息处理系统、机器人控制系统、校正方法、信息处理方法、机器人控制方法、校正程序、信息处理程序、校正装置、信息处理装置以及机器人控制装置
JP4815592B2 (ja) 物体検出方法
JP2017064844A (ja) プログラム自動生成装置
JP2016053751A (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210617

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210617

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221205

R151 Written notification of patent or utility model registration

Ref document number: 7200713

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151