JP2024075371A - 画像判定方法及び画像判定装置 - Google Patents
画像判定方法及び画像判定装置 Download PDFInfo
- Publication number
- JP2024075371A JP2024075371A JP2022186772A JP2022186772A JP2024075371A JP 2024075371 A JP2024075371 A JP 2024075371A JP 2022186772 A JP2022186772 A JP 2022186772A JP 2022186772 A JP2022186772 A JP 2022186772A JP 2024075371 A JP2024075371 A JP 2024075371A
- Authority
- JP
- Japan
- Prior art keywords
- image
- judgment
- determination
- target
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 5
- 238000010801 machine learning Methods 0.000 abstract description 6
- 239000006096 absorbing agent Substances 0.000 description 29
- 230000035939 shock Effects 0.000 description 29
- 238000007689 inspection Methods 0.000 description 27
- 238000003384 imaging method Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000007723 transport mechanism Effects 0.000 description 2
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
【課題】画像判定において簡易な方法で判定精度を向上させる。
【解決手段】画像判定方法は、判定対象を含む対象画像を取得する画像取得工程と、対象画像から判定対象を含む所定領域の画像を判定画像として抽出する抽出工程と、所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、判定画像における判定対象が判定条件を満たすかを判定する判定工程と、を含み、判定工程では、判定対象が判定条件に適合しないと判定されると、判定画像に対する判定対象の相対的な大きさを変更した再判定画像を生成し、再判定画像内の判定対象が判定条件を満たすか否かを再判定する。
【選択図】図3
【解決手段】画像判定方法は、判定対象を含む対象画像を取得する画像取得工程と、対象画像から判定対象を含む所定領域の画像を判定画像として抽出する抽出工程と、所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、判定画像における判定対象が判定条件を満たすかを判定する判定工程と、を含み、判定工程では、判定対象が判定条件に適合しないと判定されると、判定画像に対する判定対象の相対的な大きさを変更した再判定画像を生成し、再判定画像内の判定対象が判定条件を満たすか否かを再判定する。
【選択図】図3
Description
本発明は、画像判定方法及び画像判定装置に関するものである。
従来から、画像の外観検査技術として様々なものが知られている(例えば特許文献1)。特許文献1には、物品の表面のうち物品を特定するための刻印が付された刻印部を含む刻印領域を検査する刻印検査装置が開示されている。この刻印検査装置は、刻印および欠陥を有していない物品の画像を参照画像として記憶する参照画像記憶部と、物品を撮像する撮像部と、検査対象となる物品を撮像部により撮像することで取得された物品画像から刻印領域に対応する部分を切り抜いて刻印領域画像を取得し、刻印領域画像に対して刻印部の文字認識を行って刻印が適切に設けられているか否かを判定する刻印判定部と、刻印領域画像から刻印部の画像を取り除いた刻印周辺画像を参照画像と比較して刻印領域のうち刻印部を除く刻印周辺部に欠陥が含まれるか否かを判定する刻印周辺判定部と、を備えている。
近年、特許文献1に開示されるような外観検査装置では、機械学習を用いたアルゴリズムによって対象物の良否を判定することが行われている。
一方、このような外観検査では、検査の対象物の撮像の仕方などによって、良品であっても不良品であると誤判定されるおそれがある。判定精度を向上させるために、不良判定が出た場合には対象物を再撮像して再び判定をすることが考えられるが、この方法では、対象物を再撮像することで検査時間や工数が増加する。
本発明は上記の問題点に鑑みてなされたものであり、画像判定において簡易な方法で判定精度を向上させることを目的とする。
本発明は、画像判定方法であって、判定対象を含む対象画像を取得する画像取得工程と、対象画像から判定対象を含む所定領域の画像を判定画像として抽出する抽出工程と、所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、判定画像における判定対象が判定条件を満たすかを判定する判定工程と、を含み、判定工程では、判定対象が判定条件に適合しないと判定されると、判定画像に対する判定対象の相対的な大きさを変更した再判定画像を取得し、再判定画像内の判定対象が判定条件を満たすか否かを再判定することを特徴とする。
また、本発明は、画像判定装置であって、判定対象を含む対象画像を取得する画像取得部と、対象画像から判定対象を含む所定領域の画像を判定画像として抽出する抽出部と、所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、判定画像に含まれる判定対象が判定条件を満たすかを判定する判定部と、を備え、判定部は、判定対象が判定条件に適合しないと判定すると、判定画像と当該判定画像内における判定対象との相対的な大きさを変更した再判定画像を生成し、再判定画像内の判定対象が判定条件を満たすかを再判定することを特徴とする。
これらの発明では、判定画像に対する判定対象の相対的な大きさを変更した画像を再判定画像として生成することで、判定画像とは別の判定用の画像を取得することができる。これにより、再判定のために新たに対象物を撮像することなく、対象物の再判定を行うことができる。
また、本発明は、判定工程では、複数の学習済みモデルのそれぞれによって判定対象が判定条件を満たすかを判定し、複数の学習済みモデルのすべてによって判定対象が判定条件に適合すると判定された場合には判定対象は判定条件に適合すると判定し、複数の学習済みモデルのうちの少なくとも一つの学習済みモデルによって判定対象が判定条件に適合しないと判定された場合には、判定対象は判定条件に適合しないと判定することを特徴とする。
この発明では、複数の学習済みモデルの判定結果に応じて判定対象が判定条件に適合するかを判定するため、判定精度を向上させることができる。
また、本発明は、判定工程には、判定画像における判定対象が判定条件に適合しないと判定されると、判定画像に対する判定対象の相対的な大きさを増加させた拡大画像を再判定画像として取得して再判定を実行する第一再判定工程と、第一再判定工程において判定対象が判定条件に適合しないと判定されると、判定画像に対する判定対象の相対的な大きさを減少させた縮小画像を再判定画像として取得して再判定を実行する第二再判定工程と、が含まれることを特徴とする。
この発明では、拡大画像を用いる第一再判定工程と縮小画像を用いる第二再判定工程との両方が行われるため、誤判定の一因が判定画像内の判定対象が小さい場合と大きい場合のいずれの場合であっても対応することができる。
本発明によれば、画像判定における判定精度を容易に向上させることができる。
以下、図面を参照して、本発明の実施形態に係る画像判定装置100及び画像判定方法について説明する。
本実施形態の画像判定装置100は、製造された対象物にプリント(印字)された文字を認識し、対象物が製造ラインを流れる適正な製品であるかを検査して、製造ラインでの異品混入を防止する外観検査装置(以下、単に「検査装置101」とする。)に用いられる。本実施形態では、検査装置101は、対象物としての緩衝器1のシリンダ2における円筒面状の外周面に刻印によってプリントされる製造番号等の文字(文字列)を認識し、認識した文字が緩衝器1に刻印する当該製造番号等の文字と一致しているかを検査するものである。つまり、本実施形態では、緩衝器1に刻印される文字(文字列)が判定対象に相当する。
本明細書において、文字とは、情報を伝達・記録するために用いられ視覚によって認識可能な記号全般を指す。本明細書では、文字とは、アルファベットや数字、漢字、ひらがな、カタカナに加えて、句読点や疑問符等の記号(いわゆる約物)、絵文字等も含むものである。
図1及び図2に示すように、検査装置101は、緩衝器1を軸線周りに回転させる電動モータ10と、緩衝器1の外周面の文字を含む画像(以下、「対象画像」と称する。)を撮像する撮像部20と、撮像部20が撮像した対象画像を取得して画像判定を行う画像判定装置100と、検査装置101の作動を制御する制御装置30と、モニタ等の表示装置40と、を備える。
検査対象となる緩衝器1は、検査装置101によって行われる検査工程よりも前の工程において、刻印機(図示省略)によりシリンダ2の外周に文字が刻印される。文字は、シリンダ2の外周面から窪むようにして刻印される。文字が刻印された緩衝器1は、搬送機構(図示省略)によって架台(図示省略)上の所定位置(検査位置)に搬送される。電動モータ10は、架台上の検査位置にある緩衝器1を軸線周りに回転させる。
撮像部20は、線状に対象物を撮像し、撮像したデータを繋ぎ合わせることで一つの画像を生成するラインセンサカメラである。撮像部20は、所定位置にある緩衝器1の鉛直方向上方の設けられており、緩衝器1の軸線方向に沿ったラインによって緩衝器1の外周面を撮像する。電動モータ10によって軸線周りに回転する緩衝器1の外周面をこのような撮像部20で撮像することで、シリンダ2の円筒状の外周面にプリントされた文字を平面上の画像として取得することができる。撮像部20が撮像した対象画像は、画像判定装置100に入力される。なお、撮像部20は、ラインセンサカメラに限定されず、その他のカメラであってもよい。
画像判定装置100は、制御プログラム等を実行するCPU(Central Processing Unit)と、CPUにより実行される制御プログラムを記憶するROM(Read-Only Memory)と、CPUの演算結果等を記憶するRAM(Random Access Memory)と、通信装置と、等を備えたコンピュータによって構成される情報処理装置である。画像判定装置100は、ROMに記憶される制御プログラムがRAMに読み込まれ、RAM上でCPUによって実行されることにより、本明細書に記載の画像判定装置100の各種機能を実行する。画像判定装置100は、一つのコンピュータによって構成されていてもよいし、複数のマイクロコンピュータによって構成され各制御を当該複数のコンピュータで分散処理するように構成されていてもよい。
画像判定装置100は、図2に示すように、緩衝器1に付されるべき適正文字が予め記憶される記憶部51と、撮像部20が撮像した対象画像を取得する画像取得部52と、対象画像から判定対象である文字を含む所定領域の画像を判定画像として抽出する抽出部53と、所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、判定画像に含まれる文字が判定条件を満たすかを判定する判定部54と、を備える。なお、図2に示す画像判定装置100の各構成は、画像判定装置100の各機能を仮想的なユニットとして示したものであり、必ずしも物理的に存在することを意味するものではない。
記憶部51は、検査する緩衝器1に刻印される文字の情報(文字が表す製造番号等の情報)を、適正文字として記憶する。適正文字は、作業者によって予め入力される。また、記憶部51は、学習済みモデル(プログラム)として、後述する第一モデル50A及び第二モデル50Bを予め記憶している。
抽出部53は、対象画像内において認識対象となる文字列を含むバウンティングボックス(所定領域)を設定し、バウンティングボックス内の画像を判定画像として抽出する。抽出した判定画像は、判定部54に入力される。
判定部54は、判定画像内に含まれる文字を認識し、認識した文字が記憶部51に記憶された適正文字と一致しているかを判定する。つまり、本実施形態では、判定における所定の判定条件とは、認識した文字が適正文字と一致することである。判定部54は、それぞれ機械学習による学習済みモデルである第一モデル50A及び当該第一モデル50Aとは異なる第二モデル50Bによって判定文字が適正文字と一致しているかを判定する(図1参照)。判定部54の判定結果は、制御装置30に出力される。
第一モデル50A及び第二モデル50Bは、それぞれ画像内において認識対象となる文字列を含むバウンティングボックスを設定し、バウンティングボックス内に含まれる文字列のそれぞれがどの文字であるか認識・識別するようにコンピュータを機能させるプログラムである。第一モデル50A及び第二モデル50Bは、それぞれバウンティングボックス内の文字列を一文字ずつ認識する。
本実施形態では、第一モデル50A及び第二モデル50Bは、それぞれ深層学習(ディープラーニング)による機械学習が行われるアルゴリズムである。具体的には、第一モデル50Aのアルゴリズムは、YOLO(You Only Look Once)であり、第二モデル50Bのアルゴリズムは、CNN(Convolutional Neural Network)である。YOLO及びCNNの具体的構成は、公知のものであるため、詳細な説明は省略する。
第一モデル50A及び第二モデル50Bは、深層学習による学習済みモデルとして、SSD(Single Shot Multibox Detector)やDETR(DEtection with TRansformers)など、その他のものであってもよい。また、第一モデル50A及び第二モデル50Bは、深層学習による学習済みモデルに限定されず、OCRやサポートベクターマシン(SVM)といった深層学習によらない機械学習によって構築されるモデルでもよい。第一モデル50Aと第二モデル50Bとは、互いに異なるモデルである。本明細書において、第一モデル50Aと第二モデル50Bとが異なるとは、アルゴリズムが異なることに加えて、同じアルゴリズムであっても、学習されるデータが異なる場合も含む意味である。
第一モデル50A及び第二モデル50Bは、文字を含む文字画像に対して当該文字が表す意味である文字情報がラベリングされたデータを教師データとして機械学習される教師あり機械学習によるアルゴリズムである。教師データとなる文字画像は、判定条件に適合するように、適正文字が付された画像である。教師データの文字画像は、検査装置101の検査対象である緩衝器1に刻印される文字を撮像部20によって撮像することで取得してもよいし、緩衝器1の文字を撮像した画像又は設計図面などから人工的に生成するものでもよい。また、第一モデル50Aと第二モデル50Bとで使用される教師データは、互いに共通であってもよいし異なっていてもよい。
教師データには、文字画像全体に対する文字の相対的な大きさが異なる複数種類の文字画像が含まれる。これにより、対象画像における文字の大きさがばらついても、精度良く判定をすることができる。
制御装置30は、制御プログラム等を実行するCPU(Central Processing Unit)と、CPUにより実行される制御プログラムを記憶するROM(Read-Only Memory)と、CPUの演算結果等を記憶するRAM(Random Access Memory)と、通信装置と、等を備えたコンピュータによって構成される情報処理装置である。制御装置30は、ROMに記憶される制御プログラムがRAMに読み込まれ、RAM上でCPUによって実行されることにより、本明細書に記載の制御装置30の各種機能を実行する。制御装置30は、一つのコンピュータによって構成されていてもよいし、複数のマイクロコンピュータによって構成され各制御を当該複数のコンピュータで分散処理するように構成されていてもよい。
制御装置30は、検査装置101における電動モータ10、撮像部20、搬送機構などの各構成の作動を制御する。また、制御装置30には、画像判定装置100による判定結果を表す信号が入力される。なお、制御装置30は、画像判定装置100と同一のコンピュータとして構成されてもよい。
次に、本実施形態の画像判定方法及び検査方法について説明する。
検査装置101は、検査対象である緩衝器1が所定位置に搬送されると、電動モータ10によって緩衝器1を回転させながら緩衝器1の外周面の文字を撮像部20によって撮像する。撮像された画像は、画像判定装置100に入力される。
画像判定装置100は、図3に示す処理を実行することで、対象画像における文字が適正文字であるかどうかを判定する。以下、図3を参照して、画像判定装置100による画像判定方法について説明する。
図3に示すように、ステップS10では、撮像部20が撮像した対象画像を取得する。ステップS10が、画像取得部52によって実行される画像取得工程に相当する。
ステップS11では、図4に示すように、対象画像内に文字を含むバウンティングボックスを設定し、バウンティングボックス内の画像を判定画像として抽出する。ステップS11の処理は、YOLOによって構成される第一モデル50Aによって実行される。第二モデル50Bは、バウンティングボックスの設定(対象の検出)は行わず、後述する文字の認識(識別)のみを行う。ステップS11が、抽出部53によって実行される抽出工程に相当する。
次に、ステップS12~ステップS18において、対象画像における文字が判定条件に適合しているか、具体的には、適正文字と一致しているかを判定する。ステップS12~ステップS20が、判定部54によって実行される判定工程に相当する。ステップS14及びステップS16は、第一モデル50Aを用いて実行される。ステップS12、ステップS15、及びステップS17は、第一モデル50A及び第二モデル50Bの両方を用いて実行される。
ステップS12では、第一モデル50A及び第二モデル50Bのそれぞれによって、対象画像内に含まれる文字を認識し、認識した文字が、適正文字であるかを判定する。
ステップS12において、第一モデル50A及び第二モデル50Bの両方が、認識した文字が適正文字であると判定した場合には、ステップS13に進む。ステップS13では、認識した文字が適正文字である、つまり、判定条件に適合すると判断(決定)する。認識した文字が適正文字であると判断されると、判定条件に適合することを示す適合信号が制御装置30に出力される。
ステップS12において、第一モデル50A及び第二モデル50Bの判定結果の少なくとも一方が、判定条件に適合しないと判定した場合には、ステップS14に進む。ステップS14では、図5(b)に示すように、判定画像に対する文字の相対的な大きさを大きくした拡大画像(再判定画像)を生成する。より具体的には、判定画像の大きさは維持しつつ、縦横比を一定のまま文字を大きくして、拡大画像を生成する。
次に、ステップS15では、ステップS14で生成した拡大画像を取得して文字を認識し、認識した文字が、適正文字であるかを第一モデル50A及び第二モデル50Bによって再判定する。ステップS15が、再判定工程である第一再判定工程に相当する。
ステップS15において、第一モデル50A及び第二モデル50Bの両方が、認識した文字が適正文字であると判定した場合には、ステップS13に進み認識した文字が適正文字であると判断する。
ステップS15において、第一モデル50A及び第二モデル50Bの判定結果の少なくとも一方が判定条件に適合しないと判定した場合には、ステップS16に進む。ステップS16では、図5(c)に示すように、判定画像に対する文字の相対的な大きさを小さくして、縮小画像(再判定画像)を生成する。より具体的には、判定画像の大きさは維持しつつ、縦横比を一定のまま文字を小さくして、縮小画像を生成する。
ステップS17では、ステップS16で生成した縮小画像を取得して文字を認識し、認識した文字が、適正文字であるかを第一モデル50A及び第二モデル50Bによって再判定する。ステップS17が、再判定工程である第二再判定工程に相当する。
ステップS17において、第一モデル50A及び第二モデル50Bの両方が、認識した文字が適正文字であると判定した場合には、ステップS13に進み認識した文字が適正文字であると判断する。
ステップS17において、第一モデル50A及び第二モデル50Bの判定結果の少なくとも一方が、判定条件に適合しないものであった場合には、ステップS18に進む。ステップS18では、第一モデル50A及び第二モデル50Bの判定結果の両方が不適合であるかを判定する。第一モデル50A及び第二モデル50Bの判定結果の両方が不適合であった場合には、ステップS19において、認識した文字が適正文字ではない、つまり、判定条件に不適合であると判断(決定)する。判定条件に不適合であると判断されると、判定画像の文字が判定条件に不適合であることを示す不適合信号が制御装置30に出力される。
ステップS18において、第一モデル50A及び第二モデル50Bの一方が適合と判定し、他方が不適合と判定した場合には、ステップS20において、判別不能であると判断(決定)する。判別不能であると判断されると、判別不能を示す判別不能信号が制御装置30に出力される。以上により、画像判定装置100による画像判定が完了する。
なお、拡大画像及び縮小画像の生成において、文字の大きさをどの程度変更するかは、経験則などに基づいて予め設定される。
また、第一モデル50A及び第二モデル50Bのそれぞれによって実行されるステップS12、ステップS15、及びステップS17では、第一モデル50Aによる処理と第二モデル50Bによる処理とは、並列処理されるものでもよいし、逐次処理されるものでもよい。
このようにして、画像判定装置100による画像判定が行われる。
制御装置30は、適合信号を受信した場合には、モニタ等の表示装置40に検査した緩衝器1が適合品であることを表示する。緩衝器1が適合品である場合には、検査位置にある緩衝器1は、後の工程に搬送され、新たな緩衝器1が検査位置に搬送される。
制御装置30は、不適合信号を受信した場合には、表示装置40に検査した緩衝器1が不適合であることを表示する。緩衝器1が不適合品である場合には、緩衝器1の搬送を停止させる。
制御装置30は、判別不能信号を受信した場合には、表示装置40に判別不能であること、及び、判定に使用した判定画像を表示し、緩衝器1の搬送を停止させる。これにより、画像判定装置100によって判別不能である場合には、検査した緩衝器1が判定条件に適合しているか否かを作業者の目視によって最終確認することができる。
以上の工程によって、画像判定装置100による画像判定を含む検査工程が完了する。
本実施形態の画像判定では、判定画像に対する判定において、第一モデル50A又は第二モデル50Bが不適合と判定すると、判定画像から拡大画像を生成し、拡大画像に対して再判定を行う(第一再判定工程)。第一再判定工程においても第一モデル50A又は第二モデル50Bが不適合と判定すると、判定画像から縮小画像を生成し、縮小画像に対して再判定を行う(第二再判定工程)。
拡大画像及び縮小画像は、撮像部20による撮像などの工程を必要とせず、コンピュータである画像判定装置100による処理だけで生成することができるため、容易に生成することができる。そして、一度目の判定で不適合であると誤判定された場合であっても、判定する画像を拡大画像又は縮小画像とすることで、学習した教師データとの類似度が大きくなり、その結果、拡大画像又は縮小画像によって再判定することで正しく判定される確率を高めることができる。よって、画像判定装置100によれば、時間や工数を要さずに容易に判定精度を向上させることができる。
なお、本実施形態では、一度目の判定(ステップS12)で判定条件に適合と判定されると、再判定(ステップS14~ステップS17)は行われない。
また、本実施形態では、第一再判定工程において拡大画像を生成して判定を行い、第一再判定工程において判定条件に不適合と判定された場合にのみ、縮小画像に対して判定を行う第二判定工程が行われる。通常、画像判定による文字認識では、画像と文字との間の余白が小さい、言い換えると、画像に対する文字の相対的な大きさが大きいほど認識精度が高いことが知られている。よって、二回行われる再判定において、先に拡大画像に対する判定を行うことで、第一再判定工程で不適合と判定される確率を低減し、第二再判定工程を行う回数を低減できる。これにより、画像判定に要する時間をより一層低減することができる。
次に、本実施形態の変形例について説明する。以下のような変形例も本発明の範囲内であり、変形例に示す構成と上述の実施形態で説明した構成を組み合わせたり、以下の異なる変形例で説明する構成同士を組み合わせたりすることも可能である。
上記実施形態では、拡大画像及び縮小画像は、画像の大きさを維持しつつ、文字の大きさを変更することで生成される。これに対し、文字の大きさを維持しつつ、画像の大きさを変更することで、拡大画像又は縮小画像を生成してもよい。また、画像の大きさ及び文字の大きさの両方を変更して、拡大画像又は縮小画像を生成してもよい。このように、拡大画像及び縮小画像は、画像に対する文字の相対的な大きさ、言い換えると、画像の枠と文字との間の余白の大きさが判定画像から変更されるものであれば、任意の方法で作成することができる。
また、上記実施形態では、拡大画像及び縮小画像は、文字の縦横比を維持して作成される。これに対し、拡大画像及び縮小画像では、文字の縦横比を変更しながら大きさを変更するものでもよい。
また、上記実施形態では、第一モデル50A及び第二モデル50Bの二つのモデルを利用して画像判定が行われる。これに対し、三以上の学習済みモデルによって本実施形態の画像判定が行われてもよい。三つ以上の学習済みモデルが利用される場合には、判定工程は、複数の学習済みモデルのすべてによって対象画像における文字が判定条件に適合すると判定された場合には判定条件に適合すると判定し、複数の学習済みモデルのうち少なくとも一つの学習済みモデルによって対象画像における文字が判定条件に適合しないと判定された場合には、判定条件に適合しないと判定すればよい。なお、複数の学習済みモデルのうち少なくとも一つの学習済みモデルによって対象画像における文字が判定条件に適合すると判定された場合には、対象画像における文字が判定条件に適合するとし、すべての学習済みモデルによって対象画像における文字が判定条件に適合しないと判定された場合には、判定条件に適合しないと判定するように構成してもよい。
また、判定精度の向上の観点からは、二以上の複数の学習済みモデルによって画像判定が行われることが望ましいが、一つの学習済みモデルによって再判定工程を含む画像判定方法が実行されてもよい。つまり、判定工程において、複数の学習済みモデルによって判定条件を満たすかを判定する構成は必須のものではない。
また、上記実施形態では、再判定工程として、第一再判定工程及び第二再判定工程を含む二回の再判定が行われる。これに対し、再判定の数は、一回でもよいし、三回以上であってもよい。その際、再判定画像を拡大画像とするか縮小画像とするかは、任意に設定できる。また、二回の再判定を行う上記実施形態においても、第二再判定工程において判定画像を第一再判定工程とは異なる拡大画像としてもよいし、第一再判定工程において判定画像を第二再判定工程とは異なる縮小画像としてもよい。
また、上記実施形態では、画像判定装置100は、緩衝器1に適正な文字がプリントされているかを検査する検査装置101に用いられる。これに対し、画像判定装置100は、製品のキズ、変形、規格外れなど外観から確認できる欠陥を認識する検査装置101に利用することができる。また、画像判定装置100は、検査装置101に限定されず、その他の用途に利用されてもよい。
また、上述した画像判定装置100における一連の処理は、コンピュータにこれを実行させるためのプログラムとして提供されてもよい。
即ち、本実施形態に係るプログラムは、判定対象を含む対象画像を取得する画像取得工程と、対象画像から判定対象を含む所定領域の画像を判定画像として抽出する抽出工程と、所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、判定画像における判定対象が判定条件を満たすかを判定する判定工程と、コンピュータである画像判定装置100に実行させるものであり、判定工程では、判定対象が判定条件に適合しないと判定されると、判定画像に対する判定対象の相対的な大きさを変更した再判定画像を生成し、再判定画像内の判定対象が判定条件を満たすか否かを再判定させるものである。
以下、本発明の実施形態の構成、作用、及び効果をまとめて説明する。
本実施形態の画像判定方法は、判定対象を含む対象画像を取得する画像取得工程と、対象画像から判定対象を含む所定領域の画像を判定画像として抽出する抽出工程と、所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、判定画像における判定対象が判定条件を満たすかを判定する判定工程と、を含み、判定工程では、判定対象が判定条件に適合しないと判定されると、判定画像に対する判定対象の相対的な大きさを変更した再判定画像を生成し、再判定画像内の判定対象が判定条件を満たすか否かを再判定する。
画像判定装置100は、判定対象を含む対象画像を取得する画像取得部52と、対象画像から判定対象を含む所定領域の画像を判定画像として抽出する抽出部53と、所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、判定画像に含まれる判定対象が判定条件を満たすかを判定する判定部54と、を備え、判定部54は、判定対象が判定条件に適合しないと判定すると、判定画像に対する判定対象の相対的な大きさを変更した再判定画像を生成し、再判定画像内の判定対象が判定条件を満たすかを再判定する。
これらの構成では、判定画像に対する判定対象の相対的な大きさを変更した画像を再判定画像として生成することで、判定画像とは別の判定用の画像を取得することができる。これにより、再判定のために新たに対象物を撮像することなく、対象物の再判定を行うことができる。したがって、本実施形態によれば、画像判定における判定精度を容易に向上させることができる。
また、画像判定方法の判定工程では、学習済みモデルとして第一モデル50A及び第二モデル50Bのそれぞれによって判定対象が判定条件を満たすかを判定し、第一モデル50A及び第二モデル50Bの両方によって判定対象が判定条件に適合すると判定された場合には判定対象は判定条件に適合すると判定し、第一モデル50A及び第二モデル50Bの少なくとも一方によって判定対象が判定条件に適合しないと判定された場合には、判定対象は判定条件に適合しないと判定する。
この構成では、第一モデル50A及び第二モデル50Bの二つのモデルの判定結果に応じて判定対象が判定条件に適合するかを判定するため、判定精度を向上させることができる。
また、画像判定方法では、判定工程には、判定画像における判定対象が判定条件に適合しないと判定されると、判定画像に対する判定対象の相対的な大きさを増加させた拡大画像を再判定画像として取得して再判定を実行する第一再判定工程と、第一再判定工程において判定対象が判定条件に適合しないと判定されると、判定画像に対する判定対象の相対的な大きさを減少させた縮小画像を再判定画像として取得して再判定を実行する第二再判定工程と、が含まれることを特徴とする。
この構成では、拡大画像を用いる第一再判定工程と縮小画像を用いる第二再判定工程との両方が行われるため、誤判定の一因が判定画像内の判定対象が小さい場合と大きい場合のいずれの場合であっても対応することができる。
以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一部を示したに過ぎず、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。
50A…第一モデル(学習済みモデル)、50B…第二モデル(学習済みモデル)、52…画像取得部、53…抽出部、54…判定部、100…画像判定装置
Claims (4)
- 判定対象を含む対象画像を取得する画像取得工程と、
前記対象画像から前記判定対象を含む所定領域の画像を判定画像として抽出する抽出工程と、
所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、前記判定画像における前記判定対象が前記判定条件を満たすかを判定する判定工程と、を含み、
前記判定工程では、前記判定対象が前記判定条件に適合しないと判定されると、前記判定画像に対する前記判定対象の相対的な大きさを変更した再判定画像を生成し、前記再判定画像内の前記判定対象が前記判定条件を満たすか否かを再判定することを特徴とする画像判定方法。 - 請求項1に記載の画像判定方法であって、
前記判定工程では、複数の前記学習済みモデルのそれぞれによって前記判定対象が前記判定条件を満たすかを判定し、複数の前記学習済みモデルのすべてによって前記判定対象が前記判定条件に適合すると判定された場合には前記判定対象は前記判定条件に適合すると判定し、複数の前記学習済みモデルのうち少なくとも一つの前記学習済みモデルによって前記判定対象が前記判定条件に適合しないと判定された場合には、前記判定対象は前記判定条件に適合しないと判定することを特徴とする画像判定方法。 - 請求項1又は2に記載の画像判定方法であって、
前記判定工程には、
前記判定画像における前記判定対象が前記判定条件に適合しないと判定されると、前記判定画像に対する前記判定対象の相対的な大きさを増加させた拡大画像を前記再判定画像として取得して前記再判定を実行する第一再判定工程と、
前記第一再判定工程において前記判定対象が前記判定条件に適合しないと判定されると、前記判定画像に対する前記判定対象の相対的な大きさを減少させた縮小画像を前記再判定画像として取得して前記再判定を実行する第二再判定工程と、が含まれることを特徴とする画像判定方法。 - 判定対象を含む対象画像を取得する画像取得部と、
前記対象画像から前記判定対象を含む所定領域の画像を判定画像として抽出する抽出部と、
所定の判定条件を満たす画像を教師データとして機械学習された学習済みモデルによって、前記判定画像に含まれる前記判定対象が前記判定条件を満たすかを判定する判定部と、を備え、
前記判定部は、前記判定対象が前記判定条件に適合しないと判定すると、前記判定画像に対する前記判定対象の相対的な大きさを変更した再判定画像を生成し、前記再判定画像内の前記判定対象が前記判定条件を満たすかを再判定することを特徴とする画像判定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022186772A JP2024075371A (ja) | 2022-11-22 | 2022-11-22 | 画像判定方法及び画像判定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022186772A JP2024075371A (ja) | 2022-11-22 | 2022-11-22 | 画像判定方法及び画像判定装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024075371A true JP2024075371A (ja) | 2024-06-03 |
Family
ID=91321578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022186772A Pending JP2024075371A (ja) | 2022-11-22 | 2022-11-22 | 画像判定方法及び画像判定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024075371A (ja) |
-
2022
- 2022-11-22 JP JP2022186772A patent/JP2024075371A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10885531B2 (en) | Artificial intelligence counterfeit detection | |
CN110826416B (zh) | 一种基于深度学习的卫浴陶瓷表面缺陷检测方法及装置 | |
CN110659647B (zh) | 印章图像识别方法及装置、智能发票识别设备和存储介质 | |
CN110060237B (zh) | 一种故障检测方法、装置、设备及系统 | |
US10817741B2 (en) | Word segmentation system, method and device | |
WO2019237549A1 (zh) | 验证码识别方法、装置、计算机设备及存储介质 | |
CN109685065B (zh) | 试卷内容自动分类的版面分析方法、系统 | |
CN110490190B (zh) | 一种结构化图像文字识别方法及系统 | |
CN111310826B (zh) | 样本集的标注异常检测方法、装置及电子设备 | |
US11600088B2 (en) | Utilizing machine learning and image filtering techniques to detect and analyze handwritten text | |
CN113516619B (zh) | 一种基于图像处理技术的产品表面瑕疵识别方法 | |
KR102297232B1 (ko) | 형태학적 영상처리를 활용한 이상 탐지 방법 | |
CN114463767A (zh) | 信用证识别方法、装置、计算机设备和存储介质 | |
EP3660731B1 (en) | Digitization of industrial inspection sheets by inferring visual relations | |
CN116597466A (zh) | 一种基于改进YOLOv5s的工程图纸文字检测识别方法及系统 | |
Dai et al. | Detection and segmentation of image anomalies based on unsupervised defect reparation | |
CN112200789B (zh) | 一种图像识别的方法及装置、电子设备和存储介质 | |
CN113822836B (zh) | 标记图像的方法 | |
US20180225508A1 (en) | Detecting document objects | |
JP2024075371A (ja) | 画像判定方法及び画像判定装置 | |
CN111935480B (zh) | 一种用于图像获取装置的检测方法及相关装置 | |
CN114495108A (zh) | 字符检测方法、装置、电子设备及可读介质 | |
RU2560789C1 (ru) | Способ идентификации печати на цифровом изображении | |
JP2008282327A (ja) | 文字対称性判定方法及び文字対称性判定装置 | |
CN118864876A (zh) | 基于图文预训练模型的零样本异常检测方法、装置 |