JP7338779B2 - 画像認識装置、画像認識方法、及び、プログラム - Google Patents
画像認識装置、画像認識方法、及び、プログラム Download PDFInfo
- Publication number
- JP7338779B2 JP7338779B2 JP2022501427A JP2022501427A JP7338779B2 JP 7338779 B2 JP7338779 B2 JP 7338779B2 JP 2022501427 A JP2022501427 A JP 2022501427A JP 2022501427 A JP2022501427 A JP 2022501427A JP 7338779 B2 JP7338779 B2 JP 7338779B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- time
- feature
- images
- series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10141—Special mode during image acquisition
- G06T2207/10152—Varying illumination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Description
対象物を撮影した時系列の撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の明度値の変化に基づいて、前記時系列の撮影画像から前記対象物の特徴箇所を示す特徴画像を選択する画像選択手段と、
前記特徴画像を用いて、前記対象物の認識処理を行う認識手段と、を備える。
対象物を撮影した時系列の撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の明度値の変化に基づいて、前記時系列の撮影画像から前記対象物の特徴箇所を示す特徴画像を選択し、
前記特徴画像を用いて、前記対象物の認識処理を行う。
対象物を撮影した時系列の撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の明度値の変化に基づいて、前記時系列の撮影画像から前記対象物の特徴箇所を示す特徴画像を選択し、
前記特徴画像を用いて、前記対象物の認識処理を行う処理をコンピュータに実行させる。
[基本原理]
まず、本発明に係る画像認識装置100の基本原理について説明する。図1は、画像認識装置100を用いた異常検出の様子を示す。本実施形態では、異常検出の対象物を錠剤5とする。錠剤5は、矢印の方向に移動するコンベア2上に所定間隔で配置され、コンベア2の移動に伴って移動する。コンベア2の上方には照明3と高速カメラ4が配置される。図1の例では、2つのバー型照明3を用いているが、照明の形態はこれには限られない。対象物の形状や検出すべき異常の種類に応じて、様々な強度及び照明範囲の照明が複数設置される。特に錠剤5などの小さい対象物の場合、微小な異常の種類、度合い、位置などは様々であるため、複数の照明を用いて照明条件を様々に変えて撮影を行う。
(ハードウェア構成)
図3は、第1実施形態に係る画像認識装置のハードウェア構成を示すブロック図である。図示のように、画像認識装置100は、インタフェース(I/F)12と、プロセッサ13と、メモリ14と、記録媒体15と、データベース(DB)16と、入力部17と、表示部18と、を備える。
図4は、第1実施形態に係る画像認識装置100の機能構成を示すブロック図である。画像認識装置100は、物体領域抽出部20と、画像選択器30と、認識器40と、を備える。物体領域抽出部20は、高速カメラ4から物体の時系列画像を受け取り、各撮影画像から対象物を含む領域である物体領域を抽出する。具体的に、物体領域抽出部20は、背景差分法などにより、撮影画像中の対象物の物体領域を抽出する。本実施形態では、対象物は錠剤5であるので、物体領域は撮影画像中の錠剤5の領域であり、具体的には図2に示すような錠剤5を含む矩形の領域となる。物体領域抽出部20は、抽出した物体領域の時系列画像を画像選択器30に出力する。
図7は、本実施形態による画像認識処理のフローチャートである。この処理は、図3に示すプロセッサ13が予め用意されたプログラムを実行し、図4及び図5に示す各要素として動作することにより実現される。
上記の実施形態では、セル分割部31は、物体領域の撮影画像を所定サイズのセルCに分割しているが、セルの分割方法はこれには限られない。例えば、撮影画像を諧調値や色特徴に基づいてグルーピングして作成したスーパーピクセルをセルCとして使用してもよい。また、別の例では、撮影画像の各画素をセルCとして用いてもよい。
(機能構成)
次に、第2実施形態について説明する。第2実施形態では、画像選択器30を深層学習モデルを適用したニューラルネットワークにより構成する。第2実施形態に係る画像認識装置100のハードウェア構成は図1と同様であり、機能構成は図4と同様である。
図10(A)は、深層学習モデルを用いて画像選択器30を構成した場合の実施例を示す。この実施例では、画像選択器30は、時系列画像を時間軸方向に連結し、畳み込み演算によりセル毎の評価値を算出して特徴画像を選択する。図示のように、画像選択器30は、深層学習モデルが適用されたニューラルネットワーク35と、畳み込み演算部38とを備える。時系列画像は、ニューラルネットワーク35及び畳み込み演算部38に入力される。ニューラルネットワーク35は、入力された時系列画像から特徴量を抽出し、非冗長度合いベクトルを生成して畳み込み演算部38に出力する。畳み込み演算部38は、時系列画像と非冗長度ベクトルとの時間軸方向の積を演算する。
次に、深層学習モデルを用いる場合の画像認識装置の実施例を説明する。図12(A)は、深層学習モデル用いる場合の画像認識装置100aの概略構成を示す。この実施例では、認識器40aを、CNN(Convolutional Neural Network)とRNN(Reccurent Neural Network)を組み合わせたニューラルネットワークにより構成する。1枚の画像から異常を検知する通常の認識器は計算量が多く、時系列画像に基づく高速な検査には不向きである。この点、本例のように認識器40に軽量のCNNと回帰(Recurrent)構造を組み合わせることにより、時系列画像を高速に認識することが可能となる。
次に、本発明の第3実施形態について説明する。図13は、第3実施形態に係る画像認識装置の機能構成を示す。画像認識装置70は、画像選択部71と、認識部72と、を備える。画像選択部71は、対象物を撮影した時系列の撮影画像から、前記対象物の特徴箇所を示す特徴画像を選択する。認識部72は、特徴画像を用いて対象物の認識処理を行う。
対象物を撮影した時系列の撮影画像から、前記対象物の特徴箇所を示す特徴画像を選択する画像選択部と、
前記特徴画像を用いて、前記対象物の認識処理を行う認識部と、
を備える画像認識装置。
前記画像選択部は、前記撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の統計量の変化に基づいて、前記時系列の撮影画像から前記特徴画像を選択する付記1に記載の画像認識装置。
前記画像選択部は、前記セル毎の統計量の変化が開始した撮影画像から、前記変化が終了した撮影画像までの連続する撮影画像を前記特徴画像として選択する付記2に記載の画像認識装置。
前記セルは、前記撮影画像を分割した所定サイズのセル、スーパーピクセル、及び、前記撮影画像を構成するピクセルのいずれかである付記2又は3に記載の画像認識装置。
前記画像選択部は、ニューラルネットワークにより構成され、前記時系列の撮影画像から前記特徴画像を選択するように学習された学習済みモデルを用いて、前記特徴画像を選択する付記1に記載の画像認識装置。
前記画像選択部は、前記時系列の撮影画像から特徴量を抽出し、前記特徴量に基づいて前記時系列の撮影画像間の非冗長度合いを示すベクトルを生成し、前記ベクトルを用いて前記時系列の撮影画像から前記特徴画像を選択する付記5に記載の画像認識装置。
前記画像選択部は、前記撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の非冗長度合いに基づいて、前記時系列の撮影画像から前記特徴画像を選択する付記6に記載の画像認識装置。
前記画像選択部は、前記特徴画像を選択する根拠となったセルのアテンション情報を前記認識部に出力し、
前記認識部は、前記アテンション情報を用いて、前記対象物の前記特徴箇所を認識する付記7に記載の画像認識装置。
前記画像選択部と前記認識部は、1つのニューラルネットワークにより構成される付記5乃至8のいずれか一項に記載の画像認識装置。
前記特徴箇所は前記対象物に存在する異常を示す箇所であり、
前記認識部は、前記対象物の異常に関するクラス分類、又は、前記対象物に存在する異常検知を行う付記1乃至9のいずれか一項に記載の画像認識装置。
対象物を撮影した時系列の撮影画像から、前記対象物の特徴箇所を示す特徴画像を選択し、
前記特徴画像を用いて、前記対象物の認識処理を行う画像認識方法。
対象物を撮影した時系列の撮影画像から、前記対象物の特徴箇所を示す特徴画像を選択し、
前記特徴画像を用いて、前記対象物の認識処理を行う処理をコンピュータに実行させるプログラムを記録した記録媒体。
5 錠剤
20 物体領域抽出部
30 画像選択器
31 セル分割部
32 セル別変化検出部
33 選択部
35 ニューラルネットワーク
37 最適化部
38 畳み込み演算部
39 閾値処理部
40 認識器
100 画像認識装置
Claims (17)
- 対象物を撮影した時系列の撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の明度値の変化に基づいて、前記時系列の撮影画像から前記対象物の特徴箇所を示す特徴画像を選択する画像選択手段と、
前記特徴画像を用いて、前記対象物の認識処理を行う認識手段と、
を備える画像認識装置。 - 前記画像選択手段は、前記セル毎の明度値の変化が開始した撮影画像から、前記変化が終了した撮影画像までの連続する撮影画像を前記特徴画像として選択する請求項1に記載
の画像認識装置。 - 前記セルは、前記撮影画像を分割した所定サイズのセル、スーパーピクセル、及び、前記撮影画像を構成するピクセルのいずれかである請求項1又は2に記載の画像認識装置。
- 前記画像選択手段は、ニューラルネットワークにより構成され、前記時系列の撮影画像から前記特徴画像を選択するように学習された学習済みモデルを用いて、前記特徴画像を選択する請求項1に記載の画像認識装置。
- 対象物を撮影した時系列の撮影画像から特徴量を抽出し、前記特徴量に基づいて前記時系列の撮影画像間の非冗長度合いを示すベクトルを生成し、前記ベクトルを用いて前記時系列の撮影画像から前記対象物の特徴箇所を示す特徴画像を選択する画像選択手段と、
前記特徴画像を用いて、前記対象物の認識処理を行う認識手段と、
を備える画像認識装置。 - 前記画像選択手段は、前記撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の非冗長度合いに基づいて、前記時系列の撮影画像から前記特徴画像を選択する請求項5に記載の画像認識装置。
- 前記画像選択手段は、前記特徴画像を選択する根拠となったセルのアテンション情報を前記認識手段に出力し、
前記認識手段は、前記アテンション情報を用いて、前記対象物の前記特徴箇所を認識する請求項6に記載の画像認識装置。 - 前記画像選択手段と前記認識手段は、1つのニューラルネットワークにより構成される請求項4乃至7のいずれか一項に記載の画像認識装置。
- 前記特徴箇所は前記対象物に存在する異常を示す箇所であり、
前記認識手段は、前記対象物の異常に関するクラス分類、又は、前記対象物に存在する異常検知を行う請求項1乃至8のいずれか一項に記載の画像認識装置。 - 対象物を撮影した時系列の撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の明度値の変化に基づいて、前記時系列の撮影画像から前記対象物の特徴箇所を示す特徴画像を選択し、
前記特徴画像を用いて、前記対象物の認識処理を行う画像認識方法。 - 対象物を撮影した時系列の撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の明度値の変化に基づいて、前記時系列の撮影画像から前記対象物の特徴箇所を示す特徴画像を選択し、
前記特徴画像を用いて、前記対象物の認識処理を行う処理をコンピュータに実行させるプログラム。 - 対象物を撮影した時系列の撮影画像から特徴量を抽出し、前記特徴量に基づいて前記時系列の撮影画像間の非冗長度合いを示すベクトルを生成し、前記ベクトルを用いて前記時系列の撮影画像から前記対象物の特徴箇所を示す特徴画像を選択し、
前記特徴画像を用いて、前記対象物の認識処理を行う画像認識方法。 - 前記特徴画像の選択では、前記撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の非冗長度合いに基づいて、前記時系列の撮影画像から前記特徴画像を選択する請求項12に記載の画像認識方法。
- 前記特徴画像の選択では、前記特徴画像を選択する根拠となったセルのアテンション情報を出力し、
前記認識処理は、前記アテンション情報を用いて、前記対象物の前記特徴箇所を認識する請求項13に記載の画像認識方法。 - 対象物を撮影した時系列の撮影画像から特徴量を抽出し、前記特徴量に基づいて前記時系列の撮影画像間の非冗長度合いを示すベクトルを生成し、前記ベクトルを用いて前記時系列の撮影画像から前記対象物の特徴箇所を示す特徴画像を選択し、
前記特徴画像を用いて、前記対象物の認識処理を行うコンピュータに実行させるプログラム。 - 前記特徴画像の選択では、前記撮影画像の各々を複数のセルに分割し、前記撮影画像の前記セル毎の非冗長度合いに基づいて、前記時系列の撮影画像から前記特徴画像を選択する請求項15に記載のプログラム。
- 前記特徴画像の選択では、前記特徴画像を選択する根拠となったセルのアテンション情報を出力し、
前記認識処理は、前記アテンション情報を用いて、前記対象物の前記特徴箇所を認識する請求項16に記載のプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/006180 WO2021166058A1 (ja) | 2020-02-18 | 2020-02-18 | 画像認識装置、画像認識方法、及び、記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021166058A1 JPWO2021166058A1 (ja) | 2021-08-26 |
JPWO2021166058A5 JPWO2021166058A5 (ja) | 2022-09-28 |
JP7338779B2 true JP7338779B2 (ja) | 2023-09-05 |
Family
ID=77390705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022501427A Active JP7338779B2 (ja) | 2020-02-18 | 2020-02-18 | 画像認識装置、画像認識方法、及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230053838A1 (ja) |
JP (1) | JP7338779B2 (ja) |
WO (1) | WO2021166058A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220292285A1 (en) * | 2021-03-11 | 2022-09-15 | International Business Machines Corporation | Adaptive selection of data modalities for efficient video recognition |
WO2022205685A1 (zh) * | 2021-03-29 | 2022-10-06 | 泉州装备制造研究所 | 一种基于轻量化网络的交通标志识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011095171A (ja) | 2009-10-30 | 2011-05-12 | Sumitomo Chemical Co Ltd | 欠陥検査システム、並びに、それに用いる、欠陥検査用撮影装置、欠陥検査用画像処理装置、欠陥検査用画像処理プログラム、記録媒体、および欠陥検査用画像処理方法 |
JP2018190329A (ja) | 2017-05-11 | 2018-11-29 | オムロン株式会社 | 画像処理装置、画像処理プログラム、画像処理システム |
JP2019184489A (ja) | 2018-04-13 | 2019-10-24 | 日東電工株式会社 | 画像識別装置、及び画像識別装置を備える物品製造装置 |
WO2019243863A1 (en) | 2018-06-18 | 2019-12-26 | Inception Institute Of Artificial Intelligence | Vehicle re-identification techniques using neural networks for image analysis, viewpoint-aware pattern recognition, and generation of multi-view vehicle representations |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8457414B2 (en) * | 2009-08-03 | 2013-06-04 | National Instruments Corporation | Detection of textural defects using a one class support vector machine |
-
2020
- 2020-02-18 WO PCT/JP2020/006180 patent/WO2021166058A1/ja active Application Filing
- 2020-02-18 JP JP2022501427A patent/JP7338779B2/ja active Active
- 2020-02-18 US US17/796,702 patent/US20230053838A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011095171A (ja) | 2009-10-30 | 2011-05-12 | Sumitomo Chemical Co Ltd | 欠陥検査システム、並びに、それに用いる、欠陥検査用撮影装置、欠陥検査用画像処理装置、欠陥検査用画像処理プログラム、記録媒体、および欠陥検査用画像処理方法 |
JP2018190329A (ja) | 2017-05-11 | 2018-11-29 | オムロン株式会社 | 画像処理装置、画像処理プログラム、画像処理システム |
JP2019184489A (ja) | 2018-04-13 | 2019-10-24 | 日東電工株式会社 | 画像識別装置、及び画像識別装置を備える物品製造装置 |
WO2019243863A1 (en) | 2018-06-18 | 2019-12-26 | Inception Institute Of Artificial Intelligence | Vehicle re-identification techniques using neural networks for image analysis, viewpoint-aware pattern recognition, and generation of multi-view vehicle representations |
Also Published As
Publication number | Publication date |
---|---|
US20230053838A1 (en) | 2023-02-23 |
JPWO2021166058A1 (ja) | 2021-08-26 |
WO2021166058A1 (ja) | 2021-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chung et al. | An efficient hand gesture recognition system based on deep CNN | |
Wang et al. | Machine vision intelligence for product defect inspection based on deep learning and Hough transform | |
CN111402203B (zh) | 一种基于卷积神经网络的织物表面缺陷检测方法 | |
CN109613002B (zh) | 一种玻璃缺陷检测方法、装置和存储介质 | |
CN111667455B (zh) | 一种刷具多种缺陷的ai检测方法 | |
Bong et al. | Vision-based inspection system for leather surface defect detection and classification | |
JP7338779B2 (ja) | 画像認識装置、画像認識方法、及び、プログラム | |
CN115184359A (zh) | 一种自动调参的表面缺陷检测系统与方法 | |
CN113487610B (zh) | 疱疹图像识别方法、装置、计算机设备和存储介质 | |
CN111145145A (zh) | 一种基于MobileNets的图像表面缺陷检测方法 | |
JP2021143884A (ja) | 検査装置、検査方法、プログラム、学習装置、学習方法、および学習済みデータセット | |
CN113807378A (zh) | 训练数据增量方法、电子装置与计算机可读记录介质 | |
KR102372714B1 (ko) | 딥러닝 기반 자동 결함 검사 장치 및 방법 | |
CN113763424A (zh) | 基于嵌入式平台的实时智能目标检测方法及系统 | |
Zhou et al. | A novel convolutional neural network for electronic component classification with diverse backgrounds | |
CN114387213A (zh) | 一种基于深度迁移学习的汽车钣金件表面缺陷检测方法 | |
CN117911437A (zh) | 一种改进YOLOv5x的荞麦籽粒粘连分割方法 | |
KR102178238B1 (ko) | 회전 커널을 이용한 머신러닝 기반 결함 분류 장치 및 방법 | |
Sema et al. | Automatic Detection and Classification of Mango Disease Using Convolutional Neural Network and Histogram Oriented Gradients | |
Khajuria et al. | Blur detection in identity images using convolutional neural network | |
CN114863199A (zh) | 一种基于优化锚框机制的目标检测方法 | |
CN112749687A (zh) | 一种图片质量和静默活体检测多任务训练方法和设备 | |
US20240153061A1 (en) | Inspection device, inspection method, and recording medium | |
Kronenwett et al. | Potential of Deep Learning methods for image processing in sensor-based sorting: data generation, training strategies and model architectures | |
WO2022185474A1 (ja) | 学習装置、学習方法、検査装置、検査方法、及び、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220803 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230623 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230725 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230807 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7338779 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |