JP2017123163A - 画像認識装置 - Google Patents
画像認識装置 Download PDFInfo
- Publication number
- JP2017123163A JP2017123163A JP2016248418A JP2016248418A JP2017123163A JP 2017123163 A JP2017123163 A JP 2017123163A JP 2016248418 A JP2016248418 A JP 2016248418A JP 2016248418 A JP2016248418 A JP 2016248418A JP 2017123163 A JP2017123163 A JP 2017123163A
- Authority
- JP
- Japan
- Prior art keywords
- area
- processor
- image
- recognition
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/10544—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation by scanning of the records by radiation in the optical part of the electromagnetic spectrum
- G06K7/10712—Fixed beam scanning
- G06K7/10722—Photodetector array or CCD scanning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/08—Payment architectures
- G06Q20/20—Point-of-sale [POS] network systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/758—Involving statistics of pixels or of feature values, e.g. histogram matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
- G06V30/2247—Characters composed of bars, e.g. CMC-7
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07G—REGISTERING THE RECEIPT OF CASH, VALUABLES, OR TOKENS
- G07G1/00—Cash registers
- G07G1/0036—Checkout procedures
- G07G1/0045—Checkout procedures with a code reader for reading of an identifying code of the article to be registered, e.g. barcode reader or radio-frequency identity [RFID] reader
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Electromagnetism (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Accounting & Taxation (AREA)
- Toxicology (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
- Cash Registers Or Receiving Machines (AREA)
Abstract
【課題】対象物の認識を高速に行える画像認識装置を提供する。
【解決手段】実施形態によれば、画像認識装置は、メモリと、インターフェースと、プロセッサと、を備える。メモリは、対象物に付与されるコード情報から得られる識別情報と、オブジェクト認識に用いる対象物の画像情報とを認識対象とする対象物ごとに記憶する。プロセッサは、画像から対象物がある対象物領域を抽出し、前記対象物領域においてコード情報を抽出し、抽出したコード情報から前記識別情報を認識し、コード情報に基づく対象物の認識に失敗した場合、前記対象物領域の画像と前記メモリに記憶された各対象物の画像情報とにより対象物を認識するように制御する。
【選択図】 図1
【解決手段】実施形態によれば、画像認識装置は、メモリと、インターフェースと、プロセッサと、を備える。メモリは、対象物に付与されるコード情報から得られる識別情報と、オブジェクト認識に用いる対象物の画像情報とを認識対象とする対象物ごとに記憶する。プロセッサは、画像から対象物がある対象物領域を抽出し、前記対象物領域においてコード情報を抽出し、抽出したコード情報から前記識別情報を認識し、コード情報に基づく対象物の認識に失敗した場合、前記対象物領域の画像と前記メモリに記憶された各対象物の画像情報とにより対象物を認識するように制御する。
【選択図】 図1
Description
本発明の実施形態は、画像認識装置に関する。
画像認識装置には、カメラが撮影する画像から対象物を認識する機能を有するものがある。対象物を認識する機能としては、バーコード認識、およびオブジェクト認識などがある。オブジェクト認識は、カメラが撮影する画像から取得する画像情報と予め保持する対象物自体の画像情報と比較することにより取得した画像情報に含まれる対象物を認識するものである。一般に、オブジェクト認識は、運用上の利点が多い反面、処理時間がかかる。このため、画像認識装置は、オブジェクト認識の負担を軽減することが要望される。
上記の課題を解決するために、対象物の認識を高速に行える画像認識装置を提供する。
実施形態によれば、画像認識装置は、メモリと、インターフェースと、プロセッサと、を備える。メモリは、対象物に付与されるコード情報から得られる識別情報と、オブジェクト認識に用いる対象物の画像情報とを認識対象とする対象物ごとに記憶する。インターフェースは、撮影された画像を取得する。プロセッサは、前記画像から対象物がある対象物領域を抽出し、前記対象物領域において対象物に付与されているコード情報を抽出し、抽出したコード情報から前記識別情報を認識し、コード情報に基づく対象物の認識に失敗した場合、前記対象物領域の画像と前記メモリに記憶された各対象物の画像情報とにより対象物を認識するように制御する。
以下、図面を参照しながら実施形態について説明する。
(第1実施形態)
まず、第1実施形態に係る画像認識装置について説明する。
図1は、第1実施形態に係る画像認識装置10の構成例を概略的に示す。
(第1実施形態)
まず、第1実施形態に係る画像認識装置について説明する。
図1は、第1実施形態に係る画像認識装置10の構成例を概略的に示す。
画像認識装置10は、所定の位置にセットされた対象物を認識する。例えば、画像認識装置10は、店舗などに設置され、利用客又は店員がセットした商品を認識するものである。また、画像認識装置10は、認識した商品についての決済処理を実行するものであってもよい。認識対象とする対象物は、特定の物に限定されるものではない。例えば、対象物は、物品、商品、又は、製品などである。
画像認識装置10は、対象物を認識する機能として、少なくともコード認識の機能とオブジェクト認識の機能とを有する。コード認識は、対象物に付与されているコード情報に基づいて対象物を認識する処理である。コード認識による認識対象の対象物は、自身を特定するためのコード情報が付与される。例えば、対象物に付与されるコード情報は、バーコード、又は、二次元コードなどである。また、オブジェクト認識は、対象物そのものの画像により対象物を認識する。
図1が示すように、画像認識装置10は、筐体1、撮影部2、及び、処理部3などを備える。
筐体1は、画像認識装置10の外形を形成するフレームである。筐体1は、対象物を配置することができるように形成される。図1が示す例においては、筐体1は、コの字型であり、筐体1に対象物が置かれる載置台を有する。筐体1において対象物が置かれる載置台は、対象物が配置できる領域を有する。例えば、画像認識装置10がカゴの中にある対象物を認識する形態であれば、載置台は、カゴが載置できるように構成される。また、載置台に対象物を直接載置する形態であれば、載置台の対象物を載置する領域(載置面)は、対象物を識別し易い色で構成される。例えば、載置台の載置面は、黒色である。
撮影部2は、対象物が載置される載置面を含む撮影領域の画像を撮影する。図1が示す例においては、撮影部2は、対象物が置かれる載置面を上方から撮影するように設置される。撮影部2は、載置面上に置ければ対象物を撮影できるものであれば良く、設置位置及び向きが特定の構成に限定されるものではない。例えば、撮影部2は、斜め上方から載置面を撮影するように設置されてもよい。
なお、画像認識装置10は、複数個の撮影部2を備えてもよい。この場合、複数の撮影部2は、それぞれ異なる位置及び角度で対象物を撮影するように設置されてもよい。
なお、画像認識装置10は、複数個の撮影部2を備えてもよい。この場合、複数の撮影部2は、それぞれ異なる位置及び角度で対象物を撮影するように設置されてもよい。
撮影部2は、CCDなどの撮像素子を有するカメラ又はスキャナなどの画像撮影装置である。また、撮影部2は、対象物を認識しうる画像情報を取得するものであれば良く、特定の構成に限定されるものではない。例えば、撮影部2は、不可視光を撮影するものであってもよい。例えば、撮影部2は、赤外線カメラであってもよい。
処理部3は、撮影部2が撮影した画像から対象物を認識する。例えば、処理部3は、プロセッサがプログラムを実行することにより処理を実行できる電子計算機などである。処理部3は、認識した対象物を示す情報(対象物の認識結果)を外部装置へ送信しても良い。処理部3は、対象物の認識結果を外部装置へ送信することにより外部の表示装置に対象物の認識結果を表示させてもよい。処理部3については、後に詳述する。
なお、画像認識装置10は、載置面上に置かれた対象物を照らすための照明などを備えてもよい。
また、撮影部2及び処理部3は、筐体1と一体的に形成されてもよい。
また、画像認識装置10は、必要に応じて、適宜他の構成を備え、又は、上記の構成を欠いてもよい。
なお、画像認識装置10は、載置面上に置かれた対象物を照らすための照明などを備えてもよい。
また、撮影部2及び処理部3は、筐体1と一体的に形成されてもよい。
また、画像認識装置10は、必要に応じて、適宜他の構成を備え、又は、上記の構成を欠いてもよい。
ここでは、画像認識装置10の撮影部2は、載置面上に置かれた対象物としての商品A及び商品Bを含む画像を撮影するものとする。
次に、画像認識装置10の構成例について説明する。
図2は、画像認識装置10の構成例を示すブロック図である。
図2に示すように、画像認識装置10は、撮影部2、及び、処理部3などを備える。処理部3は、プロセッサ(CPU)11、ROM12、RAM13、NVM14、表示部15、及び、インターフェース16などを備える。
図2は、画像認識装置10の構成例を示すブロック図である。
図2に示すように、画像認識装置10は、撮影部2、及び、処理部3などを備える。処理部3は、プロセッサ(CPU)11、ROM12、RAM13、NVM14、表示部15、及び、インターフェース16などを備える。
プロセッサ11は、集積回路などで構成される演算回路を含む。プロセッサ11は、画像認識装置10全体の制御及び各種の処理を実行する。プロセッサ11は、ROM12又はNVM14に記憶されているプログラム及び制御データに基づいて種々の処理を行う。例えば、プロセッサ11は、ROM12又はNVM14に記憶されているプログラムを実行することにより、画像認識装置10の動作制御あるいは画像認識装置10の運用形態に応じた種々の処理を行う。
なお、各種の機能のうちの一部は、ハードウエア回路により実現されるものであっても良い。この場合、プロセッサ11は、ハードウエア回路により実行される機能を制御する。
ROM12は、予め制御用のプログラム及び制御データなどを記憶する不揮発性のメモリである。ROM12は、制御プログラム及び制御データなどを記憶した状態で画像認識装置10に組み込まれる。
RAM13は、揮発性のメモリである。RAM13は、プロセッサ11の処理中のデータなどを一時的に格納する。RAM13は、プロセッサ11からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM13は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。
RAM13は、揮発性のメモリである。RAM13は、プロセッサ11の処理中のデータなどを一時的に格納する。RAM13は、プロセッサ11からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM13は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。
NVM14(記憶部)は、SSD、HDD又はフラッシュROMなどのデータの書き込み及び書換えが可能な不揮発性のメモリである。NVM14は、画像認識装置10の運用用途に応じた制御プログラム、アプリケーション、及び種々のデータを記憶する。例えば、NVM14は、プログラムファイル及びデータファイルなどの各ファイルに制御プログラム及び種々のデータなどが書き込まれる。
また、NVM14は、データベース14aを有する。データベース14aは、認識対象とする各対象物に対する認識処理用の辞書データを記憶する。例えば、データベース14aは、対象物に付与されるコード情報をデコードして得られる識別情報(例えば商品コード)を対象物ごとに記憶する。また、データベース14aは、オブジェクト認識用の画像情報を対象物ごとに記憶する。オブジェクト認識用の画像情報は、例えば、対象物の画像、対象物のエッジ(パッケージの模様などのエッジも含む)を示す情報、ある小領域単位での濃度勾配情報、又は、対象物の線の先端や交点などの特徴点とその周囲の情報(以下局所特徴量と記載)などである。また、データベース14aは、各対象物の面積情報を記憶する。対象物の面積情報は、特定の面の面積だけでなく、各面の面積を示す情報を記憶する。また、データベース14aは、対象物の重量を示す重さ情報などを記憶しても良い。
表示部15は、プロセッサ11の制御により種々の情報を表示する表示装置である。表示部15は、例えば、液晶表示装置である。
インターフェース16は、プロセッサ11が撮影部2と通信するためのインターフェースである。インターフェース16は、プロセッサ11からの画像を撮影させる制御信号を撮影部2に送信する。また、インターフェース16は、撮影部2が撮影した画像を取得する。即ち、プロセッサ11は、インターフェース16を通じて、撮影部2が撮影した画像を取得する。
インターフェース16は、プロセッサ11が撮影部2と通信するためのインターフェースである。インターフェース16は、プロセッサ11からの画像を撮影させる制御信号を撮影部2に送信する。また、インターフェース16は、撮影部2が撮影した画像を取得する。即ち、プロセッサ11は、インターフェース16を通じて、撮影部2が撮影した画像を取得する。
なお、処理部3は、さらに操作部など備えてもよい。また、処理部3は、必要に応じて、適宜他の構成を備え、又は、上記の構成を欠いてもよい。
次に、プロセッサ11が実現する機能について説明する。
まず、プロセッサ11は、対象物を含む画像を取得する機能を有する(画像取得部)。例えば、プロセッサ11は、インターフェース16を通じて画像を撮影させる制御信号を撮影部2に送信する。撮影部2は、当該制御信号に従って載置面を撮影する。撮影部2は、インターフェース16を通じて、撮影した画像をプロセッサ11へ送信する。プロセッサ11は、撮影部2から画像を取得する。
なお、プロセッサ11は、外部装置から対象物を含む画像を取得してもよい。
まず、プロセッサ11は、対象物を含む画像を取得する機能を有する(画像取得部)。例えば、プロセッサ11は、インターフェース16を通じて画像を撮影させる制御信号を撮影部2に送信する。撮影部2は、当該制御信号に従って載置面を撮影する。撮影部2は、インターフェース16を通じて、撮影した画像をプロセッサ11へ送信する。プロセッサ11は、撮影部2から画像を取得する。
なお、プロセッサ11は、外部装置から対象物を含む画像を取得してもよい。
また、プロセッサ11は、撮影部2が撮影した画像から対象物の画像(対象物領域)を抽出する機能を有する(抽出部)。例えば、プロセッサ11は、載置面の色(例えば、黒色)以外の領域を対象物領域として抽出する。
また、プロセッサ11は、撮影画像における各部の高さ(例えば、撮影画像における各部と筐体1の天井との距離)に基づいて対象物領域を抽出しても良い。撮影画像における各部の高さを検出する場合、画像認識装置10は、載置面及び載置面上の対象物の高さを測定する距離センサを備える。プロセッサ11は、距離センサから撮影画像における各部の高さを示す情報を取得する。撮影画像における各部の高さを示す情報を取得すると、プロセッサ11は、撮影画像において載置面よりも高い領域を対象物領域として抽出する。また、プロセッサ11は、異なる高さの面を異なる対象物領域として抽出してもよい。
なお、プロセッサ11が対象物領域を抽出する方法は、特定の方法に限定されるものではない。
なお、プロセッサ11が対象物領域を抽出する方法は、特定の方法に限定されるものではない。
また、プロセッサ11は、対象物領域にあるコード情報を検出し、検出したコード情報を認識することにより、コードに対応する対象物を認識する機能(コード認識機能)を有する(コード認識部)。例えば、プロセッサ11は、対象物領域から、対象物に付与されているコード情報の領域(コード領域)を抽出する。例えば、プロセッサ11は、対象物領域に対してパターンマッチングなどを用いるラスタスキャンを実行し、コード領域を抽出する。なお、プロセッサ11がコード領域を特定する方法は、特定の方法に限定されるものではない。
撮影画像からコード領域を抽出した後、プロセッサ11は、コード領域に含まれるコード情報をデコードする。コード情報をデコードすると、プロセッサ11は、デコード結果(商品コード)に対応する対象物をデータベース14aから検索する。プロセッサ11は、デコード結果に対応する対象物を対象物領域にある対象物として認識する。
また、プロセッサ11は、コード認識に失敗した対象物領域からオブジェクト認識で対象物を認識する機能を有する(オブジェクト認識部)。例えば、プロセッサ11は、コード領域の抽出に失敗した対象物領域、又は、コード領域から抽出したコード情報でのデコードに失敗した対象物領域に対してオブジェクト認識を行う。
すなわち、プロセッサ11は、撮影画像における対象物領域に対してオブジェクト認識を行う。オブジェクト認識において、プロセッサ11は、対象物領域の画像情報とデータベース14aに登録されている各対象物の画像情報とが一致するかを判定する。プロセッサ11は、対象物領域の画像情報と一致する画像情報がデータベース14aにあれば、対象物領域にある対象物は画像情報が一致した対象物であると認識する。
また、画像情報から得られるエッジによるオブジェクト認識を行う場合、プロセッサ11は、対象物領域の画像からエッジを抽出する。プロセッサ11は、対象物領域から抽出したエッジとデータベース14aに登録されている各対象物のエッジとが一致するかを判定する。対象物領域から抽出したエッジと一致するエッジがデータベース14aにあれば、プロセッサ11は、対象物領域にある対象物はエッジが一致した対象物であると認識する。
また、画像情報から得られる局所特徴量によるオブジェクト認識を行う場合、プロセッサ11は、対象物領域の画像から特徴点と局所特徴量とを抽出する。プロセッサ11は、対象物領域から抽出した特徴点及び局所特徴量とデータベース14aに登録されている各対象物の特徴点及び局所特徴量とが一致するかを判定する。対象物領域から抽出した特徴点及び局所特徴量と一致する特徴点及び局所特徴量がデータベース14aにあれば、プロセッサ11は、対象物領域にある対象物は特徴点及び局所特徴量が一致した対象物であると認識する。
なお、プロセッサ11がオブジェクト認識を行う方法は、特定の方法に限定されるものではない。また、プロセッサ11は、対象物領域をラスタスキャンし、上記のいずれかの判定を行ってもよい。
なお、プロセッサ11がオブジェクト認識を行う方法は、特定の方法に限定されるものではない。また、プロセッサ11は、対象物領域をラスタスキャンし、上記のいずれかの判定を行ってもよい。
次に、第1の実施形態に係る画像認識装置10の動作例について説明する。
図3は、第1の実施形態に係る画像認識装置10の動作例を説明するためのフローチャートである。
まず、画像認識装置10のプロセッサ11は、撮影部2を用いて載置面上の画像を撮影する。プロセッサ11は、撮影部2により撮影した撮影画像を取得する(ACT11)。撮影画像を取得すると、プロセッサ11は、取得した撮影画像から対象物領域を抽出する(ACT12)。
図3は、第1の実施形態に係る画像認識装置10の動作例を説明するためのフローチャートである。
まず、画像認識装置10のプロセッサ11は、撮影部2を用いて載置面上の画像を撮影する。プロセッサ11は、撮影部2により撮影した撮影画像を取得する(ACT11)。撮影画像を取得すると、プロセッサ11は、取得した撮影画像から対象物領域を抽出する(ACT12)。
対象物領域を抽出すると、プロセッサ11は、抽出した対象物領域においてコード認識を実行する(ACT13)。コード認識に失敗すると(ACT14、NO)、当該対象物領域においてオブジェクト認識を実行する(ACT15)。
コード認識に成功した場合(ACT14、YES)、又は、オブジェクト認識に成功した場合(ACT17、YES)、プロセッサ11は、ACT13又はACT15で認識した対象物を撮影画像の認識結果としてRAM13又はNVM14に記憶する(ACT17)。
コード認識に成功した場合(ACT14、YES)、又は、オブジェクト認識に成功した場合(ACT17、YES)、プロセッサ11は、ACT13又はACT15で認識した対象物を撮影画像の認識結果としてRAM13又はNVM14に記憶する(ACT17)。
オブジェクト認識に失敗した場合、プロセッサ11は、当該対象物領域に対する認識を失敗したと判定する(ACT18)。例えば、プロセッサ11は、当該対象物領域に対する認識に失敗したことを示す情報をRAM13又はNVM14などに記憶してもよい。
認識した対象物を示す情報を記憶した場合(ACT17)、又は、認識に失敗したと判定した場合(ACT18)、プロセッサ11は、取得した撮影画像に他に対象物領域があるか判定する(ACT19)。他に対象物領域があると判定すると(ACT19、YES)、プロセッサ11は、ACT13に戻り、他の対象物領域において同様の動作を行う。
他に対象物領域がないと判定すると(ACT19、NO)、プロセッサ11は、動作を終了する。
なお、プロセッサ11は、認識結果を表示部15などに表示してもよい。また、プロセッサ11は、認識に失敗した対象物領域を表示部15などに表示してもよい。また、プロセッサ11は、認識結果、及び/又は、認識に失敗した対象物領域を外部装置へ送信してもよい。
なお、対象物は、コードを備えないものであってもよい。また、画像情報は、対象物のいくつかの面(上面、側面又は底面など)についての情報を備えてもよい。
以上のように、第1の実施形態に係る画像認識装置は、撮影画像から抽出した対象物領域においてコード認識を実行する。また、画像認識装置は、コード認識に失敗した場合、コード認識に失敗した対象物領域に対してオブジェクト認識を実行する。即ち、第1の実施形態に係る画像認識装置は、先に比較的処理の軽い(処理時間が早い)コードの認識処理を行い、コードの認識処理で認識できなかった対象物領域において比較的処理の重い(処理時間がかかる)オブジェクト認識を行う。
第1の実施形態によれば、画像認識装置は、コード認識とオブジェクト認識とを効率良く実施できる。また、第1の実施形態によれば、画像認識装置は、処理時間がかかるオブジェクト認識を行う領域を少なくし、対象物の認識処理全体として処理時間を高速化できる。
(第2実施形態)
次に、第2実施形態について説明する。
第2実施形態に係る画像認識装置10は、対象物領域において複数回、認識処理(コード認識又はオブジェクト認識など)を行う点で、第1実施形態に係る画像認識装置10と異なる。また、第2の実施形態に係る画像認識装置10は、第1の実施形態で説明した図1及び図2に示すものと同様なハードウエア構成を有するものとする。
(第2実施形態)
次に、第2実施形態について説明する。
第2実施形態に係る画像認識装置10は、対象物領域において複数回、認識処理(コード認識又はオブジェクト認識など)を行う点で、第1実施形態に係る画像認識装置10と異なる。また、第2の実施形態に係る画像認識装置10は、第1の実施形態で説明した図1及び図2に示すものと同様なハードウエア構成を有するものとする。
ここで、第2の実施形態に係る画像認識装置10が実現する機能について説明する。
第2の実施形態に係る画像認識装置10のプロセッサ11は、対象物領域において認識処理を複数回実行する機能を有する(認識部)。例えば、プロセッサ11は、ある対象物領域において認識処理として、コード認識又はオブジェクト認識を行う。プロセッサ11は、当該対象物領域から1つの対象物を認識した後、さらに当該対象物領域において認識処理を行う。プロセッサ11は、当該対象物領域において、さらなる対象物を認識できなくなるまで、認識処理を繰り返す。
第2の実施形態に係る画像認識装置10のプロセッサ11は、対象物領域において認識処理を複数回実行する機能を有する(認識部)。例えば、プロセッサ11は、ある対象物領域において認識処理として、コード認識又はオブジェクト認識を行う。プロセッサ11は、当該対象物領域から1つの対象物を認識した後、さらに当該対象物領域において認識処理を行う。プロセッサ11は、当該対象物領域において、さらなる対象物を認識できなくなるまで、認識処理を繰り返す。
例えば、プロセッサ11は、オブジェクト認識による対象物の認識処理を以下のように実行する。ここでは、オブジェクト認識は、画像情報から得られるエッジ又は局所特徴量を用いた認識処理であるものとする。
まず、プロセッサ11は、対象物領域の画像においてエッジ又は局所特徴量を抽出する。プロセッサ11は、対象物領域から抽出したエッジ又は局所特徴量とデータベース14aに登録されている各対象物のエッジ又は局所特徴量とが一致するかを判定する。プロセッサ11は、エッジ又は局所特徴量が一致する対象物が検出できた場合、対象物領域における1つの対象物が、エッジ又は局所特徴量が一致した対象物であると認識(判断)する。
まず、プロセッサ11は、対象物領域の画像においてエッジ又は局所特徴量を抽出する。プロセッサ11は、対象物領域から抽出したエッジ又は局所特徴量とデータベース14aに登録されている各対象物のエッジ又は局所特徴量とが一致するかを判定する。プロセッサ11は、エッジ又は局所特徴量が一致する対象物が検出できた場合、対象物領域における1つの対象物が、エッジ又は局所特徴量が一致した対象物であると認識(判断)する。
1つの対象物が認識できた後、プロセッサ11は、上述の処理で一致すると判断したエッジ又は局所特徴量を対象物領域のエッジ又は局所特徴量から削除する。即ち、プロセッサ11は、次回以降の認識処理では認識が成功した対象物に関するエッジ又は局所特徴量以外のエッジ又は局所特徴量に基づいてオブジェクト認識を行う。
プロセッサ11は、対象物領域の残りのエッジ又は局所特徴量と、データベース14aにおける各対象物のエッジ又は局所特徴量とが一致するかを判定する。プロセッサ11は、エッジ又は局所特徴量が一致する対象物が検出できた場合、対象物領域における1つの対象物が、エッジ又は局所特徴量が一致した対象物であると認識(判断)する。
プロセッサ11は、一致するエッジ又は局所特徴量がなくなるまで、上記の動作を繰り返す。以上の処理により、画像認識装置10は、対象物領域における全ての対象物が認識できる。
次に、プロセッサ11のオブジェクト認識の具体例について説明する。
図4は、撮影画像から抽出された対象物領域20の例である。図4に示す例では、対象物領域20において商品Aと商品Bとが存在する。
図4は、撮影画像から抽出された対象物領域20の例である。図4に示す例では、対象物領域20において商品Aと商品Bとが存在する。
図5は、プロセッサ11のオブジェクト認識による処理例を説明するための図である。
ここで、プロセッサ11は、対象物領域20において図5に示すような特徴点(局所特徴)を抽出したものとする。図5に示す例では、対象物領域20内の円が特徴点を中心とし局所特徴量生成のために参照した範囲(以下図5に関わる説明では“特徴点”と記載)を示すものとする。プロセッサ11は、対象物領域20の特徴点とデータベース14aに登録されている対象物の特徴点とを比較する。ここでは、プロセッサ11は、対象物領域20において、データベース14aにおける商品Aの特徴点と一致する特徴点を対象物領域20から発見したものとする。この場合、プロセッサ11は、対象物領域20における1つの対象物として商品Aを認識する。
ここで、プロセッサ11は、対象物領域20において図5に示すような特徴点(局所特徴)を抽出したものとする。図5に示す例では、対象物領域20内の円が特徴点を中心とし局所特徴量生成のために参照した範囲(以下図5に関わる説明では“特徴点”と記載)を示すものとする。プロセッサ11は、対象物領域20の特徴点とデータベース14aに登録されている対象物の特徴点とを比較する。ここでは、プロセッサ11は、対象物領域20において、データベース14aにおける商品Aの特徴点と一致する特徴点を対象物領域20から発見したものとする。この場合、プロセッサ11は、対象物領域20における1つの対象物として商品Aを認識する。
商品Aが認識できた後、プロセッサ11は、対象物領域20から抽出した特徴点のうち商品Aの特徴点と一致した特徴点(即ち、商品Aの特徴点)及び局所特徴量を削除する。図5に示す例では、削除された特徴点は、破線の円で示すものとする。対象物領域20から抽出した特徴点から商品Aの特徴点を削除した後、プロセッサ11は、さらに、2回目のオブジェクト認識を実行する。図5が示すように、2回目のオブジェクト認識では、対象物領域20から抽出した特徴点のうち商品Aの特徴点及び局所特徴量が削除された状態で実施される。
プロセッサ11は、2回目のオブジェクト認識において、残りの特徴点とデータベース14aに登録されている各対象物の特徴点とを比較する。ここでは、プロセッサ11は、対象物領域20において、データベース14aに登録されている商品Bの特徴点と一致する特徴点を発見したものとする。この場合、プロセッサ11は、対象物領域20におけるもう1つの対象物として商品Bを認識する。
商品Bが認識できた後、プロセッサ11は、対象物領域20から抽出した特徴点のうち商品Bの特徴点と一致した特徴点(即ち、商品Bの特徴点)及び局所特徴量を削除する。対象物領域20から抽出した特徴点から商品Bの特徴点及び局所特徴量を削除した後、プロセッサ11は、さらに、3回目のオブジェクト認識を実行する。図5が示すように、3回目のオブジェクト認識では、商品Aの特徴点と商品Bの特徴点及び局所特徴量が削除された状態で実施される。
プロセッサ11は、3度目のオブジェクト認識において、残りの特徴点とデータベース14aに登録されている各対象物の特徴点とを比較する。ここでは、プロセッサ11は、残りの特徴点と一致する特徴点が発見されないものとする。一致する特徴点がないと判断した場合、プロセッサ11は、当該対象物領域20に対するオブジェクト認識の処理を終了する。
次に、第2の実施形態に係る画像認識装置10の動作例について説明する。
図6は、第2の実施形態に係る画像認識装置10の動作例を説明するためのフローチャートである。
まず、プロセッサ11は、撮影部2を用いて載置面上の画像を撮影する。プロセッサ11は、撮影部2から撮影画像を取得する(ACT21)。撮影画像を取得すると、プロセッサ11は、撮影画像から対象物領域を抽出する(ACT22)。対象物領域を抽出すると、プロセッサ11は、対象物領域から特徴点及び局所特徴量を抽出する(ACT23)。
図6は、第2の実施形態に係る画像認識装置10の動作例を説明するためのフローチャートである。
まず、プロセッサ11は、撮影部2を用いて載置面上の画像を撮影する。プロセッサ11は、撮影部2から撮影画像を取得する(ACT21)。撮影画像を取得すると、プロセッサ11は、撮影画像から対象物領域を抽出する(ACT22)。対象物領域を抽出すると、プロセッサ11は、対象物領域から特徴点及び局所特徴量を抽出する(ACT23)。
対象物領域から特徴点及び局所特徴量を抽出すると、プロセッサ11は、対象物領域においてオブジェクト認識を行う(ACT24)。認識に成功すると(ACT25、YES)、プロセッサ11は、認識した対象物を撮影画像の認識結果としてRAM13又はNVM14に格納する(ACT26)。
認識結果を格納すると、プロセッサ11は、対象物領域においてACT24で認識された対象物の特徴点及び局所特徴量を削除する(ACT27)。特徴点及び局所特徴量を削除すると、プロセッサ11は、ACT24に戻る。プロセッサ11は、残りの特徴点及び局所特徴量を用いてオブジェクト認識を行う。
認識に失敗すると(ACT25、NO)、プロセッサ11は、他に対象物領域があるか判定する(ACT28)。他に対象物領域があると判定すると(ACT28、YES)、プロセッサ11は、ACT23に戻り、他の対象物領域において同様の動作を行う。
他に対象物領域がないと判定すると(ACT28、NO)、プロセッサ11は、動作を終了する。
なお、プロセッサ11は、対象物領域において1つの対象物も認識できなかった場合、当該対象物領域では認識処理に失敗したことを示す情報をRAM13又はNVM14に格納してもよい。また、プロセッサ11は、当該対象物領域では認識処理に失敗したことを示す情報を外部装置へ送信してもよい。
また、プロセッサ11は、オブジェクト認識の代わりにコード認識を用いて対象物を特定してもよい。この場合、プロセッサ11は、ACT23及びACT27を実行しなくともよい。
以上のように、第2の実施形態に係る画像認識装置は、1つの対象物領域において複数回、対象物の認識処理を行う。第2の実施形態によれば、1つの対象物領域に複数個の対象物が存在する場合であっても、画像認識装置は、1つの対象物領域に存在する全ての対象物を認識することができる。例えば、複数の対象物が対象物領域として切り分け難い状態で載置面上に配置されている場合であっても、画像認識装置は、全ての対象物をそれぞれ認識することができる。
また、第2の実施形態に係る画像認識装置は、認識できた対象物の特徴点及び局所特徴量を削除して次の認識処理を実行する。これにより、商品などの対象領域の切り出し処理の結果、1つの対象領域に複数の商品が存在していても、検出漏れなく認識することができる。
(第3実施形態)
次に、第3実施形態について説明する。
第3実施形態に係る画像認識装置10は、対象物領域の面積と認識した対象物の面積とを比較する点で、第2実施形態に係る画像認識装置10と異なる。また、第3の実施形態に係る画像認識装置10は、第1の実施形態で説明した図1及び図2に示すものと同様なハードウエア構成を有するものとする。ただし、第3実施形態に係る画像認識装置10は、データベース14aに、各対象物の面積を示す面積情報を記憶するものとする。例えば、面積情報は、ミリメートル又はインチなどで面積を示してもよいし、撮影画像における画素数で面積を示してもよい。また、データベース14aは、面積情報として、各対象物について各面(例えば、上面、底面又は側面など)の面積を記憶するものとする。
(第3実施形態)
次に、第3実施形態について説明する。
第3実施形態に係る画像認識装置10は、対象物領域の面積と認識した対象物の面積とを比較する点で、第2実施形態に係る画像認識装置10と異なる。また、第3の実施形態に係る画像認識装置10は、第1の実施形態で説明した図1及び図2に示すものと同様なハードウエア構成を有するものとする。ただし、第3実施形態に係る画像認識装置10は、データベース14aに、各対象物の面積を示す面積情報を記憶するものとする。例えば、面積情報は、ミリメートル又はインチなどで面積を示してもよいし、撮影画像における画素数で面積を示してもよい。また、データベース14aは、面積情報として、各対象物について各面(例えば、上面、底面又は側面など)の面積を記憶するものとする。
次に、第3実施形態に係る画像認識装置10のプロセッサ11が実現する機能について説明する。
プロセッサ11は、対象物領域全体の面積を取得する機能を有する(面積取得部)。例えば、プロセッサ11は、対象物領域全体の画素数を対象物領域全体の面積として取得する。
プロセッサ11は、対象物領域全体の面積を取得する機能を有する(面積取得部)。例えば、プロセッサ11は、対象物領域全体の画素数を対象物領域全体の面積として取得する。
また、プロセッサ11は、対象物領域において認識できた全ての対象物の総面積(認識処理済みの面積)を取得する機能を有する。例えば、プロセッサ11は、データベース14aに登録されている面積情報を参照し、認識できた対象物の面積を取得する。なお、プロセッサ11は、対象物領域にある対象物の面(対象物の被撮影面)を認識し、対象物の被撮影面の面積をデータベース14aから取得してもよい。この場合、データベース14aは、各対象物について、各面の面積を示す情報が登録される。
プロセッサ11は、対象物領域において認識できた対象物が1つである場合、認識できた対象物の面積を認識処理済みの面積として取得する。また、プロセッサ11は、対象物領域において複数個の対象物が認識できた場合、認識した各対象物の面積を合計した面積を認識処理済みの面積として算出する。
また、プロセッサ11は、対象物領域全体の面積と認識処理済みの面積とを比較する機能を有する。例えば、プロセッサ11は、対象物領域全体の面積が認識処理済みの面積よりも大きいことを判定する。プロセッサ11は、対象物領域全体の面積が認識処理済みの面積よりも大きい場合、対象物領域に未認識の対象物が存在する可能性が高いと判定する。従って、対象物領域全体の面積が認識処理済みの面積よりも大きい場合、プロセッサ11は、認識処理を再度実行する。
また、プロセッサ11は、対象物領域全体の面積が認識処理済みの面積よりも小さいことを判定する。プロセッサ11は、対象物領域全体の面積が認識処理済みの面積よりも小さい場合、対象物領域に対する認識処理結果に誤認識が含まれる可能性が高いと判定する。例えば、対象物領域全体の面積が認識処理済みの面積よりも小さい場合、対象物領域にある対象物と異なる対象物を認識した場合、又は、対象物領域に存在しない対象物を認識した場合が想定される。従って、対象物領域全体の面積が認識処理済みの面積よりも小さい場合、プロセッサ11は、対象物領域の認識処理に失敗したと判定する。
また、プロセッサ11は、対象物領域全体の面積と認識処理済みの面積とが一致するかを判定する。ここで、プロセッサ11は、対象物領域の面積と認識面積との差が所定の閾値以下である場合に、対象物領域の面積と認識面積とが一致すると判定してもよい。プロセッサ11は、対象物領域全体の面積と認識処理済みの面積とが一致する場合、対象物領域において認識処理を完了したと判定する。従って、対象物領域全体の面積と認識処理済みの面積とが一致する場合、プロセッサ11は、対象物領域に対する認識処理を終了する。
次に、第3の実施形態に係る画像認識装置10の動作例について説明する。
図7は、第3の実施形態に係る画像認識装置10の動作例を説明するためのフローチャートである。
まず、第3の実施形態に係る画像認識装置10のプロセッサ11は、撮影部2を用いて載置面上の画像を撮影する。プロセッサ11は、撮影部2から撮影画像を取得する(ACT31)。撮影画像を取得すると、プロセッサ11は、撮影画像から対象物領域を抽出する(ACT32)。対象物領域を抽出すると、プロセッサ11は、対象物領域から特徴点及び局所特徴量を抽出する(ACT33)。特徴点及び局所特徴量を抽出すると、プロセッサ11は、対象物領域全体の面積を取得する(ACT34)
対象物領域全体の面積を取得すると、プロセッサ11は、対象物領域においてオブジェクト認識を実行する(ACT35)。1つの対象物の認識に成功すると(ACT36、YES)、プロセッサ11は、認識できた対象物の面積(認識処理済み面積)を算出する(ACT37)。認識処理済みの面積を算出すると、プロセッサ11は、対象物領域全体の面積と認識処理済みの面積とが一致するかを判定する(ACT38)。ここでは、プロセッサ11は、対象物領域全体の面積と認識処理済みの面積との差分が所定の閾値未満であるかにより一致するかを判定して良い。
図7は、第3の実施形態に係る画像認識装置10の動作例を説明するためのフローチャートである。
まず、第3の実施形態に係る画像認識装置10のプロセッサ11は、撮影部2を用いて載置面上の画像を撮影する。プロセッサ11は、撮影部2から撮影画像を取得する(ACT31)。撮影画像を取得すると、プロセッサ11は、撮影画像から対象物領域を抽出する(ACT32)。対象物領域を抽出すると、プロセッサ11は、対象物領域から特徴点及び局所特徴量を抽出する(ACT33)。特徴点及び局所特徴量を抽出すると、プロセッサ11は、対象物領域全体の面積を取得する(ACT34)
対象物領域全体の面積を取得すると、プロセッサ11は、対象物領域においてオブジェクト認識を実行する(ACT35)。1つの対象物の認識に成功すると(ACT36、YES)、プロセッサ11は、認識できた対象物の面積(認識処理済み面積)を算出する(ACT37)。認識処理済みの面積を算出すると、プロセッサ11は、対象物領域全体の面積と認識処理済みの面積とが一致するかを判定する(ACT38)。ここでは、プロセッサ11は、対象物領域全体の面積と認識処理済みの面積との差分が所定の閾値未満であるかにより一致するかを判定して良い。
対象物領域全体の面積と認識処理済みの面積とが一致しないと判定すると(ACT38、NO)、プロセッサ11は、対象物領域全体の面積が認識処理済みの面積よりも大きいか判定する(ACT39)。対象物領域全体の面積が認識処理済みの面積よりも大きいと判定すると(ACT39、YES)、プロセッサ11は、対象物領域から抽出した特徴点及び局所特徴量から認識できた対象物(認識処理済みの対象物)の特徴点及び局所特徴量を削除する(ACT40)。認識できた対象物の特徴点及び局所特徴量を削除すると、プロセッサ11は、ACT35に戻る。
対象物領域全体の面積と認識処理済みの面積とが一致したと判定すると(ACT38、YES)、プロセッサ11は、認識できた各対象物を撮影画像に対する認識結果としてRAM13又はNVM14に格納する(ACT41)。
認識結果を格納すると、プロセッサ11は、撮影画像において他に対象物領域があるか判定する(ACT42)。他に対象物領域があると判定すると(ACT42、YES)、プロセッサ11は、ACT33に戻り、他の対象物領域において同様の動作を行う。他に対象物領域がないと判定すると(ACT42、NO)、プロセッサ11は、動作を終了する。
対象物の認識に失敗した場合(ACT36、YES)、又は、対象物領域全体の面積が認識処理済みの面積よりも小さいと判定した場合(ACT39、NO)、プロセッサ11は、対象物領域に対する認識処理に失敗したと判定する(ACT43)。例えば、プロセッサ11は、当該対象物領域に対する認識に失敗したことを示す情報をRAM13又はNVM14などに格納してもよい。
対象物領域に対する認識処理に失敗したと判定すると、プロセッサ11は、ACT42へ進む。
なお、プロセッサ11は、対象物領域全体の面積を取得した後に対象物領域から特徴点及び局所特徴量を抽出してもよい。
また、プロセッサ11は、オブジェクト認識の代わりにコード認識を用いて対象物を特定してもよい。この場合、プロセッサ11は、ACT33及びACT40を実行しなくともよい。
また、プロセッサ11は、オブジェクト認識の代わりにコード認識を用いて対象物を特定してもよい。この場合、プロセッサ11は、ACT33及びACT40を実行しなくともよい。
以上のように、第3の実施形態に係る画像認識装置は、対象物領域において認識できた対象物の面積(認識処理済みの面積)と対象物領域全体の面積とを比較することにより、対象物領域にある全ての対象物を認識し終えたかを判定する。第3の実施形態によれば、画像認識装置は、認識処理済みの面積が対象物領域全体の面積と一致する場合に対象物領域に対する認識処理が終了したと判断する。第3の実施形態によれば、画像認識装置は、面積比較によって認識処理の終了を判断できるため、対象物の認識を終えたことを認識するための認識処理を行う必要がなく、認識処理の負担を軽減することができる。
また、第3の実施形態に係る画像認識装置は、対象物領域全体の面積が認識処理済みの面積よりも小さい場合には、誤認識があるのと判定する。第3の実施形態によれば、対象物領域全体の面積と認識処理済みの面積との比較によって、誤認識を検出することができる。
なお、上述の第3の実施形態では、面積比較により認識処理の終了を判定するものとしたが、変形例として、画像認識装置は、重さの比較により認識処理の終了を判定するようにしても良い。重さ比較は、載置面(被撮影面)上の全対象物の重量を計測する重さセンサを設け、データベース14aに各対象物の重量を示す重さ情報を登録しておくことにより実現できる。
例えば、画像認識装置は、重さセンサで計測する載置面上の全対象物の重量と撮影画像から得られる全ての対象物領域から認識された全対象物の総重量とを比較する。画像認識装置は、載置面上の全対象物の重量と認識された全対象物の総重量とが一致すれば、撮影画像全体に対する各対象物の認識が正常に終了したものと判断できる。また、画像認識装置は、載置面上の全対象物の重量が認識された全対象物の総重量によりも小さければ、誤認識が含まれる可能性が高いと判断することも可能となる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1…筐体、2…撮影部、3…処理部、10…画像認識装置、11…プロセッサ、12…ROM、13…RAM、14…NVM、14a…データベース、15…表示部、16…インターフェース、20…対象物領域。
Claims (5)
- 対象物を認識する画像認識装置であって、
対象物に付与されるコード情報から得られる識別情報と、オブジェクト認識に用いる対象物の画像情報とを認識対象とする対象物ごとに記憶するメモリと、
撮影された画像を取得するインターフェースと、
前記画像から対象物がある対象物領域を抽出し、
前記対象物領域において対象物に付与されているコード情報を抽出し、抽出したコード情報から前記識別情報を認識し、
コード情報に基づく対象物の認識に失敗した場合、前記対象物領域の画像と前記メモリに記憶された各対象物の画像情報とにより対象物を認識するように制御するプロセッサと、
を備える画像認識装置。 - 対象物を認識する画像認識装置であって、
オブジェクト認識に用いる対象物の画像情報を認識対象とする対象物ごとに記憶するメモリと、
撮影された画像を取得するインターフェースと、
前記撮影された画像から少なくても1つの対象物が存在する対象物領域を抽出し、
前記対象物領域において個々の対象物を認識するための認識処理を複数回実行するように制御するプロセッサと、
を備える画像認識装置。 - 前記メモリは、オブジェクト認識に用いる対象物の画像情報として対象物の特徴点及び局所特徴量を記憶し、
前記プロセッサは、
前記対象物領域から特徴点及び局所特徴量を抽出し、前記対象物領域から抽出した特徴点及び局所特徴量と前記メモリが記憶する各対象物の特徴点及び局所特徴量とに基づいて少なくとも1つの対象物を認識し、
少なくても1つの対象物が認識できた場合、次回以降の認識処理では認識できた対象物の特徴点及び局所特徴量以外の特徴点及び局所特徴量に基づいて対象物を認識する認識処理を実行する、
前記請求項2に記載の画像認識装置。 - 前記メモリは、対象物の面積情報を認識対象とする対象物ごとに記憶し、
前記プロセッサは、認識できた対象物の面積を前記メモリから取得し、前記対象物領域において認識できた全ての対象物の総面積と前記対象物領域全体の面積とが一致した場合に、前記対象物領域に対する認識処理を終了する、
前記請求項2又は3に記載の画像認識装置。 - 前記プロセッサは、前記対象物領域全体の面積が前記対象物領域において認識できた全ての対象物の総面積よりも小さい場合、前記対象物領域に対する認識処理に失敗したと判定する、
前記請求項4に記載の画像認識装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/989,200 US9818038B2 (en) | 2016-01-06 | 2016-01-06 | Image recognition apparatus |
US14/989,200 | 2016-01-06 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020194190A Division JP7102490B2 (ja) | 2016-01-06 | 2020-11-24 | 画像認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017123163A true JP2017123163A (ja) | 2017-07-13 |
Family
ID=59235675
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016248418A Pending JP2017123163A (ja) | 2016-01-06 | 2016-12-21 | 画像認識装置 |
JP2020194190A Active JP7102490B2 (ja) | 2016-01-06 | 2020-11-24 | 画像認識装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020194190A Active JP7102490B2 (ja) | 2016-01-06 | 2020-11-24 | 画像認識装置 |
Country Status (3)
Country | Link |
---|---|
US (2) | US9818038B2 (ja) |
JP (2) | JP2017123163A (ja) |
CN (1) | CN106951904B (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018129038A (ja) * | 2017-02-06 | 2018-08-16 | 東芝テック株式会社 | 物品認識装置及び物品認識方法 |
JP2019021100A (ja) * | 2017-07-19 | 2019-02-07 | 東芝テック株式会社 | 画像探索装置、商品認識装置および画像探索プログラム |
JP2019128826A (ja) * | 2018-01-25 | 2019-08-01 | 東芝テック株式会社 | 物品認識装置及び商品決済装置 |
JP2019197316A (ja) * | 2018-05-08 | 2019-11-14 | 東芝テック株式会社 | 物品認識装置 |
JP2020083584A (ja) * | 2018-11-29 | 2020-06-04 | 株式会社東芝 | 荷降ろし装置、荷降ろし方法及びプログラム |
JP2022106808A (ja) * | 2018-05-08 | 2022-07-20 | 東芝テック株式会社 | 物品認識装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102255351B1 (ko) * | 2014-09-11 | 2021-05-24 | 삼성전자주식회사 | 홍채 인식 방법 및 장치 |
CN109697801A (zh) * | 2017-10-23 | 2019-04-30 | 北京京东尚科信息技术有限公司 | 自助结算设备、方法、装置、介质及电子设备 |
CN108229946A (zh) * | 2018-02-08 | 2018-06-29 | 中山简单点网络技术有限公司 | 一种无人销售结算系统及系统识别商品的方法 |
CN113591594A (zh) * | 2021-07-06 | 2021-11-02 | 盒马(中国)有限公司 | 称重处理方法、装置及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014167749A (ja) * | 2013-02-28 | 2014-09-11 | Toshiba Tec Corp | 商品情報表示装置及びコンピュータプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100951890B1 (ko) * | 2008-01-25 | 2010-04-12 | 성균관대학교산학협력단 | 상황 모니터링을 적용한 실시간 물체 인식 및 자세 추정 방법 |
US8494909B2 (en) * | 2009-02-09 | 2013-07-23 | Datalogic ADC, Inc. | Automatic learning in a merchandise checkout system with visual recognition |
KR101293776B1 (ko) * | 2010-09-03 | 2013-08-06 | 주식회사 팬택 | 객체 리스트를 이용한 증강 현실 제공 장치 및 방법 |
JP5675233B2 (ja) * | 2010-09-09 | 2015-02-25 | キヤノン株式会社 | 情報処理装置、その認識方法及びプログラム |
JP5668932B2 (ja) * | 2011-05-23 | 2015-02-12 | 株式会社モルフォ | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP5431429B2 (ja) | 2011-09-06 | 2014-03-05 | 東芝テック株式会社 | 情報処理装置及びプログラム |
US9424480B2 (en) * | 2012-04-20 | 2016-08-23 | Datalogic ADC, Inc. | Object identification using optical code reading and object recognition |
JP5666538B2 (ja) * | 2012-11-09 | 2015-02-12 | 富士重工業株式会社 | 車外環境認識装置 |
CN103116771A (zh) * | 2013-02-20 | 2013-05-22 | 吴凡 | 一种基于条形码的目标识别方法及应用系统 |
JP6179592B2 (ja) * | 2013-05-31 | 2017-08-16 | 日本電気株式会社 | 画像認識装置、その処理方法、およびプログラム |
JP2016001464A (ja) * | 2014-05-19 | 2016-01-07 | 株式会社リコー | 処理装置、処理システム、処理プログラム、及び、処理方法 |
JP6501501B2 (ja) * | 2014-11-12 | 2019-04-17 | キヤノン株式会社 | 情報処理装置、情報処理方法、情報処理システム及びプログラム |
JP6341124B2 (ja) | 2015-03-16 | 2018-06-13 | カシオ計算機株式会社 | オブジェクト認識装置および認識結果提示方法 |
US9747512B2 (en) | 2015-06-25 | 2017-08-29 | Toshiba Tec Kabushiki Kaisha | Article recognition apparatus and image processing method for article recognition apparatus |
-
2016
- 2016-01-06 US US14/989,200 patent/US9818038B2/en active Active
- 2016-11-24 CN CN201611051933.9A patent/CN106951904B/zh active Active
- 2016-12-21 JP JP2016248418A patent/JP2017123163A/ja active Pending
-
2017
- 2017-10-12 US US15/782,147 patent/US10095943B2/en active Active
-
2020
- 2020-11-24 JP JP2020194190A patent/JP7102490B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014167749A (ja) * | 2013-02-28 | 2014-09-11 | Toshiba Tec Corp | 商品情報表示装置及びコンピュータプログラム |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018129038A (ja) * | 2017-02-06 | 2018-08-16 | 東芝テック株式会社 | 物品認識装置及び物品認識方法 |
JP6999404B2 (ja) | 2017-02-06 | 2022-01-18 | 東芝テック株式会社 | 物品認識装置及び物品認識方法 |
JP2019021100A (ja) * | 2017-07-19 | 2019-02-07 | 東芝テック株式会社 | 画像探索装置、商品認識装置および画像探索プログラム |
JP2019128826A (ja) * | 2018-01-25 | 2019-08-01 | 東芝テック株式会社 | 物品認識装置及び商品決済装置 |
JP2019197316A (ja) * | 2018-05-08 | 2019-11-14 | 東芝テック株式会社 | 物品認識装置 |
JP7062507B2 (ja) | 2018-05-08 | 2022-05-16 | 東芝テック株式会社 | 物品認識装置 |
JP2022106808A (ja) * | 2018-05-08 | 2022-07-20 | 東芝テック株式会社 | 物品認識装置 |
JP7274644B2 (ja) | 2018-05-08 | 2023-05-16 | 東芝テック株式会社 | 物品認識装置 |
JP2020083584A (ja) * | 2018-11-29 | 2020-06-04 | 株式会社東芝 | 荷降ろし装置、荷降ろし方法及びプログラム |
WO2020110998A1 (ja) * | 2018-11-29 | 2020-06-04 | 株式会社 東芝 | 荷降ろし装置、荷降ろし方法及びプログラム |
US12103793B2 (en) | 2018-11-29 | 2024-10-01 | Kabushiki Kaisha Toshiba | Unloading apparatus, unloading method, and program |
Also Published As
Publication number | Publication date |
---|---|
CN106951904A (zh) | 2017-07-14 |
JP2021057054A (ja) | 2021-04-08 |
US20170193319A1 (en) | 2017-07-06 |
US9818038B2 (en) | 2017-11-14 |
CN106951904B (zh) | 2021-01-26 |
US10095943B2 (en) | 2018-10-09 |
US20180032833A1 (en) | 2018-02-01 |
JP7102490B2 (ja) | 2022-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7102490B2 (ja) | 画像認識装置 | |
US9747512B2 (en) | Article recognition apparatus and image processing method for article recognition apparatus | |
JP6143111B2 (ja) | 物体識別装置、物体識別方法、及びプログラム | |
JP2018156674A (ja) | 画像認識装置及び商品情報処理装置 | |
JP6344389B2 (ja) | 光学文字認識装置 | |
JP2017014014A (ja) | 画像処理装置 | |
US20180150699A1 (en) | Object recognition device | |
US10679094B2 (en) | Automatic ruler detection | |
US20150146991A1 (en) | Image processing apparatus and image processing method of identifying object in image | |
JP6630341B2 (ja) | シンボルの光学的検出方法 | |
JP2018133071A (ja) | 物品認識装置、決済装置および物品認識方法 | |
US10395090B2 (en) | Symbol detection for desired image reconstruction | |
US8977009B2 (en) | Biometric authentication device, biometric authentication program, and biometric authentication method | |
US20190073880A1 (en) | Article recognition apparatus, article recognition method, and non-transitory readable storage medium | |
JP6772059B2 (ja) | 電子制御装置、電子制御システムおよび電子制御方法 | |
JP2018067306A (ja) | 画像処理装置及び画像処理方法 | |
JP7131118B2 (ja) | 認証装置、認証プログラム、認証方法 | |
JP2018169943A5 (ja) | ||
CN110766671A (zh) | 一种基于机器视觉软件的图像处理方法 | |
US10963726B2 (en) | Article recognition device | |
US10977512B2 (en) | Article recognition device | |
JP2019204233A (ja) | 物品認識装置 | |
JP7035357B2 (ja) | 画像判定用コンピュータプログラム、画像判定装置及び画像判定方法 | |
JP2022106808A (ja) | 物品認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200929 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210323 |