JP2016126515A - オブジェクト認識スキャナシステム - Google Patents

オブジェクト認識スキャナシステム Download PDF

Info

Publication number
JP2016126515A
JP2016126515A JP2014266702A JP2014266702A JP2016126515A JP 2016126515 A JP2016126515 A JP 2016126515A JP 2014266702 A JP2014266702 A JP 2014266702A JP 2014266702 A JP2014266702 A JP 2014266702A JP 2016126515 A JP2016126515 A JP 2016126515A
Authority
JP
Japan
Prior art keywords
dimensional
recognition
image
image signal
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014266702A
Other languages
English (en)
Inventor
内田 秀樹
Hideki Uchida
秀樹 内田
隆春 藤井
Takaharu Fujii
隆春 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Optec Co Ltd
Original Assignee
Kyocera Optec Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Optec Co Ltd filed Critical Kyocera Optec Co Ltd
Priority to JP2014266702A priority Critical patent/JP2016126515A/ja
Publication of JP2016126515A publication Critical patent/JP2016126515A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Cash Registers Or Receiving Machines (AREA)
  • Image Input (AREA)

Abstract

【課題】被写体を3次元的に認識でき、被写体の認識精度を向上させたオブジェクト認識スキャナシステムを提供する。【解決手段】光学的伝達関数(OTF)を変調させる光波面変調素子360を含む深度拡張光学系330、この光学系を通過した被写体像600を撮像する撮像素子340及び撮像素子からの被写体分散画像信号より分散のない2次元画像信号を生成する変換部350を少なくとも有する撮像装置310が2個以上組み込まれた画像取得手段と、各撮像装置から取得した2次元画像信号を用いて被写体像600の3次元画像信号を生成する3次元画像生成手段とを備える。【選択図】図4

Description

本発明は、POS端末として好適に用いられるオブジェクト認識スキャナシステムに関する。
スーパーマーケットなどの商品販売の現場では、POS(Point Of Sale)端末が広く導入されている。
従来のPOSシステムの端末は、バーコードスキャナを備え、商品に付されたバーコードをスキャンし、商品コードを取得して、この取得した商品コードで商品情報ファイルを検索し、商品名や販売価格などの商品情報を取得する。
もともと、1次元バーコードを読み取るところから始まったPOSシステムの端末は、その後、2次元バーコードも読み取れる端末へと進歩してきた。
更に近年では、バーコードがついてない野菜や果物、或いはお惣菜等の商品の外観を表した2次元画像信号から抽出した2次元特徴量(外観形状、色合い、模様、凹凸具合等の表面情報をパラメータで表したもの)と、辞書データに登録された基準商品(認識対象物)の特徴量と照合することによって、その商品が複数の基準商品のいずれかに属するかを判定するオブジェクト認識スキャナシステムが知られている(特許文献1)。この従来のオブジェクト認識スキャナシステムにおいて、2次元画像信号は、通常、オブジェクト認識スキャナから50mm〜500mm程度離れたところにある商品を、1個の撮像装置により生成されている。
しかしながら、従来のオブジェクト認識スキャナシステムでは、辞書データにピントが合った状態の基準商品の特徴量のデータが登録されている場合、この辞書データに登録された基準商品の特徴量と、ピント位置からずれた位置にある商品を撮像して得られた2次元画像信号から抽出した2次元特徴量とを照合する際、認識精度が低いという問題があった。
そこで、ピントが合った状態の商品の2次元画像信号を生成するために、撮像装置にオートフォーカス機能を持たせることが考えられる。しかし、そもそも、奥行き方向にある程度の幅があるものでは、手前側にはピントが合っているものの奥側はピントが合わないため、さほど認識レベルの向上は見られない。さらに、レンズの特性として近くにあるものの方がピント範囲が狭いため、距離により、商品を撮像して得られた2次元画像信号から抽出した2次元特徴量と、辞書データに登録された基準商品の特徴量とのマッチングが良くないといった現象があった。
一方、オブジェクトを取り込む光学系に、光学的伝達関数(OTF)を変調させる光波面変調素子を組み込み、それを変換係数演算手段から得られた変換係数によって、画像信号の変換を行うことにより、被写界深度を拡張する撮像装置が知られている(特許文献2)。
この被写界深度を拡張する撮像装置を上述した従来のオブジェクト認識スキャナシステムに適用すれば、被写界深度が深い(ピントが合った状態の商品の)2次元画像信号を生成することができる。
しかしながら、2次元画像信号では、生成された2次元画像信号に表された商品の大きさは、商品と撮像素子との距離に起因するものなのか、商品自体の大きさに起因するものなのか解らないため、2次元画像信号に表された商品の大きさによって区別できない問題がある。そのため、同じ商品でも大きさの違いでコストが変わってくるような商品を、商品の大きさによって区別できなかった。
すなわち、従来技術では、被写界深度が深い2次元画像信号を生成し、この2次元画像信号から2次元的な情報までしか抽出できないことから、形状・色合い等の商品の2次元特徴量による判断でしか商品を認識できず、商品の認識精度が低いという問題があった。
特開2014−32539号公報 特許第4663737号
本発明の課題は、被写体を3次元的に認識でき、被写体の認識精度を向上させたオブジェクト認識スキャナシステムを提供することを目的とする。
本発明者らは、上記課題を解決すべく鋭意検討を重ねた結果、本発明を完成するに至った。すなわち、本発明は、以下のような構成を有する。
(1)光学的伝達関数(OTF)を変調させる光波面変調素子を含む光学系、この光学系を通過した被写体像を撮像する撮像素子、および前記撮像素子からの被写体分散画像信号より分散のない2次元画像信号を生成する変換部を少なくとも有する撮像装置が2個以上組み込まれた画像取得手段と、各撮像装置から取得した2次元画像信号を用いて前記被写体像の3次元画像信号を生成する3次元画像生成手段とを備えることを特徴とするオブジェクト認識スキャナシステム。
(2)前記画像取得手段は、前記撮像装置を2個有し、前記3次元画像生成手段は、各撮像装置から取得した2次元画像信号を用いてステレオ画像処理をし、前記被写体像の3次元画像信号を生成する前記(1)に記載のオブジェクト認識スキャナシステム。
(3)前記3次元画像生成手段により生成された3次元画像信号に基づくデータを、認識対象物毎にその認識対象物の3次元構造情報を表わす3次元モデルデータが保存された3次元構造認識辞書ファイルの前記3次元モデルデータと照合させることにより、前記被写体像がいずれの認識対象物に属するか判定する判定手段を備える前記(1)または(2)に記載のオブジェクト認識スキャナシステム。
(4)前記被写体像が認識コードであり、前記3次元画像生成手段により生成された3次元画像信号に基づいて、前記認識コードの2次元外形を復元した認識コード復元画像信号を生成する復元手段と、前記復元手段により復元された認識コード復元画像信号から読み取られたデータを、認識対象物毎にその認識対象物の識別情報を表す識別情報データが保存された識別情報辞書ファイルの前記識別情報データと照合させることにより、前記被写体像がいずれの認識対象物に属するか判定する判定手段と、を備える前記(1)または(2)に記載のオブジェクト認識スキャナシステム。
(5)前記認識コードは、1次元バーコードまたは2次元バーコードである前記(4)に記載のオブジェクト認識スキャナシステム。
本発明によれば、被写体を3次元的に認識でき、被写体の認識精度を向上させることができる。そのため、例えば、同じ商品でも大きさ違いでコストが変わってくるような商品において、今までは商品までの距離による写った画像の大きさが異なるのか、商品の大きさによって異なっているのかが解らなかったものが、判別できるようになる。
本発明の一実施形態に係るオブジェクト認識スキャナシステムにおけるスキャナ装置とPOS端末とのハードウェア構成を示すブロック図である。 本発明の一実施形態に係るオブジェクト認識スキャナシステムの機能を説明するためのブロック図である。 本発明の一実施形態における撮像装置の構成を示す概略説明図である。 本発明の一実施形態における画像取得手段を示す外観斜視図である。 本発明の一実施形態における3次元構造認識辞書ファイルに保存された認識対象物の3次元構造情報を表わす3次元モデルデータの構造を示す模式図である。 本発明の一実施形態に係るオブジェクト認識スキャナシステムのCPUが実行する情報処理手順の要部を示す流れ図である。 図7のステップST6で示す認識処理の具体的な手順を示す流れ図である。 本発明の他の実施形態に係るオブジェクト認識スキャナシステムの機能を説明するためのブロック図である。 本発明の他の実施形態に係るオブジェクト認識スキャナシステムのCPUが実行する情報処理手順の要部を示す流れ図である。 図9のステップST5で示すステレオ画像処理およびステップST8で示す復元処理を示す流れ図である。 図9のステップST6aで示す認識処理の具体的な手順を示す流れ図である。
〔本発明の一実施形態〕
以下、本発明の一実施形態であるオブジェクト認識スキャナシステムについて図面を参照して詳細に説明する。
オブジェクト認識スキャナシステムは、被写体(顧客が買い上げる商品、以下、単に商品という場合もある)を3次元的に認識し、その商品がいずれかの認識対象物(基準商品)に属するか判定するシステムである。すなわち、商品から被写界深度が深い2次元画像信号を複数生成し、これらの2次元画像信号を用いて3次元画像信号を生成し、この3次元画像信号に基づくデータを3次元構造認識辞書ファイルの3次元モデルデータと照合することにより、商品がいずれかの基準商品に属するか判定するシステムである。
このようにオブジェクト認識スキャナシステムでは、被写界深度が深い2次元画像信号を用いて3次元画像信号を生成するので、商品の大きさや傷の深さなどの3次元的(立体的)な情報を得ることができる。さらに、3次元画像信号に基づくデータを3次元構造認識辞書ファイルの3次元モデルデータと照合することにより、商品がいずれかの基準商品に属するか判定するので、2次元画像信号から抽出した2次元的な情報(外観特徴量)のみを用いて、その商品が複数の基準商品のいずれかに属するかを判定する従来のPOSシステムの端末を用いる場合よりも、商品と基準商品とのマッチング精度が高い。そのため、例えば、同じ商品でも大きさの違いでコストが変わってくるような商品を、商品の大きさによって区別することができる。
オブジェクト認識スキャナシステムは、図1に示すように、顧客が買い上げる商品を登録する登録部としてのスキャナ装置10と、顧客の代金支払いを処理する決済部としてのPOS端末20とを含む。POS端末20は、通常、レジ台の上にドロワ30を介して設置される。スキャナ装置10とPOS端末20とは、図示しない通信ケーブルによって電気的に接続される。
スキャナ装置10は、キーボード11、タッチパネル12、客用ディスプレイ13および後述する画像取得手段300を備える。
POS端末20は、決済に必要なデバイスとしてキーボード21、オペレータ用ディスプレイ22、客用ディスプレイ23及びレシートプリンタ24を備える。
図1は、スキャナ装置10とPOS端末20とのハードウェア構成を示すブロック図である。スキャナ装置10は、スキャナ部101と操作・表示部102とを備える。スキャナ部101は、制御部本体としてのCPU111を具備しており、このCPU111に、アドレスバス,データバス等のバスライン112を介して、ROM113とRAM114とが接続される。ROM113には、CPU111によって実行されるプログラムが記憶される。
バスライン112には、入出力回路(不図示)を介して画像取得手段300が接続され、接続インターフェース115及び接続インターフェース116を介して、キーボード11、タッチパネル12及び客用ディスプレイ13が、バスライン112に接続される。タッチパネル12は、例えば液晶ディスプレイを用いたパネル表示部121であり、この表示部の画面はタッチパネルセンサ122として機能している。
接続インターフェース116と、キーボード11、タッチパネル12及び客用ディスプレイ13とは、操作・表示部102を構成する。操作・表示部102を構成する各部は、スキャナ部101のCPU111のみならず、後述するPOS端末20のCPU201によってもコントロールされる。
POS端末20も、制御部本体としてCPU201を搭載する。そしてこのCPU201に、バスライン202を介して、ROM203、RAM204、HDD装置205、通信インターフェース206及び接続インターフェース207が接続される。また、バスライン202には、キーボード21、オペレータ用ディスプレイ22、客用ディスプレイ23、プリンタ24及びドロワ30の各部も、それぞれ入出力回路(不図示)を介して接続される。
通信インターフェース206は、LAN等のネットワークを介して、店舗の中枢を担う店舗サーバ40と接続される。この接続により、POS端末20は、店舗サーバ40とデータの送受信が可能となる。かくしてPOS端末20は、店舗サーバ40が有する3次元構造認識辞書ファイル50や商品データファイル(不図示)等にアクセスして、各ファイルに保存されている3次元モデルデータを読み込んだり、3次元モデルデータを更新(追加、変更、削除)したりする。
接続インターフェース207は、通信ケーブルを介して、スキャナ装置10の両接続インターフェース115,116と接続される。この接続により、POS端末20は、スキャナ装置10のスキャナ部101で読み取られた情報を受信する。また、POS端末20は、スキャナ装置10の操作・表示部102を構成するキーボード11、タッチパネル12、客用ディスプレイ13との間でデータ信号を送受信する。
図2は、スキャナ装置10とPOS端末20とによって構成されるオブジェクト認識スキャナシステム1の機能を説明するためのブロック図である。
オブジェクト認識スキャナシステム1は、画像取得手段300と、3次元画像生成手段400と、判定手段500とを備える。
(画像取得手段300)
画像取得手段300は、撮像装置310a,310b(以下、まとめて撮像装置310という場合がある)で取得した被写体600(例えば、商品等)の被写界深度が深い(高繊細な)2次元画像信号を3次元画像生成手段400に供給するものであり、図3に示すように、第1の撮像装置310aと、第2の撮像装置310bと、光源部320とを有する。
2次元画像信号とは、被写体600のフレーム画像、2次元特徴量(外観形状、色合い、模様、凹凸具合等の表面情報をパラメータで表したもの)を含む。
撮像装置310は、図4に示すように、光学系330と、この光学系330を通過した被写体600を撮像する撮像素子340と、撮像素子340からの被写体分散画像信号より分散のない2次元画像信号を生成する変換部350とを有する。
光学系330は、被写体600を撮影した像を撮像素子340に供給するものである。具体的に、光学系330は、物体側レンズ331と、結像レンズ332と、この物体側レンズ331および結像レンズ332の間に配置された光波面変調素子360とを有する。また、物体側レンズ331および結像レンズ332の間には図示しない絞りが配置される。
光波面変調素子360は、光学的伝達関数(OTF)を変調させるもの、すなわち、結像レンズ332による撮像素子340の受光面への結像の波面を変形(変調)させるものである。光波面変調素子360としては、厚みが変化する光学素子(例えば、3次元的曲面を有する位相板);屈折率が変化する光学素子(例えば、屈折率分布型波面変調レンズ);レンズ表面へのコーディングにより厚み、屈折率が変化する光学素子(例えば、波面変調ハイブリッドレンズ);光の位相分布を変調可能な液晶素子(例えば、液晶空間位相変調素子)などが挙げられる。
撮像素子340は、光学系330を通過し、その受光面に結像された被写体600を電気信号に変換して被写体分散画像信号を生成するものであり、例えば、CCDセンサ、CMOSセンサなどが挙げられる。
変換部350は、撮像素子340からの被写体分散画像信号に対してデジタル処理を施すことにより、被写体分散画像信号より分散のない2次元画像信号を生成するもの、言い換えると、光波面変調素子360により深度の深い光束(像形成の中心的役割を成す)とフレアー(ボケ部分)を形成している被写体分散画像信号(撮像素子340上ではピントのどこにも合わない画像)からピントの合った画像に復元するものであるものであり、深度拡張光学系システム(DEOS:Depth Expantion Optical System:登録商標)で用いられる公知の画像処理装置と同様の構成であればよい。
このような撮像装置310としては、例えば、特許第5198052号公報、特許第5197784号公報、特許第4948990号公報、特許第4948967号公報、特許第4916869号公報、特許第4916862号公報、特許第4916853号公報、特許第4818957号公報、特許第4818956号公報、特許第4813147号公報、特許第4812541号公報、特許第4777177号公報、特許第4749985号公報、特許第4749984号公報、特許第4749959号公報、特許第4722748号公報、特許第4712631号公報、特許第4693720号公報、特許第4663737号公報、特許第4364847号公報などに記載の撮像装置を用いることができる。
光源部320としては、商品や使用環境などに応じて適宜調整すればよく、例えば、発光ダイオード(LED)などが挙げられる。
なお、オブジェクト認識スキャナシステム1では、撮像装置310を2つ有するが、本発明はこれに限定されず、3つ以上の複数の撮像装置を有してもよい。
(3次元画像生成手段400)
3次元画像生成手段400は、各撮像装置310から取得した2次元画像信号を用いてステレオ画像処理による3次元計測を行い、被写体600の3次元画像信号を生成する。
3次元画像信号とは、被写体600のフレーム画像、3次元特徴量(サイズ情報、カラー情報、テクスチャ情報、形状情報、視差情報、距離情報、3次元位置情報、3次元計測の信頼性を示す評価値など)の特徴量を含む。
ステレオ画像処理には、レンズ歪み補正処理・平行化処理等のステレオ較正処理や;ノイズ除去を行うためのローパスフィルタ処理等の前処理や;エッジ検出等の特徴量演算処理がある。さらに、正規化相互相関や差分絶対値和等のブロックマッチングやスペース・スウィープ法等の各種の相関演算処理を用いてステレオ画像間の対応点検索を行い、視差情報を取得するステレオマッチング処理;ランクフィルタ処理やラベリング等により特異点の除去を行う後処理;視差情報を用いて距離情報を演算する距離計算処理などがある。処理の途中で得られる情報、例えばステレオマッチング処理で対応点検索を行った場合の対応点の画像上の座標などを出力することもできる。3次元計測にステレオ撮像を用いることで、撮像画像の各画素の2次元画像座標と、計測した3次元情報との対応付けが容易に行える。
(判定手段510)
判定手段510は、3次元画像生成手段400により生成された3次元画像信号に基づくデータを、3次元構造認識辞書ファイル50の後述する3次元モデルデータと照合させることにより、被写体600がいずれの基準商品に属するか判定する。
3次元画像信号に基づくデータとは、上述した3次元画像信号の特徴量のうち、被写体600のサイズ情報と、それ以外から選択される少なくとも1つとを含む。被写体600のサイズ情報以外から選択される少なくとも1つは、被写体600の外観特徴などに応じて適宜選択すればよい。
被写体600がいずれの基準商品に属するか判定するには、例えば、3次元画像信号に基づくデータを3次元モデルデータと順次照合して、3次元モデルデータの特徴量毎に類似度を算出し、その算出した類似度の数値が最も高い基準商品に被写体600が属すると判定すればよい。
類似度の算出方法は、特に限定されるものではなく、例えば、ヒストグラムに基づく方法、変換に基づく方法、位相に基づく方法、見かけに基づく方法などの手法を組合わせた検索エンジンを用いて類似度を算出してもよい。類似度は、例えば、一致する度合いを示す一致度(一致率)や、どの程度相関するかを示す相関値等であってもよい。すなわち類似度は、被写体600の3次元画像信号に基づくデータと3次元構造認識辞書ファイル50の3次元モデルデータとを基に得られる値であればよい。
図5は、3次元構造認識辞書ファイル50に保存された基準商品の3次元構造情報を表わす3次元モデルデータの構造を示す模式図である。例えば、図5に示すように、3次元構造認識辞書ファイル50には、基準商品毎に、その基準商品を識別する商品ID及び商品名と関連付けて、上述したように複数の特徴量からなる3次元モデルデータが保存される。
3次元モデルデータは、対応する商品IDで識別される基準商品の3次元構造情報(サイズ情報、カラー情報、テクスチャ情報、形状情報、視差情報、距離情報、3次元位置情報、3次元計測の信頼性を示す評価値等)である特徴量をパラメータで表わしたもの(特徴量データ)で、1つの基準商品に対し、その基準商品を様々な方向から見たときの特徴量データ0〜Nがそれぞれ保存される。なお、1つの基準商品に対する特徴量データの数(N+1)は、固定ではない。また、特徴量データの数(N+1)は基準商品によって異なる。店舗で販売される各商品には、固有の商品IDが割当てられている。商品データファイルには、各商品の商品IDと関連付けて、商品名、単価、プリセット画像等の商品情報が保存されている。
これにより、例えば、オブジェクト認識スキャナシステム1を用いて被写体600がいずれかの基準商品に属するか判定することで、その基準商品の商品IDを取得し、商品データファイルにアクセスすることで、その基準商品の商品情報を読み込むことができる。
図6は、オブジェクト認識スキャナシステム1のCPU(CPU111、CPU201)が実行する情報処理手順の要部を示す流れ図である。この情報処理を実行するためのプログラムは、POS端末20のROM203に格納される。このプログラムの少なくとも一部がスキャナ装置10のROM113に格納されていてもよい。
図6の処理が開始すると、CPU(CPU111またはCPU201:以下同)は、画像取得手段300に対して撮像オン信号を出力する(ST1)。例えば、CPU201がCPU111に対して撮像オンを指令し、この指令を受けたCPU111が、画像取得手段300に対して撮像オン信号を出力する。この撮像オン信号により、第1の撮像装置310aおよび第2の撮像装置310bが撮像領域の撮像を開始する。第1の撮像装置310aおよび第2の撮像装置310bで撮像された撮像領域のフレーム画像は、RAM114に順次保存される。
CPUは、RAM114に保存されたフレーム画像のデータを取り込む(ST2)。そしてCPUは、このフレーム画像から被写体600が検出されるか否かを確認する(ST3)。具体的には、CPUは、フレーム画像を二値化した画像から輪郭線等を抽出する。そしてCPUは、フレーム画像に映し出されている物体の輪郭抽出を試みる。物体の輪郭が抽出されると、CPUは、その輪郭内の画像を被写体600とみなす。
フレーム画像から被写体600が検出されない場合(ST3にてNO)、CPUは、RAM114から次のフレーム画像を取り込む(ST2)。そしてCPUは、このフレーム画像から被写体600が検出されるか否かを確認する(ST3)。
フレーム画像から被写体600が検出された場合には(ST3にてYES)、CPUは、第1の撮像装置310aおよび第2の撮像装置310bが撮像したフレーム画像それぞれについて、その輪郭内の画像から被写体600の形状、表面の色合い、模様、凹凸状況等の外観上の2次元特徴量を抽出する(ST4)。抽出された2次元特徴量のデータは、RAM204のワークエリアに一時的に格納される。
2次元特徴量を抽出し終えると、CPUは、ステレオ画像処理による3次元計測を行う(ST5:3次元画像生成手段400)。CPUは、3次元情報として被写体600の画像上の各画素に対応する3次元座標を取得し、それをもとに被写体600の3次元位置やサイズ情報(高さ・幅)や、3次元情報の信頼性などを被写体600の3次元特徴量として算出する。
被写体600の3次元位置は、例えば、被写体600の画像上の各画素に対応する3次元座標の集合において、その重心や平均値を算出し用いても良いし、撮像画像において床面領域が認識できており、被写体600が床面に接している画素、すなわち足元の画素が認識できる場合には、その画素に対応する3次元座標を取っても良い。また、3次元座標のうち、光軸方向の成分のみを抽出し、これをカメラ(撮像装置310)からの距離として3次元座標の代わりに用いても良い。被写体600のサイズ情報(高さや幅)は被写体600の撮像装置310からの距離と被写体600の画像上の高さや幅を用いることで算出することができる。ステレオカメラ(第1の撮像装置310aおよび第2の撮像装置310b)が床面に対し俯角を持って設置されている場合は、その俯角情報を用いて3次元座標の座標系を俯角が無くなるように変換しても良い。この場合、被写体600の高さや幅をより厳密に計測できる。3次元情報の信頼性は、ステレオ画像処理により計測した3次元座標の評価値を参照して、例えば被写体600の画像上の総画素数に対する、評価値の高い3次元座標を持つ画素数の割合などから算出することができる。
ステレオ画像処理による3次元計測をし終えると、CPUは、図7の流れ図により具体的に示される手順の認識処理を実行する(ST6:判定手段500)。先ず、CPUは、店舗サーバ40の3次元構造認識辞書ファイル50を検索する(ST61)。そしてCPUは、3次元構造認識辞書ファイル50から1商品(基準商品)の3次元モデルデータ(商品ID、商品名、複数の特徴量データ)を読み込む(ST62)。
3次元モデルデータを読み込めたならば、CPUは、ステップST6の処理で抽出された3次元画像信号に基づくデータを3次元モデルデータが、当該3次元モデルデータに対してどの程度類似しているかを示す類似度を算出する(ST63)。類似度は、値が大きいほど類似率が高いと言える。
CPUは、類似度が所定の基準閾値より高いか否かを確認する(ST64)。基準閾値は、登録商品候補として残すべき基準商品の類似度の下限である。類似度の上限値を“100”とした場合、基準閾値は、例えばその1/5の“20”と設定する。類似度が基準閾値より高いレベルにある場合(ST64にてYES)、CPUは、当該3次元モデルデータの商品ID及び商品名と、ステップST5の処理で抽出された3次元モデルデータと、ステップST63の処理で算出された類似度とを、登録商品候補としてRAM204の所定エリアに格納する(ST65)。これに対し、類似度が基準閾値を超えない場合には(ST64にてNO)、CPUは、ステップST65の処理を実行しない。
しかる後、CPUは、認識辞書ファイル50に未処理の3次元モデルデータが存在するか否かを確認する(ST66)。存在する場合(ST66にてYES)、CPUは、ステップST62の処理に戻る。すなわちCPUは、3次元構造認識辞書ファイル50から未処理の3次元モデルデータをさらに読み込んで、ステップST63〜ST66の処理を実行する。
こうして、3次元構造認識辞書ファイル50に保存されている全ての商品の3次元モデルデータについて、ステップST63〜ST66の処理が実行されると(ST66にてNO)、認識処理が終了する。
認識処理が終了すると、CPUは、登録商品候補となる基準商品のなかで類似度が最も高いものを、登録商品として自動的に決定する(ST7)。
このように、オブジェクト認識スキャナシステムにおいては、ユーザがスキャナ装置10の読取窓に被写体600をかざすと、画像取得手段300によってこの被写体600が撮影される。そして、この被写体600の画像から抽出される3次元画像信号に基づくデータと、3次元構造認識辞書ファイル50に登録されている各基準商品の3次元モデルデータとから、基準商品毎に特徴量の類似度が算出される。そして、類似度の最も高い登録商品候補が、登録商品として決定される。そうすると、オブジェクト認識スキャナシステムでは、この選択された基準商品の販売データが登録処理される。
〔他の実施形態〕
本発明の他の実施形態に係るオブジェクト認識スキャナシステムについて、図面を参照して詳細に説明する。
図8は、スキャナ装置10とPOS端末20とによって構成されるオブジェクト認識スキャナシステムの機能を説明するためのブロック図である。図8において、図2に示すオブジェクト認識スキャナシステムを構成する各機能と同一のものには同一の符号を付して説明を省略する。
オブジェクト認識スキャナシステムは、図8に示すように、画像取得手段300と、3次元画像生成手段400と、復元手段700と、判定手段510とを備える。すなわち、オブジェクト認識スキャナシステム2は、復元手段700を有し、判定手段500の代わりに判定手段510を用い、3次元構造認識辞書ファイル50の代わりに識別情報辞書ファイル51を用いる他はオブジェクト認識スキャナシステム1と同様である。
オブジェクト認識スキャナシステムは、商品に付された被写体600(以下、認識コード600という)を読み取り、その商品がいずれかの認識対象物(基準商品)に属するか判定するシステムである。すなわち、商品に付された認識コード600から被写界深度が深い2次元画像信号を複数生成し、これらの2次元画像信号を用いて3次元画像信号を生成し、この3次元画像信号に基づいて2次元の認識コード復元画像信号を生成(復元)し、この認識コード復元画像信号と識別情報辞書ファイル51の識別情報データとを照合することにより、認識コード600が付された商品がいずれかの基準商品に属するか判定するシステムである。
このようにオブジェクト認識スキャナシステムでは、認識コード復元画像信号は被写界深度が深い2次元画像信号を用いて復元されるので、被写界深度が浅い2次元画像信号を用いて復元された認識コード復元画像信号を用いる場合よりも、認識コード600と、識別情報辞書ファイル51にあらかじめ登録された識別情報データとのマッチング精度が高い。
また、オブジェクト認識スキャナシステムでは、3次元画像信号に基づいて2次元の認識コード復元画像信号を生成(復元)するので、例えば、認識コード600が商品の形状等に伴い歪んだ状態で商品に付されていても、認識コード600の読み取り精度が高い。そのため、商品に付された認識コード600から、商品名や販売価格などの商品情報を、バーコードスキャナを備え、レジスタに対してある程度垂直にならないと読み込めなかった従来のPOSシステムの端末を用いる場合よりも、精度よく取得することができる。
認識コード600としては、例えば、商品を認識できるコードであればよく、例えば、1次元バーコード、2次元バーコードなどが挙げられる。
オブジェクト認識スキャナシステムにおける2次元画像信号とは、認識コード600のフレーム画像、2次元特徴量(外観形状、色合い、模様、凹凸具合等の表面情報をパラメータで表したもの)を含む。
オブジェクト認識スキャナシステムにおける3次元画像信号とは、認識コード600のフレーム画像、サイズ情報、カラー情報、テクスチャ情報、形状情報、視差情報、距離情報、3次元位置情報、3次元計測の信頼性を示す評価値などの特徴量を含む。
(復元手段700)
復元手段700は、3次元画像生成手段400により生成された3次元画像信号に基づいて、認識コード600の2次元外形を復元した認識コード復元画像信号を生成し、出力する。例えば、認識コード600が一次元バーコードである場合、3次元画像信号のフレーム画像中から一次元バーコードが含まれる部分を抽出し、抽出した一次元バーコードに歪んだ部分がある場合には、その部分を直線状に復元し、復元した認識コードの2次元外形から2次元特徴量を抽出する。
認識コード復元画像信号とは、復元された認識コードのフレーム画像、2次元特徴量(外観形状等の表面情報をパラメータで表したもの)を含む。
(判定手段510)
判定手段510は、復元手段700により復元された認識コード復元画像信号から読み取られたデータを、基準商品毎にその基準商品の識別情報を表す後述する識別情報データが保存された識別情報辞書ファイル51の識別情報データと照合させることにより、認識コード600がいずれの基準商品に属するか判定する。
認識コード復元画像信号から読み取られたデータとは、2次元特徴量(外観形状等の表面情報をパラメータで表したもの)を含む。
認識コード600がいずれの基準商品に属するか判定する方法としては、例えば、認識コード復元画像信号から読み取られたデータを、識別情報辞書ファイル51の識別情報データと順次照合して、基準商品毎にデータの類似度を算出すればよい。
類似度の算出方法は、特に限定されるものではなく、例えばヒストグラムに基づく方法、変換に基づく方法、位相に基づく方法、見かけに基づく方法等を用いて類似度を算出してもよい。なお、類似度は、例えば、一致する度合いを示す一致度(一致率)や、どの程度相関するかを示す相関値等であってもよい。すなわち類似度は、認識コード復元画像信号から読み取られたデータと、識別情報辞書ファイル51の識別情報データとを基に得られる値であればよい。
識別情報辞書ファイル51には、基準商品毎に、その基準商品を識別する商品ID及び商品名と関連付けて、上述したように複数の2次元特徴量からなる識別情報データが保存される。識別情報データは、対応する商品IDで識別される商品の2次元特徴量(外観形状等)である特徴量をパラメータで表わしたもの(特徴量データ)で、図5に示す3次元構造認識辞書ファイル50と同様に、1つの基準商品に対し、その基準商品を様々な方向から見たときの特徴量データ0〜Nがそれぞれ保存される。
図9は、オブジェクト認識スキャナシステム2のCPU(CPU111、CPU201)が実行する情報処理手順の要部を示す流れ図である。図9において、図6に示すオブジェクト認識スキャナシステム1のCPU(CPU111、CPU201)が実行する情報処理手順の要部を示す流れ図のステップと同一のものには同一の符号を付して説明を省略する。
ST3aでは、商品の代わりに識別コードを検出する他はST3と同じである。
ステレオ画像処理(ST5:3次元画像生成手段400)および復元処理(ST8:復元手段700)では、図10に示すように、光学的伝達関数(OTF)を変調させる光波面変調素子を組み込んだカメラ2台よりの個々の画像出力に対して、光学的伝達関数(OTF)に基づき画像を個別に復元させ、次にステレオ画像・3D画像処理を行う。
復元処理をし終えると、CPUは、図11の流れ図により具体的に示される手順の認識処理を実行する(ST6a:判定手段510)。先ず、CPUは、店舗サーバ40の識別情報辞書ファイル51を検索する(ST6a1)。そしてCPUは、識別情報辞書ファイル51から1基準商品の識別情報データを読み込む(ST6a2)。
識別情報データを読み込めたならば、CPUは、ステップST8の処理で2次元外形が復元された認識コード復元画像信号から読み取られたデータを識別情報データが、識別情報データに対してどの程度類似しているかを示す類似度を算出する(ST6a3)。類似度は、値が大きいほど類似率が高いと言える。
CPUは、類似度が所定の基準閾値より高いか否かを確認する(ST6a4)。基準閾値は、登録商品候補として残すべき基準商品の類似度の下限である。類似度の上限値を“100”とした場合、基準閾値は、例えばその1/5の“20”と設定する。類似度が基準閾値より高いレベルにある場合(ST6a4にてYES)、CPUは、当該識別情報データの商品ID及び商品名と、ステップST8の処理で抽出された2次元特徴量のデータと、ステップST6a3の処理で算出された類似度とを、登録商品候補としてRAM204の所定エリアに格納する(ST6a5)。これに対し、類似度が基準閾値を超えない場合には(ST6a4にてNO)、CPUは、ステップST6a5の処理を実行しない。
しかる後、CPUは、識別情報辞書ファイル51に未処理の識別情報データが存在するか否かを確認する(ST6a6)。存在する場合(ST6a6にてYES)、CPUは、ステップST6a2の処理に戻る。すなわちCPUは、識別情報辞書ファイル51から未処理の識別情報データをさらに読み込んで、ステップST6a3〜ST6a6の処理を実行する。
こうして、識別情報辞書ファイル51に保存されている全ての基準商品の識別情報データについて、ステップST6a3〜ST6a6の処理が実行されると(ST6a6にてNO)、認識処理が終了する。
認識処理が終了すると、CPUは、登録商品候補となる基準商品のなかで類似度が最も高いものを、登録商品として自動的に決定する(ST7a)。
このように、オブジェクト認識スキャナシステムにおいては、ユーザがスキャナ装置10の読取窓に識別コード600をかざすと、画像取得手段300によってこの識別コード600が撮影される。そして、この識別コード600の画像から生成される3次元画像信号に基いて、識別コード600の2次元外形が復元される。次いで、復元された2次元外形から抽出された認識コード復元画像信号から読み取られたデータと、識別情報辞書ファイル51に登録されている各基準商品の識別情報データとから、基準商品毎に2次元特徴量の類似度が算出される。そして、類似度の最も高い登録商品候補が、登録商品として決定される。そうすると、オブジェクト認識スキャナシステムでは、この選択された基準商品の販売データが登録処理される。
この他、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
50 3次元構造認識辞書ファイル
51 識別情報辞書ファイル
300 画像取得手段
310 撮像装置
330 光学系
340 撮像素子
350 変換部
360 光波面変調素子
400 3次元画像生成手段
500,510 判定手段
600 被写体(認識コード)
700 復元手段

Claims (5)

  1. 光学的伝達関数(OTF)を変調させる光波面変調素子を含む光学系、この光学系を通過した被写体像を撮像する撮像素子、およびこの撮像素子からの被写体分散画像信号より分散のない2次元画像信号を生成する変換部を少なくとも有する撮像装置が2個以上組み込まれた画像取得手段と、
    各撮像装置から取得した2次元画像信号を用いて前記被写体像の3次元画像信号を生成する3次元画像生成手段とを備えることを特徴とするオブジェクト認識スキャナシステム。
  2. 前記画像取得手段は、前記撮像装置を2個有し、
    前記3次元画像生成手段は、各撮像装置から取得した2次元画像信号を用いてステレオ画像処理をし、前記被写体像の3次元画像信号を生成する請求項1に記載のオブジェクト認識スキャナシステム。
  3. 前記3次元画像生成手段により生成された3次元画像信号に基づくデータを、認識対象物毎にその認識対象物の3次元構造情報を表わす3次元モデルデータが保存された3次元構造認識辞書ファイルの前記3次元モデルデータと照合させることにより、前記被写体像がいずれの認識対象物に属するか判定する判定手段を備える請求項1または2に記載のオブジェクト認識スキャナシステム。
  4. 前記被写体像が認識コードであり、
    前記3次元画像生成手段により生成された3次元画像信号に基づいて、前記認識コードの2次元外形を復元した認識コード復元画像信号を生成する復元手段と、
    前記復元手段により復元された認識コード復元画像信号から読み取られたデータを、認識対象物毎にその認識対象物の識別情報を表す識別情報データが保存された識別情報辞書ファイルの前記識別情報データと照合させることにより、前記被写体像がいずれの認識対象物に属するか判定する判定手段と、を備える請求項1または2に記載のオブジェクト認識スキャナシステム。
  5. 前記認識コードは、1次元バーコードまたは2次元バーコードである請求項4に記載のオブジェクト認識スキャナシステム。
JP2014266702A 2014-12-26 2014-12-26 オブジェクト認識スキャナシステム Pending JP2016126515A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014266702A JP2016126515A (ja) 2014-12-26 2014-12-26 オブジェクト認識スキャナシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014266702A JP2016126515A (ja) 2014-12-26 2014-12-26 オブジェクト認識スキャナシステム

Publications (1)

Publication Number Publication Date
JP2016126515A true JP2016126515A (ja) 2016-07-11

Family

ID=56359504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014266702A Pending JP2016126515A (ja) 2014-12-26 2014-12-26 オブジェクト認識スキャナシステム

Country Status (1)

Country Link
JP (1) JP2016126515A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018088161A (ja) * 2016-11-29 2018-06-07 サインポスト株式会社 情報処理システム及び情報処理方法
CN111325049A (zh) * 2018-12-13 2020-06-23 北京京东尚科信息技术有限公司 商品识别方法、装置、电子设备及可读介质
CN111340042A (zh) * 2018-12-19 2020-06-26 中国移动通信集团四川有限公司 物体轮廓识别方法、装置、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018088161A (ja) * 2016-11-29 2018-06-07 サインポスト株式会社 情報処理システム及び情報処理方法
CN111325049A (zh) * 2018-12-13 2020-06-23 北京京东尚科信息技术有限公司 商品识别方法、装置、电子设备及可读介质
CN111340042A (zh) * 2018-12-19 2020-06-26 中国移动通信集团四川有限公司 物体轮廓识别方法、装置、设备及存储介质
CN111340042B (zh) * 2018-12-19 2023-09-22 中国移动通信集团四川有限公司 物体轮廓识别方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
EP3163497B1 (en) Image transformation for indicia reading
JP6507730B2 (ja) 座標変換パラメータ決定装置、座標変換パラメータ決定方法及び座標変換パラメータ決定用コンピュータプログラム
JP6651705B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6125188B2 (ja) 映像処理方法及び装置
JP6428266B2 (ja) 色補正装置、色補正方法および色補正用プログラム
US9454708B2 (en) Recognition dictionary creation apparatus and method for creating recognition dictionary by the same
EP3497618B1 (en) Independently processing plurality of regions of interest
JP5951043B2 (ja) 画像計測装置
JP6976733B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2021057054A (ja) 画像認識装置
JPWO2015147333A1 (ja) 売上登録装置、プログラム及び売上登録方法
JP2018133071A (ja) 物品認識装置、決済装置および物品認識方法
CN107491744A (zh) 人体身份识别方法、装置、移动终端和存储介质
JPWO2018147059A1 (ja) 画像処理装置、および画像処理方法、並びにプログラム
JP2016126515A (ja) オブジェクト認識スキャナシステム
CN112802114A (zh) 多视觉传感器融合装置及其方法和电子设备
US20210232797A1 (en) Independently processing plurality of regions of interest
JP6452361B2 (ja) 情報処理装置、情報処理方法、プログラム
JP2014059710A (ja) 対象物検出装置および対象物検出方法
JP6943340B2 (ja) 物体検出装置、物体検出システム、物体検出方法、およびプログラム
JP6311461B2 (ja) 視線分析システムおよび視線分析装置
JP2018160184A (ja) 情報処理装置及びプログラム
JP5708305B2 (ja) 画像認識装置、画像認識方法及び画像認識用コンピュータプログラム
KR101300166B1 (ko) 홍채 검출 장치 및 방법
KR101706674B1 (ko) 원거리 가시광선 영상과 열 영상에 기반한 성별 인식 방법 및 장치