JP5707375B2 - 商品認識装置及び商品認識プログラム - Google Patents

商品認識装置及び商品認識プログラム Download PDF

Info

Publication number
JP5707375B2
JP5707375B2 JP2012243645A JP2012243645A JP5707375B2 JP 5707375 B2 JP5707375 B2 JP 5707375B2 JP 2012243645 A JP2012243645 A JP 2012243645A JP 2012243645 A JP2012243645 A JP 2012243645A JP 5707375 B2 JP5707375 B2 JP 5707375B2
Authority
JP
Japan
Prior art keywords
product
distance
recognition
feature amount
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012243645A
Other languages
English (en)
Other versions
JP2014092975A (ja
Inventor
秀彦 宮越
秀彦 宮越
広志 菅澤
広志 菅澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2012243645A priority Critical patent/JP5707375B2/ja
Priority to US14/065,512 priority patent/US20140126773A1/en
Priority to CN201310533195.1A priority patent/CN103810468B/zh
Publication of JP2014092975A publication Critical patent/JP2014092975A/ja
Application granted granted Critical
Publication of JP5707375B2 publication Critical patent/JP5707375B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/68Food, e.g. fruit or vegetables

Description

本発明の実施形態は、撮像部で撮像した画像データから商品を認識する商品認識装置及びコンピュータを当該商品認識装置にとして機能させるための商品認識プログラムに関する。
対象となる物品(オブジェクト)を撮像部で撮像した画像データから当該物品の外観特徴量を抽出し、認識辞書ファイルに登録された基準画像の特徴量データと照合して類似度を算出し、この類似度に応じて当該物品の種別等を認識する技術がある。このような画像中に含まれる物品を認識する技術は、一般物体認識(generic object recognition)と呼ばれる。この一般物体認識の技術については、下記の文献において各種認識技術が解説されている。
柳井 啓司,“一般物体認識の現状と今後”,情報処理学会論文誌,Vol.48,No.SIG16[平成22年8月10日検索],インターネット< URL: http://mm.cs.uec.ac.jp/IPSJ-TCVIM-Yanai.pdf >
また、画像をオブジェクト毎に領域分割することによって、一般物体認識を行う技術が、下記の文献において解説されている。
Jamie Shottonら,“Semantic Texton Forests for Image Categorization and Segmentation”,[平成22年8月10日検索],インターネット< URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.145.3036&rep=repl&type=pdf >
近年、例えば小売店の会計システム(POSシステム)において、顧客が買い上げる商品、特に、野菜、果物等のようにバーコードが付されていない商品の認識装置に、上述した一般物体認識の技術を適用することが提案されている。この場合、オペレータ(店員または客)は撮像部に向けて認識対象の商品を翳すが、翳した際に撮像部から商品までの距離が必ずしも一定になるとは限らない。その一方で、撮像部の画素数は一定であるため、撮像部から商品までの距離によって撮影画像の解像度は異なる。このため、撮像画像から抽出される商品の外観特徴量と基準画像の特徴量データとを比較した際に、撮影画像と基準画像の解像度が異なるために類似度が低くなり、認識率が低下する懸念がある。
特開2001−092975号公報
本発明が解決しようとする課題は、撮像部から商品までの距離の変化によって認識率が低下するのを防止できる商品認識装置を提供しようとするものである。
一実施形態において、商品認識装置は、特徴量抽出手段、距離測定手段、ファイル選択手段、類似度算出手段及び確定手段を含む。特徴量抽出手段は、商品を撮影する撮像部で撮影された画像からその画像に含まれる商品の外観特徴量を抽出する。距離測定手段は、撮像部からこの撮像部で撮影された商品までの距離を測定する。ファイル選択手段は、距離別認識辞書ファイルのなかから、距離測定手段で測定された距離に相当する認識辞書ファイルを選択する。距離別認識辞書ファイルは、認識対象商品を撮影したときの撮影距離別にその撮影距離で認識対象商品を撮影した画像から得られる当該認識対象商品の表面情報を表わす特徴量データを、その特徴量データがその商品にとって適正な撮影距離で撮影された基準画像から得られたか否かを識別する情報とともに保存する。類似度算出手段は、特徴量抽出手段により抽出された外観特徴量を、ファイル選択手段により選択された認識辞書ファイルの特徴量データと照合して、外観特徴量が特徴量データに対してどの程度類似しているかを示す類似度を認識対象商品毎に算出する。確定手段は、類似度算出手段により認識対象商品毎に算出される類似度の最大値が予め設定された確定値以上であり、かつその最大値となる類似度が適正な撮影距離で撮影された基準画像から得られた特徴量データにより算出された場合に、この類似度を有する認識対象商品を撮像部で撮影された商品として確定する。
一実施形態である店舗会計システムの外観図。 同店舗会計システムのスキャナ装置とPOS端末とのハードウェア構成を示すブロック図。 第1の実施形態において、認識辞書ファイルに保存される商品別辞書データの構造を示す模式図。 判定テーブルのデータ構造を示す模式図。 スキャナ装置の読取窓に商品を翳したときの状態と、そのとき撮影されるフレーム画像の一例とを示す模式図。 スキャナ装置の読取窓に商品を翳したときの状態と、そのとき撮影されるフレーム画像の一例とを示す模式図。 第1の実施形態において、スキャナ装置が有する商品認識装置としての機能を示すブロック図。 第1の実施形態において、商品認識プログラムにしたがってスキャナ装置のCPUが実行する情報処理手順の要部を示す流れ図。 図8における認識処理の手順を具体的に示す流れ図。 撮影距離が短距離のときにタッチパネルに表示される画面の一例を示す図。 撮影距離が中距離のときにタッチパネルに表示される画面の一例を示す図。 撮影距離が長距離のときにタッチパネルに表示される画面の一例を示す図。 第2の実施形態における認識辞書ファイルの構成を示す模式図。 第2の実施形態において、認識辞書ファイルに保存される商品別辞書データの構造を示す模式図。 第2の実施形態において、スキャナ装置が有する商品認識装置としての機能を示すブロック図。 第1の実施形態において、商品認識プログラムにしたがってスキャナ装置のCPUが実行する情報処理手順の要部を示す流れ図。 図8における認識処理の手順の前半部を具体的に示す流れ図。 図8における認識処理の手順の後半部を具体的に示す流れ図。
以下、商品認識装置の実施形態について、図面を用いて説明する。なお、本実施形態は、野菜,果物等を商品として取扱う小売店の店舗会計システムを構築するスキャナ装置1に、商品認識装置としての機能を持たせた場合である。
[第1の実施形態]
図1は、店舗会計システムの外観図である。このシステムは、顧客が買い上げる商品を登録する登録部としてのスキャナ装置1と、顧客の代金支払いを処理する決済部としてのPOS(Point Of Sales)端末2とを含む。スキャナ装置1は、会計カウンタ3の上に取り付けられる。POS端末2は、レジ台4の上にドロワ5を介して設置される。スキャナ装置1とPOS端末2とは、通信ケーブル300(図2を参照)によって電気的に接続される。
スキャナ装置1は、キーボード11、タッチパネル12及び客用ディスプレイ13を備える。これらの表示・操作デバイス(キーボード11、タッチパネル12、客用ディスプレイ13)は、スキャナ装置1の本体を構成する薄型矩形形状のハウジング1Aに取り付けられる。
ハウジング1Aには、撮像部14が内蔵される。また、矩形状の読取窓1Bが、ハウジング1Aの正面に形成される。撮像部14は、エリアイメージセンサであるCCD(Charge Coupled Device)撮像素子及びその駆動回路と、撮像領域の画像をCCD撮像素子に結像させるための撮像レンズとを備える。撮像領域とは、読取窓1Bから撮像レンズを通してCCD撮像素子のエリアに結像するフレーム画像の領域を指す。撮像部14は、撮像レンズを通ってCCD撮像素子に結像した撮像領域の画像を出力する。なお、撮像部はCMOS(complementary metal oxide semiconductor)イメージセンサであってもよい。
前記読取窓1Bの近傍には、後述する距離測定手段72としての距離センサ15が設けられる。距離センサ15は、前記撮像部14からこの撮像部14で撮影された商品までの距離計測に供せられる。かような距離センサ15としては、赤外線LEDとフォトトランジスタとを組み合わせたもの、あるいは超音波やレーザ光を用いたもの等の周知の距離センサが適用可能である。
POS端末2は、決済に必要なデバイスとしてキーボード21、オペレータ用ディスプレイ22、客用ディスプレイ23及びレシートプリンタ24を備える。
会計カウンタ3は、その奥側の顧客通路に沿って細長い形状である。レジ台4は、会計カウンタ3に沿って移動する顧客の移動方向に対して下流側の会計カウンタ3の端部手前側に、会計カウンタ3に対して略垂直に置かれる。そして、この会計カウンタ3の手前側とレジ台4の手前側が、会計担当の店員いわゆるキャッシャのスペースとなる。
会計カウンタ3の略中央には、スキャナ装置1のハウジング1Aが、キーボード11、タッチパネル12及び読取窓1Bをそれぞれ手前側のキャッシャ側に向けて立設される。スキャナ装置1の客用ディスプレイ13は、顧客通路側を向いてハウジング1Aに取り付けられる。
会計カウンタ3のスキャナ装置1を挟んで顧客移動方向上流側の荷受面は、買物客が購入する未登録の商品Mが入れられた買物カゴ6を置くためのスペースとなる。他方、下流側の荷受面は、スキャナ装置1により登録された商品Mを入れるための買物カゴ7を置くためのスペースとなる。
図2は、スキャナ装置1とPOS端末2とのハードウェア構成を示すブロック図である。スキャナ装置1は、スキャナ部101と操作・出力部102とを備える。スキャナ部101は、制御部本体としてCPU(Central Processing Unit)111を搭載する。そしてこのCPU111に、アドレスバス,データバス等のバスライン112を介して、ROM(Read Only Memory)113とRAM(Random Access Memory)114とが接続される。ROM113には、後述する商品認識プログラム等、CPU111によって実行されるプログラムが記憶される。
この他、バスライン112には、入出力回路(不図示)を介して前記撮像部14と距離センサ15とが接続される。また、バスライン112は、接続インターフェース115及び接続インターフェース116を介して延長され、このバスライン112に前記キーボード11、タッチパネル12及び客用ディスプレイ13が接続される。タッチパネル12は、パネル型のディスプレイ12aと、このディスプレイ12aの画面上に重ねて配置されたタッチパネルセンサ12bとを備える。また、音声合成部16も、バスライン112に接続される。音声合成部16は、バスライン112を介して入力されるコマンドに応じて音声信号をスピーカ17に出力する。スピーカ17は、音声信号を音声に変換して出力する。
前記接続インターフェース116と、前記キーボード11、タッチパネル12、客用ディスプレイ13及び音声合成部16とは、前記操作・出力部102を構成する。操作・出力部102を構成する各部は、スキャナ部101のCPU111のみならず、後述するPOS端末2のCPU201によってもコントロールされる。
POS端末2も、制御部本体としてCPU201を搭載する。そしてこのCPU201に、バスライン202を介して、ROM203、RAM204、補助記憶部205、通信インターフェース206及び接続インターフェース207が接続される。また、バスライン202には、前記キーボード21、オペレータ用ディスプレイ22、客用ディスプレイ23、プリンタ24及びドロワ5の各部も、それぞれ入出力回路(不図示)を介して接続される。
通信インターフェース206は、LAN(Local Area Network)等のネットワークを介して、店舗の中枢を担う店舗サーバ(不図示)と接続される。この接続により、POS端末2は、店舗サーバとデータの送受信が可能となる。
接続インターフェース207は、通信ケーブル300を介して、スキャナ装置1の両接続インターフェース115,116と接続される。この接続により、POS端末2は、スキャナ装置1のスキャナ部101から情報を受信する。また、POS端末2は、スキャナ装置1の操作・出力部102を構成するキーボード11、タッチパネル12、客用ディスプレイ13、音声合成部16との間でデータ信号を送受信する。一方、スキャナ装置1は、この接続により、POS端末2の補助記憶部205に保存されているデータファイルにアクセスする。
補助記憶部205は、例えばHDD(Hard Disk Drive)装置またはSSD(Solid State Drive)装置であって、種々のプログラムの他、認識辞書ファイル30等のデータファイルを保存する。認識辞書ファイル30には、短距離辞書ファイル31と中距離辞書ファイル32と長距離辞書ファイル33とがある。
図3は、各認識辞書ファイル31〜33に保存される商品別辞書データの構造を示す模式図である。図3に示すように、商品別辞書データは、認識対象商品を識別する商品ID及び商品名と、適正距離フラグF0と、特徴量データとを含む。適正距離フラグF0については後述する。特徴量データは、対応する商品IDで識別される商品を撮影した基準画像から、その商品の表面情報(外観形状、色合い、模様、凹凸具合等)である外観上の特徴量を抽出し、この外観特徴量をパラメータで表わしたもので、1つの認識対象商品に対し、その商品を様々な方向から見たときの特徴量データ0〜nが存在する。なお、特徴量データの数(n+1)は、固定ではない。また、特徴量データの数(n+1)は認識対象商品によって異なる。また、商品名は必ずしも商品別辞書データに含まれていなくてもよい。
短距離辞書ファイル31には、基準画像を得るために認識対象商品を撮影した際の撮像手段(カメラ)と商品との距離、いわゆる撮影距離が予め設定された第1の距離D1(cm)未満のときの基準画像から得られた特徴量データを含む商品別辞書データが保存される。中距離辞書ファイル32には、撮影距離が前記第1の距離D1以上で、かつこの第1の距離D1よりも長い第2距離D2(cm)未満のときの基準画像から得られた特徴量データを含む商品別辞書データが保存される。長距離辞書ファイル33には、撮影距離が前記第2の距離D2以上のときの基準画像から得られた特徴量データを含む商品別辞書データが保存される。
本実施形態では、各認識対象商品の商品別辞書データが、短距離辞書ファイル31、中距離辞書ファイル32及び長距離辞書ファイル33に対してそれぞれ保存される。すなわち、認識対象商品毎に第1の距離D1未満の撮影距離で撮影した第1の基準画像と、第1の距離D1以上で第2の距離D2未満の撮影距離で撮影した第2の基準画像と、第2の距離D2以上の撮影距離で撮影した第3の基準画像とを用意し、各基準画像からそれぞれ特徴量データを取得して商品別辞書データを作成し、各々を該当する撮影距離別の認識辞書ファイル31〜33に登録しておく。
ここで、撮影距離と認識率との関係について説明する。
図5及び図6は、スキャナ装置1の読取窓1Bに商品(リンゴ)Mを翳したときの状態と、そのとき撮影されるフレーム画像G1,G2の一例とを示す模式図である。図5は、撮影距離が短い場合(距離=d1)を示しており、図6は、撮影距離が長い場合(距離=d2:d2>d1)を示している。
図5のフレーム画像G1と図6のフレーム画像G2とを比較すれば明らかなように、読取窓1Bから商品Mまでの距離が近いとき、すなわち撮影距離が短いときにはフレーム画像G1のサイズに対して商品Mが大きく映し出され、距離が遠いとき、すなわち撮影距離が長いときにはフレーム画像G2のサイズに対して商品Mが小さく映し出される。その結果、フレーム画像G1とフレーム画像G2とを同一サイズのセルで格子状に区分すると、商品Mを映し出すセルの数は、撮影距離が長いときよりも短いときの方が多い。つまり、撮影距離が短いときにはフレーム画像G1に映し出される商品Mの解像度が高くなり、撮影距離が長いときには解像度が低くなる。
一般物体認識の技術では、撮像部14によって撮影された画像の解像度と、基準画像の解像度とが近似していればいるほど、認識率が高くなる傾向がある。つまり、図5に示すように、読取窓1Bから商品Mまでの距離が近いときには、短距離辞書ファイル31または中距離辞書ファイル32に保存された特徴量データを用いれば認識率が高いが、長距離辞書ファイル33に保存された特徴量データであれば認識率が低くなる。逆に、図6に示すように、読取窓1Bから商品Mまでの距離が遠いときには、長距離辞書ファイル33または中距離辞書ファイル32に保存された特徴量データを用いれば認識率が高いが、短距離辞書ファイル31に保存された特徴量データであれば認識率が低くなる。
その一方で、商品は種類によって大きさが異なる。例えば同じ柑橘類であっても、「蜜柑」のように小さいものから「文丹」のように大きいものまで存在する。サイズが小さい認識対象商品の場合、長距離辞書ファイル33用の特徴量データを得るために認識対象商品を第2の距離D2以上の撮影距離で撮影すると、基準画像の解像度が著しく低くなる。このため、信頼度の高い特徴量データを得ることはできない。逆に、サイズが大きい認識対象商品の場合には、短距離辞書ファイル31用の特徴量データを得るために認識対象商品を第1の距離D1未満の撮影距離で撮影すると、商品画像がフレームからはみ出してしまう。このため、やはり信頼度の高い特徴量データは得られない。特徴量データの信頼度が低いということは、認識結果に対する信頼性も低くなる。つまり、商品を認識する際には、その商品のサイズによって適正な撮影距離というものが存在する。
本実施形態では、認識対象商品毎に、適正な撮影距離で撮影された基準画像から生成された特徴量データを含む商品別辞書データの適正距離フラグF0を“1”とし、適正でない撮影距離で撮影された基準画像から生成された特徴量データを含む商品別辞書データの適正距離フラグF0を“0”とする。
図7は、商品認識装置としての機能を示すブロック図である。本実施形態では、この機能をスキャナ装置1が有する。すなわちスキャナ装置1は、撮像部14の撮像領域に翳された商品Mを認識し、販売商品として確定するまでの機能として、特徴量抽出手段71、距離測定手段72、ファイル選択手段73、類似度算出手段74、候補出力手段75、第1の確定手段76及び第2の確定手段77を備える。
特徴量抽出手段71は、撮像部14で撮影された画像からその画像に含まれる商品Mの外観特徴量を抽出する。距離測定手段(距離センサ15)72は、撮像部14からこの撮像部14で撮影された商品Mまでの距離を測定する。ファイル選択手段73は、撮影距離別の認識辞書ファイル(短距離辞書ファイル31、中距離辞書ファイル32、長距離辞書ファイル33)のなかから、距離測定手段72で測定された距離に相当する認識辞書ファイル3X(X=1,2or3)を選択する。
ファイル選択手段73は、図4に示すデータ構造の判定テーブル40を使用する。判定テーブル40は、短距離辞書ファイル31、中距離辞書ファイル32及び長距離辞書ファイル33をそれぞれ識別する辞書ファイル名に関連付けて、その辞書ファイルに登録されている商品別辞書データに係る撮影距離dの範囲を設定したものであり、例えばRAM114に記憶される。すなわち、短距離辞書ファイル31の辞書ファイル名に関連付けて、第1の距離D1未満の範囲が設定され、中距離辞書ファイル32の辞書ファイル名に関連付けて、第1の距離D1以上で第2の距離D2未満の範囲が設定され、長距離辞書ファイル33の辞書ファイル名に関連付けて、第2の距離D2以上の範囲が設定される。ファイル選択手段73は、距離測定手段72で測定された距離dが含まれる範囲の辞書ファイル名で特定される認識辞書ファイル3Xを選択する。
類似度算出手段74は、特徴量抽出手段71により抽出された外観特徴量を、ファイル選択手段73により選択された認識辞書ファイル3Xの特徴量データと照合して、外観特徴量が特徴量データに対してどの程度類似しているかを示す類似度を認識対象商品毎に算出する。候補出力手段75は、類似度算出手段74により算出される類似度に基づいて認識対象商品を認識商品候補としてタッチパネル12に選択可能に表示出力する。
第1の確定手段76は、タッチパネル12に表示された認識商品候補の中から選択された認識対象商品を撮像部14で撮影された商品Mとして確定する。第2の確定手段77は、候補出力手段75により認識商品候補として出力される認識対象商品の最大類似度が予め設定された確定値以上であり、かつその最大類似度が適正な撮影距離で撮影された基準画像から得られた特徴量データにより算出された場合に、この最大類似度を有する認識対象商品を撮像部14で撮影された商品として確定する。
各手段71〜77は、スキャナ装置1のCPU111が、商品認識プログラムに従って動作することで実現される。商品認識プログラムが起動すると、スキャナ装置1のCPU111は、図8の流れ図に示す手順で各部を制御する。
先ず、CPU111は、後述する商品確定フラグF1を“0”にリセットする(ST1)。商品確定フラグF1は、RAM114に格納されている。またCPU11は、撮像部14に対して撮像オン信号を出力する(ST2)。この撮像オン信号により、撮像部14が撮像領域の撮像を開始する。撮像部14で撮像された撮像領域のフレーム画像は、RAM114に順次保存される。因みに、ステップST1とステップST2との処理手順は逆でもよい。
撮像オン信号を出力したCPU111は、RAM114に保存されたフレーム画像を取り込む(ST3)。そしてCPU111は、このフレーム画像に商品が撮影されているか否かを確認する(ST4)。具体的には、CPU111は、フレーム画像を二値化した画像から輪郭線等を抽出する。そしてCPU111は、フレーム画像に映し出されている物体の輪郭抽出を試みる。物体の輪郭が抽出されると、CPU111は、その輪郭内の画像を商品とみなす。
フレーム画像に商品が撮影されていない場合(ST4にてNO)、CPU111は、RAM104から次のフレーム画像を取り込む(ST3)。そしてCPU111は、このフレーム画像に商品が撮影されているか否かを確認する(ST4)。
フレーム画像に商品Mが撮影されていた場合(ST4にてYES)、CPU111は、距離センサ15を作動させて、撮像部14から商品Mまでの撮影距離dを測定する(ST5:距離測定手段74)。撮影距離dが測定されたならば、CPU111は、判定テーブル40を参照して、当該撮影距離dが含まれる距離範囲に関連付けられた辞書ファイル名を取得し、この辞書ファイル名で特定される認識辞書ファイル3X(X=1、2or3)を選択する(ST6:ファイル選択手段73)。また、CPU111は、フレーム画像から抽出された輪郭内の画像から商品Mの形状、表面の色合い、模様、凹凸状況等の外観特徴量を抽出する(ST6:特徴量抽出手段71)。因みに、ステップST5,6とステップST7との処理手順は逆でもよい。
こうして、撮影距離dに相当する認識辞書ファイル3Xを選択するとともに、商品Mの外観特徴量を取得すると、CPU111は、認識処理を起動する(ST8)。
図9は、認識処理の手順を示す流れ図である。先ずCPU111は、接続インターフェース115を介して接続されるPOS端末2の補助記憶部205にアクセスして、選択された認識辞書ファイル3Xを検索する(ST21)。そしてCPU111は、認識辞書ファイル3Xから1商品のデータレコード(商品ID、商品名、適正距離フラグF0、特徴量データ0〜n)を読み込む(ST22)。
データレコードを読み込めたならば、CPU111は、当該レコードの特徴量データ0〜n毎に、ステップST7の処理で抽出された商品の外観特徴量が当該特徴量データ0〜nに対してどの程度類似しているかを示す類似度を算出する。そしてCPU111は、特徴量データ0〜n毎に算出された類似度の最大値を、当該レコードの商品IDで特定される商品と検出された商品Mとの類似度として決定する(ST23:類似度算出手段74)。なお、決定される類似度は、特徴量データ0〜n毎に算出された類似度の最大値でなく、特徴量データ0〜n毎に算出された類似度の合計値あるいは平均値等であってもよい。
CPU111は、ステップST23の処理で決定された類似度が予め設定された候補閾値Lminを超えるか否かを確認する(ST24)。類似度が候補閾値Lminを超えていない場合(ST24にてNO)、CPU111は、ステップST26の処理に進む。
類似度が候補閾値Lminを超えている場合には(ST24にてYES)、CPU111は、当該レコードの商品ID及び適正距離フラグF0と類似度とを登録商品候補(認識商品候補)のデータとして、RAM114に格納する(ST25)。しかる後、CPU111は、ステップST26の処理に進む。
ステップST26では、CPU111は、認識辞書ファイル3Xに未処理のデータレコードが存在するか否かを確認する。存在する場合(ST26にてYES)、CPU111は、ステップST22の処理に戻る。すなわちCPU111は、認識辞書ファイル3Xから未処理のデータレコードを読み込み、前記ステップST23〜ST25の処理を実行する。
認識辞書ファイル3Xに未処理のデータレコードが存在しない場合、すなわち認識辞書ファイル30の検索を終了したならば(ST26にてNO)、CPU111は、登録商品候補のデータがRAM114に格納されているか否かを確認する(ST27)。登録商品候補のデータが格納されていない場合(ST27にてNO)、今回の認識処理が終了する。
登録商品候補のデータが格納されている場合には(ST27にてYES)、CPU111は、RAM114に格納された登録商品候補のデータの最大類似度が予め設定された確定閾値Lmax(Lmax>Lmin)を超えるか否かを確認する(ST28)。最大類似度が確定閾値Lmaxを超えない場合(ST28にてYES)、CPU111は、RAM114に格納された登録商品候補のデータの中から類似度が大きい順に最大でK(K>2)品目の商品を選択する。そしてCPU111は、選択した最大K品目の商品を登録商品候補の商品リストとしてディスプレイ12aに表示する(ST30:候補出力手段75)。そしてCPU111は、当該商品リストの中からいずれかの商品が選択されたか否かを確認する(ST31)。例えばキーボード11の再検索キーが入力されて選択されないことが宣言された場合(ST33にてNO)、今回の認識処理が終了する。
一方、タッチパネル12またはキーボード11の操作入力により、登録商品候補の商品リストの中からいずれか1商品が選択された場合には(ST31にてYES)、CPU111は、この選択された商品の商品IDをRAM114から取得する(ST32)。そしてCPU111は、この取得した商品IDを、販売商品の商品IDとして確定し、通信ケーブル330を介してPOS端末2に送信する(ST33:第1の確定手段76)。またCPU111は、商品確定フラグF1を“1”にセットする(ST34)。以上で、今回の認識処理が終了する。
また、ステップST28にて登録商品候補のデータの最大類似度が確定閾値Lmaxを超える場合には(ST28にてYES)、CPU111は、この登録商品候補のデータに含まれる適正距離フラグF0を調べる(ST29)。適正距離フラグF0が“0”にリセットされている場合(ST29にてNO)、最大類似度は、適正でない撮影距離で撮影された基準画像によって生成された特徴量データから算出された類似度なので、前記ステップST30の処理に進む。すなわち、CPU111は、登録商品候補のデータの中から類似度の大きい順に選択した最大K品目の商品を登録商品候補の商品リストとしてディスプレイ12aに表示する。以後、CPU111は、前記ステップST31〜ST34の処理を実行する。
これに対し、適正距離フラグF0が“1”にセットされていた場合には(ST29にてYES)、CPU111は、ステップST33の処理に進む。すなわちCPU111は、最大類似度を有する商品の商品IDをRAM114から取得する。そしてCPU111は、この取得した商品IDを、販売商品の商品IDとして確定し、通信ケーブル330を介してPOS端末2に送信する(ST33:第2の確定手段77)。また、CPU111は、商品確定フラグF1を“1”にセットする(ST34)。因みに、ステップST33とステップST34との処理手順は逆でもよい。以上で、今回の認識処理は終了する。
認識処理が終了すると、CPU111は、商品確定フラグF1が“1”にセットされたか否かを確認する(ST9)。商品確定フラグF1が“1”にセットされていない場合(ST9にてNO)、CPU111は、ステップST3に戻る。すなわちCPU111は、RAM114に保存されている別のフレーム画像を取り込む(ST3)。そしてCPU111は、前記ステップST4以降の処理を再度実行する。
商品確定フラグF1が“1”にセットされていた場合には(ST9にてYES)、CPU111は、撮像部14に対して撮像オフ信号を出力する(ST10)。この撮像オフ信号により、撮像部14は撮像を中止する。以上で、商品認識プログラムは終了する。
図10は、読取窓1Bに翳された商品Mと撮像部14との距離dが、第2の距離D2よりも遠いときに、タッチパネル12に表示される画面120の一例である。画面120は、画像表示領域121と商品候補領域122とに区分される。そして画像表示領域121には、ステップST3の処理で取り込まれたフレーム画像が表示される。また商品候補領域122には、ステップST6の処理により選択された長距離辞書ファイル33の特徴量データを用い、ステップST9の認識処理により得られたK品目(図では6品目)の商品が登録商品候補として選択可能に表示される。
長距離辞書ファイル33には、撮影距離が第2の距離D2以上のときの基準画像から得られた特徴量データを含む商品別辞書データが保存されている。したがって、撮像部14によって撮影された商品Mの画像は基準画像と解像度が近似しているので、認識率は高くなる。
図11は、読取窓1Bに翳された商品Mと撮像部14との距離dが、第1の距離D1よりも遠く、第2の距離D2よりも近いときに、タッチパネル12に表示される画面120の一例である。画面120は、画像表示領域121と商品候補領域122とに区分される。そして画像表示領域121には、ステップST3の処理で取り込まれたフレーム画像が表示される。また商品候補領域122には、ステップST6の処理により選択された中距離辞書ファイル32の特徴量データを用い、ステップST9の認識処理により得られたK品目(図では6品目)の商品が登録商品候補として選択可能に表示される。
中距離辞書ファイル32には、撮影距離が前記第1の距離D1以上で、かつこの第1の距離D1よりも長い第2距離D2(cm)未満のときの基準画像から得られた特徴量データを含む商品別辞書データが保存されている。したがって、撮像部14によって撮影された商品Mの画像は基準画像と解像度が近似しているので、認識率は高くなる。
図12は、読取窓1Bに翳された商品Mと撮像部14との距離dが、第1の距離D1よりも近いときに、タッチパネル12に表示される画面120の一例である。画面120は、画像表示領域121と商品候補領域122とに区分される。そして画像表示領域121には、ステップST3の処理で取り込まれたフレーム画像が表示される。また商品候補領域122には、ステップST6の処理により選択された短距離辞書ファイル31の特徴量データを用い、ステップST9の認識処理により得られたK品目(図では6品目)の商品が登録商品候補として選択可能に表示される。
短距離辞書ファイル31には、撮影距離が予め設定された第1の距離D1(cm)未満のときの基準画像から得られた特徴量データを含む商品別辞書データが保存されている。したがって、撮像部14によって撮影された商品Mの画像は基準画像と解像度が近似しているので、認識率は高くなる。
登録商品候補の中に該当商品Mが含まれている場合、ユーザは、その商品Mにタッチする等して選択する。そうすると、該当商品Mが販売商品として確定され、POS端末2に売上登録される。
また、登録商品候補が表示される前に、スキャナ装置1では、登録商品候補の最大類似度が確定閾値Lmaxを超えるか否かが判定される。そして、最大類似度が確定閾値Lmaxを超える場合には、この最大類似度を有する登録商品候補のデータの適正距離フラグF0がチェックされる。ここで、適正距離フラグF0が“1”にセットされていた場合、この最大類似度を有する登録商品候補の商品IDで特定される商品が販売商品として自動的に確定され、POS端末2に売上登録される。
例えば、商品「蜜柑」はサイズが小さい。このため、短距離辞書ファイル31に登録されている認識対象商品「蜜柑」の商品別辞書データは、適正距離フラグF0が、信頼性が高いことを意味する“1”にセットされている。この場合において、ユーザが商品「蜜柑」を撮像部14に対して第1の距離D1より近くに翳すと、スキャナ装置1では短距離辞書ファイル31が選択される。そして、撮影画像から得られる商品「蜜柑」の外観特徴量と、短距離辞書ファイル31に登録されている認識対象商品「蜜柑」の特徴量データとの類似度が算出される。ここで、この類似度が最大類似度であり、かつ確定閾値Lmaxを超える場合、商品「蜜柑」は自動的にPOS端末2に売上登録される。したがって、ユーザが登録商品候補の中から該当する商品Mを選択する手間なく、該当商品を販売商品として確定することができる。
このように本実施形態によれば、読取窓1Bに翳された商品から撮像部14までの撮影距離dに応じて使用する認識辞書ファイル31,32,33を切り替えて商品認識を行うので、スキャナ装置1は、撮影距離dに係らず高い認識率で商品を認識することができる。
[第2の実施形態]
次に、第2の実施形態について、図13〜図18を用いて説明する。なお、本実施形態も第1の実施形態と同様にスキャナ装置1に商品認識装置としての機能を持たせた場合である。このため、店舗会計システムの外観図、スキャナ装置1とPOS端末2とのハードウェア構成を示すブロック図は、第1の実施形態と共通なので共通部分に同一符号を付し、詳しい説明は省略する。
図13は、第2の実施形態で使用する認識辞書ファイル40を示す模式図である。図示するように、第2の実施形態では、認識辞書ファイル40として短距離辞書ファイル41と長距離辞書ファイル42との2種類を用いる。短距離辞書ファイル41には、撮影距離が予め設定された閾値距離Dx(cm)未満のときの基準画像から得られた特徴量データを含む商品別辞書データが保存される。長距離辞書ファイル42には、撮影距離が前記閾値距離Dx以上のときの基準画像から得られた特徴量データを含む商品別辞書データが保存される。
図14は、各認識辞書ファイル41,42に保存される商品別辞書データの構造を示す模式図である。図示するように、商品別辞書データは、認識対象商品を識別する商品ID及び商品名と、複数の特徴量データ0〜nとを含む。
第1の実施形態で説明したように、認識対象商品には、サイズによって適正な撮影距離がある。例えば、蜜柑のように比較的サイズの小さい商品は、閾値距離Dxよりも短い撮影距離が適正距離となる。これに対し、文旦のように比較的サイズの大きい商品は、閾値距離Dxよりも長い撮影距離が適正距離となる。
本実施形態では、適正な撮影距離が閾値距離Dx未満の認識対象商品については、閾値距離Dx未満の撮影距離で撮影した基本画像から得られる特徴量データを含む商品別辞書データを短距離辞書ファイル41に保存する。長距離辞書ファイル42には、当該認識対象商品に関する商品別辞書データを保存しない。逆に、適正な撮影距離が閾値距離Dx以上の認識対象商品については、閾値距離Dx以上の撮影距離で撮影した基本画像から得られる特徴量データを含む商品別辞書データを長距離辞書ファイル42に保存する。短距離辞書ファイル41には、当該認識対象商品に関する商品別辞書データを保存しない。
図15は、商品認識装置としての機能を示すブロック図である。本実施形態でも、この機能をスキャナ装置1が有する。すなわちスキャナ装置1は、撮像部14の撮像領域に翳された商品Mを認識し、販売商品として確定するまでの機能として、特徴量抽出手段81、類似度算出手段82、候補出力手段83、確定手段84及び警告手段85を備える。
特徴量抽出手段81、撮像部14で撮影された画像からその画像に含まれる商品の外観特徴量を抽出する。類似度算出手段82は、特徴量抽出手段81により抽出された外観特徴量を、距離別認識辞書ファイル40(短距離辞書ファイル41と長距離辞書ファイル42との両方)の特徴量データと照合して、外観特徴量が特徴量データに対してどの程度類似しているかを示す類似度を認識対象商品毎に算出する。候補出力手段83は、類似度算出手段82により算出される類似度の大きい順に認識対象商品を認識商品候補としてタッチパネル12に選択可能に表示出力する。警告手段85は、認識商品候補の中から撮像部14で撮影された商品Mが選択されないと、撮像部14で撮影された商品と撮像部14との間隔を変えるように警告する。
各手段81〜85は、スキャナ装置1のCPU111が、商品認識プログラムに従って動作することで実現される。商品認識プログラムが起動すると、スキャナ装置1のCPU111は、図16の流れ図に示す手順で各部を制御する。
図16において、ステップST31〜ST34までは、第1の実施形態のステップST1〜ST4までの処理と同一である。すなわちCPU111は、商品確定フラグF1を“0”にリセットし(ST31)、撮像部14に対して撮像オン信号を出力する(ST32)。そしてCPU111は、フレーム画像を取り込み(ST33)、このフレーム画像に商品が撮影されているか否かを確認する(ST34)。
フレーム画像に商品が撮影されていない場合(ST34にてNO)、CPU111は、RAM104から次のフレーム画像を取り込む(ST33)。そしてCPU111は、このフレーム画像に商品が撮影されているか否かを確認する(ST34)。
フレーム画像に商品Mが撮影されていた場合(ST34にてYES)、CPU111は、フレーム画像から抽出された輪郭内の画像から商品Mの形状、表面の色合い、模様、凹凸状況等の外観特徴量を抽出する(ST35:特徴量抽出手段81)。外観特徴量を抽出した後、CPU111は、認識処理を起動する(ST36)。
図17及び図18は、認識処理の手順を示す流れ図である。先ずCPU111は、接続インターフェース115を介して接続されるPOS端末2の補助記憶部205にアクセスして、短距離辞書ファイル41を検索する(ST41)。そしてCPU111は、短距離辞書ファイル41から1商品のデータレコード(商品ID、商品名、特徴量データ0〜n)を読み込む(ST42)。
データレコードを読み込めたならば、CPU111は、当該レコードの特徴量データ0〜n毎に、ステップST35の処理で抽出された商品の外観特徴量が当該特徴量データ0〜nに対してどの程度類似しているかを示す類似度を算出する。そしてCPU111は、特徴量データ0〜n毎に算出された類似度の最大値を、当該レコードの商品IDで特定される商品と検出された商品Mとの類似度として決定する(ST43:類似度算出手段82)。なお、決定される類似度は、特徴量データ0〜n毎に算出された類似度の最大値でなく、特徴量データ0〜n毎に算出された類似度の合計値あるいは平均値等であってもよい。
CPU111は、ステップST43の処理で決定された類似度が予め設定された候補閾値Lminを超えるか否かを確認する(ST44)。類似度が候補閾値Lminを超えていない場合(ST44にてNO)、CPU111は、ステップST46の処理に進む。
類似度が候補閾値Lminを超えている場合には(ST44にてYES)、CPU111は、当該レコードの商品IDと類似度とを登録商品候補(認識商品候補)のデータとして、RAM114に格納する(ST45)。しかる後、CPU111は、ステップST46の処理に進む。
ステップST46では、CPU111は、短距離辞書ファイル41に未処理のデータレコードが存在するか否かを確認する。存在する場合(ST46にてYES)、CPU111は、ステップST42の処理に戻る。すなわちCPU111は、短距離辞書ファイル41から未処理のデータレコードを読み込み、前記ステップST43〜ST45の処理を実行する。
短距離辞書ファイル41に未処理のデータレコードが存在しない場合、すなわち短距離辞書ファイル41の検索を終了したならば(ST46にてNO)、CPU111は、長距離辞書ファイル42を検索する(ST47)。以後、CPU111は、ステップST48〜ST52として、短距離辞書ファイル41に対して実行したステップST42〜ST46と同一の処理を実行する。
そして長距離辞書ファイル42の検索を終了したならば(ST52にてNO)、CPU111は登録商品候補のデータがRAM114に格納されているか否かを確認する(ST53)。登録商品候補のデータが格納されていない場合(ST53にてNO)、今回の認識処理が終了する。
登録商品候補のデータが格納されている場合には(ST53にてYES)、CPU111は、RAM114に格納された登録商品候補のデータの最大類似度が予め設定された確定閾値Lmax(Lmax>Lmin)を超えるか否かを確認する(ST54)。最大類似度が確定閾値Lmaxを超えない場合(ST54にてNO)、CPU111は、RAM114に格納された登録商品候補のデータの中から類似度が大きい順に最大でK(K>2)品目の商品を選択する。そしてCPU111は、選択した最大K品目の商品を登録商品候補の商品リストとしてディスプレイ12aに表示する(ST55:候補出力手段83)。そしてCPU111は、当該商品リストの中からいずれかの商品が選択されたか否かを確認する(ST56)。例えばキーボード11の再検索キーが入力されて選択されないことが宣言された場合(ST56にてNO)、CPU111は、例えば「撮影距離を変えてください」というように、撮影距離を変更させることを指示する音声ガイダンスをスピーカ17から発音させる(ST57:警告手段85)。
これに対し、タッチパネル12またはキーボード11の操作入力により、登録商品候補の商品リストの中からいずれか1商品が選択された場合には(ST56にてYES)、CPU111は、この選択された商品の商品IDをRAM114から取得する(ST58)。そしてCPU111は、この取得した商品IDを、販売商品の商品IDとして確定し、通信ケーブル330を介してPOS端末2に送信する(ST59:確定手段84)。またCPU111は、商品確定フラグF1を“1”にセットする(ST60)。
また、ステップST54にて登録商品候補のデータの最大類似度が確定閾値Lmaxを超える場合には(ST54にてYES)、CPU111は、ステップST59の処理に進む。すなわちCPU111は、最大類似度を有する商品の商品IDをRAM114から取得する。そしてCPU111は、この取得した商品IDを、販売商品の商品IDとして確定し、通信ケーブル330を介してPOS端末2に送信する(ST59)。また、CPU111は、商品確定フラグF1を“1”にセットする(ST60)。因みに、ステップST58とステップST59との処理手順は逆でもよい。
以上で、今回の認識処理は終了する。
認識処理が終了すると、CPU111は、商品確定フラグF1が“1”にセットされたか否かを確認する(ST37)。商品確定フラグF1が“1”にセットされていない場合(ST37にてNO)、CPU111は、ステップST33に戻る。すなわちCPU111は、RAM114に保存されている別のフレーム画像を取り込む(ST33)。そしてCPU111は、前記ステップST34以降の処理を再度実行する。
商品確定フラグF1が“1”にセットされていた場合には(ST37にてYES)、CPU111は、撮像部14に対して撮像オフ信号を出力する(ST38)。この撮像オフ信号により、撮像部14は撮像を中止する。以上で、商品認識プログラムは終了する。
このように本実施形態においては、短距離辞書ファイル41には適正な撮影距離が閾値距離Dx未満の認識対象商品の商品別辞書データが保存され、長距離辞書ファイル42には適正な撮影距離が閾値距離Dx以上の認識対象商品の商品別辞書データが保存される。そして、商品Mを読取窓1Bに翳すと、この商品Mと撮像部14との撮影距離に係らずスキャナ装置1では、短距離辞書ファイル41と長距離辞書ファイル42との両方に登録されている商品別辞書データの特徴量データと撮影画像から抽出された商品画像の外観特徴量との類似度が算出される。
したがって、サイズが小さいために適正な撮影距離が閾値距離Dx未満の商品を、読取窓1Bの近く、すなわち撮影距離が閾値距離Dx未満の位置にて翳した際には、高い認識率をもって商品が認識される。ところが、この商品を閾値距離Dx以上離して読取窓1Bに翳した際には、認識率が低くなる。この場合、例えば「撮影距離を変えてください」なる警告が発せられるので、ユーザは、商品を読取窓1Bに近づけるであろう。その結果、当該商品は高い認識率もって認識される。
一方、サイズが大きいために適正な撮影距離が閾値距離Dx以上の商品を、読取窓1Bから閾値距離Dx以上離して翳した場合には、高い認識率をもって商品が認識される。ところが、この商品を読取窓1Bの近く、すなわち撮影距離が閾値距離Dx未満の位置にて翳した際には、認識率が低くなる。この場合も同様な警告が発せられるので、ユーザは、商品を読取窓1Bから離すであろう。その結果、商品は高い認識率もって認識される。
このように第2の実施形態においても、スキャナ装置1は、高い認識率をもって商品を認識することができる。
なお、本発明は、前記実施形態に限定されるものではない。
例えば第2の実施形態では、認識処理において、先に短距離辞書ファイル41を検索し(ST41〜ST46)、後から長距離辞書ファイル42を検索したが(ST47〜ST52)、先に長距離辞書ファイル42を検索し(ST47〜ST52)、後から短距離辞書ファイル41を検索してもよい(ST41〜ST46)。
また第1の実施形態では、認識辞書ファイル30を短距離辞書ファイル31、中距離辞書ファイル32及び長距離辞書ファイル33の3種類とし、第2の実施形態では、短距離辞書ファイル41と長距離辞書ファイル42との2種類としたが、距離別認識辞書ファイルの数はこれに限定されるものではない。4種類以上とすることで、さらに認識率は高まる。
また、前記各実施形態は、スキャナ装置1が商品認識装置としての機能を全て有したが、スキャナ装置1とPOS端末2とが商品認識装置としての機能を分散して有してもよい。あるいは、スキャナ装置1をPOS端末2に組み込んで一体的に構成し、この一体構成の装置が商品認識装置としての機能を有してもよい。また、店舗サーバ等の外部装置に発明の機能を実現させる商品認識プログラムを全てまたは一部を記憶させて構成してもよい。また、本実施形態では据え置き式のスキャナにて説明を行ったが、持ち運びが可能な携帯型のスキャナであってもよい。
なお、前記各実施形態は、装置内部のプログラム記憶部であるROMに発明の機能を実現させる商品認識プログラムが予め記録されているものとした。しかしこれに限らず、同様のプログラムがネットワークから装置にダウンロードされてもよい。あるいは、記録媒体に記録された同様のプログラムが、装置にインストールされてもよい。記録媒体は、CD−ROM,メモリカード等のようにプログラムを記憶でき、かつ装置が読み取り可能であれば、その形態は問わない。また、プログラムのインストールやダウンロードにより得る機能は、装置内部のOS(オペレーティング・システム)等と協働してその機能を実現させるものであってもよい。また、本実施形態のプログラムを、通信機能を有する携帯電話やいわゆるPDAのような携帯情報端末に組み込んで、その機能を実現させるものであってもよい。
この他、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1]商品を撮影する撮像部で撮影された画像からその画像に含まれる商品の外観特徴量を抽出する特徴量抽出手段と、前記撮像部からこの撮像部で撮影された商品までの距離を測定する距離測定手段と、認識対象商品を撮影したときの撮影距離別にその撮影距離で前記認識対象商品を撮影した基準画像から得られる当該認識対象商品の表面情報を表わす特徴量データを保存する距離別認識辞書ファイルのなかから、前記距離測定手段で測定された距離に相当する認識辞書ファイルを選択するファイル選択手段と、前記特徴量抽出手段により抽出された外観特徴量を、前記ファイル選択手段により選択された前記認識辞書ファイルの前記特徴量データと照合して、前記外観特徴量が前記特徴量データに対してどの程度類似しているかを示す類似度を前記認識対象商品毎に算出する類似度算出手段と、
この類似度算出手段により算出される前記類似度に基づいて前記認識対象商品を認識商品候補として出力する候補出力手段と、を具備したことを特徴とする商品認識装置。
[2]前記候補出力手段は、認識商品候補の認識対象商品を選択可能に表示出力する手段であり、前記認識商品候補の中から選択された認識対象商品を前記撮像部で撮影された商品として確定する第1の確定手段を含む付記[1]記載の商品認識装置。
[3]前記距離別認識辞書ファイルに保存される前記認識対象商品毎の特徴量データは、その商品にとって適正な撮影距離で撮影された基準画像から得られたか否かを識別する情報をさらに記憶しており、前記候補出力手段により認識商品候補として出力される認識対象商品の最大類似度が予め設定された確定値以上であり、かつその最大類似度が前記適正な撮影距離で撮影された基準画像から得られた特徴量データにより算出された場合に、この最大類似度を有する認識対象商品を前記撮像部で撮影された商品として確定する第2の確定手段、をさらに具備する付記[1]または[2]記載の商品認識装置。
[4]商品を撮影する撮像部で撮影された画像からその画像に含まれる商品の外観特徴量を抽出する特徴量抽出手段と、前記特徴量抽出手段により抽出された外観特徴量を、認識対象商品を撮影したときの撮影距離別にその撮影距離で前記認識対象商品を撮影した基準画像から得られる当該認識対象商品の表面情報を表わす特徴量データを保存する距離別認識辞書ファイルの前記特徴量データと照合して、前記外観特徴量が前記特徴量データに対してどの程度類似しているかを示す類似度を前記認識対象商品毎に算出する類似度算出手段と、この類似度算出手段により算出される前記類似度に基づいて前記認識対象商品を認識商品候補として出力する候補出力手段と、を具備したことを特徴とする商品認識装置。
[5]前記候補出力手段は、認識商品候補の認識対象商品を選択可能に表示出力する手段であり、前記認識商品候補の中から前記撮像部で撮影された商品が選択されないと、前記撮像部で撮影された商品と前記撮像部との間隔を変えるように警告する警告手段、をさらに具備したことを特徴とする付記[4]記載の商品認識装置。
[6]コンピュータに、商品を撮影する撮像部で撮影された画像からその画像に含まれる商品の外観特徴量を抽出する特徴量抽出機能と、認識対象商品を撮影したときの撮影距離別にその撮影距離で前記認識対象商品を撮影した基準画像から得られる当該認識対象商品の表面情報を表わす特徴量データを保存する距離別認識辞書ファイルのなかから、距離測定手段で測定された前記撮像部からこの撮像部で撮影された商品までの距離に相当する認識辞書ファイルを選択するファイル選択機能と、前記特徴量抽出機能により抽出された外観特徴量を、前記ファイル選択機能により選択された前記認識辞書ファイルの前記特徴量データと照合して、前記外観特徴量が前記特徴量データに対してどの程度類似しているかを示す類似度を前記認識対象商品毎に算出する類似度算出機能と、この類似度算出機能により算出される前記類似度に基づいて前記認識対象商品を認識商品候補として出力する候補出力機能と、を実現させるための商品認識プログラム。
1…スキャナ装置、2…POS端末、12…タッチパネル、14…撮像部、15…距離センサ、31,41…短距離辞書ファイル、32…中距離辞書ファイル、33,42…長距離辞書ファイル、71、81…特徴量抽出手段、72…距離測定手段、73…ファイル選択手段、74、82…類似度算出手段、75、83…候補出力手段、76…第1の確定手段、77…第2の確定手段、78…第1の確定手段、79…第2の確定手段、84…確定手段、85…警告手段。

Claims (6)

  1. 商品を撮影する撮像部で撮影された画像からその画像に含まれる商品の外観特徴量を抽出する特徴量抽出手段と、
    前記撮像部からこの撮像部で撮影された商品までの距離を測定する距離測定手段と、
    認識対象商品を撮影したときの撮影距離別にその撮影距離で前記認識対象商品を撮影した基準画像から得られる当該認識対象商品の表面情報を表わす特徴量データを、その特徴量データがその商品にとって適正な撮影距離で撮影された基準画像から得られたか否かを識別する情報とともに保存する距離別認識辞書ファイルのなかから、前記距離測定手段で測定された距離に相当する認識辞書ファイルを選択するファイル選択手段と、
    前記特徴量抽出手段により抽出された外観特徴量を、前記ファイル選択手段により選択された前記認識辞書ファイルの前記特徴量データと照合して、前記外観特徴量が前記特徴量データに対してどの程度類似しているかを示す類似度を前記認識対象商品毎に算出する類似度算出手段と、
    この類似度算出手段により前記認識対象商品毎に算出される前記類似度の最大値が予め設定された確定値以上であり、かつその最大値となる類似度が前記適正な撮影距離で撮影された基準画像から得られた特徴量データにより算出された場合に、この類似度を有する認識対象商品を前記撮像部で撮影された商品として確定する確定手段と、
    を具備したことを特徴とする商品認識装置。
  2. 前記確定手段により前記商品を確定できないとき、前記類似度算出手段により算出される前記類似度が大きい順に前記認識対象商品を認識商品候補として出力する候補出力手段、
    をさらに具備したことを特徴とする請求項1記載の商品認識装置。
  3. 前記候補出力手段により出力された前記認識商品候補の中から選択された認識対象商品を前記撮像部で撮影された商品として確定する選択確定手段、
    をさらに具備したことを特徴とする請求項記載の商品認識装置。
  4. 商品を撮影する撮像部で撮影された画像からその画像に含まれる商品の外観特徴量を抽出する特徴量抽出手段と、
    認識対象商品を撮影したときの撮影距離別にその撮影距離で前記認識対象商品を撮影した基準画像から得られる当該認識対象商品の表面情報を表わす特徴量データを保存する距離別認識辞書ファイルと、
    前記特徴量抽出手段により抽出された外観特徴量を、前記距離別認識辞書ファイルの前記特徴量データと照合して、前記外観特徴量が前記特徴量データに対してどの程度類似しているかを示す類似度を前記認識対象商品毎に算出する類似度算出手段と、
    この類似度算出手段により算出される前記類似度に基づいて前記認識対象商品を認識商品候補として出力する候補出力手段と、
    を具備し
    前記距離別認識辞書ファイルは、それぞれその撮影距離が適正である商品の特徴量データを保存し、前記撮影距離が適正でない商品の特徴量データを保存しないことを特徴とする商品認識装置。
  5. 前記候補出力手段は、認識商品候補の認識対象商品を選択可能に表示出力する手段であり、
    前記認識商品候補の中から前記撮像部で撮影された商品が選択されないと、前記撮像部で撮影された商品と前記撮像部との間隔を変えるように警告する警告手段、をさらに具備したことを特徴とする請求項4記載の商品認識装置。
  6. コンピュータに、
    商品を撮影する撮像部で撮影された画像からその画像に含まれる商品の外観特徴量を抽出する特徴量抽出機能と、
    認識対象商品を撮影したときの撮影距離別にその撮影距離で前記認識対象商品を撮影した基準画像から得られる当該認識対象商品の表面情報を表わす特徴量データを、その特徴量データがその商品にとって適正な撮影距離で撮影された基準画像から得られたか否かを識別する情報とともに保存する距離別認識辞書ファイルのなかから、距離測定手段で測定された前記撮像部からこの撮像部で撮影された商品までの距離に相当する認識辞書ファイルを選択するファイル選択機能と、
    前記特徴量抽出機能により抽出された外観特徴量を、前記ファイル選択機能により選択された前記認識辞書ファイルの前記特徴量データと照合して、前記外観特徴量が前記特徴量データに対してどの程度類似しているかを示す類似度を前記認識対象商品毎に算出する類似度算出機能と、
    この類似度算出機能により前記認識対象商品毎に算出される前記類似度の最大値が予め設定された確定値以上であり、かつその最大値となる類似度が前記適正な撮影距離で撮影された基準画像から得られた特徴量データにより算出された場合に、この類似度を有する認識対象商品を前記撮像部で撮影された商品として確定する確定機能と、
    を実現させるための商品認識プログラム。
JP2012243645A 2012-11-05 2012-11-05 商品認識装置及び商品認識プログラム Active JP5707375B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012243645A JP5707375B2 (ja) 2012-11-05 2012-11-05 商品認識装置及び商品認識プログラム
US14/065,512 US20140126773A1 (en) 2012-11-05 2013-10-29 Commodity recognition apparatus and commodity recognition method
CN201310533195.1A CN103810468B (zh) 2012-11-05 2013-10-31 商品识别装置及商品识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012243645A JP5707375B2 (ja) 2012-11-05 2012-11-05 商品認識装置及び商品認識プログラム

Publications (2)

Publication Number Publication Date
JP2014092975A JP2014092975A (ja) 2014-05-19
JP5707375B2 true JP5707375B2 (ja) 2015-04-30

Family

ID=50622425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012243645A Active JP5707375B2 (ja) 2012-11-05 2012-11-05 商品認識装置及び商品認識プログラム

Country Status (3)

Country Link
US (1) US20140126773A1 (ja)
JP (1) JP5707375B2 (ja)
CN (1) CN103810468B (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5553866B2 (ja) * 2012-07-23 2014-07-16 東芝テック株式会社 商品認識装置及び認識辞書追加プログラム
JP5826800B2 (ja) * 2013-07-17 2015-12-02 東芝テック株式会社 認識辞書評価装置及び認識辞書評価プログラム
JP6193136B2 (ja) * 2014-01-21 2017-09-06 東芝テック株式会社 画像情報処理装置及びプログラム
JPWO2015145977A1 (ja) * 2014-03-27 2017-04-13 日本電気株式会社 情報処理装置、画像処理方法とプログラム、ならびに、pos端末装置
JP6239460B2 (ja) * 2014-07-28 2017-11-29 東芝テック株式会社 情報処理装置及びプログラム
JP6263483B2 (ja) * 2015-01-26 2018-01-17 東芝テック株式会社 物品認識装置、販売データ処理装置および制御プログラム
JP6651705B2 (ja) 2015-03-31 2020-02-19 日本電気株式会社 情報処理装置、情報処理方法、およびプログラム
JP6322603B2 (ja) * 2015-06-23 2018-05-09 東芝テック株式会社 画像処理装置および画像処理プログラムと、陳列状況判定装置
WO2017079972A1 (en) * 2015-11-13 2017-05-18 Xiaogang Wang A method and a system for classifying objects in images
US20170193290A1 (en) * 2016-01-06 2017-07-06 Toshiba Tec Kabushiki Kaisha Commodity registration apparatus and commodity registration method
JP6209716B1 (ja) * 2016-06-02 2017-10-11 サインポスト株式会社 情報処理システム、情報処理方法、及びプログラム
JP7197971B2 (ja) * 2017-08-31 2022-12-28 キヤノン株式会社 情報処理装置、情報処理装置の制御方法及びプログラム
US20190073880A1 (en) * 2017-09-06 2019-03-07 Toshiba Tec Kabushiki Kaisha Article recognition apparatus, article recognition method, and non-transitory readable storage medium
CN111587450A (zh) * 2017-12-21 2020-08-25 提立特有限公司 零售结账终端新鲜农产品标识系统
CN108491873B (zh) * 2018-03-19 2019-05-14 广州蓝深科技有限公司 一种基于数据分析的商品分类方法
CN110610577A (zh) * 2018-06-15 2019-12-24 腾讯科技(深圳)有限公司 信息自助处理方法、装置、系统、存储介质及电子装置
JP2021018470A (ja) * 2019-07-17 2021-02-15 東芝テック株式会社 物品特定装置及びプログラム
CN110600016B (zh) * 2019-09-20 2022-02-25 北京市律典通科技有限公司 卷宗推送方法和装置
JP7144082B2 (ja) * 2021-01-20 2022-09-29 Necプラットフォームズ株式会社 商品認識装置、システム、方法及びプログラム
CN113111800A (zh) * 2021-04-19 2021-07-13 北京每日优鲜电子商务有限公司 无人货柜商品上架判断方法、设备和存储介质
WO2022249885A1 (ja) * 2021-05-28 2022-12-01 パナソニックIpマネジメント株式会社 識別装置、及び、識別方法
US11928662B2 (en) * 2021-09-30 2024-03-12 Toshiba Global Commerce Solutions Holdings Corporation End user training for computer vision system
WO2023054090A1 (ja) * 2021-10-01 2023-04-06 ソニーセミコンダクタソリューションズ株式会社 認識処理装置、認識処理方法、および認識処理システム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2879130B2 (ja) * 1994-04-14 1999-04-05 株式会社エヌ・ティ・ティ・データ 物品識別システム及び方法
JPH08138028A (ja) * 1994-11-11 1996-05-31 Tec Corp 物品認識装置
US6201885B1 (en) * 1998-09-11 2001-03-13 Bunge Foods Corporation Method for bakery product measurement
TWI299471B (en) * 2001-08-24 2008-08-01 Toshiba Kk Person recognition apparatus
JP2005149370A (ja) * 2003-11-19 2005-06-09 Matsushita Electric Ind Co Ltd 画像撮影装置、個人認証装置及び画像撮影方法
EP1766552A2 (en) * 2004-06-23 2007-03-28 Strider Labs, Inc. System and method for 3d object recognition using range and intensity
JP2007072665A (ja) * 2005-09-06 2007-03-22 Fujitsu Ten Ltd 物体判別装置、物体判別方法および物体判別プログラム
CN101226591A (zh) * 2008-01-31 2008-07-23 上海交通大学 基于手机摄像头结合人脸识别技术的身份识别方法
JP5434708B2 (ja) * 2010-03-15 2014-03-05 オムロン株式会社 照合装置、デジタル画像処理システム、照合装置制御プログラム、コンピュータ読み取り可能な記録媒体、および照合装置の制御方法
JP5194149B2 (ja) * 2010-08-23 2013-05-08 東芝テック株式会社 店舗システムおよびプログラム
CN102063616A (zh) * 2010-12-30 2011-05-18 上海电机学院 一种基于图像特征匹配的商品自动识别系统及方法
JP2012247968A (ja) * 2011-05-27 2012-12-13 Toshiba Tec Corp 情報処理装置、情報処理方法及び制御プログラム
CN102332137A (zh) * 2011-09-23 2012-01-25 纽海信息技术(上海)有限公司 商品匹配方法及系统
CN102722889B (zh) * 2012-05-31 2015-12-16 信帧科技(北京)有限公司 一种图像背景获取方法和装置

Also Published As

Publication number Publication date
JP2014092975A (ja) 2014-05-19
US20140126773A1 (en) 2014-05-08
CN103810468B (zh) 2017-10-24
CN103810468A (zh) 2014-05-21

Similar Documents

Publication Publication Date Title
JP5707375B2 (ja) 商品認識装置及び商品認識プログラム
JP5747014B2 (ja) 商品認識装置及び商品認識プログラム
US10108830B2 (en) Commodity recognition apparatus and commodity recognition method
JP5619095B2 (ja) 商品認識装置及び商品認識プログラム
JP5553866B2 (ja) 商品認識装置及び認識辞書追加プログラム
JP5826152B2 (ja) 商品認識装置及び商品認識プログラム
US10169752B2 (en) Merchandise item registration apparatus, and merchandise item registration method
JP5551143B2 (ja) 店舗システムおよびプログラム
JP5656796B2 (ja) 商品データ処理装置、商品データ処理方法及び制御プログラム
JP5847117B2 (ja) 認識辞書作成装置及び認識辞書作成プログラム
JP5511864B2 (ja) 店舗会計システム及び店舗会計プログラム
JP2013250768A (ja) 商品認識装置及び商品認識プログラム
JP2014052810A (ja) 情報処理装置及びプログラム
JP2014146384A (ja) 商品読取装置、商品読取方法及び商品読取プログラム
JP5622756B2 (ja) 商品読取装置及び商品読取プログラム
JP6239460B2 (ja) 情報処理装置及びプログラム
US20170344851A1 (en) Information processing apparatus and method for ensuring selection operation
JP5770899B2 (ja) 情報処理装置及びプログラム
JP5760032B2 (ja) 認識辞書作成装置及び認識辞書作成プログラム
JP5753929B2 (ja) 商品認識装置、方法及び認識辞書追加プログラム
US20170083891A1 (en) Information processing apparatus and information processing method
JP6392406B2 (ja) 商品認識装置及び商品認識プログラム
JP2015099550A (ja) 商品認識装置及び商品認識プログラム
JP6133470B2 (ja) 商品認識装置及び商品認識プログラム
JP5784170B2 (ja) 店舗会計システム及び店舗会計プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150302

R150 Certificate of patent or registration of utility model

Ref document number: 5707375

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150