JP6947283B2 - 店舗装置、店舗システム、画像取得方法、およびプログラム - Google Patents

店舗装置、店舗システム、画像取得方法、およびプログラム Download PDF

Info

Publication number
JP6947283B2
JP6947283B2 JP2020502774A JP2020502774A JP6947283B2 JP 6947283 B2 JP6947283 B2 JP 6947283B2 JP 2020502774 A JP2020502774 A JP 2020502774A JP 2020502774 A JP2020502774 A JP 2020502774A JP 6947283 B2 JP6947283 B2 JP 6947283B2
Authority
JP
Japan
Prior art keywords
image
product
display
learning
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020502774A
Other languages
English (en)
Other versions
JPWO2019167278A1 (ja
Inventor
壮馬 白石
壮馬 白石
岩元 浩太
浩太 岩元
二徳 高田
二徳 高田
秀雄 横井
秀雄 横井
恵美 北川
恵美 北川
サイプラサド チャンドラカント コトゥルワル
サイプラサド チャンドラカント コトゥルワル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019167278A1 publication Critical patent/JPWO2019167278A1/ja
Application granted granted Critical
Publication of JP6947283B2 publication Critical patent/JP6947283B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/18Payment architectures involving self-service terminals [SST], vending machines, kiosks or multimedia terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/20Point-of-sale [POS] network systems
    • G06Q20/203Inventory monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/20Point-of-sale [POS] network systems
    • G06Q20/208Input by product or record sensing, e.g. weighing or scanner processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07GREGISTERING THE RECEIPT OF CASH, VALUABLES, OR TOKENS
    • G07G1/00Cash registers
    • G07G1/0036Checkout procedures
    • G07G1/0045Checkout procedures with a code reader for reading of an identifying code of the article to be registered, e.g. barcode reader or radio-frequency identity [RFID] reader
    • G07G1/0054Checkout procedures with a code reader for reading of an identifying code of the article to be registered, e.g. barcode reader or radio-frequency identity [RFID] reader with control of supplementary check-parameters, e.g. weight or number of articles
    • G07G1/0063Checkout procedures with a code reader for reading of an identifying code of the article to be registered, e.g. barcode reader or radio-frequency identity [RFID] reader with control of supplementary check-parameters, e.g. weight or number of articles with means for detecting the geometric dimensions of the article of which the code is read, such as its size or height, for the verification of the registration

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Geometry (AREA)
  • Cash Registers Or Receiving Machines (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像を用いた商品認識技術に関する。
画像を用いて商品を認識する技術の一例が、例えば、下記特許文献1に開示されている。下記特許文献1では、カメラにより撮像された対象物をオブジェクト認識することで当該対象物を商品として識別し、その商品を購入対象商品として登録する機能を備える商品登録装置が開示されている。
特開2016−62545号公報
画像を用いて商品を識別可能とするためには、識別対象の商品毎に学習用および評価用の画像を多数用意し、かつ、それらの画像を使って識別器を構築する作業が必要となる。そして、この作業にかかる手間を削減するためには、外部に委託したり、専用の装置を用意したりすることが考えられるが、その場合、コストが嵩む。
本発明は、上記の課題に鑑みてなされたものである。本発明の目的の一つは、商品を識別するために利用される識別器を構築する際にかかるコストを削減する技術を提供することである。
本発明の店舗装置は、
ディスプレイの表示面上に載置された商品が写る画像を撮像装置から取得する画像取得手段と、
顧客が購入する商品を登録する商品登録モードと、商品を識別するための識別器の学習用画像を収集する画像収集モードと、を切り替えるモード切替手段と、
前記商品登録モードのとき、前記画像に基づいて前記識別器が識別した商品を購入対象の商品として登録する商品登録手段と、
前記画像収集モードのとき、前記ディスプレイの表示面に所定の背景画像を表示させる表示制御手段と、
前記背景画像と前記商品とが写る画像を前記学習用画像として所定の記憶装置に記憶させる画像収集手段と、
を備える。
本発明の店舗システムは、
表示面が商品の載置面として利用されるディスプレイと、
前記ディスプレイの表示面上に載置された商品が写る画像を生成する撮像装置と、
前記撮像装置により生成された画像を取得する画像取得手段と、
顧客が購入する商品を登録する商品登録モードと、商品を識別するための識別器の学習用画像を収集する画像収集モードと、を切り替えるモード切替手段と、
前記商品登録モードのとき、前記画像に基づいて前記識別器が識別した商品を購入対象の商品として登録する商品登録手段と、
前記画像収集モードのとき、前記ディスプレイの表示面に所定の背景画像を表示させる表示制御手段と、
前記背景画像と前記商品とが写る画像を前記学習用画像として所定の記憶装置に記憶させる画像収集手段と、
を備える。
本発明の画像取得方法は、
コンピュータが、
ディスプレイの表示面上に載置された商品が写る画像を撮像装置から取得し、
顧客が購入する商品を登録する商品登録モードと、商品を識別するための識別器の学習用画像を収集する画像収集モードと、を切り替え、
前記商品登録モードのとき、前記画像に基づいて前記識別器が識別した商品を購入対象の商品として登録し、
前記画像収集モードのとき、前記ディスプレイの表示面に所定の背景画像を表示させ、
前記背景画像と前記商品とが写る画像を前記学習用画像として所定の記憶装置に記憶させる、
ことを含む。
本発明のプログラムは、コンピュータに上述の画像取得方法を実行させる。
本発明によれば、商品を識別するために利用される識別器を構築する際にかかるコストを削減することができる。
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
第1実施形態の店舗システムの構成例を示す図である。 店舗システムのハードウエア構成を例示するブロック図である。 第1実施形態の店舗システムが商品登録モード時に実行する処理の流れを例示する図である。 第1実施形態の店舗システムが画像収集モード時に実行する処理の流れを例示する図である。 画像収集部が所定の記憶装置に記憶する情報の一例を示す図である。 第3実施形態の店舗システムの構成例を示す図である。 第3実施形態の表示制御部によりディスプレイに表示される情報の一例を示す図である。 第4実施形態の店舗システムの構成例を示す図である。 第4実施形態の店舗システムにより実行される学習処理の流れを例示するフローチャートである。 第5実施形態の店舗システム1の構成例を示す図である。 第5実施形態の店舗システム1の処理の流れを例示するシーケンス図である。 撮影画像から商品領域画像を抽出する第1の手法の例示する図である。 撮影画像から商品領域画像を抽出する第2の手法を例示する図である。 撮影画像から商品領域画像を抽出する第3の手法の例示する図である。 第3の手法の他の例を示す図である。 撮影画像から商品領域画像を抽出する第4の手法を例示する図である。 画像生成部154の動作を具体的に例示する図である。
以下、本発明の実施形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また、特に説明する場合を除き、各ブロック図において、各ブロックは、ハードウエア単位の構成ではなく、機能単位の構成を表している。
[第1実施形態]
〔システム構成例〕
図1は、第1実施形態の店舗システム1の構成例を示す図である。なお、図1はあくまで例示であり、本発明に係る店舗システム1は図1に描かれる構成に限定されない。図1に示されるように、店舗システム1は、店舗装置10、会計処理用機器20、撮像装置30、およびディスプレイ40を含んで構成される。店舗装置10は、図示しない配線等によって会計処理用機器20、撮像装置30、およびディスプレイ40と接続されている。
店舗装置10は、一般的なレジ業務に係る処理に加え、商品を識別するための識別器の学習用画像を収集する処理を実行することができる。店舗装置10の各機能については後述する。
会計処理用機器20は、店舗のレジ業務で利用される各種機器である。例えば、会計処理用機器20は、バーコードスキャナ、キャッシャ、ドロワ、自動釣銭機、レシートプリンタ、キーボードやマウスなどの入力機器、ディスプレイ(タッチパネルディスプレイ)やスピーカーなどの出力機器を含む。
ディスプレイ40は、様々な画像をその表示面上に表示する。また、ディスプレイ40は、後述の店舗装置10による制御に従って、特定の背景画像を表示する。また、ディスプレイ40の表示面は、図示されるように、商品Pを載置する載置面としても利用される。
撮像装置30は、商品Pが写る画像を生成する。また、図1に示されるように、撮像装置30は、ディスプレイ40を撮像範囲に含むように配置されている。撮像装置30は、ディスプレイ40の表示面に表示された画像を背景として、当該ディスプレイ40の表示面に載置された商品Pを撮影することができる。撮像装置30により生成された画像は、店舗装置10に送信される。
図1に例示されるように、本実施形態の店舗装置10は、画像取得部110、モード切替部120、商品登録部130、表示制御部140、および画像収集部150を備える。画像取得部110は、ディスプレイ40の表示面上に載置された商品Pが写る画像を撮像装置30から取得する。モード切替部120は、店舗システム1(店舗装置10)の動作モードを、商品登録モードと画像収集モードとの間で切り替える。商品登録モードは、顧客が購入する商品を登録する処理を実行するモードである。言い換えると、商品登録モードは一般的なレジ装置の処理を実行するモードである。一方、画像収集モードは、商品を識別するための商品識別エンジン(識別器)の学習用画像を収集するモードである。商品登録部130は、上述の商品登録モードのときに動作する。商品登録部130は、画像取得部110により取得された画像に基づいて識別器が識別した商品を、購入対象の商品として登録する。言い換えると、商品登録部130は、画像取得部110により取得された画像を用いて通常のレジ業務に係る処理を実行する処理部である。例えば、商品登録部130は、画像取得部110により取得された画像に基づいて識別された購入商品の情報を、ディスプレイ40または会計処理用機器20として設けられたディスプレイに出力する。表示制御部140および画像収集部150は、画像収集モードのときに動作する。表示制御部140は、ディスプレイ40の表示面に所定の背景画像を表示させる。画像収集部150は、表示制御部140によりディスプレイ40の表示面に表示された背景画像と、ディスプレイ40の表示面上に載置された商品Pと、が写る画像を、識別器の学習用画像として取得する。そして、画像収集部150は、識別器の学習用画像として取得した画像を、所定の記憶装置に記憶させる。ここで、所定の記憶装置は、例えば、ハードディスクドライブのような不揮発性の記憶装置であってもよいし、RAM(Random Access Memory)のような揮発性の記憶装置であってもよい。
〔ハードウエア構成例〕
店舗システム1は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、店舗システム1がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
図2は、店舗システム1のハードウエア構成を例示するブロック図である。
店舗装置10は、バス1010、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060を有する。
バス1010は、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1020などを互いに接続する方法は、バス接続に限定されない。
プロセッサ1020は、CPU(Central Processing Unit) やGPU(Graphics Processing Unit)などで実現されるプロセッサである。
メモリ1030は、RAM(Random Access Memory)などで実現される主記憶装置である。
ストレージデバイス1040は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、又はROM(Read Only Memory)などで実現される補助記憶装置である。ストレージデバイス1040は店舗装置10の各機能(画像取得部110、モード切替部120、商品登録部130、表示制御部140、および画像収集部150など)を実現するプログラムモジュールを記憶している。プロセッサ1020がこれら各プログラムモジュールをメモリ1030上に読み込んで実行することで、そのプログラムモジュールに対応する各機能が実現される。
入出力インタフェース1050は、店舗装置10と各種入出力デバイスとを接続するためのインタフェースである。図2では、店舗装置10は、会計処理用機器20、撮像装置30、およびディスプレイ40と、入出力インタフェース1050を介して接続されている。会計処理用機器20は、例えば、バーコードスキャナ、キャッシャ、ドロワ、自動釣銭機、レシートプリンタ、キーボードやマウスなどの入力機器、ディスプレイ(タッチパネルディスプレイ)やスピーカーなどの出力機器を含む。撮像装置30は、例えば、CCD(Charge Coupled Device)イメージセンサやCMOS(Complementary Metal Oxide Semiconductor)イメージセンサを搭載するカメラである。撮像装置30は、図示されるように、ディスプレイ40(およびディスプレイ40上に載置される商品P)を撮像範囲に含むように設置される。撮像装置30は、ディスプレイ40上に載置された商品Pを撮影して、その商品Pが写る画像を生成する。ディスプレイ40は、一般的な表示用のデバイスである。なお、ディスプレイ40は、商品Pの載置面としても利用される。そのため、ディスプレイ40は、好ましくは、LCD(Liquid Crystal Display)、PDP(Plasma Display Panel)、有機EL(Electro Luminescence)などの平面型ディスプレイである。また、ディスプレイ40は、ユーザの入力操作を受け付け可能なタッチパネルであってもよい。
ネットワークインタフェース1060は、店舗装置10をネットワークに接続するためのインタフェースである。このネットワークは、例えばLAN(Local Area Network)やWAN(Wide Area Network)である。ネットワークインタフェース1060がネットワークに接続する方法は、無線接続であってもよいし、有線接続であってもよい。
図2は、あくまで一例であり、店舗システム1のハードウエア構成は図2の例に制限されない。例えば、店舗装置10は、ネットワークインタフェース1060を介して、会計処理用機器20および撮像装置30と接続されていてもよい。また、ディスプレイ40は、会計処理用機器20のディスプレイの代わりに、商品登録業務用の各種画面を表示してもよい。この場合、会計処理用機器20のディスプレイはなくてもよい。
〔処理の流れ〕
図3および図4を用いて、本実施形態の店舗システム1により実行される処理の流れを説明する。図3は、第1実施形態の店舗システム1が商品登録モード時に実行する処理の流れを例示する図である。また、図4は、第1実施形態の店舗システム1が画像収集モード時に実行する処理の流れを例示する図である。
<商品登録モード時の処理>
まず、図3を用いて、商品登録モード時の処理の流れについて説明する。
まず、店舗システム1を利用するユーザ(店員)は、店舗システム1の動作モードを「商品登録モード」に切り替える操作を実行する。この操作は、例えば、店舗装置10に接続された図示しないスイッチ等の切り替え操作や、ディスプレイ40や会計処理用機器20のディスプレイに表示された切替ボタンの押下操作などである。この操作に応じて、店舗システム1のモードを指定する情報(モード指定情報)が生成され、店舗装置10に送信される。
店舗装置10が、上述したような操作によって生成されたモード指定情報(ここでは、「商品登録モード」を指定する情報)を取得すると(S102)、モード切替部120は、店舗システム1の動作モードを商品登録モードに設定する(S104)。そして、店舗装置10は、ディスプレイ40に商品登録業務用の画面を表示させる(S106)。また、モード切替部120によって店舗システム1の動作モードが商品登録モードに設定されたことに応じて、以下に例示するような処理が実行される。
画像取得部110は、撮像装置30により生成された撮影画像を取得する(S108)。例えば、撮像装置30は、イメージセンサのセンシング結果(撮影画像)を、画像取得部110に常時出力している。また、撮像装置30は、画像取得部110の指示に応じて、画像を生成するように構成されていてもよい。そして、商品登録部130は、画像取得部110により取得された撮影画像の中に商品が存在するか否かを判定する(S110)。例えば、商品登録部130は、画像取得部110により取得された撮影画像(または撮影画像から抽出される特徴量)を商品識別エンジンに入力して得られる出力結果に基づいて、撮影画像の中に商品が存在するか否かを判定することができる。その他にも、商品登録部130は、エッジ特徴量などを用いて撮影画像の中から物体の領域を検出した後、テンプレートマッチングなどを行って当該物体が商品か否かを判定してもよい。
撮影画像の中に商品が存在しない場合(S110:NO)、画像取得部110は、撮像装置30により生成される新たな撮影画像を取得し、商品登録部130は、その新たな撮影画像の中に商品が存在する否かを判定する。
一方、撮影画像の中に商品が存在する場合(S110:YES)、商品登録部130は、その商品(商品識別エンジン等により識別された商品)を、購入対象の商品として登録する(S112)。例えば、商品登録部130は、次のような動作を行うことができる。まず、商品登録部130は、その商品が何かを示す情報(例えば、商品の識別情報)を、商品識別エンジン等の識別結果として取得する。ここで、ディスプレイ40上に複数の商品が載置されている場合、商品識別エンジンは、それらの商品1つ1つについて識別した結果を出力することができる。そして、商品登録部130は、商品識別エンジンから取得した情報を基に、商品登録に必要な情報を取得する。例えば、商品登録部130は、商品識別エンジンから取得した商品の識別情報を基に、その商品に関連する情報(例えば、商品名、商品価格、特典の有無など)を取得することができる。そして、商品登録部130は、このように取得された商品に関連する情報を用いて購入対象の商品リストを更新する情報を生成する。例えば、商品登録部130は、S110の処理で識別された商品に関連する情報を追加した商品リストを、会計処理用機器20に送信する。また、商品登録部130は、S110の処理で識別された商品に関連する情報を、更新用の情報として会計処理用機器20に送信してもよい。ディスプレイ40は、商品登録部130から取得した情報に基づいて、購入対象の商品の商品リストの表示内容を更新する(S114)。
画像取得部110および商品登録部130は、購入対象の商品を登録する処理の終了指示が検出されるまで、上述の処理を繰り返し実行する(S116:NO)。例えば、購入商品を全て登録した後に押下するボタン(小計ボタンなど)が押下されるまで、画像取得部110および商品登録部130は上述の処理を繰り返し実行する。そして、小計ボタンなどが押下された場合(S116:YES)、画像取得部110および商品登録部130は上述の処理を終了する。その後、店舗装置10は代金の支払い処理を実行する(S118)。
なお、上述の処理において、商品登録部130は、会計処理用機器20としてディスプレイが設けられている場合、ディスプレイ40の代わりに或いは加えて、当該ディスプレイに購入商品のリストを送信してもよい。また、会計処理用機器20として、バーコードリーダー等が設けられている場合、商品登録部130は、当該バーコードリーダーから取得した情報を用いて、購入商品のリストを更新してもよい。
<画像収集モード>
次に、図4を用いて、画像収集モード時の処理の流れについて説明する。
まず、店舗システム1を利用するユーザ(店員)は、店舗システム1の動作モードを「画像収集モード」に切り替える操作を実行する。この操作は、例えば、店舗装置10に接続された図示しないスイッチ等の切り替え操作や、ディスプレイ40や会計処理用機器20のディスプレイに表示された切替ボタンの押下操作などである。この操作に応じて、店舗システム1のモードを指定する情報(モード指定情報)が生成され、店舗装置10に送信される。
店舗装置10が、上述したような操作によって生成されたモード指定情報(ここでは、「画像収集モード」を指定する情報)を取得すると(S202)、モード切替部120は、店舗システム1の動作モードを画像収集モードに設定する(S204)。モード切替部120によって店舗システム1の動作モードが画像収集モードに設定されたことに応じて、以下に例示するような処理が実行される。
表示制御部140は、ディスプレイ40に、所定の背景画像を表示させる(S206)。背景画像は、ランダムに生成された画像(例えば、それぞれランダムな幾何学図形の結合画像など)であってもよい。また例えば、背景画像は、商品識別エンジンの利用環境に合わせてチューニングされた画像であってもよい。例えば、店舗での業務において実際に表示される画面やGUI(Graphical User Interface)などの表示コンテンツ、または、人物の手や指などが、ノイズとして背景画像の少なくとも一部に含まれていてもよい。このようなノイズを背景画像に含めることにより、商品識別エンジンの利用環境(具体的には、ディスプレイ40上に購入対象の商品を載置し、上部の撮像装置30で商品をまとめて認識するようなシステム)で実際に起こり得る状況を精度よく再現できる。背景画像は、例えば、ストレージデバイス1040などに予め記憶されている。表示制御部140は、ストレージデバイス1040などから背景画像を読み出し、ディスプレイ40に出力することができる。
また、店舗システム1を利用するユーザは、商品識別エンジンの学習対象である商品Pをディスプレイ40上の任意の位置に載置する(S208)。その後、店舗システム1を利用するユーザは、店舗装置10に接続された入力装置(キーボードやタッチパネルなど)を介して、撮像装置30に撮影動作を指示する(S210)。撮像装置30は、画像取得部110からの撮影指示に応じて、ディスプレイ40の表示面に表示された背景画像と、ディスプレイ40の表示面上に載置された商品Pと、が写る画像を生成する。そして、画像取得部110は、撮像装置30により生成された画像を取得する(S212)。画像収集部150は、S212で取得された画像を、学習用画像として所定の記憶装置(例えば、ストレージデバイス1040)に記憶する(S214)。このとき、画像収集部150は、例えば、店舗装置10に接続された入力装置(キーボードやタッチパネルなど)を介して、商品識別エンジンの学習に利用される付加情報の入力を受け付けてもよい。例えば、画像収集部150は、商品Pが何であるかを示す情報(以下、「商品特定情報」と表記)の入力を受け付け、S212の処理で取得した画像と対応付けて記憶してもよい(例:図5)。図5は、画像収集部150が所定の記憶装置に記憶する情報の一例を示す図である。図5では、画像取得部110により取得された画像(または、当該画像の特徴量)と、ディスプレイ40上に載置された商品の商品特定情報(例えば、商品の名称や商品毎に割り当てられた識別情報など)と、を対応付けた情報が例示されている。
以上、本実施形態によれば、一般的なレジ業務を行う装置において、商品を識別するための識別器の学習に利用可能な画像を収集することが可能となる。すなわち、一般的なレジ業務を行う装置を、識別器を構築するための装置として機能させることができる。これにより、識別器を構築する際にかかるコストを削減させることができる。また、本実施形態では、画像収集モードにおいて、ディスプレイ40に任意の背景画像を表示させることができる。これにより、識別器の学習に適した画像を、容易に作り出すことが可能となる。
[第2実施形態]
本実施形態は、以下の点を除き、第1実施形態と同様の構成を有する。
〔システム構成例〕
本実施形態の店舗システム1は、例えば図1に示されるような構成と同様の構成を有する。本実施形態の表示制御部140は、画像収集モードのとき、ディスプレイ40の表示面に、それぞれ内容の異なる複数の背景画像を切り替えて表示させる。そして、本実施形態の画像収集部150は、上記複数の背景画像のいずれかと、ディスプレイ40の表示面上に載置された商品Pと、が写る複数の学習用画像を取得する。
ここで、表示制御部140によりディスプレイ40の表示面上に表示される複数の背景画像は、それぞれランダムに生成された画像(例えば、それぞれランダムな幾何学図形の結合画像など)であってもよい。また例えば、複数の背景画像は、例えば、それぞれ互いに色の異なる複数の無地の画像であってもよい。また、複数の背景画像は、商品識別エンジンの利用環境に合わせてチューニングされた画像であってもよい。例えば、複数の背景画像は、商品が写る画像であってもよい。この場合、商品の種類および配置の少なくとも一方が、複数の背景画像それぞれの間で互いに異なる。またこの場合において、複数の背景画像の少なくとも一部に、商品以外のノイズが含まれていてもよい。具体的には、店舗での業務において実際に表示される画面やGUI(Graphical User Interface)などの表示コンテンツ、または、人物の手や指などが、ノイズとして複数の背景画像の少なくとも一部に含まれていてもよい。このようなノイズを背景画像に含めることにより、商品識別エンジンの利用環境(具体的には、ディスプレイ40上に購入対象の商品を載置し、上部の撮像装置30で商品をまとめて認識するようなシステム)で実際に起こり得る状況を精度よく再現できる。
上記で例示したような複数の背景画像のデータは、例えばストレージデバイス1040などに記憶されており、表示制御部140は、ストレージデバイス1040などから各背景画像のデータを読み出すことができる。また、商品識別エンジンの利用環境に合わせてチューニングされた複数の背景画像を使う場合、表示制御部140は、ストレージデバイス1040に記憶されているパーツ画像をランダム或いは所定のルールに従って組み合わせて複数の背景画像を生成するように構成されていてもよい。
〔ハードウエア構成例〕
本実施形態の店舗システム1は、第1実施形態と同様のハードウエア構成(例:図2)を有する。本実施形態のストレージデバイス1040は、上述の表示制御部140の機能を実現するプログラムモジュールを更に記憶している。プロセッサ1020が、これらのプログラムモジュールをメモリ1030上に読み出して実行することにより、本実施形態の表示制御部140の機能が実現される。
〔処理の流れ〕
本実施形態の大まかな処理の流れは、図4に示すものと同様である。本実施形態では、S206の処理において、表示制御部140は、複数の背景画像を所定のタイミングで切り替えて表示させる描画データをディスプレイ40に送信する。そして、ディスプレイ40は、表示制御部140から受信した描画データに基づいて、複数の背景画像を切り替えながら表示する。これにより、S212の処理において、画像取得部110は、複数の背景画像のいずれかと、ディスプレイ40の表示面上に載置された商品Pと、が写る複数の画像を取得することができる。そして、S214の処理において、画像収集部150は、このように取得された複数の画像を、商品識別エンジンの学習用画像として所定の記憶装置(例えば、ストレージデバイス1040など)に記憶させる。
以上、本実施形態によれば、商品識別エンジンの学習用画像を収集するモードにおいて、商品Pを載置するディスプレイ40の表示面に複数の背景画像が切り替え表示される。これにより、第1実施形態の場合と比較して、多様な学習用画像を容易に収集することが可能となる。
[第3実施形態]
本実施形態は、以下の点を除き、上述の各実施形態と同様の構成を有する。
〔システム構成例〕
図6は、第3実施形態の店舗システム1の構成例を示す図である。本実施形態において、店舗装置10は、ディスプレイ40の表示面上に載置された商品Pの位置を取得する位置情報取得部160を更に備える。位置情報取得部160は、例えば、様々な物体検出アルゴリズムを用いて、画像取得部110により取得された画像の中から、ディスプレイ40の表示面に載置された物体(商品P)の位置を検出することができる。そして、本実施形態の表示制御部140は、商品登録モードにおいて商品の位置に応じて表示する情報を、位置情報取得部160により取得された商品Pの位置に基づいて、ディスプレイ40の表示面に更に表示させる。
図7に、表示制御部140が表示させる情報の一例を示す。図7は、第3実施形態の表示制御部140によりディスプレイ40に表示される情報の一例を示す図である。図7の例では、商品登録モードにおいて商品の位置に応じて表示する情報は、ディスプレイ40上に載置された商品Pの輪郭に沿って表示される枠状の表示要素fである。なお、表示制御部140は、「撮像装置30により生成された画像での座標」を「ディスプレイ40の表示面(商品Pの載置面)での座標」に変換する変換ルールを予め保持している。そして、表示制御部140は、画像内の商品の位置(座標)を当該変換ルールに基づきディスプレイ40の表示面の座標に変換し、例えば変換した位置を囲むように枠状の表示要素fを表示させることができる。また、表示制御部140は、例えば、商品の識別結果に応じて表示させるGUI(例えば、商品を購入商品として登録するボタンや商品のキャンセルボタンなど)を、商品Pの位置に応じて更に表示してもよい。
以上、本実施形態では、ディスプレイ40の表示面に表示された画像とディスプレイ40の表示面上に載置された商品Pとが写る学習用画像を収集する際、商品登録モードにおいて商品識別エンジンの識別結果に応じて表示される情報が更に表示される。これにより、商品登録モード時に商品の識別結果に応じて表示される情報の領域を、識別器が商品の一部分として誤って認識しないように学習するための画像を生成することができる。
[第4実施形態]
本実施形態は、以下の点を除き、上述の各実施形態と同様である。
〔システム構成例〕
図8は、第4実施形態の店舗システム1の構成例を示す図である。なお、図8の例では、第3実施形態の構成をベースとしている。本実施形態では、店舗装置10は、学習部170を更に備える。学習部170は、画像収集部150により収集された学習用画像を用いて、商品識別エンジン(識別器)の学習を行う。
〔ハードウエア構成例〕
本実施形態の店舗システム1は、第1実施形態と同様のハードウエア構成(例:図2)を有する。本実施形態のストレージデバイス1040は、上述の学習部170の機能を実現するプログラムモジュールを更に記憶している。プロセッサ1020が、これらのプログラムモジュールをメモリ1030上に読み出して実行することにより、本実施形態の学習部170の機能が実現される。
〔処理の流れ〕
図9を用いて、本実施形態の店舗システム1により実行される処理の流れを説明する。図9は、第4実施形態の店舗システム1により実行される学習処理の流れを例示するフローチャートである。
学習部170は、図4のS214の処理で所定の記憶装置に記憶(収集)された、学習用画像を読み出す(S302)。学習部170は、例えば、店舗システム1を利用するユーザの選択入力に従って或いはランダムに、所定の記憶装置に記憶された学習用画像の全てまたは一部を読み出すことができる。そして、学習部170は、読み出した学習用画像を用いて、商品識別エンジンの学習を行う。
学習部170は、例えば次のようにして、商品識別エンジンの学習を行うことができる。学習部170は、画像収集部150により収集された学習用画像から、ディスプレイ40の表示面上に載置された商品の領域を示す商品領域画像を抽出する(S304)。例えば、学習用画像が、図7に例示されるように、商品の存在位置を示す情報(例:枠状の表示要素f)を含んでいるとする。この場合、学習部170は、商品の存在位置を示す情報(例:枠状の表示要素f)を学習用画像の中から検出する。そして、学習部170は、商品の存在位置を示す情報(例:枠状の表示要素f)の検出位置に基づいて、商品領域画像を抽出することができる。具体的には、学習部170は、商品の存在位置を示す情報(例:枠状の表示要素f)の内側の領域を切り出して、商品領域画像を生成することができる。また、商品の存在位置を示す情報(例:枠状の表示要素f)が学習用画像に含まれていない場合、学習部170は、ユーザに商品の領域を指定させてもよい。この場合、学習部170は、キーボードやタッチパネルなどを介して、ユーザの指定入力を受け付けることができる。そして、学習部170は、指定された領域を商品領域画像として抽出することができる。なお、学習部170は、学習用画像に商品特定情報が対応付けられていない場合、商品特定情報の入力を更に受け付けてもよい。
そして、学習部170は、学習用画像から抽出された商品領域画像と、当該学習用画像に対応付けられた商品特定情報と、に基づいて、商品特定情報によって特定される商品の識別用パラメータを生成または更新する(S306)。学習部170は、商品特定情報によって特定される商品の識別用パラメータが商品識別エンジンに存在しない場合、抽出した商品領域画像を用いて、その商品の識別用パラメータを生成する。また、商品特定情報によって特定される商品の識別用パラメータが商品識別エンジンに存在する場合は、学習部170は、商品領域画像を用いて、その商品の識別用パラメータを更新する。
このように、本実施形態の店舗システム1によれば、上述の各実施形態で生成された学習用画像を用いて、商品識別エンジン(識別器)を容易に構築することができる。
[第5実施形態]
本実施形態は、以下の点を除き、第4実施形態と同様である。
〔システム構成例〕
図10は、第5実施形態の店舗システム1の構成例を示す図である。本実施形態において、画像収集部150は、抽出部152および画像生成部154を更に備える。抽出部152は、撮像装置30により生成された撮影画像から、商品の領域を示す部分画像(以下、「商品領域画像」と表記)を抽出する。なお、抽出部152の動作の具体例については、後述する。画像生成部154は、抽出部152により抽出された商品領域画像を所定のベース画像に合成することにより学習用画像を生成し、所定の記憶装置に記憶させる。ここで、ベース画像は任意の画像である。例えば、ベース画像は、単色無地の画像、幾何学的パターンや文字などを含む画像、および、自然画像などである。ベース画像は、ここで例示したような画像を任意に組み合わせた画像であってもよい。ここで例示したようなベース画像は、ストレージデバイス1040に予め記憶されている。なお、複数種類のベース画像がストレージデバイス1040に記憶されていてもよい。また、所定の記憶装置は、例えば、ハードディスクドライブのような不揮発性の記憶装置であってもよいし、RAM(Random Access Memory)のような揮発性の記憶装置であってもよい。
〔ハードウエア構成例〕
本実施形態の店舗システム1は、第1実施形態と同様のハードウエア構成(例:図2)を有する。本実施形態のストレージデバイス1040は、上述の抽出部152およびが画像生成部154の機能を実現するプログラムモジュールを更に記憶している。プロセッサ1020が、これらのプログラムモジュールをメモリ1030上に読み出して実行することにより、本実施形態の抽出部152および画像生成部154の機能が実現される。
〔処理の流れ〕
図11を用いて、本実施形態の店舗システム1により実行される処理の流れを説明する。図11は、第5実施形態の店舗システム1の処理の流れを例示するシーケンス図である。
本実施形態のS302からS312までの処理の流れは、図4のS202からS212までの処理と同様である。
抽出部152は、撮像装置30により生成された撮影画像から、商品の領域を示す商品領域画像を抽出する(S31)。以下、図を用いて、撮影画像から商品領域画像を抽出する具体的な手法をいくつか例示する。
<第1の手法>
図12は、撮影画像から商品領域画像を抽出する第1の手法の例示する図である。図12の手法では、表示制御部140は、それぞれ互いに内容の異なる複数の背景画像として、それぞれ互いに色の異なる無地の画像をディスプレイ40に表示させる。図12では、それぞれ、赤(図中斜線部)、白(図中無地部)、青(図中縦線部)を地色とする3枚の背景画像(1a〜1c)を用いる例が示されている。これらの画像は、例えば、ストレージデバイス1040に記憶されている。なお、図12はあくまで例示であり、背景画像の色の組み合わせや色の数は図12の例に制限されない。この場合、画像収集部150は、赤色の背景画像(1a)および商品Pが写っている撮影画像(2a)と、白色の背景画像(1b)および商品Pが写っている撮影画像(2b)と、青色の背景画像(1c)および商品Pが写っている撮影画像(2c)を取得することができる。ここで、商品Pはディスプレイ40の表示面上に載置されている。そのため3枚の撮影画像(2a〜2c)を比べた場合、商品Pの載置されている領域については、ディスプレイ40の表示面のよりも色の変化が明らかに小さくなる。すなわち、複数の撮影画像をそれぞれ比較した場合、商品Pが載置されている領域の輝度の変化量は、それ以外の領域(すなわち、ディスプレイ40の表示面)の輝度の変化量よりも明らかに小さくなる。よって、抽出部152は、複数の撮影画像間での輝度の変化量を利用して、商品領域画像を抽出することができる。具体的には、抽出部152は、まず、3枚の撮影画像(2a〜2c)それぞれの各ピクセルについて輝度の分散値を算出する。次に、抽出部152は、所定の閾値を用いて、3枚の撮影画像(2a〜2c)間で輝度の分散値が当該閾値を超えているピクセルの集合領域(背景領域)と、輝度の変化量が当該閾値未満のピクセルの集合領域(前景領域、すなわち、商品の領域)と、をそれぞれ特定する。この所定の閾値は、例えば、抽出部152のプログラムモジュール内で定義されている。次に、抽出部152は、上記のように特定した結果を用いて、背景領域をマスクするマスク画像M1を生成する。そして、抽出部152は、生成したマスク画像M1を用いて、撮影画像から商品Pの領域を示す商品領域画像P1を抽出する。抽出部152は、生成したマスク画像M1および抽出した商品Pの商品領域画像P1を、その商品Pを識別する情報(例えば、商品名や商品識別番号など)と対応付けて、ストレージデバイス1040や他の記憶装置などに記憶する。
<第2の手法>
図13は、撮影画像から商品領域画像を抽出する第2の手法を例示する図である。図13の手法では、表示制御部140は、所定の背景画像として、既知の背景画像(1d)をディスプレイ40に表示させる。既知の背景画像(1d)は、例えば、ストレージデバイス1040に記憶されている。既知の背景画像(1d)を表示させたディスプレイ40上に商品Pを載置した後で撮像装置30が撮影を行うことにより、画像収集部150は、図示するような撮影画像(2d)を取得することができる。ここで、商品Pはディスプレイ40の表示面上に載置されている。そのため、撮影画像(2d)において、既知の背景画像(1d)の一部領域は商品Pで隠されることになる。つまり、抽出部152は、撮影画像(2d)のうち、既知の背景画像(1d)と異なるピクセルの集合領域を、商品の領域として特定することができる。また、抽出部152は、撮影画像(2d)のうち、既知の背景画像(1d)と等しいピクセルの集合領域を背景領域として特定することができる。そして、抽出部152は、上記のように特定した結果を用いて、背景領域をマスクするマスク画像M2を生成する。そして、抽出部152は、生成したマスク画像M2を用いて、撮影画像から商品Pの領域を示す商品領域画像P2を抽出する。抽出部152は、生成したマスク画像M2および抽出した商品Pの商品領域画像P2を、その商品Pを識別する情報(例えば、商品名や商品識別番号など)と対応付けて、ストレージデバイス1040や他の記憶装置などに記憶する。
第2の手法は、第1の手法と異なり、既知の画像の模様のズレなどを活用し、商品Pの領域を特定している。そのため、ディスプレイ40上に載置された商品が透明な物体(例えば、ペットボトル飲料など)であっても、商品Pの領域を精度よく特定することができる。なお、第2の手法において、抽出部152は、複数の既知の画像を利用してもよい。この場合、抽出部152は、複数の既知の画像それぞれについて異なるピクセルの集合領域を特定した結果に基づいて、商品Pの領域を特定することができる。
<第3の手法>
図14は、撮影画像から商品領域画像を抽出する第3の手法の例示する図である。図14の手法では、表示制御部140は、所定の背景画像として、既知の背景画像(1e)をディスプレイ40に表示させる。なお、第3の手法は、既知の背景画像として無地の画像を用いている点で、第2の手法とは異なる。既知の背景画像(1e)は、例えば、ストレージデバイス1040に記憶されている。既知の背景画像(1e)を表示させたディスプレイ40上に商品Pを載置した後で撮像装置30が撮影を行うことにより、画像収集部150は、図示するような撮影画像(2e)を取得することができる。ここで、商品Pはディスプレイ40の表示面上に載置されている。そのため、撮影画像(2e)において、既知の背景画像(1e)の一部領域は商品Pで隠されることになる。更に、既知の背景画像(1e)が無地であることから、抽出部152は、撮影画像(2e)のうち、既知の背景画像(1e)と色の異なるピクセルの集合領域を、商品の領域として特定することができる。また、抽出部152は、撮影画像(2e)のうち、既知の背景画像(1e)と同色のピクセルの集合領域を背景領域として特定することができる。そして、抽出部152は、上記のように特定した結果を用いて、背景領域をマスクするマスク画像M3を生成する。そして、抽出部152は、生成したマスク画像M3を用いて、撮影画像から商品Pの領域を示す商品領域画像P3を抽出する。抽出部152は、生成したマスク画像M3および抽出した商品Pの商品領域画像P3を、その商品Pを識別する情報(例えば、商品名や商品識別番号など)と対応付けて、ストレージデバイス1040や他の記憶装置などに記憶する。
第3の手法は、背景画像の色に基づいて、商品Pの領域を抽出している。そのため、第3の手法は、輝度の分散値を利用する第1の手法とは異なり、半透明な商品にも対応可能である。
なお、第3の手法において、既知の背景画像はそれぞれ色の異なる複数の画像であってもよい(例:図15)。図15は、第3の手法の他の例を示す図である。図1では、それぞれ、赤色(図中斜線部R)、白色(図中無地部W)、青色(図中縦線部B)を有する既知の3枚の背景画像(1f)が例示されている。なお、本図の例において、商品Pのパッケージの色が赤色であり、かつ、商品Pには白色のラベルLが貼り付けられているとする。この場合、抽出部152は、図14で説明した流れと同様にして、赤、白、青のそれぞれについて、マスク画像(色別マスク画像MR、MW、MB)を生成することができる。なお、色別マスク画像MRは、赤色の領域をマスクする画像である。また、色別マスク画像MWは、白色の領域をマスクする画像である。また、色別マスク画像MBは、青色の領域をマスクする画像である。図示されるように、色別マスク画像MRは、商品のパッケージ部分(白色のラベルLの領域を除く赤色の領域)をマスク領域に含んでしまっている。また、色別マスク画像MWは、商品に貼り付けられた白色のラベルLの領域をマスク領域に含んでしまっている。このような場合において、抽出部152は、例えばこれらの色別マスク画像MR、MW、MBのマスク領域の論理積から、最終的なマスク画像M3’を生成することができる。そして、抽出部152は、生成したマスク画像M3’を用いて、撮影画像から商品Pの領域を示す商品領域画像を抽出することができる。このようにすることで、例えば、商品の少なくとも一部の色が背景画像の色と偶然同じであった場合であっても、商品の領域を正確に抽出するマスク画像を生成することができる。
<第4の手法>
図16は、撮影画像から商品領域画像を抽出する第4の手法を例示する図である。図16の手法では、表示制御部140は、所定の背景画像として、動画(1g)をディスプレイ40に表示させる。なお、図16では、2つの図形(円と三角形)が時間と共に移動する動画(1g)が例示されている。なお、表示制御部140は、図16の例に限らず、任意の動画を表示させることができる。この場合、画像収集部150は、例えば、図中の符号2gで示すような、複数の撮影画像を取得することができる。ここで、商品Pはディスプレイ40の表示面上に載置されている。そのため、撮影画像(2g)において、動画(1g)の中で移動する図形の少なくとも一部が、商品Pにより隠されることがある(例:2g(2))。つまり、複数の撮影画像において、商品Pが載置されている領域は、背景の動画部分と比較して動きが小さくなる。よって、抽出部152は、複数の撮影画像において、動きの少ないピクセルの集合領域(継続して止まっている物体の領域)を、商品の領域として特定することができる。具体的には、抽出部152は、オプティカルフローや背景差分などを用いて、商品の領域を特定することができる。また、抽出部152は、一定以上の動きのあるピクセルの集合領域を背景領域として特定することができる。そして、上記のように特定した結果を用いて、背景領域をマスクするマスク画像M4を生成する。そして、抽出部152は、生成したマスク画像M4を用いて、撮影画像から商品Pの領域を示す商品領域画像P4を抽出する。抽出部152は、生成したマスク画像M4および抽出した商品Pの商品領域画像P4を、その商品Pを識別する情報(例えば、商品名や商品識別番号など)と対応付けて、ストレージデバイス1040や他の記憶装置などに記憶する。
なお、上述の各手法おいて、複数の物体が同時にディスプレイ40上に載置された場合、抽出部152は、次のようにして、個々の物体毎にマスク画像と当該物体の商品領域画像を記憶装置に記憶することができる。具体的には、抽出部152は、まず、得られたマスク画像を連結成分分析などによって個々の領域に分割し、物体毎のマスク画像を生成する。そして、抽出部152は、物体毎のマスク画像と、マスク画像によって抽出される物体の商品領域画像とを、その物体を識別する情報と対応付けて記憶装置に記憶する。
また、抽出部152は、商品領域画像の代わりに、画像取得部110により取得された撮影画像を記憶装置に記憶してもよい。この場合でも、記憶装置に記憶された撮影画像とマスク画像とを利用することにより、対象の商品の商品領域画像を必要に応じて生成することができる。
図11に戻り、画像生成部154は、S314の処理で抽出された商品領域画像を所定のベース画像に合成して、学習用画像を生成する(S316)。なお、画像生成部154は、S314の処理で抽出された商品領域画像のほか、過去の処理で抽出された他の商品の商品領域画像を使って、学習用画像を生成してもよい。過去の処理で抽出された他の物体の商品領域画像は、例えば、ストレージデバイス1040に蓄積されている。この場合、画像生成部154は、ユーザの選択入力または予め設定されたルールに従って、ストレージデバイス1040から読み出す商品領域画像を選択することができる。また、画像生成部154は、ベース画像に合成する商品領域画像の種類や個数をランダムに選択してもよい。
図17を用いて、画像生成部154の動作を具体的に説明する。図17は、画像生成部154の動作を具体的に例示する図である。図17の例では、2つの物体(商品Aおよび商品B)の撮影画像2および2から、それぞれ、商品Aの商品領域画像Pおよび商品Bの商品領域画像Pが生成された場合を想定している。この場合、画像生成部154は、商品Aの商品領域画像Pおよび商品Bの商品領域画像Pを所定のベース画像に合成して、例えば、符号3で示すような学習用画像を生成することができる。図示されるように、画像生成部154は、商品Aの商品領域画像Pおよび商品Bの商品領域画像Pを加工(回転、移動など)することができる。また、画像生成部154は、商品Aの商品領域画像Pおよび商品Bの商品領域画像Pの配置数を決定することができる。画像生成部154は、ユーザの指定入力や所定のルールに従って、あるいは、全くのランダムに、加工の仕方や配置数を決定することができる。また、画像生成部154は、学習用画像の生成時にベース画像に合成した商品領域画像のリストを生成する。このリストは、例えば、ベース画像内での位置座標と、商品の名称や識別番号といった商品を個別に識別可能な情報(または、単に商品であることを示す情報)とを、ベース画像に合成した商品領域画像毎に記憶している。つまり、このリストは、学習用画像において、どの商品がどの位置に存在するかを示す情報として利用できる。
画像生成部154は、上述のように生成した第3画像およびリストを、メモリ1030やストレージデバイス1040といった、所定の記憶装置に記憶する(S318)。このように、本実施形態の画像生成部154は、商品領域画像を用いて、様々なシチュエーションに則した画像を無数に作成することができる。そして、学習部170は、学習用画像およびリストを入力として、識別器の学習を行うことができる。
以上、本実施形態の店舗システム1では、ディスプレイ40に載置された商品Pを撮影する際、ディスプレイ40の表示面に背景画像を表示することによって、商品Pと背景画像とを含む撮影画像が生成される。そして、背景画像を表示するディスプレイ40上に商品Pを載置していることで撮影画像に生じる特性に基づいて、撮影画像からその商品Pの領域を示す商品領域画像が抽出される。そして、抽出された商品領域画像を所定のベース画像に合成することにより、学習用画像が生成される。
本実施形態の店舗システム1によれば、抽出された商品領域画像を用いて、商品識別エンジン(識別器)の学習用画像として、無数のパターンの画像を容易に生成することが可能となる。つまり、本実施形態の店舗システム1によれば、識別器の最適化するための画像の生成効率が向上するため、商品認識に利用される識別器を構築する際の手間を低減させることができる。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
例えば、本発明は、購入商品の登録から代金の支払いまでの操作を店員用の装置で行う一般的な方式のみならず、所謂セミセルフ方式やセルフ方式にも適用できる。セミセルフ方式では、商品登録用のレジ装置と代金支払い用の精算装置が別々に設けられている。そして、この商品登録用のレジ装置に、上述の店舗装置10の機能を持たせることができる。また、セルフ方式では、購入商品の登録から代金の支払いまでを顧客が操作する装置で行う。そして、この顧客が操作する装置に、上述の店舗装置10の機能を持たせることができる。
また、上述の説明で用いた複数のシーケンス図やフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1.
ディスプレイの表示面上に載置された商品が写る画像を撮像装置から取得する画像取得手段と、
顧客が購入する商品を登録する商品登録モードと、商品を識別するための識別器の学習用画像を収集する画像収集モードと、を切り替えるモード切替手段と、
前記商品登録モードのとき、前記画像に基づいて前記識別器が識別した商品を購入対象の商品として登録する商品登録手段と、
前記画像収集モードのとき、前記ディスプレイの表示面に所定の背景画像を表示させる表示制御手段と、
前記背景画像と前記商品とが写る画像を前記学習用画像として所定の記憶装置に記憶させる画像収集手段と、
を備える店舗装置。
2.
前記表示制御手段は、前記画像収集モードのとき、前記ディスプレイの表示面に、それぞれ内容の異なる複数の背景画像を切り替えて表示させ、
前記画像収集手段は、前記複数の背景画像のいずれかと前記ディスプレイに載置された商品とが写る複数の画像を、前記学習用画像として所定の記憶装置に記憶させる、
1.に記載の店舗装置。
3.
前記表示制御手段は、前記複数の背景画像として、それぞれ互いに色の異なる無地の画像を表示させる、
2.に記載の店舗装置。
4.
前記ディスプレイの表示面上に載置された商品の位置を取得する位置取得手段を更に備え、
前記表示制御手段は、前記商品登録モードにおいて商品の存在位置に応じて表示する情報を、前記位置取得手段により取得された商品の位置に基づいて更に表示させる、
1.から3.のいずれか1つに記載の店舗装置。
5.
前記画像収集手段により収集された学習用画像を用いて、前記識別器の学習を行う学習手段を更に備える、
1.から4.のいずれか1つに記載の店舗装置。
6.
前記学習手段は、
前記学習用画像から、前記ディスプレイ上に載置された商品の領域を示す商品領域画像を抽出し、
抽出した前記商品領域画像を用いて前記識別器の学習を行う、
5.に記載の店舗装置。
7.
前記学習手段は、
前記学習用画像の中から、前記ディスプレイ上に載置された商品の存在位置を示す情報を検出し、
前記学習用画像における前記情報の検出位置に基づいて、前記商品領域画像を抽出する、
6.に記載の店舗装置。
8.
表示面が商品の載置面として利用されるディスプレイと、
前記ディスプレイの表示面上に載置された商品が写る画像を生成する撮像装置と、
前記撮像装置により生成された画像を取得する画像取得手段と、
顧客が購入する商品を登録する商品登録モードと、商品を識別するための識別器の学習用画像を収集する画像収集モードと、を切り替えるモード切替手段と、
前記商品登録モードのとき、前記画像に基づいて前記識別器が識別した商品を購入対象の商品として登録する商品登録手段と、
前記画像収集モードのとき、前記ディスプレイの表示面に所定の背景画像を表示させる表示制御手段と、
前記背景画像と前記商品とが写る画像を前記学習用画像として所定の記憶装置に記憶させる画像収集手段と、
を備える店舗システム。
9.
前記表示制御手段は、前記画像収集モードのとき、前記ディスプレイの表示面に、それぞれ内容の異なる複数の背景画像を切り替えて表示させ、
前記画像収集手段は、前記複数の背景画像のいずれかと前記ディスプレイに載置された商品とが写る複数の画像を、前記学習用画像として所定の記憶装置に記憶させる、
8.に記載の店舗システム。
10.
前記表示制御手段は、前記複数の背景画像として、それぞれ互いに色の異なる無地の画像を表示させる、
9.に記載の店舗システム。
11.
前記ディスプレイの表示面上に載置された商品の位置を取得する位置取得手段を更に備え、
前記表示制御手段は、前記商品登録モードにおいて商品の存在位置に応じて表示する情報を、前記位置取得手段により取得された商品の位置に基づいて更に表示させる、
8.から10.のいずれか1つに記載の店舗システム。
12.
前記画像収集手段により収集された学習用画像を用いて、前記識別器の学習を行う学習手段を更に備える、
8.から11.のいずれか1つに記載の店舗システム。
13.
前記学習手段は、
前記学習用画像から、前記ディスプレイ上に載置された商品の領域を示す商品領域画像を抽出し、
抽出した前記商品領域画像を用いて前記識別器の学習を行う、
12.に記載の店舗システム。
14.
前記学習手段は、
前記学習用画像の中から、前記ディスプレイ上に載置された商品の存在位置を示す情報を検出し、
前記学習用画像における前記情報の検出位置に基づいて、前記商品領域画像を抽出する、
13.に記載の店舗システム。
15.
コンピュータが、
ディスプレイの表示面上に載置された商品が写る画像を撮像装置から取得し、
顧客が購入する商品を登録する商品登録モードと、商品を識別するための識別器の学習用画像を収集する画像収集モードと、を切り替え、
前記商品登録モードのとき、前記画像に基づいて前記識別器が識別した商品を購入対象の商品として登録し、
前記画像収集モードのとき、前記ディスプレイの表示面に所定の背景画像を表示させ、
前記背景画像と前記商品とが写る画像を前記学習用画像として所定の記憶装置に記憶させる、
ことを含む画像取得方法。
16.
前記コンピュータが、
前記画像収集モードのとき、前記ディスプレイの表示面に、それぞれ内容の異なる複数の背景画像を切り替えて表示させ、
前記複数の背景画像のいずれかと前記ディスプレイに載置された商品とが写る複数の画像を、前記学習用画像として所定の記憶装置に記憶させる、
ことを含む15.に記載の画像取得方法。
17.
前記コンピュータが、
前記複数の背景画像として、それぞれ互いに色の異なる無地の画像を表示させる、
ことを含む16.に記載の画像取得方法。
18.
前記コンピュータが、
前記ディスプレイの表示面上に載置された商品の位置を取得し、
前記商品登録モードにおいて商品の存在位置に応じて表示する情報を、前記取得された商品の位置に基づいて更に表示させる、
ことを含む15.から17.のいずれか1つに記載の画像取得方法。
19.
前記コンピュータが、
前記収集された学習用画像を用いて、前記識別器の学習を行う、
ことを含む15.から18.のいずれか1つに記載の画像取得方法。
20.
前記コンピュータが、
前記学習用画像から、前記ディスプレイ上に載置された商品の領域を示す商品領域画像を抽出し、
抽出した前記商品領域画像を用いて前記識別器の学習を行う、
ことを含む19.に記載の画像取得方法。
21.
前記コンピュータが、
前記学習用画像の中から、前記ディスプレイ上に載置された商品の存在位置を示す情報を検出し、
前記学習用画像における前記情報の検出位置に基づいて、前記商品領域画像を抽出する、
ことを含む20.に記載の画像取得方法。
22.
コンピュータに、15.から21.のいずれか1つに記載の画像取得方法を実行させるプログラム。

Claims (10)

  1. ディスプレイの表示面上に載置された商品が写る画像を撮像装置から取得する画像取得手段と、
    顧客が購入する商品を登録する商品登録モードと、商品を識別するための識別器の学習用画像を収集する画像収集モードと、を切り替えるモード切替手段と、
    前記商品登録モードのとき、前記画像に基づいて前記識別器が識別した商品を購入対象の商品として登録する商品登録手段と、
    前記画像収集モードのとき、前記ディスプレイの表示面に所定の背景画像を表示させる表示制御手段と、
    前記背景画像と前記商品とが写る画像を前記学習用画像として所定の記憶装置に記憶させる画像収集手段と、
    を備える店舗装置。
  2. 前記表示制御手段は、前記画像収集モードのとき、前記ディスプレイの表示面に、それぞれ内容の異なる複数の背景画像を切り替えて表示させ、
    前記画像収集手段は、前記複数の背景画像のいずれかと前記ディスプレイに載置された商品とが写る複数の画像を、前記学習用画像として所定の記憶装置に記憶させる、
    請求項1に記載の店舗装置。
  3. 前記表示制御手段は、前記複数の背景画像として、それぞれ互いに色の異なる無地の画像を表示させる、
    請求項2に記載の店舗装置。
  4. 前記ディスプレイの表示面上に載置された商品の位置を取得する位置取得手段を更に備え、
    前記表示制御手段は、前記商品登録モードにおいて商品の存在位置に応じて表示する情報を、前記位置取得手段により取得された商品の位置に基づいて更に表示させる、
    請求項1から3のいずれか1項に記載の店舗装置。
  5. 前記画像収集手段により収集された学習用画像を用いて、前記識別器の学習を行う学習手段を更に備える、
    請求項1から4のいずれか1項に記載の店舗装置。
  6. 前記学習手段は、
    前記学習用画像から、前記ディスプレイ上に載置された商品の領域を示す商品領域画像を抽出し、
    抽出した前記商品領域画像を用いて前記識別器の学習を行う、
    請求項5に記載の店舗装置。
  7. 前記学習手段は、
    前記学習用画像の中から、前記ディスプレイ上に載置された商品の存在位置を示す情報を検出し、
    前記学習用画像における前記情報の検出位置に基づいて、前記商品領域画像を抽出する、
    請求項6に記載の店舗装置。
  8. 表示面が商品の載置面として利用されるディスプレイと、
    前記ディスプレイの表示面上に載置された商品が写る画像を生成する撮像装置と、
    前記撮像装置により生成された画像を取得する画像取得手段と、
    顧客が購入する商品を登録する商品登録モードと、商品を識別するための識別器の学習用画像を収集する画像収集モードと、を切り替えるモード切替手段と、
    前記商品登録モードのとき、前記画像に基づいて前記識別器が識別した商品を購入対象の商品として登録する商品登録手段と、
    前記画像収集モードのとき、前記ディスプレイの表示面に所定の背景画像を表示させる表示制御手段と、
    前記背景画像と前記商品とが写る画像を前記学習用画像として所定の記憶装置に記憶させる画像収集手段と、
    を備える店舗システム。
  9. コンピュータが、
    ディスプレイの表示面上に載置された商品が写る画像を撮像装置から取得し、
    顧客が購入する商品を登録する商品登録モードと、商品を識別するための識別器の学習用画像を収集する画像収集モードと、を切り替え、
    前記商品登録モードのとき、前記画像に基づいて前記識別器が識別した商品を購入対象の商品として登録し、
    前記画像収集モードのとき、前記ディスプレイの表示面に所定の背景画像を表示させ、
    前記背景画像と前記商品とが写る画像を前記学習用画像として所定の記憶装置に記憶させる、
    ことを含む画像取得方法。
  10. コンピュータに、請求項9に記載の画像取得方法を実行させるプログラム。
JP2020502774A 2018-03-02 2018-03-02 店舗装置、店舗システム、画像取得方法、およびプログラム Active JP6947283B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/008145 WO2019167278A1 (ja) 2018-03-02 2018-03-02 店舗装置、店舗システム、画像取得方法、およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2019167278A1 JPWO2019167278A1 (ja) 2021-03-04
JP6947283B2 true JP6947283B2 (ja) 2021-10-13

Family

ID=67806049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020502774A Active JP6947283B2 (ja) 2018-03-02 2018-03-02 店舗装置、店舗システム、画像取得方法、およびプログラム

Country Status (3)

Country Link
US (1) US20210004644A1 (ja)
JP (1) JP6947283B2 (ja)
WO (1) WO2019167278A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023234062A1 (ja) * 2022-05-31 2023-12-07 京セラ株式会社 データ取得装置、データ取得方法、及びデータ取得台

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4913719B2 (ja) * 2007-12-28 2012-04-11 東芝テック株式会社 商品販売データ処理装置及びコンピュータプログラム
US8571298B2 (en) * 2008-12-23 2013-10-29 Datalogic ADC, Inc. Method and apparatus for identifying and tallying objects
JP5518918B2 (ja) * 2012-02-29 2014-06-11 東芝テック株式会社 情報処理装置、店舗システム及びプログラム
JP5915851B2 (ja) * 2012-03-12 2016-05-11 大日本印刷株式会社 会計管理システム及びレジシステム
JP6177068B2 (ja) * 2013-09-24 2017-08-09 株式会社ブレイン 店舗システム
WO2015140855A1 (ja) * 2014-03-20 2015-09-24 日本電気株式会社 Pos端末装置、posシステム、画像処理方法及びプログラムが格納された非一時的なコンピュータ可読媒体
JP6387821B2 (ja) * 2014-12-18 2018-09-12 カシオ計算機株式会社 商品登録装置、商品登録方法、および、商品画像提供システム
JP6565252B2 (ja) * 2015-03-23 2019-08-28 日本電気株式会社 情報処理装置、情報処理方法、およびプログラム
US10198722B2 (en) * 2015-07-15 2019-02-05 Toshiba Tec Kabushiki Kaisha Commodity-sales-data processing apparatus, commodity-sales-data processing method, and computer-readable storage medium
JP6556003B2 (ja) * 2015-09-25 2019-08-07 シャープ株式会社 商品情報入力機能を備えた複合機
JP6734580B2 (ja) * 2016-03-10 2020-08-05 株式会社ブレイン 物品識別システム

Also Published As

Publication number Publication date
US20210004644A1 (en) 2021-01-07
JPWO2019167278A1 (ja) 2021-03-04
WO2019167278A1 (ja) 2019-09-06

Similar Documents

Publication Publication Date Title
US10762486B2 (en) Information processing apparatus, information processing method, and non-transitory storage medium
JP6801676B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP6549558B2 (ja) 売上登録装置、プログラム及び売上登録方法
EP3021299A1 (en) Information processing apparatus, store system and method
US20140067574A1 (en) Information processing apparatus and information processing method
US9412045B2 (en) Commodity registration apparatus and commodity registration method
JP2008257462A (ja) 商品販売登録データ処理装置
CN111046683B (zh) 读取装置及控制方法、计算机可读存储介质、电子设备
JP2013089090A (ja) 情報処理装置及びプログラム
US9208383B2 (en) Commodity recognition apparatus and method for recognizing commodity by the same
JP6947283B2 (ja) 店舗装置、店舗システム、画像取得方法、およびプログラム
JP7501907B2 (ja) 画像収集装置、画像収集システム、画像収集方法、およびプログラム
US20180240093A1 (en) Information processing apparatus and information processing method
JP7006767B2 (ja) 画像識別レジ装置、画像識別レジシステム、会計処理方法、およびプログラム
JP6981538B2 (ja) 画像識別レジ装置、画像識別レジシステム、商品情報表示方法、およびプログラム
JP7248010B2 (ja) 登録システム、登録方法及びプログラム
JP6532114B1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2019168818A (ja) 商品情報取得装置、商品情報取得方法、およびプログラム
JP7322945B2 (ja) 処理装置、処理方法及びプログラム
JP7078105B2 (ja) 会計装置、会計システム、商品識別方法、およびプログラム
JP7020538B2 (ja) 会計装置、会計システム、商品識別方法、およびプログラム
EP2960831A1 (en) Information processing apparatus and information processing method
US20230186736A1 (en) Processing system, processing method, and non-transitory storage medium

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200826

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210817

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210830

R150 Certificate of patent or registration of utility model

Ref document number: 6947283

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150