JP6153087B2 - 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム - Google Patents

情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム Download PDF

Info

Publication number
JP6153087B2
JP6153087B2 JP2013549240A JP2013549240A JP6153087B2 JP 6153087 B2 JP6153087 B2 JP 6153087B2 JP 2013549240 A JP2013549240 A JP 2013549240A JP 2013549240 A JP2013549240 A JP 2013549240A JP 6153087 B2 JP6153087 B2 JP 6153087B2
Authority
JP
Japan
Prior art keywords
feature
local
local feature
product
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013549240A
Other languages
English (en)
Other versions
JPWO2013089042A1 (ja
Inventor
野村 俊之
俊之 野村
山田 昭雄
昭雄 山田
岩元 浩太
浩太 岩元
亮太 間瀬
亮太 間瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2013089042A1 publication Critical patent/JPWO2013089042A1/ja
Application granted granted Critical
Publication of JP6153087B2 publication Critical patent/JP6153087B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects

Description

本発明は、局所特徴量を使用して、撮像した映像内の商品を同定するための技術に関する。
上記技術分野において、特許文献1には、あらかじめモデル画像から生成されたモデル辞書を使用して、クエリ画像を認識する場合に、特徴量をクラスタリングすることにより認識速度を向上した技術が記載されている。
特開2011−22168
しかしながら、上記文献に記載の技術では、リアルタイムで映像中の画像内の商品を認識して商品管理をすることができなかった。
本発明の目的は、上述の課題を解決する技術を提供することにある。
上記目的を達成するため、本発明に係るシステムは、
商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段と、
撮像手段と、
前記撮像手段が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識手段と、
を備えることを特徴とする。
上記目的を達成するため、本発明に係る方法は、
商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理システムにおける情報処理方法であって、
撮像ステップと、
前記撮像ステップにおいて撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識ステップと、
を備えることを特徴とする。
本発明によれば、リアルタイムで映像中の画像内の商品を認識して商品管理をすることができる。
本発明の第1実施形態に係る情報処理システムの構成を示すブロック図である。 本発明の第2実施形態に係る情報処理システムの構成を示すブロック図である。 本発明の第2実施形態に係る情報処理システムの商品出荷時の動作手順を示すシーケンス図である。 本発明の第2実施形態に係る情報処理システムの商品入庫時の動作手順を示すシーケンス図である。 本発明の第2実施形態に係る情報処理システムの棚卸し/棚割調査時の動作手順を示すシーケンス図である。 本発明の第2実施形態に係る情報処理システムの店舗レジでの動作手順を示すシーケンス図である。 本発明の第2実施形態に係る通信端末の機能構成を示すブロック図である。 本発明の第2実施形態に係る管理サーバの機能構成を示すブロック図である。 本発明の第2実施形態に係るPOSの機能構成を示すブロック図である。 本発明の第2実施形態に係る店舗コンピュータの機能構成を示すブロック図である。 本発明の第2実施形態に係る局所特徴量DBの構成を示す図である。 本発明の第2実施形態に係る局所特徴量生成部の機能構成を示すブロック図である。 本発明の第2実施形態に係る局所特徴量生成の手順を説明する図である。 本発明の第2実施形態に係る局所特徴量生成の手順を説明する図である。 本発明の第2実施形態に係る局所特徴量生成部でのサブ領域の選択順位を示す図である。 本発明の第2実施形態に係る局所特徴量生成部での特徴ベクトルの選択順位を示す図である。 本発明の第2実施形態に係る局所特徴量生成部での特徴ベクトルの階層化を示す図である。 本発明の第2実施形態に係る符号化部の構成を示す図である。 本発明の第2実施形態に係る出荷処理および入庫処理時の商品認識部の処理を示す図である。 本発明の第2実施形態に係る棚卸しおよび棚割時の商品認識部の処理を示す図である。 本発明の第2実施形態に係るレジ処理時の商品認識部の処理を示す図である。 本発明の第2実施形態に係る通信端末のハードウェア構成を示すブロック図である。 本発明の第2実施形態に係る通信端末における局所特徴量生成テーブルを示す図である。 本発明の第2実施形態に係る通信端末の処理手順を示すフローチャートである。 本発明の第2実施形態に係る局所特徴量生成処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る符号化処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る差分値の符号化処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る管理コンピュータのハードウェア構成を示すブロック図である。 本発明の第2実施形態に係る商品価格DBの構成を示す図である。 本発明の第2実施形態に係る管理コンピュータの処理手順を示すフローチャートである。 本発明の第2実施形態に係る局所特徴量DB生成処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る商品認識処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る照合処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る商品管理処理の処理手順を示すフローチャートである。 本発明の第3実施形態に係る情報処理システムの処理を示す図である。 本発明の第3実施形態に係る情報処理システムの動作手順を示すシーケンス図である。 本発明の第3実施形態に係る局所特徴量DBにおける値引情報の構成を示す図である。 本発明の第3実施形態に係るPOSの処理手順を示すフローチャートである。 本発明の第4実施形態に係る情報処理システムにおける動作手順を示すシーケンス図である。 本発明の第4実施形態に係る通信端末の機能構成を示すブロック図である。 本発明の第5実施形態に係る情報処理システムの処理を示す図である。 本発明の第5実施形態に係るアンケートDBの構成を示す図である。 本発明の第5実施形態に係る管理コンピュータの処理手順を示すフローチャートである。 本発明の第6実施形態に係る情報処理システムにおける通信端末の機能構成を示すブロック図である。 本発明の第7実施形態に係る情報処理システムの構成を示すブロック図である。 本発明の第8実施形態に係る情報処理システムの構成を示すブロック図である。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素は単なる例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
[第1実施形態]
本発明の第1実施形態としての情報処理システム100について、図1を用いて説明する。情報処理システム100は、撮像した映像内の商品を同定するシステムである。
図1に示すように、情報処理システム100は、第1局所特徴量記憶部110と、撮像部120と、第2局所特徴量生成部130と、認識部140と、を含む。第1局所特徴量記憶部110は、商品111と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量112とを、対応付けて記憶する。第2局所特徴量生成部130は、撮像部120が撮像した映像中からm個の特徴点131を抽出し、m個の特徴点131のそれぞれを含むm個の局所領域132についてm個の第2局所特徴量133を生成する。認識部140は、第1局所特徴量112の特徴ベクトルの次元数iおよび第2局所特徴量133の特徴ベクトルの次元数jのうち、より少ない次元数を選択する。認識部140は、選択された次元数までの特徴ベクトルからなるn個の第2局所特徴量133に、選択された次元数までの特徴ベクトルからなるm個の第1局所特徴量112の所定割合以上が対応するか否かを判定する。対応すると判定した場合に(141)、映像中の画像101に商品111が存在すると認識する。
本実施形態によれば、リアルタイムで映像中の画像内の商品を認識して商品管理をすることができる。
[第2実施形態]
次に、本発明の第2実施形態に係る情報処理システムについて説明する。本実施形態の情報処理システムは、撮像した映像から通信端末が局所特徴量を生成して各管理コンピュータに送信し、管理コンピュータでは商品に対応付けて記憶した局所特徴量と照合して商品を同定して、同定した商品の管理処理を行なう。
本実施形態によれば、同じ商品を様々な状態であっても同定できるので、統一的な商品管理が可能である。
《情報処理システムの構成》
図2は、本実施形態に係る情報処理システム200の構成を示すブロック図である。
図2の情報処理システム200は、商品の販売を行なう流通システムである。情報処理システム200は、ネットワーク260を介して接続された複数の店舗や商品の出荷倉庫などを含む。図2には、2つの店舗201と202とを示し、以下、店舗201による処理を説明する。
図2の情報処理システム200では、倉庫からの出荷処理210と、店舗201への入庫処理220と、店舗201での棚卸し処理230と、店舗201でのレジ処理240と、を説明する。
まず、出荷処理210においては、通信端末211が倉庫から輸送車212に搬出される出庫品213を撮像して、その映像から局所特徴量を生成する。本例では、生成した局所特徴量をネットワーク260を介して管理サーバ250に送る。管理サーバ250で局所特徴量から出庫品213を同定し、出庫処理を行なう。なお、出荷処理210においては、撮像される出庫品213はダンボール箱などのケースである。
次に、入庫処理220においては、通信端末221が輸送車212から下ろされて店舗201に入庫される入庫品213を撮像して、その映像から局所特徴量を生成する。なお、出庫品と入庫品は同じなので、同じ参照番号を付している。生成した局所特徴量をネットワーク260を介して管理サーバ250に送る。同時に、店舗コンピュータ201aにも送る。管理サーバ250および/または店舗コンピュータ201aにおいて、局所特徴量から入庫品213を同定し、入庫処理を行なう。なお、入庫処理220においても、撮像される出庫品213はダンボール箱などのケースである。
次に、棚卸し処理230においては、店員232が携帯する通信端末231が所望の棚233を撮像する。撮像された映像から局所特徴量を生成する。生成した局所特徴量を店舗コンピュータ201aに送る。なお、棚卸し処理は、店舗コンピュータ201aで実行してもよいし、データを管理サーバ250に転送して管理サーバ250で行なってもよい。また、棚卸し処理230では、棚233の認識のみではなく棚233に陳列された商品の1つ1つを認識する必要があるので、出荷処理210や入庫処理220に比較して、より高精度な特徴点数や特徴ベクトルの次元数による局所特徴量生成が行なわれる(図11A〜図11F参照)。
次に、レジ処理240においては、店員243が携帯する、あるいはレジに設置された通信端末241が商品241aやかご241bを撮像する。撮像された映像から局所特徴量を生成する。生成した局所特徴量をPOS(point of sale)242あるいは、POS242を介して店舗コンピュータ201aに送る。局所特徴量による商品の同定処理と、商品価格判定処理は、POS242で行なっても店舗コンピュータ201aで行なってもよいが、POS242で行なうのが望ましい。個別の商品241aの認識と、かご214b内の複数商品の認識との場合に、異なる精度の局所特徴量を生成するように制御してもよい。
このように、出荷処理210と、入庫処理220と、棚卸し処理230と、レジ処理240とを、それぞれ通信端末211〜241による撮像のみによって、リアルタイムに統一的に実現できる。
なお、以下の説明では、局所特徴量の照合により商品認識を行なう管理サーバ250や店舗コンピュータ201a、POS242を、局所特徴量を生成する通信端末211〜241と対比して、管理コンピュータと総称する場合もある。
《商品出荷時の動作手順》
図3は、本実施形態に係る商品出荷時の動作手順を示すシーケンス図である。
まず、必要であれば、ステップS300において、管理サーバ250から通信端末にアプリケーションのダウンロードを行なう。そして、ステップS301において、本実施形態の処理を行なうための、アプリケーションの起動と初期化が行なわれる。
ステップS303において、通信端末は、出荷品を撮影する。この時点では、商品はダンボール箱などに入っているので、この箱を認識する。ステップS305において、映像から局所特徴量を生成する。続いて、ステップS307において局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS309において、通信端末から管理サーバに送信される。
管理サーバでは、ステップS311において、各商品に対して生成され記憶された局所特徴量DB310を参照して、出荷品の認識を行なう。そして、ステップS313において、商品の認識結果を管理サーバから通信端末に送信する。
通信端末は、ステップS315において、認識結果を報知する。一方、管理サーバは、ステップS317において、流通管理DB320を参照して、流通管理処理を行なう。
《商品入庫時の動作手順》
図4は、本実施形態に係る商品入庫時の動作手順を示すシーケンス図である。
まず、必要であれば、ステップS400において、管理サーバ250あるいは店舗コンピュータから通信端末にアプリケーションのダウンロードを行なう。そして、ステップS401において、本実施形態の処理を行なうための、アプリケーションの起動と初期化が行なわれる。
ステップS403において、通信端末は、出入庫品を撮影する。この時点では、商品はダンボール箱などに入っているので、出荷と同様にこの箱を認識する。ステップS405において、映像から局所特徴量を生成する。続いて、ステップS407において局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS409において、通信端末から管理サーバに送信される。
管理サーバでは、ステップS411において、各商品に対して生成され記憶された局所特徴量DB310を参照して、入庫品の認識を行なう。そして、ステップS413において、商品の認識結果を管理サーバから通信端末に送信する。
通信端末は、ステップS415において、認識結果を報知する。一方、管理サーバは、ステップS417において、流通管理DB320を参照して、流通管理処理を行なう。
一方、入庫処理においては、ステップS419において、入庫品の認識結果は管理サーバから店舗コンピュータにも送信される。店舗コンピュータは、ステップS421において、在庫管理DB410を参照して入庫処理を行なう。なお、局所特徴量による入庫品の認識は、店舗コンピュータで行なってもよい。また、管理サーバがシステム全体の在庫管理を行なう場合は、ステップS423において、管理サーバが有する在庫管理DBを参照して、在庫管理処理が行なわれる。
《棚卸し/棚割調査時の動作手順》
図5は、本実施形態に係る棚卸し/棚割調査時の動作手順を示すシーケンス図である。
まず、必要であれば、ステップS500において、管理サーバ250あるいは店舗コンピュータから通信端末にアプリケーションのダウンロードを行なう。そして、ステップS501において、本実施形態の処理を行なうための、アプリケーションの起動と初期化が行なわれる。
ステップS503において、通信端末は、商品棚を撮影する。ステップS505において、映像から局所特徴量を生成する。なお、棚卸し/棚割調査では、棚全体の認識と共に、個々の商品の同定と配置認識が必要であるので、特徴点数や特徴ベクトルの次元数などを調整して、より精度の高い局所特徴量が生成される。続いて、ステップS507において局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS509において、通信端末から店舗コンピュータに送信される。
店舗コンピュータでは、ステップS511において、各商品に対して生成され記憶された店舗コンピュータの局所特徴量DB510を参照して、棚および商品の認識を行なう。そして、ステップS513において、認識結果を店舗コンピュータから通信端末に送信する。
通信端末は、ステップS515において、認識結果を報知する。一方、店舗コンピュータは、ステップS517において、店舗コンピュータの在庫管理DB410を参照して、棚卸し/棚割認識処理を行なう。そして、棚卸し/棚割認識結果は、ステップS519において、店舗コンピュータから管理サーバに送信される。管理サーバでは、受信した棚卸し/棚割認識結果に基づいて、ステップS521において、流通管理DB320や在庫管理DB420を参照して、流通・在庫管理処理が行なわれる。
なお、局所特徴量による棚卸しや棚割調査のための認識を店舗コンピュータでなく、管理サーバで行なう場合は、その手順が、ステップS531からS535に破線で示されている。
《店舗レジでの動作手順》
図6は、本実施形態に係る店舗レジでの動作手順を示すシーケンス図である。
まず、必要であれば、ステップS600において、管理サーバ250あるいは店舗コンピュータからPOSあるいは通信端末にアプリケーションのダウンロードを行なう。そして、ステップS601において、本実施形態の処理を行なうための、アプリケーションの起動と初期化が行なわれる。
ステップS603において、通信端末は、レジで1つおよび複数の商品、あるいはかごに入った商品群を撮影する。ステップS605において、映像から局所特徴量を生成する。なお、棚卸し/棚割調査で説明したように、個々の商品とかごの中の複数商品の認識では、特徴点数や特徴ベクトルの次元数などを調整して、精度を変えた局所特徴量が生成される。続いて、ステップS607において局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS609において、通信端末からPOSに送信される。
POSでは、ステップS611において、各商品に対して生成され記憶されたPOSの局所特徴量DB610を参照して、商品の認識を行なう。そして、ステップS613において、認識結果をPOSから通信端末に送信する。
通信端末は、ステップS615において、認識結果を報知する。一方、POSは、ステップS617において、POSの商品価格DB620を参照して、認識された商品の価格を判定し、POS上の表示する。POSは、ステップS619において、客の支払を受けて、入金処理を行なう。そして、ステップS621において、売上情報を店舗コンピュータに送信する。
店舗コンピュータでは、POSからの売上情報を受信して、ステップS623において、売上管理DB640を参照して、売上処理を行なう。そして、ステップS625において、在庫管理DB410を参照して、在庫処理を行なう。
なお、図6の処理においても、商品認識をPOSではなく、店舗コンピュータや管理サーバで行なっても良く、その場合の処理が、ステップS631とS633に図示されている。また、価格判定をPOSでなく店舗コンピュータで行なっても良く、その場合の処理が、ステップS635により図示されている。さらに、在庫処理を管理サーバが行なう場合を、ステップS637による図示している。
《通信端末の機能構成》
図7は、本実施形態に係る通信端末211、221、231、241の機能構成を示すブロック図である。
図7において、撮像部701は、クエリ画像を入力する。局所特徴量生成部702は、撮像部701からの映像から局所特徴量を生成する。生成された局所特徴量は、特徴点座標と共に、局所特徴量送信部703で符号化部703aにより符号化され、通信制御部704を介して、局所特徴量により商品認識を行なうコンピュータ、例えば、POSや店舗コンピュータ、管理サーバに送信する。
商品認識結果受信部705は、通信制御部704を介して商品認識結果を受信する。そして、認識結果報知部706は、受信した商品認識結果をユーザに報知する。
《管理サーバの機能構成》
図8は、本実施形態に係る管理サーバ250の機能構成を示すブロック図である。
図8において、局所特徴量受信部802は、通信制御部801を介して通信端末から受信した局所特徴量を復号部802aで復号する。商品認識部803は、受信した局所特徴量を、商品に対応する局所特徴量を格納する局所特徴量DB310の局所特徴量と照合して、商品を認識する。認識結果送信部804は、商品認識部803が認識した認識結果を通信制御部801を介して通信端末に返信する。
また、商品認識部803からに認識結果と、売上情報受信部805が受信した売上情報とに基づいて、流通管理部806は、流通管理DB320を参照して流通管理を行なう。また、在庫管理部807は、在庫管理DB420を参照して、在庫管理を行なう。
《POSの機能構成》
図9Aは、本実施形態に係るPOS242の機能構成を示すブロック図である。
図9Aにおいて、局所特徴量受信部912は、通信制御部911を介して通信端末から受信した局所特徴量を復号部912aで復号する。商品認識部913は、受信した局所特徴量を、商品に対応する局所特徴量を格納する局所特徴量DB610の局所特徴量と照合して、商品を認識する。認識結果送信部914は、商品認識部913が認識した認識結果を通信制御部911を介して通信端末に返信する。
また、商品価格判定部915は、商品価格DB620を参照して、認識した商品の価格を判定する。その商品価格は、価格積算部916に送られて、客が購入した商品の価格を積算する。積算される価格は価格表示部917に表示される。
価格積算部916で積算した積算価格と、入金部918への入金情報に基づいて、入金処理部919は、領収書印刷部920で領収書を印刷すると共に、売上情報送信部921から店舗コンピュータに送信する。
《店舗コンピュータの機能構成》
図9Bは、本実施形態に係る店舗コンピュータ201aの機能構成を示すブロック図である。
図9Bにおいて、局所特徴量受信部932は、通信制御部931を介して通信端末から受信した局所特徴量を復号部932aで復号する。商品認識部933は、受信した局所特徴量を、商品に対応する局所特徴量を格納する局所特徴量DB510の局所特徴量と照合して、商品を認識する。認識結果送信部934は、商品認識部933が認識した認識結果を通信制御部931を介して通信端末に返信する。
また、商品価格判定部935は、商品価格DB630を参照して、認識した商品の価格を判定する。その商品価格は、商品価格送信部936から通信制御部931を介して、例えば、POSに価格判定機能が場合に送信される。
また、商品認識部933からの商品に人気結果は、棚卸し/棚割認識処理部937に送られて、在庫管理DB410を参照して、棚卸し/棚割認識処理が行なわれる。棚卸し/棚割認識結果は、棚卸し/棚割認識結果送信部938から通信制御部931を介して、管理サーバに送られる。
また、通信制御部931を介してPOSから送信された売上情報は、売上情報受信部939で受信されて、売上処理部940により、売上管理DB640に蓄積される。
(局所特徴量DB)
図10は、本実施形態に係る局所特徴量DB310,510,610の構成を示す図である。
局所特徴量DB310,510,610は、商品ID1001と商品名/種別1002に対応付けて、第1番局所特徴量1003、第2番局所特徴量1004、...、第m番局所特徴量1005を記憶する。各局所特徴量は、5×5のサブ領域に対応して、25次元ずつに階層化された1次元から150次元の要素からなる特徴ベクトルを記憶する(図11F参照)。
なお、mは正の整数であり、商品に対応して異なる数でよい。また、本実施形態においては、それぞれの局所特徴量と共に照合処理に使用される特徴点座標が記憶される。
《局所特徴量生成部》
図11Aは、本実施形態に係る局所特徴量生成部702の構成を示すブロック図である。
局所特徴量生成部702は、特徴点検出部1111、局所領域取得部1112、サブ領域分割部1113、サブ領域特徴ベクトル生成部1114、および次元選定部1115を含んで構成される。
特徴点検出部1111は、画像データから特徴的な点(特徴点)を多数検出し、各特徴点の座標位置、スケール(大きさ)、および角度を出力する。
局所領域取得部1112は、検出された各特徴点の座標値、スケール、および角度から、特徴量抽出を行う局所領域を取得する。
サブ領域分割部1113は、局所領域をサブ領域に分割する。たとえば、サブ領域分割部1113は、局所領域を16ブロック(4×4ブロック)に分割することも、局所領域を25ブロック(5×5ブロック)に分割することもできる。なお、分割数は限定されない。本実施形態においては、以下、局所領域を25ブロック(5×5ブロック)に分割する場合を代表して説明する。
サブ領域特徴ベクトル生成部1114は、局所領域のサブ領域ごとに特徴ベクトルを生成する。サブ領域の特徴ベクトルとしては、たとえば、勾配方向ヒストグラムを用いることができる。
次元選定部1115は、サブ領域の位置関係に基づいて、近接するサブ領域の特徴ベクトル間の相関が低くなるように、局所特徴量として出力する次元を選定する(たとえば、間引きする)。また、次元選定部1115は、単に次元を選定するだけではなく、選定の優先順位を決定することができる。すなわち、次元選定部1115は、たとえば、隣接するサブ領域間では同一の勾配方向の次元が選定されないように、優先順位をつけて次元を選定することができる。そして、次元選定部1115は、選定した次元から構成される特徴ベクトルを、局所特徴量として出力する。なお、次元選定部1115は、優先順位に基づいて次元を並び替えた状態で、局所特徴量を出力することができる。
《局所特徴量生成部の処理》
図11B〜図11Fは、本実施形態に係る局所特徴量生成部702の処理を示す図である。
まず、図11Bは、局所特徴量生成部702における、特徴点検出/局所領域取得/サブ領域分割/特徴ベクトル生成の一連の処理を示す図である。かかる一連の処理については、米国特許第6711293号明細書や、David G. Lowe著、「Distinctive image features from scale-invariant key points」、(米国)、International Journal of Computer Vision、60(2)、2004年、p. 91-110を参照されたい。
(特徴点検出部)
図11Bの画像1121は、図11Aの特徴点検出部1111において、映像中の画像から特徴点を検出した状態を示す図である。以下、1つの特徴点データ1121aを代表させて局所特徴量の生成を説明する。特徴点データ1121aの矢印の起点が特徴点の座標位置を示し、矢印の長さがスケール(大きさ)を示し、矢印の方向が角度を示す。ここで、スケール(大きさ)や方向は、対象映像にしたがって輝度や彩度、色相などを選択できる。また、図11Bの例では、60度間隔で6方向の場合を説明するが、これに限定されない。
(局所領域取得部)
図11Aの局所領域取得部1112は、たとえば、特徴点データ1121aの起点を中心にガウス窓1122aを生成し、このガウス窓1122aをほぼ含む局所領域1122を生成する。図11Bの例では、局所領域取得部1112は正方形の局所領域1122を生成したが、局所領域は円形であっても他の形状であってもよい。この局所領域を各特徴点について取得する。局所領域が円形であれば、撮影方向に対してロバスト性が向上するという効果がある。
(サブ領域分割部)
次に、サブ領域分割部1113において、上記特徴点データ1121aの局所領域1122に含まれる各画素のスケールおよび角度をサブ領域1123に分割した状態が示されている。なお、図11Bでは4×4=16画素をサブ領域とする5×5=25のサブ領域に分割した例を示す。しかし、サブ領域は、4×4=16や他の形状、分割数であってもよい。
(サブ領域特徴ベクトル生成部)
サブ領域特徴ベクトル生成部1114は、サブ領域内の各画素のスケールを6方向の角度単位にヒストグラムを生成して量子化し、サブ領域の特徴ベクトル1124とする。すなわち、特徴点検出部1111が出力する角度に対して正規化された方向である。そして、サブ領域特徴ベクトル生成部1114は、サブ領域ごとに量子化された6方向の頻度を集計し、ヒストグラムを生成する。この場合、サブ領域特徴ベクトル生成部1114は、各特徴点に対して生成される25サブ領域ブロック×6方向=150次元のヒストグラムにより構成される特徴ベクトルを出力する。また、勾配方向を6方向に量子化するだけに限らず、4方向、8方向、10方向など任意の量子化数に量子化してよい。勾配方向をD方向に量子化する場合、量子化前の勾配方向をG(0〜2πラジアン)とすると、勾配方向の量子化値Qq(q=0,...,D−1)は、たとえば式(1)や式(2)などで求めることができるが、これに限られない。
Qq=floor(G×D/2π) ...(1)
Qq=round(G×D/2π)modD ...(2)
ここで、floor()は小数点以下を切り捨てる関数、round()は四捨五入を行う関数、modは剰余を求める演算である。また、サブ領域特徴ベクトル生成部1114は勾配ヒストグラムを生成するときに、単純な頻度を集計するのではなく、勾配の大きさを加算して集計してもよい。また、サブ領域特徴ベクトル生成部1114は勾配ヒストグラムを集計するときに、画素が属するサブ領域だけではなく、サブ領域間の距離に応じて近接するサブ領域(隣接するブロックなど)にも重み値を加算するようにしてもよい。また、サブ領域特徴ベクトル生成部1114は量子化された勾配方向の前後の勾配方向にも重み値を加算するようにしてもよい。なお、サブ領域の特徴ベクトルは勾配方向ヒストグラムに限られず、色情報など、複数の次元(要素)を有するものであればよい。本実施形態においては、サブ領域の特徴ベクトルとして、勾配方向ヒストグラムを用いることとして説明する。
(次元選定部)
次に、図11C〜図11Fにしたがって、局所特徴量生成部702における、次元選定部1115に処理を説明する。
次元選定部1115は、サブ領域の位置関係に基づいて、近接するサブ領域の特徴ベクトル間の相関が低くなるように、局所特徴量として出力する次元(要素)を選定する(間引きする)。より具体的には、次元選定部1115は、たとえば、隣接するサブ領域間では少なくとも1つの勾配方向が異なるように次元を選定する。なお、本実施形態では、次元選定部1115は近接するサブ領域として主に隣接するサブ領域を用いることとするが、近接するサブ領域は隣接するサブ領域に限られず、たとえば、対象のサブ領域から所定距離内にあるサブ領域を近接するサブ領域とすることもできる。
図11Cは、局所領域を5×5ブロックのサブ領域に分割し、勾配方向を6方向1131aに量子化して生成された150次元の勾配ヒストグラムの特徴ベクトル1131から次元を選定する場合の一例を示す図である。図11Cの例では、150次元(5×5=25サブ領域ブロック×6方向)の特徴ベクトルから次元の選定が行われている。
(局所領域の次元選定)
図11Cは、局所特徴量生成部702における、特徴ベクトルの次元数の選定処理の様子を示す図である。
図11Cに示すように、次元選定部1115は、150次元の勾配ヒストグラムの特徴ベクトル1131から半分の75次元の勾配ヒストグラムの特徴ベクトル1132を選定する。この場合、隣接する左右、上下のサブ領域ブロックでは、同一の勾配方向の次元が選定されないように、次元を選定することができる。
この例では、勾配方向ヒストグラムにおける量子化された勾配方向をq(q=0,1,2,3,4,5)とした場合に、q=0,2,4の要素を選定するブロックと、q=1,3,5の要素を選定するサブ領域ブロックとが交互に並んでいる。そして、図11Cの例では、隣接するサブ領域ブロックで選定された勾配方向を合わせると、全6方向となっている。
また、次元選定部1115は、75次元の勾配ヒストグラムの特徴ベクトル1132から50次元の勾配ヒストグラムの特徴ベクトル1133を選定する。この場合、斜め45度に位置するサブ領域ブロック間で、1つの方向のみが同一になる(残り1つの方向は異なる)ように次元を選定することができる。
また、次元選定部1115は、50次元の勾配ヒストグラムの特徴ベクトル1133から25次元の勾配ヒストグラムの特徴ベクトル1134を選定する場合は、斜め45度に位置するサブ領域ブロック間で、選定される勾配方向が一致しないように次元を選定することができる。図11Cに示す例では、次元選定部1115は、1次元から25次元までは各サブ領域から1つの勾配方向を選定し、26次元から50次元までは2つの勾配方向を選定し、51次元から75次元までは3つの勾配方向を選定している。
このように、隣接するサブ領域ブロック間で勾配方向が重ならないように、また全勾配方向が均等に選定されることが望ましい。また同時に、図11Cに示す例のように、局所領域の全体から均等に次元が選定されることが望ましい。なお、図11Cに示した次元選定方法は一例であり、この選定方法に限らない。
(局所領域の優先順位)
図11Dは、局所特徴量生成部702における、サブ領域からの特徴ベクトルの選定順位の一例を示す図である。
次元選定部1115は、単に次元を選定するだけではなく、特徴点の特徴に寄与する次元から順に選定するように、選定の優先順位を決定することができる。すなわち、次元選定部1115は、たとえば、隣接するサブ領域ブロック間では同一の勾配方向の次元が選定されないように、優先順位をつけて次元を選定することができる。そして、次元選定部1115は、選定した次元から構成される特徴ベクトルを、局所特徴量として出力する。なお、次元選定部1115は、優先順位に基づいて次元を並び替えた状態で、局所特徴量を出力することができる。
すなわち、次元選定部1115は、1〜25次元、26次元〜50次元、51次元〜75次元の間は、たとえば図11Dのマトリクス1141に示すようなサブ領域ブロックの順番で次元を追加するように選定していってもよい。図11Dのマトリクス1141に示す優先順位を用いる場合、次元選定部1115は、中心に近いサブ領域ブロックの優先順位を高くして、勾配方向を選定していくことができる。
図11Eのマトリクス1151は、図11Dの選定順位にしたがって、150次元の特徴ベクトルの要素の番号の一例を示す図である。この例では、5×5=25ブロックをラスタスキャン順に番号p(p=0,1,...,25)で表し、量子化された勾配方向をq(q=0,1,2,3,4,5)とした場合に、特徴ベクトルの要素の番号を6×p+qとしている。
図11Fのマトリクス1161は、図11Eの選定順位による150次元の順位が、25次元単位に階層化されていることを示す図である。すなわち、図11Fのマトリクス1161は、図4Dのマトリクス1141に示した優先順位にしたがって図11Eに示した要素を選定していくことにより得られる局所特徴量の構成例を示す図である。次元選定部1115は、図11Fに示す順序で次元要素を出力することができる。具体的には、次元選定部1115は、たとえば150次元の局所特徴量を出力する場合、図11Fに示す順序で全150次元の要素を出力することができる。また、次元選定部1115は、たとえば25次元の局所特徴量を出力する場合、図11Fに示す1行目(76番目、45番目、83番目、...、120番目)の要素1171を図11Fに示す順(左から右)に出力することができる。また、次元選定部1115は、たとえば50次元の局所特徴量を出力する場合、図11Fに示す1行目に加えて、図11Fに示す2行目の要素1172を図11Fに示す順(左から右)に出力することができる。
ところで、図11Fに示す例では、局所特徴量は階層的な構造となっている。すなわち、たとえば、25次元の局所特徴量と150次元の局所特徴量とにおいて、先頭の25次元分の局所特徴量における要素1171〜1176の並びは同一となっている。このように、次元選定部1115は、階層的(プログレッシブ)に次元を選定することにより、アプリケーションや通信容量、端末スペックなどに応じて、任意の次元数の局所特徴量、すなわち任意のサイズの局所特徴量を抽出して出力することができる。また、次元選定部1115が、階層的に次元を選定し、優先順位に基づいて次元を並び替えて出力することにより、異なる次元数の局所特徴量を用いて、画像の照合を行うことができる。たとえば、75次元の局所特徴量と50次元の局所特徴量を用いて画像の照合が行われる場合、先頭の50次元だけを用いることにより、局所特徴量間の距離計算を行うことができる。
なお、図11Dのマトリクス1141から図11Fに示す優先順位は一例であり、次元を選定する際の順序はこれに限られない。たとえば、ブロックの順番に関しては、図11Dのマトリクス1141の例の他に、図11Dのマトリクス1142や図11Dのマトリクス1143に示すような順番でもよい。また、たとえば、すべてのサブ領域からまんべんなく次元が選定されるように優先順位が定められることとしてもよい。また、局所領域の中央付近が重要として、中央付近のサブ領域の選定頻度が高くなるように優先順位が定められることとしてもよい。また、次元の選定順序を示す情報は、たとえば、プログラムにおいて規定されていてもよいし、プログラムの実行時に参照されるテーブル等(選定順序記憶部)に記憶されていてもよい。
また、次元選定部1115は、サブ領域ブロックを1つ飛びに選択して、次元の選定を行ってもよい。すなわち、あるサブ領域では6次元が選定され、当該サブ領域に近接する他のサブ領域では0次元が選定される。このような場合においても、近接するサブ領域間の相関が低くなるようにサブ領域ごとに次元が選定されていると言うことができる。
また、局所領域やサブ領域の形状は、正方形に限られず、任意の形状とすることができる。たとえば、局所領域取得部1112が、円状の局所領域を取得することとしてもよい。この場合、サブ領域分割部413は、円状の局所領域をたとえば複数の局所領域を有する同心円に9分割や17分割のサブ領域に分割することができる。この場合においても、次元選定部1115は、各サブ領域において、次元を選定することができる。
以上、図11B〜図11Fに示したように、本実施形態の局所特徴量生成部702によれば、局所特徴量の情報量を維持しながら生成された特徴ベクトルの次元が階層的に選定される。この処理により、認識精度を維持しながらリアルタイムでの対象物認識と認識結果の表示が可能となる。なお、局所特徴量生成部702の構成および処理は本例に限定されない。認識精度を維持しながらリアルタイムでの対象物認識と認識結果の表示が可能となる他の処理が当然に適用できる。
(符号化部)
図11Gは、本実施形態に係る符号化部703aを示すブロック図である。なお、符号化部は本例に限定されず、他の符号化処理も適用可能である。
符号化部703aは、局所特徴量生成部702の特徴点検出部1111から特徴点の座標を入力して、座標値を走査する座標値走査部1181を有する。座標値走査部1181は、画像をある特定の走査方法にしたがって走査し、特徴点の2次元座標値(X座標値とY座標値)を1次元のインデックス値に変換する。このインデックス値は、走査に従った原点からの走査距離である。なお、走査方向については、制限はない。
また、特徴点のインデックス値をソートし、ソート後の順列の情報を出力するソート部1182を有する。ここでソート部1182は、たとえば昇順にソートする。また降順にソートしてもよい。
また、ソートされたインデックス値における、隣接する2つのインデックス値の差分値を算出し、差分値の系列を出力する差分算出部1183を有する。
そして、差分値の系列を系列順に符号化する差分符号化部1184を有する。差分値の系列の符号化は、たとえば固定ビット長の符号化でもよい。固定ビット長で符号化する場合、そのビット長はあらかじめ規定されていてもよいが、これでは考えられうる差分値の最大値を表現するのに必要なビット数を要するため、符号化サイズは小さくならない。そこで、差分符号化部1184は、固定ビット長で符号化する場合、入力された差分値の系列に基づいてビット長を決定することができる。具体的には、たとえば、差分符号化部1184は、入力された差分値の系列から差分値の最大値を求め、その最大値を表現するのに必要なビット数(表現ビット数)を求め、求められた表現ビット数で差分値の系列を符号化することができる。
一方、ソートされた特徴点のインデックス値と同じ順列で、対応する特徴点の局所特徴量を符号化する局所特徴量符号化部1185を有する。ソートされたインデックス値と同じ順列で符号化することで、差分符号化部1184で符号化された座標値と、それに対応する局所特徴量とを1対1で対応付けることが可能となる。局所特徴量符号化部1185は、本実施形態においては、1つの特徴点に対する150次元の局所特徴量から次元選定された局所特徴量を、たとえば1次元を1バイトで符号化し、次元数のバイトで符号化することができる。
(商品認識部)
図11H、図11Jおよび図11Kは、本実施形態に係る商品認識部803,913,933の処理を示す図である。
図11Hは、図2における出荷処理210および入庫処理220時の商品認識部803の処理を示す図である。図11Hに示す、あらかじめ出荷および入庫商品であるダンボールなどのケース1191aから本実施形態に従い生成された局所特徴量1191は、局所特徴量DB310に格納されている。一方、図11Hの左図の通信端末で撮像された映像画面1190からは、本実施形態に従い局所特徴量が生成される。そして、局所特徴量DB310に格納された局所特徴量1191が、映像画面1190から生成された局所特徴量中にあるか否かが照合される。
図11Hに示すように、商品認識部803は、局所特徴量DB310に格納されている局所特徴量と局所特徴量が合致する各特徴点を細線のように関連付ける。なお、商品認識部803は、局所特徴量の所定割合以上が一致する場合を特徴点の合致とする。そして、商品認識部803は、関連付けられた特徴点の集合間の位置関係が線形関係であれば、対象商品であると認識する。このような認識を行なえば、サイズの大小や向きの違い(視点の違い)、あるいは反転などによっても認識が可能である。また、所定数以上の関連付けられた特徴点があれば認識精度が得られるので、一部が視界から隠れていても商品の認識が可能である。
図11Hにおいては、局所特徴量DB310の1つの局所特徴量1191から、3つの向きの異なる商品1190a,1190b,1190cが同じ商品(梱包容器やケース)として認識される。
図11Jは、図2における棚卸し処理230(棚割処理)時の商品認識部933の処理を示す図である。図11Jに示す、あらかじめ商品(本例では、大きなペットボトル商品1193a、小さなペットボトル商品1194a、小さな紙パック商品1195a)から本実施形態に従い生成された局所特徴量1193,1194,1195は、局所特徴量DB510に格納されている。一方、図11Jの左図の通信端末で撮像された映像画面1192からは、本実施形態に従い局所特徴量が生成される。そして、局所特徴量DB510に格納された局所特徴量のそれぞれが、映像画面1192から生成された局所特徴量中にあるか否かが照合される。
図11Jに示すように、局所特徴量DB510に格納されている局所特徴量1193〜1195と局所特徴量が合致する各特徴点を細線にように関連付ける。なお、局所特徴量の所定割合以上が一致する場合を特徴点の合致とする。そして、関連付けられた特徴点の位置関係が線形関係であれば、認識対象物であると認識する。ここで、認識のための局所特徴量の合致条件や特徴点数の条件は、図11Hと同様であってもよいし、認識対象が異なるので異なる条件を設定してもよい。
図11Jにおいては、局所特徴量DB510の3つの局所特徴量1193〜1195から、棚に陳列された異なる3つの商品1192a,1192b,1192cが個々に認識される。なお、図11Jにおいては、商品認識処理を分かりやすく図示するため、それぞれ1つの商品への細線のみを図示している。
図11Kは、図2におけるレジ処理240時の商品認識部913の処理を示す図である。図11Kに示す、あらかじめ商品(本例では、ラベル1197bが貼られたペットボトル商品1197a、ケース1198aに収納されたたまご1198b、識別可能なテープ1199bで束ねられたホーレンソウ1199a)から本実施形態に従い生成された局所特徴量1197〜1199は、局所特徴量DB610に格納されている。一方、図11Kの左図の通信端末で撮像された映像画面1196からは、本実施形態に従い局所特徴量が生成される。そして、局所特徴量DB610に格納された局所特徴量のそれぞれが、映像画面1196から生成された局所特徴量中にあるか否かが照合される。
図11Kに示すように、局所特徴量DB610に格納されている局所特徴量1197〜1199と局所特徴量が合致する各特徴点を細線にように関連付ける。なお、局所特徴量の所定割合以上が一致する場合を特徴点の合致とする。そして、関連付けられた特徴点の位置関係が線形関係であれば、認識対象物であると認識する。ここで、認識のための局所特徴量の合致条件や特徴点数の条件は、図11Hや図11Jと同様であってもよいし、認識対象が異なるので異なる条件を設定してもよい。
図11Kにおいては、局所特徴量DB610の3つの局所特徴量1197〜1199から、かごに収納された異なる3つの商品1196a,1196b,1196cが個々に認識される。
なお、本実施形態の商品認識部809,913,933の照合処理では、特徴点座標と局所特徴量とに基づいて照合が行なわれるが、合致する認識対象物から生成された局所特徴量と映像中の画像から生成された局所特徴量との配列順序の線形関係のみによっても、認識が可能である。一方、本実施形態では、2次元画像によって説明されているが、3次元の特徴点座標を使用しても、同様の処理が可能である。
《通信端末のハードウェア構成》
図12Aは、本実施形態に係る通信端末211〜241のハードウェア構成を示すブロック図である。
図12Aで、CPU1210は演算制御用のプロセッサであり、プログラムを実行することで通信端末211〜241の各機能構成部を実現する。ROM1220は、初期データおよびプログラムなどの固定データおよびプログラムを記憶する。また、通信制御部704は通信制御部であり、本実施形態においては、ネットワークを介して他の装置と通信する。なお、CPU1210は1つに限定されず、複数のCPUであっても、あるいは画像処理用のGPU(Graphics Processing Unit)を含んでもよい。
RAM1240は、CPU1210が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM1240には、本実施形態の実現に必要なデータを記憶する領域が確保されている。入力映像1241は、撮像部701が撮像して入力された入力映像を示す。特徴点データ1242は、入力映像1241から検出した特徴点座標、スケール、角度を含む特徴点データを示す。局所特徴量生成テーブル1243は、局所特徴量を生成するまでのデータを保持する局所特徴量生成テーブルを示す(12B参照)。局所特徴量1244は、局所特徴量生成テーブル1243を使って生成され、通信制御部704を介して商品認識を行なう送信先に送る局所特徴量を示す。商品認識結果1245は、通信制御部704を介して送信先から返信された商品認識結果を示す。表示画面データ1246は、ユーザに商品認識結果1245を含む情報を報知するための表示画面データを示す。なお、音声出力をする場合には、音声データが含まれてもよい。入出力/送受信データ1247は、入出力インタフェース1260を介して入出力される入出力データおよび通信制御部704を介して送受信される送受信データを示す。
ストレージ1250には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。ストレージ1250には、以下のプログラムが格納される。通信端末制御プログラム1251は、本通信端末211〜241の全体を制御する通信端末制御プログラムを示す。通信端末制御プログラム1251には、以下のモジュールが含まれている。
局所特徴量生成モジュール1252は、通信端末制御プログラム1251において、入力映像から図4B〜図4Fにしたがって局所特徴量を生成する局所特徴量生成モジュールを示す。符号化モジュール1258は、局所特徴量生成モジュール1252により生成された局所特徴量を送信のために符号化する符号化モジュールを示す。商品認識結果報知モジュール755は、商品認識結果を受信して表示または音声によりユーザに報知するための商品認識結果結果報知モジュールを示す。
入出力インタフェース1260は、入出力機器との入出力データをインタフェースする。入出力インタフェース1260には、表示部1261、操作部1262であるタッチパネルやキーボード、スピーカ1263、マイク1264、撮像部701が接続される。入出力機器は上記例に限定されない。また、GPS(Global Positioning System)位置生成部1265は、GPS衛星からの信号に基づいて現在位置を取得する。
なお、図7には、本実施形態に必須なデータやプログラムのみが示されており、本実施形態に関連しないデータやプログラムは図示されていない。
(局所特徴量生成テーブ)
図12Bは、本実施形態に係る通信端末211〜241における局所特徴量生成テーブル1243を示す図である。
局所特徴量生成テーブル1243には、入力画像ID1201に対応付けて、複数の検出された検出特徴点1202,特徴点座標1203および特徴点に対応する局所領域情報1204が記憶される。そして、各検出特徴点1202,特徴点座標1203および局所領域情報1204に対応付けて、複数のサブ領域ID1205,サブ領域情報1206,各サブ領域に対応する特徴ベクトル1207および優先順位を含む選定次元1208が記憶される。
以上のデータから各検出特徴点1202に対して生成された局所特徴量1209が記憶される。
《通信端末の処理手順》
図13は、本実施形態に係る通信端末211〜241の処理手順を示すフローチャートである。このフローチャートは、図12AのCPU1210によってRAM1240を用いて実行され、図7の各機能構成部を実現する。
まず、ステップS1311において、商品認識を行なうための映像入力があったか否かを判定する。また、ステップS1321においてはデータ受信を判定する。いずれでもなければ、ステップS1231においてその他の処理を行なう。なお、通常の送信処理については説明を省略する。
映像入力があればステップS1313に進んで、入力映像から局所特徴量生成処理を実行する(図14A参照)。次に、ステップS1315において、局所特徴量および特徴点座標を符号化する(図14Bおよび図14C参照)。ステップS1317においては、符号化されたデータを管理コンピュータに送信する。
データ受信の場合はステップS1323に進んで、照合サーバからの商品認識結果の受信か否かを判定する。商品認識結果であればステップS1325に進んで、受信した商品認識結果を報知する。
(局所特徴量生成処理)
図14Aは、本実施形態に係る局所特徴量生成処理S1313の処理手順を示すフローチャートである。
まず、ステップS1411において、入力映像から特徴点の位置座標、スケール、角度を検出する。ステップS1413において、ステップS1411で検出された特徴点の1つに対して局所領域を取得する。次に、ステップS1415において、局所領域をサブ領域に分割する。ステップS1417においては、各サブ領域の特徴ベクトルを生成して局所領域の特徴ベクトルを生成する。ステップS1411からS1417の処理は図11Bに図示されている。
次に、ステップS1419において、ステップS1417において生成された局所領域の特徴ベクトルに対して次元選定を実行する。次元選定については、図11D〜図11Fに図示されている。
ステップS1421においては、ステップS1411で検出した全特徴点について局所特徴量の生成と次元選定とが終了したかを判定する。終了していない場合はステップS1413に戻って、次の1つの特徴点について処理を繰り返す。
(符号化処理)
図14Bは、本実施形態に係る符号化処理S1315の処理手順を示すフローチャートである。
まず、ステップS1431において、特徴点の座標値を所望の順序で走査する。次に、ステップS1433において、走査した座標値をソートする。ステップS1435において、ソートした順に座標値の差分値を算出する。ステップS1437においては、差分値を符号化する(図14C参照)。そして、ステップS1439において、座標値のソート順に局所特徴量を符号化する。なお、差分値の符号化と局所特徴量の符号化とは並列に行なってもよい。
(差分値の符号化処理)
図14Cは、本実施形態に係る差分値の符号化処理S1437の処理手順を示すフローチャートである。
まず、ステップS1441において、差分値が符号化可能な値域内であるか否かを判定する。符号化可能な値域内であればステップS1447に進んで、差分値を符号化する。そして、ステップS1449へ移行する。符号化可能な値域内でない場合(値域外)はステップS1443に進んで、エスケープコードを符号化する。そしてステップS1445において、ステップS1447の符号化とは異なる符号化方法で差分値を符号化する。そして、ステップS1449へ移行する。ステップS1449では、処理された差分値が差分値の系列の最後の要素であるかを判定する。最後である場合は、処理が終了する。最後でない場合は、再度ステップS1441に戻って、差分値の系列の次の差分値に対する処理が実行される。
《管理コンピュータのハードウェア構成》
図15Aは、本実施形態に係る管理コンピュータのハードウェア構成を示すブロック図である。なお、図15Aには、共通の構成要素とそれぞれに固有の構成要素とが、混在して図示されている。それぞれにおいて共通の構成要素については、管理サーバ250を代表させる。
図23で、CPU1510は演算制御用のプロセッサであり、プログラムを実行することで照合サーバである映像処理装置1620の各機能構成部を実現する。ROM1520は、初期データおよびプログラムなどの固定データおよびプログラムを記憶する。また、通信制御部801は通信制御部であり、本実施形態においては、ネットワークを介して他の装置と通信する。なお、CPU1510は1つに限定されず、複数のCPUであっても、あるいは画像処理用のGPUを含んでもよい。
RAM1540は、CPU1510が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM1540には、本実施形態の実現に必要なデータを記憶する領域が確保されている。受信した局所特徴量1441は、通信端末から受信した特徴点座標を含む局所特徴量を示す。読出した局所特徴量1542は、局所特徴量DB310から読み出した特徴点座標を含むと局所特徴量を示す。商品照合結果1543は、受信した局所特徴量と局所特徴量DB310に格納された局所特徴量との照合から認識された、商品照合結果を示す。商品価格1544は、POS242または店舗コンピュータ201aに固有のデータであり、商品認識結果に基づいて商品価格DB630から読出された商品価格を示す。入金情報1545は、POS242または店舗コンピュータ201aに固有のデータであり、ユーザの支払が完了した時点での入金情報を示す。流通管理情報1546は、管理サーバ250に固有のデータであり、流通管理DB320に蓄積される流通管理情報を示す。在庫管理情報1547は、管理サーバ250と店舗コンピュータ201aとに固有のデータであり、在庫管理DB420に基づく在庫管理情報を示す。送受信データ1548は、通信制御部801を介して送受信される送受信データを示す。
ストレージ1550には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。局所特徴量DB310は、図10に示したと同様の局所特徴量DBを示す。商品価格DB630は、POS242または店舗コンピュータ201aに固有のDBであり、商品価格を格納する(図15B参照)。流通管理DB320は、管理サーバ250に固有のDBであり、商品流通(たとえば、図2の出荷や入庫など)の情報を格納する。在庫管理DB420は、管理サーバ250と店舗コンピュータ201aとに固有のDBであり、在庫管理情報を格納する。
ストレージ1550には、以下のプログラムが格納される。管理コンピュータ制御プログラム1551は、本管理コンピュータの全体を制御する管理コンピュータ制御プログラムを示す。局所特徴量DB作成モジュール21552は、管理コンピュータ制御プログラム1551において、認識部品の画像から局所特徴量を生成して局所特徴量DBに格納する局所特徴量DB作成モジュールを示す。商品認識制御モジュール1553は、管理コンピュータ制御プログラム1551において、受信した局所特徴量と局所特徴量DB310に格納された局所特徴量とを照合して商品を認識する商品認識制御モジュールを示す。商品価格判定モジュール1554は、POS242または店舗コンピュータ201aに固有のモジュールであり、認局所特徴量から認識された商品に基づいて価格を判定する商品価格判定モジュールを示す。
なお、図23には、本実施形態に必須なデータやプログラムのみが示されており、本実施形態に関連しないデータやプログラムは図示されていない。
(商品価格DB)
図15Bは、本実施形態に係る商品価格DB630の構成を示す図である。
商品価格DB630は、商品IDおよび商品名/種別に対応付けて、商品価格を記憶している。
《管理コンピュータの処理手順》
図16は、本実施形態に係る管理コンピュータ250,201a,242の処理手順を示すフローチャートである。このフローチャートは、図15AのCPU1510によりRAM1540を使用して実行され、図8、図9Aあるいは図9Bの各機能構成部を実現する。
まず、ステップS1611において、局所特徴量DBの生成か否かを判定する。また、ステップS1621において、通信端末からの局所特徴量受信かを判定する。いずれでもなければ、ステップS1631において他の処理を行なう。
局所特徴量DBの生成であればステップS1613に進んで、局所特徴量DB生成処理を実行する(図17参照)。また、局所特徴量の受信であればステップS1623に進んで、商品認識処理を行なう(図18Aおよび図18B参照)。次に、ステップS1625において、認識対象物/リンク情報取得処理を実行する(図26B参照)。そして、ステップS2525において、POS242または店舗コンピュータ201aに固有のステップである、価格判定処理を行なう。そして、ステップS1627においては、流通管理処理や在庫管理処理を含む商品流通処理を行なう(図19参照)。
(局所特徴量DB生成処理)
図17は、本実施形態に係る局所特徴量DB生成処理S1613の処理手順を示すフローチャートである。
まず、ステップS1701において、商品の画像を取得する。ステップS1703においては、特徴点の位置座標、スケール、角度を検出する。ステップS1705において、ステップS1703で検出された特徴点の1つに対して局所領域を取得する。次に、ステップS1707において、局所領域をサブ領域に分割する。ステップS1709においては、各サブ領域の特徴ベクトルを生成して局所領域の特徴ベクトルを生成する。ステップS1705からS1709の処理は図11Bに図示されている。
次に、ステップS1711において、ステップS1709において生成された局所領域の特徴ベクトルに対して次元選定を実行する。次元選定については、図11D〜図11Fに図示されている。しかしながら、局所特徴量DB310の生成においては、次元選定における階層化を実行するが、生成されたすべての特徴ベクトルを格納するのが望ましい。
ステップS1713においては、ステップS2613で検出した全特徴点について局所特徴量の生成と次元選定とが終了したかを判定する。終了していない場合はステップS1705に戻って、次の1つの特徴点について処理を繰り返す。全特徴点について終了した場合はステップS1715に進んで、認識商品に対応付けて局所特徴量と特徴点座標とを局所特徴量DB310に登録する。
ステップS1717においては、他の商品があるか否かを判定する。他の商品があればステップS1701に戻って、認識対象物の画像を取得して処理を繰り返す。
(商品認識処理)
図18Aは、本実施形態に係る商品認識処理S1623の処理手順を示すフローチャートである。
まず、ステップS1811において、局所特徴量DB310から1つの認識対象物の局所特徴量を取得する。そして、ステップS1813において、商品の局所特徴量と通信端末から受信した局所特徴量との照合を行なう(図18B参照)。
ステップS1815において、合致したか否かを判定する。合致していればステップS1821に進んで、合致した商名を記憶して通信端末に送信する。
ステップS1817においては、全商品を照合したかを判定し、残りがあればステップS1811に戻って次の商品の照合を繰り返す。なお、かかる照合においても、あらかじめ分野の限定を行なってもよい。
(照合処理)
図18Bは、本実施形態に係る照合処理S1813の処理手順を示すフローチャートである。
まず、ステップS1831において、初期化として、パラメータp=1,q=0を設定する。次に、ステップS1833において、ステップS1831において生成した局所特徴量の次元数jを取得する。
ステップS1835〜S1845のループにおいて、p>m(m=商品の特徴点数)となるまで各局所特徴量の照合を繰り返す。まず、ステップS1835において、局所特徴量DB310に格納された商品の第p番局所特徴量の次元数jのデータを取得する。すなわち、最初の1次元からj次元を取得する。次に、ステップS1837において、ステップS1835において取得した第p番局所特徴量と入力映像から生成した全特徴点の局所特徴量を順に照合して、類似か否かを判定する。ステップS1839においては、局所特徴量間の照合の結果から類似度が閾値αを超えるか否かを判断し、超える場合はステップS1841において、局所特徴量と、入力映像と商品とにおける合致した特徴点の位置関係との組みを記憶する。そして、合致した特徴点数のパラメータであるqを1つカウントアップする。ステップS1843においては、商品の特徴点を次の特徴点に進め(p←p+1)、商品の全特徴点の照合が終わってない場合には(p≦m)、ステップS935に戻って合致する局所特徴量の照合を繰り返す。なお、閾値αは、商品によって求められる認識精度に対応して変更可能である。ここで、他の商品との相関が低い認識対象物であれば認識精度を低くしても、正確な認識が可能である。
商品の全特徴点との照合が終了すると、ステップS1845からS1847に進んで、ステップS1847〜S1853において、商品が入力映像に存在するか否かが判定される。まず、ステップS1847において、商品の特徴点数pの内で入力映像の特徴点の局所特徴量と合致した特徴点数qの割合が、閾値βを超えたか否かを判定する。超えていればステップS1849に進んで、商品候補として、さらに、入力映像の特徴点と商品の特徴点との位置関係が、線形変換が可能な関係を有しているかを判定する。すなわち、ステップS941において局所特徴量が合致したとして記憶した、入力映像の特徴点と商品の特徴点との位置関係が、回転や反転、視点の位置変更などの変化によっても可能な位置関係なのか、不可能な位置関係なのかを判定する。かかる判定方法は幾何学的に既知であるので、詳細な説明は省略する。ステップS1851において、線形変換可能か否かの判定結果により、線形変換可能であればステップS953に進んで、照合した商品が入力映像に存在すると判定する。なお、閾値βは、商品によって求められる認識精度に対応して変更可能である。ここで、他の商品との相関が低い、あるいは一部分からでも特徴が判断可能な商品であれば合致した特徴点が少なくても、正確な認識が可能である。すなわち、一部分が隠れて見えなくても、あるいは特徴的な一部分が見えてさえいれば、商品の認識が可能である。
ステップS1855においては、局所特徴量DB310に未照合の商品が残っているか否かを判定する。まだ商品が残っていれば、ステップS957において次の商品を設定して、パラメータp=1,q=0に初期化し、ステップS935に戻って照合を繰り返す。
なお、かかる照合処理の説明からも明らかなように、あらゆる分野の商品を局所特徴量DB310に記憶して、全商品を照合する処理は、負荷が非常に大きくなる。したがって、たとえば、入力映像からの商品認識の前にユーザが商品の分野をメニューから選択して、その分野を局所特徴量DB310から検索して照合することが考えられる。また、局所特徴量DB310にユーザが使用する分野の局所特徴量のみを記憶することによっても、負荷を軽減できる。
(商品管理処理)
図19は、本実施形態に係る商品管理処理S1627の処理手順を示すフローチャートである。
まず、ステップS1901においては、流通管理DB320に対して認識商品の移動履歴を蓄積する。そして、ステップS1903においては、在庫管理DB420に対して認識商品の販売履歴を津奇跡する。
[第3実施形態]
次に、本発明の第3実施形態に係る情報処理システムについて説明する。本実施形態に係る情報処理システムは、上記第2実施形態と比べると、レジ処理において、商品の同定と共に値引き額を撮像した映像から認識して、店員の操作無し値引き計算をする点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については説明を省略する。
本実施形態によれば、商品の値引き処理を店員の操作なしに実現して、レジ処理の効率化を図ることができる。
《本実施形態に係る処理》
図20は、本発明の第3実施形態に係る情報処理システム2000の処理を示す図である。特に、図20は、本実施形態に係る商品認識部913の処理を示す図である。
図20に示す、あらかじめ商品2021と値引札2031とから本実施形態に従い生成された局所特徴量2020,2030は、局所特徴量DB610に格納されている。一方、図20の左図の通信端末で撮像された映像画面2010からは、本実施形態に従い局所特徴量が生成される。そして、局所特徴量DB610に格納された局所特徴量2020,2030が、映像画面2010から生成された局所特徴量中にあるか否かが照合される。
図20に示すように、商品認識部913は、局所特徴量DB610に格納されている局所特徴量と局所特徴量が合致する各特徴点を細線のように関連付ける。なお、商品認識部913は、局所特徴量の所定割合以上が一致する場合を特徴点の合致とする。そして、商品認識部913は、関連付けられた特徴点の集合間の位置関係が線形関係であれば、対象商品であると認識する。このような認識を行なえば、サイズの大小や向きの違い(視点の違い)、あるいは反転などによっても認識が可能である。また、所定数以上の関連付けられた特徴点があれば認識精度が得られるので、一部が視界から隠れていても商品の認識が可能である。
図20においては、局所特徴量DB610の商品と値引札との局所特徴量2020,2030から、商品と値引額(値引率)が認識される。そして、図2のPOS242は、店員243に操作無しに、値引いた商品価格による処理を実現する。
《情報処理システムの動作手順》
図21は、本実施形態に係る情報処理システム2000の動作手順を示すシーケンス図である。なお、必要であれば、管理サーバ250あるいは店舗コンピュータからPOSあるいは通信端末にアプリケーションのダウンロードを行なう。そして、本実施形態の処理を行なうための、アプリケーションの起動と初期化が行なわれるが、図21では削除している(図6参照)。
ステップS2101においては、店舗コンピュータからPOSに対して、値引き用局所特徴量が送信される。POSはステップS2103において、値引札の局所特徴量を局所特徴量DB610に追加する(図22参照)。
ステップS2105において、通信端末は、レジで1つおよび複数の商品、あるいはかごに入った商品群を撮影する。ステップS2197において、映像から局所特徴量を生成する。なお、棚卸し/棚割調査で説明したように、個々の商品とかごの中の複数商品の認識では、特徴点数や特徴ベクトルの次元数などを調整して、精度を変えた局所特徴量が生成される。続いて、ステップS2109において局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS2111において、通信端末からPOSに送信される。
POSでは、ステップS2113において、各商品に対して生成され記憶されたPOSの局所特徴量DB610を参照して、商品の認識を行なう。同時に、値引札の認識も行なわれる。そして、ステップS2115において、認識結果をPOSから通信端末に送信する。
通信端末は、ステップS2117において、認識結果を報知する。一方、POSは、ステップS2119において、POSの商品価格DB620を参照して、認識された商品の価格を判定する。次に、ステップS2121において、商品価格に、値引きがあればそれを計算する。そして、ステップS2123において、値引きした価格を表示する。
POSは、ステップS2125において、客の支払を受けて、入金処理を行なう。そして、ステップS2127において、売上情報を店舗コンピュータに送信する。以下の処理は、図6に示した通りである。
(局所特徴量DBにおける値引情報)
図22は、本実施形態に係る局所特徴量DB610における値引情報の構成を示す図である。
局所特徴量DB610は、商品IDに対応付けた局所特徴量を格納すると共に、値引情報610aを登録する。値引情報610aは、値引札に対応付けて、値引き率、値引き額、値引札の局所特徴量を記憶している。
《POSの処理手順》
図23は、本実施形態に係るPOSの処理手順を示すフローチャートである。
まず、ステップS2311において、値引用情報を受信したか否かを判定する。また、ステップS2321において、局所特徴量を受信したか否かを判定する。また、入金データを受信したか否かを判定する。いずれでもなければ、ステップS2341において、他の処理を行なう。
値引用情報を受信した場合はステップS2313に進んで、局所特徴量DB610に値引情報を保持する。
局所特徴量を受信した場合はステップS2323に進んで、局所特徴量DB610を参照して、商品と値引札の認識処理を行なう。次に、ステップS2325において、認識商品について、商品価格DB620を参照して商品価格を判定する。ステップS2327においては、ステップS2325において判定した商品価格に対して、ステップS2323において値引札が認識されれば、値引計算を行なう。そして、ステップS2329において、価格表示を行なう。
入金データ受信であればステップS2333に進んで、入金処理を行なう。そして、店舗コンピュータ201aに売上げの通知を行なう。
[第4実施形態]
次に、本発明の第4実施形態に係る情報処理システムについて説明する。本実施形態に係る情報処理は、上記第2実施形態と比べると、通信端末による商品認識を、商品に付加された識別子であるバーコードなどによる従来の商品識別の補助として使用する点で異なる。すなわち、本実施形態の局所特徴量による商品認識は、商品の方向などに関わらず認識が可能であるため、バーコードなどの位置を店員に通知することが可能になる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、店員がバーコードなどの位置を探すことがないため、迅速な処理が可能となる。
《本実施形態の動作手順》
図24は、本実施形態に係る情報処理システム2400における動作手順を示すシーケンス図である。なお、必要であれば、管理サーバ250あるいは店舗コンピュータからPOSあるいは通信端末にアプリケーションのダウンロードを行なうが、図24では削除している(図6参照)。
ステップS2401においては、本実施形態の処理のために、アプリケーションを起動して初期化する。ステップS2403において、通信端末は、レジで1つおよび複数の商品、あるいはかごに入った商品群を撮影する。ステップS2405において、映像から局所特徴量を生成する。なお、棚卸し/棚割調査で説明したように、個々の商品とかごの中の複数商品の認識では、特徴点数や特徴ベクトルの次元数などを調整して、精度を変えた局所特徴量が生成される。続いて、ステップS2407において局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS2409において、通信端末からPOSに送信される。
POSでは、ステップS2411において、各商品に対して生成され記憶されたPOSの局所特徴量DB610を参照して、商品の認識を行なう。同時に、ステップS2413において、商品の向きを認識する。図11H〜図11Kでも示したように、本実施形態においては、商品の向きが認識可能である。なお、1つの商品のみではなく複数の商品についてもリアルタイムに商品の向きの認識が可能である。そして、ステップS2415において、商品の向きからあらかじめバーコードが配置された位置を参照して、特に、店員から見えない場合に、バーコードがどこに在るかを認識する。ステップS2417において、その結果の、商品の向きやバーコード位置の情報が、認識商品面と共に、通信端末に送信される。
通信端末は、ステップS2419において、認識結果を報知する。見えないバーコードが何処にあるかを報知する。
店員がバーコードを見付けて、バーコードリーダがステップS2421においてバーコードを読み取ると、ステップS2423において、バーコードリーダからPOSにバーコードデータが送られて、商品と認識が行なわれる。
なお、図24においては、POSでの向きの認識を示したが、例えば、出荷処理や入庫処理においては、店舗コンピュータや管理サーバで行なうこともできる。
《通信端末の機能構成》
図25は、本実施形態に係る通信端末2511,2521,2531,2541の機能構成を示すブロック図である。なお、本実施形態では、第2実施形態の図7にバーコードリーダに関連する機能を追加したものであり、図7と同様の機能構成部には同じ参照番号を符し、説明は省略する。
図25において、通信制御部704を介して商品認識結果受信部2505で受信される商品認識結果は、商品名のみではなく、商品の向きとバーコードのある位置を示す情報を含んでいる。認識結果報知部2506は、商品の向きとバーコードのある位置を示す情報をユーザに報知する。バーコードのある位置を示す情報は、表示や音声によるコメントであっても、画像情報による通知であってもよい。バーコードリーダ部2507は、従来の機能構成部であり、認識結果報知部2506の指示に従って読み取ったバーコード情報を、通信制御部704を介して送信する。
[第5実施形態]
次に、本発明の第5実施形態に係る情報処理システムについて説明する。本実施形態に係る情報処理システムは、上記第2実施形態と比べると、ユーザが携帯端末で商品を撮像した場合に、その映像中の商品からアンケートを募集する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については説明を省略する。
本実施形態によれば、ユーザの商品あるいは店舗に対する関心と共に、商品のメーカにとっては宣伝効果を高めることができる。
なお、本実施形態においては、サプライヤ側の端末を通信端末と呼んできたが、ユーザ側の端末を区別するため携帯端末と呼ぶ。
《本実施形態に係る処理》
図26は、本実施形態に係る情報処理システムの処理を示す図である。
図26の左図は、携帯端末2801で店舗内の食品棚2804を撮像して、表示画面2802に表示したものである。商品棚には、ペットボトルや紙パックが陳列されている。この中で、紙パック2803が、アンケートを知らせる商品として登録されているとする。
図26の右図は、その紙パック2803に対応して、“旅行券が当たるアンケートに参加、(する/しない)”とのメッセージ2805が表示されている。
(アンケートDB)
図27は、本実施形態に係るアンケートDBの構成を示す図である。
図27において、アンケートDB01は、商品IDと商品名に対応付けて、アンケート画面や、アンケート回答の蓄積データ、アンケート期間が記憶されている。
また、アンケートDB2702には、アンケート回答したユーザIDとユーザ名に対応付けて、メールアドレスや、何の商品でアンケートしたかの商品ID、その商品名、プレゼント(図26では旅行券)の当否が記憶されている。
《管理コンピュータの処理手順》
図28は、本実施形態に係る管理コンピュータの処理手順を示すフローチャートである。
まず、ステップS2811において、局所特徴量を携帯端末から受信したかを判定する。局所特徴量を受信したならばステップS2813に進んで、映像中の商品を認識する。ステップS2815においては、商品中のアンケート商品があるか否かを判定する。アンケート商品があればステップS2817において、アンケート通知画面を携帯端末に送る。
一方、局所特徴量の受信でなければステップS2819に進んで、ユーザからのアンケート参加回答を受信したかを判定する。アンケート参加回答であればステップS2821において、アンケート内容画面を送信する。
局所特徴量の受信でもアンケート参加回答の受信でもなければ、ステップS2823において、他の処理を行なう。
[第6実施形態]
次に、本発明の第6実施形態に係る情報処理システムについて説明する。本実施形態に係る情報処理システムは、上記第2実施形態と比べると、通信端末(携帯端末)において、局所特徴量DBを有して商品認識を行なう点で異なる。その他の通信端末の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、通信障害などに関係なく商品認識が行なえる。
《通信端末の機能構成》
図29は、本実施形態に係る情報処理システムにおける通信端末の機能構成を示すブロック図である。なお、図29の通信端末の構成において、第2実施形態んも図7との相違点は、商品認識を行なう構成であり、他の機能構成部は同様であるので、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
局所特徴量DB2901は、図10と同ような構成の商品と局所特徴量を対応付けて記憶する。なお、通信端末の処理速度や記憶容量などの制限がある場合に、局所特徴量DB2901には、特定の分野の局所特徴量や所望の商品関連の局所特徴量のみを記憶してもよい。商品認識部2903は、映像から局所特徴量生成した局所特徴量と局所特徴量DB2901からの局所特徴量とを照合して、商品を認識する。商品認識結果送信部2904は、通信端末で認識した商品名などを通信制御部704を介して外部に送信する。
[第7実施形態]
次に、本発明の第7実施形態に係る情報処理システムについて説明する。本実施形態に係る上記第2実施形態乃至第6実施形態を、図書館に適用したものである。
図30は、本実施形態に係る情報処理システム3000の構成を示すブロック図である。第2実施形態の図2に示したのと同様の処理が、図書館における本の管理においても適用可能である。
図30には、ネットワーク3060を介して管理サーバ3050と接続された図書館3001のコンピュータ3001aが図示されている。図2と同様に本の入庫処理3020においては、通信端末3021による撮像により本を認識する。また、在庫管理処理3030では、通信端末3031による撮像により棚と本を認識する。また、貸出/返却処理3040では、通信端末3041による撮像により本を認識する。
[第8実施形態]
次に、本発明の第8実施形態に係る情報処理システムについて説明する。本実施形態に係る上記第2実施形態乃至第6実施形態を、美術館や博物館に適用したものである。
図31は、本実施形態に係る情報処理システム3100の構成を示すブロック図である。第2実施形態の図2に示したのと同様の処理が、美術館や博物館における絵画や彫刻、あるいは文化遺産などの展示物の管理においても適用可能である。
図31には、美術館や博物館3101のコンピュータ3101aが図示されている。図2と同様に本の入庫処理3120においては、通信端末3121による撮像により絵画などの美術品を認識する。また、在庫管理処理3130では、通信端末3131による撮像により絵画などを認識する。また、解説処理3140では、通信端末3141による撮像により撮像した絵画などの説明を聞くことができる。
[他の実施形態]
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する制御プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされる制御プログラム、あるいはその制御プログラムを格納した媒体、その制御プログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
この出願は、2011年12月16日に出願された日本出願特願2011−276522を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段と、
撮像手段と、
前記撮像手段が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識手段と、
を備えることを特徴とする情報処理システム。
(付記2)
前記認識手段の認識結果を報知する報知手段をさらに備えることを特徴とする付記1に記載の情報処理システム。
(付記3)
前記情報処理システムは、ユーザが携帯する通信端末と、前記通信端末と通信する情報処理装置とを有し、
前記通信端末が、前記撮像手段と前記第2局所特徴量生成手段と前記報知手段とを含んで、前記m個の第2局所特徴量を前記通信端末から前記情報処理装置へ送信し、
前記情報処理装置が、前記第1局所特徴量記憶手段と前記認識手段とを含んで、前記認識手段の認識結果を前記情報処理装置から前記通信端末へ送信することを特徴とする付記2に記載の情報処理システム。
(付記4)
前記第1局所特徴量記憶手段は、複数の商品にそれぞれ対応付けて各商品の画像から生成した前記m個の第1局所特徴量を記憶し、
前記認識手段は、前記撮像手段が撮像した前記画像に含まれる複数の商品を認識すると共に、前記n個の第2局所特徴量のならびに基づいて、前記撮像手段が撮像した前記画像における前記複数の商品の配置を認識する配置認識手段を有することを特徴とする付記1乃至3のいずれか1つに記載の情報処理システム。
(付記5)
前記配置認識手段が認識した前記複数の商品の配置に基づいて、棚卸しまたは棚割を行なう第1管理手段を備えることを特徴とする付記4に記載の情報処理システム。
(付記6)
前記商品の画像は、複数の商品を含む梱包容器の画像を含み、
前記認識手段は、前記梱包容器を認識することを特徴とする付記1乃至4のいずれか1つに記載の情報処理システム。
(付記7)
前記認識手段による前記梱包容器の認識に基づいて、前記商品の流通管理または在庫管理を行なう第2管理手段を備えることを特徴とする付記6に記載の情報処理システム。
(付記8)
前記第1局所特徴量および前記第2局所特徴量は、画像から抽出した特徴点を含む局所領域を複数のサブ領域に分割し、前記複数のサブ領域内の勾配方向のヒストグラムからなる複数の次元の特徴ベクトルを生成することにより生成されることを特徴とする付記1乃至7のいずれか1つに記載の情報処理システム。
(付記9)
前記第1局所特徴量および前記第2局所特徴量は、前記生成した複数の次元の特徴ベクトルから、隣接するサブ領域間の相関がより大きな次元を削除することにより生成されることを特徴とする付記8に記載の情報処理システム。
(付記10)
前記特徴ベクトルの複数の次元は、前記特徴点の特徴に寄与する次元から順に、かつ、前記局所特徴量に対して求められる精度の向上に応じて第1次元から順に選択できるよう、所定の次元数ごとに前記局所領域をひと回りするよう配列することを特徴とする付記8または9に記載の情報処理システム。
(付記11)
前記第2局所特徴量生成手段は、前記商品の相関に対応して、他の商品とより高い前記相関を有する商品については次元数のより多い前記第2局所特徴量を生成することを特徴とする付記10に記載の情報処理システム。
(付記12)
前記第1局所特徴量記憶手段は、前記商品の相関に対応して、他の商品とより高い前記相関を有する商品については次元数のより多い前記第1局所特徴量を記憶することを特徴とする付記10または11に記載の情報処理システム。
(付記13)
前記商品に付加された識別子を読み取ることにより前記商品を識別する識別手段を、さらに備え、
前記認識手段は、認識した前記商品の方向を判定して、前記方向に基づいて前記商品に付加した前記識別子の位置を認識することを特徴とする付記1乃至12のいずれか1つに記載の情報処理システム。
(付記14)
前記商品は、図書館における本であることを特徴とする付記1乃至13のいずれか1つに記載の情報処理システム。
(付記15)
前記商品は、美術館における美術品であることを特徴とする付記1乃至13のいずれか1つに記載の情報処理システム。
(付記16)
前記商品は、博物館における展示物であることを特徴とする付記1乃至13のいずれか1つに記載の情報処理システム。
(付記17)
付記3に記載の情報処理システムにおける通信端末であって、
撮像手段と、
前記撮像手段が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
前記m個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる商品を認識する情報処理装置に送信する第1送信手段と、
前記情報処理装置からが撮像した前記画像に含まれる商品を示す情報を受信する第1受信手段と、
を備えることを特徴とする通信端末。
(付記18)
付記3に記載の情報処理システムにおける通信端末の制御方法であって、
撮像ステップと、
前記撮像ステップにおいて撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記m個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる商品を認識する情報処理装置に送信する第1送信ステップと、
前記情報処理装置からが撮像した前記画像に含まれる商品を示す情報を受信する第1受信ステップと、
を含むことを特徴とする通信端末の制御方法。
(付記19)
付記3に記載の情報処理システムにおける通信端末の制御プログラムであって、
撮像ステップと、
前記撮像ステップにおいて撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記m個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる商品を認識する情報処理装置に送信する第1送信ステップと、
前記情報処理装置からが撮像した前記画像に含まれる商品を示す情報を受信する第1受信ステップと、
をコンピュータに実行させることを特徴とする制御プログラム。
(付記20)
付記3に記載の情報処理システムにおける、商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置であって、
通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記通信端末から受信する第2受信手段と、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識手段と、
認識した前記商品を示す情報を前記通信端末に送信する第2送信手段と、
を備えることを特徴とする情報処理装置。
(付記21)
付記3に記載の情報処理システムにおける、商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御方法であって、
通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記通信端末から受信する第2受信ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識ステップと、
認識した前記商品を示す情報を前記通信端末に送信する第2送信ステップと、
を含むことを特徴とする情報処理装置の制御方法。
(付記22)
付記3に記載の情報処理システムにおける、商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御プログラムであって、
通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記通信端末から受信する第2受信ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識ステップと、
認識した前記商品を示す情報を前記通信端末に送信する第2送信ステップと、
をコンピュータに実行させることを特徴とする制御プログラム。
(付記23)
商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理システムにおける情報処理方法であって、
撮像ステップと、
前記撮像ステップにおいて撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識ステップと、
を備えることを特徴とする情報処理方法。

Claims (18)

  1. 商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段と、
    撮像手段と、
    前記撮像手段が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識手段と、
    を備え、
    前記第1局所特徴量および前記第2局所特徴量は、画像から抽出した特徴点を含む局所領域を複数のサブ領域に分割し、前記複数のサブ領域内の勾配方向のヒストグラムからなる複数の次元の特徴ベクトルを生成することにより生成され、
    前記第1局所特徴量および前記第2局所特徴量は、前記生成した複数の次元の特徴ベクトルから、隣接するサブ領域間の相関がより低くなるように次元を選定することにより生成されることを特徴とする情報処理システム。
  2. 前記認識手段の認識結果を報知する報知手段をさらに備えることを特徴とする請求項1に記載の情報処理システム。
  3. 前記情報処理システムは、ユーザが携帯する通信端末と、前記通信端末と通信する情報処理装置とを有し、
    前記通信端末が、前記撮像手段と前記第2局所特徴量生成手段と前記報知手段とを含んで、前記m個の第2局所特徴量を前記通信端末から前記情報処理装置へ送信し、
    前記情報処理装置が、前記第1局所特徴量記憶手段と前記認識手段とを含んで、前記認識手段の認識結果を前記情報処理装置から前記通信端末へ送信することを特徴とする請求項2に記載の情報処理システム。
  4. 前記第1局所特徴量記憶手段は、複数の商品にそれぞれ対応付けて各商品の画像から生成した前記m個の第1局所特徴量を記憶し、
    前記認識手段は、前記撮像手段が撮像した前記画像に含まれる複数の商品を認識すると共に、前記n個の第2局所特徴量のならびに基づいて、前記撮像手段が撮像した前記画像における前記複数の商品の配置を認識する配置認識手段を有することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理システム。
  5. 前記配置認識手段が認識した前記複数の商品の配置に基づいて、棚卸しまたは棚割を行なう第1管理手段を備えることを特徴とする請求項4に記載の情報処理システム。
  6. 前記商品の画像は、複数の商品を含む梱包容器の画像を含み、
    前記認識手段は、前記梱包容器を認識することを特徴とする請求項1乃至4のいずれか1項に記載の情報処理システム。
  7. 前記認識手段による前記梱包容器の認識に基づいて、前記商品の流通管理または在庫管理を行なう第2管理手段を備えることを特徴とする請求項6に記載の情報処理システム。
  8. 前記商品に付加された識別子を読み取ることにより前記商品を識別する識別手段を、さらに備え、
    前記認識手段は、認識した前記商品の方向を判定して、前記方向に基づいて前記商品に付加した前記識別子の位置を認識することを特徴とする請求項1乃至7のいずれか1項に記載の情報処理システム。
  9. 前記商品は、図書館における本であることを特徴とする請求項1乃至8のいずれか1項に記載の情報処理システム。
  10. 前記商品は、美術館における美術品であることを特徴とする請求項1乃至8のいずれか1項に記載の情報処理システム。
  11. 前記商品は、博物館における展示物であることを特徴とする請求項1乃至8のいずれか1項に記載の情報処理システム。
  12. 請求項3に記載の情報処理システムにおける通信端末であって、
    撮像手段と、
    前記撮像手段が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
    前記m個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる商品を認識する情報処理装置に送信する第1送信手段と、
    前記情報処理装置から撮像した前記画像に含まれる商品を示す情報を受信する第1受信手段と、
    を備えることを特徴とする通信端末。
  13. 請求項3に記載の情報処理システムにおける通信端末の制御方法であって、
    撮像ステップと、
    前記撮像ステップにおいて撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
    前記m個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる商品を認識する情報処理装置に送信する第1送信ステップと、
    前記情報処理装置から撮像した前記画像に含まれる商品を示す情報を受信する第1受信ステップと、
    を含むことを特徴とする通信端末の制御方法。
  14. 請求項3に記載の情報処理システムにおける通信端末の制御プログラムであって、
    撮像ステップと、
    前記撮像ステップにおいて撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
    前記m個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる商品を認識する情報処理装置に送信する第1送信ステップと、
    前記情報処理装置から撮像した前記画像に含まれる商品を示す情報を受信する第1受信ステップと、
    をコンピュータに実行させることを特徴とする制御プログラム。
  15. 請求項3に記載の情報処理システムにおける、商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置であって、
    通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記通信端末から受信する第2受信手段と、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識手段と、
    認識した前記商品を示す情報を前記通信端末に送信する第2送信手段と、
    を備えることを特徴とする情報処理装置。
  16. 請求項3に記載の情報処理システムにおける、商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御方法であって、
    通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記通信端末から受信する第2受信ステップと、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識ステップと、
    認識した前記商品を示す情報を前記通信端末に送信する第2送信ステップと、
    を含むことを特徴とする情報処理装置の制御方法。
  17. 請求項3に記載の情報処理システムにおける、商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御プログラムであって、
    通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記通信端末から受信する第2受信ステップと、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識ステップと、
    認識した前記商品を示す情報を前記通信端末に送信する第2送信ステップと、
    をコンピュータに実行させることを特徴とする制御プログラム。
  18. 商品と、前記商品の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理システムにおける情報処理方法であって、
    撮像ステップと、
    前記撮像ステップにおいて撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記商品が存在すると認識する認識ステップと、
    を備え、
    前記第1局所特徴量および前記第2局所特徴量は、画像から抽出した特徴点を含む局所領域を複数のサブ領域に分割し、前記複数のサブ領域内の勾配方向のヒストグラムからなる複数の次元の特徴ベクトルを生成することにより生成され、
    前記第1局所特徴量および前記第2局所特徴量は、前記生成した複数の次元の特徴ベクトルから、隣接するサブ領域間の相関がより低くなるように次元を選定することにより生成されることを特徴とする情報処理方法。
JP2013549240A 2011-12-16 2012-12-07 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム Active JP6153087B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011276522 2011-12-16
JP2011276522 2011-12-16
PCT/JP2012/081853 WO2013089042A1 (ja) 2011-12-16 2012-12-07 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2013089042A1 JPWO2013089042A1 (ja) 2015-04-27
JP6153087B2 true JP6153087B2 (ja) 2017-06-28

Family

ID=48612493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013549240A Active JP6153087B2 (ja) 2011-12-16 2012-12-07 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム

Country Status (3)

Country Link
US (1) US9754169B2 (ja)
JP (1) JP6153087B2 (ja)
WO (1) WO2013089042A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7057397B2 (ja) 2015-05-08 2022-04-19 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、プログラム、および、記憶媒体

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150269501A1 (en) * 2014-03-18 2015-09-24 Ghostruck Co System and process for resource allocation to relocate physical objects
JP6330424B2 (ja) * 2014-03-28 2018-05-30 凸版印刷株式会社 商品情報提供システム、商品情報提供サーバ、商品情報提供方法及びプログラム
JP6384091B2 (ja) * 2014-03-31 2018-09-05 大日本印刷株式会社 サーバ装置、プログラム及び通信方法
WO2015159775A1 (ja) 2014-04-15 2015-10-22 オリンパス株式会社 画像処理装置、通信システム及び通信方法並びに撮像装置
US9536167B2 (en) * 2014-12-10 2017-01-03 Ricoh Co., Ltd. Realogram scene analysis of images: multiples for scene analysis
US9678999B1 (en) * 2014-12-31 2017-06-13 Teradata Us, Inc. Histogram generation on multiple dimensions
WO2017201483A1 (en) * 2016-05-19 2017-11-23 Simbe Robotics Inc. Method for tracking placement of products on shelves in a store
US10643177B2 (en) * 2017-03-21 2020-05-05 Kellogg Company Determining product placement compliance
CN109472524B (zh) * 2017-09-08 2022-04-26 北京京东尚科信息技术有限公司 信息处理方法和装置
CN108737368A (zh) * 2018-04-03 2018-11-02 浙江华睿科技有限公司 一种包裹信息传输、存储、查询的方法、装置及系统
JP6516037B2 (ja) * 2018-04-26 2019-05-22 凸版印刷株式会社 商品情報提供システム及び商品情報提供方法
CN110276305B (zh) * 2019-06-25 2021-06-15 广州众聚智能科技有限公司 一种动态商品识别方法
CN110929626A (zh) * 2019-11-18 2020-03-27 上海欧冶物流股份有限公司 确定库存货物件数的方法、仓库盘点方法、装置及设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711293B1 (en) 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
JP2000306077A (ja) * 1999-04-21 2000-11-02 Hitachi Zosen Corp 図書管理設備
US7050631B2 (en) * 2002-10-30 2006-05-23 Sick Auto Ident, Inc. Barcode detection system
JP2006031200A (ja) 2004-07-14 2006-02-02 Nec Corp 商品検索システム及びその方法並びにそれに用いる端末装置、サーバ装置及びプログラム
US7769221B1 (en) * 2005-03-10 2010-08-03 Amazon Technologies, Inc. System and method for visual verification of item processing
JP4988408B2 (ja) * 2007-04-09 2012-08-01 株式会社デンソー 画像認識装置
US7949568B2 (en) * 2007-08-31 2011-05-24 Accenture Global Services Limited Determination of product display parameters based on image processing
JP5294342B2 (ja) * 2008-04-28 2013-09-18 公立大学法人大阪府立大学 物体認識用画像データベースの作成方法、処理装置および処理用プログラム
JP5200819B2 (ja) * 2008-09-25 2013-06-05 ブラザー工業株式会社 物品管理システム
JP5247480B2 (ja) * 2009-01-13 2013-07-24 キヤノン株式会社 オブジェクト識別装置及びオブジェクト識別方法
KR101369915B1 (ko) * 2009-01-23 2014-03-06 닛본 덴끼 가부시끼가이샤 영상 식별자 추출 장치
JP5164222B2 (ja) * 2009-06-25 2013-03-21 Kddi株式会社 画像検索方法およびシステム
JP5224393B2 (ja) 2009-07-13 2013-07-03 古河電気工業株式会社 光配線方法
JP5521676B2 (ja) * 2010-03-19 2014-06-18 富士通株式会社 画像処理装置及び画像処理プログラム
JP5685390B2 (ja) 2010-05-14 2015-03-18 株式会社Nttドコモ 物体認識装置、物体認識システムおよび物体認識方法
US9805331B2 (en) * 2011-02-09 2017-10-31 Deutsche Telekom Ag Smartphone-based asset management system
JP5866177B2 (ja) * 2011-11-10 2016-02-17 ソニー株式会社 画像処理装置および画像処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7057397B2 (ja) 2015-05-08 2022-04-19 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、プログラム、および、記憶媒体

Also Published As

Publication number Publication date
JPWO2013089042A1 (ja) 2015-04-27
US9754169B2 (en) 2017-09-05
US20150098610A1 (en) 2015-04-09
WO2013089042A1 (ja) 2013-06-20

Similar Documents

Publication Publication Date Title
JP6153087B2 (ja) 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
CN108416403B (zh) 商品与标签的自动关联方法、系统、设备及存储介质
Wei et al. Deep learning for retail product recognition: Challenges and techniques
US10922353B2 (en) Hybrid detection recognition system
CA2950799C (en) Linear grouping of recognized items in an image
US10467674B2 (en) Visual search in a controlled shopping environment
George et al. Recognizing products: A per-exemplar multi-label image classification approach
US20160117631A1 (en) Orphaned item identification
CN103003814A (zh) 使用大型数据库进行对象识别的系统及方法
US10346659B1 (en) System for reading tags
CN109741551B (zh) 一种商品识别结算方法、装置及系统
CN110622173A (zh) 贴错标签的产品的检测
EP3217324A1 (en) Hybrid detection recognition system
WO2013115093A1 (ja) 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
Pandian RFID for libraries: a practical guide
CN113935774A (zh) 图像处理方法、装置、电子设备及计算机存储介质
Ragesh et al. Deep learning based automated billing cart
Xiong et al. Text detection in stores using a repetition prior
KR102243731B1 (ko) 포스 단말기와 연동하여 고객이 구매한 상품들을 이용한 영수증 광고 추천 장치
Rodnichenko et al. Augmented reality techniques in industrial warehouse logistics in mining industry
US20210142092A1 (en) Method and Apparatus for Detecting and Interpreting Price Label Text
CN110705363B (zh) 一种商品规格的识别方法与装置
WO2019092782A1 (ja) 情報処理装置、制御方法、及びプログラム
Lee et al. Matching book-spine images for library shelf-reading process automation
US20230087587A1 (en) Systems and methods for item recognition

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170508

R150 Certificate of patent or registration of utility model

Ref document number: 6153087

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170521