JP6098701B2 - 複数の整理されたオブジェクトを含む画像を解析する方法、システム及びコンピュータ可読プログラム - Google Patents

複数の整理されたオブジェクトを含む画像を解析する方法、システム及びコンピュータ可読プログラム Download PDF

Info

Publication number
JP6098701B2
JP6098701B2 JP2015240156A JP2015240156A JP6098701B2 JP 6098701 B2 JP6098701 B2 JP 6098701B2 JP 2015240156 A JP2015240156 A JP 2015240156A JP 2015240156 A JP2015240156 A JP 2015240156A JP 6098701 B2 JP6098701 B2 JP 6098701B2
Authority
JP
Japan
Prior art keywords
label
shelf
image
location
superpixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015240156A
Other languages
English (en)
Other versions
JP2016115349A (ja
Inventor
エル シュワルツ エドワード
エル シュワルツ エドワード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2016115349A publication Critical patent/JP2016115349A/ja
Application granted granted Critical
Publication of JP6098701B2 publication Critical patent/JP6098701B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • G06K17/0022Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations arrangements or provisious for transferring data to distant stations, e.g. from a sensing device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本願は、概して、画像処理におけるオブジェクト検出の分野に関係がある。より具体的には、本願は、複数の整理されたオブジェクトの画像を解析して、オブジェクト、棚の最前部及びその棚の最前部にあるラベル、棚の下にある空きスペース、特定されていないオブジェクトがある可能性がある領域、及び空き領域を画像において特定するシステム及び方法に関係がある。
当該技術は、複数の棚の画像を受け取る画像認識システムを含む。画像認識システムは、前記棚の画像においてピクセルのグループに基づき該画像内の特徴を特定し、該特徴を用いて外観に基づき可能な棚及びラベルの位置を特定する。画像認識モジュールは更に、可能な棚及びラベルの位置のコンテクストを用いて、可能な棚及びラベルの位置から最良の棚及びラベルの位置を選択する。その最良の棚及びラベルの位置を用いて、画像認識モジュールは、棚及びラベルの外観についてのモデルを生成する。更に、画像認識モジュールは、棚及びラベルの外観についてのモデルに基づき、可能な棚及びラベルの位置のコンテクスト及び特徴を用いて、外観に基づく可能な棚及びラベルの位置を更新する。最終的に、画像認識モジュールは、その更新された可能な棚及びラベルの位置を用いて最終の棚及びラベルの位置を選択する。
他の実施形態には、画像においてオブジェクトを認識するための対応する方法及びコンピュータプログラム製品がある。ここで記載される特徴及び利点は、包括的ではなく、多くの更なる特徴及び利点は、図面及び明細書を参酌して当業者に明らかである。更に、明細書において使用される用語は、主として、読みやすさ及び教育的目的のために選ばれており、記載される技術の適用範囲を制限するものはない点が留意されるべきである。
ここで記載される技術は、限定としてではなく一例として、添付の図面の図において表されている。図中、同じ参照符号は、同様の要素を参照するために使用されている。図は、説明のためにのみ、ここで記載される技術の様々な実施形態を表す。ここで表されている構造及び方法の代替の実施形態がここで記載される技術の原理から外れることなしに採用され得ることは、以下の議論から容易に認識されるはずである。
小売り棚の画像を解析するシステム100の実施形態の一例を表すハイレベルブロック図である。
リアログラム解析アプリケーションを含むリアログラム解析システムの一例のブロック図を表す。
スーパーピクセルに基づくリアログラムシーン解析のための方法の一例のフロー図である。
リアログラムの一例を表す。
棚及び棚にある製品を含むリアログラムの例を表す。
スーパーピクセルを重ね合わされたリアログラムの例を表す。
スーパーピクセル及び幾つかの実施形態では他の観測結果に基づきリアログラムの領域を特定する方法の一例のフロー図である。
リアログラム画像において表されている棚の最前部を特定する方法の一例のフロー図である。
リアログラム画像において表されている棚の最前部を特定する方法の一例のフロー図であり、図7Aの続きである。
スーパーピクセルを重ね合わされたリアログラムの部分と、棚の外観特徴を決定するためのスーパーピクセル間の関係を表す矢印とを例示する。
可能な棚の境界を表すためのプロセスを表す例図である。
スーパーピクセルのリストをそれらの夫々の角度で表す例図である。
棚の外観特徴を決定するためのスーパーピクセル間の関係を表す例図である。
スーパーピクセル境界での量子化された勾配を表す例図である。
一対のスーパーピクセルについての量子化された勾配を示すデータ構造の例である。
リアログラム画像において表されている棚の最前部でのラベルの位置を検出及び決定する方法の一例のフロー図である。
棚セグメントのクラスタを表すために番号を付されたスーパーピクセルを重ね合わされたリアログラムの部分を例示する。
棚セグメントのクラスタを表すために番号を付されたスーパーピクセルを重ね合わされたリアログラムの部分を例示する。
スーパーピクセルが最も少ないスーパーピクセルのクラスタと、水平でない直線が最も多いスーパーピクセルのクラスタとの間の共通集合を表す例図である。
棚のスーパーピクセルのクラスタを表すために番号を付されたスーパーピクセルの接続された成分を重ね合わされており且つ仮定のラベル位置を示すリアログラムの部分を例示する。
リアログラム画像において複数の特定のオブジェクトの存在及び位置を決定する方法の一例のフロー図である。
画像内の複数の対応する点についての記述子の差の棒グラフを例示する。
同じ高さのアイテムの積み重ねの例図を表す。
画像内のインデックスを付されていないオブジェクトを特定する境界ボックスを重ね合わされたリアログラムの部分を例示する。
リアログラム画像において棚の下にある空きスペースを見つける方法の一例のフロー図である。
セグメンテーションアルゴリズムによってセグメント化された“品切れ”領域及び“他”領域を特定するリアログラムの部分を例示する。
“品切れ”領域及び“他”領域を特定するリアログラムの部分を例示する。
スーパーピクセルをシードされた“品切れ”領域及び“他”領域を特定するリアログラムの部分を例示する。
1回のセグメンテーションアルゴリズムの後の、“品切れ”領域及び“他”領域を示すスーパーピクセルを重ね合わされたリアログラムの例を表す。
10回のセグメンテーションアルゴリズムの後の、“品切れ”領域及び“他”領域を示すスーパーピクセルを重ね合わされたリアログラムの例を表す。
潜在的な未知の製品についての接続されたコンポーネントポリゴンを重ね合わされたリアログラムの例を表す。
画像から値段を抽出するための方法の一例のフロー図である。
表において棚の仮定の一例を表す。
図1は、小売り棚の画像を解析するシステム100の実施形態の一例を表すハイレベルブロック図である。表されているシステム100は、イメージングデバイス115と、リアログラム解析サーバ101とを含む。表されている実施形態では、システム100のエンティティは、ネットワーク105を介して通信上結合されている。
ネットワーク105は、従来型の有線又は無線であることができ、星形構成、トークンリング構成又は他の構成を含む多種多様な構成を有してよい。更に、ネットワーク105は、ローカルエリアネットワーク(LAN;Local Area Network)、ワイドエリアネットワーク(WAN;Wide Area Network)(例えば、インターネット)、及び/又は複数のデバイスが通信し得る他の相互接続されたデータパスを含んでよい。幾つかの実施形態では、ネットワーク105は、ピア・ツー・ピアネットワークであってよい。ネットワーク105はまた、様々な異なった通信プロトコルにおいてデータを送信する電気通信ネットワークの部分へ結合されるか、あるいは、そのような部分を含んでよい。幾つかの実施形態では、ネットワーク105は、ショート・メッセージング・サービス(SMS;Short Messaging Service)、マルチメディア・メッセージング・サービス(MMS;Multimedia Messaging Service)、ハイパーテキスト・トランスファ・プロトコル(HTTP;HyperText Transfer Protocol)、ダイレクトデータ接続、WAP、電子メール、等を介することを含め、データを送信及び受信するために、Bluetooth(登録商標)通信ネットワーク又はセルラー通信ネットワークを含む。図1は、イメージングデバイス115及びリアログラム解析サーバ101へ結合された1つのネットワーク105しか表していないが、実際には、1つ以上のネットワークがそれらのエンティティへ接続され得る。
表されている実施形態では、システム100は、ネットワーク105へ結合されているリアログラム解析サーバ101を含む。リアログラム解析サーバ101は、プロセッサ、メモリ、ネットワーク通信機能、及びデータストレージ(例えば、データストレージ143)を含むコンピューティング装置であってよい。図1の例では、リアログラム解析サーバ101の構成要素は、以下で更に詳細に記載されるリアログラム解析アプリケーションを実装するよう構成される。リアログラム解析サーバ101は、イメージングデバイス115から又は他のソースから解析のための1つ以上の画像を受け取ってよく、例えば、インターネット・ブラウザ、電子メール、又は同様のものを介してアップロードされる。図1の例は1つのリアログラム解析サーバ101しか含まないが、システム100は1つ以上のリアログラム解析サーバ101を含んでよい。
データストレージ143は、ここで記載される機能を提供するためのデータを記憶する非一時的なメモリである。データストレージ143は、動的ランダムアクセスメモリ(DRAM;Dynamic Random Access Memory)デバイス、静的ランダムアクセスメモリ(SRAM;Static Random Access Memory)デバイス、フラッシュメモリ又は何らかの他のメモリデバイスであってよい。幾つかの実施形態では、データストレージ143は、ハードディスクドライブ、フロッピー(登録商標)ディスクドライブ、CD−ROMデバイス、DVD−RAMデバイス、DVD−RWデバイス、フラッシュメモリデバイス、又はより永続的に情報を記憶する何らかの他の大容量記憶デバイスを含む不揮発性メモリ又は同様の永久記憶デバイス及び媒体を更に含んでよい。
一実施形態において、データストレージ143は、リアログラム解析サービスのユーザによるアクセスのために、リアログラム解析サーバ101が受け取った画像及びそれらの画像に関連するデータを記憶する。例えば、データストレージ143は、受け取られた画像とともに画像解析結果を記憶してよく、ネットワーク105を介してアクセスされてよい。図1の例は、リアログラム解析サーバ101の部分として1つのデータストレージ143しか含まないが、データストレージは、システム100においてどこにでも設置されてよいことが理解されるべきである。例えば、別個のストレージデバイスが、局所接続を介して又はネットワーク105上でリアログラム解析サーバ101と結合されてよい。
一実施形態において、リアログラム解析アプリケーション103は、小売り棚にある1つ以上のアイテムの画像においてオブジェクトを検出及び特定し、棚の最前部及びそこにあるラベルを特定し、棚の下にある空きスペースを特定し、特定されていない製品がある可能性がある領域を特定し、且つ空きの棚スペース(例えば、製品が“品切れ”である領域)を特定するソフトウェア及び/又はロジックを含む。幾つかの実施形態では、リアログラム解析アプリケーション103は、ここで記載されるようにハードウェア及びソフトウェアの組み合わせを用いて実装され得る。
図1に表されているイメージングデバイス115は、一例として使用される。幾つかの実施形態では、イメージングデバイス115は、メモリ、プロセッサ及びカメラを含むコンピューティング装置、例えば、ラップトップ・コンピュータ、タブレット・コンピュータ、携帯電話機、パーソナル・デジタル・アシスタント(PDA;Personal Digital Assistant)、携帯型電子メール装置、ウェブカム又は同様のものであってよい。他の実施形態では、画像捕捉装置は、デジタルカメラ、又は同様のものであってよい。図1は、1つの画像捕捉装置115しか表していないが、本開示は、1つ以上の画像捕捉装置115を備えたシステムアーキテクチャに適用される。
図2は、リアログラム解析アプリケーション103を含むリアログラム解析システム200の一例のブロック図を表す。例えば、リアログラム解析システム200は、上記のリアログラム解析サーバ101であってよい。図2の例では、リアログラム解析システム200は、リアログラム解析アプリケーション103、プロセッサ235、メモリ237、通信ユニット241、及びデータストレージ243を含む。リアログラム解析アプリケーション103は、オブジェクト認識モジュール201、セグメンテーションモジュール203、棚/ラベル検出モジュール205、空きスペースモジュール207、及びマルチプルスモジュール209を含む。一実施形態において、バス220は、リアログラム解析システム200の構成要素を通信上結合する。バス220は、業界標準アーキテクチャ(ISA;Industry Standard Architecture)バス、ペリフェラル・コンポーネント・インターコネクト(PCI;Peripheral Component Interconnect)バス、ユニバーサル・シリアル・バス(USB;Universal Serial Bus)、又は同様の機能を提供する当該技術で知られている何らかの他のバスを含む1つ以上のバスを表してよい。
プロセッサ235は、様々な入力/出力、論理、及び/又は数学的動作を実行することによってソフトウェア命令を実行してよい。プロセッサ235は、例えば、複数命令セットコンピュータ(CISC;Complex Instruction Set Computer)アーキテクチャ、縮小命令セットコンピュータ(RISC;Reduced Instruction Set Computer)アーキテクチャ、グラフィクス・プロセッシング・ユニット(GPU;Graphics Processing Unit)、及び/又は命令セットの組み合わせを実装するアーキテクチャを含む、データ信号を処理するための様々な計算アーキテクチャを有してよい。プロセッサ235は、単一のプロセッシングユニット、あるいは、複数のプロセッシングユニット及び/又はコアを含んでよい。幾つかの実施形態では、プロセッサ235は、電子表示信号を生成して表示装置へ供給すること、画像の表示を支援すること、画像を捕捉し送信すること、種々のタイプの特徴抽出及びサンプリングを含む複雑なタスクを実行すること、等が可能であってよい。幾つかの実施形態では、プロセッサ235は、バス220を介してメモリ237へ結合されてよく、そのデータ及び命令にアクセスするとともに、そこにデータを格納する。バス220は、例えば、オブジェクト認識モジュール201、セグメンテーションモジュール203、棚/ラベル検出モジュール205、空きスペースモジュール207、マルチプルスモジュール209、メモリ237、通信ユニット241、及びデータストレージ243を含むリアログラム解析システム200の他の構成要素へプロセッサ235を結合してよい。明らかなように、他のプロセッサ、センサ、ディスプレイ及び物理構成が可能である。
メモリ237は、リアログラム解析システム200の他の構成要素のためのデータを記憶し、そのデータへのアクセスを提供してよい。メモリ237は、ここで別なところで論じられるように、単一のコンピューティング装置又は複数のコンピューティング装置において含まれてよい。幾つかの実施形態では、メモリ237は、プロセッサ235によって実行され得る命令及び/又はデータを記憶してよい。例えば、一実施形態において、メモリ237は、プロセッサによって実行される場合に、プロセッサに、オブジェクト認識モジュール201、セグメンテーションモジュール203、棚/ラベル検出モジュール205、空きスペースモジュール207、及びマルチプルスモジュール209を含むリアログラム解析アプリケーション103を実装させる命令を記憶してよい。メモリ237はまた、例えば、オペレーティングシステム、ハードウェアドライバ、他のソフトウェアアプリケーション、データベース、等を含む他の命令及びデータを記憶することが可能であってよい。メモリ237は、プロセッサ235及びリアログラム解析システム200の他の構成要素との通信のためにバス220へ結合されてよい。
メモリ237は、1つ以上の非一時的なコンピュータ使用可能(例えば、読み取り可能、書き込み可能、等)な媒体を含んでよい。この媒体は、プロセッサ235による処理のために、又はそれと接続されて、命令、データ、コンピュータプログラム、ソフトウェア、コード、ルーチン、等を含むことができる如何なる有形な装置又はデバイスであることもできる。幾つかの実施形態では、メモリ237は、揮発性メモリ及び不揮発性メモリの1つ以上を含んでよい。例えば、メモリ237は、制限なしに、動的ランダムアクセスメモリ(DRAM)デバイス、静的ランダムアクセスメモリ(SRAM)デバイス、埋込メモリデバイス、ディスクリートメモリデバイス(例えば、PROM、FPROM、ROM)、ハードディスク、光ディスク(CD、DVD、ブルーレイ、等)の1つ以上を含んでよい。メモリ237は、単一のデバイスであってよく、あるいは、複数種類のデバイス及び構成を含んでよいことが理解されるべきである。
通信ユニット241は、プロセッサ235及びリアログラム解析システム200の他の構成要素をネットワーク105及び他のプロセッシングシステムへ結合することによってデータを受信及び送信するハードウェアである。通信ユニット241は、例えば、イメージングデバイス115からの1つ以上の画像、及び/又は解析結果を受信するよう構成される。一実施形態において、通信ユニット241は、ネットワーク105への又は他の通信チャネルへの直接的な物理接続のためのポートを含んでよい。例えば、通信ユニット241は、ネットワーク105との有線接続のためにRJ45又は同様のポートを含んでよい。他の実施形態では、通信ユニット241は、1つ以上の無線通信方法、例えば、IEEE802.11、IEEE802.16、Bluetooth(登録商標)、又は他の適切な無線通信方法を用いてネットワーク105又は何らかの他の通信チャネルを介してデータを交換するための無線トランシーバ(図示せず。)を含んでよい。
更なる他の実施形態では、通信ユニット241は、セルラー通信ネットワーク上で、例えば、ショート・メッセージング・サービス(SMS)、マルチメディア・メッセージング・サービス(MMS)、ハイパーテキスト・トランスファ・プロトコル(HTTP)、ダイレクトデータ接続、WAP、電子メール、又は他の適切なタイプの電子通信を介して、データを送信及び受信するためのセルラー通信トランシーバを含んでよい。更なる他の実施形態では、通信ユニット241は、有線ポート及び無線トランシーバを含んでよい。通信ユニット241はまた、例えばTCP/IP、HTTP、HTTPS及びSMTPなどの標準ネットワークプロトコルによるファイル及び/又はメディアオブジェクトの分配のためにネットワーク105への他の従来の接続を提供する。
データストレージ243は、ここで記載される機能を提供する際に使用されるデータを記憶する非一時的なメモリである。例えば、データストレージ243は、画像捕捉装置又は他のソースから受信された画像、画像の解析結果、画像解析で使用されるデータ構造、例えば、画像においてオブジェクトを特定するために使用される特徴点を持った機知のオブジェクトインデックス、及び同様のものを記憶してよい。データストレージ243は、動的ランダムアクセスメモリ(DRAM)デバイス、静的ランダムアクセスメモリ(SRAM)デバイス、フラッシュメモリ又は何らかの他のメモリデバイスであってよい。幾つかの実施形態では、データストレージ243は、ハードディスク、フロッピー(登録商標)ディスク、CD−ROMデバイス、DVD−ROMデバイス、DVD−RAMデバイス、DVD−RWデバイス、フラッシュメモリデバイス、又はより永久的に情報を記憶する何らかの他の大容量記憶デバイスを含む不揮発性メモリ又は同様の永久記憶デバイス及び媒体を更に含んでよい。
オブジェクト認識モジュール201は、画像においてオブジェクトを検出及び特定するソフトウェア及び/又はロジックを含む。小売り棚又はディスプレイの画像における製品がオブジェクトの例として本明細書を通じて使用される一方で、オブジェクトは、例えば、文書、本、又は同様のものなどの、あらゆる環境の画像における他の認識可能な特徴であってよい。オブジェクト認識モジュール201は、既存の公の及び/又は独自仕様の画像認識アルゴリズムに従って画像においてオブジェクトを検出及び特定してよい。例えば、オブジェクト認識モジュール201は、検出されたオブジェクトを、データストレージ243にある検索データベースに記憶されている既知のオブジェクトの画像と照合するために、コンピュータビジョンBoW(Bag of Words)を使用してよい。例えば、スケールが不変の特徴変換(SIFT;Scale-Invariant Feature Transform)アルゴリズムを用いると、オブジェクト認識モジュール201は、検出されたオブジェクトについて特徴点を抽出し、それらの特徴点を検索データベースと比較する。比較のために、検出されたオブジェクトからの特徴点及び検索データベース内の画像は、k最近傍点(KNN;K-nearest Neighbors)又は同様のアルゴリズムに基づき照合される。
幾つかの実施形態では、オブジェクト認識モジュール201は、フィールド・プログラマブル・ゲート・アレイ(FPGA;Field Programmable Gate Array)又は特定用途向け集積回路(ASIC;Application-Specific Integrated Circuit)を含むプログラム可能な又は特殊化されたハードウェアを用いて実装されてよい。幾つかの実施形態では、オブジェクト認識モジュール201は、プロセッサ235によって実行可能なソフトウェア及びハードウェアの組み合わせを用いて実装されてよい。幾つかの実施形態では、オブジェクト認識モジュール201は、プロセッサ235によって実行可能な命令の組である。幾つかの実施形態では、オブジェクト認識モジュール201は、メモリ237に記憶されている命令であり、プロセッサ235によってアクセス可能であり且つ実行される。幾つかの実施形態では、オブジェクト認識モジュール201は、バス220を介したプロセッサ235、メモリ237及びリアログラム解析システム200の他の構成要素との協調及び通信のために適応される。
図2の例において表されているリアログラム解析アプリケーション103は、1つのオブジェクト認識モジュール201しか含まないが、1つ以上の更なるオブジェクト認識モジュールが製品の検出及び特定のために使用されてよいことが認識されるべきである。同様に、オブジェクト認識モジュール201は、連続的に又は並行して個々の画像を処理してよい。更に、イメージングデバイス115から受信された複数の画像を処理のための単一の画像にまとめてよい。幾つかの実施形態では、オブジェクト認識モジュール201は、イメージングデバイス115が最終のリアログラムを生成することにおいて使用される画像を依然として捕捉している最中に、イメージングデバイス115から受信された画像に対する認識の実行を開始してよい。
セグメンテーションモジュール203は、以下で更に詳細に記載されるように、画像解析における使用のために夫々の画像において複数の画像セグメントを生成するソフトウェア及び/又はロジックを含む。ここで論じられる技術は、例えば、粗格子、スーパーピクセル、等の様々な画像セグメント及びセグメンテーション方法に適用可能であることが認識されるであろう。なお、以下の例では、1つ又は他が、記述的目的のために使用され得る。
棚/ラベル検出モジュール205は、以下で更に詳細に記載されるように、棚の最前部及び棚の最前部にある製品ラベル(例えば、値札、バーコード、等)を特定するソフトウェア及び/又はロジックを含む。空きスペースモジュール207は、以下で更に詳細に記載されるように、製品が“品切れ”である領域を決定するためにリアログラム画像において棚上の空きスペースを特定するソフトウェア及び/又はロジックを含む。マルチプルスモジュール209は、オブジェクト認識モジュール201によって認識されない類似した特徴を持った複数のオブジェクト検出し、それらのオブジェクトを未知又は未確認製品として特定するソフトウェア及び/又はロジックを含む。
リアログラム解析アプリケーション103の様々なモジュールは、プログラム可能な又は特殊化されたハードウェア(例えば、フィールド・プログラマブル・ゲート・アレイ(FPGA)又は特定用途向け集積回路(ASIC))を用いて、あるいは、プロセッサ235によって実行可能なソフトウェア及びハードウェアの組み合わせを用いて、実装されてよい。例えば、モジュールは、メモリ237において記憶され、プロセッサ235によってアクセス可能であり且つ実行される命令の組であってよい。様々なモジュールの機能は、以下で更に詳細に記載される。
図3は、スーパーピクセルに基づくリアログラムシーン解析のための方法300の一例のフロー図である。幾つかの実施形態では、画像は、スーパーピクセルに分割されてよい。幾つかの実施形態では、方法300は、例えば、店内の棚のリアログラムなどの画像において特徴を特定するために使用される。リアログラム(realogram)(例えば、図4において表される。)は、プラノグラム(planogram)の対象の現実の実施の画像である。プラノグラムは、例えば、棚ユニットにある製品の場所及び量などの、小売り環境でディスプレイされる製品の視覚表現である。ここで使用されるフェイシング(facing)は、製品の積み重ね(又は積み重ねの部分でない単一の製品)である。プラノグラム(例えば、計画された製品レイアウトの描写)において、フェイシングが1つよりも多い製品を有する場合に、それらの製品は同一である。リアログラム(例えば、店舗内の実際の製品レイアウトの画像)において、フェイシングは、入り交じった製品を有してよい。方法300は、例えば、棚の位置、ラベル、インデックス付きの製品(例えば、画像認識アルゴリズムによる識別のためにインデックスを付された製品)、インデックス無しの製品(例えば、画像認識アルゴリズムによる識別のためにインデックスを付されていない製品)、及び空きスペース(例えば、製品が品切れである領域)等をリアログラムにおいて決定するために使用されてよい。
図4は、一例となるリアログラム(例えば、店舗の棚にある製品の画像)を表す。図4の例では、画像内の製品は、様々なデンタルケア製品の多数の箱を含む。なお、画像は、リアログラム解析アプリケーション103によって検出及び特定される如何なる数、サイズ、及び範囲の製品(又は他のオブジェクト)も含むことができることが認識されるべきである。例となるリアログラムはまた、インデックス無し製品402、インデックス付き製品(例えば、境界ボックスを有して表される製品)、及び品切れ領域404を表す。幾つかの実施形態では、会計検査官/販売員代表は、イメージングデバイス115(例えば、ラップトップ・コンピュータ、タブレット・コンピュータ、携帯電話機、パーソナル・デジタル・アシスタント(PDA)、携帯型電子メール装置、ウェブカム、デジタルカメラ、又は同様もの)を用いてリアログラム画像を捕捉してよい。一実施形態において、会計検査官/販売員代表は、小売店にある大きな棚の複数の画像を捕捉し、夫々の画像は棚の一部分をカバーし、画像は、ここで別なところで記載されるように、リアログラム解析アプリケーション103によって連続的に又は並行して縫合又は解析され得る。他の実施形態では、リアログラムは、自動画像捕捉装置によって自動的に捕捉されてよい。この自動画像捕捉は、例えば、周期的に行われてよい。ここでの例は、リアログラムを、例えば小売りオブジェクトなどの棚の画像として記載するが、画像は、整理されたオブジェクトの如何なる配置も含んでよいことが理解されるべきである。例えば、画像は、問屋、倉庫、保管室、キャビネット等の画像であってよい。同様に、オブジェクトは、小売り製品に加えて、ツール、製造、建築又は保守において使用される部品、薬、応急手当物資、非常又は安全設備、等であってよい。
図3の例に戻ると、302で、リアログラム解析アプリケーション103は、整理されたオブジェクトのリアログラム画像(例えば、小売ディスプレイ)を受け取る。例えば、画像は、イメージングデバイス115(例えば、デジタルカメラ、携帯電話機、ロボット搭載カメラ、等)によって捕捉され、解析のためにリアログラム解析アプリケーション103へアップロードされてよい。
304で、オブジェクト認識モジュール201は、既存の公の及び/又は独自仕様の画像認識アルゴリズムに従って、画像内のオブジェクトを検出及び特定して、検出されたオブジェクトを、データストレージ243上の検索データベースに記憶されている既知のオブジェクトの画像と照合してよい。幾つかの実施形態では、オブジェクト認識モジュール201は、1つ以上の画像内の夫々の特定されたオブジェクトについて識別領域又は境界ボックスを生成し、認識結果を出力する。幾つかの実施形態では、オブジェクト認識モジュール201は、画像内の特徴が検索データベースに記憶されている特徴と一致するピクセル位置であるインライアのリストを生成する。小売り棚上の製品の例では、夫々の製品についての認識結果は、例えば、オブジェクトID(例えば、最小管理単位(SKU;Stock Keeping Unit))を含んでよい。夫々の特定された対象についての認識結果はまた、製品を特定することにおけるオブジェクト認識モジュール201のコンフィデンスを含む他の情報を含んでよい。
306で、セグメンテーションモジュール203は、リアログラム画像からスーパーピクセルを生成する。様々な実施形態において、セグメンテーションモジュール203は、同時に捕捉されるか又は以前に捕捉されてデータストレージに記憶されたリアログラム画像からスーパーピクセルを入手及び生成してよい。ここで使用されるように、スーパーピクセルは、ピクセルの組を含む画像のセグメントである。スーパーピクセルはまた、部分(part)、部分(portion)又は領域(region)と呼ばれることがある。例えば、スーパーピクセルは、通常のピクセルよりも大きい、デジタル画像のコンパクトな部分であり、夫々の部分は、おおよそ同じ色及び輝度のピクセルを含む。リアログラム画像のセグメンテーションのためにスーパーピクセルを使用する利点は、解析を必要とする離散的なデータ点の数を制限することによって(例えば、スーパーピクセル対個々のピクセル)、画像の解析を簡単にすることである。スーパーピクセルは、ソリッドカラーを表す粗グリッドとソリッドカラー領域間のエッジとの間の好ましい妥結点である。粗グリッドと同じく、画像のスーパーピクセル・セグメンテーションは、オブジェクトを良好にモデリングするスケールを選択することを可能にし、有用な数の仮定を生成するのを助ける。スーパーピクセル・アルゴリズムは、異なったソリッドカラーにより領域を分け且つ画像内のドミナントのエッジと整列する境界を生成するよう試みる。故に、スーパーピクセル・アルゴリズムによって生成された境界は、実際のオブジェクト境界についての良好な候補である。スーパーピクセルは、点、ラインセグメント、境界ボックス等である観測結果を互いに且つ局所的な画像領域にマッピングするのに特に有用である。スーパーピクセルは、以下で更に詳細に記載されるように、小近傍モデルにより確率を推定し且つ決定を行うのにも有用である。
セグメンテーションモジュール203は、基礎を成す画像の特徴に基づき画像をコンパクトな部分にセグメント化することによって、整理されたオブジェクトの画像、例えば、リアログラムからスーパーピクセルを生成する。様々な実施形態において、セグメンテーションモジュール203は、様々な既知のアルゴリズムによりスーパーピクセルを生成してよい。例えば、セグメンテーションモジュール203は、Simple Linear Iterative Clustering(SLIC)アルゴリズム、Superpixels Extracted via Energy-Driven Sampling(SEEDS)アルゴリズム、Superpixel Contourアルゴリズム、又は他の既知の公の若しくは独自仕様のスーパーピクセル生成アルゴリズムを使用してよい。
幾つかの実施形態では、スーパーピクセルを生成することにおいて計算効率を高め且つピクセルごとのノイズを低減するよう、リアログラム解析アプリケーション103は、受信されたリアログラム画像を低減された解像度にスケーリングする。幾つかの実施形態では、1000ピクセル以上の最小寸法を持った画像は、その最小寸法が500から1000ピクセルの間にあるように、夫々の次元において、それらの約数の最大値を用いて、2、3、4等の係数によってスケーリングされてよい。例えば、3264×2448ピクセル(例えば、最小寸法は2448)の解像度を持った画像について、4の係数が、816×612ピクセルのサイズへと画像をスケーリングするために使用されてよい。
一実施形態において、スケーリング係数は、リアログラム画像における製品のピクセル寸法に対する物理的な製品サイズの比に基づき決定される。特定の製品についての画像認識結果からの情報(製品を特定するとともに、ピクセルにおいて画像位置を与えることができる。)及びそれらの製品に関するサイズの知識は、おおよそのサイズを決定するために使用され得る。例えば、画像は、14ピクセルが約1インチに対応するようにスケーリングされ得る。
図5Aは、棚及び棚上の製品を含むリアログラムの一例を表す。図5Bは、セグメンテーションエンジン203によって生成されたスーパーピクセルを重ね合わされたリアログラム(例えば、スーパーピクセル)の例を表す。
図3の例に戻ると、307で、リアログラム解析アプリケーション103は、他の観測結果を用いてスーパーピクセルにラベルを付す。幾つかの実施形態では、セグメンテーションモジュール203は、更なる情報又は観測結果を用いてスーパーピクセルにラベルを付してよい。例えば、セグメンテーションモジュール203は、例えば、サイズ(高さ、幅、奥行き)及び/又は、製品が棚上に又は吊すことでディスプレイされているかどうかなどの、期待される製品に関する知識、特定の製品についての画像認識結果、フェイシング(facing)(例えば、積み重ね(stack))にグループ分けされている特定の製品についての画像認識結果、並びに画像において検出されたラインセグメントを更に含んでよい。幾つかの実施形態では、特徴(例えば、スーパーピクセルにラベルを付すために使用される他の観測結果)はソリッドカラー領域、ソリッドカラー領域間のエッジ、ドミナントのエッジ、点、ラインセグメント、境界ボックス、類似した色又は輝度の領域、等である。一実施形態において、スーパーピクセルは、特定の製品認識結果からの結果を用いてラベルを付されてよい。例えば、認識された製品についての境界ボックス内にあるか、認識された製品についてインライアを有する(例えば、スーパーピクセルの中の1つ以上のピクセルは、製品認識に使用される特徴の位置に対応する。)か、フェイシングの下にあるか、あるいは、長い水平なラインセグメントと交差するスーパーピクセルは、然るべくラベルを付される。一実施形態において、リアログラム解析アプリケーション103は、リアログラム画像においてラインセグメントを検出するためにLine Segment Detector(LSD)アルゴリズムを使用する。ラインセグメントは、水平方向における範囲が垂直方向における範囲の少なくとも2倍である場合に、水平であると決定される。一実施形態において、セグメンテーションモジュール203は、認識された製品にないラインセグメントを有するスーパーピクセルにのみラベルを付す。他の実施形態では、セグメンテーションモジュール203は、最長の期待される製品よりも長いラインセグメントを有するスーパーピクセルにのみラベルを付す。他の実施形態では、セグメンテーションモジュール203は、最長の認識される製品よりも長いラインセグメントを有するスーパーピクセルにのみラベルを付す。
308で、リアログラム解析アプリケーション103は、スーパーピクセル及び幾つかの実施形態では他の観測結果に基づきリアログラムの領域を特定する。例えば、他の観測結果は、リアログラム属性、例えば、オブジェクト特定結果、リアログラム画像において検出されたラインセグメント、スーパーピクセルのクラスタ(例えば、色に基づくクラスタ)、又はリアログラムの領域等を含んでよい。なお、他の観測結果が可能である。リアログラム解析アプリケーション103は、例えば、棚、棚にあるラベル、インデックス無し製品が仕入れられた領域、品切れ領域、及び/又はリアログラム画像において存在する他の領域等の領域を、スーパーピクセル及び他の観測結果を用いて特定してよい。リアログラムの領域を特定する方法及び動作は、以下で更に詳細に記載される。
幾つかの実施形態では、リアログラム解析アプリケーション103によって特定された領域は、小売り実施のための重要業績評価指標(KPI;Key Performance Indicator(s))であり、あるいは、他の目的のために有用であり得る。領域はまた、KPIを決定するために使用されてよい。例えば、棚領域は、インデックス付きオブジェクトを棚によって線形なグループにグループ分けするために使用されてよい。棚、インデックス付きオブジェクト、及びインデックス無しオブジェクトの各領域は、例えば、棚の共有及び品揃えの共有等のメトリクスを推定するために使用されてよい。
幾つかの実施形態では、画像セグメンテーション及びラベル付けは任意であってよく、リアログラム解析アプリケーション103は、それらのステップを省略し、画像において検出された特徴点に基づき画像の領域を分類してよい。画像解析アプリケーション103は、例えば、スケールが不変の特徴変換(SIFT;Scale-Invariant Feature Transform)アルゴリズム、畳み込みニューラルネットワーク(CNN;Convolutional Neutral Network)、深層学習(deep learning)、機械学習(machine learning)、又は同様のものを用いて画像において特徴点を特定してよい。
図6は、スーパーピクセル及び幾つかの実施形態では他の観測結果に基づきリアログラムの領域を特定する方法308の一例のフロー図である。様々な実施形態において、スーパーピクセルに基づきリアログラムの領域を特定するよう、リアログラム解析エンジン103及びその構成要素は、観測結果をスーパーピクセルへ属性として割り当て、スーパーピクセルに基づくモデルにより仮定を生成し、スーパーピクセルに基づくモデルにより仮定をバリデートし、解析結果を出力する。リアログラムシーン解析のこのような生成は、後続の図において詳細に説明される。602で、棚/ラベル検出モジュール205は、整理されたオブジェクトの画像において表される棚の最前部を特定する。幾つかの実施形態では、棚/ラベル検出モジュール205は、画像においてピクセルのグループに基づき特徴を特定し、可能な棚位置に関する仮定を生成及び評価してよい。例えば、棚/ラベル検出モジュール205は、以下で更に詳細に記載される方法により棚の位置を決定してよい。
604で、棚/ラベル検出モジュール205は、棚の最前部にあるラベルの位置を決定する。幾つかの実施形態では、棚/ラベル検出モジュール205は、棚の最前部(例えば、ブロック602で見つけられる。)に関連するスーパーピクセルを色及び他の観測結果(例えば、画像において検出されるラインセグメント)に基づき様々なグループにクラスタ化することによって、棚の最前部にあるラベルの存在及び位置を決定してよい。他の実施形態では、棚/ラベル検出モジュール205は、画像において特定された特徴点を用いて棚の最前部にあるラベルの存在及び位置を決定してよい。例えば、棚/ラベル検出モジュール205は、図7及び図13を参照して記載される方法を用いてラベルの存在及び位置を決定してよい。情報は、例えば値段、UPC、製品名又は同様のもの等のラベルから抽出されてよい。
606で、マルチプルスモジュール209は、類似した特徴を備える複数のオブジェクトの存在及び位置を決定する。この動作は、インデックスを付されていないリアログラム画像内のオブジェクト(例えば、上述されたように画像プロセッサによって特定されたオブジェクトの中にないもの)を見つけるのに特に有用である。幾つかの実施形態では、マルチプルスモジュール209は、同じ画像(例えば、リアログラム)内の特徴点を照合し、点の対をクラスタ化し、そして、幾つかの実施形態では、製品の積み重ね(例えば、垂直グループ)、水平グループ及び/又は同じ若しくは類似した製品の孤立したインスタンスを見つける。例えば、マルチプルスモジュール209は、図17を参照して更に詳細に記載される方法を用いて複数のものの存在及び位置を決定してよい。
608で、空きスペースモジュール207は、棚の下にある空きスペースの存在及び位置を決定する。幾つかの実施形態では、空きスペースモジュール207は、オブジェクトを欠いている領域(例えば、暗領域、同色領域、及び/又は棚の背面に対応する領域、例えばペグボード)を決定することによって、品切れ領域を特定する。例えば、空きスペースモジュール207は、図20を参照して更に詳細に記載される方法を用いて棚の下にある空きスペースの存在及び位置を決定してよい。
図7A及び7Bは、リアログラム画像において表されている棚及びラベルを決定するための方法700の一例のフロー図を表す。701で、棚/ラベル検出モジュール205は、複数の整理されたオブジェクトの画像を受け取る。上述されたように、画像は、小売り棚又はディスプレイのリアログラム画像であってよい。
702で、棚/ラベル検出モジュール205は、画像においてピクセルのグループに基づき特徴を特定する。例えば、画像解析アプリケーション103は、例えば、スケールが不変の特徴変換(SIFT;Scale-Invariant Feature Transform)アルゴリズム、畳み込みニューラルネットワーク(CNN;Convolutional Neutral Network)、深層学習(deep learning)、機械学習(machine learning)、又は同様のものを用いて画像において特徴点を特定してよい。他の実施形態では、特徴は、隣接したスーパーピクセル間の勾配に基づくスーパーピクセル棚特徴であってよい。ここで使用されるスーパーピクセル棚特徴は、スーパーピクセル境界の幾らかがそのスーパーピクセルと直ぐ隣のスーパーピクセルとの境界の特性に基づき棚最前部の部分のトップ又はボトムエッジに対応し得るスーパーピクセルである。棚/ラベル検出モジュール205は、スーパーピクセルがスーパーピクセル棚特徴であるかどうかを、水平エッジで4つの隣接したスーパーピクセルのグループを見つけることに基づき判定する。
夫々のスーパーピクセルについて、その隣にあるものは他のスーパーピクセルであり、スーパーピクセルを有するピクセルが(8個接続された)隣接スーパーピクセルである。一実施形態において、棚/ラベル検出モジュール205は、スーパーピクセルラベルの画像サイズの2Dアレイのラスタースキャンを用いて、隣接するスーパーピクセルを見つける。3×3近傍の中心がいずれの周囲とも異なる夫々のラスター位置で、中心に対応するスーパーピクセル及び夫々の一意の異なった周囲に対応する1つ以上のスーパーピクセルは、隣どうしである。この対又は隣接するスーパーピクセルどうしの対について、その/夫々の対についての隣接スーパーピクセルのリストは、その対の他方のスーパーピクセルが隣接スーパーピクセルのリストに既にない場合に更新される。
一実施形態において、夫々のスーパーピクセルについて、その隣どうしの9つのリストは、そのスーパーピクセル及び夫々の隣接スーパーピクセルについての重心の関係に基づき生成される。直ぐそばにある重心については1つのリストが存在する。目下の実施では、直ぐそばとは、X方向の距離が全てのスーパーピクセルのX方向の平均幅よりも小さく、Y方向の距離が全てのスーパーピクセルの平均高さよりも小さいことをいう。直ぐそばにない隣どうしのスーパーピクセルについて、スーパーピクセルからその隣のスーパーピクセルへのベクトルの角度は、0、45、90、135、180、225、270又は315度に量子化され、スーパーピクセルの8つのリストはそれら8つの角度に対応する。図10は、それらの夫々の角度でスーパーピクセルのリストを表す例図である。
一実施形態において、ソーベル勾配(Sobel gradient)は、画像のX及びY方向において計算され、極(大きさ及び角度)座標に変換される。一実施形態において、棚/ラベル検出モジュール205は、この勾配をR、G及びBの各成分について個々に計算し、最大の大きさを持った成分についての大きさ及び角度を使用する。図12Aは、スーパーピクセル境界での量子化された勾配を表す例図である。図12Bは、スーパーピクセルの対についての量子化された勾配を示すデータ構造の例である。1つのインデックス(“小さい大きさ”インデックス)は、大きさが閾値(例えば、16)よりも小さいときに使用される。このインデックスは、スーパーピクセル間に明確な境界を持たないスーパーピクセルを示すために使用される。そうでない場合は、角度は、0、45、90、135、180、225、270又は315度に量子化され、対応するインデックスが、それら8つの角度について使用される。それら8つのインデックスは、スーパーピクセル間に明確な境界を持つスーパーピクセルを示す。
一実施形態において、隣接したスーパーピクセル(例えば、図12Aの例におけるS1及びS0)の各対について、及び勾配量子化値の夫々について、カウントのために整数である、X座標及びY座標は、0に初期化される。スーパーピクセルの画像サイズの2Dアレイのラスタースキャンが実行される。3×3近傍の中心がいずれの周囲とも異なる夫々のラスター位置で、隣どうしの対応する対及び勾配量子化値は決定され、夫々の対に対応するデータ構造において2つの位置を特定するために使用される。夫々のデータ構造位置について、カウントは1だけインクリメントされ、ラスター位置のX及びY座標は、データ構造におけるX及びY値に夫々加えられる。ラスタースキャンの後、データ構造におけるカウント値は、同じ量子化された勾配を有する一対のスーパーピクセルについての境界ピクセルの数である。最終的に、データ構造におけるX及びYの各値は、対応するカウントによる除算によって正規化される。データ構造におけるX及びYの値は、このとき、同じ量子化された勾配を有する一対のスーパーピクセルについての境界ピクセルの重心である。
夫々のスーパーピクセルがスーパーピクセル棚特徴であるか否かを判定するよう、棚/ラベル検出エンジン205は、製品認識結果からのインライアを有するスーパーピクセルとしてラベルを付されたスーパーピクセルを最初に除外する。棚/ラベル検出エンジンは、次いで、明確な境界を持った横の隣接スーパーピクセル(例えば、左手又は右手)を有するスーパーピクセルを除外する。一実施形態において、左右の隣接スーパーピクセル(量子化された角度0又は180度を持つ隣接するスーパーピクセル)について、夫々の隣接スーパーピクセルについての量子化された勾配カウントが確認される。最大カウントを持ったインデックスが、少なくとも1つの隣接スーパーピクセルについての“小さい大きさ”インデックスでない場合は、このスーパーピクセルはスーパーピクセル棚特徴でない(例えば、その隣接するスーパーピクセルは、明確な境界を有する。)。最大カウントを有するインデックスが“小さい大きさ”インデックスである隣接スーパーピクセルは、明確な境界を有さない横の隣接スーパーピクセルである。
棚/ラベル検出エンジン205は、次いで、残りのスーパーピクセルから“上”及び“下”にあるスーパーピクセル棚特徴を決定する。スーパーピクセルは、上側の隣接スーパーピクセル(例えば、隣接スーパーピクセルに対する角度が45、90又は135度2量子化されるとき)との境界での勾配が垂直である(例えば、勾配角度は90又は270で量子化された。)場合に“上側のスーパーピクセル棚特徴”である。同じ勾配インデックスを持った異なる上側の隣接スーパーピクセルを有する、明確な境界を持たない横の隣接スーパーピクセルが存在する。スーパーピクセルとその上の隣接スーパーピクセルとの境界のY重心及び横の隣接スーパーピクセルとその上の隣接スーパーピクセルとの境界のY重心は、閾値(例えば、<5低解像度ピクセル>)内で同じである。スーパーピクセルは、下側の隣接スーパーピクセル(例えば、その隣接スーパーピクセルに対する角度が225、270又は315度に量子化されるとき)との境界での勾配が垂直である(例えば、勾配角度は90又は270度に量子化された。)場合に“下側のスーパーピクセル棚特徴”である。同じ勾配インデックスを持った異なる下側の隣接スーパーピクセルを有する、明確な境界を持たない横の隣接スーパーピクセルが存在する。スーパーピクセルとその下の隣接スーパーピクセルとの境界のY重心及び横の隣接スーパーピクセルとその下の隣接スーパーピクセルとの境界のY重心は、閾値(例えば、<5低解像度ピクセル>)内で同じである。この関係は、図11の例図において表される。
以下は、リアログラム画像においてスーパーピクセル棚特徴を特定するアルゴリズムの例である:
図8は、スーパーピクセルを重ね合わされたリアログラムの部分及び、スーパーピクセル棚特徴であるスーパーピクセルを示す矢印の例を表す。上にあるスーパーピクセル棚特徴は、スーパーピクセル重心からその上部境界へ上向きの矢印によって示される。下にあるスーパーピクセル棚特徴は、スーパーピクセル重心からその下部境界へ下向きの矢印によって示される。上述されたように、スーパーピクセル棚特徴は、4つの隣接したスーパーピクセルの境界に基づき決定される。図8の例では、スーパーピクセル802は、スーパーピクセル802とその横の隣接スーパーピクセル804との間の勾配が小さく、それらの上の隣接スーパーピクセル806どうしの間の境界が水平エッジ(例えば、境界上での最もよく見られる量子化された勾配値はどちらも同じ垂直方向であり、それらの境界ピクセルのY重心は同様である。)を示すので、スーパーピクセル棚特徴である。
図7の例に戻ると、704で、棚/ラベル検出モジュール205は、特徴を用いて外観に基づき、とり得る棚の位置を特定する。一実施形態において、棚/ラベル検出モジュール205は、スーパーピクセル棚特徴を色によってクラスタ化し、ラインセグメントに基づき角度を求め、色及び角度を用いて棚の位置の仮定を決定するようスーパーピクセルを探すことによって、棚の位置の仮定を決定する。このプロセスは、以下で更に詳細に記載される。他の実施形態では、棚/ラベル検出モジュール205は、棚エッジに対応し得る特徴点を決定することによって、とり得る棚の位置を特定する。
様々な実施形態において、スーパーピクセル棚特徴は、k平均クラスタリング、凝集型(agglomerative)クラスタリング(例えば、ウォード(Ward)クラスタリング)、ガウス混合モデル(GMM;Gaussian Mixture Model)、他の既知の独自仕様若しくは公のクラスタリング技術、又はカラーパレットを生成及び量子化する技術を用いて、平均色によってクラスタ化される。一実施形態において、棚/ラベル検出モジュール205は、5つのクラスタ(例えば、k=5、5つのGMMコンポーネント)を使用する。クラスタは、様々な色空間、例えば、RGB、LAB、又は同様のもの等に基づくことができる。一実施形態において、棚/ラベル検出モジュール205は、認識された製品境界ボックス内にあるものとしてラベルを付されたスーパーピクセル棚特徴の色を任意に無視してよい。例えば、認識された製品についての境界ボックスにあるスーパーピクセルは、色0としてラベルを付され、他のスーパーピクセル棚特徴は、色1、2、3、4又は5としてラベルを付される。同様に、ぶら下がった製品の下にあるスーパーピクセル棚特徴は、幾つかの実施形態において無視され得る。一実施形態において、棚/ラベル検出モジュール205は、夫々のクラスタについてグレースケール又は輝度値を決定する。例えば、棚/ラベル検出モジュール205は、グレースケール値を決定するようGMMから平均を決定してよい。色に基づきスーパーピクセル棚特徴をクラスタ化する例は、図9の例の906において表される。
とり得る棚の位置を棚/ラベル検出モジュール205によって特定されたスーパーピクセル棚特徴から決定するよう、モジュールは、図9の例における902で表されるように、水平に近いラインを形成するスーパーピクセル棚特徴を探す。例えば、一実施形態において、棚/ラベル検出モジュール205は、0.005ラジアンのステップで−0.3ラジアンから+0.3ラジアンまで(おおよそ、0.3度のステップで−17度から+17度まで)の水平に近い角度を探す。棚/ラベル検出モジュール205は、長い水平ラインセグメント(例えば、認識された製品になく、期待される製品よりも長い、水平に近い範囲内にある角度を持ったラインセグメント)におけるそれらの発生頻度及び製品のボトムエッジにおける発生頻度に基づき、角度によってソートされる。棚/ラベル検出モジュール205は、最初に発生頻度の多い角度の順において角度をソートする。長いラインセグメント又は製品からの情報がない場合は、ソートは最初に0ラジアン(水平0度)である。本明細書の全体を通じて、特定の繰り返しにおける(特定の仮定についての)検索角度はシータ(theta)と呼ばれる。
以下は、シータ及び幅にわたってスーパーピクセル棚特徴を探すアルゴリズムの例である:
任意に、一実施形態において、棚/ラベル検出モジュール205は、シータの古い値でのスーパーピクセル棚特徴のグループの経過を追い、異なるグループを与える角度のみを処理することができる。
棚/ラベル検出モジュール205は、図9の例における904で表されるように、同じ水平ライン(水平は、シータだけ回転した後の水平を意味する。)にあるスーパーピクセル棚特徴の境界の座標を、その水平ラインに対応するビンにグループ分けするよう、十分なサイズのビンを生成する。一実施形態において、棚/ラベル検出モジュール205は、6つの低解像度ピクセルのビンサイズを使用する。例えば、モジュールは、50%重なり合ったビンを使用する。故に、回転されたY座標ごとにビン0..5,3..8,6..11,9..14,等が存在する。
ここで記載されるように、棚のフロントエッジの厚さは、棚のトップエッジと棚のボトムエッジとの間の距離である。一実施形態において、棚/ラベル検出モジュールは、4乃至20個のビンインデックス(50%の重なりを持ったビンについてビンサイズ単位のユニットにおいて2乃至10である。)から検索する。一実施形態において、“目下の仮定は良好である”基準は、見つけられるラベルの数、見つけられる棚の数、及びスコア(幾つかの実施形態において、その重要度の順序における。)に基づく。棚/ラベル検出モジュール205は、最小数のラベルが見つけられる場合(例えば、3)に、又は目下の仮定が如何なる前の仮定よりも良い場合に、“目下の仮定は良好である”と決定する。
一実施形態において、仮定をマージする場合に、幅にわたってループすることによる全ての仮定は保持される。代替的に、仮定が、他の仮定に近いと認められる場合は、マージは、以下で記載されるように、グループにおいて1つの仮定を選択することと同様な方法でそれらのうちの幾つかしか保持しなくてよい。
全ての厚さを検討した後、棚/ラベル検出モジュール205は、直ぐそばにある仮定の各グループから1つの仮定を選択する。例えば、モジュール205は、仮定の対を考えることによって仮定を選択する。対は、直ぐそばにある対が最初に検討されるような順序において考えられる。一実施形態において、棚どうしの間の最小の期待される距離は、棚の仮定の対が極めて直ぐそばにあるかどうか(例えば、上の棚の下部と下の棚の上部との間の距離が期待される距離よりも小さいかどうか)を判定するために使用される。一実施形態において、棚/ラベル検出モジュール205は、棚どうしの間の最小の期待される距離として、最小の期待される製品の高さを使用する。最小の期待される製品は、期待される製品(例えば、検索データベース内でインデックスを付されている製品)の中から見つけられる。代替的に、棚どうしの間の最小の期待される距離は、最短の認識された製品の高さであることができる。あるいは、他の実施形態では、最小の期待される高さは、認識されていない製品が認識された製品よりも短いことがある場合を扱うために、最短の認識された製品の高さの分数、例えば、最短の認識された製品の高さの半分であることができる。仮定を選択するとき、同様の厚さ(例えば、ビンサイズの2倍よりも大きくない距離)を有する仮定は、一緒のグループと見なされ得る。任意に、仮定を選択するとき、以下で記載されるようにスーパーピクセル棚特徴のヒストグラムの比較に基づき類似した外観を有する仮定は、一緒のグループと見なされ得る。
極めて直ぐそばにある一対の棚の仮定から一方の仮定を除外する場合に、その対の一方が、706に関連して以下で記載されるように外観に基づく(例えば、スーパーピクセル棚特徴のスコアに基づく)評価からであり、一方が、708に関連して以下で記載されるようにコンテクストに基づく評価(例えば、フェイシングの下の検索)からであるならば、コンテクストからの一方が除外される。そうでない場合は、低い方の仮定が、よりずっと暗い(例えば、0..255ピクセルについて64よりもグレースケール値又は輝度が小さい)ならば、それが除外される。さもなければ、以下で記載される、仮定を評価するための他の基準が、どちらを除外すべきかを判断するために使用され得る。代替的に、棚/ラベル検出モジュールが、ラベルの上及び下に関する情報を提供する場合は(以下で更に詳細に記載される。)、ラベルの上下位置は、適合する棚の上下位置に票を投じるために使用されてよく、票が少ない仮定が除外され得る。代替的に、検出されたラベルが少ない仮定は除外される。代替的に、仮定は、棚の色、ラベルの色及び/又は棚の厚さが全ての残りの仮定について一致するように除外され得る。
一実施形態において、選択された仮定に近いスーパーピクセル棚特徴は、シータの他の値についての検討から外される。棚どうしの間の最小の期待される距離は、この場合に、何が近いかについての閾値として使用される。シータにわたる検索は、スーパーピクセル棚特徴の閾数(例えば、6)未満が検討されるべき場合に停止する。これは、異なった棚が画像において異なった角度にある場合を扱う。これは、イメージングデバイスのポジションが棚を画像において平行でないようにする場合に起こり得る。
代替の実施形態では、アルゴリズムはグリーディ(greedy)であり、ラベルがシータについての何らかの値で見つけられると停止する。他の代替の実施形態では、シータにわたる検索は、全てのスーパーピクセル棚特徴にわたって続き、1つ以上の最良のシータ値からの結果が使用される。
棚/ラベル検出モジュールは、とり得る棚の位置(例えば、上記の仮定)から棚の位置を決定する。仮定を評価し選択するためのアルゴリズムの例は、以下で記載される:
706で、棚/ラベル検出モジュール205は、外観に基づき棚の位置を評価する。概して、棚の仮定は、2つの平行なラインであって、それらのライン内で同じ色を有する2つの平行なラインを表すとともに、上述されたように、長い水平なエッジを更に有するか、あるいは、フェイシングの下で上側の平行なラインを有するか、あるいは、下側の平行なラインの下でより暗いスーパーピクセル棚特徴を有し得るスーパーピクセル棚特徴に基づき、求められる。任意に、棚エッジは、棚の下にある暗領域よりも明るいと期待され、暗いスーパーピクセル棚特徴は、平行なライン内にあるスーパーピクセル棚特徴と見なされない。5つのクラスタ色(0が黒であり、255が白であるところ、0から255までのグレースケール値)について、5つの色のうちの最小グレースケール値よりも64より大きくなく且つ64から5つの色の最大グレースケール値を引いたもの未満であるとき、色は暗い。
一実施形態において、棚/ラベル検出モジュール205は、以下のように一対のビンについてスコアを計算する。夫々の色について(例えば、夫々のGMMコンポーネント1、2、3、4及び5について)、モジュールは、上限ビンについての2つの垂直な勾配方向の夫々について最大数のスーパーピクセル棚特徴(例えば、棚の上部であると仮定されるスーパーピクセル棚特徴)を求める。また、モジュール205は、長い水平エッジを有するスーパーピクセル棚特徴及びフェイシングの下にあるスーパーピクセル棚特徴の対応するカウントの最大値を求める。同様に、夫々の色について、棚/ラベル検出モジュール205は、下限ビンについての2つの垂直な勾配方向の夫々について下側のスーパーピクセル棚特徴の最大数を求める。また、モジュール205は、長い水平エッジを有するスーパーピクセル棚特徴の対応するカウントを求める。任意に、モジュール205は、より暗い(例えば、0から255のグレースケールについて64又はそれ以上の異なるグレースケール)下側の平行ラインについて上にあるスーパーピクセル棚特徴の数を求める。更に、夫々の色について、モジュール205は、その色についての上下のカウントの最小値を求める。最大値を有する色は最良の色(例えば、棚の仮定の色)であり、最大値は最良のカウントである。棚/ラベル検出モジュール205は、最良のカウントの和として仮定についてスコアを決定する。その色についての長いエッジ/フェイシング/より暗いスーパーピクセル棚特徴のカウントのより大きい方は、和が最良のカウントの2倍より大きくないようにクリッピングされる。
他の実施形態では、棚/ラベル検出モジュール205は、一対のビンについてヒストグラムを計算する。上限ビンについての上側のスーパーピクセル棚特徴、上限ビンについての下側のスーパーピクセル棚特徴、下限ビンについての上側のスーパーピクセル棚特徴、及び下限ビンについての下側のスーパーピクセル棚特徴の夫々について色に基づく1つのヒストグラムが存在する。異なる棚の仮定は、ヒストグラムを比較することによって比較され得る。
他の実施形態では、棚/ラベル検出モジュール205は、上下のスーパーピクセル棚特徴が近いスーパーピクセル棚特徴のみを考えることによって、一対のビンについて他のスコアを計算する。2つのスーパーピクセル棚特徴は、それらのX座標の差が閾値未満である場合に近い。一実施形態において、閾値は、Tが棚の厚さであり、Bがビン間隔であるとして、T/tan(arcsin(B/T))又は同等にT2×sqrt(1−(B/T)2)/Bである。一実施形態において、X座標は原画像のX座標である。他の実施形態では、X座標は、シータだけ回転された座標系にある。
708で、棚/ラベル検出モジュール205は、コンテクストに基づき棚の位置を評価する。様々な実施形態において、コンテクストは、棚の位置を評価するために使用され得る。これは、オブジェクト認識モジュール201からの情報、重なり合った画像における棚検出からの情報、棚どうしの間の規則的な間隔を前提とすること又は他の先験的情報に基づく仮定、及び同様のものを含むことができる。最良の仮定の選択を改善するよう、仮定についてのスコアにはボーナスが加えられ得る。製品が棚の上に置かれている場合に、製品のボトムエッジは、棚のトップエッジと同じ位置にある。リアログラム画像(画像内の垂直位置が必ずしも3D空間における垂直位置にのみ対応するわけではない2D投影)において、位置の比較は、3Dジオメトリを明示的に考慮するか、あるいは、3D降下を可能にする同じ位置についての近似を使用するべきである。例えば、一実施形態において、棚/ラベル検出モジュールは、フェイシングの下限ビン座標を棚の上限ビン座標と比較し、例えば、T=1.5×厚さであり、厚さが目下の棚の仮定についての棚上部と棚下部との間の距離であるとして、Tビン内に棚上部を有さない如何なるフェイシングも棚によって支持されていないものと見なされる。
棚の上にないぶら下がった製品の場合は、棚が見つけられない場合に繰り返しを停止することによって扱われる点に留意されたい。任意に、如何なる認識された製品も、ぶら下がった製品であると知られる場合に、それらの製品は、棚によって支持されていない製品として検討から除外され得る。
1つの棚があり得る範囲を求めるよう、棚/ラベル検出モジュール205は、棚の厚さよりも離れていない下部を有するフェイシングをグループ化し、そのグループの最小ビン座標より小さいもの及び最大ビン座標よりも大きいものを使用する(それらのビンが存在しない場合は、それらの位置よりも小さいもの及び大きいものを無視する。)。
幾つかの実施形態では、同じシーンの重なり合った画像が使用される。画像どうしの間の幾何学的関係は、既存の公の及び/又は独自仕様のスティッチング・アルゴリズムを用いて決定される。棚検出は、複数の画像に対して実行される。棚の位置の仮定は、スティッチング・アルゴリズムによって決定された座標系に変換される。一実施形態において、仮定は、複数の重なり合った画像において一致した位置にある棚についてのスコアを連帯して最大にするよう選択される。他の実施形態では、1つの画像における棚の仮定は、他の画像における対応する位置で棚の仮定が存在する場合に、ボーナスを付与される。
幾つかの実施形態では、棚どうしの間の間隔は規則的である。706で外観に基づき計算される棚の仮定の各対間の間隔が求められる。それらの間隔についての一意の値(例えば、ビン間隔によって特定される許容範囲内で同じ値)は、棚の間隔についての推定値である。小さい正の整数(例えば、2、3、4、5)によって割られるそれらのスペースは、結果が最小の棚間隔よりも大きいか又はそれと等しい場合に、棚の間隔についての他の推定値である。706で外観に基づき計算される棚の仮定から離れて、推定された棚の間隔の倍数である位置は、上述された、棚によって支持されていないフェイシングを見つけることと同じように、棚があるであろう範囲を求めるために使用される。
710で、選択された棚の仮定に基づき、棚/ラベル検出モジュール205は棚の境界を決定する。一実施形態において、棚の境界の座標を決定するよう、棚/ラベル検出モジュールは、棚についての原画像のY座標(のみ)を返す。それらのY座標は、画像の全幅に及ぶ水平な棚を表す。モジュール205は、棚の上側座標として、一実施形態において、棚の上部についてのスーパーピクセル棚特徴の上側境界重心Y座標の最大値を選択する(“上側インライア”)。同様に、モジュール205は、棚の下側座標として、棚の下部についてのスーパーピクセル棚特徴の下側境界重心Y座標の最小値を選択する(“下側インライア”)。
任意に、棚の境界は、次の1つ以上を表すことができる。すなわち、水平から離れた角度にある棚、複数のベイ(bay(s))(ベイは、店舗内の特定の棚構成における相異なるエリアである。)を有するか、又はいずれのベイにもない領域を有する画像などの、画像の幅に満たない棚、3D又はカメラ効果(例えば、異なる角度での区分線形)により画像において直線でない棚、エッジ部分が塞がされていない棚エッジの可視的な部分がある。一実施形態において、ある角度にある棚は、2つのライン又は一対の平行なラインを上側インライア及び下側インライアに合わせることによって表され得る。画像内の棚は、ピンクッション又は樽形湾曲などの3D又はカメラ効果に起因して直線でないことがある。区分的に連続している異なった角度ごとの棚の仮定は、棚の境界を表すようポリゴンへと結合され得る。
棚の仮定からの情報は、棚についてのスーパーピクセル棚特徴の位置及びそれらの色を含む。任意に、特定の認識された製品についての境界ボックスにあるか、又は特定の認識された製品についてのインライアを有するスーパーピクセルなどの、更なる情報が存在する。棚が画像全体に及ばない場合は、全幅の棚の仮定におけるスーパーピクセルに基づき検出され得る。そのようなスーパーピクセルは、スーパーピクセル棚特徴ではなく、色が類似しておらず、及び/又は、特定の認識された製品に関連する。ベイ境界の検索は、全ての棚に適用される画像ごとの単一の境界に制限されてよい(例えば、検索は、単一の垂直ベイ境界についてであってよい。)。一実施形態において、4つの辺を持つポリゴン又は平行四辺形は、棚を表すために使用され得る。
様々な実施形態において、選択された棚の境界内にある幾つかのスーパーピクセルは、棚の部分としてラベルを付されることから除外されてよい。例えば、棚の仮定のスーパーピクセルにおいて特定の製品の認識から何らかのインライアが存在する場合に、それらのスーパーピクセルは、棚に一致しないものとして扱われ得る。それらのスーパーピクセルは、棚エッジを塞ぐ棚エッジの前にあるオブジェクトからであると期待される。それらのスーパーピクセルの領域は結合されてよく、棚の境界を表すポリゴンは、それらの領域を除外するものとして決定され得る。幾つかの実施形態では、GrabCutなどの画像セグメンテーション方法は、棚の仮定によるスーパーピクセルを前景(仮定からのスーパーピクセル棚特徴であり且つ別な方法で可能であるスーパーピクセルについての特定の前景)として、そして、上下にある隣接サブピクセルを(特定の)背景として、初期化され得る。GrabCutは、次いで、棚と一致しない棚の仮定におけるスーパーピクセルを見つけるために使用され得る。
712で、棚/ラベル検出モジュール205は、棚の仮定においてラベル及び値段を検出する。ラベル検出は、図13に関連して更に詳細に以下で記載される。値段を検出するよう、棚/ラベル検出モジュール205は、光学文字認識(OCR;Optical Character Recognition)により画像から値段を抽出する。画像から値段を抽出するためのアルゴリズムの例は、以下で記載される:
幾つかの実施形態では、棚/ラベル検出モジュール205は、複数の閾値を使用し、複数のテキスト片(例えば、ラベル上の値段)に対応する領域に対して複数回OCRを実行してよい。このOCRは、同じテキストについて複数のOCR結果をしばしばもたらす。このようなことが起こる場合に、最良のOCR結果(例えば、最も高い信頼を伴う結果)が見つけられ、その後の処理において使用される。論理的に、最良のOCR結果を選択することは、棚/ラベル検出モジュール205が同じテキストについて複数のOCR結果を生成しない場合は不要である。
図25は、画像から値段を抽出するための方法の一例のフロー図である。2502で、棚/ラベル検出モジュール205は、既知の公の及び/又は独自仕様のテキスト検出方法により画像においてテキストを検出する。ステップ2504で、棚/ラベル検出モジュール205は、テキストを認識し、テキスト画像を、既知の公の及び/又は独自仕様のOCR方法によりシンボリックテキストに変換する。
OCR方法は、印刷されたテキストを伴う画像をシンボリックテキストに変換する。幾つかの実施形態では、OCR方法は、文書レイアウト解析、シーンテキスト検出、及び/又は同様の前処理ステップを実行して、認識のためのバイナリ画像を生成してよい。文書レイアウト解析は、テキスト、写真、グラフィクス、及び他のコンテンツを含む文書(例えば、新聞、雑誌、等)において、例えば表題、段組等のようなテキストを識別する。シーンテキスト検出は、テキストを見つけるよう画像を解析することを含んでよい。例えば、画像は、テキストを含むオブジェクト(例えば、製品箱/コンテナ、棚ラベル、等)を含んでよい。シーンテキスト検出は、OCRのためのバイナリ画像を生成するよう、複数の色を有するテキストを同様に扱う。幾つかの実施形態では、OCR方法(例えば、文書レイアウト解析、シーンテキスト検出、又は同様の高度な前処理を含まない方法)は、入力として別個の前処理ステップによって生成されたバイナリ画像をとってよい。一実施形態において、GrabCutは、OCRへの入力のために画像領域を2値化するために使用される。
OCRソフトウェアは、通常は、印刷されたテキストの良質の画像(例えば、高分解能、高コントラスト、良好なフォーカス、無モーションブラー、一様な輝度、等)において正確である。しかし、例えば店舗の棚などのシーン画像は、解像度がテキストのサイズに対して低く、コントラストが低く、且つ、例えば、フォーカスの悪さや動きに起因したブラー及び照明に起因したグレアなどの画像劣化を含み得る、より品質が低い画像を含む。店舗の棚の典型的な画像は、多種多様の色において大量のシーンテキストを有する。そのような画像はまた、テキストではないがテキストの低水準の特徴を共有し得る(例えば、ストロークから成ってよい。)大量のグラフィクス又はラインアート(バーコード、ロゴ、等)を更に有する。
店舗の棚の画像に対して既存のシーンテキスト検出ソフトウェアを用いることは、例えば値札上の値段等のテキストを見つけることができないことがある。テキストを見つける機会を増やすよう、棚/ラベル検出モジュール205は、シーンテキスト検出を、棚又は棚の仮定に対応すると決定される(ここでは別なところで記載される。)画像内の領域に制限される。
2506で、ラベル/棚検出モジュール205は、認識されたテキストに対して後処理を実行してよい。低解像度、ブラー及び/又は他の劣化に起因して、OCRは、店舗の棚の画像において、例えば“S”、“5”及び“$”といった類似した文字を正確に区別することができないことがある。値段検出のためにそのような文字を区別するよう、ラベル/棚検出モジュール205は、OCRのために認められる文字を、例えば、“$.0123456789”に制限してよく、例えば字(letter(s))などの他の文字は除外される。幾つかの値札は、OCRソフトウェアが扱わないセント記号(“¢”)のような文字を含むことがある。代わりに、OCRは、扱われない文字を何らかの代替の文字と混同(例えば、“¢”を“c”と混同)することがあり、故に、許容される文字として、代替の実施は、代替の文字、例えば“$c.0123456789”を含んでよい。
正規表現又は他のパターンは、期待される文字列を定義することができる。例となる正規表現は、“$”から始まって、1つ以上の数字と小数点とを有し、2つの数字で終わる文字列に適合する“^\$\d+\.\d\d$”である。他の例となる正規表現は、数字から始まって、任意に2番目の数字を有し、“c”又は“¢”で終わる文字列に適合する“^\d\d?c$”である。幾つかのOCR方法は、認識に役立つよう、期待される文字列を使用することへの支援を含んでよい。さもなければ、棚/ラベル検出モジュール205は、期待される文字列を後処理ステップとして適用してよい。棚/ラベル検出モジュール205は、従って、期待されるパターンに適合しないOCR出力を拒絶してよい。
同様に、OCR方法は、夫々の文字について代替の認識を提供してよく、棚/ラベル検出モジュール205は、期待されるパターンに適合する結果を選択し、そして、代替物のいずれも適合しない場合にのみ認識を拒絶するために、後処理を使用してよい。幾つかの実施形態において、OCR方法は、代替の認識のためにスコア又はコンフィデンス値を提供し、棚/ラベル検出モジュール205は、最も高いスコア又はコンフィデンス値との一致を選択してよい。
幾つかの実施形態では、棚/ラベル検出モジュール205は、値段テキストを特定するよう、文字境界ボックス内にある他の文字に対する文字の位置を使用することができる。例えば、ラベルが、他の文字(例えば、値段における上付文字)とは異なった位置に“$”又は“¢”文字を含む場合に、文字境界ボックス位置は、値段を他のテキストと区別するために使用され得る。
加えて、棚/ラベル検出モジュール205によって実行される後処理は、テキスト認識の間に落とされた文字を補正することができる(例えば、小数点“.”が落とされ、OCRがそれらの位置でワードブレイク(word break)を返す場合)。例えば、棚/ラベル検出モジュール205によって実行される後処理ステップは、落とされた文字について代替物を生成し、パターンマッチングを使用してその代替物の適切な文字を決定し、落とされた文字を置換することができる。
上記の方法の例において示されるように、キャッシングは任意に使用されてよく、それにより、テキスト決定及びOCRは、同じ棚の仮定について1回より多く実行されない。例えば、個々の棚についての同じ仮定は、幾つかの値段を見つけるための最初の検出と、更なる値段を見つけるよう試みるための後の検出との両方に使用されてよい。棚の仮定についてのラインの座標は、キャッシュキーとして使用され得る。
幾つかの棚の候補は、画像の上下で画像の外に広がってよい。そのような棚の候補は、クリッピングされた画像領域を生成してテキスト検出へ入力するよう、画像の限界までクリッピングされてよい。OCR方法は、通常は、テキストを検出するための最低限の解像度を有する。これは、クリッピングされた領域についての最小サイズを示唆する。最小サイズよりも小さい領域は、テキスト検出又はOCRを実行する必要なしに抽出可能なテキストを有さないと推定され得る。例えば、10ピクセルに満たない高さの領域は、抽出可能なテキストを有さないと推定される。通常は、高さが小さい画像の上又は下にある棚の候補のみが極めて小さい。
値段又はラベルが検出されると、棚/ラベル検出モジュール205は、ラベル及び/又は値段の位置を確かめるよう、画像において検出された適合する値段及びラベルを特定する。値段は、その値段がラベルと重なり合い、且つ、重なり合いの高さが少なくとも値段の高さの半分であり、重なり合いの幅が少なくとも値段の幅の半分である場合に、ラベルに適合する。幾つかの実施形態では、値段の周りの境界ボックスの高さ及び幅は、値段の高さ及び幅を決定するために使用される。
幾つかの実施形態では、ラベルが直ぐそばにある場合に、複数のラベルは、個別の別々のラベルではなく、結合されたラベル領域として検出されてよい。単一のラベル領域において水平に可分である複数の値段が存在する場合に、棚/ラベル検出モジュール205は、そのラベル領域を分割する。一実施形態において、棚/ラベル検出モジュールは、結合されたラベル領域を、ラベル検出から決定されたラベルのメジアン幅に基づき、別々のラベルに分割する。他の実施形態では、棚/ラベル検出モジュール205は、結合されたラベル領域を、値段境界ボックスの位置及び/又はサイズに基づき分割する。
一実施形態において、外観に基づき棚の位置を評価すること及びコンテクストに基づき棚の位置を評価することは、1つ以上の仮定を検討から外すことを有する。これは、減じられた数の仮定に対してのみラベル検出を実行することによって、必要とされる全体の計算の量を低減するのに有利である。他の実施形態では、ラベル検出は、検討から仮定を外す前に仮定に対して実行される。
714で、棚/ラベル検出モジュール205は、外観に基づく棚位置の仮定と、コンテクストに基づく棚位置の仮定と、ラベル及び値段検出とからの情報を用いて、最良の棚及びラベルの位置を選択する。一実施形態において、最良の位置は、見つけられたラベル及び値段の数、見つけられた棚の数、及びスコア(幾つかの実施形態について重要度のその順序における。)に基づき、選択される。他の実施形態では、仮定のグループは、上述されたように、幅及び/又はスーパーピクセル棚特徴ヒストグラムに基づき、まとめて考えられる。他の実施形態では、例えば決定木学習、ブースティング、ランダム木、又はSVM(Support Vector Machine)等の機械学習方法が、位置を選択するために使用される。
図26は、表において棚の仮定の例を表す。表は、例えば、データストレージ243において記憶されてよい。表中の各行は仮定である。夫々の仮定は、上限ビン値及び下限ビン値によって記載される。他の表中の列は、ビンにおける幅、ラベル検出により見つけられたラベルの数、スコア(スーパーピクセル棚特徴に基づく。)、この仮定についてのスーパーピクセル棚特徴の1乃至5の色インデックス、スーパーピクセル棚特徴の輝度又はグレースケール値、及びフェイシングの下での検索からのフェイシング情報がこの仮定を生成するために使用されたか否かである。別個の棚であるにはあまりにも直ぐそばにある仮定のグループは、黒い太線によって分けられている(例えば、グループごとに1つの棚がある。)夫々のグループについて、最良の仮定として選択された仮定は、(背景を影付きとすることで)ハイライト表示されている。それら4つの最良の仮定は、4つの検出された棚に対応する。
全ての棚が上記の方法により画像において見つけられるわけではないことが可能であり得る。棚/ラベル検出モジュール205は、更なる棚/ラベル検出に役立つよう棚及びラベルモデルを生成することによって、以前に見逃された棚を見つけるよう試みてよい。716で、棚/ラベル検出モジュールは、714からの最良の棚位置に基づき棚外観についてのモデルを生成する。一実施形態において、棚モデルは、棚の最前部の厚さの推定値である1つの幾何パラメータを有する。推定値は、以前に検出された棚の平均厚さである。他の実施形態では、棚モデルは、更なる幾何又は色パラメータを含んでよい。
718で、棚/ラベル検出モジュール205は、714からの最良の棚位置に基づきラベル外観についてのモデルを生成する。一実施形態において、ラベルモデルは、幾何パラメータ及び色パラメータの両方を含んでよい。1つの幾何パラメータは、例えば、ラベル及び値段検出712の間に決定されたラベルの幅の推定値であってよい。ラベルモデルにおける更なる幾何パラメータは、例えば、値段テキストと棚/ラベルエッジとの間の垂直マージンを含んでよい。
色パラメータは、ラベルの色についてのガウス混合モデル(GMM)、このGMMに関連する確率閾値、及び以前に検出されたラベルがこのGMMと如何にして適合するのかの例を含んでよい。幾つかの実施形態では、ラベルモデルは、例えば“ラベルは赤及び白であるか、あるいは、ラベルは青及び緑である”といった、ラベルについてのドミナント色の間のAND−OR関係を学習し表すことができる。ラベルの色は、ラベル検出712によって特定されたラベル領域におけるスーパーピクセルの平均色であってよい。例えば、それらのラベルの色について計算されたGMMは、3要素平均ベクトル及び3×3の共分散行列を夫々が有する5つのコンポーネントを含んでよい。
一実施形態において、確率閾値は、GMMを用いてラベルの色の確率を計算することによって決定される。例えば、25%のパーセンタイル確率は、閾値として使用されてよい(例えば、ラベルの色の確率の25%以上且つそれらの確率の75%未満である確率)。
GMMにおける検出されたラベルの一致の標本は、夫々の検出されたラベルについてのラベルの色のヒストグラム、バッグ又はマルチセットを計算することによって決定される。夫々のヒストグラムビン(又は同等にバッグ要素若しくはマルチセット要素)は、GMMコンポーネントインデックスのうちの1つ(通常は、5つのインデックスのうちの1つ)に対応する。夫々のビンのカウント(又は要素のカウント)は、GMMによってそのGMMコンポーネントへ割り当てられているラベルの色の数である。割り当てのガウス確率は、閾値よりも大きいか又はそれと等しい。一実施形態において、夫々の検出されたラベルの標本は、1回よりも多く現れる全てのGMMインデックスの中の最も頻度が高いGMMインデックス(例えば、最大で3つ)の組によって要約される。代替の実施形態では、同様の要約が使用されてよく、あるいは、ヒストグラム(又はバッグ/マルチセット)が要約の代わりに直接使用されてよい。
一実施形態において、同じラベルの色は、閾値の確率を計算する目的で且つ標本を計算する目的で、GMMを構築するために使用される。代替の実施形態では、それらのラベルの色は、異なったラベルの色がそれらの目的のために使用されるように分割されてよい。
720で、棚/ラベル検出モジュール205は、棚及びラベルの外観についてのモデルに基づき、可能な棚の位置のコンテクスト及び特徴を用いて、外観に基づく可能な棚の位置を更新する。長い水平ラインセグメントは、時々、棚のエッジを示す。一実施形態において、棚/ラベル検出モジュール205は、如何なる棚の仮定にも近くなく且つ可能な棚の位置(704から)の角度に適合する長い水平ラインセグメントを特定してよい。そのような長い水平ラインセグメントは、以前に検出されていなかった棚のエッジに対応してよい。棚/ラベル検出モジュール205は、更なる棚の仮定を生成するよう、棚が特定された水平ラインの上又は下のいずれに現れるのかを特定しようと試みる。加えて、棚/ラベル検出モジュール205は、特徴(例えば、スーパーピクセル棚特徴)が棚の仮定内にない位置を確認して、更なる棚の仮定を生成するよう、棚が特徴の上又は下のいずれに現れるのかを判定する。
棚/ラベル検出モジュール205は、棚の存在を探すために棚モデル(例えば、棚の厚みの推定値)を使用してよい。水平ライン又は他の特徴の上下を探すアルゴリズムの例は、以下で記載される:
棚/ラベル検出モジュール205がいずれかの仮定(例えば、特徴の上との仮定及び特徴の下との仮定)について値段又はラベルを見つける場合に、より多くの数の値段又はラベルを伴う仮定が、検出された棚の仮定として返される。棚/ラベル検出モジュール205がいずれの仮定についても値段又はラベルを見つけられない場合に、仮定は棚に対応せず、結果は返されない。
722で、棚/ラベル検出モジュール205は、更新された棚の位置の仮定に基づき棚の境界を決定する。棚/ラベル検出モジュール205は、710を参照して上述された方法と同様にしてここで棚の境界を決定する。
724で、棚/ラベル検出モジュール205は、ラベルモデルに基づきラベル及び値段を検出する。棚/ラベル検出モジュール205は、図13を参照して記載されるように、値段を抽出(し、次いで、値段がラベル上にあることを確認)することによって、ラベル及び値段を検出する。任意に、値段が抽出され得ないラベルの位置は、ラベル検出、如何なる以前に検出されラベルも除外すること、次いで、仮定の中から選ぶようラベルをバリデートすることによって、決定される。726で、棚/ラベル検出モジュール205は、714を参照して上述されたように最終の棚及びラベルの位置を選ぶ。
図13は、リアログラム画像において表されている棚の最前部におけるラベルの位置を検出及び決定するための方法604の一例のフロー図である。1302で、棚/ラベル検出モジュール205は、上述されたように、棚に関連したスーパーピクセルを特定する。1304で、棚/ラベル検出モジュール205は、棚のスーパーピクセルを色によってクラスタに量子化する。例えば、一実施形態において、棚/ラベル検出モジュール205は、棚のスーパーピクセルを、k平均クラスタリングにより、5つのクラスタにクラスタ化する。当然ながら、様々な数のクラスタ又はクラスタリングアルゴリズムが棚のスーパーピクセルをクラスタ化するために使用されてよい。図14Aは、棚のスーパーピクセルのクラスタを表すために番号を付けられたスーパーピクセルを重ね合わされたリアログラムの例の一部を表す。
図13の例に戻ると、1306で、棚/ラベル検出モジュール205は、任意に、ラベルに対応する可能性があるクラスタを決定する。例えば、棚/ラベル検出モジュール205は、ラベルに対応する可能性があるクラスタとして、スーパーピクセルが最も少ない(例えば、一番人気がない色を有する。)クラスタを特定する。一実施形態において、棚/ラベル検出モジュール205は、スーパーピクセルが最も少ない3つのクラスタを特定する。図14Bは、棚のスーパーピクセルを表すために番号を付けられたスーパーピクセルを重ね合わされたリアログラムの例の一部を表す。図14Bの例では、クラスタ1は最多のスーパーピクセル(例えば、最も人気のある色)を含み、クラスタ2、4及び5は最少のスーパーピクセルを含む。
同様に、棚/ラベル検出モジュール205は、棚のスーパーピクセルであって、それらの境界内に完全に含まれている非水平ラインを有するスーパーピクセルを特定する。一実施形態において、モジュール205は、LSD結果(上記)を使用することによってこれを行う。非水平ラインは、そのようなラインが棚のラベル上に印刷された数字及び/又はバーコードにしばしば対応することから、ラベルの部分である可能性があるスーパーピクセルを特定するために使用され得る。一実施形態において、棚/ラベル検出モジュール205は、非水平ラインを有する最多のスーパーピクセルを含む3つのクラスタを特定する。図14Bの例では、クラスタ3、4及び5が、非水平ラインを有する最多のスーパーピクセルを含む。
1308で、棚/ラベル検出モジュール205は、クラスタに基づきラベルの位置の仮定を形成する。一実施形態において、棚/ラベル検出モジュール205は、1つ以上のクラスタにおいて隣接したスーパーピクセルの接続されたコンポーネントを見つけることによって、クラスタに基づきラベルの位置の仮定を形成する。
他の実施形態では、棚/ラベル検出モジュール205は、最少のスーパーピクセルを有する色クラスタ及び最多の非水平ラインを有するクラスタの両方(例えば、それらのクラスタの共通集合)にある棚のスーパーピクセルを決定して、ラベルの位置の仮定を形成する。図15は、最少のスーパーピクセルを有するスーパーピクセルのクラスタと最多の非水平ラインを有するスーパーピクセルのクラスタとの間の共通集合を表す例図である。図15の例では、色に基づき最少のスーパーピクセルを有するクラスタのグループは、C3とラベルを付されており、最多の非水平ラインを有するクラスタのグループは、M3とラベルを付されている。図15から明らかなように、クラスタ5及び4は、それら2つのグループの共通集合内にある。棚/ラベル検出モジュール205は、この共通集合を使用して、ラベル特徴を含むクラスタについての仮定を決定する。例えば、モジュール205は、クラスタ4に含まれるスーパーピクセルが存在する領域、クラスタ5に含まれるスーパーピクセルが存在する領域、並びにクラスタ4及びクラスタ5の両方に含まれるスーパーピクセルが存在する領域の仮定をテストしてよい。他の実施形態では、まさに記載されたように第1の組の仮定を生成することに加えて、棚/ラベル検出モジュール205は、最少のスーパーピクセルを有するクラスタにも最多の非水平ラインを有するクラスタにもないクラスタを用いて第2の組の仮定を更に生成する。以下で記載される、ラベルの仮定をバリデートしようとする試みは、最初に第1の組に対して実行され得る。そして、ラベルが見つけられない場合は、バリデーションは第2の組に対して実行され得る。他の実施形態では、色の人気の基準及び/又は非水平ラインの基準は、1つ以上の他の既存の公の及び/又は独自仕様の画像特徴抽出アルゴリズムによって置き換えられ得る。
1310で、棚/ラベル検出モジュール205は、ラベルモデルが存在するかどうかを判定する。ラベルモデルが存在する場合は、1312で、棚/ラベル検出モジュールは、モデルに適合するコンポーネントを見つける。例えば、棚/ラベル検出モジュール205は、モデルに含まれるGMMラベル色に適合するスーパーピクセルを決定する。スーパーピクセルがGMMに適合しない場合は、接続されているコンポーネントはモデルに適合しない。他の例では、接続されたコンポーネントの幅がラベルよりも大きい(例えば、その幅は、モデルに含まれる1.5×メジアンラベル幅よりも大きい)場合、且つ、接続されたコンポーネントにおける全ての位置でメジアンラベル幅の半分内に適合するスーパーピクセルがない場合、接続されたコンポーネントはモデルに適合しない。
1314で、棚/ラベル検出モジュール205は、ラベルモデルからメジアン幅を読み出し、1320で、以下で更に詳細に記載されるように、メジアン幅に近いラベル候補(例えば、モデルに適合するコンポーネントを有する仮定のラベル位置)を決定する。一実施形態において、棚/ラベル検出モジュール205は、メジアン幅の整数倍に近いラベル候補を決定する。
ラベルモデルが存在しない場合は、棚/ラベル検出モジュール205は、1316で、1つよりも多いスーパーピクセルを有する画像内のコンポーネントを見つけ、1318で、選択されたコンポーネントに基づきメジアン幅を決定する。1320で、棚/ラベル検出モジュール205は、メジアン幅に近いラベル候補を決定する。
図16は、棚のスーパーピクセルのクラスタを表すために番号を付けられたスーパーピクセルの接続されたコンポーネントを重ね合わされ且つ仮定のラベルの位置を示すリアログラムの例の一部を表す。1322で、棚/ラベル検出モジュール205は、最良のラベル仮定を選ぶ。例えば、棚/ラベル検出モジュール205は、夫々の幅とメジアンとの間の差を計算して閾値(例えば、10又はメジアンの半分の小さい方)と比較し、どれだけの検出されたラベルが同じ幅であるのか及び幾つが閾範囲内に入らないかに基づき夫々の仮定にスコアを付け、最も高いスコアを有する仮定を選択し、棚の最前部に沿って同様の幅を有する少なくとも閾数(例えば、5)の隣接しないラベルが存在することを確認することによって、最良のラベル仮定を決定する。任意に、スーパーピクセルのメジアン幅の2倍よりも幅が大きくないラベル仮定は、拒絶される。任意に、閾量(例えば、メジアン幅の50%)だけメジアン幅よりも大きいラベル仮定は、複数のラベルであると見なされる。任意に、複数のラベルについての仮定は、単一のラベルについての仮定に分割される。任意に、同様の(重なり合った)仮定について、ラベル検出は、仮定の幾つかに対してのみ実行される。例えば、ラベル検出は、スコアが高い方から低い方へといった順序で、前の仮定が重複する(例えば、上部と下部との間の差がスーパーピクセルのメジアン高さの半分に満たない)か又は以前に検出されたラベルが重複する如何なる仮定もスキップしながら、仮定に対して実行される。
棚/ラベル検出モジュール205は、色及び幾何パラメータに基づき、選択されたラベル仮定をバリデートする。例えば、棚/ラベル検出モジュール205は、ラベル仮定について境界ボックスを生成し、境界ボックスの幅をモデルのラベル幅まで広げ、境界ボックス内のスーパーピクセルがモデルに適合するかどうかを判定し、スーパーピクセルがモデルに適合する場合に境界ボックスをラベルとして加えてよい。スーパーピクセルがラベルモデルに適合するかどうかを判定するよう、スーパーピクセルの平均色のヒストグラム(又はバッグ若しくはマルチセット)は、ラベルモデルを構築するために使用されたのと同様にして計算される。いずれかの標本が適合する場合に、スーパーピクセルはラベルモデルに適合する。例えば、標本は、仮定からのインデックスの組がモデル標本におけるインデックスの組と同じである場合にモデルに適合する。照合のためにヒストグラムを使用する代替の実施では、ヒストグラム比較計算は、適合を決定するために使用されてよい。
一実施形態において、幾何パラメータに基づくバリデーションは、棚/ラベルの垂直位置に対するテキスト垂直位置を制限するパラメータを特定することを含む。例えば、ラベルモデルは、棚/ラベルの上部と値段の上部との間の期待されるマージンと、値段の下部と棚/ラベルの下部との間の期待されるマージンとを特定するパラメータを含んでよい。スケールと無関係であるよう、マージンパラメータは、値段テキストの高さに正規化される。一実施形態において、マージンは、実際のマージンが期待されるマージンのテキストの高さ内にある場合に適合する。例となる棚及びラベルについて、上側マージンは、テキストの高さであり、下側マージングはテキスト高さの2倍である。
他の実施形態では、ラベル仮定をバリデートすることは、既存の公の及び/又は独自仕様のテキスト検出アルゴリズムを使用し、テキストが検出されなかった仮定を拒絶することを含む。他の実施形態では、ラベル仮定をバリデートすることは、既存の公の及び/又は独自仕様のテキスト認識(OCR)アルゴリズムを使用し、テキストが認識されなかった仮定を拒絶することを含む。他の実施形態では、ラベル仮定をバリデートすることは、ラベルを認識するようトレーニングされた既存の公の及び/又は独自仕様のオブジェクト認識又は検出アルゴリズム(例えば、テンプレートがラベルから学習されるテンプレートマッチング)を使用し、オブジェクトが認識又は検出されなかった仮定を拒絶することを含む。
幾つかの実施形態では、同じシーンの複数の重なり合った画像は、リアログラム解析アプリケーションによって受け取られ、リアログラム解析において使用されてよい。画像間の幾何学的関係は、既存の公の及び/又は独自仕様のスティッチング・アルゴリズムを用いて決定される。ラベル検出は複数の画像に対して実行される。ラベルの位置の仮定は、複数の重なり合った画像を結合するために使用されるスティッチング・アルゴリズムによって決定される座標系に変換される。一実施形態において、重なりを伴った画像領域におけるラベル仮定のバリデーションは、複数の画像における対応する位置においてラベル仮定が存在するかどうかを判定することを含む。
幾つかの実施形態において、ラベル検出は、同じ画像内の異なった棚仮定に対して、あるいは、異なった重なり合った画像に対して、複数回実行される。最初の回の後、ラベル検出は、新たに推定される幅を計算することに代えて、前の回からで推定された幅(例えば、仮定のメジアン幅)を使用してよい。
幾つかの実施形態において、複数の重なり合った画像にあるラベル位置について、夫々の画像内の夫々の重なり合ったラベル領域における画像品質が評価される。評価は、ラベルが検出されるサブ画像全体に対して、又はラベルが検出される場所を中心としたサブ画像に対してであってよい。一実施形態において、領域のコントラストは、高いコントラストは高い品質を示すものとして評価される。他の実施形態では、領域のシャープネスは、高いシャープネスは高い品質を示すものとして評価される。他の実施形態では、スペクトル反射は、低いスペクトル反射は高い品質を示すものとして評価される。夫々のラベル領域について、最も高い品質の領域は、更なる解析のために及び/又はユーザへの表示のために使用される。代替的に、十分に品質が高いと判断された全ての領域は、更なる解析のために使用される。例えば、ある領域について0..255グレースケール値を考えると、最も暗いピクセルが128に満たない場合は、領域は十分な品質を備えると判断される。複数の重なり合った画像からの1つ以上の最も高い品質の領域の使用は、不拡散照明が1つの画像における特定のラベルに対してスペクトル反射を引き起こすが他の画像では引き起こさない場合に有利である。
幾つかの実施形態では、ラベルが検出された後、ラベルからの情報(例えば、値段、UCPコード、製品名、等)が抽出される。情報は、OCR、バーコード読み取りソフトウェア、又は他の同様の既存の公の及び/若しくは独自仕様のアルゴリズムを用いて抽出される。ラベル検出は、ラベルの要素(例えば、値段、バーコード、製品名、等)を見つけ、1つ以上の特定の要素を露出し、1つ以上の特定の要素における情報を抽出することを含んでよい。一実施形態において、情報は、クラウドソーシングを使用することを含め、人々によって抽出されてよい。
図17は、整理されたオブジェクトの画像において特定のオブジェクトの複数個の存在及び位置を決定するための方法606の一例のフロー図である。画像内の特定のオブジェクトの複数個(特に、オブジェクト認識モジュールによって認識されないオブジェクト)は、リアログラム解析アプリケーション103が、オブジェクト認識モジュールによって使用される画像検索データベースにおいてインデックスを付されていない製品を含む領域を決定し、様々なインデックス無し製品を区別することを助けるために使用され得る。1701で、マルチプルスモジュール209は、複数の整理されたオブジェクトの画像を受け取る。上述されたように、画像は、小売り棚又はディスプレイのリアログラム画像であってよい。
1702で、マルチプルスモジュール209は、整理されたオブジェクトの画像から特徴を抽出する。様々な既知の特徴抽出アルゴリズムが、画像特徴を抽出するために用いられてよい。1704で、マルチプルスモジュール209は、画像内の一致する特徴点を見つける。例えば、マルチプルスモジュール209は、画像において特徴点を照合するために、FLANN、又はKDD−ツリーアルゴリズムを使用してよい。一実施形態において、マルチプルスモジュールは、k>2として、k最近傍点アルゴリズムを用いて記述子ベクトルを照合する。一実施形態において、照合が24個の良好な一致をもたらすように、k=25である。
一実施形態において、マルチプルスモジュール209は、良好な一致(複数の一致を可能にするもの)を選択する。図18は、画像内の複数の一致する点についての記述子距離の棒グラフの例を表す。ここで使用される記述子距離は、2つの特徴点がどの程度類似しているのかを示すものであり、より小さい距離は、より類似した特徴を意味する。D1,D2,...,D8は、昇順での特定の特徴点と全ての特徴点との間の距離である。図18の例では、棒グラフは、8つの最小距離しか表さないが、記述子距離は幾つでも解析において使用されてよいことが認識されるであろう。D1,D2,...,D8にわたる棒の高さは距離を表す。同じ画像において一致する場合に、特徴点は常に0距離によりそれ自身と一致するから、D1は常に0であり、無視される。D2は、それ自身との一致(D1)を無視する最小の距離(例えば、最良の一致)である。D2及びD4がD2に近く、D5はD2よりもずっと大きいから、良好な一致はD2、D3及びD4である(例えば、インデックスjは2、3又は4である。)。D2に近いことは、閾値1/β×D2を用いて決定される。D2よりもずっと大きいことは、閾値1/α×D2を用いて決定される。それらの閾値について、0<α<β<1。一実施形態において、αは0.667であり、βは0.800である。1/β×D2と1/α×D2との間に距離がなく、少なくとも1つの距離は1/αかけるD2よりも大きい場合は、D2及び1/β×D2に満たない全ての他の距離は良好な一致に対応する。そうでない場合は、良好な一致は存在しない。
1706で、マルチプルスモジュール209は、一致する特徴点を、点間の一致する距離及び角度によりクラスタ化する。一実施形態において、全てのクラスタは少なくとも閾数の対(例えば、10)を含み、クラスタベクトル間の距離(例えば、L1又はL2距離)は閾値(例えば、20又は32)よりも小さい。幾つかの実施形態では、クラスタを見つけるために効率的な緻密な検索を実行することが有利である。一実施形態において、第1のクラスタリングステップは、点をギロチンカット(例えば、ベクトルのX又はY座標の1つに基づき点をクラスタに孤立的に分割することによって分けること)により少なくとも距離閾値だけ分けられているクラスタに分け、次いで、例えばk平均などの既存の公の又は独自仕様のクラスタリング方法を第1のステップからの各クラスタにおいて使用する第2のクラスタリングステップを使用する。一実施形態において、k平均クラスタリングは、kの複数の値とともに使用され、2から始まって、閾値よりも大きい距離を持ったベクトルを有する前の使用によるクラスタの数だけ増大させ、全てのクラスタが対の閾数よりも小さいか又は閾値よりも小さい距離を持ったベクトルを有する場合(あるいは、クラスタの最大数(例えば、200)又は繰り返しの最大数(例えば、20)が達成される場合)に終わる。一実施形態において、kクラスタリングの後、クラスタは、結果として得られるクラスタが、距離閾値に満たないベクトル間距離を有する場合に、マージされる。
特徴点対の結果として得られるクラスタは、リアログラム画像における類似したオブジェクト間の一致する点を表す。1708で、マルチプルスモジュール209は、クラスタ情報を用いてスーパーピクセルにラベルを付す。例えば、マルチプルスモジュール209は、クラスタにおける夫々の特徴点対について、特徴点を含むスーパーピクセルの対応する対を特定し、スーパーピクセル対についてのカウントをインクリメントする。少なくとも1つの対の部分である夫々のスーパーピクセルについて、マルチプルスモジュール209は、そのカウント及び一致が見つけられるスーパーピクセルの識別子を用いて、任意にクラスタベクトル及び特徴点を用いて、スーパーピクセルにラベルを付す。
ラベルを付されたスーパーピクセルを用いて、マルチプルスモジュール209は、1710で、クラスタに基づき複数の同一オブジェクト、例えば、同様の寸法の同一オブジェクトの積み重ねを見つける。図19Aは、同じ高さのアイテムの積み重ねの例図を表す。一実施形態において、同じ高さのアイテムの積み重ねを見つけるよう、マルチプルスモジュール209は、一致間のメジアン垂直距離(図19Aの例ではdとして示される。)を決定し、様々な一致の範囲及び距離に基づき積み重ねにおけるオブジェクトの最大数を見つけ、高さdを用いて積み重ねにおけるオブジェクトのその数について座標を決定し、同じ製品の積み重ねの数(例えば、図19Aの例ではd1及びd2)を決定する。図19Bは、リアログラム画像においてマルチプルスモジュールによって同じように特定されるインデックス無しオブジェクトの積み重ね(破線境界ボックスによって示される。)を識別する境界ボックス1904を重ね合わされたリアログラムの例の一部を表す。
以下は、積み重ねを特定するための例となるアルゴリズムである:
図20は、棚の最前部及び製品から棚の背景を分割するために例えばGrabCutなどのセグメンテーションアルゴリズムを使用することによってリアログラム画像において棚の下の空きスペースを見つけるための方法608の一例のフロー図である。2002で、空きスペースモジュール207は、例えば、棚の直ぐ下にある(更に、認識された製品の境界ボックスにない)最も暗いスーパーピクセルを選ぶことによって、棚の下の空きスペースを特定する。図21Aは、セグメンテーションアルゴリズムによってセグメント化された“品切れ”領域及び“他”領域を特定するリアログラムの例の一部を表す。2004で、空きスペースモジュール207は、2002で特定され且つオブジェクト認識モジュール201及び棚/ラベル検出モジュール205によって特定されたスーパーピクセルにより“品切れ”領域及び“他”領域に対してセグメンテーションアルゴリズムをシードする。例えば、図21Bの例で表されるように、空きスペースモジュール207は、“品切れ”スーパーピクセルを有する棚の直ぐ下にある暗ピクセルと、“他”スーパーピクセルを有する棚の最前部及び認識されたオブジェクトの境界ボックスによって特定される領域とをシードする。図22は、スーパーピクセルをシードされた“品切れ”領域及び“他”領域を特定するリアログラムの例の一部を表す。図22の例では、ラベルを付されていないスーパーピクセルは分類されておらず、1によりラベルを付されたスーパーピクセルは“品切れ”領域であり、2によりラベルを付されたスーパーピクセルは特定の又は起こり得る“他”領域である。
2006で、空きスペースモジュールは、“品切れ”領域の特定を精緻化するよう、スーパーピクセルをシードされたリアログラム画像にわたって、例えばGrabCutなどの画像セグメンテーションアルゴリズムを繰り返す。GrabCutは、既知及び起こり得るものとして分類されたスーパーピクセルから選択される色により前景及び背景ガウス混合モデルを生成する。未知のスーパーピクセルは、最初は無視される。GMMを用いる手、空きスペースモジュール207は、未知のスーパーピクセルをおそらく“品切れ”又は“他”であろうと分類する。加えて、空きスペースモジュール207は、幾つかの起こり得るスーパーピクセルを再分類する。新しいGMMは、再割り当てされたスーパーピクセルに基づき計算され、スーパーピクセルは、新しいGMMに基づき再び再分類される。空きスペースモジュール207は、満足のいく結果を達成するためにこの繰り返しを複数回反復してよい。一実施形態において、空きスペースモジュール207は、満足のいく結果を達成するために10回の繰り返しを実行する。図23A及び23Bは、夫々セグメンテーションアルゴリズムの1回の繰り返し及び10回の繰り返しの後に品切れ領域及び多量域を示すスーパーピクセルを重ね合わされたリアログラムの例を表す。
満足のいく結果が達成された後、空きスペースモジュール207は、オブジェクト認識結果、棚、及びセグメンテーションの繰り返し後に残っている“品切れ”領域を全体の領域から減じて、図24の例で表されるような、潜在的な未知の製品について接続コンポーネントポリゴン2401を生成してよい。幾つかの実施形態では、空きスペースモジュール207は、ポリゴン2401を最小の既知の製品のサイズと比較し、最小の既知の製品よりも小さいものを除外することによって、未知の製品領域を精緻化してよい。
リアログラムシーン解析のためのシステム及び方法が記載されてきた。前述の記載では、説明を目的として、多数の具体的詳細が、ここで紹介される技術の完全な理解を提供するために説明されている。しかし、当業者に明らかなように、そのような技術は、それらの具体的な詳細によらずとも実施され得る。他の事例では、構造及びデバイスは、記載を不明りょうにしないために且つ理解の簡単のためにブロック図形式で示されている。例えば、技術は、主としてソフトウェア及び特定のハードウェアを参照して先に一実施形態において記載されている。しかし、技術は、データ及びコマンドを受け取り、サービスを提供する如何なるペリフェラルデバイスの部分としても情報を提示することができる如何なるタイプのコンピューティングシステムによっても、実施されてよい。
「一実施形態」又は「実施形態」との明細書中での言及は、その実施形態に関連して記載される特定の機能、構造、又は特性が本明細書の少なくとも1つの実施形態に含まれることを意味する。明細書中の様々な箇所における「一実施形態において」との言い回しの出現は、必ずしも全てが同じ実施形態に言及しているわけではない。
上記の詳細な説明の幾つかの部分は、コンピュータメモリ内のデータビットに対する動作のアルゴリズム及び符号表現に関して与えられている。それらのアルゴリズム的な記述及び表現は、データ処理分野における当業者が自身の研究の内容を他の当業者に最も有効に伝えるために使用する手段である。アルゴリズムは、ここで、且つ、一般的に、所望の結果をもたらすセルフコンシステントな一連のステップであると考えられる。ステップは、物量の物理的な操作を要するものである。通常、必ずしもではないが、そのような量は、記憶され、伝送され、結合され、比較され、別なふうに操作されることが可能な電気的又は磁気的信号の形をとる。主として一般的な使用のために、それらの信号をビット、値、要素、シンボル、文字、項、数、又は同様のものと呼ぶことが都合がよい。
なお、留意されるべき点は、それら及び同様の語の全ては、適切な物理量に関連すべきであり、そのような領域に適用される単に都合のよいラベルにすぎない点である。以下の議論から明らかなように別なふうに具体的に述べられない限りは、本明細書の全体を通して、例えば「処理する(processing)」又は「計算する(computing)」又は「計算する(calculating)」又は「決定する(determining)」又は「表示する(displaying)」又は同様のものなどの語を用いる議論は、コンピュータシステムのレジスタ及びメモリ内の物理(電気)量として表されるデータを操作して、コンピュータシステムメモリ若しくはレジスタ又は他のそのような情報記憶、伝送若しくは表示デバイス内の物理量として同様に表される他のデータへと変換するコンピュータシステム又は同様の電子コンピューティング装置の動作及びプロセスに言及する。
本仕様はまた、ここでの動作を実行するための装置に関係がある。この装置は、必要とされる目的のために特別に構成されてよく、あるいは、それは、コンピュータに記憶されているコンピュータプログラムによって選択的に作動又は再設定される汎用のコンピュータを有してよい。かかるコンピュータプログラムは、例えば、制限なしに、フロッピー(登録商標)ディスク、光ディスク、CD−ROM、及び磁気ディスクを含むあらゆるタイプのディスク、読出専用メモリ(ROM;Read-Only Memory)、ランダムアクセスメモリ(RAM;Random Access Memory)、EPROM、EEPROM、磁気又は光学式カード、不揮発性メモリを備えたUSBキーを含むフラッシュメモリ、あるいは、電子命令を記憶するのに適したあらゆるタイプの媒体等であって、コンピュータシステムバスへ夫々結合されているコンピュータ可読記憶媒体において記憶されてよい。
本明細書は、全体としてハードウェアの実施形態、全体としてソフトウェアの実施形態、又はハードウェア及びソフトウェアの両方の要素を含む実施形態の形をとることができる。一実施形態において、本明細書は、ソフトウェアにおいて実装され、ファームウェア、常駐ソフトウェア、マイクロコード、等を含むがそれらに限られない。
更に、本明細書は、コンピュータ又は何らかの命令実行システムによる使用のために又はそれに関連してプログラムコードを提供するコンピュータ使用可能な又はコンピュータ読出可能な媒体からアクセス可能なコンピュータプログラム製品の形をとることができる。本明細書のために、コンピュータ使用可能な又はコンピュータ読出可能な媒体は、命令実行システム、装置、又はデバイスによる使用のために又はそれに関連してプログラムを含み、記憶し、通信し、伝搬し、又は伝送することができる如何なる装置であることもできる。
プログラムコードを記憶及び/又は実行するのに適したデータプロセッシングシステムは、直接に又はシステムバスを通じて間接的にメモリ素子へ結合された少なくとも1つのプロセッサを含む。メモリ素子は、プログラムの実際の実行の間に用いられる局所メモリと、バルクストレージと、コードが実行中にバルクストレージから取り出されるべき回数を減らすために少なくとも一部のプログラムコードの一時記憶を提供するキャッシュメモリとを含むことができる。
入出力(I/O;Input/Output)デバイス(キーボード、ディスプレイ、ポインティングデバイス、等を含むがそれらに限られない。)は、直接に又は介在するI/Oコントローラを通じてシステムへ結合され得る。
ネットワークアダプタもシステムへ結合されてよく、データプロセッシングシステムが介在するプライベート又はパブリックネットワークを通じて他のデータプロセッシングシステム又は遠隔のプリンタ若しくは記憶デバイスへ結合されるようになることを可能にする。モデム、ケーブルモデム及びEthernet(登録商標)は、ほんの一握りの現在利用可能なタイプのネットワークアダプタである。
最後に、ここで与えられているアルゴリズム及び表示は、如何なる特定のコンピュータ又は他の装置とも本質的に関係がない。様々な汎用のシステムが、ここでの教示に従うプログラムとともに使用されてよく、あるいは、必要とされる方法ステップを実行するためにより特殊化された装置を構成することが都合がよいことがある。様々なそれらのシステムのための必要とされる構造は、以下の記載から明らかであろう。加えて、本明細書は、如何なる特定のプログラミング言語も参照して記載されない。明らかなように、様々なプログラミング言語が、ここで記載される明細書の教示を実施するために使用されてよい。
実施形態の前述の記載は、例示及び説明のために与えられている。それは、包括的であったり、あるいは、開示されている厳密な形態に技術を制限したりするよう意図されない。多くの変更及び変形が上記の教示に照らして可能である。実施形態の適用範囲は、この詳細な説明によってではなく、むしろ本願の特許請求の範囲によって制限されるよう意図される。当業者によって理解されるであろうように、ここで記載される例は、その主旨又は必須の特徴から外れることなしに、他の具体的な形態において具現されてよい。同様に、モジュール、ルーチン、機能、属性、メソッドロジ及び他の態様の特定のネーミング及び分割は、強制的又は重要でなく、技術又は特徴を実装するメカニズムは、異なった名称、分割及び/又はフォーマットを有してよい。更に、当業者に明らかなように、モジュール、ルーチン、機能、属性、メソッドロジ、及び技術の他の態様は、ソフトウェア、ハードウェア、ファームウェア、又はそれらのあらゆる組み合わせとして実施されてよい。また、どこでコンポーネント(その例はモジュールである。)がソフトウェアとして実装されようとも、コンポーネントは、コンピュータプログラミングの分野における当業者に知られる、スタンドアローンのプログラムとして、より大きいプログラムの部分として、複数の別個のプログラムとして、静的若しくは動的にリンクされたライブラリとして、カーネル・ローダブル・モジュールとして、デバイスドライバとして実装され得る。加えて、技術は、如何なる具体的なプログラミング言語における実施形態にも、又は如何なる具体的なオペレーティングシステム若しくは環境についての実施形態にも決して制限されない。然るに、本明細書は、添付の特許請求の範囲の適用範囲を制限なしに例証するよう意図される。
[関連出願の相互参照]
本願は、2014年12月10日付けで、「Superpixel Based Realogram Scene Analysis」と題されて出願された米国特許仮出願第62/090177号に基づく優先権を主張するものである。なお、優先権の基礎となる米国出願は、その全文を参照により本願に援用される。
100 システム
101 リアログラム解析サーバ
103 リアログラム解析アプリケーション
105 ネットワーク
115 イメージングデバイス
143,243 データストレージ
200 リアログラム解析システム
201 オブジェクト認識モジュール
203 セグメンテーションモジュール
205 棚/ラベル検出モジュール
207 空きスペースモジュール
209 マルチプルスモジュール
235 プロセッサ
237 メモリ
802 スーパーピクセル

Claims (20)

  1. 棚の画像から棚及びラベルを特定するためのコンピュータにより実施される方法であって、
    前記棚の画像を受け取るステップと、
    前記棚の画像においてピクセルのグループに基づき特徴を特定するステップと、
    前記特徴を用いて外観に基づき可能な棚及びラベルの位置を特定するステップであり、前記可能な棚及びラベルの位置を特定することは、前記棚の画像から1つ以上のラベルの位置の仮定を生成することを含む、ステップと、
    前記1つ以上のラベルの位置の仮定の間の共通集合に基づき前記1つ以上のラベルの位置の仮定をバリデートするステップと、
    前記可能な棚及びラベルの位置のコンテクストを用いて前記可能な棚及びラベルの位置から最良の棚及びラベルの位置を選択するステップと、
    前記最良の棚及びラベルの位置に基づき棚及びラベルの外観についてのモデルを生成するステップと、
    前記棚及びラベルの外観についてのモデルに基づき、前記可能な棚及びラベルの位置のコンテクスト及び特徴を用いて、外観に基づく可能な棚及びラベルの位置を更新するステップと、
    前記更新された可能な棚及びラベルの位置を用いて最終の棚及びラベルの位置を選択するステップと
    を有する、コンピュータにより実施される方法。
  2. 前記可能な及びラベルの位置を特定することは、ピクセルの隣接したグループ間の勾配に基づき棚エッジに対応する特徴を用いて棚境界を決定することを更に有する、
    請求項1に記載のコンピュータにより実施される方法。
  3. 前記1つ以上のラベルの位置の仮定を生成することは、
    前記可能な棚及びラベルの位置における特徴を第1ラベルモデルパラメータに基づきクラスタへと量子化することと、
    前記クラスタに基づき前記1つ以上のラベルの位置の仮定を生成することと、
    ラベル候補を生成するよう、ラベル外観についての前記モデルに適合する前記1つ以上のラベルの位置の仮定内のコンポーネントを見つけることと、
    第2ラベルモデルパラメータに基づき前記生成されたラベル候補の中からラベル候補を見つけることと、
    前記ラベル候補から最良のラベルの位置の仮定を選択することと
    を有する、請求項に記載のコンピュータにより実施される方法。
  4. 前記第1ラベルモデルパラメータは、特徴色である、
    請求項3に記載のコンピュータにより実施される方法。
  5. 前記第2ラベルモデルパラメータは、メジアンラベル幅であり、前記ラベル候補を見つけることは、前記メジアンラベル幅の閾サイズ内にあるラベル候補を見つけることを更に有する、
    請求項3に記載のコンピュータにより実施される方法。
  6. 前記1つ以上のラベルの位置の仮定を生成することは、
    前記最良の棚の位置内にあるテキストを検出することと、
    前記最良の棚の位置内で検出されたテキストの各ブロックについてテキスト境界ボックスを生成することと、
    夫々のテキスト境界ボックス内で光学文字認識を実行することと
    を有する、請求項に記載のコンピュータにより実施される方法。
  7. 前記可能な棚及びラベルの位置のコンテクストは、前記可能な棚及びラベルの位置内で見つけられるラベル、前記可能な棚及びラベルの位置内で見つけられる値段、前記可能な棚及びラベルの位置内の長い水平ラインセグメント、及び前記棚の画像における他の特定されたオブジェクトに対する可能な棚及びラベルの位置の関係のグループから1つ以上を含む、
    請求項に記載のコンピュータにより実施される方法。
  8. 1つ以上のプロセッサと、
    命令を記憶しているメモリと
    を有し、
    前記命令は、実行される場合に、前記1つ以上のプロセッサに、
    棚の画像を受け取る動作と、
    前記棚の画像においてピクセルのグループに基づき特徴を特定する動作と、
    前記特徴を用いて外観に基づき可能な棚及びラベルの位置を特定する動作であり、前記可能な棚及びラベルの位置を特定することは、前記棚の画像から1つ以上のラベルの位置の仮定を生成することを含む、動作と、
    前記1つ以上のラベルの位置の仮定の間の共通集合に基づき前記1つ以上のラベルの位置の仮定をバリデートする動作と、
    前記可能な棚及びラベルの位置のコンテクストを用いて前記可能な棚及びラベルの位置から最良の棚及びラベルの位置を選択する動作と、
    前記最良の棚及びラベルの位置に基づき棚及びラベルの外観についてのモデルを生成する動作と、
    前記棚及びラベルの外観についてのモデルに基づき、前記可能な棚及びラベルの位置のコンテクスト及び特徴を用いて、外観に基づく可能な棚及びラベルの位置を更新する動作と、
    前記更新された可能な棚及びラベルの位置を用いて最終の棚及びラベルの位置を選択する動作と
    を実行させる、システム。
  9. 前記可能な及びラベルの位置を特定するよう、前記命令は、前記1つ以上のプロセッサに、ピクセルの隣接したグループ間の勾配に基づき棚エッジに対応する特徴を用いて棚境界を決定する動作を実行させる、
    請求項8に記載のシステム。
  10. 前記1つ以上のラベルの位置の仮定を生成するよう、前記命令は、前記1つ以上のプロセッサに、
    前記可能な棚及びラベルの位置における特徴を第1ラベルモデルパラメータに基づきクラスタへと量子化する動作と、
    前記クラスタに基づき前記1つ以上のラベルの位置の仮定を生成する動作と、
    ラベル候補を生成するよう、ラベル外観についての前記モデルに適合する前記1つ以上のラベルの位置の仮定内のコンポーネントを見つける動作と、
    第2ラベルモデルパラメータに基づき前記生成されたラベル候補の中からラベル候補を見つける動作と、
    前記ラベル候補から最良のラベルの位置の仮定を選択する動作と
    を実行させる、
    請求項に記載のシステム。
  11. 前記第1ラベルモデルパラメータは、特徴色である、
    請求項10に記載のシステム。
  12. 前記第2ラベルモデルパラメータは、メジアンラベル幅であり、前記ラベル候補を見つけることは、前記メジアンラベル幅の閾サイズ内にあるラベル候補を見つけることを更に有する、
    請求項10に記載のシステム。
  13. 前記1つ以上のラベルの位置の仮定を生成するよう、前記命令は、前記1つ以上のプロセッサに、
    前記最良の棚の位置内にあるテキストを検出する動作と、
    前記最良の棚の位置内で検出されたテキストの各ブロックについてテキスト境界ボックスを生成する動作と、
    夫々のテキスト境界ボックス内で光学文字認識を実行する動作と
    を実行させる、
    請求項に記載のシステム。
  14. 前記可能な棚及びラベルの位置のコンテクストは、前記可能な棚及びラベルの位置内で見つけられるラベル、前記可能な棚及びラベルの位置内で見つけられる値段、前記可能な棚及びラベルの位置内の長い水平ラインセグメント、及び前記棚の画像における他の特定されたオブジェクトに対する可能な棚及びラベルの位置の関係のグループから1つ以上を含む、
    請求項に記載のシステム。
  15. コンピュータで実行される場合に、該コンピュータに、
    棚の画像を受け取る動作と、
    前記棚の画像においてピクセルのグループに基づき特徴を特定する動作と、
    前記特徴を用いて外観に基づき可能な棚及びラベルの位置を特定する動作であり、前記可能な棚及びラベルの位置を特定することは、前記棚の画像から1つ以上のラベルの位置の仮定を生成することを含む、動作と、
    前記1つ以上のラベルの位置の仮定の間の共通集合に基づき前記1つ以上のラベルの位置の仮定をバリデートする動作と、
    前記可能な棚及びラベルの位置のコンテクストを用いて前記可能な棚及びラベルの位置から最良の棚及びラベルの位置を選択する動作と、
    前記最良の棚及びラベルの位置に基づき棚及びラベルの外観についてのモデルを生成する動作と、
    前記棚及びラベルの外観についてのモデルに基づき、前記可能な棚及びラベルの位置のコンテクスト及び特徴を用いて、外観に基づく可能な棚及びラベルの位置を更新する動作と、
    前記更新された可能な棚及びラベルの位置を用いて最終の棚及びラベルの位置を選択する動作と
    を実行させるコンピュータ可読プログラム。
  16. 前記可能な及びラベルの位置を特定するよう、当該コンピュータ可読プログラムは、前記コンピュータに、ピクセルの隣接したグループ間の勾配に基づき棚エッジに対応する特徴を用いて棚境界を決定する動作を実行させる、
    請求項15に記載のコンピュータ可読プログラム。
  17. 前記1つ以上のラベルの位置の仮定を生成するよう、当該コンピュータ可読プログラムは、前記コンピュータに、
    前記可能な棚及びラベルの位置における特徴を第1ラベルモデルパラメータに基づきクラスタへと量子化する動作と、
    前記クラスタに基づき前記1つ以上のラベルの位置の仮定を生成する動作と、
    ラベル候補を生成するよう、ラベル外観についての前記モデルに適合する前記1つ以上のラベルの位置の仮定内のコンポーネントを見つける動作と、
    第2ラベルモデルパラメータに基づき前記生成されたラベル候補の中からラベル候補を見つける動作と、
    前記ラベル候補から最良のラベルの位置の仮定を選択する動作と
    を実行させる、
    請求項15に記載のコンピュータ可読プログラム。
  18. 前記第1ラベルモデルパラメータは、特徴色である、
    請求項17に記載のコンピュータ可読プログラム。
  19. 前記第2ラベルモデルパラメータは、メジアンラベル幅であり、前記ラベル候補を見つけることは、前記メジアンラベル幅の閾サイズ内にあるラベル候補を見つけることを更に有する、
    請求項17に記載のコンピュータ可読プログラム。
  20. 前記1つ以上のラベルの位置の仮定を生成するよう、当該コンピュータ可読プログラムは、前記コンピュータに、
    前記最良の棚の位置内にあるテキストを検出する動作と、
    前記最良の棚の位置内で検出されたテキストの各ブロックについてテキスト境界ボックスを生成する動作と、
    夫々のテキスト境界ボックス内で光学文字認識を実行する動作と
    を実行させる、
    請求項15に記載のコンピュータ可読プログラム。
JP2015240156A 2014-12-10 2015-12-09 複数の整理されたオブジェクトを含む画像を解析する方法、システム及びコンピュータ可読プログラム Active JP6098701B2 (ja)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US201462090177P 2014-12-10 2014-12-10
US62/090177 2014-12-10
US14/641,296 US9536167B2 (en) 2014-12-10 2015-03-06 Realogram scene analysis of images: multiples for scene analysis
US14/641290 2015-03-06
US14/641,292 US9811754B2 (en) 2014-12-10 2015-03-06 Realogram scene analysis of images: shelf and label finding
US14/641296 2015-03-06
US14/641,290 US9483704B2 (en) 2014-12-10 2015-03-06 Realogram scene analysis of images: superpixel scene analysis
US14/641292 2015-03-06

Publications (2)

Publication Number Publication Date
JP2016115349A JP2016115349A (ja) 2016-06-23
JP6098701B2 true JP6098701B2 (ja) 2017-03-22

Family

ID=56111477

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015240156A Active JP6098701B2 (ja) 2014-12-10 2015-12-09 複数の整理されたオブジェクトを含む画像を解析する方法、システム及びコンピュータ可読プログラム
JP2015240154A Active JP6098700B2 (ja) 2014-12-10 2015-12-09 複数の整理されたオブジェクトを含む画像を解析する方法、システム及びコンピュータ可読プログラム
JP2015240159A Active JP6098702B2 (ja) 2014-12-10 2015-12-09 複数の整理されたオブジェクトを含む画像を解析する方法、システム及びコンピュータ可読プログラム

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2015240154A Active JP6098700B2 (ja) 2014-12-10 2015-12-09 複数の整理されたオブジェクトを含む画像を解析する方法、システム及びコンピュータ可読プログラム
JP2015240159A Active JP6098702B2 (ja) 2014-12-10 2015-12-09 複数の整理されたオブジェクトを含む画像を解析する方法、システム及びコンピュータ可読プログラム

Country Status (3)

Country Link
US (3) US9536167B2 (ja)
JP (3) JP6098701B2 (ja)
CN (1) CN105701519B (ja)

Families Citing this family (173)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9342900B1 (en) * 2014-12-23 2016-05-17 Ricoh Co., Ltd. Distinguishing between stock keeping units using marker based methodology
MX364903B (es) * 2015-05-16 2019-05-10 Tata Consultancy Services Ltd Procedimiento y sistema de comprobación del cumplimiento de un planograma basado en análisis visual.
US10007964B1 (en) 2015-05-20 2018-06-26 Digimarc Corporation Image processing methods and arrangements
US10552933B1 (en) 2015-05-20 2020-02-04 Digimarc Corporation Image processing methods and arrangements useful in automated store shelf inspections
US10318907B1 (en) * 2015-05-22 2019-06-11 Walgreen Co. Autonomous vehicle for mapping store layout
US9972107B2 (en) * 2015-05-29 2018-05-15 Adobe Systems Incorporated Automated decomposition of graphic designs
EP4123565A1 (en) 2015-08-03 2023-01-25 Angel Playing Cards Co., Ltd. Fraud detection system at game parlor
US11074780B2 (en) 2015-08-03 2021-07-27 Angel Playing Cards Co., Ltd. Management system of substitute currency for gaming
US10970962B2 (en) 2015-08-03 2021-04-06 Angel Playing Cards Co., Ltd. Management system of substitute currency for gaming
WO2018025752A1 (ja) 2016-08-02 2018-02-08 エンゼルプレイングカード株式会社 ゲーム管理システム
KR20220130264A (ko) 2015-08-03 2022-09-26 엔제루 구루푸 가부시키가이샤 게임용 대용 화폐, 검사장치, 게임용 대용 화폐의 제조방법, 및 테이블 게임의 관리 시스템
JP6586706B2 (ja) * 2015-09-17 2019-10-09 子達 朱 画像解析装置、画像解析方法およびプログラム
JP6900190B2 (ja) * 2016-01-14 2021-07-07 キヤノン株式会社 認識学習装置、認識学習方法及びプログラム
DE102016201389A1 (de) * 2016-01-29 2017-08-03 Robert Bosch Gmbh Verfahren zu einer Erkennung von Objekten, insbesondere von dreidimensionalen Objekten
US10957156B2 (en) 2016-09-12 2021-03-23 Angel Playing Cards Co., Ltd. Chip measurement system
CN115294701B (zh) 2016-02-01 2024-04-09 天使集团股份有限公司 游戏币的管理系统
GB2564306B (en) * 2016-03-16 2022-01-19 Walmart Apollo Llc System for verifying physical object absences from assigned regions using video analytics
US11087272B2 (en) * 2016-03-29 2021-08-10 Bossa Nova Robotics Ip, Inc. System and method for locating, identifying and counting items
WO2017203705A1 (ja) * 2016-05-27 2017-11-30 楽天株式会社 画像処理装置、画像処理方法及び画像処理プログラム
CA3025822A1 (en) * 2016-06-03 2017-12-07 Koninklijke Philips N.V. Biological object detection
US20190197561A1 (en) * 2016-06-29 2019-06-27 Trax Technology Solutions Pte Ltd Identifying products using a visual code
US10769582B2 (en) * 2016-06-30 2020-09-08 Bossa Nova Robotics Ip, Inc. Multiple camera system for inventory tracking
KR101830512B1 (ko) * 2016-07-08 2018-02-20 전자부품연구원 Dl과 pde을 복합 적용하여 최적화한 영상 세그먼테이션 방법 및 시스템
US10706348B2 (en) * 2016-07-13 2020-07-07 Google Llc Superpixel methods for convolutional neural networks
US10235654B2 (en) * 2016-07-14 2019-03-19 International Business Machines Corporation Assigning boxes to storage bays based on available spaces
US10152689B2 (en) 2016-07-14 2018-12-11 International Business Machines Corporation Mapping boxes in a storage bay
JP6939790B2 (ja) * 2016-07-21 2021-09-22 日本電気株式会社 画像処理装置、画像処理方法及びプログラム
US20180025412A1 (en) * 2016-07-22 2018-01-25 Focal Systems, Inc. Determining in-store location based on images
US9965863B2 (en) 2016-08-26 2018-05-08 Elekta, Inc. System and methods for image segmentation using convolutional neural network
US9947102B2 (en) 2016-08-26 2018-04-17 Elekta, Inc. Image segmentation using neural network method
TWI618916B (zh) * 2016-09-23 2018-03-21 啟碁科技股份有限公司 貨架庫存估測方法與系統
EP3526728B1 (en) * 2016-10-12 2024-04-24 Tata Consultancy Services Limited System and method for object recognition based estimation of planogram compliance
US10282607B2 (en) 2016-10-28 2019-05-07 The Nielsen Company (Us), Llc Reducing scale estimate errors in shelf images
US10346723B2 (en) * 2016-11-01 2019-07-09 Snap Inc. Neural network for object detection in images
US11042161B2 (en) 2016-11-16 2021-06-22 Symbol Technologies, Llc Navigation control method and apparatus in a mobile automation system
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11205120B2 (en) 2016-12-22 2021-12-21 Samsung Electronics Co., Ltd System and method for training deep learning classification networks
US20190019293A1 (en) * 2017-01-13 2019-01-17 Bet Information Systems, Inc. System and Method for Share of Shelf Data Capture and Analysis
US11494783B2 (en) * 2017-01-18 2022-11-08 International Business Machines Corporation Display and shelf space audit system
WO2018144651A1 (en) * 2017-01-31 2018-08-09 Focal Systems, Inc. Out-of-stock detection based on images
US10643177B2 (en) * 2017-03-21 2020-05-05 Kellogg Company Determining product placement compliance
US20180300043A1 (en) * 2017-04-12 2018-10-18 Ricoh Company, Ltd. Realogram to Planogram User Interface
CN107221079A (zh) * 2017-04-18 2017-09-29 东莞产权交易中心 一种自动售货机及其售货方法
US10831431B2 (en) 2017-04-18 2020-11-10 Anthony, Inc. Shelving display
WO2018204342A1 (en) 2017-05-01 2018-11-08 Symbol Technologies, Llc Product status detection system
AU2018261257B2 (en) * 2017-05-01 2020-10-08 Symbol Technologies, Llc Method and apparatus for object status detection
US10949798B2 (en) 2017-05-01 2021-03-16 Symbol Technologies, Llc Multimodal localization and mapping for a mobile automation apparatus
US10591918B2 (en) 2017-05-01 2020-03-17 Symbol Technologies, Llc Fixed segmented lattice planning for a mobile automation apparatus
US10663590B2 (en) 2017-05-01 2020-05-26 Symbol Technologies, Llc Device and method for merging lidar data
US11367092B2 (en) 2017-05-01 2022-06-21 Symbol Technologies, Llc Method and apparatus for extracting and processing price text from an image set
US10726273B2 (en) 2017-05-01 2020-07-28 Symbol Technologies, Llc Method and apparatus for shelf feature and object placement detection from shelf images
US11449059B2 (en) 2017-05-01 2022-09-20 Symbol Technologies, Llc Obstacle detection for a mobile automation apparatus
US10505057B2 (en) 2017-05-01 2019-12-10 Symbol Technologies, Llc Device and method for operating cameras and light sources wherein parasitic reflections from a paired light source are not reflected into the paired camera
WO2018201423A1 (en) * 2017-05-05 2018-11-08 Symbol Technologies, Llc Method and apparatus for detecting and interpreting price label text
WO2018227135A1 (en) * 2017-06-09 2018-12-13 Walmart Apollo, Llc Systems and methods for an augmented display system
US10863105B1 (en) * 2017-06-27 2020-12-08 Amazon Technologies, Inc. High dynamic range imaging for event detection and inventory management
US10726307B2 (en) 2017-06-30 2020-07-28 Ai Systems Co., Ltd. Real-time identification of moving objects in video images
US11205089B2 (en) * 2017-07-07 2021-12-21 Nec Corporation Object identification device, object identification method, and recording medium
US11531994B2 (en) * 2017-07-21 2022-12-20 Vispera Bilgi Teknolojileri Sanayi Ic Ve Disticaret A.S. Electronic detection of products and arrangement of products in a display structure, electronic detection of objects and arrangement of objects on and around the display structure, electronic detection of conditions of and around the display structure, and electronic scoring of the detected product and object arrangements and of the detected conditions
US20190034864A1 (en) * 2017-07-25 2019-01-31 Bossa Nova Robotics Ip, Inc. Data Reduction in a Bar Code Reading Robot Shelf Monitoring System
US11200692B2 (en) 2017-08-07 2021-12-14 Standard Cognition, Corp Systems and methods to check-in shoppers in a cashier-less store
US11250376B2 (en) 2017-08-07 2022-02-15 Standard Cognition, Corp Product correlation analysis using deep learning
US10650545B2 (en) 2017-08-07 2020-05-12 Standard Cognition, Corp. Systems and methods to check-in shoppers in a cashier-less store
US10445694B2 (en) 2017-08-07 2019-10-15 Standard Cognition, Corp. Realtime inventory tracking using deep learning
US10474988B2 (en) 2017-08-07 2019-11-12 Standard Cognition, Corp. Predicting inventory events using foreground/background processing
US10853965B2 (en) 2017-08-07 2020-12-01 Standard Cognition, Corp Directional impression analysis using deep learning
US11023850B2 (en) 2017-08-07 2021-06-01 Standard Cognition, Corp. Realtime inventory location management using deep learning
US11232687B2 (en) 2017-08-07 2022-01-25 Standard Cognition, Corp Deep learning-based shopper statuses in a cashier-less store
US10474991B2 (en) * 2017-08-07 2019-11-12 Standard Cognition, Corp. Deep learning-based store realograms
WO2019048924A1 (en) * 2017-09-06 2019-03-14 Trax Technology Solutions Pte Ltd. USING THE INCREASED REALITY FOR IMAGE CAPTURE OF A RETAIL UNIT
US10572763B2 (en) 2017-09-07 2020-02-25 Symbol Technologies, Llc Method and apparatus for support surface edge detection
US10521914B2 (en) 2017-09-07 2019-12-31 Symbol Technologies, Llc Multi-sensor object recognition system and method
FR3071341B1 (fr) * 2017-09-19 2019-09-20 Ses-Imagotag Procede mis en oeuvre par camera de controle de disposition d'articles pour des etageres equipees d'etiquettes electroniques de gondole
KR101936004B1 (ko) 2017-10-12 2019-01-08 (주)에이치엠씨 지능형 보행자 검출 방법
US10748036B2 (en) * 2017-11-21 2020-08-18 Nvidia Corporation Training a neural network to predict superpixels using segmentation-aware affinity loss
JP7024351B2 (ja) * 2017-11-24 2022-02-24 富士通株式会社 棚割生成プログラム、棚割生成方法及び棚割生成装置
WO2019108146A1 (en) * 2017-12-01 2019-06-06 Vispera Bilgi Teknolojileri Sanayi Ic Ve Dis Ticaret A.S. Electronic detection of products, poses of products, and arrangement of products in a display structure, electronic scoring of the detected product poses and product arrangement, and electronic generation of a reference image of a product in its canonical pose
US20200349806A1 (en) 2017-12-05 2020-11-05 Angel Playing Cards Co., Ltd. Management system
US10861162B2 (en) * 2017-12-08 2020-12-08 Ebay Inc. Object identification in digital images
US10664971B2 (en) * 2017-12-19 2020-05-26 Wipro Limited Method and device for detecting region of interest based on images
US10846561B1 (en) 2020-04-01 2020-11-24 Scandit Ag Recognition and selection of discrete patterns within a scene or image
CN108364316A (zh) 2018-01-26 2018-08-03 阿里巴巴集团控股有限公司 交互行为检测方法、装置、系统及设备
US11775926B2 (en) * 2018-01-29 2023-10-03 Maplebear, Inc. Machine-learned model for optimizing selection sequence for items in a warehouse
CN108364294B (zh) * 2018-02-05 2021-01-12 西北大学 基于超像素的腹部ct图像多器官分割方法
US10592726B2 (en) * 2018-02-08 2020-03-17 Ford Motor Company Manufacturing part identification using computer vision and machine learning
CN108389230A (zh) * 2018-03-07 2018-08-10 上海扩博智能技术有限公司 冰箱容量自动检测方法、系统、设备及存储介质
US11049279B2 (en) * 2018-03-27 2021-06-29 Denso Wave Incorporated Device for detecting positional relationship among objects
US10740911B2 (en) * 2018-04-05 2020-08-11 Symbol Technologies, Llc Method, system and apparatus for correcting translucency artifacts in data representing a support structure
US10823572B2 (en) 2018-04-05 2020-11-03 Symbol Technologies, Llc Method, system and apparatus for generating navigational data
US10809078B2 (en) 2018-04-05 2020-10-20 Symbol Technologies, Llc Method, system and apparatus for dynamic path generation
US10832436B2 (en) * 2018-04-05 2020-11-10 Symbol Technologies, Llc Method, system and apparatus for recovering label positions
US11327504B2 (en) 2018-04-05 2022-05-10 Symbol Technologies, Llc Method, system and apparatus for mobile automation apparatus localization
CN108829932B (zh) * 2018-05-22 2022-11-08 中国人民解放军国防科技大学 兴趣匹配方法、装置、计算机设备和存储介质
CN108846401A (zh) * 2018-05-30 2018-11-20 京东方科技集团股份有限公司 商品检测终端、方法、系统以及计算机设备、可读介质
CN108898104A (zh) * 2018-06-29 2018-11-27 北京旷视科技有限公司 一种物品识别方法、装置、系统及计算机存储介质
US10949799B2 (en) * 2018-06-29 2021-03-16 Focal Systems, Inc. On-shelf image based out-of-stock detection
CN109040539B (zh) * 2018-07-10 2020-12-01 京东方科技集团股份有限公司 图像采集装置、货架及图像识别方法
CN110738085A (zh) * 2018-07-20 2020-01-31 浙江汉朔电子科技有限公司 一种货架缺货检查方法、装置及设备、存储介质
EP3827391A4 (en) * 2018-07-26 2022-04-06 Standard Cognition, Corp. STORE REALOGRAMS BASED ON DEEP LEARNING
US10810543B2 (en) * 2018-07-30 2020-10-20 Maplebear, Inc. Populating catalog data with item properties based on segmentation and classification models
CN109086938B (zh) * 2018-08-09 2020-10-30 北京朗镜科技有限责任公司 产品sku识别方法、装置及计算机可读存储介质
CN109190919A (zh) * 2018-08-10 2019-01-11 上海扩博智能技术有限公司 零售关键业绩指标生成方法、系统、设备及存储介质
CN109191042A (zh) * 2018-08-28 2019-01-11 深圳市鼎昇贸易有限公司 仓库货物管理方法及相关产品
CN109446883B (zh) * 2018-09-05 2022-08-23 北京三快在线科技有限公司 商品状态识别方法、装置、电子设备及可读存储介质
CN109493104A (zh) * 2018-09-12 2019-03-19 广州市玄武无线科技股份有限公司 一种智能拜访的方法及系统
CN109410176B (zh) * 2018-09-28 2022-03-04 中民筑友科技投资有限公司 一种监控货架装配状态的方法、装置和存储介质
US11506483B2 (en) 2018-10-05 2022-11-22 Zebra Technologies Corporation Method, system and apparatus for support structure depth determination
US11010920B2 (en) 2018-10-05 2021-05-18 Zebra Technologies Corporation Method, system and apparatus for object detection in point clouds
US10991119B2 (en) * 2018-10-30 2021-04-27 Ncr Corporation Mapping multiple views to an identity
US11090811B2 (en) 2018-11-13 2021-08-17 Zebra Technologies Corporation Method and apparatus for labeling of support structures
US11003188B2 (en) 2018-11-13 2021-05-11 Zebra Technologies Corporation Method, system and apparatus for obstacle handling in navigational path generation
US11416000B2 (en) 2018-12-07 2022-08-16 Zebra Technologies Corporation Method and apparatus for navigational ray tracing
US11079240B2 (en) 2018-12-07 2021-08-03 Zebra Technologies Corporation Method, system and apparatus for adaptive particle filter localization
US11100303B2 (en) 2018-12-10 2021-08-24 Zebra Technologies Corporation Method, system and apparatus for auxiliary label detection and association
US11015938B2 (en) 2018-12-12 2021-05-25 Zebra Technologies Corporation Method, system and apparatus for navigational assistance
US10731970B2 (en) 2018-12-13 2020-08-04 Zebra Technologies Corporation Method, system and apparatus for support structure detection
US11126861B1 (en) 2018-12-14 2021-09-21 Digimarc Corporation Ambient inventorying arrangements
CA3028708A1 (en) 2018-12-28 2020-06-28 Zih Corp. Method, system and apparatus for dynamic loop closure in mapping trajectories
CN109977886B (zh) * 2019-03-29 2021-03-09 京东方科技集团股份有限公司 货架空置率计算方法及装置、电子设备、存储介质
CN109961101B (zh) * 2019-03-29 2021-04-27 京东方科技集团股份有限公司 货架状态确定方法及装置、电子设备、存储介质
WO2020210822A1 (en) * 2019-04-11 2020-10-15 Carnegie Mellon University System and method for associating products and product labels
US11232575B2 (en) 2019-04-18 2022-01-25 Standard Cognition, Corp Systems and methods for deep learning-based subject persistence
CN110287203B (zh) * 2019-05-24 2021-03-26 北京百度网讯科技有限公司 用于售货机的更新方法、更新装置及售货机
US11341663B2 (en) 2019-06-03 2022-05-24 Zebra Technologies Corporation Method, system and apparatus for detecting support structure obstructions
US11200677B2 (en) 2019-06-03 2021-12-14 Zebra Technologies Corporation Method, system and apparatus for shelf edge detection
US11662739B2 (en) 2019-06-03 2023-05-30 Zebra Technologies Corporation Method, system and apparatus for adaptive ceiling-based localization
US11402846B2 (en) 2019-06-03 2022-08-02 Zebra Technologies Corporation Method, system and apparatus for mitigating data capture light leakage
US11080566B2 (en) 2019-06-03 2021-08-03 Zebra Technologies Corporation Method, system and apparatus for gap detection in support structures with peg regions
US11960286B2 (en) 2019-06-03 2024-04-16 Zebra Technologies Corporation Method, system and apparatus for dynamic task sequencing
US11151743B2 (en) 2019-06-03 2021-10-19 Zebra Technologies Corporation Method, system and apparatus for end of aisle detection
US11037099B2 (en) 2019-06-10 2021-06-15 Salesforce.Com, Inc. System and method for live product report generation without annotated training data
CN112149450A (zh) * 2019-06-26 2020-12-29 浙江汉朔电子科技有限公司 排面检查系统及方法
CN110472486B (zh) * 2019-07-03 2021-05-11 北京三快在线科技有限公司 一种货架障碍物识别方法、装置、设备及可读存储介质
US11915192B2 (en) 2019-08-12 2024-02-27 Walmart Apollo, Llc Systems, devices, and methods for scanning a shopping space
WO2021034681A1 (en) 2019-08-16 2021-02-25 Bossa Nova Robotics Ip, Inc. Systems and methods for image capture and shelf content detection
CN112800804A (zh) * 2019-10-28 2021-05-14 汉朔科技股份有限公司 基于价签的缺货检测方法及装置
US11507103B2 (en) 2019-12-04 2022-11-22 Zebra Technologies Corporation Method, system and apparatus for localization-based historical obstacle handling
EP3832491A1 (en) * 2019-12-06 2021-06-09 Idemia Identity & Security France Methods for processing a plurality of candidate annotations of a given instance of an image, and for learning parameters of a computational model
US11107238B2 (en) * 2019-12-13 2021-08-31 Zebra Technologies Corporation Method, system and apparatus for detecting item facings
RU2726185C1 (ru) * 2020-01-21 2020-07-09 Общество с ограниченной ответстсвенностью «Аби Продакшн» Детектирование и идентификация объектов на изображениях
JP7304070B2 (ja) 2020-01-22 2023-07-06 国立研究開発法人産業技術総合研究所 物品群の配置状態を認識するための情報処理方法、装置及びプログラム
EP3901818A1 (en) * 2020-03-09 2021-10-27 YI Tunnel (Beijing) Technology Co., Ltd. Method and system for analyzing commodities on supermarket shelf
US11822333B2 (en) 2020-03-30 2023-11-21 Zebra Technologies Corporation Method, system and apparatus for data capture illumination control
US11514665B2 (en) 2020-04-01 2022-11-29 Scandit Ag Mapping optical-code images to an overview image
US11295163B1 (en) * 2020-04-01 2022-04-05 Scandit Ag Recognition of optical patterns in images acquired by a robotic device
CN113627418B (zh) * 2020-05-07 2023-08-25 杭州海康威视数字技术股份有限公司 数据管理方法、计算机设备及计算机可读存储介质
US11244147B2 (en) 2020-05-15 2022-02-08 Scandit Ag Optical data exchange while preserving social distancing
US11403477B1 (en) 2020-05-15 2022-08-02 Scandit Ag Image exposure performance improvements for recognition of optical patterns
EP4158572A2 (en) * 2020-06-01 2023-04-05 Trax Technology Solutions Pte Ltd. Systems and methods for retail environments
TWI742733B (zh) * 2020-06-19 2021-10-11 倍利科技股份有限公司 圖像轉換方法
US11303853B2 (en) 2020-06-26 2022-04-12 Standard Cognition, Corp. Systems and methods for automated design of camera placement and cameras arrangements for autonomous checkout
US11361468B2 (en) 2020-06-26 2022-06-14 Standard Cognition, Corp. Systems and methods for automated recalibration of sensors for autonomous checkout
US11544509B2 (en) 2020-06-30 2023-01-03 Nielsen Consumer Llc Methods, systems, articles of manufacture, and apparatus to classify labels based on images using artificial intelligence
US11450024B2 (en) 2020-07-17 2022-09-20 Zebra Technologies Corporation Mixed depth object detection
US11670073B2 (en) * 2020-08-25 2023-06-06 Saudi Arabian Oil Company System and method for detection of carbonate core features from core images
CN114253253A (zh) * 2020-09-24 2022-03-29 科沃斯商用机器人有限公司 一种基于人工智能的目标识别方法、装置及机器人
CN112215142B (zh) * 2020-10-12 2021-08-13 上海汉时信息科技有限公司 基于深度图像信息检测货架缺货率的方法、装置及设备
US11593915B2 (en) 2020-10-21 2023-02-28 Zebra Technologies Corporation Parallax-tolerant panoramic image generation
US11392891B2 (en) 2020-11-03 2022-07-19 Zebra Technologies Corporation Item placement detection and optimization in material handling systems
US11704787B2 (en) * 2020-11-06 2023-07-18 Wipro Limited Method and system for determining stock in an inventory
US11847832B2 (en) 2020-11-11 2023-12-19 Zebra Technologies Corporation Object classification for autonomous navigation systems
TW202232437A (zh) * 2021-02-09 2022-08-16 阿物科技股份有限公司 圖像分類與標示方法及系統
US11842321B1 (en) * 2021-03-17 2023-12-12 Amazon Technologies, Inc. Image-based detection of planogram product spaces
CN113034365B (zh) * 2021-03-19 2023-09-22 西安电子科技大学 一种基于超像素的多图拼接方法及系统
US11954882B2 (en) 2021-06-17 2024-04-09 Zebra Technologies Corporation Feature-based georegistration for mobile computing devices
WO2023017439A1 (en) * 2021-08-11 2023-02-16 Atai Labs Private Limited "automated system and method for detecting real-time space occupancy of inventory within a warehouse
US11880738B1 (en) 2021-08-17 2024-01-23 Scandit Ag Visual odometry for optical pattern scanning in a real scene
AU2021245114B1 (en) * 2021-10-05 2022-03-10 Van der Weegen, Mark Image Recognition using Code Based Data Reduction
KR20230117662A (ko) 2022-02-01 2023-08-08 엔제루 구루푸 가부시키가이샤 관리 시스템
US11557136B1 (en) 2022-02-23 2023-01-17 Scandit Ag Identity document verification based on barcode structure
US20230274226A1 (en) * 2022-02-25 2023-08-31 Target Brands, Inc. Retail shelf image processing and inventory tracking system
CN115526901B (zh) * 2022-09-21 2024-04-09 吉林农业科技学院 一种互联网的大数据图像处理系统
CN116993947B (zh) * 2023-09-26 2023-12-12 光谷技术有限公司 一种三维场景可视化展示方法及系统

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10156670A (ja) * 1996-12-03 1998-06-16 Fanuc Ltd 工場システムにおける情報伝達方法
US6728391B1 (en) * 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator
EP1422657A1 (en) * 2002-11-20 2004-05-26 Setrix AG Method of detecting the presence of figures and methods of managing a stock of components
US7596275B1 (en) 2004-03-01 2009-09-29 Science Applications International Corporation Methods and systems for imaging and classifying targets as empty or non-empty
JP4603807B2 (ja) * 2004-03-10 2010-12-22 富士通株式会社 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体
US7693757B2 (en) 2006-09-21 2010-04-06 International Business Machines Corporation System and method for performing inventory using a mobile inventory robot
US8189855B2 (en) 2007-08-31 2012-05-29 Accenture Global Services Limited Planogram extraction based on image processing
JP2009265998A (ja) 2008-04-25 2009-11-12 Lambda Systems Inc 画像処理システム、画像処理方法及び画像処理プログラム
CA2720217C (en) 2010-04-08 2016-03-29 Accenture Global Services Limited Digital point-of-sale analyzer
US9754169B2 (en) * 2011-12-16 2017-09-05 Nec Corporation Information processing system, information processing method, information processing device and control method and control program thereof, and communication terminal and control method and control program thereof
JP5754813B2 (ja) 2012-01-10 2015-07-29 Kddi株式会社 画像中の特徴点を検出する特徴点検出プログラム、画像処理装置及び方法
JP6043094B2 (ja) 2012-05-30 2016-12-14 辛東主 商品陳列情報集計システム
US8837830B2 (en) 2012-06-12 2014-09-16 Xerox Corporation Finding text in natural scenes
WO2014071060A2 (en) 2012-10-31 2014-05-08 Environmental Systems Research Institute Scale-invariant superpixel region edges
DE102013002554A1 (de) 2013-02-15 2014-08-21 Jungheinrich Aktiengesellschaft Verfahren zur Erkennung von Objekten in einem Lager und/oder zur räumlichen Orientierung in einem Lager
JP6048741B2 (ja) 2013-03-04 2016-12-21 日本電気株式会社 物品管理システム、物品管理方法、情報処理装置およびその制御方法と制御プログラム
JP6270065B2 (ja) * 2013-03-04 2018-01-31 日本電気株式会社 物品管理システム、情報処理装置およびその制御方法と制御プログラム
US9158988B2 (en) * 2013-06-12 2015-10-13 Symbol Technclogies, LLC Method for detecting a plurality of instances of an object
US9886678B2 (en) * 2013-09-25 2018-02-06 Sap Se Graphic representations of planograms
US9547838B2 (en) * 2013-11-06 2017-01-17 Oracle International Corporation Automated generation of a three-dimensional space representation and planogram verification
US9542746B2 (en) * 2014-06-13 2017-01-10 Xerox Corporation Method and system for spatial characterization of an imaging system

Also Published As

Publication number Publication date
CN105701519B (zh) 2018-10-09
JP2016115348A (ja) 2016-06-23
JP6098702B2 (ja) 2017-03-22
US20160171429A1 (en) 2016-06-16
US9483704B2 (en) 2016-11-01
US20160171707A1 (en) 2016-06-16
JP2016115349A (ja) 2016-06-23
US9536167B2 (en) 2017-01-03
CN105701519A (zh) 2016-06-22
JP2016115350A (ja) 2016-06-23
US20160171336A1 (en) 2016-06-16
JP6098700B2 (ja) 2017-03-22
US9811754B2 (en) 2017-11-07

Similar Documents

Publication Publication Date Title
JP6098701B2 (ja) 複数の整理されたオブジェクトを含む画像を解析する方法、システム及びコンピュータ可読プログラム
EP3032460A1 (en) Realogram scene analysis of images: superpixel scene analysis
US10922353B2 (en) Hybrid detection recognition system
US8625889B2 (en) System for food recognition method using portable devices having digital cameras
US9384423B2 (en) System and method for OCR output verification
US8655070B1 (en) Tree detection form aerial imagery
CA2957433C (en) Hybrid detection recognition system
JP2010140478A (ja) 文書画像分類のための方法及びシステム
Ye et al. Scene text detection via integrated discrimination of component appearance and consensus
JP2019046484A (ja) 画像認識システム
US10380456B2 (en) Classification dictionary learning system, classification dictionary learning method and recording medium
JP2019045909A (ja) 画像認識システム
CN107403179B (zh) 一种物品包装信息的注册方法及装置
US20210304422A1 (en) Generation of non-occluded image based on fusion of multiple occulded images
Pan et al. Improving scene text detection by scale-adaptive segmentation and weighted CRF verification
CN116868226A (zh) 图像中注释的感兴趣区域的检测
CN111507344A (zh) 从图像中识别出文字的方法和装置
JP5796107B2 (ja) テキスト検出の方法及び装置
JP2010507171A (ja) 語彙表現による画像管理
CN114882511A (zh) 基于amnn和汉字结构字典的手写汉字识别方法、系统、设备和存储介质
Moghimi Using color for object recognition
Zini et al. Portable and fast text detection
Evangelos Object detection with computer vision Algorithm for car detection
Qiao et al. Scene Text Detection with Adaptive Line Clustering
Bell Text detection and recognition in natural images

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170206

R151 Written notification of patent or utility model registration

Ref document number: 6098701

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151