JP7340353B2 - 情報処理装置、物品識別装置、及び物品識別システム - Google Patents

情報処理装置、物品識別装置、及び物品識別システム Download PDF

Info

Publication number
JP7340353B2
JP7340353B2 JP2019096182A JP2019096182A JP7340353B2 JP 7340353 B2 JP7340353 B2 JP 7340353B2 JP 2019096182 A JP2019096182 A JP 2019096182A JP 2019096182 A JP2019096182 A JP 2019096182A JP 7340353 B2 JP7340353 B2 JP 7340353B2
Authority
JP
Japan
Prior art keywords
detection target
image
target image
identification
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019096182A
Other languages
English (en)
Other versions
JP2020190950A (ja
Inventor
孝 門
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2019096182A priority Critical patent/JP7340353B2/ja
Priority to CN201911113448.3A priority patent/CN111985517A/zh
Priority to US16/687,854 priority patent/US11417025B2/en
Priority to EP19219246.6A priority patent/EP3742384A1/en
Publication of JP2020190950A publication Critical patent/JP2020190950A/ja
Application granted granted Critical
Publication of JP7340353B2 publication Critical patent/JP7340353B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/10Selection of transformation methods according to the characteristics of the input images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/247Aligning, centring, orientation detection or correction of the image by affine transforms, e.g. correction due to perspective effects; Quadrilaterals, e.g. trapezoids
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/272Means for inserting a foreground image in a background image, i.e. inlay, outlay

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明の実施形態は、情報処理装置、物品識別装置、及び物品識別システムに関する。
予め生成された識別モデルに基づき、棚を有する什器に置かれた検出対象(商品、物品など)が撮像された画像(識別対象画像)から、検出対象を識別する(ラベル付けする)装置が実用化されている。
識別モデルは、学習用データに基づいて、予め機械学習により生成される。機械学習は、例えば、セグメンテーション用のニューラルネットワークなどの手法である。学習用データは、問題と答えとを含むデータである。例えば、画像から検出対象を識別する識別モデルの生成には、検出対象を含む画像を問題とし、画像中の検出対象の領域と、検出対象を示す情報(ラベル情報)と、を答えとした学習用データが用いられる。学習用データは、例えば、検出対象を含む画像に人手により、検出対象が存在する領域及びラベル情報を付与することにより生成される。このように、学習用データの生成が手間である為、検出対象を含まない背景画像に、検出対象の画像(検出対象画像)を重畳することにより、学習用データを生成する方法がある。
検出対象画像は、検出対象の所定の面(フェイス)の画像である。検出対象のフェイスは、什器に検出対象が配置された際に見える外観のいずれかの面である。例えば、検出対象画像は、検出対象のフェイスに撮像装置が正対した状態で、撮像装置により撮像された画像である。背景画像は、例えば、検出対象が配置されていない什器及びその近傍の画像である。背景画像の撮像時の什器に対する撮像装置の光学系の光軸の角度は、什器に検出対象が配置された場合に検出対象のフェイスに対して正対しない角度である可能性がある。このような状態で撮像された背景画像には、検出対象画像を単純に重畳することができないという課題がある。
特開2009-152951号公報
本発明が解決しようとする課題は、識別モデルに用いられる学習用データを生成することができる情報処理装置、物品識別装置、及び物品識別システムを提供することである。
一実施形態に係る情報処理装置は、メモリと、プロセッサと、を具備する。メモリは、検出対象を含まない背景画像、検出対象の画像である検出対象画像、及び前記検出対象画像の検出対象を示すラベル情報を記憶する。プロセッサは、前記背景画像を台形補正し、台形補正された前記背景画像に前記検出対象画像を重畳して前記合成画像を生成し、前記合成画像と前記ラベル情報とに基づいて、学習用データを生成する。
図1は、一実施形態に係る物品識別システムの構成例を概略的に示す図である。 図2は、一実施形態に係る情報処理装置の構成例について説明する為の図である。 図3は、一実施形態に係る背景画像取得時の撮像装置の状態の例について説明する為の説明図である。 図4は、一実施形態に係る背景画像の例について説明する為の説明図である。 図5は、一実施形態に係る識別対象画像の例について説明する為の説明図である。 図6は、一実施形態に係る検出対象画像取得時の撮像装置の状態の例について説明する為の説明図である。 図7は、一実施形態に係る検出対象画像の例について説明する為の説明図である。 図8は、一実施形態に係る情報処理装置の学習フェーズにおける動作の例について説明する為の図である。 図9は、一実施形態に係る背景画像の射影変換の例について説明する為の説明図である。 図10は、一実施形態に係る背景画像の台形補正の例について説明する為の説明図である。 図11は、一実施形態に係る合成画像の例について説明する為の説明図である。 図12は、一実施形態に係る情報処理装置の推論フェーズにおける動作の例について説明する為の図である。 図13は、一実施形態に係る識別対象画像の射影変換及び台形補正の例について説明する為の説明図である。 図14は、一実施形態に係る情報処理装置による識別結果の例について説明する為の説明図である。
以下、実施の形態について図面を参照して説明する。
図1は、一実施形態に係る物品識別システム1の概略的な構成の例について説明するための説明図である。
まず物品識別システム1の概要について説明する。
物品識別システム1は、店舗、倉庫などの所定の場所に設置された陳列用の什器2と、什器2に置かれた検出対象である商品(物品)3などを撮像し、撮像した画像から検出対象を識別するラベル付け処理を行うシステムである。
什器2は、バックボード11と、バックボード11から突出した棚12とを備える。
バックボード11は、棚12を支持する支持部材である。バックボード11は、例えば、垂直方向に起立した板状に構成される。
棚12は、商品3を支持する棚板である。棚12は、例えばバックボード11から水平方向に突出するように構成される。
物品識別システム1は、商品棚撮像装置21と、ネットワーク22を介して接続された情報処理装置23とを備える。
商品棚撮像装置21は、光学系と、撮像素子とを備えるカメラである。商品棚撮像装置21は、光学系により結像された光を、撮像素子により画像(画像データ)に変換する。商品棚撮像装置21は、取得した画像を情報処理装置23に供給する。商品棚撮像装置21は、例えば、什器2が配置される店舗や倉庫などに設けられた監視カメラとして構成される。また、商品棚撮像装置21は、什器2近傍に設けられた商品撮像用のカメラであってもよい。また、商品棚撮像装置21は、店舗や倉庫内を移動する移動機構と、移動機構に設置されたカメラとを備える装置として構成されていてもよい。
情報処理装置23は、機械学習を用いた物体検出を行う。図2は、情報処理装置23の構成例について説明する為の説明図である。情報処理装置23は、システムコントローラ31、表示部32、操作インタフェース33、及び通信インタフェース34を備える。
システムコントローラ31は、情報処理装置23の制御を行う。システムコントローラ31は、例えば、プロセッサ41及びメモリ42を備える。
プロセッサ41は、演算処理を実行する演算素子である。プロセッサ41は、例えばCPUである。また、プロセッサ41は、例えばCPUとGPUとを含む構成であってもよい。プロセッサ41は、メモリ42に記憶されているプログラムなどのデータに基づいて種々の処理を行う。プロセッサ41は、メモリ42に格納されているプログラムを実行することにより、種々の動作を実行可能な制御部として機能する。
メモリ42は、プログラム及びプログラムで用いられるデータなどを記憶する記憶媒体である。また、メモリ42は、ワーキングメモリとしても機能する。すなわち、メモリ42は、プロセッサ41の処理中のデータ、及びプロセッサ41が実行するプログラムなどを一時的に格納する。
表示部32は、システムコントローラ31または図示されないグラフィックコントローラなどの表示制御部から入力される映像信号に応じて画面を表示するディスプレイを備える。例えば、表示部32のディスプレイには、情報処理装置23の種々の設定の為の画面(例えば後述する合成パラメータの設定画面)が表示される。
操作インタフェース33は、図示されない操作部材に接続されている。操作インタフェース33は、操作部材の操作に応じた操作信号をシステムコントローラ31に供給する。操作部材は、例えば、タッチセンサ、テンキー、電源キー、用紙フィードキー、種々のファンクションキー、またはキーボードなどである。タッチセンサは、ある領域内において指定された位置を示す情報を取得する。タッチセンサは、表示部32と一体にタッチパネルとして構成されることにより、表示部32に表示された画面上のタッチされた位置を示す信号をシステムコントローラ31に入力する。
通信インタフェース34は、他の機器と通信する為のインターフェースである。通信インタフェース34は、例えば、商品棚撮像装置21、及び上位装置(外部機器)などとの通信に用いられる。通信インタフェース34は、Bluetooth(登録商標)またはWi-fi(登録商標)などの規格に従って他の機器と無線通信を行う。また、例えば、通信インタフェース34は、LANコネクタなどとして構成されてもよい。
次に、商品棚撮像装置21が取得する画像について説明する。
商品棚撮像装置21は、一般的に、広範囲を撮像することが要求される。この為、商品棚撮像装置21の光学系は、対角画角が極力大きな(焦点距離が極力短い)光学系が用いられる。例えば、商品棚撮像装置21の光学系は、第1の射影方式(例えば等距離射影方式、立体射影方式、等立体角射影方式、または正射影方式などの所謂魚眼射影方式)であり、且つ焦点距離の短い光学系が用いられる。なお、以下の説明では、商品棚撮像装置21の光学系は、等距離射影方式の光学系であるとして説明する。
図3は、背景画像撮像時の商品棚撮像装置21の状態について説明するための説明図である。商品棚撮像装置21は、図3に示されるように、商品3が什器2に配置されていない状態で、什器2及びその近傍を撮像することにより、背景画像を取得する。背景画像の撮像時の什器2に対する商品棚撮像装置21の光学系の光軸の角度は、図3に示されるように、什器2に検出対象の商品3が配置された場合に、商品3の上面(棚12と接している面と逆側の面)に対して正対しない角度である。即ち、商品棚撮像装置21の光学系は、什器2の棚12の商品が配置される面に対して角度を成す。
図4は、図3に示される状態で商品棚撮像装置21により撮像された背景画像の例を示す。背景画像は、第1の射影方式(本例では等距離射影方式)の光学系を有する撮像装置により撮像された画像である。即ち、背景画像は、等距離射影方式の画像である。
なお、背景画像を取得する撮像装置は、商品棚撮像装置21とは異なる撮像装置であってもよい。また、背景画像は、立体射影方式、等立体角射影方式、または正射影方式などの射影方式の光学系を有する撮像装置により撮像された画像であってもよい。
また、商品棚撮像装置21は、商品3が什器2に配置された状態で、什器2及びその近傍を撮像することにより、識別対象画像を取得する。
図5は、図3の状態で商品3が什器2に配置された場合に、商品棚撮像装置21により撮像された識別対象画像の例を示す。識別対象画像は、第1の射影方式(本例では等距離射影方式)の光学系を有する撮像装置により撮像された画像である。即ち、識別対象画像は、等距離射影方式の画像である。
次に、情報処理装置23において用いられる画像、及び学習用データについて説明する。
情報処理装置23は、予め生成された識別モデルに基づき、画像中の物体を推論する推論フェーズと、学習用データ(教示データ)に基づき、識別モデルの生成及び更新を行う学習フェーズとを有する。
情報処理装置23は、推論フェーズにおいて、予め生成された識別モデルに基づき、商品棚撮像装置21により取得した識別対象画像から、検出対象である商品3を識別するラベル付け処理を行う。即ち、情報処理装置23は、識別モデルに基づきラベル付け処理を行うことにより、識別対象画像中の「どこに」、「何が」あるかを検出する。
また、情報処理装置23は、学習フェーズにおいて、学習用データに基づいて、機械学習により識別モデルを生成及び更新する機械学習処理を行う。
学習用データは、問題と答えとを含むデータである。例えば、画像から検出対象を識別する識別モデルの生成には、検出対象を含む画像を問題とし、画像中の検出対象の位置と、検出対象を示す情報(ラベル情報)と、を答えとした学習用データが用いられる。
例えば、ラベル付け処理は、「SSD: Single Shot MultiBox Detector( https://arxiv.org/abs/1512.02325 参照)」などに記載されている手法である。この手法では、画像と、画像中の位置を示すバウンディングボックス情報と、有限個のクラスの中から選択されたラベル情報と、を含む学習用データに基づいて、機械学習により識別モデルが生成される。
情報処理装置23は、予め取得した背景画像に、検出対象の画像(検出対象画像)を重畳することにより、学習用データを生成する。
検出対象画像は、検出対象である商品の所定の面の画像である。この所定の面を、フェイスと称する。フェイスは、什器2に商品が配置された際に見える外観のいずれかの面である。本例では、什器2の棚12に並べられた商品3の上面(棚12と接している面と逆側の面)がフェイスであると仮定して説明する。
図6は、検出対象画像撮像時の撮像装置の状態について説明するための説明図である。
撮像装置は、商品3のフェイスに撮像装置が正対した状態で、第2の射影方式(例えば中心射影方式)の光学系を有する撮像装置により商品3を撮像することにより、検出対象画像を取得する。より具体的には、検出対象画像は、図6に示されるように、撮像装置の光学系の光軸が商品3のフェイスに直交した状態で、撮像装置により撮像された画像である。
図7は、図6に示される状態で撮像装置により撮像された検出対象画像の例を示す。検出対象画像は、第2の射影方式(本例では中心射影方式)の光学系を有する撮像装置により撮像された矩形状の画像である。即ち、背景画像は、中心射影方式の画像である。また、検出対象画像は、商品3のフェイスの領域がトリミングされ、フェイスの外側の領域が除去された画像である。また、検出対象画像には、ラベル情報が付与される。ラベル情報は、検出対象画像の撮像時に検出対象画像に付与される。また、ラベル情報は、撮像されて保存された検出対象画像に対して一括して、または個別に付与されてもよい。
例えば、検出対象画像を取得する撮像装置は、商品棚撮像装置21とは異なる撮像装置である。なお、検出対象画像を取得する撮像装置は、商品棚撮像装置21であってもよい。
次に、情報処理装置23の学習フェーズにおける動作について説明する。
上記したように、情報処理装置23は、学習フェーズにおいて、学習用データに基づいて、機械学習により識別モデルを生成及び更新する機械学習処理を行う。この為に、まず情報処理装置23は、学習用データの生成を行う。
上記のような条件で撮像された背景画像には、検出対象画像を単純に重畳することができない。これは、背景画像と検出対象画像との射影方式の違い、及び撮像面における光軸からの距離の差に起因する像高の差の為である。この為、情報処理装置23は、背景画像を画像処理により変換し、変換した背景画像に検出対象画像を重畳することにより、学習用データを生成する。
情報処理装置23のシステムコントローラ31のプロセッサ41は、予め背景画像を複数取得し、メモリ42に記憶する。また、プロセッサ41は、ラベル情報が付与された検出対象画像を予め複数取得し、メモリ42に記憶する。また、プロセッサ41は、検出対象画像に対する画像処理に用いられるパラメータ(合成パラメータ)を予め取得し、メモリ42に記憶する。
図8は、情報処理装置23における機械学習処理について説明する為の説明図である。
まず、プロセッサ41は、メモリ42から背景画像を読み出す(ACT11)。プロセッサ41は、メモリ42から検出対象画像を読み出す(ACT12)。プロセッサ41は、ランダムで背景画像及び検出対象画像をメモリ42から読み出す構成であってもよいし、操作インタフェース33によって選択された背景画像及び検出対象画像をメモリ42から読み出す構成であってもよい。また、プロセッサ41は、1つの背景画像と、複数の検出対象画像をメモリ42から読み出す構成であってもよい。
プロセッサ41は、読み出した背景画像の射影方式を変換する射影変換を行う(ACT13)。例えば、プロセッサ41は、第1の射影方式(等距離射影方式)の背景画像を、検出対象画像の射影方式である第2の射影方式(中心射影方式)の画像に変換する。これにより、プロセッサ41は、図4に示された背景画像を、図9に示される背景画像に変換する。
プロセッサ41は、中心射影方式に変換された背景画像を台形補正する(ACT14)。例えば、プロセッサ41は、中心射影方式に変換された背景画像において、1つの消失点に向かって伸びる複数の直線を検出する。プロセッサ41は、複数の直線検出結果に基づいて、図9に示された背景画像を、図10に示される背景画像に変換する。また、プロセッサ41は、予め設定されたパラメータに基づいて、背景画像に対する台形補正を行う構成であってもよい。
プロセッサ41は、メモリ42から合成パラメータを読み出す(ACT15)。合成パラメータは、検出対象画像への画像処理(拡大縮小、回転、色相補正、明るさ補正、コントラスト補正、及びぼかしなどの処理)に用いられるパラメータである。プロセッサ41は、検出対象画像を合成パラメータに基づき補正(ACT16)。即ち、プロセッサ41は、メモリ42から読み出した合成パラメータに基づいて、ACT12で読み出した検出対象画像に対して、拡大縮小、回転、色相補正、明るさ補正、コントラスト補正、及びぼかしなどの画像処理を行う。
またさらに、合成パラメータは、背景画像への画像処理(色相補正、明るさ補正、コントラスト補正、及びぼかしなどの処理)に用いられるパラメータを含んでいてもよい。また、プロセッサ41は、メモリ42から読み出した合成パラメータに基づいて、図10の背景画像に対して、色相補正、明るさ補正、コントラスト補正、及びぼかしなどの画像処理を行ってもよい。
次に、プロセッサ41は、検出対象画像を背景画像に重畳して合成画像を生成する(ACT17)。即ち、プロセッサ41は、ACT14で補正された背景画像に対して、ACT16で補正された検出対象画像を重畳することにより、図11に示される合成画像を生成する。背景画像に重畳する検出対象画像の数は、1つであってもよいし、複数であってもよい。また、背景画像に重畳する検出対象画像の数は、予め設定された数であってもよいし、ランダムであってもよい。また、検出対象画像を重畳する背景画像上の位置は、予め設定された位置であってもよいし、ランダムであってもよい。また、プロセッサ41は、複数の種類の検出対象画像を背景画像上に重畳してもよい。
またさらに、合成パラメータは、背景画像に検出対象画像を重畳する位置(合成位置)、背景画像に検出対象画像を重畳する数(合成数)、検出対象画像同士の重なりを許容するか否か、などを示す情報であってもよい。この場合、プロセッサ41は、合成パラメータに基づいて、検出対象画像を重畳する合成位置、合成数、重なりが許容されているか否かを判断する。
プロセッサ41は、学習用データを生成する(ACT18)。プロセッサ41は、合成画像、合成画像上の検出対象画像の位置、及び検出対象画像に対応するラベル情報に基づいて、学習用データを生成する。即ち、学習用データにおける問題は、背景画像に検出対象画像が重畳されて生成された合成画像であり、学習用データにおける答えは、背景画像上の検出対象画像が重畳された位置、及び検出対象画像に対応するラベル情報である。プロセッサ41は、合成画像上に検出対象画像を重畳した位置、及び重畳した検出対象画像に付与されていたラベル情報を学習用データにおける答えとして、学習用データを生成する。プロセッサ41は、生成した学習用データをメモリ42に生成する(ACT19)。
次に、プロセッサ41は、識別モデルを更新するか否か判断する(ACT20)。プロセッサ41は、識別モデルを更新しないと判断した場合(ACT20、NO)、ACT11の処理に移行し、学習用データの収集を継続して行う。また、プロセッサ41は、識別モデルを更新すると判断した場合(ACT20、YES)、収集した学習用データに基づいて、識別モデルを更新し(ACT21)、処理を終了する。例えば、プロセッサ41は、メモリ42に識別モデルが保存されておらず、且つ任意の数の学習用データが収集された場合、識別モデルを生成し、メモリ42に保存する。また、プロセッサ41は、任意の数の学習用データが収集される毎に、メモリ42に保存されている識別モデルを更新する。また、プロセッサ41は、メモリ42に保存されている識別モデルを更新した後、ACT11の処理に移行し、学習用データの収集を継続して行う構成であってもよい。
上記したように、情報処理装置23は、検出対象を含まない背景画像、検出対象の画像である検出対象画像、及び検出対象画像の検出対象を示すラベル情報を記憶したメモリ42と、プロセッサ41とを備える。プロセッサ41は、背景画像を台形補正し、台形補正された背景画像に検出対象画像を重畳して合成画像を生成する。またプロセッサ41は、合成画像と背景画像に重畳した検出対象画像に対応するラベル情報とに基づいて、学習用データを生成する。これにより、撮像時の角度が異なる場合であっても、背景画像及び検出対象画像に基づいて、学習用データを生成することができる。これにより、機械学習に用いる学習用データを容易に収集することができる。この結果、容易に精度の高い識別モデルを生成することが可能になる。
また、プロセッサ41は、背景画像を検出対象画像と同じ射影方式に射影変換し、射影変換した背景画像に対して台形補正を行い、合成画像の生成に用いる。これにより、撮像時の射影方式が異なる場合であっても、背景画像及び検出対象画像に基づいて、学習用データを生成することができる。これにより、機械学習に用いる学習用データを容易に収集することができる。
また、プロセッサ41は、予め設定された合成パラメータに基づいて検出対象画像を補正し、補正した検出対象画像を背景画像に重畳して合成画像を生成する。これにより、検出対象画像と背景画像との間の向き、画像サイズ、色相、明るさ、及びコントラストなどの差が補正された合成画像を生成することができる。これにより、機械学習に用いる学習用データを容易に収集することができる。
次に、情報処理装置23の推論フェーズにおける動作について説明する。
上記したように、情報処理装置23は、推論フェーズにおいて、予め生成された識別モデルに基づき、商品棚撮像装置21により取得した識別対象画像から、検出対象である商品3を識別するラベル付け処理を行う。
図12は、情報処理装置23におけるラベル付け処理について説明する為の説明図である。
まず、プロセッサ41は、メモリ42から識別モデルを読み出す(ACT31)。また、プロセッサ41は、カメラ、即ち商品棚撮像装置21を起動させる(ACT32)。プロセッサ41は、商品棚撮像装置21により撮像を実行させるか否か判断する(ACT33)。プロセッサ41は、商品棚撮像装置21により撮像を実行させると判断した場合(ACT33、YES)、商品棚撮像装置21により撮像を実行させ、例えば図5に示される識別対象画像を取得する(ACT34)。また、プロセッサ41は、商品棚撮像装置21により撮像を実行させないと判断した場合(ACT33、NO)、後述するACT40の処理に移行する。
例えば、プロセッサ41は、予め設定された時間に、商品棚撮像装置21により撮像を実行させると判断する。また、プロセッサ41は、予め設定された時間間隔毎に、商品棚撮像装置21により撮像を実行させると判断する構成であってもよい。また、プロセッサ41は、他のセンサ(例えば人感センサなど)の検出結果に基づいて、商品棚撮像装置21により撮像を実行させると判断する構成であってもよい。また、プロセッサ41は、商品棚撮像装置21により連続的に撮像を行わせ、連続して取得した画像の一部を識別対象画像として用いる構成であってもよい。
プロセッサ41は、取得した識別対象画像を射影変換する(ACT35)。プロセッサ41は、取得した第1の射影方式(等距離射影方式)の識別対象画像を、識別モデルの生成に用いられた画像の射影方式である第2の射影方式(中心射影方式)の画像に変換する。
プロセッサ41は、中心射影方式に変換された識別対象画像を台形補正する(ACT36)。例えば、プロセッサ41は、中心射影方式に変換された識別対象画像において、1つの消失点に向かって伸びる複数の直線を検出する。プロセッサ41は、複数の直線検出結果に基づいて、台形補正を行う。また、プロセッサ41は、予め設定されたパラメータに基づいて、背景画像に対する台形補正を行う構成であってもよい。
上記のACT35及びACT36の処理により、プロセッサ41は、図5に示された等距離射影方式の識別対象画像を、中心射影方式に変換され、且つ台形補正が施された図13に示される識別対象画像に変換する。図13に示される識別対象画像には、検出対象である商品3のフェイスが検出対象画像と同様の状態で写っている。
プロセッサ41は、射影変換及び台形補正が施された識別対象画像を、識別モデルに入力する(ACT37)。これにより、識別対象画像上の検出対象である商品3のフェイスが写った領域毎に、ラベル情報が付与された図14に示されるような識別結果を取得する(ACT38)。図14の識別結果では、検出された商品3のフェイスの領域毎に、1つのラベル情報が付与されている。また、識別結果は、検出された商品3のフェイスの領域毎に、ラベル情報毎の信頼度を示す情報が付与されたものであってもよい。即ち、ある領域Aのラベル情報毎の信頼度が「ラベルA=0.8」、「ラベルB=0.05」、「ラベルC=0.02」のように構成され、領域Bのラベル情報毎の信頼度が「ラベルA=0.01」、「ラベルB=0.05」、「ラベルC=0.9」のように構成されていてもよい。
プロセッサ41は、取得した識別結果を出力し(ACT39)、ラベル付け処理を終了するか否か判断する(ACT40)。プロセッサ41は、ラベル付け処理を終了しないと判断した場合(ACT40、NO)、ACT33の処理に移行し、新たに識別対象画像を取得し、ラベル付け処理を継続する。プロセッサ41は、ラベル付け処理を終了すると判断した場合(ACT40、YES)、ラベル付け処理を終了する。
上記したように、物品識別装置として機能する情報処理装置23は、検出対象を含まない背景画像、検出対象の画像である検出対象画像、及び検出対象画像の検出対象を示すラベル情報を記憶したメモリ42と、プロセッサ41とを備える。プロセッサ41は、背景画像を台形補正し、台形補正された背景画像に検出対象画像を重畳して合成画像を生成する。またプロセッサ41は、合成画像と背景画像に重畳した検出対象画像に対応するラベル情報とに基づいて、学習用データを生成する。さらに、プロセッサ41は、学習用データに基づいて識別モデルを生成する。これにより、情報処理装置23は、容易に精度の高い識別モデルを生成することが可能になる。
また、プロセッサ41は、検出対象が写った識別対象画像と、識別モデルとに基づいて、識別対象画像中の検出対象である商品3を識別する。このように生成された識別モデルを用いて、識別対象画像中の検出対象である商品3を識別することにより、高い精度で検出対象を識別対象画像から検出することができる。
なお、上記した情報処理装置23は、カウント可能であり、且つ所定の時間内に数が増減するものであれば如何なるものを検出対象とする構成であってもよい。例えば、情報処理装置23は、店舗における商品のチェックアウト及び補充の状況などを確認する為のシステム(棚管理システム)に適用可能である。例えば、情報処理装置23は、スーパーマーケットにおいて青果、パッケージ商品(箱または袋)、飲料(缶、ボトル、または箱)、買い物客、店員などを画像から検出するシステムに適用可能である。また、例えば、情報処理装置23は、専門店において、商品、買い物客、店員などを画像から検出するシステムに適用可能である。また、例えば、情報処理装置23は、飲食店において、飲食物、食器(皿、グラス、箸)、飲食客、店員などを画像から検出するシステムに適用可能である。
また、情報処理装置23は、物流倉庫における物品の出入りを確認する為のシステム(検品システム)に適用可能である。例えば、情報処理装置23は、物流倉庫において、ダンボール、コンテナ(かご)、車両(リフトまたはトラック)、人物などを画像から検出するシステムに適用可能である。
また、情報処理装置23は、製造現場におけるピッキングシステムに適用可能である。例えば、情報処理装置23は、製造現場において、部品、工具、ロボット(組み立てまたはピッキング)、車両(リフトまたはトラック)、人物などを画像から検出するシステムに適用可能である。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1…物品識別システム、2…什器、3…商品、11…バックボード、12…棚、21…商品棚撮像装置、22…ネットワーク、23…情報処理装置、31…システムコントローラ、32…表示部、33…操作インタフェース、34…通信インタフェース、41…プロセッサ、42…メモリ。

Claims (10)

  1. 検出対象を含まない背景画像、検出対象の画像である検出対象画像、及び前記検出対象画像の検出対象を示すラベル情報を記憶したメモリと、
    前記背景画像を台形補正し、台形補正された前記背景画像に前記検出対象画像を重畳して合成画像を生成し、前記合成画像と前記ラベル情報とに基づいて、学習用データを生成するプロセッサと、
    を具備する情報処理装置。
  2. 前記プロセッサは、前記背景画像を前記検出対象画像と同じ射影方式に射影変換し、射影変換した前記背景画像を台形補正する請求項1に記載の情報処理装置。
  3. 前記プロセッサは、予め設定された合成パラメータに基づいて前記検出対象画像を補正し、補正した前記検出対象画像を前記背景画像に重畳して前記合成画像を生成する請求項1または2に記載の情報処理装置。
  4. 前記プロセッサは、前記合成画像における前記検出対象の領域と、前記検出対象に対応するラベル情報とを対応付けて、前記学習用データを生成する請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 検出対象を含まない背景画像、検出対象の画像である検出対象画像、及び前記検出対象画像の検出対象を示すラベル情報を記憶したメモリと、
    前記背景画像を台形補正し、台形補正された前記背景画像に前記検出対象画像を重畳して合成画像を生成し、前記合成画像と前記ラベル情報とに基づいて、学習用データを生成し、生成した学習用データに基づいて識別モデルを生成し、前記検出対象が写った識別対象画像と、前記識別モデルとに基づいて、前記識別対象画像中の前記検出対象を識別するプロセッサと、
    を具備する物品識別装置。
  6. 前記プロセッサは、前記背景画像を前記検出対象画像と同じ射影方式に射影変換し、射影変換した前記背景画像を台形補正する請求項5に記載の物品識別装置。
  7. 前記プロセッサは、前記識別対象画像を前記検出対象画像と同じ射影方式に射影変換し、射影変換した前記識別対象画像を台形補正し、台形補正した前記識別対象画像と、前記識別モデルとに基づいて、前記識別対象画像中の前記検出対象を識別する請求項6に記載の物品識別装置。
  8. 前記プロセッサは、予め設定された合成パラメータに基づいて前記検出対象画像を補正し、補正した前記検出対象画像を前記背景画像に重畳して前記合成画像を生成する請求項5乃至7のいずれか1項に記載の物品識別装置。
  9. 前記プロセッサは、前記合成画像における前記検出対象の領域と、前記検出対象に対応するラベル情報とを対応付けて、前記学習用データを生成する請求項5乃至8のいずれか1項に記載の物品識別装置。
  10. 撮像装置と物品識別装置とを具備する物品識別システムであって、
    前記撮像装置は、検出対象が写った識別対象画像を撮像し、前記識別対象画像を前記物品識別装置に供給し、
    前記物品識別装置は、
    検出対象を含まない背景画像、検出対象の画像である検出対象画像、及び前記検出対象画像の検出対象を示すラベル情報を記憶したメモリと、
    前記背景画像を台形補正し、台形補正された前記背景画像に前記検出対象画像を重畳して合成画像を生成し、前記合成画像と前記ラベル情報とに基づいて、学習用データを生成し、生成した学習用データに基づいて識別モデルを生成し、前記検出対象が写った識別対象画像と、前記識別モデルとに基づいて、前記識別対象画像中の前記検出対象を識別するプロセッサと、
    を具備する物品識別システム。
JP2019096182A 2019-05-22 2019-05-22 情報処理装置、物品識別装置、及び物品識別システム Active JP7340353B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2019096182A JP7340353B2 (ja) 2019-05-22 2019-05-22 情報処理装置、物品識別装置、及び物品識別システム
CN201911113448.3A CN111985517A (zh) 2019-05-22 2019-11-14 信息处理装置、物品识别装置及物品识别系统
US16/687,854 US11417025B2 (en) 2019-05-22 2019-11-19 Information processing apparatus, article identification apparatus, and article identification system
EP19219246.6A EP3742384A1 (en) 2019-05-22 2019-12-23 Information processing apparatus, article identification apparatus, and article identification system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019096182A JP7340353B2 (ja) 2019-05-22 2019-05-22 情報処理装置、物品識別装置、及び物品識別システム

Publications (2)

Publication Number Publication Date
JP2020190950A JP2020190950A (ja) 2020-11-26
JP7340353B2 true JP7340353B2 (ja) 2023-09-07

Family

ID=69005534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019096182A Active JP7340353B2 (ja) 2019-05-22 2019-05-22 情報処理装置、物品識別装置、及び物品識別システム

Country Status (4)

Country Link
US (1) US11417025B2 (ja)
EP (1) EP3742384A1 (ja)
JP (1) JP7340353B2 (ja)
CN (1) CN111985517A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014178957A (ja) 2013-03-15 2014-09-25 Nec Corp 学習データ生成装置、学習データ作成システム、方法およびプログラム
WO2019198200A1 (ja) 2018-04-12 2019-10-17 日本電気株式会社 学習用画像生成装置、学習用画像生成方法及びプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3538228B2 (ja) * 1994-07-19 2004-06-14 株式会社ナムコ 画像合成装置
JP4089426B2 (ja) * 2002-12-26 2008-05-28 カシオ計算機株式会社 プロジェクタ、撮像装置、台形補正用プログラム
US8370207B2 (en) * 2006-12-30 2013-02-05 Red Dot Square Solutions Limited Virtual reality system including smart objects
JP2009152951A (ja) 2007-12-21 2009-07-09 Alpine Electronics Inc 画像処理装置
JP5635709B2 (ja) 2011-03-01 2014-12-03 ザ プロクター アンド ギャンブルカンパニー 物理的小売環境のバーチャル図解上での物理的小売環境に関するデータの表示
JP5951367B2 (ja) * 2012-01-17 2016-07-13 シャープ株式会社 撮像装置、撮像画像処理システム、プログラムおよび記録媒体
JP6253467B2 (ja) * 2014-03-24 2017-12-27 東芝アルパイン・オートモティブテクノロジー株式会社 画像処理装置および画像処理プログラム
KR102272310B1 (ko) * 2014-11-18 2021-07-02 삼성전자주식회사 영상 처리 방법, 상기 방법을 기록한 컴퓨터 판독 가능 저장매체 및 전자 기기.
US9443164B2 (en) 2014-12-02 2016-09-13 Xerox Corporation System and method for product identification
JP6596278B2 (ja) * 2015-09-14 2019-10-23 オリンパス株式会社 情報処理装置、情報処理装置の制御方法、及び情報処理プログラム
JP6880687B2 (ja) * 2016-12-07 2021-06-02 ブラザー工業株式会社 プログラム及びシステム
JP2018142856A (ja) * 2017-02-28 2018-09-13 セイコーエプソン株式会社 プロジェクター、及び、プロジェクターの制御方法
JP7011146B2 (ja) * 2017-03-27 2022-01-26 富士通株式会社 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法
JP6458239B1 (ja) * 2017-08-29 2019-01-30 株式会社マーケットヴィジョン 画像認識システム
JP6831951B2 (ja) * 2018-10-16 2021-02-24 株式会社マーケットヴィジョン 画像認識システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014178957A (ja) 2013-03-15 2014-09-25 Nec Corp 学習データ生成装置、学習データ作成システム、方法およびプログラム
WO2019198200A1 (ja) 2018-04-12 2019-10-17 日本電気株式会社 学習用画像生成装置、学習用画像生成方法及びプログラム

Also Published As

Publication number Publication date
CN111985517A (zh) 2020-11-24
JP2020190950A (ja) 2020-11-26
US20200372681A1 (en) 2020-11-26
EP3742384A1 (en) 2020-11-25
US11417025B2 (en) 2022-08-16

Similar Documents

Publication Publication Date Title
US10692231B1 (en) Composite agent representation
US10909667B1 (en) Image rectification using transformation data
CN111315670B (zh) 货架标签检测装置、货架标签检测方法、以及记录介质
US10332066B1 (en) Item management system using weight
US9898635B2 (en) Point-of-sale (POS) code sensing apparatus
US10334965B2 (en) Monitoring device, monitoring system, and monitoring method
US10176521B2 (en) Augmented reality virtual product for display
US11127061B2 (en) Method, product, and system for identifying items for transactions
JP6549558B2 (ja) 売上登録装置、プログラム及び売上登録方法
WO2015145982A1 (ja) 情報処理装置、情報処理システム、物流システム、情報処理方法およびプログラム記憶媒体
TW201811636A (zh) 挑選支援裝置
CN111295684A (zh) 货架监视装置、货架监视方法及货架监视程序
JP6751882B2 (ja) 商品モニタリング装置、商品モニタリングシステムおよび商品モニタリング方法
JP5904097B2 (ja) 物品情報の表示装置
EP3953879A1 (en) System and method for associating products and product labels
US10789569B1 (en) System to determine item footprint
US11300662B1 (en) Detecting and locating interactions using LIDAR devices
US10346659B1 (en) System for reading tags
US11328513B1 (en) Agent re-verification and resolution using imaging
CN116615743A (zh) 分析传感器数据以识别事件
JP5891399B2 (ja) 作業検知システムの設定方法及びそれを用いた作業検知システム
JP7340353B2 (ja) 情報処理装置、物品識別装置、及び物品識別システム
US11398094B1 (en) Locally and globally locating actors by digital cameras and machine learning
JP6395895B1 (ja) 映像検品認識装置
CN112868039B (zh) 用于自主零售商店的自适应智能货架

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220510

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20230104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230828

R150 Certificate of patent or registration of utility model

Ref document number: 7340353

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150