JP7567166B2 - 画像処理装置、画像処理方法、およびプログラム - Google Patents

画像処理装置、画像処理方法、およびプログラム Download PDF

Info

Publication number
JP7567166B2
JP7567166B2 JP2019227385A JP2019227385A JP7567166B2 JP 7567166 B2 JP7567166 B2 JP 7567166B2 JP 2019227385 A JP2019227385 A JP 2019227385A JP 2019227385 A JP2019227385 A JP 2019227385A JP 7567166 B2 JP7567166 B2 JP 7567166B2
Authority
JP
Japan
Prior art keywords
category
area
product
image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019227385A
Other languages
English (en)
Other versions
JP2021096635A (ja
Inventor
八栄子 米澤
良子 門馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2019227385A priority Critical patent/JP7567166B2/ja
Publication of JP2021096635A publication Critical patent/JP2021096635A/ja
Application granted granted Critical
Publication of JP7567166B2 publication Critical patent/JP7567166B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、店舗での棚割管理を支援する技術に関する。
陳列棚等に配置された商品の画像をコンピュータを用いて解析することによって、棚割業務を効率的に行う技術が研究されている。
上述した技術の一例が、例えば、下記特許文献1に開示されている。具体的には、下記特許文献1に、画像内の物品それぞれの文字情報および当該文字情報の位置情報に基づいて照合対象のデータを絞り込み、棚割管理業務での画像処理速度を向上させる技術が開示されている。
特開2014-044481号公報
コンピュータを用いて商品を認識する際、商品の画像特徴量を使って商品を認識する。店舗で扱う商品の中には、例えば容量(サイズ)が異なる等、様々なバリエーションを有する商品も存在し得る。コンピュータは、そのような商品のバリエーションを区別して、個々の商品を認識する必要がある。しかしながら、パッケージデザインはバリエーションによって変化が乏しいことが多く、画像上の特徴が類似し易い。その結果、コンピュータが商品のバリエーションを混同してしまい、商品の認識(区別)精度が低下し得る。
本発明は、上記の課題に鑑みてなされたものである。本発明の目的の一つは、様々なバリエーションを有する商品について、そのバリエーションを精度よく識別する技術を提供することである。
本発明の画像処理装置は、
画像において物体が存在する領域を検出する物体検出手段と、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段と、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段と、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示処理手段と、
を備える。
本発明の画像処理方法は、
コンピュータが、
画像において物体が存在する領域を検出し、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定し、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別し、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する、
ことを含む。
本発明のプログラムは、
コンピュータを、
画像において物体が存在する領域を検出する物体検出手段、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示出力手段、
として機能させる。
本発明によれば、様々なバリエーションを有する商品について、そのバリエーションを精度よく識別する技術が提供される。
第1実施形態における画像処理装置の機能構成を例示する図である。 画像処理装置のハードウエア構成を例示するブロック図である。 第1実施形態の画像処理装置によって実行される処理の流れを例示するフローチャートである。 物体検出部が取得する画像の一例を示す図である。 物体検出部の処理によって記憶領域に記憶される処理結果情報の一例を示す図である。 カテゴリ特定部の処理によって更新された処理結果情報の一例を示す図である。 商品識別用の基準データを含む商品情報の一例を示す図である。 商品識別部の処理によって更新された処理結果情報の一例を示す図である。 第1実施形態の表示処理部が表示装置に出力する出力画像の一例を示す図である。 第1実施形態の表示処理部が表示装置に出力する出力画像の一例を示す図である。 第1実施形態の表示処理部が表示装置に出力する出力画像の一例を示す図である。 第2実施形態のカテゴリ特定部の機能を例示する図である。 2つの他の物体について特定されたカテゴリを用いるモードを使用することを示す入力を受け付ける画面の一例を示す図である。 第3実施形態における画像処理装置の機能構成を例示する図である。 第3実施形態の画像処理装置により実行される処理の流れを例示するフローチャートである。 第2実施形態の表示処理部が表示装置に出力する出力画像の一例を示す図である。 画像処理装置の各処理部の処理結果を示す情報の一例を示す図である。
以下、本発明の実施形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また、特に説明する場合を除き、各ブロック図において、各ブロックは、ハードウエア単位の構成ではなく、機能単位の構成を表している。また、図中の矢印の向きは、情報の流れを分かり易くするためのものであり、特に説明のない限り通信の方向(一方向通信/双方向通信)を限定しない。
[第1実施形態]
<機能構成>
図1は、第1実施形態における画像処理装置10の機能構成を例示する図である。図1に示されるように、本実施形態の画像処理装置10は、物体検出部110、カテゴリ特定部120、商品識別部130、および表示処理部140を有する。
物体検出部110は、処理対象の画像(例えば、商品が陳列されている棚の画像)を取得し、その画像において物体(商品)が存在する領域を検出する。物体検出部110は、例えば、複数の教師データを用いて機械学習を繰り返すことによって構築された検出器(学習モデル)を用いて、画像の中から物体が存在する領域を検出することができる。ここで、教師データは、複数の物体が写る学習用の画像と当該画像における物体の位置を示すラベル情報とを組み合わせて構成される。検出器は、このような教師データを用いた機械学習の繰り返しの中で、個々の物体の境界を判別するためのパラメータ(特徴量)を学習する。
カテゴリ特定部120は、物体検出部110により検出された領域の形状を用いて当該領域に位置する物体が属するカテゴリを特定する。ここで「カテゴリ」とは、1つの商品として販売されるときの容量や数量(1パッケージ当たりの個数)のバリエーションを意味する。例えば、ビールのような飲料製品については、容量のバリエーション(350ml/500mlなど)や数量のバリエーション(単品/マルチパック)が存在する。ここで挙げたビールの例に限定されないが、本発明では、このような容量や数量に類するもののバリエーションが「カテゴリ」として設定され得る。
商品識別部130は、商品識別用の基準データと、物体検出部110により検出された領域から得られる画像特徴量とに基づいて、当該領域に位置する物体(商品)を識別する。一例として、商品識別部130は、物体検出部110により検出された領域から得られる画像特徴量と、商品を識別するために用意された各商品の基準データ(基準画像特徴量)とのマッチング処理を行って、当該領域に位置する物体(商品)を識別する。この場合、商品識別用の基準データは、例えば、画像処理装置10の記憶装置や外部のデータベースなどに記憶されている。ここで、商品識別部130は、物体検出部110により検出された領域から得られる画像特徴量とのマッチング処理で用いる商品の基準データを、当該領域に位置する物体のカテゴリに基づいて絞り込む。例えば、ある領域に位置する物体のカテゴリとして「X」というカテゴリが特定された場合、商品識別部130は、特定されたカテゴリ「X」に対応する商品の基準データをマッチング処理の対象データとして選択する。この例において、特定されたカテゴリ「X」とは異なるカテゴリに対応するその他の基準データはマッチング処理で使用されない。
表示処理部140は、図示されるように、出力画像を表示装置20に出力する。表示処理部140により出力される出力画像は、物体検出部110により検出された領域の位置と、商品識別部130による商品の識別結果と、を示す情報を少なくとも含む。
<作用・効果>
本実施形態では、商品の識別処理(マッチング処理)を行う前に、検出された物体の形状を用いて予めカテゴリが特定される。ここで、容量や数量のバリエーションが存在する商品について、統一された(類似する)デザインが採用されることが一般的である。つまり、パッケージデザインから得られる特徴量を用いて商品を識別する場合には、その商品の容量や数量などのバリエーションを誤って判別してしまう可能性を含んでいる。一方で、容量や数量が違う場合、外観の形状(サイズ)には明らかな差が生まれる。そのため、本実施形態の構成によれば、商品のカテゴリ(バリエーション)を精度よく判別することが可能となる。また、本実施形態の構成によれば、商品を識別するためのマッチング処理で使用する商品の基準データの数をカテゴリ特定結果に基づいて絞り込むことができるため、処理に要する時間を短縮する効果も見込める。
<ハードウエア構成例>
画像処理装置10は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、画像処理装置10がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
図2は、画像処理装置10のハードウエア構成を例示するブロック図である。
画像処理装置10は、バス1010、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060を有する。
バス1010は、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1020などを互いに接続する方法は、バス接続に限定されない。
プロセッサ1020は、CPU(Central Processing Unit) やGPU(Graphics Processing Unit)などで実現されるプロセッサである。
メモリ1030は、RAM(Random Access Memory)などで実現される主記憶装置である。
ストレージデバイス1040は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、又はROM(Read Only Memory)などで実現される補助記憶装置である。ストレージデバイス1040は画像処理装置10の各機能(物体検出部110、カテゴリ特定部120、商品識別部130、表示処理部140など)を実現するプログラムモジュールを記憶している。プロセッサ1020がこれら各プログラムモジュールをメモリ1030上に読み込んで実行することで、各プログラムモジュールに対応する各機能が実現される。
入出力インタフェース1050は、画像処理装置10と周辺機器とを接続するためのインタフェースである。周辺機器は、例えば、キーボードやマウスなどの入力機器、ディスプレイ(タッチパネルディスプレイ)やスピーカーなどの出力機器を含む。
ネットワークインタフェース1060は、画像処理装置10をネットワークに接続するためのインタフェースである。このネットワークは、例えばLAN(Local Area Network)やWAN(Wide Area Network)である。ネットワークインタフェース1060がネットワークに接続する方法は、無線接続であってもよいし、有線接続であってもよい。画像処理装置10は、ネットワークインタフェース1060を介して、例えば、ユーザ端末2と通信可能に接続される。ここで、ユーザ端末2は、処理対象の画像を撮像する機能を有するカメラモジュールと、表示処理部140の出力画像を表示させる表示装置20とを有している。ユーザ端末2は、例えば、スマートフォン、タブレット端末、モバイルPCなどである。物体検出部110は、ネットワークインタフェース1060を介して、ユーザ端末2の撮像装置30で生成された処理対象の画像を取得することができる。また、表示処理部140は、ネットワークインタフェース1060を介して、ユーザ端末2の表示装置20に出力画像の描画データを送信することができる。
なお、図2に例示される構成はあくまで一例であり、画像処理装置10のハードウエアの構成は図2の例に制限されない。例えば、画像処理装置10の各機能が、スマートフォンやタブレット端末といったユーザ端末2に備えられていてもよい。この場合、画像処理装置10の各機能を実行するアプリケーション(プログラム)が、ユーザ端末2にインストールされる。これにより、ユーザ端末2が実質的に画像処理装置10と同等の装置となる。
<処理の流れ>
図3は、第1実施形態の画像処理装置10によって実行される処理の流れを例示するフローチャートである。
物体検出部110は、商品陳列棚などの陳列スペースに配置された全てまたは一部の商品が写る画像を取得する(S102)。物体検出部110は、例えば、図4に例示されるような画像を取得する。図4は、物体検出部110が取得する画像の一例を示す図である。図4には、商品陳列棚の一部領域を撮影した場合の画像の一例が示されている。ここで、画像処理装置10がカメラ機能を有する装置(例えば、スマートフォンやタブレット端末など)である場合、物体検出部110は、カメラ機能を起動させて生成した画像を処理対象の画像として取得することができる。また、画像処理装置10とは別に設けられたカメラ機能を有する外部装置(例えば、図2の構成におけるユーザ端末2)が画像を生成する場合、物体検出部110は、ネットワークを介して当該外部装置によって生成された画像を取得することができる。
次に、物体検出部110は、取得された画像において物体が存在する領域を検出する(S104)。物体検出部110は、例えば、機械学習によって物体の領域を判別可能に構築された学習モデルを使って、個々の物体が位置する領域を検出する。図4に例示されるように、商品の陳列スペースを撮像した画像には、基本的に複数の物体(個々の商品)が存在し得る。そのため、S104の処理では、基本的に1つの画像から複数の領域が検出され得る。物体検出部110は、図4に例示されるような画像を解析した結果として得られる情報(処理結果情報、例:図5)を、メモリ1030やストレージデバイス1040などの記憶領域に記憶する。図5は、物体検出部110の処理によって記憶領域に記憶される処理結果情報の一例を示す図である。図5に例示される情報は、画像内で検出された個々の領域を識別するための情報(領域ID)と、画像座標系での当該領域の位置を示す情報(領域情報)とを含んでいる。なお、図5における「カテゴリ特定結果」および「商品識別結果」の列には、後述のカテゴリ特定部120の処理結果を示す情報および商品識別部130の処理結果を示す情報がそれぞれ格納される。
次に、カテゴリ特定部120は、S104の処理で検出された領域の1つを、処理対象領域として選択する(S106)。そしてカテゴリ特定部120は、選択した処理対象領域の形状に基づいて、当該処理対象領域に位置する物体が属するカテゴリを特定する(S108)。カテゴリ特定部120は、処理対象領域に位置する物体のカテゴリの特定結果を用いて、記憶領域に記憶されている処理結果情報を更新する(例:図6)。図6は、カテゴリ特定部120の処理によって更新された処理結果情報の一例を示す図である。カテゴリ特定部120は、図6に例示されるように、処理対象領域に位置する物体のカテゴリとして特定したカテゴリを示す情報を、「カテゴリ特定結果」の欄に格納する。
一例として、カテゴリ特定部120は、処理対象領域の高さ方向の大きさを用いて、当該処理対象領域に位置する物体のカテゴリを特定することができる。例えば、カテゴリ特定部120は、次のような処理を行う。まず、カテゴリ特定部120は、画像内での処理対象領域の位置を示す領域情報に基づいて、当該処理対象領域の高さ方向の大きさ(画素数)を算出する。次に、カテゴリ特定部120は、処理対象領域の高さ方向の大きさに対応するカテゴリを、領域の高さ方向の大きさとカテゴリとの対応関係を示す情報に基づいて特定する。ここで、画像内での領域の高さ方向の大きさとカテゴリとの対応関係は、例えば、想定される範囲で撮影位置を変えながら、商品(物体)の配置された陳列スペースを実際に撮影した結果に基づいて定めることができる。領域の高さ方向の大きさとカテゴリとの対応関係を示す情報は、カテゴリ特定部120がアクセス可能な記憶領域(例えば、メモリ1030やストレージデバイス1040など)に予め記憶されている。
他の一例として、カテゴリ特定部120は、処理対象領域の高さ方向の大きさと処理対象領域の幅方向の大きさの比率(アスペクト比)を用いて、当該処理対象領域に位置する物体のカテゴリを特定することもできる。例えば、カテゴリ特定部120は、画像内での処理対象領域の位置を示す領域情報に基づいて、当該処理対象領域の高さ方向の大きさおよび幅方向の大きさをそれぞれ算出する。さらに、カテゴリ特定部120は、高さ方向の大きさと幅方向の大きさを用いて、アスペクト比を算出する。そして、カテゴリ特定部120は、算出したアスペクト比に対応するカテゴリを、アスペクト比とカテゴリとの対応関係を示す情報に基づいて特定する。ここで、アスペクト比とカテゴリとの対応関係は、商品のサイズ(例えば、350ml缶のサイズやマルチパックの梱包サイズ)の情報を用いて定義することができる。アスペクト比とカテゴリとの対応関係を示す情報は、カテゴリ特定部120がアクセス可能な記憶領域(例えば、メモリ1030やストレージデバイス1040など)に予め記憶されている。
処理対象領域に位置する物体のカテゴリが特定された後、商品識別部130は、予め用意されている商品識別用の基準データと比較する画像特徴量を、処理対象領域から抽出する(S110)。ここで、商品識別用の基準データは、例えば図7に示されるような形式で、メモリ1030やストレージデバイス1040などの記憶領域に予め用意されている。図7は、商品識別用の基準データを含む商品情報の一例を示す図である。基準データは、商品画像または当該商品画像から抽出される画像特徴量である。
また、商品識別部130は、S108の処理で特定された処理対象領域に位置する物体のカテゴリに基づいて、商品識別用の基準データ全ての中から当該カテゴリに対応する基準データを選択する(S112)。例えば、S108の処理において処理対象領域に位置する物体のカテゴリが「500ml」と特定されたとする。この場合に、商品識別部130は、図7に例示される基準データの中から、「500ml」のカテゴリに対応する基準データ(2、6、10および14行目のレコードに格納されている基準データ)を、マッチング処理で用いる基準データとして選択する。
そして、商品識別部130は、カテゴリに基づいて選択した商品の基準データと、処理対象領域から得られた画像特徴量とを比較し、その類似度(マッチング処理で算出されるスコア)に基づいて当該領域に位置する物体(商品)を識別する(S114)。例えば、商品識別部130は、最も類似度の大きい基準データに紐付く商品IDを商品の識別結果として取得する。また、商品識別部130は、所定の閾値以上の類似度を示す基準データ(複数存在する場合は、その中で最も類似度の大きい基準データ)を特定し、その基準データに紐付く商品IDを商品の識別結果として取得するように構成されていてもよい。なお、所定の閾値以上の類似度を示す基準データが存在しない場合、商品識別部130は、単純に最も類似度の大きい基準データに紐付く商品IDを取得するようにしてもよいし、商品が識別できなかったことを示す情報を生成してもよい。そして、商品識別部130は、商品の識別結果を用いて、記憶領域に記憶されている処理結果情報を更新する(例:図8)。図8は、商品識別部130の処理によって更新された処理結果情報の一例を示す図である。商品識別部130は、図8に例示されるように、マッチング処理による識別結果(商品の識別)として特定したカテゴリを示す情報を、「カテゴリ特定結果」の欄に格納する。なお、本図における「-」は、商品が識別できなかったことを示す情報を意味している。
S106からS114までの処理は、S104の処理で検出された全ての領域が処理対象領域として選択されるまで繰り返される。具体的には、処理対象領域として選択されていない領域が残っている場合(S116:YES)、未選択の領域の中から新たな処理対象領域が選択され、上述の処理が繰り返される。全ての領域が選択された場合(S116:NO)、表示処理部140は、各領域のマッチング処理の結果を用いて出力画像を生成し、当該出力画像を表示装置20に出力する(S118)。
<出力画像の一例>
以下、表示処理部140によって出力される出力画像について、いくつか具体例をあげて説明する。図9から図11は、第1実施形態の表示処理部140が表示装置20に出力する出力画像の一例を示す図である。
図9の例において、表示処理部140は、例えば、物体が存在する領域を示す枠状の表示要素A1を処理対象の画像に重畳させて、物体が存在する位置を可視化した出力画像を生成している。このとき、表示処理部140は、記憶領域に記憶された領域情報に基づいて、個々の領域に対応する表示要素A1の表示位置(画像上での位置座標)を設定することができる。また、表示処理部140は、個々の領域の位置を示す表示要素A1の表示態様を、各領域に関するマッチング処理の結果に応じて設定することができる。図9の例では、表示処理部140は、表示要素A1の枠線の種類(実線/点線)によって、商品が識別できた領域(枠線が実線の領域)と商品が識別できなかった領域(枠線が点線の領域)とを区別可能にしている。このようにすることで、出力画像を確認する人物が、マッチング処理の成否を把握し易くなる。なお、表示処理部140は、枠線の種類に限らず、枠線の色、塗りつぶしパターンの種類などによって、商品が識別できた領域と商品が識別できなかった領域とを区別可能にしてもよい。
また、図9に例示されるように、表示処理部140は、処理対象の画像において識別された商品を示す商品リストA2を出力画像に含めるようにしてもよい。表示処理部140は、商品識別部130による各領域のマッチング処理の結果に基づいて、商品リストA2を生成することができる。この場合において、表示処理部140は、商品リストA2上での選択操作に応じて、出力画像を更新するように構成されていてもよい。例えば、図10に例示されるように、商品リストA2上で選択された商品に対応する領域の表示要素A1を強調表示するように構成されていてもよい。図10の例では、商品リストA2上で「Cビール 缶350ml」を選択する入力が行われた状態が示されている。この場合、表示処理部140は、例えば、リスト上で選択された商品の識別情報に基づいて、記憶領域に記憶された情報(例:図8)から選択された商品に紐付く領域を特定する。そして、表示処理部140は、例えば、表示要素A1の枠線の色、枠線の太さ、枠線の種類、枠内の塗りつぶしの種類などを変更することで、特定した領域に対応する表示要素A1を強調表示する。このようにすることで、出力画像を確認する人物が、識別された各商品が画像上のどの位置に存在しているかを容易に把握できる。また、図10に例示されるように、表示処理部140は、商品リストA2の選択状態に応じて、選択された商品の情報を示す表示要素A3を画像上に更に表示するようにしてもよい。
また、表示処理部140は、同じ名称の商品かつ同じカテゴリに属する商品が連続して配置されている領域を1つの連続領域として認識し、その連続領域を示す表示要素B1と商品名およびカテゴリを示す表示要素B2を含む出力画像を生成してもよい(例:図11)。図11に例示されるような出力画像によっても、陳列スペースでの商品配置の詳細を容易に把握することができる。
[第2実施形態]
本実施形態は、以下で説明する点を除き、第1実施形態と同様の構成を有する。
図12に示されるように、本実施形態のカテゴリ特定部120は、処理対象領域に位置する物体(対象物体)の両隣に位置する2つの他の物体について特定されたカテゴリの情報を用いて、当該対象物体のカテゴリを設定する。図12は、第2実施形態のカテゴリ特定部120の機能を例示する図である。なお、図12において、点線の枠は処理対象領域を意味している。本実施形態のカテゴリ特定部120は、処理対象領域に位置する対象物体1201のカテゴリを特定する際、当該物体1201の両隣に位置する2つの他の物体(物体1202および物体1203)のカテゴリが特定済みであり、かつ、当該2つの他の物体のカテゴリが同一であるか否かを判定する。図12の例では、2つの他の物体(物体1202および物体1203)のカテゴリが特定済みであり、かつ、それらのカテゴリは同一である。この場合、カテゴリ特定部120は、物体1202および物体1203で共通しているカテゴリ(ここでは、「500ml、単品」)を、処理対象領域に位置する対象物体1201のカテゴリとして設定する。なお、物体1202および物体1203のカテゴリが同一でない場合には、カテゴリ特定部120は、第1実施形態で説明したように、処理対象領域の形状に基づいてその処理対象領域に位置する対象物体1201のカテゴリを特定することができる。
<作用・効果>
本実施形態では、処理対象領域に位置する物体のカテゴリを特定する際、その物体の両隣に位置する2つの他の物体のカテゴリが特定済み、かつ、2つの他の物体のカテゴリが同一である場合、他の物体について特定されたカテゴリを処理対象領域に位置する物体のカテゴリとして設定する。例えば、本実施形態において、カテゴリ特定部120は、物体検出部110により検出された領域について、1つ飛ばしに領域の形状を用いたカテゴリ特定処理を行った後、残った領域について上述の処理を実行するように構成される。これにより、少なくとも一部の領域について、領域の形状を用いた処理よりも簡易な処理でカテゴリを特定でき、全体の処理時間の短縮が見込める。
なお、本実施形態において、カテゴリ特定部120は、対象物体の両隣に位置する2つの他の物体のカテゴリを用いて当該対象物体のカテゴリを設定するモードを使用することを示す入力に応じて、上述の処理を実行するように構成されていてもよい。例えば、処理対象の画像が取得された場合に、カテゴリ特定部120は、図13に例示されるような画面を表示装置20に表示させ、当該画面を介して、2つの他の物体について特定されたカテゴリを用いるモードを使用する領域を指定する入力を受け付けるように構成される。図13は、2つの他の物体について特定されたカテゴリを用いるモードを使用する領域の設定入力を受け付ける画面の一例を示す図である。図13の例において、カテゴリ特定部120は、マウスやタッチパネルなどの入力装置を用いたユーザの入力操作に応じて、領域を指定する入力を受け付ける。ユーザの入力操作は、例えば、任意の領域を指定する操作や、棚板の位置などによって特定された部分領域(陳列棚の各段)の少なくともいずれか1つを選択する操作などである。図13に例示されるケースでは、カテゴリ特定部120は、商品陳列棚の真ん中の段に対応する領域を指定する入力操作を受け付け、当該領域を上記モードの対象領域として認識する。
このような構成によれば、ユーザが、処理対象の画像において本実施形態の処理を適用したい領域を任意に設定することができる。例えば、ユーザは、商品の配置パターンによって本実施形態の処理に適さない領域(同じカテゴリの商品が3つ以上連続して配置されていない領域など)を事前に除外することができる。
[第3実施形態]
機械(画像処理装置10)による画像認識技術において、誤りを完全に排除することは現状難しい。最終的なアウトプットの精度を向上させるために、機械による判断が難しい部分については人の目で確認して修正する方法を採用することもあるが、本発明が対象とする陳列スペースの画像のように確認対象が多数存在する場合、人の目で1つ1つ確認していくことは非常に手間がかかる。本実施形態の画像処理装置10は、この課題を解決する構成を更に備える。
<機能構成>
本実施形態の画像処理装置10は、以下で説明する点を除き、第1実施形態と同様の構成を有する。また、本実施形態の画像処理装置10は、第2実施形態で説明した機能を更に備えていてもよい。図14は、第3実施形態における画像処理装置10の機能構成を例示する図である。図14に示されるように、本実施形態の画像処理装置10は、識別誤り候補抽出部150を更に備えている点で、第1実施形態の構成と相違する。
識別誤り候補抽出部150は、商品を誤って識別している可能性のある領域(以下、「候補領域」とも表記)を特定する。識別誤り候補抽出部150の具体的な動作例については、後述する。また、本実施形態の表示処理部140は、識別誤り候補抽出部150による候補領域の特定結果に基づいて、当該候補領域を識別可能にする表示要素を更に含む出力画像を表示する。
<処理の流れ>
図15は、第3実施形態の画像処理装置10により実行される処理の流れを例示するフローチャートである。図15の例で示される処理は、図3のS116の判定処理が「NO」となった後、図3のS118の処理に代えて実行される。
物体検出部110によって検出された領域の全てが処理対象領域として選択された場合(S116:NO)、識別誤り候補抽出部150は、処理対象領域の中から候補領域を特定する(S202)。
一例として、識別誤り候補抽出部150は、商品識別部130によるマッチング処理の確信度(商品識別結果の確からしさ)に基づいて候補領域を特定するように構成されていてもよい。マッチング処理の確信度は、例えば、マッチング処理の結果として得られるスコア(類似度)の大きさに基づいて判断することができる。具体的には、識別誤り候補抽出部150は、マッチング処理の結果得られた類似度が高いほど当該マッチング処理の確信度が高いと判断できる。識別誤り候補抽出部150は、例えば各領域のマッチング処理の結果(類似度)が所定の閾値未満か否かを判定し、マッチング処理の結果として所定の閾値未満の類似度が得られた領域を候補領域として特定する。
他の一例として、識別誤り候補抽出部150は、商品識別部130によるマッチング処理の結果から得られる商品の配列に基づいて候補領域を特定するように構成されていてもよい。例えば、識別誤り候補抽出部150は、商品のイレギュラーな配置を検出し、その商品に対応する領域を候補領域として特定することができる。具体的な例として、識別誤り候補抽出部150は、ある特定の商品だけフェイス数(商品の列の数)が異なっている状態を商品の識別結果から検出できた場合に、当該商品に対応する領域を候補領域として特定することができる。また、他の具体的な例として、識別誤り候補抽出部150は、ある第1のカテゴリ(例:500ml、単品)に属する商品が連続して配置されている領域において当該第1のカテゴリとは異なる第2のカテゴリ(例:マルチパック)に属する商品が突然現れるような状態を「商品のイレギュラーな配置」として検出し、その第2のカテゴリに属する商品に対応する領域を候補領域として特定することができる。
そして、表示処理部140は、商品識別部130による各領域のマッチング処理の結果およびS202の処理における候補領域の特定結果を用いて出力画像を生成し、当該出力画像を表示装置20に出力する(S204)。
<出力画像の一例>
図16は、第2実施形態の表示処理部140が表示装置20に出力する出力画像の一例を示す図である。図16の例において、表示処理部140は、表示要素B(斜線の塗りつぶしパターン)によって、商品を誤って識別している可能性のある領域をその他の領域と区別可能にしている。表示処理部140は、例えば、図17に例示されるような情報を用いて、出力画像を生成することができる。
図17は、画像処理装置10の各処理部の処理結果を示す情報の一例を示す図である。図17に例示される情報は、図5、6、および8と異なり、「候補領域フラグ」の列を更に有している。ここで、識別誤り候補抽出部150は、ある領域が候補領域として特定された場合に、当該領域の「候補領域フラグ」の列にその領域が候補領域であることを示す情報(本図の例では、「1(候補領域)」)を設定する。そして、表示処理部140は、候補領域フラグに「1(候補領域)」が設定されていか否かによって、各領域に対応する表示要素(例:枠状の表示要素)の表示態様を変更する。具体的には、表示処理部140は、候補領域として特定した領域に対して特定のマークを付与する、或いは、枠線の種類、枠線の色、枠線の太さ、枠内の塗りつぶしパターンの種類などを候補領域特有の態様に設定する。これにより、候補領域を区別可能な出力画像が生成される。そして、表示処理部140は、生成した出力画像を表示装置20に出力する。
<作用・効果>
本実施形態では、商品を誤って識別している可能性のある領域(候補領域)を判別するための情報を含む出力画像が表示装置20に表示される。これにより、出力画像を確認する人物が、画像処理装置10による判断誤りの可能性がある領域を容易に見つけることができる。その結果、例えば誤りを修正するといった、最終的なアウトプットの精度を高める措置を効率的に行うことができる。
以上、図面を参照して本発明の実施の形態について述べたが、本発明はこれらに限定されて解釈されるべきものではなく、本発明の要旨を逸脱しない限りにおいて、当業者の知識に基づいて、種々の変更、改良等を行うことができる。実施形態に開示されている複数の構成要素は、適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよいし、異なる実施形態の構成要素を適宜組み合わせてもよい。
また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1.
画像において物体が存在する領域を検出する物体検出手段と、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段と、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段と、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示処理手段と、
を備える画像処理装置。
2.
前記物体検出手段は、機械学習により構築された学習モデルを用いて、前記物体が存在する領域を検出する、
1.に記載の画像処理装置。
3.
前記カテゴリ特定手段は、前記物体に両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する、
1.または2.に記載の画像処理装置。
4.
前記カテゴリ特定手段は、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定するモードを使用する入力に応じて、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定する処理を実行する、
3.に記載の画像処理装置。
5.
前記カテゴリ特定手段は、前記領域の高さ方向の大きさ、および、前記領域の高さ方向の大きさと前記領域の横方向の大きさとの比率の少なくとも一方を用いて、前記物体のカテゴリを特定する、
1.から4.のいずれか1つに記載の画像処理装置。
6.
商品を誤って識別している可能性のある候補領域を特定する識別誤り候補抽出手段を更に備え、
前記表示処理手段は、前記候補領域を識別可能とする表示要素を更に含む前記出力画像に重畳させる、
1.から5.のいずれか1つに記載の画像処理装置。
7.
前記識別誤り候補抽出手段は、前記識別結果の確信度に基づいて前記候補領域を特定する、
6.に記載の画像処理装置。
8.
前記識別誤り候補抽出手段は、前記識別結果から得られる商品の配列に基づいて前記候補領域を特定する、
6.に記載の画像処理装置。
9.
コンピュータが、
画像において物体が存在する領域を検出し、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定し、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別し、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する、
ことを含む画像処理方法。
10.
前記コンピュータが、機械学習により構築された学習モデルを用いて、前記物体が存在する領域を検出する、
ことを含む9.に記載の画像処理方法。
11.
前記コンピュータが、前記物体に両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する、
ことを含む9.または10.に記載の画像処理方法。
12.
前記コンピュータが、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定するモードを使用する入力に応じて、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定する処理を実行する、
ことを含む11.に記載の画像処理方法。
13.
前記コンピュータが、前記領域の高さ方向の大きさ、および、前記領域の高さ方向の大きさと前記領域の横方向の大きさとの比率の少なくとも一方を用いて、前記物体のカテゴリを特定する、
ことを含む9.から12.のいずれか1つに記載の画像処理方法。
14.
前記コンピュータが、
商品を誤って識別している可能性のある候補領域を特定し、
前記表示処理手段は、前記候補領域を識別可能とする表示要素を更に含む前記出力画像に重畳させる、
ことを含む9.から13.のいずれか1つに記載の画像処理方法。
15.
前記コンピュータが、前記識別結果の確信度に基づいて前記候補領域を特定する、
ことを含む14.に記載の画像処理方法。
16.
前記コンピュータが、前記識別結果から得られる商品の配列に基づいて前記候補領域を特定する、
ことを含む14.に記載の画像処理方法。
17.
コンピュータを、
画像において物体が存在する領域を検出する物体検出手段、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示出力手段、
として機能させるためのプログラム。
18.
前記物体検出手段は、機械学習により構築された学習モデルを用いて、前記物体が存在する領域を検出する、
17.に記載のプログラム。
19.
前記カテゴリ特定手段は、前記物体に両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する、
17.または18.に記載のプログラム。
20.
前記カテゴリ特定手段は、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定するモードを使用する入力に応じて、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定する処理を実行する、
19.に記載のプログラム。
21.
前記カテゴリ特定手段は、前記領域の高さ方向の大きさ、および、前記領域の高さ方向の大きさと前記領域の横方向の大きさとの比率の少なくとも一方を用いて、前記物体のカテゴリを特定する、
17.から20.のいずれか1つに記載のプログラム。
22.
前記コンピュータを、
商品を誤って識別している可能性のある候補領域を特定する識別誤り候補抽出手段として更に機能させ、
前記表示処理手段は、前記候補領域を識別可能とする表示要素を更に含む前記出力画像に重畳させる、
17.から21.のいずれか1つに記載のプログラム。
23.
前記識別誤り候補抽出手段は、前記識別結果の確信度に基づいて前記候補領域を特定する、
22.に記載のプログラム。
24.
前記識別誤り候補抽出手段は、前記識別結果から得られる商品の配列に基づいて前記候補領域を特定する、
22.に記載のプログラム。
10 画像処理装置
1010 バス
1020 プロセッサ
1030 メモリ
1040 ストレージデバイス
1050 入出力インタフェース
1060 ネットワークインタフェース
110 物体検出部
120 カテゴリ特定部
130 商品識別部
140 表示処理部
150 識別誤り候補抽出部
2 ユーザ端末
20 表示装置

Claims (9)

  1. 画像において物体が存在する領域を検出する物体検出手段と、
    検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段と、
    特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段と、
    検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示処理手段と、
    を備え
    前記カテゴリ特定手段は、前記物体の両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する画像処理装置。
  2. 前記物体検出手段は、機械学習により構築された学習モデルを用いて、前記物体が存在する領域を検出する、
    請求項1に記載の画像処理装置。
  3. 前記カテゴリ特定手段は、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定するモードを使用する入力に応じて、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定する処理を実行する、
    請求項1又は2に記載の画像処理装置。
  4. 前記カテゴリ特定手段は、前記領域の高さ方向の大きさ、および、前記領域の高さ方向の大きさと前記領域の横方向の大きさとの比率の少なくとも一方を用いて、前記物体のカテゴリを特定する、
    請求項1から3のいずれか1項に記載の画像処理装置。
  5. 商品を誤って識別している可能性のある候補領域を特定する識別誤り候補抽出手段を更に備え、
    前記表示処理手段は、前記候補領域を識別可能とする表示要素を更に含む前記出力画像を表示装置に出力する、
    請求項1から4のいずれか1項に記載の画像処理装置。
  6. 前記識別誤り候補抽出手段は、前記識別結果の確信度に基づいて前記候補領域を特定する、
    請求項5に記載の画像処理装置。
  7. 前記識別誤り候補抽出手段は、前記識別結果から得られる商品の配列に基づいて前記候補領域を特定する、
    請求項5に記載の画像処理装置。
  8. コンピュータが、
    画像において物体が存在する領域を検出し、
    検出された前記領域の形状を用いて前記物体の属するカテゴリを特定し、
    特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別し、
    検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する、
    ことを含み、
    前記物体の両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する画像処理方法。
  9. コンピュータを、
    画像において物体が存在する領域を検出する物体検出手段、
    検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段、
    特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段、
    検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示出力手段、
    として機能させ
    前記カテゴリ特定手段は、前記物体の両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定するプログラム。
JP2019227385A 2019-12-17 2019-12-17 画像処理装置、画像処理方法、およびプログラム Active JP7567166B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019227385A JP7567166B2 (ja) 2019-12-17 2019-12-17 画像処理装置、画像処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019227385A JP7567166B2 (ja) 2019-12-17 2019-12-17 画像処理装置、画像処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2021096635A JP2021096635A (ja) 2021-06-24
JP7567166B2 true JP7567166B2 (ja) 2024-10-16

Family

ID=76431392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019227385A Active JP7567166B2 (ja) 2019-12-17 2019-12-17 画像処理装置、画像処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP7567166B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7069568B2 (ja) * 2017-05-15 2022-05-18 株式会社三洋物産 遊技機
CN114445745B (zh) * 2022-01-26 2025-08-05 上海扩博智能技术有限公司 叠放物品的识别方法、系统、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009187482A (ja) 2008-02-08 2009-08-20 Nippon Sogo System Kk 棚割再現方法、棚割再現プログラム、棚割評価方法、棚割評価プログラム及び記録媒体
JP2015210651A (ja) 2014-04-25 2015-11-24 サントリーシステムテクノロジー株式会社 商品識別システム
WO2018016214A1 (ja) 2016-07-21 2018-01-25 日本電気株式会社 画像処理装置、画像処理方法及びプログラム
WO2019107157A1 (ja) 2017-11-29 2019-06-06 株式会社Nttドコモ 棚割情報生成装置及び棚割情報生成プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009187482A (ja) 2008-02-08 2009-08-20 Nippon Sogo System Kk 棚割再現方法、棚割再現プログラム、棚割評価方法、棚割評価プログラム及び記録媒体
JP2015210651A (ja) 2014-04-25 2015-11-24 サントリーシステムテクノロジー株式会社 商品識別システム
WO2018016214A1 (ja) 2016-07-21 2018-01-25 日本電気株式会社 画像処理装置、画像処理方法及びプログラム
WO2019107157A1 (ja) 2017-11-29 2019-06-06 株式会社Nttドコモ 棚割情報生成装置及び棚割情報生成プログラム

Also Published As

Publication number Publication date
JP2021096635A (ja) 2021-06-24

Similar Documents

Publication Publication Date Title
US12412150B2 (en) Information processing apparatus, control method, and program
JP7501725B2 (ja) 画像処理装置、画像処理方法、および、プログラム
JP7147921B2 (ja) 画像処理装置、画像処理方法及びプログラム
US11741685B2 (en) Commodity identification device, non-transitory computer-readable storage medium, and learning method
US20220245958A1 (en) Document structure identification using post-processing error correction
US10217083B2 (en) Apparatus, method, and program for managing articles
US10311295B2 (en) Heuristic finger detection method based on depth image
JP7567166B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7683668B2 (ja) 画像記憶装置、画像記憶方法、及びプログラム
US20150253861A1 (en) Detecting device and detecting method
US20230386210A1 (en) Processing device, processing method, and non-transitory storage medium
WO2020133201A1 (en) Automated identification of input elements in graphical user interface
US9229608B2 (en) Character display apparatus, character display method, and computer readable medium
JP6575628B1 (ja) 情報処理装置、情報処理システム、制御方法、及びプログラム
JP7647909B2 (ja) 画像解析システム、画像解析方法およびプログラム
US20250037293A1 (en) Image analysis system, image analysis method, and non-transitory computer-readable medium
JP7099193B2 (ja) 情報処理システム、情報処理装置、情報処理方法、およびプログラム
WO2023062724A1 (ja) 画像解析システム、画像解析方法およびプログラム
CN121096016A (zh) 一种异常检测方法及服务器
JP2019197595A (ja) 情報処理装置、情報処理システム、制御方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231124

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240524

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240916

R150 Certificate of patent or registration of utility model

Ref document number: 7567166

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150