JP7567166B2 - 画像処理装置、画像処理方法、およびプログラム - Google Patents
画像処理装置、画像処理方法、およびプログラム Download PDFInfo
- Publication number
- JP7567166B2 JP7567166B2 JP2019227385A JP2019227385A JP7567166B2 JP 7567166 B2 JP7567166 B2 JP 7567166B2 JP 2019227385 A JP2019227385 A JP 2019227385A JP 2019227385 A JP2019227385 A JP 2019227385A JP 7567166 B2 JP7567166 B2 JP 7567166B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- area
- product
- image
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 159
- 238000003672 processing method Methods 0.000 title claims description 11
- 238000000034 method Methods 0.000 claims description 45
- 230000008569 process Effects 0.000 claims description 42
- 238000001514 detection method Methods 0.000 claims description 33
- 238000000605 extraction Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 15
- 238000010801 machine learning Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 29
- 238000005516 engineering process Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 235000013405 beer Nutrition 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000001788 irregular Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
画像において物体が存在する領域を検出する物体検出手段と、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段と、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段と、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示処理手段と、
を備える。
コンピュータが、
画像において物体が存在する領域を検出し、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定し、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別し、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する、
ことを含む。
コンピュータを、
画像において物体が存在する領域を検出する物体検出手段、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示出力手段、
として機能させる。
<機能構成>
図1は、第1実施形態における画像処理装置10の機能構成を例示する図である。図1に示されるように、本実施形態の画像処理装置10は、物体検出部110、カテゴリ特定部120、商品識別部130、および表示処理部140を有する。
本実施形態では、商品の識別処理(マッチング処理)を行う前に、検出された物体の形状を用いて予めカテゴリが特定される。ここで、容量や数量のバリエーションが存在する商品について、統一された(類似する)デザインが採用されることが一般的である。つまり、パッケージデザインから得られる特徴量を用いて商品を識別する場合には、その商品の容量や数量などのバリエーションを誤って判別してしまう可能性を含んでいる。一方で、容量や数量が違う場合、外観の形状(サイズ)には明らかな差が生まれる。そのため、本実施形態の構成によれば、商品のカテゴリ(バリエーション)を精度よく判別することが可能となる。また、本実施形態の構成によれば、商品を識別するためのマッチング処理で使用する商品の基準データの数をカテゴリ特定結果に基づいて絞り込むことができるため、処理に要する時間を短縮する効果も見込める。
画像処理装置10は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、画像処理装置10がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
図3は、第1実施形態の画像処理装置10によって実行される処理の流れを例示するフローチャートである。
以下、表示処理部140によって出力される出力画像について、いくつか具体例をあげて説明する。図9から図11は、第1実施形態の表示処理部140が表示装置20に出力する出力画像の一例を示す図である。
本実施形態は、以下で説明する点を除き、第1実施形態と同様の構成を有する。
本実施形態では、処理対象領域に位置する物体のカテゴリを特定する際、その物体の両隣に位置する2つの他の物体のカテゴリが特定済み、かつ、2つの他の物体のカテゴリが同一である場合、他の物体について特定されたカテゴリを処理対象領域に位置する物体のカテゴリとして設定する。例えば、本実施形態において、カテゴリ特定部120は、物体検出部110により検出された領域について、1つ飛ばしに領域の形状を用いたカテゴリ特定処理を行った後、残った領域について上述の処理を実行するように構成される。これにより、少なくとも一部の領域について、領域の形状を用いた処理よりも簡易な処理でカテゴリを特定でき、全体の処理時間の短縮が見込める。
機械(画像処理装置10)による画像認識技術において、誤りを完全に排除することは現状難しい。最終的なアウトプットの精度を向上させるために、機械による判断が難しい部分については人の目で確認して修正する方法を採用することもあるが、本発明が対象とする陳列スペースの画像のように確認対象が多数存在する場合、人の目で1つ1つ確認していくことは非常に手間がかかる。本実施形態の画像処理装置10は、この課題を解決する構成を更に備える。
本実施形態の画像処理装置10は、以下で説明する点を除き、第1実施形態と同様の構成を有する。また、本実施形態の画像処理装置10は、第2実施形態で説明した機能を更に備えていてもよい。図14は、第3実施形態における画像処理装置10の機能構成を例示する図である。図14に示されるように、本実施形態の画像処理装置10は、識別誤り候補抽出部150を更に備えている点で、第1実施形態の構成と相違する。
図15は、第3実施形態の画像処理装置10により実行される処理の流れを例示するフローチャートである。図15の例で示される処理は、図3のS116の判定処理が「NO」となった後、図3のS118の処理に代えて実行される。
図16は、第2実施形態の表示処理部140が表示装置20に出力する出力画像の一例を示す図である。図16の例において、表示処理部140は、表示要素B(斜線の塗りつぶしパターン)によって、商品を誤って識別している可能性のある領域をその他の領域と区別可能にしている。表示処理部140は、例えば、図17に例示されるような情報を用いて、出力画像を生成することができる。
本実施形態では、商品を誤って識別している可能性のある領域(候補領域)を判別するための情報を含む出力画像が表示装置20に表示される。これにより、出力画像を確認する人物が、画像処理装置10による判断誤りの可能性がある領域を容易に見つけることができる。その結果、例えば誤りを修正するといった、最終的なアウトプットの精度を高める措置を効率的に行うことができる。
1.
画像において物体が存在する領域を検出する物体検出手段と、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段と、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段と、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示処理手段と、
を備える画像処理装置。
2.
前記物体検出手段は、機械学習により構築された学習モデルを用いて、前記物体が存在する領域を検出する、
1.に記載の画像処理装置。
3.
前記カテゴリ特定手段は、前記物体に両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する、
1.または2.に記載の画像処理装置。
4.
前記カテゴリ特定手段は、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定するモードを使用する入力に応じて、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定する処理を実行する、
3.に記載の画像処理装置。
5.
前記カテゴリ特定手段は、前記領域の高さ方向の大きさ、および、前記領域の高さ方向の大きさと前記領域の横方向の大きさとの比率の少なくとも一方を用いて、前記物体のカテゴリを特定する、
1.から4.のいずれか1つに記載の画像処理装置。
6.
商品を誤って識別している可能性のある候補領域を特定する識別誤り候補抽出手段を更に備え、
前記表示処理手段は、前記候補領域を識別可能とする表示要素を更に含む前記出力画像に重畳させる、
1.から5.のいずれか1つに記載の画像処理装置。
7.
前記識別誤り候補抽出手段は、前記識別結果の確信度に基づいて前記候補領域を特定する、
6.に記載の画像処理装置。
8.
前記識別誤り候補抽出手段は、前記識別結果から得られる商品の配列に基づいて前記候補領域を特定する、
6.に記載の画像処理装置。
9.
コンピュータが、
画像において物体が存在する領域を検出し、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定し、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別し、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する、
ことを含む画像処理方法。
10.
前記コンピュータが、機械学習により構築された学習モデルを用いて、前記物体が存在する領域を検出する、
ことを含む9.に記載の画像処理方法。
11.
前記コンピュータが、前記物体に両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する、
ことを含む9.または10.に記載の画像処理方法。
12.
前記コンピュータが、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定するモードを使用する入力に応じて、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定する処理を実行する、
ことを含む11.に記載の画像処理方法。
13.
前記コンピュータが、前記領域の高さ方向の大きさ、および、前記領域の高さ方向の大きさと前記領域の横方向の大きさとの比率の少なくとも一方を用いて、前記物体のカテゴリを特定する、
ことを含む9.から12.のいずれか1つに記載の画像処理方法。
14.
前記コンピュータが、
商品を誤って識別している可能性のある候補領域を特定し、
前記表示処理手段は、前記候補領域を識別可能とする表示要素を更に含む前記出力画像に重畳させる、
ことを含む9.から13.のいずれか1つに記載の画像処理方法。
15.
前記コンピュータが、前記識別結果の確信度に基づいて前記候補領域を特定する、
ことを含む14.に記載の画像処理方法。
16.
前記コンピュータが、前記識別結果から得られる商品の配列に基づいて前記候補領域を特定する、
ことを含む14.に記載の画像処理方法。
17.
コンピュータを、
画像において物体が存在する領域を検出する物体検出手段、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示出力手段、
として機能させるためのプログラム。
18.
前記物体検出手段は、機械学習により構築された学習モデルを用いて、前記物体が存在する領域を検出する、
17.に記載のプログラム。
19.
前記カテゴリ特定手段は、前記物体に両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する、
17.または18.に記載のプログラム。
20.
前記カテゴリ特定手段は、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定するモードを使用する入力に応じて、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定する処理を実行する、
19.に記載のプログラム。
21.
前記カテゴリ特定手段は、前記領域の高さ方向の大きさ、および、前記領域の高さ方向の大きさと前記領域の横方向の大きさとの比率の少なくとも一方を用いて、前記物体のカテゴリを特定する、
17.から20.のいずれか1つに記載のプログラム。
22.
前記コンピュータを、
商品を誤って識別している可能性のある候補領域を特定する識別誤り候補抽出手段として更に機能させ、
前記表示処理手段は、前記候補領域を識別可能とする表示要素を更に含む前記出力画像に重畳させる、
17.から21.のいずれか1つに記載のプログラム。
23.
前記識別誤り候補抽出手段は、前記識別結果の確信度に基づいて前記候補領域を特定する、
22.に記載のプログラム。
24.
前記識別誤り候補抽出手段は、前記識別結果から得られる商品の配列に基づいて前記候補領域を特定する、
22.に記載のプログラム。
1010 バス
1020 プロセッサ
1030 メモリ
1040 ストレージデバイス
1050 入出力インタフェース
1060 ネットワークインタフェース
110 物体検出部
120 カテゴリ特定部
130 商品識別部
140 表示処理部
150 識別誤り候補抽出部
2 ユーザ端末
20 表示装置
Claims (9)
- 画像において物体が存在する領域を検出する物体検出手段と、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段と、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段と、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示処理手段と、
を備え、
前記カテゴリ特定手段は、前記物体の両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する画像処理装置。 - 前記物体検出手段は、機械学習により構築された学習モデルを用いて、前記物体が存在する領域を検出する、
請求項1に記載の画像処理装置。 - 前記カテゴリ特定手段は、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定するモードを使用する入力に応じて、前記2つの他の物体のカテゴリを用いて前記物体のカテゴリを設定する処理を実行する、
請求項1又は2に記載の画像処理装置。 - 前記カテゴリ特定手段は、前記領域の高さ方向の大きさ、および、前記領域の高さ方向の大きさと前記領域の横方向の大きさとの比率の少なくとも一方を用いて、前記物体のカテゴリを特定する、
請求項1から3のいずれか1項に記載の画像処理装置。 - 商品を誤って識別している可能性のある候補領域を特定する識別誤り候補抽出手段を更に備え、
前記表示処理手段は、前記候補領域を識別可能とする表示要素を更に含む前記出力画像を表示装置に出力する、
請求項1から4のいずれか1項に記載の画像処理装置。 - 前記識別誤り候補抽出手段は、前記識別結果の確信度に基づいて前記候補領域を特定する、
請求項5に記載の画像処理装置。 - 前記識別誤り候補抽出手段は、前記識別結果から得られる商品の配列に基づいて前記候補領域を特定する、
請求項5に記載の画像処理装置。 - コンピュータが、
画像において物体が存在する領域を検出し、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定し、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別し、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する、
ことを含み、
前記物体の両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定する画像処理方法。 - コンピュータを、
画像において物体が存在する領域を検出する物体検出手段、
検出された前記領域の形状を用いて前記物体の属するカテゴリを特定するカテゴリ特定手段、
特定された前記カテゴリに対応する商品の基準データと前記領域から得られる特徴量とに基づいて商品を識別する商品識別手段、
検出された前記領域の位置と商品の識別結果とを示す情報を含む出力画像を表示装置に出力する表示出力手段、
として機能させ、
前記カテゴリ特定手段は、前記物体の両隣に位置する2つの他の物体それぞれについて特定されたカテゴリが同一であった場合、前記物体のカテゴリを前記2つの他の物体と同一のカテゴリに設定するプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019227385A JP7567166B2 (ja) | 2019-12-17 | 2019-12-17 | 画像処理装置、画像処理方法、およびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019227385A JP7567166B2 (ja) | 2019-12-17 | 2019-12-17 | 画像処理装置、画像処理方法、およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021096635A JP2021096635A (ja) | 2021-06-24 |
| JP7567166B2 true JP7567166B2 (ja) | 2024-10-16 |
Family
ID=76431392
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019227385A Active JP7567166B2 (ja) | 2019-12-17 | 2019-12-17 | 画像処理装置、画像処理方法、およびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7567166B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7069568B2 (ja) * | 2017-05-15 | 2022-05-18 | 株式会社三洋物産 | 遊技機 |
| CN114445745B (zh) * | 2022-01-26 | 2025-08-05 | 上海扩博智能技术有限公司 | 叠放物品的识别方法、系统、设备及存储介质 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009187482A (ja) | 2008-02-08 | 2009-08-20 | Nippon Sogo System Kk | 棚割再現方法、棚割再現プログラム、棚割評価方法、棚割評価プログラム及び記録媒体 |
| JP2015210651A (ja) | 2014-04-25 | 2015-11-24 | サントリーシステムテクノロジー株式会社 | 商品識別システム |
| WO2018016214A1 (ja) | 2016-07-21 | 2018-01-25 | 日本電気株式会社 | 画像処理装置、画像処理方法及びプログラム |
| WO2019107157A1 (ja) | 2017-11-29 | 2019-06-06 | 株式会社Nttドコモ | 棚割情報生成装置及び棚割情報生成プログラム |
-
2019
- 2019-12-17 JP JP2019227385A patent/JP7567166B2/ja active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009187482A (ja) | 2008-02-08 | 2009-08-20 | Nippon Sogo System Kk | 棚割再現方法、棚割再現プログラム、棚割評価方法、棚割評価プログラム及び記録媒体 |
| JP2015210651A (ja) | 2014-04-25 | 2015-11-24 | サントリーシステムテクノロジー株式会社 | 商品識別システム |
| WO2018016214A1 (ja) | 2016-07-21 | 2018-01-25 | 日本電気株式会社 | 画像処理装置、画像処理方法及びプログラム |
| WO2019107157A1 (ja) | 2017-11-29 | 2019-06-06 | 株式会社Nttドコモ | 棚割情報生成装置及び棚割情報生成プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021096635A (ja) | 2021-06-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12412150B2 (en) | Information processing apparatus, control method, and program | |
| JP7501725B2 (ja) | 画像処理装置、画像処理方法、および、プログラム | |
| JP7147921B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
| US11741685B2 (en) | Commodity identification device, non-transitory computer-readable storage medium, and learning method | |
| US20220245958A1 (en) | Document structure identification using post-processing error correction | |
| US10217083B2 (en) | Apparatus, method, and program for managing articles | |
| US10311295B2 (en) | Heuristic finger detection method based on depth image | |
| JP7567166B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
| JP7683668B2 (ja) | 画像記憶装置、画像記憶方法、及びプログラム | |
| US20150253861A1 (en) | Detecting device and detecting method | |
| US20230386210A1 (en) | Processing device, processing method, and non-transitory storage medium | |
| WO2020133201A1 (en) | Automated identification of input elements in graphical user interface | |
| US9229608B2 (en) | Character display apparatus, character display method, and computer readable medium | |
| JP6575628B1 (ja) | 情報処理装置、情報処理システム、制御方法、及びプログラム | |
| JP7647909B2 (ja) | 画像解析システム、画像解析方法およびプログラム | |
| US20250037293A1 (en) | Image analysis system, image analysis method, and non-transitory computer-readable medium | |
| JP7099193B2 (ja) | 情報処理システム、情報処理装置、情報処理方法、およびプログラム | |
| WO2023062724A1 (ja) | 画像解析システム、画像解析方法およびプログラム | |
| CN121096016A (zh) | 一种异常检测方法及服务器 | |
| JP2019197595A (ja) | 情報処理装置、情報処理システム、制御方法、及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221107 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230914 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230926 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231124 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240227 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240524 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20240603 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240903 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240916 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7567166 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |