JP7149953B2 - 検出装置及び検出プログラム - Google Patents
検出装置及び検出プログラム Download PDFInfo
- Publication number
- JP7149953B2 JP7149953B2 JP2019550485A JP2019550485A JP7149953B2 JP 7149953 B2 JP7149953 B2 JP 7149953B2 JP 2019550485 A JP2019550485 A JP 2019550485A JP 2019550485 A JP2019550485 A JP 2019550485A JP 7149953 B2 JP7149953 B2 JP 7149953B2
- Authority
- JP
- Japan
- Prior art keywords
- reliability
- area
- shelf
- product
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明の一側面は、画像に写った物体を検出する検出装置及び検出プログラムに関する。
商品棚構成(商品棚における商品の配置)は、売上に大きな影響を与え得るため、店舗及び店舗に商品を卸しているメーカーの両方にとって重要である。小売店においては、商品棚構成は、例えばPOSシステムによって管理される。しかし、POSシステムに登録された商品棚構成と同一の商品棚が店舗で構成されていることを確認するためには、店舗スタッフが目視で確認する必要がある。また、メーカーが小売店における自社商品の売上を分析するために、商品棚における自社商品と他社商品との配置関係を分析する場合がある。このような分析のために、通常、各メーカーの社員は、小売店における商品棚構成を目視で確認している。このように商品棚構成を目視で確認する場合、時間的負担及び人的負担が多大となるため、商品棚を撮像した画像を用いて自動で商品棚を再構成する技術が要請されている。
商品棚を再現するためには撮像した画像に写った商品及び棚板を検出する必要がある。しかしながら、実店舗では様々な配列で様々な商品が配置されている。また、棚板には店舗独自の値札及びポップ等が不規則に配置されている場合がある。このため、画像認識による物体の検出が困難であり、商品棚を精度良く再現できない場合がある。
画像認識による物体の検出に関連して、例えば下記特許文献1は、画像に含まれる人体を認識するモデルによって検出された領域のうちから、互いに重複関係にある重複領域(例えば、大領域と当該大領域に包含される小領域)を抽出し、重複領域の重複状態に基づいて、重複領域が人体であるか否かを判別する手法を開示している。
上記特許文献1の手法は、検出された全ての重複領域同士を比較している。このため、画像に写った物体の数が多く、検出される物体領域が多い場合には、高速かつ効率的に処理を実行できないという問題が生じ得る。すなわち、上記特許文献1の手法には、画像に写った物体を精度良くかつ効率的に検出する上で改善の余地がある。
そこで、本発明の一側面は、画像に写った物体を精度良くかつ効率的に検出できる検出装置及び検出プログラムを提供することを目的とする。
本発明の一側面に係る検出装置は、入力画像に対する画像認識により検出された複数の物体領域の各々について、物体領域のカテゴリと、物体領域がカテゴリに合致する可能性の高さを示す信頼度と、を検出する検出部と、複数の物体領域を、信頼度に基づいて分類する分類部と、信頼度に基づく分類に関して予め定められた関係を有する複数の物体領域同士の位置関係に基づいて、当該複数の物体領域のうちの少なくとも1つの物体領域の信頼度を補正する補正部と、を備える。
本発明の一側面に係る検出装置によれば、入力画像に対する画像認識により検出された複数の物体領域の各々は、検出された信頼度に基づいて分類される。そして、信頼度に基づく分類に関して予め定められた関係を有する複数の物体領域同士の位置関係に基づいて、少なくとも1つの物体領域の信頼度が補正される。この構成により、物体領域同士の位置関係と信頼度に基づく分類の関係性とに基づいて、物体領域の信頼度を適切に補正することが可能となる。また、信頼度に基づく分類に関して予め定められた関係を有する複数の物体領域同士の位置関係に着目することにより、検出された全ての物体領域同士(例えば互いに重複する全ての物体領域同士)の位置関係を考慮する場合と比較して、処理の効率化を図ることができる。以上により、上記検出装置によれば、画像に写った物体を精度良くかつ効率的に検出できる。
本発明の一側面によれば、画像に写った物体を精度良くかつ効率的に検出できる検出装置及び検出プログラムを提供することができる。
以下、添付図面を参照して、本発明の一実施形態について詳細に説明する。なお、図面の説明において同一又は相当要素には同一符号を付し、重複する説明を省略する。
図1は、本発明の一実施形態に係る検出装置10の機能構成を示す図である。検出装置10は、入力画像に対する画像認識を実行することにより、入力画像に写った物体を検出する装置である。本実施形態では一例として、入力画像は、店舗等における商品棚を正面から撮像することにより得られた画像であり、検出装置10は、入力画像に写り込んだ商品、商品棚(例えば棚板)、及び値札のいずれかに対応する物体領域を検出する。検出装置10は、例えばスマートフォン及びタブレット端末等のユーザが所有する携帯端末に実装され得る。また、検出装置10は、例えばパーソナルコンピュータ及びサーバ装置等の据置型のコンピュータ装置等に実装されてもよい。
図1に示すように、検出装置10は、機能的な構成要素として、画像取得部11と、検出部12と、分類部13と、補正部14と、物体領域決定部15と、を備える。
画像取得部11は、検出部12による画像認識処理の実行対象となる入力画像を取得する。入力画像は、例えば、小売店の店舗スタッフ又は小売店に商品を卸している商品メーカーの社員等が小売店の商品棚をカメラで撮像することによって得られた画像である。検出装置10がカメラ付き携帯端末である場合、画像取得部11は、検出装置10が備えるカメラによって撮像された画像を入力画像として取得してもよい。検出装置10がカメラ機能を備えていない場合、画像取得部11は、検出装置10以外の機器(例えばデジタルカメラ等)によって撮像された画像を入力画像として、当該機器から有線通信又は無線通信によって取得してもよい。また、画像取得部11は、検出装置10が備えるメモリ等の記憶装置に既に記憶されている画像を、入力画像として読み出してもよい。
検出部12は、画像取得部11によって取得された入力画像に対する画像認識を実行する。検出部12は、当該画像認識により検出された複数の物体領域の各々について、物体領域のカテゴリと、物体領域が当該カテゴリに合致する可能性の高さを示す信頼度と、を検出する。「物体領域のカテゴリ」は、検出された物体領域に写り込んだ物体の種類の候補である。本実施形態では一例として、物体領域のカテゴリは、商品、商品棚(棚板)、及び値札のいずれかである。「物体領域が当該カテゴリに合致する可能性」とは、物体領域に写り込んだ物体が当該カテゴリ(商品、商品棚、及び値札のいずれか)に合致する可能性である。「信頼度」は、例えば画像認識により検出されたカテゴリの信頼性を表すスコアであり、例えば数値によって表される。本実施形態では一例として、信頼度は、0から1までの範囲の数値で表され、数値が大きいほど物体領域がカテゴリに合致する可能性が高いことを示している。
検出部12は、例えばDNN(Deep Neural Networks)等を用いた公知の画像認識手法により、入力画像に写り込んだ商品、商品棚、及び値札のいずれかに対応する物体領域を検出する。本実施形態では一例として、検出される物体領域は、矩形領域である。ただし、検出される物体領域の形状は、矩形以外の形状(例えば円形、楕円形、物体の輪郭に沿った形状等)であってもよい。検出部12は、例えば、入力画像から検出された画像特徴(例えば特徴点及び輪郭等)に基づいて、物体領域の四隅の座標、或いは対角関係にある2つの座標(例えば物体領域の左上隅及び右下隅の座標)を取得する。本実施形態では、物体領域が矩形領域であるため、物体領域の左上隅及び右下隅の2つの座標から、物体領域の残りの2つの座標(すなわち、左下隅及び右上隅の座標)が特定される。また、検出部12は、入力画像から検出された画像特徴に基づいて、各物体領域について、物体領域のカテゴリを特定すると共に、当該物体領域が当該カテゴリに合致する可能性の高さを示す信頼度を算出する。検出部12は、例えば、複数の商品、商品棚、及び値札等をDNNによって学習することにより事前に得られている画像特徴と入力画像から検出された画像特徴とを比較することにより、物体領域の左上隅及び右下隅の座標を取得し、当該物体領域のカテゴリの分類及び信頼度の算出を行う。
図2は、検出部12により検出された物体領域の一例を示す図である。図2の例では、上述した検出部12により、3つの商品棚領域102、4つの商品領域103、及び5つの値札領域104が物体領域として検出(推定)されている。ここで、商品棚領域102は、カテゴリが「商品棚」であると検出された物体領域であり、商品領域103は、カテゴリが「商品」であると検出された物体領域であり、値札領域104は、カテゴリが「値札」であると検出された物体領域である。また、図2に示すように、本実施形態では、横方向(水平方向)をx方向(左から右に向かう方向が正方向)とし、高さ方向(鉛直方向)をy方向(上から下に向かう方向が正方向)とし、物体領域の位置をxy座標によって表す。
図2に示すように、複数の物体領域は、互いに重なる場合がある。例えば値札と商品棚(棚板)のように、実際に物体同士(ここでは値札及び商品棚)が重なっていることに起因して物体領域同士(ここでは商品棚領域102及び値札領域104)が重なる場合がある。また、実際には存在しない物体が誤検出されることに起因して物体領域同士が重なる場合がある。具体的には、実際に存在する物体に対応する物体領域(正しく検出された物体領域)と実際には存在しない物体に対応する物体領域(誤検出された物体領域)とが重なる場合がある。
各物体領域は、検出部12により検出された信頼度及びカテゴリ、並びに左上隅及び右下隅の座標を含む検出結果情報によって特定され得る。検出結果情報は、例えば、後述するメモリ1002及びストレージ1003等の記憶装置に記憶される。図2の例では、商品領域103aは、信頼度が「0.92」であり、左上隅の座標が(xmin1,ymin1)であり、右下隅の座標が(xmax1,ymax1)であり、カテゴリが「商品」であることを示す検出結果情報R1により特定されている。また、商品棚領域102aは、信頼度が「0,40」であり、左上隅の座標が(xmin2,ymin2)であり、右下隅の座標が(xmax2,ymax2)であり、カテゴリが「商品棚」であることを示す検出結果情報R2により特定されている。
分類部13は、検出部12により検出された複数の物体領域(商品棚領域102、商品領域103、及び値札領域104)を、各物体領域に関連付けられた信頼度に基づいていくつかのクラスに分類する。本実施形態では、分類部13は、信頼度が予め定められた閾値t(例えば0.7)以上の物体領域を高信頼度領域に分類し、信頼度が閾値t未満の物体領域を低信頼度領域に分類する。図2の例では、信頼度が閾値t以上である商品領域103aは高信頼度領域に分類され、信頼度が閾値t未満である商品棚領域102aは低信頼度領域に分類される。
補正部14は、信頼度に基づく分類に関して予め定められた関係を有する複数の物体領域同士の位置関係に基づいて、当該複数の物体領域のうちの少なくとも1つの物体領域の信頼度を補正する。例えば、補正部14は、低信頼度領域に分類された物体領域である低信頼度物体領域と高信頼度領域に分類された物体領域である高信頼度物体領域との位置関係に基づいて、低信頼度物体領域の信頼度を補正する。具体的には、補正部14は、一の低信頼度物体領域と一以上の高信頼度物体領域との重複度に基づいて、当該一の低信頼度物体領域の信頼度を補正する。より具体的には、補正部14は、入力画像に含まれる低信頼度物体領域のうちから1つの低信頼度物体領域を処理対象として選択し、選択された低信頼度物体領域と重複する領域を有する高信頼度物体領域を抽出する。そして、補正部14は、選択された低信頼度物体領域と抽出された一以上の高信頼度物体領域との重複度に基づいて、選択された低信頼度物体領域の信頼度を補正する。
ここで、領域Aと領域Bとの重複度とは、領域Aと領域Bとが重なる度合いを示す指標である。例えば、重複度は、領域A及び領域Bが重なる重複領域(積集合A∩B)の面積を、領域Aの面積又は領域Bの面積で除算した値であってもよい。また、重複度は、領域A及び領域Bが重なる重複領域(積集合A∩B)の面積を、領域Aと領域Bとの和集合A∪Bの面積で除算した値であってもよい。いずれの場合にも、重複度は、0から1までの値をとり、1に近いほど領域Aと領域Bとが重なる度合いが大きいことを示している。補正部14により実行される補正処理の具体的な方法については後述する。
物体領域決定部15は、各物体領域の最終的な信頼度(すなわち、補正部14による補正処理が実行された後の信頼度)に基づいて、最終的な物体領域を決定する。具体的には、物体領域決定部15は、最終的な信頼度が閾値t(ここでは0.7)以上である物体領域(すなわち、最終的に確定した高信頼度物体領域)を、正しく検出された物体領域として抽出する。一方、物体領域決定部15は、最終的な信頼度が閾値t未満である物体領域(すなわち、最終的に確定した低信頼度物体領域)については、誤検出された物体領域(例えば背景等)であるとみなし、正しく検出された物体領域として抽出しない。
このような処理により、補正部14により実行される補正処理の結果に基づく物体検出が実現される。例えば、検出部12による画像認識において0.7未満の信頼度が検出された低信頼度物体領域のうち、高信頼度物体領域との位置関係からカテゴリ(検出部12により検出されたカテゴリ)に合致する可能性が高いと考えられる低信頼度物体領域の信頼度を上方補正することが可能となる。その結果、物体の検出漏れ(取りこぼし)を低減し、物体検出の精度を向上させることができる。
以下、補正部14により実行される補正処理のいくつかの例(第1~第5の補正処理)について説明する。第1~第3の補正処理では、補正部14は、低信頼度領域に分類された商品棚領域102である低信頼度棚領域と高信頼度物体領域との位置関係に基づいて、低信頼度棚領域の信頼度を補正する。低信頼度棚領域は、低信頼度物体領域のうちカテゴリが商品棚である領域である。第4及び第5の補正処理では、補正部14は、低信頼度領域に分類された商品領域103である低信頼度商品領域と高信頼度物体領域との位置関係に基づいて、低信頼度商品領域の信頼度を補正する。低信頼度商品領域は、低信頼度物体領域のうちカテゴリが商品である領域である。
(第1の補正処理)
図3を参照して、第1の補正処理について説明する。図3において、高信頼度物体領域の外周枠は実線で示されており、低信頼度物体領域の外周枠は破線で示されている。ここでは、低信頼度物体領域として、低信頼度棚領域201,202が存在している。第1の補正処理では、補正部14は、低信頼度棚領域201,202と高信頼度物体領域との重複度(位置関係)に基づいて、低信頼度棚領域201,202の信頼度を補正する。具体的には、補正部14は、低信頼度棚領域201,202と高信頼度領域に分類された商品領域103である高信頼度商品領域との重複度に基づいて、低信頼度棚領域201,202の信頼度を補正する。
図3を参照して、第1の補正処理について説明する。図3において、高信頼度物体領域の外周枠は実線で示されており、低信頼度物体領域の外周枠は破線で示されている。ここでは、低信頼度物体領域として、低信頼度棚領域201,202が存在している。第1の補正処理では、補正部14は、低信頼度棚領域201,202と高信頼度物体領域との重複度(位置関係)に基づいて、低信頼度棚領域201,202の信頼度を補正する。具体的には、補正部14は、低信頼度棚領域201,202と高信頼度領域に分類された商品領域103である高信頼度商品領域との重複度に基づいて、低信頼度棚領域201,202の信頼度を補正する。
より具体的には、補正部14は、低信頼度棚領域201,202と高信頼度商品領域との重複度が小さいほど低信頼度棚領域201,202の信頼度が大きくなるように、低信頼度棚領域201,202の信頼度を補正する。このような第1の補正処理は、以下の考え方に基づいている。通常、商品は商品棚(棚板)の上に陳列されるため、商品棚を正面から捉えた入力画像101において、商品棚領域102と商品領域103とは重ならないと考えられる。したがって、商品棚領域102と商品領域103との重複度が小さいほど、当該商品棚領域102が正しく検出された物体領域(すなわち、実際に存在する商品棚に対応する領域)である可能性が高いと考えられる。第1の補正処理によれば、このような考え方に基づいて、低信頼度棚領域201,202の信頼度を適切に補正できる。
例えば、補正部14は、低信頼度棚領域201,202のそれぞれについて、下記の式1及び式2に基づいて信頼度を補正する。
式1:補正score=score×α
式2:α=c1+{S(A1)-S(A1∩A2)}/S(A1)
式1:補正score=score×α
式2:α=c1+{S(A1)-S(A1∩A2)}/S(A1)
ここで、「score」は、補正前の信頼度である。「補正score」は、補正後の信頼度である。「c1」は、予め定められた定数である。「A1」は、低信頼度棚領域(低信頼度棚領域201又は低信頼度棚領域202)を示す。「A2」は、当該低信頼度棚領域と重複する領域を有する高信頼度商品領域を示す。このような高信頼度商品領域が複数存在する場合、A2は当該複数の高信頼度商品領域の和集合である。S(X)は、領域Xの面積を示す。
式2は、低信頼度棚領域と高信頼度商品領域との重複領域(積集合)の面積「S(A1∩A2)」が当該低信頼度棚領域の面積「S(A1)」に対して小さいほどαが大きくなるように設計されている。定数c1は、例えばユーザによって任意に定められ得る。例えば「c1=0.6」である場合、重複度(ここでは「S(A1∩A2)/S(A1)」)が0.6より小さくなるときにαが1よりも大きくなり、補正scoreがscoreよりも大きくなる。
図3の例では、低信頼度棚領域201は、高信頼度商品領域(3つの商品領域103)と重なる領域を有しており、上述した重複度が0.6以上である可能性がある。すなわち、αが1以下となる可能性がある。αが1以下となる場合には、低信頼度棚領域201の補正後の信頼度(補正score)は、元の値(score)よりも大きくならないため、低信頼度棚領域201は、低信頼度領域に分類されたままとなる。
一方、低信頼度棚領域202と重なる領域を有する高信頼度商品領域は存在しないため、低信頼度棚領域202については、αが1より大きくなり、補正後の信頼度(補正score)が元の値(score)よりも大きくなる。このため、低信頼度棚領域202の補正後の信頼度は、閾値t(ここでは0.7)以上となる可能性がある。この場合、低信頼度棚領域202は、物体領域決定部15によって、正しく検出された物体領域として抽出されることになる。
以上のように、第1の補正処理によれば、商品棚領域102と商品領域103との重複度を補助情報として用いることにより、低信頼度棚領域201,202の信頼度を適切に補正することができ、商品棚領域の検出漏れ(取りこぼし)を低減することができる。
(第2の補正処理)
図3を参照して、第2の補正処理について説明する。第2の補正処理では、補正部14は、第1の補正処理と同様に、低信頼度棚領域201,202と高信頼度物体領域との重複度(位置関係)に基づいて、低信頼度棚領域201,202の信頼度を補正する。具体的には、補正部14は、低信頼度棚領域201,202と高信頼度領域に分類された値札領域104である高信頼度値札領域との重複度に基づいて、低信頼度棚領域201,202の信頼度を補正する。
図3を参照して、第2の補正処理について説明する。第2の補正処理では、補正部14は、第1の補正処理と同様に、低信頼度棚領域201,202と高信頼度物体領域との重複度(位置関係)に基づいて、低信頼度棚領域201,202の信頼度を補正する。具体的には、補正部14は、低信頼度棚領域201,202と高信頼度領域に分類された値札領域104である高信頼度値札領域との重複度に基づいて、低信頼度棚領域201,202の信頼度を補正する。
より具体的には、補正部14は、低信頼度棚領域201,202と高信頼度値札領域との重複度が大きいほど低信頼度棚領域201,202の信頼度が大きくなるように、低信頼度棚領域201,202の信頼度を補正する。このような第2の補正処理は、以下の考え方に基づいている。通常、値札は商品棚(棚板)の正面側(客が対面する側)の側面に取り付けられていることが多いため、商品棚を正面から捉えた入力画像101において、商品棚領域102と値札領域104とは重なると考えられる。したがって、商品棚領域102と値札領域104との重複度が大きいほど、当該商品棚領域102が正しく検出された物体領域(すなわち、実際に存在する商品棚に対応する領域)である可能性が高いと考えられる。第2の補正処理によれば、このような考え方に基づいて、低信頼度棚領域201,202の信頼度を適切に補正できる。
例えば、補正部14は、低信頼度棚領域201,202のそれぞれについて、下記の式3及び式4に基づいて信頼度を補正する。
式3:補正score=score×β
式4:β=c2+S(A1∩A3)/S(A1)
式3:補正score=score×β
式4:β=c2+S(A1∩A3)/S(A1)
ここで、「score」、「補正score」、及びS(X)の定義は、第1の補正処理において説明した通りである。「c2」は、予め定められた定数である。「A1」は、低信頼度棚領域(低信頼度棚領域201又は低信頼度棚領域202)を示す。「A3」は、当該低信頼度棚領域と重複する領域を有する高信頼度値札領域を示す。このような高信頼度値札領域が複数存在する場合には、A3は当該複数の高信頼度値札領域の和集合である。
式4は、低信頼度棚領域と高信頼度値札領域との重複領域(積集合)の面積「S(A1∩A3)」が当該低信頼度棚領域の面積「S(A1)」に対して大きいほどβが大きくなるように設計されている。定数c2は、例えばユーザによって任意に定められ得る。例えば「c2=0.8」である場合、重複度(ここでは「S(A1∩A3)/S(A1)」)が0.2より大きくなるときにβが1よりも大きくなり、補正scoreがscoreよりも大きくなる。
図3の例では、低信頼度棚領域202は、高信頼度値札領域(3つの値札領域104)と重なる領域を有しており、上述した重複度が0.2よりも大きい可能性がある。すなわち、βが1より大きくなる可能性がある。βが1より大きくなる場合には、低信頼度棚領域202の補正後の信頼度(補正score)は、元の値(score)よりも大きくなるため、低信頼度棚領域202の補正後の信頼度は、閾値t(ここでは0.7)以上となる可能性がある。この場合、低信頼度棚領域202は、物体領域決定部15によって、正しく検出された物体領域として抽出されることになる。
一方、低信頼度棚領域201と重なる領域を有する高信頼度値札領域は存在しないため、低信頼度棚領域201については、βは1未満となる。このため、低信頼度棚領域201は、低信頼度領域に分類されたままとなる。
以上のように、第2の補正処理によれば、商品棚領域102と値札領域104との重複度を補助情報として用いることにより、低信頼度棚領域201,202の信頼度を適切に補正することができ、商品棚領域の検出漏れ(取りこぼし)を低減することができる。
(第3の補正処理)
図4を参照して、第3の補正処理について説明する。第3の補正処理では、補正部14は、低信頼度棚領域203と、それぞれ高信頼度領域に分類された商品棚領域102である複数(ここでは一例として3つ)の高信頼度棚領域102b,102c,102dとの位置関係に基づいて、低信頼度棚領域203の信頼度を補正する。以下、第3の補正処理の具体例について説明する。
図4を参照して、第3の補正処理について説明する。第3の補正処理では、補正部14は、低信頼度棚領域203と、それぞれ高信頼度領域に分類された商品棚領域102である複数(ここでは一例として3つ)の高信頼度棚領域102b,102c,102dとの位置関係に基づいて、低信頼度棚領域203の信頼度を補正する。以下、第3の補正処理の具体例について説明する。
まず、補正部14は、少なくとも3つ以上の高信頼度棚領域(ここでは3つの高信頼度棚領域102b,102c,102d)の位置に基づいて、隣り合う高信頼度棚領域102b,102c,102d同士の間隔を算出する。具体的には、補正部14は、下段の高信頼度棚領域102bと中段の高信頼度棚領域102cとの間隔d1と、高信頼度棚領域102cと上段の高信頼度棚領域102dとの間隔d2と、を算出する。本実施形態では一例として、間隔d1,d2は、隣り合う2つの高信頼度棚領域の各々の中心点同士の距離である。図4の例では、高信頼度棚領域102bの中心点P1の座標(cx1,cy1)は、高信頼度棚領域102bの左上隅の座標(x1,y1)と右下隅の座標(x2,y2)から、下記式5のように算出される。
式5:(cx1,cy1)=((x1+x2)/2,(y1+y2)/2)
式5:(cx1,cy1)=((x1+x2)/2,(y1+y2)/2)
同様にして、高信頼度棚領域102cの中心点P2の座標(cx2,cy2)及び高信頼度棚領域102dの中心点P3の座標(cx3,cy3)についても求めることができる。補正部14は、このようにして得られた中心点P1,P2,P3の各々の座標に基づいて、間隔d1,d2を算出することができる。
次に、補正部14は、低信頼度棚領域203を間に挟んで隣接する2つの高信頼度棚領域(ここでは、高信頼度棚領域102c,102d)同士の間隔d2と、他の高信頼度棚領域同士の間隔(ここでは、高信頼度棚領域102b,102c同士の間隔d1)と、低信頼度棚領域203の位置(ここでは低信頼度棚領域203の中心点P0のy座標であるcy)と、2つの高信頼度棚領域102c,102dの位置(ここでは、それぞれの中心点P2,P3のy座標であるcy2,cy3)とに基づいて、低信頼度棚領域203の信頼度を補正する。なお、高信頼度棚領域が4つ以上存在する場合には、他の高信頼度棚領域同士の間隔は複数存在する。この場合、補正部14は、当該複数の間隔から得られる代表値(例えば平均値等)を、間隔d1の代わりに用いてもよい。
例えば、補正部14は、低信頼度棚領域203を間に挟んで隣接する2つの高信頼度棚領域102c,102d同士の間隔d2が他の間隔d1と比較して所定割合だけ大きい場合に、低信頼度棚領域203の信頼度を補正する。これは以下の考え方に基づいている。通常、商品棚は高さ方向(y方向)に等間隔に配置されると考えられる。このため、高信頼度棚領域102c,102d同士の間隔d2が通常の商品棚同士の間隔(高信頼度棚領域102b,102c同士の間隔d1)よりも大きい場合、高信頼度棚領域102c,102dの間に1枚の商品棚が存在する可能性が高いと考えられる。したがって、上記補正によれば、商品棚が存在する可能性が高いと考えられる位置に低信頼度棚領域203が存在する場合に、当該低信頼度棚領域203の信頼度を適切に補正(上方修正)できる。
例えば、補正部14は、「d2>d1」かつ「3×d1>d2>2×d1」が成立する場合に、間隔d2が間隔d1と比較して所定割合だけ大きいと判定し、下記の式6~式8に基づいて、低信頼度棚領域203の信頼度を補正する。
式6:補正score=score×γ
式7:γ=c3+f(y)
式6:補正score=score×γ
式7:γ=c3+f(y)
ここで、「score」及び「補正score」の定義は、第1の補正処理において説明した通りである。「c3」は、予め定められた定数である。「f(y)」は、平均値μ、標準偏差σの正規分布に従う関数である。「μ」は、例えば、高信頼度棚領域102c,102dのそれぞれの中心点P2,P3を結ぶ線分の中点の高さ位置(y座標)である。具体的には、「μ=(cy2+cy3)/2」である。「σ」は、例えば「d1/4」である。式8において、変数yには、低信頼度棚領域203の中心点P0のy座標(cy)が代入される。式7及び式8によれば、低信頼度棚領域203の高さ位置(cy)が、商品棚が等間隔に配置されるという前提において商品棚が存在する可能性が最も高い高さ位置(すなわち、μ)に近いほど、補正項であるγの値が大きくなる。ただし、式8は一例であり、f(y)は、上記のような考え方に基づくγが得られる関数であればよく、他の関数によって表されてもよい。定数c3は、例えばユーザによって任意に定められ得る。例えば「c3=0.8」である場合、f(y)が0.2より大きくなる場合に、補正scoreがscoreよりも大きくなる。
以上のように、第3の補正処理によれば、商品棚は通常等間隔に配置されるという考え方に基づいて、商品棚領域102の配置間隔(位置関係)を補助情報として用いることにより、低信頼度棚領域203の信頼度を適切に補正することができる。その結果、商品棚領域の検出漏れ(取りこぼし)を低減することができる。
なお、第3の補正処理は、上記例に限られない。例えば、補正部14は、1つの低信頼度棚領域と2つの高信頼度棚領域とが順不同で高さ方向(y方向)に沿ってほぼ等間隔に配置されている場合に、当該低信頼度棚領域の信頼度を上方修正してもよい。例えば、補正部14は、上述した1つの低信頼度棚領域及び2つの高信頼度棚領域からなる3つの棚領域について、上段の棚領域及び中段の棚領域の間隔と中段の棚領域及び下段の棚領域の間隔との差が予め定められた閾値以下である場合に、これら3つの棚領域がほぼ等間隔に配置されていると判定し、当該低信頼度棚領域の信頼度を上方修正してもよい。
(第4の補正処理)
図5及び図6を参照して、第4の補正処理について説明する。第4の補正処理では、補正部14は、低信頼度商品領域204と高信頼度商品領域との重複度(位置関係)に基づいて、低信頼度商品領域204の信頼度を補正する。具体的には、補正部14は、低信頼度商品領域204と高信頼度商品領域との重複度が小さいほど低信頼度商品領域204の信頼度が大きくなるように、低信頼度商品領域204の信頼度を補正する。このような第4の補正処理は、以下の考え方に基づいている。通常、商品棚を正面から見た場合に、複数の商品は、商品同士が重ならないように配置されると考えられる。このため、商品棚を正面から捉えた入力画像101において、複数の商品領域103同士は通常重ならないと考えられる。したがって、他の商品領域103との重複度が小さい商品領域103ほど、正しく検出された物体領域(すなわち、実際に存在する商品に対応する領域)である可能性が高いと考えられる。第4の補正処理によれば、このような考え方に基づいて、低信頼度商品領域204の信頼度を適切に補正できる。
図5及び図6を参照して、第4の補正処理について説明する。第4の補正処理では、補正部14は、低信頼度商品領域204と高信頼度商品領域との重複度(位置関係)に基づいて、低信頼度商品領域204の信頼度を補正する。具体的には、補正部14は、低信頼度商品領域204と高信頼度商品領域との重複度が小さいほど低信頼度商品領域204の信頼度が大きくなるように、低信頼度商品領域204の信頼度を補正する。このような第4の補正処理は、以下の考え方に基づいている。通常、商品棚を正面から見た場合に、複数の商品は、商品同士が重ならないように配置されると考えられる。このため、商品棚を正面から捉えた入力画像101において、複数の商品領域103同士は通常重ならないと考えられる。したがって、他の商品領域103との重複度が小さい商品領域103ほど、正しく検出された物体領域(すなわち、実際に存在する商品に対応する領域)である可能性が高いと考えられる。第4の補正処理によれば、このような考え方に基づいて、低信頼度商品領域204の信頼度を適切に補正できる。
例えば、補正部14は、低信頼度商品領域204について、下記の式9及び式10に基づいて信頼度を補正する。
式9:補正score=score×δ
式10:δ=c4-S(A4∩A5)/S(A4∪A5)
式9:補正score=score×δ
式10:δ=c4-S(A4∩A5)/S(A4∪A5)
ここで、「score」、「補正score」、及びS(X)の定義は、第1の補正処理において説明した通りである。「c4」は、予め定められた定数である。「A4」は、低信頼度商品領域(ここでは、低信頼度商品領域204)を示す。「A5」は、当該低信頼度商品領域と重複する領域を有する高信頼度商品領域を示す。このような高信頼度商品領域が複数存在する場合、A5は当該複数の高信頼度商品領域の和集合である。
式10は、低信頼度商品領域204と高信頼度商品領域との重複度(ここでは「S(A4∩A5)/S(A4∪A5)」)が小さいほどδが大きくなるように設計されている。定数c4は、例えばユーザによって任意に定められ得る。例えば「c4=1.2」である場合、重複度が0.2より小さくなるときにδが1よりも大きくなり、補正scoreがscoreよりも大きくなる。
図6の(A)の例では、低信頼度商品領域204と重なる領域を有する高信頼度商品領域(他の商品領域103)は存在しないため、上述した重複度は0となる。その結果、δが1より大きくなり、補正後の信頼度(補正score)が元の値(score)よりも大きくなる。このため、低信頼度商品領域204の補正後の信頼度は閾値t(ここでは0.7)以上となる可能性がある。この場合、低信頼度商品領域204は、物体領域決定部15によって、正しく検出された物体領域として抽出されることになる。
一方、図6の(B)の例では、低信頼度商品領域204は、隣接する高信頼度商品領域(2つの商品領域103)と重複する領域を有しており、上述した重複度が0.2以上である可能性がある。すなわち、δが1以下となる可能性がある。δが1以下となる場合には、低信頼度商品領域204の補正後の信頼度(補正score)は、元の値(score)よりも大きくならないため、低信頼度商品領域204は、低信頼度領域に分類されたままとなる。
以上のように、第4の補正処理によれば、商品領域103同士の重複度を補助情報として用いることにより、低信頼度商品領域204の信頼度を適切に補正することができ、商品領域の検出漏れ(取りこぼし)を低減することができる。
(第5の補正処理)
図7及び図8を参照して、第5の補正処理について説明する。第5の補正処理では、補正部14は、低信頼度商品領域205とそれぞれ高信頼度領域に分類された複数の商品の物体領域(すなわち、複数の高信頼度商品領域)を囲む領域との重複度に基づいて、低信頼度商品領域205の信頼度を補正する。例えば、低信頼度商品領域205は、複数の商品をまとめてパッケージングしており、単一の商品として販売されるセット商品(商品の一種)に対応する領域(セット商品領域)である場合がある。第5の補正処理によれば、低信頼度商品領域205がセット商品領域である可能性が高いと考えられる場合に、低信頼度商品領域205の信頼度を適切に補正(上方修正)できる。これにより、セット商品領域を精度良く検出することができる。
図7及び図8を参照して、第5の補正処理について説明する。第5の補正処理では、補正部14は、低信頼度商品領域205とそれぞれ高信頼度領域に分類された複数の商品の物体領域(すなわち、複数の高信頼度商品領域)を囲む領域との重複度に基づいて、低信頼度商品領域205の信頼度を補正する。例えば、低信頼度商品領域205は、複数の商品をまとめてパッケージングしており、単一の商品として販売されるセット商品(商品の一種)に対応する領域(セット商品領域)である場合がある。第5の補正処理によれば、低信頼度商品領域205がセット商品領域である可能性が高いと考えられる場合に、低信頼度商品領域205の信頼度を適切に補正(上方修正)できる。これにより、セット商品領域を精度良く検出することができる。
図7は、セット商品領域105の一例を示す図である。図7の例では、セット商品領域105に対応するセット商品は、2つの商品領域103に対応する2つの単体商品を含んでいる。なお、セット商品は、3つ以上の単体商品を含んでもよい。この場合、セット商品領域105は、3つ以上の商品領域103を含む。
以下、図8を参照して、第5の補正処理の具体例について説明する。補正部14は、まず、高信頼度商品領域(ここでは、3つの高信頼度商品領域103b,103c,103d)に対して、陳列情報を関連付ける。陳列情報は、高信頼度商品領域に対応する商品が陳列されている場所(例えば高さ位置及び水平位置)を、商品棚又は他の商品に対する相対位置関係によって示した情報である。高さ位置を示す情報は、例えば、高信頼度商品領域に対応する商品が陳列されている商品棚の段数を示す情報である。水平位置を示す情報は、例えば、高信頼度商品領域に対応する商品が商品棚の何列目に陳列されているか(すなわち、左端又は右端から何番目の商品であるか)を示す情報である。
補正部14は、例えば高信頼度商品領域の座標(検出結果情報に含まれる座標)と、商品棚領域102の座標とを比較することにより、当該高信頼度商品領域の高さ位置を示す情報(例えば段数)を取得する。さらに、補正部14は、例えば高信頼度商品領域同士のx座標を比較することにより、各高信頼度商品領域の水平位置を示す情報(例えば列数)を取得する。図8の例では、補正部14は、例えば、高信頼度商品領域103bの陳列情報として「1段目1列目」を示す情報を取得し、高信頼度商品領域103cの陳列情報として「1段目2列目」を示す情報を取得し、高信頼度商品領域103dの陳列情報として「1段目3列目」を示す情報を取得する。
次に、補正部14は、低信頼度商品領域205と重複する領域を有する高信頼度商品領域が複数存在するか否かを判定する。図8の(A)の例では、複数の高信頼度商品領域(2つの高信頼度商品領域103c,103d)が低信頼度商品領域205と重複するため、上記判定結果はYESとなる。この場合、補正部14は、当該複数の高信頼度商品領域の各々の陳列情報(ここでは段数及び列数)に基づいて、当該複数の高信頼度商品領域が互いに隣接する領域であるか否かを判定する。例えば、補正部14は、当該複数の高信頼度商品領域の段数が同一であり、列数が連続している場合に、当該複数の高信頼度商品領域が互いに隣接する領域であると判定する。図8の(A)の例では、高信頼度商品領域103c,103dは、上記要件を満たすため、互いに隣接する領域であると判定される。この場合、当該複数の高信頼度商品領域103c,103dに対応する商品は、同一のセット商品に属する単体商品である可能性がある。そこで、このような場合には、補正部14は、更に以下の処理を実行する。
図8の(B)に示すように、補正部14は、互いに隣接する領域であると判定された高信頼度商品領域103c,103dを結合した結合領域110を画定する。例えば、補正部14は、高信頼度商品領域103c,103dの各々の四隅の座標のうち最小のx座標を結合領域110の左上隅及び左下隅のx座標とする。また、補正部14は、高信頼度商品領域103c,103dの各々の四隅の座標のうち最小のy座標を結合領域110の左上隅及び右上隅のy座標とする。また、補正部14は、高信頼度商品領域103c,103dの各々の四隅の座標のうち最大のx座標を結合領域110の右上隅及び右下隅のx座標とする。また、補正部14は、高信頼度商品領域103c,103dの各々の四隅の座標のうち最大のy座標を結合領域110の左下隅及び右下隅のy座標とする。このような処理により、図8の(B)に示すような矩形状の結合領域110が画定される。
次に、補正部14は、低信頼度商品領域205と結合領域110との重複度εを、下記の式11に基づいて算出する。ここで、「A6」は低信頼度商品領域205を示し、「A7」は結合領域110を示す。
式11:ε=S(A6∩A7)/S(A6∪A7)
式11:ε=S(A6∩A7)/S(A6∪A7)
補正部14は、例えば、低信頼度商品領域205の信頼度と重複度εとに基づいて、低信頼度商品領域205の信頼度を補正する。例えば、補正部14は、低信頼度商品領域205の信頼度が閾値t1以上であり、かつ、重複度εが閾値t2以上である場合に、低信頼度商品領域205の信頼度を閾値t(ここでは0.7)以上の値に補正してもよい。この場合、物体領域決定部15により、低信頼度商品領域205は、高信頼度商品領域103c,103dに対応する商品を含む商品領域(セット商品領域)として抽出されることになる。なお、閾値t1,t2は、例えばユーザによって任意に定められ得る。
以上のように、第5の補正処理によれば、低信頼度商品領域205と複数の商品領域103をまとめた結合領域110との重複度を補助情報として用いることにより、低信頼度商品領域205の信頼度を適切に補正することができる。その結果、セット商品領域の検出漏れ(取りこぼし)を低減することができる。
以上説明した第1~第5の補正処理は、それぞれ単独で実行されてもよいし、組み合わせて実行されてもよい。例えば、補正部14は、補正処理の対象となる低信頼度棚領域について、第1~第3の補正処理のうちから選択された2つ以上の補正処理を実行してもよい。例えば、第1~第3の補正処理の全てを実行する場合には、当該低信頼度棚領域の信頼度は、下記の式12に基づいて補正される。このように上記第1~第5の補正処理を組み合わせることにより、複数の観点に基づいて、より高精度に物体領域の検出漏れを低減することができる。
式12:補正score=score×α×β×γ
式12:補正score=score×α×β×γ
(第6の補正処理)
図9を参照して、第6の補正処理について説明する。第6の補正処理では、補正部14は、いずれも高信頼度領域に分類された物体領域である複数の高信頼度物体領域同士の重複度に基づいて、少なくとも1つの高信頼度物体領域の信頼度を補正する。ここでは一例として、補正部14は、高信頼度棚領域と高信頼度商品領域との重複度に基づいて、当該高信頼度棚領域又は当該高信頼度商品領域の信頼度を補正する。
図9を参照して、第6の補正処理について説明する。第6の補正処理では、補正部14は、いずれも高信頼度領域に分類された物体領域である複数の高信頼度物体領域同士の重複度に基づいて、少なくとも1つの高信頼度物体領域の信頼度を補正する。ここでは一例として、補正部14は、高信頼度棚領域と高信頼度商品領域との重複度に基づいて、当該高信頼度棚領域又は当該高信頼度商品領域の信頼度を補正する。
より具体的には、補正部14は、高信頼度棚領域102eと一以上の高信頼度商品領域(ここでは、3つの高信頼度商品領域103e,103f,103g)との重複度が大きいほど、高信頼度棚領域102e又は高信頼度商品領域103e,103f,103gの信頼度が小さくなるように、高信頼度棚領域102e又は高信頼度商品領域103e,103f,103gの信頼度を補正する。このような第6の補正処理は、以下の考え方に基づいている。通常、商品棚(棚板)の正面側(客が対面する側)の上部に商品が置かれるため、商品棚を正面から捉えた入力画像101において、商品棚領域102と商品領域103とは重ならないと考えられる。したがって、商品棚領域102と商品領域103との重複度が大きいほど、商品棚領域102又は商品領域103のいずれかが誤って検出された物体領域(すなわち、実際には存在しない商品棚又は商品に対応する領域)である可能性が高いと考えられる。第6の補正処理によれば、このような考え方に基づいて、高信頼度棚領域102e又は高信頼度商品領域103e,103f,103gの信頼度を適切に補正できる。
ここでは一例として、補正部14は、高信頼度棚領域102eの信頼度と高信頼度商品領域103e,103f,103gの信頼度の平均値とを比較する。ここで、高信頼度棚領域102eの信頼度が高信頼度商品領域103e,103f,103gの信頼度の平均値よりも大きい場合には、高信頼度棚領域102eよりも高信頼度商品領域103e,103f,103gの方が誤って検出された可能性が高いと考えられる。したがって、この場合には、補正部14は、高信頼度商品領域103e,103f,103gの信頼度を補正する。一方、高信頼度棚領域102eの信頼度が高信頼度商品領域103e,103f,103gの信頼度の平均値よりも小さい場合には、高信頼度商品領域103e,103f,103gよりも高信頼度棚領域102eの方が誤って検出された可能性が高いと考えられる。したがって、この場合には、補正部14は、高信頼度棚領域102eの信頼度を補正する。
例えば、補正部14は、高信頼度棚領域102e又は高信頼度商品領域103e,103f,103gについて、下記の式13及び式14に基づいて信頼度を補正する。
式13:補正score=score×ζ
式14:ζ=c5―S(A8∩A9)/S(A8)
式13:補正score=score×ζ
式14:ζ=c5―S(A8∩A9)/S(A8)
ここで、「score」、「補正score」、及びS(X)の定義は、第1の補正処理において説明した通りである。ただし、高信頼度棚領域(ここでは高信頼度棚領域102e)の信頼度(以下「棚score」ともいう)が一以上の高信頼度商品領域(ここでは高信頼度商品領域103e,103f,103g)の信頼度の平均値(以下「商品score」ともいう)よりも大きい場合には、「score」及び「補正score」は、各高信頼度商品領域の信頼度及び補正後の信頼度を示す。一方、棚scoreが商品scoreよりも小さい場合には、「score」及び「補正score」は、高信頼度棚領域の信頼度及び補正後の信頼度を示す。なお、棚scoreと商品scoreとが同一の場合には、「score」及び「補正score」は前者のように定められてもよいし、後者のように定められてもよい。或いは、そのような場合には、第6の補正処理は実行されなくてもよい。
「c5」は、予め定められた定数である。「A8」及び「A9」は、次のように決まる。すなわち、棚scoreが商品scoreよりも大きい場合には、「A8」は高信頼度棚領域を示し、「A9」は一以上の高信頼度商品領域の和集合を示す。逆に、棚scoreが商品scoreよりも小さい場合には、「A8」は一以上の高信頼度商品領域の和集合を示し、「A9」は高信頼度棚領域を示す。なお、棚scoreと商品scoreとが同一の場合には、「A8」及び「A9」は前者のように定められてもよいし、後者のように定められてもよい。或いは、そのような場合には、第6の補正処理は実行されなくてもよい。
例えば、高信頼度棚領域102eの棚scoreが0.9であり、高信頼度商品領域103e,103f,103gのscoreがそれぞれ0.80,0.75,0.70であるとする。この場合、棚scoreである0.9は、高信頼度商品領域103e,103f,103gの商品scoreである0.75(=(0.80+0.75+0.70)/3)よりも大きいため、A8は高信頼度棚領域102eを示し、A9は高信頼度商品領域103e,103f,103gの和集合を示す。
式14は、高信頼度棚領域と高信頼度商品領域(高信頼度商品領域が複数の場合には、複数の高信頼度商品領域の和集合)との重複領域(積集合)の面積「S(A8∩A9)」が高信頼度棚領域及び高信頼度商品領域のうち信頼度の大きい方の領域(A8)の面積「S(A8)」に対して大きいほどζが小さくなるように設計されている。定数c5は、例えばユーザによって任意に定められ得る。例えば「c5=1.4」である場合、重複度(ここでは「S(A8∩A9)/S(A8)」)が0.4より大きくなるときにζが1よりも小さくなり、補正scoreがscoreよりも小さくなる。
図9の例では、高信頼度棚領域102eは、高信頼度商品領域(3つの高信頼度商品領域103e,103f,103g)と重なる領域を有しており、上述した重複度が0.4よりも大きい可能性がある。すなわち、ζが1より小さくなる可能性がある。ここで、高信頼度棚領域102eの棚scoreが0.9であり、高信頼度商品領域103e,103f,103gの商品scoreが0.8である場合について考える。この場合、高信頼度商品領域103e,103f,103gの信頼度が補正対象となる。このとき、ζが1より小さくなる場合には、高信頼度商品領域103e,103f,103gのそれぞれの補正後の信頼度(補正score)は、元の値(score)よりも小さくなり、閾値t(ここでは0.7)未満となる可能性がある。この場合、高信頼度商品領域103e,103f,103gのうち補正後の信頼度が閾値t未満である領域は、物体領域決定部15によって、正しく検出された物体領域ではないとして除外されることになる。
以上のように、第6の補正処理によれば、商品棚領域102と商品領域103との重複度を補助情報として用いることにより、高信頼度棚領域102e又は高信頼度商品領域103e,103f,103gの信頼度を適切に補正することができ、商品棚領域又は商品領域の誤検出(商品棚又は商品が実際には存在しない領域を誤って検出すること)を低減することができる。
なお、補正部14は、例えば上記と同様の考え方に基づいて、その他の高信頼度物体領域同士の組み合わせに対して補正処理を行ってもよい。例えば、補正部14は、互いに重なる領域を有する複数の高信頼度商品領域同士の重複度に基づいて、いずれか1つの領域(例えば複数の高信頼度商品領域のうち信頼度が最も小さい領域)の信頼度を補正してもよい。
次に、図10及び図11を参照して、検出装置10の動作の一例について説明する。ここでは、第1~第5の補正処理が実行される場合の処理手順について説明する。
まず、画像取得部11は、画像認識の実行対象となる入力画像101を取得する(ステップS1)。
続いて、検出部12は、当該入力画像101に対する画像認識を実行し、当該画像認識により検出された複数の物体領域の各々について、物体領域のカテゴリと、物体領域が当該カテゴリに合致する可能性の高さを示す信頼度と、を検出する(ステップS2)。これにより、図2に示すように、複数の物体領域(商品棚領域102、商品領域103、及び値札領域104)が検出される。
続いて、分類部13は、検出された複数の物体領域を、各物体領域に関連付けられた信頼度に基づいて高信頼度領域と低信頼度領域とに分類する(ステップS3)。例えば、分類部13は、信頼度が予め定められた閾値t(例えば0.7)以上の物体領域を高信頼度領域に分類し、信頼度が閾値t未満の物体領域を低信頼度領域に分類する。
続いて、補正部14は、低信頼度領域に分類された物体領域(低信頼度物体領域)と高信頼度領域に分類された物体領域(高信頼度物体領域)との位置関係(例えば、上述したような重複度及び配置間隔等)に基づいて、低信頼度物体領域の信頼度を補正する(ステップS4)。例えば、補正部14は、低信頼度棚領域に対して、上述した第1~第3の補正処理の少なくとも1つを実行することにより、当該低信頼度棚領域の信頼度を補正する。また、補正部14は、低信頼度商品領域に対して、上述した第4及び第5の補正処理の少なくとも1つを実行することにより、当該低信頼度商品領域の信頼度を補正する。
図11を参照して、ステップS4の処理手順の具体例について説明する。まず、補正部14は、処理対象(信頼度を補正する対象)となる低信頼度物体領域を1つ選択する(ステップS41)。選択された低信頼度物体領域が商品棚領域(すなわち、低信頼度棚領域)である場合(ステップS42:YES)、補正部14は、当該信頼度棚領域に対して、上述した第1~第3の補正処理のうち少なくとも1つを実行する(ステップS43)。一方、選択された低信頼度物体領域が商品棚領域ではなく(ステップS42:NO)、商品領域(すなわち、低信頼度商品領域)である場合(ステップS44:YES)、補正部14は、当該低信頼度商品領域に対して、上述した第4及び第5の補正処理のうち少なくとも1つを実行する(ステップS45)。なお、本実施形態では、選択された低信頼度物体領域が商品棚領域でも商品領域でもない場合(ステップS44:NO)、補正処理を実行しない。補正部14は、全ての低信頼度物体領域について処理が完了するまで上記処理を繰り返し実行する。具体的には、補正部14は、未完了の低信頼度物体領域が存在する場合(ステップS46:NO)、ステップS41に戻り、全ての低信頼度物体領域についての処理が完了した場合(ステップS46:YES)、ステップS4の補正処理を完了する。
続いて、物体領域決定部15は、各物体領域の最終的な信頼度(すなわち、補正部14による補正処理が実行された後の信頼度)に基づいて、最終的な物体領域を決定する(ステップS5)。
次に、図12を参照して、第6の補正処理の処理手順について説明する。図12は、第6の補正処理が実行される場合のステップS4(図10参照)の処理手順の一例を示している。
まず、補正部14は、互いに重なる高信頼度棚領域及び一以上の高信頼度商品領域を抽出する(ステップS141)。図9の例では、高信頼度棚領域102eと3つの高信頼度商品領域103e,103f,103gとが抽出される。続いて、補正部14は、高信頼度棚領域102eの信頼度(棚score)と3つの高信頼度商品領域103e,103f,103gの信頼度の平均値(商品score)とを比較する(ステップS142)。棚scoreが商品scoreより大きい場合(ステップS142:YES)、補正部14は、高信頼度商品領域103e,103f,103gのそれぞれを補正対象として、上述した第6の補正処理を実行する(ステップS143)。一方、棚scoreが商品score以下の場合(ステップS142:NO)、補正部14は、高信頼度棚領域102eを補正対象として、上述した第6の補正処理を実行する(ステップS144)。
次に、図13を参照して、コンピュータを検出装置10として機能させるための検出プログラムPについて説明する。
検出プログラムPは、メインモジュールP10、画像取得モジュールP11、検出モジュールP12、分類モジュールP13、補正モジュールP14、及び物体領域決定モジュールP15を備える。メインモジュールP10は、検出装置10としての処理を統括的に制御する部分である。画像取得モジュールP11、検出モジュールP12、分類モジュールP13、補正モジュールP14、及び物体領域決定モジュールP15を実行することにより実現される機能は、それぞれ、検出装置10の画像取得部11、検出部12、分類部13、補正部14、及び物体領域決定部15の機能と同様である。
検出プログラムPは、例えば、CD-ROM、DVD若しくはROM等の記録媒体又は半導体メモリによって提供される。また、検出プログラムPは、搬送波に重畳されたコンピュータデータ信号としてネットワークを介して提供されてもよい。
(作用効果)
以上述べた検出装置10によれば、入力画像101に対する画像認識により検出された複数の物体領域の各々は、検出された信頼度に基づいていくつかのクラス(本実施形態では一例として、高信頼度領域及び低信頼度領域の2つのクラス)に分類される。そして、信頼度に基づく分類に関して予め定められた関係を有する複数の物体領域同士の位置関係に基づいて、少なくとも1つの物体領域の信頼度が補正される。この構成により、物体領域同士の位置関係と信頼度に基づく分類の関係性とに基づいて、物体領域の信頼度を適切に補正することが可能となる。また、信頼度に基づく分類に関して予め定められた関係を有する複数の物体領域同士の位置関係に着目することにより、検出された全ての物体領域同士(例えば互いに重複する全ての物体領域同士)の位置関係を考慮する場合と比較して、処理の効率化を図ることができる。より具体的には、物体領域同士の位置関係の比較を、上述したように予め定められた関係を有する物体領域同士についてのみ実行することにより、計算量の削減及びメモリ使用量の低減を図ることができる。すなわち、プロセッサ、メモリ等のハードウェア資源の処理負荷及び使用量を低減できる。以上により、検出装置10によれば、画像に写った物体を精度良くかつ効率的に検出できる。
以上述べた検出装置10によれば、入力画像101に対する画像認識により検出された複数の物体領域の各々は、検出された信頼度に基づいていくつかのクラス(本実施形態では一例として、高信頼度領域及び低信頼度領域の2つのクラス)に分類される。そして、信頼度に基づく分類に関して予め定められた関係を有する複数の物体領域同士の位置関係に基づいて、少なくとも1つの物体領域の信頼度が補正される。この構成により、物体領域同士の位置関係と信頼度に基づく分類の関係性とに基づいて、物体領域の信頼度を適切に補正することが可能となる。また、信頼度に基づく分類に関して予め定められた関係を有する複数の物体領域同士の位置関係に着目することにより、検出された全ての物体領域同士(例えば互いに重複する全ての物体領域同士)の位置関係を考慮する場合と比較して、処理の効率化を図ることができる。より具体的には、物体領域同士の位置関係の比較を、上述したように予め定められた関係を有する物体領域同士についてのみ実行することにより、計算量の削減及びメモリ使用量の低減を図ることができる。すなわち、プロセッサ、メモリ等のハードウェア資源の処理負荷及び使用量を低減できる。以上により、検出装置10によれば、画像に写った物体を精度良くかつ効率的に検出できる。
また、補正部14は、分類部13によって低信頼度領域に分類された物体領域である低信頼度物体領域と分類部13によって高信頼度領域に分類された物体領域である高信頼度物体領域との位置関係に基づいて、低信頼度物体領域の信頼度を補正する。本実施形態では、上述した第1~第5の補正処理が、当該補正に該当する。この場合、高信頼度物体領域との位置関係からカテゴリに合致する可能性が高いと考えられる低信頼度物体領域の信頼度を上方修正することが可能となる。また、高信頼度物体領域との位置関係からカテゴリに合致する可能性が低いと考えられる低信頼度物体領域の信頼度を下方修正することも可能となる。その結果、物体の検出漏れ(取りこぼし)を低減すると共に、物体検出の精度を向上させることができる。
また、補正部14は、低信頼度物体領域と高信頼度物体領域との重複度に基づいて、低信頼度物体領域の信頼度を補正する。本実施形態では、上述した第1、第2、第4、及び第5の補正処理が、当該補正に相当する。このような構成によれば、一般的に物体同士が重複する位置関係にあるか否かという観点に基づいて、低信頼度物体領域の信頼度を適切に補正(上方修正又は下方修正)できる。その結果、物体の検出漏れ(取りこぼし)を低減すると共に、物体検出の精度を向上させることができる。
また、補正部14は、低信頼度棚領域と高信頼度商品領域との重複度が小さいほど低信頼度棚領域の信頼度が大きくなるように、低信頼度棚領域の信頼度を補正する。本実施形態では、上述した第1の補正処理が、当該補正に相当する。このような構成によれば、商品棚及び商品が通常重複しない位置関係にあるという観点に基づいて、低信頼度棚領域の信頼度を適切に補正できる。その結果、商品棚の検出漏れ(取りこぼし)を低減でき、商品棚構成を精度良く再現することが可能となる。
また、補正部14は、低信頼度棚領域と高信頼度値札領域との重複度が大きいほど低信頼度棚領域の信頼度が大きくなるように、低信頼度棚領域の信頼度を補正する。本実施形態では、上述した第2の補正処理が、当該補正に相当する。このような構成によれば、商品棚及び値札が通常重複する位置関係にあるという観点に基づいて、低信頼度棚領域の信頼度を適切に補正できる。その結果、商品棚の検出漏れ(取りこぼし)を低減でき、商品棚構成を精度良く再現することが可能となる。
また、補正部14は、低信頼度棚領域と複数の高信頼度棚領域との位置関係に基づいて、低信頼度棚領域の信頼度を補正する。より具体的には、補正部14は、少なくとも3つ以上の高信頼度棚領域の位置に基づいて、隣り合う高信頼度棚領域同士の間隔を算出し、低信頼度棚領域を間に挟んで隣接する2つの高信頼度棚領域同士の間隔と、他の高信頼度棚領域同士の間隔と、低信頼度棚領域の位置と、上記2つの高信頼度棚領域の位置とに基づいて、低信頼度棚領域の信頼度を補正する。本実施形態では、上述した第3の補正処理が、当該補正に相当する。このような構成によれば、複数の商品棚が通常高さ方向に等間隔に配置される位置関係にあるという観点に基づいて、低信頼度棚領域の信頼度を適切に補正できる。その結果、商品棚の検出漏れ(取りこぼし)を低減でき、商品棚構成を精度良く再現することが可能となる。
また、補正部14は、低信頼度商品領域と高信頼度商品領域との重複度が小さいほど低信頼度商品領域の信頼度が大きくなるように、低信頼度商品領域の信頼度を補正する。本実施形態では、上述した第4の補正処理が、当該補正に相当する。このような構成によれば、商品同士が通常重複しない位置関係にあるという観点に基づいて、低信頼度商品領域の信頼度を適切に補正できる。その結果、商品の検出漏れ(取りこぼし)を低減でき、商品棚構成を精度良く再現することが可能となる。
また、補正部14は、低信頼度商品領域と複数の高信頼度商品領域を囲む結合領域との重複度に基づいて、低信頼度商品領域の信頼度を補正する。本実施形態では、上述した第5の補正処理が、当該補正に相当する。このような構成によれば、低信頼度商品領域が、複数の商品を含むセット商品に対応するセット商品領域である可能性が高いと考えられる場合に、低信頼度棚領域の信頼度を適切に補正できる。その結果、セット商品の検出漏れ(取りこぼし)を低減でき、商品棚構成を精度良く再現することが可能となる。
また、補正部14は、複数の高信頼度物体領域同士の重複度に基づいて、少なくとも1つの高信頼度物体領域の信頼度を補正する。本実施形態では、上述した第6の補正処理が、当該補正に該当する。このような構成によれば、一般的に物体同士が重複する位置関係にあるか否かという観点に基づいて、高信頼度物体領域の信頼度を適切に補正できる。
また、補正部14は、高信頼度棚領域と高信頼度商品領域との重複度が大きいほど、高信頼度棚領域又は高信頼度商品領域の信頼度が小さくなるように、高信頼度棚領域又は高信頼度商品領域の信頼度を補正する。本実施形態では、上述した第6の補正処理が、当該補正に該当する。このような構成によれば、商品棚及び商品が通常重複しない位置関係にあるという観点に基づいて、高信頼度棚領域又は高信頼度商品領域の信頼度を適切に補正(下方修正)できる。その結果、物体の誤検出を低減でき、物体検出の精度を向上させることができる。
なお、上記実施形態の説明に用いたブロック図(図1)は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線で)接続し、これら複数の装置により実現されてもよい。
例えば、上記実施形態における検出装置10は、上記実施形態の検出装置10の処理を行うコンピュータとして機能してもよい。上述した通り、図14は、本実施形態に係る検出装置10のハードウェア構成の一例を示す図である。上述の検出装置10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、及びバス1007等を含むコンピュータ装置として構成されてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニット等に読み替えることができる。検出装置10のハードウェア構成は、図14に示された各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
検出装置10における各機能は、プロセッサ1001、メモリ1002等のハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタ等を含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、及び/又はデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、検出装置10の検出部12は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよく、図1に示した他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されてもよい。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)等の少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)等と呼ばれてもよい。メモリ1002は、上記実施形態に係る検出方法(例えば図9及び図10のフローチャートに示される手順等)を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュール等を保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)等の光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップ等の少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバ、その他の適切な媒体であってもよい。
通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュール等ともいう。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサ等)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプ等)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001及びメモリ1002等の各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
また、検出装置10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)等のハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
以上、本発明について詳細に説明したが、当業者にとっては、本発明が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本発明は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更された態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本発明に対して何ら制限的な意味を有するものではない。
例えば、本実施形態では、分類部13は、複数の物体領域を、信頼度が閾値t以上の高信頼度領域と信頼度が閾値t未満の低信頼度領域との2つのクラスに分類したが、これは一例に過ぎない。例えば、分類部13は、複数の物体領域を3つ以上のクラスに分類してもよい。この場合、検出装置10(特に補正部14)は、例えば複数のクラスのうち信頼度が所定の基準よりも低い一又は複数のクラスのいずれかに分類された領域を本実施形態の低信頼度領域とみなしてもよい。同様に、検出装置10は、複数のクラスのうち信頼度が所定の基準よりも高い一又は複数のクラスのいずれかに分類された領域を本実施形態の低信頼度領域とみなしてもよい。なお、低信頼度領域に属するか否かの判定に用いられる基準と高信頼度領域に属するか否かの判定に用いられる基準とは、同一であってもよいし、互いに異なっていてもよい。
例えば、分類部13は、複数の物体領域を、信頼度が低いクラス(低信頼度クラス)、信頼度が中程度のクラス(中信頼度クラス)、及び信頼度が高いクラス(高信頼度クラス)の3つのクラスに分類してもよい。この場合、検出装置10(特に補正部14)は、例えば、低信頼度クラスに分類された領域を本実施形態の低信頼度領域とみなすと共に、高信頼度クラスに分類された領域を本実施形態の高信頼度領域とみなして、本実施形態で説明した補正処理を行ってもよい。或いは、検出装置10は、複数のクラスを低信頼度領域又は高信頼度領域に含めてもよい。例えば、上記のように3つのクラスに分類する場合において、検出装置10は、低信頼度クラスに分類された領域及び中信頼度クラスに分類された領域の両方を本実施形態の低信頼度領域とみなしてもよいし、中信頼度クラスに分類された領域及び高信頼度クラスに分類された領域の両方を本実施形態の高信頼度領域とみなしてもよい。
本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャート等は、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理されてもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本明細書で説明した各態様/実施形態は単独で用いられてもよいし、組み合わせて用いられてもよいし、実行に伴って切り替えて用いられてもよい。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能等を意味するよう広く解釈されるべきである。
また、ソフトウェア、命令等は、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)等の有線技術及び/又は赤外線、無線及びマイクロ波等の無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
本明細書で説明した情報及び信号等は、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップ等は、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
また、本明細書で説明した情報、パラメータ等は、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。
上述したパラメータに使用される名称はいかなる点においても限定的なものではない。さらに、これらのパラメータを使用する数式等は、本明細書で明示的に開示したものと異なる場合もある。
本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」との両方を意味する。
「含む(include)」、「含んでいる(including)」、及びそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「又は(or)」及び「或いは(or)」は、排他的論理和ではないことが意図される。
本明細書において、文脈又は技術的に明らかに1つのみしか存在しない装置であることが示されていなければ、複数の装置をも含むものとする。
本明細書で使用する「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「決定」したとみなす事等を含み得る。また、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「決定」したとみなす事等を含み得る。また、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)等した事を「決定」したとみなす事を含み得る。つまり、「決定」は、何らかの動作を「決定」したとみなす事を含み得る。
本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。
10…検出装置、11…画像取得部、12…検出部(検出部)、13…分類部、14…補正部、15…物体領域決定部、101…入力画像、102…商品棚領域、102e…高信頼度棚領域、103…商品領域、103e,103f,103g…高信頼度商品領域、104…値札領域、105…セット商品領域、110…結合領域、201,202,203…低信頼度棚領域、204,205…低信頼度商品領域、P…検出プログラム、P10…メインモジュール、P11…画像取得モジュール、P12…検出モジュール、P13…分類モジュール、P14…補正モジュール、P15…物体領域決定モジュール。
Claims (12)
- 入力画像に対する画像認識により検出された複数の物体領域の各々について、前記物体領域のカテゴリと、前記物体領域が前記カテゴリに合致する可能性の高さを示す信頼度と、を検出する検出部と、
複数の前記物体領域を、前記信頼度に基づいて分類する分類部と、
前記信頼度に基づく分類に関して予め定められた関係を有する複数の前記物体領域同士の位置関係に基づいて、当該複数の前記物体領域のうちの少なくとも1つの物体領域の前記信頼度を補正する補正部と、
を備える検出装置。 - 前記補正部は、前記分類部によって低信頼度領域に分類された物体領域である低信頼度物体領域と前記分類部によって高信頼度領域に分類された物体領域である高信頼度物体領域との位置関係に基づいて、前記低信頼度物体領域の前記信頼度を補正する、
請求項1に記載の検出装置。 - 前記補正部は、前記低信頼度物体領域と前記高信頼度物体領域との重複度に基づいて、前記低信頼度物体領域の前記信頼度を補正する、
請求項2に記載の検出装置。 - 前記補正部は、前記低信頼度領域に分類された商品棚の物体領域である低信頼度棚領域と前記高信頼度領域に分類された商品の物体領域である高信頼度商品領域との重複度が小さいほど前記低信頼度棚領域の前記信頼度が大きくなるように、前記低信頼度棚領域の前記信頼度を補正する、
請求項2又は3に記載の検出装置。 - 前記補正部は、前記低信頼度領域に分類された商品棚の物体領域である低信頼度棚領域と前記高信頼度領域に分類された値札の物体領域である高信頼度値札領域との重複度が大きいほど前記低信頼度棚領域の前記信頼度が大きくなるように、前記低信頼度棚領域の前記信頼度を補正する、
請求項2~4のいずれか一項に記載の検出装置。 - 前記補正部は、前記低信頼度領域に分類された商品棚の物体領域である低信頼度棚領域とそれぞれ前記高信頼度領域に分類された商品棚の物体領域である複数の高信頼度棚領域との位置関係に基づいて、前記低信頼度棚領域の前記信頼度を補正する、
請求項2~5のいずれか一項に記載の検出装置。 - 前記補正部は、
少なくとも3つ以上の前記高信頼度棚領域の位置に基づいて、隣り合う前記高信頼度棚領域同士の間隔を算出し、
前記低信頼度棚領域を間に挟んで隣接する2つの前記高信頼度棚領域同士の前記間隔と、他の前記高信頼度棚領域同士の間隔と、前記低信頼度棚領域の位置と、前記2つの前記高信頼度棚領域の位置とに基づいて、前記低信頼度棚領域の前記信頼度を補正する、
請求項6に記載の検出装置。 - 前記補正部は、前記低信頼度領域に分類された商品の物体領域である低信頼度商品領域と前記高信頼度領域に分類された商品の物体領域である高信頼度商品領域との重複度が小さいほど前記低信頼度商品領域の前記信頼度が大きくなるように、前記低信頼度商品領域の前記信頼度を補正する、
請求項2~7のいずれか一項に記載の検出装置。 - 前記補正部は、前記低信頼度領域に分類された商品の物体領域である低信頼度商品領域とそれぞれ前記高信頼度領域に分類された複数の商品の物体領域を囲む領域との重複度に基づいて、前記低信頼度商品領域の前記信頼度を補正する、
請求項2~8のいずれか一項に記載の検出装置。 - 前記補正部は、いずれも前記高信頼度領域に分類された物体領域である複数の高信頼度物体領域同士の重複度に基づいて、少なくとも1つの前記高信頼度物体領域の前記信頼度を補正する、
請求項2に記載の検出装置。 - 前記補正部は、前記高信頼度領域に分類された商品棚の物体領域である高信頼度棚領域と前記高信頼度領域に分類された商品の物体領域である高信頼度商品領域との重複度が大きいほど、前記高信頼度棚領域又は前記高信頼度商品領域の前記信頼度が小さくなるように、前記高信頼度棚領域又は前記高信頼度商品領域の前記信頼度を補正する、
請求項10に記載の検出装置。 - コンピュータを、
入力画像に対する画像認識により検出された複数の物体領域の各々について、前記物体領域のカテゴリと、前記物体領域が前記カテゴリに合致する可能性の高さを示す信頼度と、を検出する検出部と、
複数の前記物体領域を、前記信頼度に基づいて分類する分類部と、
前記信頼度に基づく分類に関して予め定められた関係を有する複数の前記物体領域同士の位置関係に基づいて、当該複数の前記物体領域のうちの少なくとも1つの物体領域の前記信頼度を補正する補正部と、
として機能させる検出プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017212913 | 2017-11-02 | ||
JP2017212913 | 2017-11-02 | ||
PCT/JP2018/040683 WO2019088223A1 (ja) | 2017-11-02 | 2018-11-01 | 検出装置及び検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019088223A1 JPWO2019088223A1 (ja) | 2020-11-26 |
JP7149953B2 true JP7149953B2 (ja) | 2022-10-07 |
Family
ID=66331936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019550485A Active JP7149953B2 (ja) | 2017-11-02 | 2018-11-01 | 検出装置及び検出プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7149953B2 (ja) |
WO (1) | WO2019088223A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149450A (zh) * | 2019-06-26 | 2020-12-29 | 浙江汉朔电子科技有限公司 | 排面检查系统及方法 |
JP2022528022A (ja) * | 2020-03-09 | 2022-06-08 | ▲図▼▲霊▼通▲諾▼(北京)科技有限公司 | スーパーマーケット商品棚上の商品の分析方法及びシステム |
JP7443210B2 (ja) * | 2020-09-17 | 2024-03-05 | Lineヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000149018A (ja) | 1998-09-10 | 2000-05-30 | Fuji Photo Film Co Ltd | 画像処理方法、画像処理装置及び記録媒体 |
JP2010176504A (ja) | 2009-01-30 | 2010-08-12 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
JP2011170684A (ja) | 2010-02-19 | 2011-09-01 | Panasonic Corp | 対象物追跡装置、対象物追跡方法、および対象物追跡プログラム |
WO2014136559A1 (ja) | 2013-03-04 | 2014-09-12 | 日本電気株式会社 | 物品管理システム、情報処理装置およびその制御方法と制御プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3596792B2 (ja) * | 1996-10-07 | 2004-12-02 | 富士写真フイルム株式会社 | 異常陰影候補領域を含む局所領域の抽出方法および装置 |
JP6517652B2 (ja) * | 2015-10-01 | 2019-05-22 | 日本電信電話株式会社 | 物体顕著性マップ算出装置、方法、及びプログラム |
-
2018
- 2018-11-01 WO PCT/JP2018/040683 patent/WO2019088223A1/ja active Application Filing
- 2018-11-01 JP JP2019550485A patent/JP7149953B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000149018A (ja) | 1998-09-10 | 2000-05-30 | Fuji Photo Film Co Ltd | 画像処理方法、画像処理装置及び記録媒体 |
JP2010176504A (ja) | 2009-01-30 | 2010-08-12 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
JP2011170684A (ja) | 2010-02-19 | 2011-09-01 | Panasonic Corp | 対象物追跡装置、対象物追跡方法、および対象物追跡プログラム |
WO2014136559A1 (ja) | 2013-03-04 | 2014-09-12 | 日本電気株式会社 | 物品管理システム、情報処理装置およびその制御方法と制御プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2019088223A1 (ja) | 2019-05-09 |
JPWO2019088223A1 (ja) | 2020-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200151657A1 (en) | Information processing apparatus, control method, and program | |
JP7191851B2 (ja) | 棚割情報生成装置及び棚割情報生成プログラム | |
JP7149953B2 (ja) | 検出装置及び検出プログラム | |
US10949665B2 (en) | Reducing scale estimate errors in shelf images | |
JP6366024B2 (ja) | 画像化された文書からテキストを抽出する方法及び装置 | |
US20120249415A1 (en) | Server, terminal device, and grouping method | |
JP2023109773A (ja) | 画像処理装置、画像処理方法、および、プログラム | |
US9082000B2 (en) | Image processing device and image processing method | |
US11475673B2 (en) | Image recognition device for detecting a change of an object, image recognition method for detecting a change of an object, and image recognition system for detecting a change of an object | |
US11816923B2 (en) | Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium | |
CN111783665A (zh) | 一种动作识别方法、装置、存储介质和电子设备 | |
US20180307896A1 (en) | Facial detection device, facial detection system provided with same, and facial detection method | |
US20220415049A1 (en) | Enhancing detection of occluded objects in a multiple object detection system | |
US11036974B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2018156308A (ja) | 情報処理装置、情報処理システム及びプログラム | |
US20140169625A1 (en) | Image processing apparatus, method, and storage medium | |
US11288816B2 (en) | Image detection device, image detection method and storage medium storing program | |
JP2898562B2 (ja) | ナンバープレート決定方法 | |
US20230130674A1 (en) | Computer-readable recording medium storing learning program, learning method, and information processing apparatus | |
CN112424849A (zh) | 信息处理装置、信息处理方法及程序 | |
JP7108553B2 (ja) | 棚割情報生成装置及び棚割情報生成プログラム | |
WO2013128839A1 (ja) | 画像認識システム、画像認識方法およびコンピュータ・プログラム | |
JP2007206963A (ja) | 画像処理装置及び画像処理方法及びプログラム及び記憶媒体 | |
JP2022185872A (ja) | 画像処理装置、画像処理方法、撮像装置 | |
JP2018156544A (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220927 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7149953 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |