JP2021015368A - 物品推定プログラム、物品推定装置、及び物品推定方法 - Google Patents

物品推定プログラム、物品推定装置、及び物品推定方法 Download PDF

Info

Publication number
JP2021015368A
JP2021015368A JP2019128596A JP2019128596A JP2021015368A JP 2021015368 A JP2021015368 A JP 2021015368A JP 2019128596 A JP2019128596 A JP 2019128596A JP 2019128596 A JP2019128596 A JP 2019128596A JP 2021015368 A JP2021015368 A JP 2021015368A
Authority
JP
Japan
Prior art keywords
article
estimation
estimation result
candidate information
specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019128596A
Other languages
English (en)
Other versions
JP7346951B2 (ja
Inventor
義勝 御宿
Yoshimasa Mishuku
義勝 御宿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019128596A priority Critical patent/JP7346951B2/ja
Publication of JP2021015368A publication Critical patent/JP2021015368A/ja
Application granted granted Critical
Publication of JP7346951B2 publication Critical patent/JP7346951B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

【課題】複数の物品を撮影した画像に写っている物品の推定精度を向上させる。【解決手段】コンピュータは、画像集合に対する学習処理により生成された、画像に写っている物品を推定する推定モデルに基づいて、複数の物品を撮影した処理対象画像内で複数の物品それぞれが写っている物品領域と、物品領域に写っている物品とを推定する。次に、コンピュータは、処理対象画像内の複数の物品領域のうち特定の物品領域に写っている特定の物品の推定結果が、複数の物品領域のうち残りの物品領域に写っている物品の推定結果に近づくように、特定の物品の推定結果を補正する。【選択図】図6

Description

本発明は、物品推定プログラム、物品推定装置、及び物品推定方法に関する。
スーパーマーケット、コンビニエンスストア等の店舗の陳列棚に陳列されている商品を識別する商品識別システムが知られている(例えば、特許文献1を参照)。この商品識別システムでは、商品画像から算出される商品特徴情報を学習することで商品マスターデータが生成され、商品マスターデータを用いて、陳列棚の画像データから検出された商品が識別される。
例えば、複数の店舗における商品の識別結果を売上データとともに収集することで、商品の識別結果をビッグデータ解析に利用することが可能になる。
特開2015−210651号公報
機械学習により生成される学習モデルを用いて、店舗等の棚を撮影した画像に写っている商品を推定する際、商品を正しく推定することが困難な場合がある。
なお、かかる問題は、店舗等の棚に陳列された商品を推定する場合に限らず、様々な場所に置かれた物品を推定する場合において生ずるものである。
1つの側面において、本発明は、複数の物品を撮影した画像に写っている物品の推定精度を向上させることを目的とする。
1つの案では、物品推定プログラムは、以下の処理をコンピュータに実行させる。
(1)コンピュータは、画像集合に対する学習処理により生成された、画像に写っている物品を推定する推定モデルに基づいて、複数の物品を撮影した処理対象画像内で複数の物品それぞれが写っている物品領域と、物品領域に写っている物品とを推定する。
(2)コンピュータは、処理対象画像内の複数の物品領域のうち特定の物品領域に写っている特定の物品の推定結果が、複数の物品領域のうち残りの物品領域に写っている物品の推定結果に近づくように、特定の物品の推定結果を補正する。
1つの側面によれば、複数の物品を撮影した画像に写っている物品の推定精度を向上させることができる。
ボトルに対する推定結果を示す図である。 物品推定装置の機能的構成図である。 物品推定処理のフローチャートである。 物品推定装置の具体例を示す機能的構成図である。 学習処理を示す図である。 物品推定処理を示す図である。 画像から検出された直線を示す図である。 ボトルの矩形領域を示す図である。 文字列を示す図である。 物品推定処理の具体例を示すフローチャートである。 サイズ推定処理のフローチャートである。 文字列抽出処理のフローチャートである。 情報処理装置のハードウェア構成図である。
以下、図面を参照しながら、実施形態を詳細に説明する。
機械学習により生成される学習モデルを用いて、店舗等の棚を撮影した画像に写っている商品を推定する場合、商品名だけではなく、商品のサイズ、同一ブランドの類似商品等も含めて識別できることが望ましい。商品のサイズは、縦横の長さ、体積、容量、重量等を含む。例えば、ペットボトル飲料の場合、ペットボトルの容量が商品のサイズに該当する。以下では、ペットボトルを指して単に「ボトル」と記載することがある。
棚の画像は、スマートフォン、タブレット等の携帯端末装置を用いて撮影されることが多いため、撮影位置と棚に陳列された商品との位置関係によっては、学習モデルで商品を推定することが困難な場合がある。特に、商品のサイズを正しく推定することは困難である。
また、機械学習の教師データとして、サイズを含む商品情報とサイズを含まない商品情報とが混在している場合、識別対象の商品の画像特徴のみに基づいて、その商品のサイズを推定すると、必ずしも正しい推定結果が得られるとは限らない。
図1は、ペットボトル飲料であるお茶のボトルに対する推定結果の例を示している。図1の画像には、店舗の棚に陳列されたお茶のボトルが写っており、各ボトルが写っている物品領域の推定結果として、矩形領域101−1〜矩形領域101−6が抽出されている。矩形領域101−1〜矩形領域101−6それぞれに写っている商品の推定結果としては、例えば、以下のような推定結果が得られる。
R1 商品名:A茶 容量:250ml 尤度:0.7
R2 商品名:A茶 容量:500ml 尤度:0.6
R3 商品名:A茶 容量:250ml 尤度:0.6
R4 商品名:B茶 容量:250ml 尤度:0.8
R5 商品名:B茶 容量:250ml 尤度:0.8
R6 商品名:B茶 容量:250ml 尤度:0.9
推定結果R1〜推定結果R6は、矩形領域101−1〜矩形領域101−6それぞれに写っている商品の推定結果を表し、商品名、容量、及び推定の尤度を含む。
例えば、矩形領域101−1のボトルの推定結果R1に含まれる商品名は“A茶”であり、容量は“250ml”であり、尤度は“0.7”である。矩形領域101−2のボトルの推定結果R2に含まれる商品名は“A茶”であり、容量は“500ml”であり、尤度は“0.6”である。
この例では、棚に陳列されたボトルの容量がすべて250mlであるため、推定結果R2の“500ml”は、容量に対する誤った推定結果を表している。したがって、推定結果R2の“500ml”を、正しい容量である“250ml”に修正することが望ましい。
図2は、実施形態の物品推定装置の機能的構成例を示している。図2の物品推定装置201は、記憶部211、推定部212、補正部213、及び出力部214を含む。記憶部211は、画像集合に対する学習処理により生成された、画像に写っている物品を推定する推定モデル221と、複数の物品を撮影した処理対象画像222とを記憶する。推定部212及び補正部213は、推定モデル221及び処理対象画像222を用いて物品推定処理を行う。
図3は、図2の物品推定装置201が行う物品推定処理の例を示すフローチャートである。まず、推定部212は、推定モデル221に基づいて、処理対象画像222内で複数の物品それぞれが写っている物品領域と、物品領域に写っている物品とを推定する(ステップ301)。
次に、補正部213は、処理対象画像222内の複数の物品領域のうち特定の物品領域に写っている特定の物品の推定結果が、残りの物品領域に写っている物品の推定結果に近づくように、特定の物品の推定結果を補正する(ステップ302)。そして、出力部214は、特定の物品の補正後の推定結果と、残りの物品領域に写っている物品の推定結果とを出力する(ステップ303)。
図2の物品推定装置201によれば、複数の物品を撮影した画像に写っている物品の推定精度を向上させることができる。
図4は、図2の物品推定装置201の具体例を示している。図4の物品推定装置401は、記憶部411、画像取得部412、学習部413、推定部414、文字認識部415、補正部416、及び出力部417を含む。記憶部411、推定部414、補正部416、及び出力部417は、図2の記憶部211、推定部212、補正部213、及び出力部214にそれぞれ対応する。
撮像装置402は、例えば、CCD(Charged-Coupled Device)、CMOS(Complementary Metal-Oxide-Semiconductor)等の撮像素子を有するカメラであり、所定の場所に置かれた物品の画像を撮影する。撮像装置402は、スマートフォン、タブレット等の携帯端末装置であってもよい。
所定の場所は店舗の棚であってもよく、工場又は倉庫のラックであってもよい。物品は、店舗の棚に陳列された商品であってもよく、工場又は倉庫のラックに置かれた製品、部品、装置等であってもよい。商品は、飲料、食品、衣料品、日用品等であってもよい。
撮像装置402は、通信ネットワークを介して、撮影した画像を物品推定装置401へ送信することができる。画像取得部412は、通信ネットワークを介して、撮像装置402が出力する画像を取得し、処理対象画像423として記憶部411に格納する。処理対象画像423は、図2の処理対象画像222に対応する。
記憶部411は、学習データとして用いられる画像集合421を記憶している。画像集合421に含まれる複数の画像は、処理対象画像423に写っている物品と同様の物品を撮影した画像であり、事前に用意される。これらの画像は、撮像装置402によって撮影された画像であってもよく、別の撮像装置によって撮影された画像であってもよい。
学習部413は、画像集合421に対する学習処理を行うことで推定モデル422を生成する。推定モデル422は、画像に写っている物品を推定する学習モデルであり、図2の推定モデル221に対応する。推定モデル422としては、ニューラルネットワーク、サポートベクタマシン、決定木等を用いることができる。
図5は、物品推定装置401が行う学習処理の例を示している。画像集合421に含まれる画像501には、ボトル502−1〜ボトル502−7が写っている。ボトル502−i(i=1〜7)は、店舗の棚に陳列されたお茶、水等の飲料のボトルである。ボトル502−1及びボトル502−2は、棚の上段に陳列されており、ボトル502−3〜ボトル502−7は、棚の下段に陳列されている。
画像501に対する教師データ(正解データ)は、各ボトル502−iを示す分類情報と、各ボトル502−iが写っている物品領域を示す領域情報と、各ボトル502−iの角度を示す角度情報とを含む。
分類情報は、商品名、サイズ(容量)等を含む。ボトル502−1〜ボトル502−7それぞれの領域情報は、画像501内における矩形領域503−1〜矩形領域503−7それぞれの座標を表す。
角度情報は、画像501を撮影した撮像装置の撮影方向に対する、ボトル502−iの特徴が表れている方向の角度を表す。ボトル502−iの形状はほとんどが類似しているため、ボトル502−iの特徴は、ボトル502−i上のラベルに表示された商品名に表れていることが多い。この場合、商品名が表示されている面の法線方向が、ボトル502−iの特徴が表れている方向となる。
しかし、ボトル502−iが段上で回転することによって、商品名が表示されている面も回転するため、矩形領域503−i内の画像特徴が大きく変化する。このため、ボトル502−iの角度を区別せずに単一の分類として学習すると、回転によって維持される画像特徴のみが学習される傾向が大きくなり、推定モデル422が有意な特徴抽出器になりにくい。
そこで、教師データに角度情報を含めておき、ボトル502−iの角度毎に異なるラベルの平面的な画像特徴を学習することで、様々な角度で陳列されたボトル502−iを、推定モデル422により精度良く推定することが可能になる。
例えば、ボトル502−2の教師データ511において、商品名は“A茶 緑茶”であり、容量は“320ml”であり、矩形領域503−2の座標は(xmin2,ymin2,xmax2,ymax2)であり、角度は“350°”である。x座標は、画像501の水平方向の座標であり、y座標は、画像501の垂直方向の座標である。xmin2は、矩形領域503−2のx座標の最小値を表し、ymin2は、矩形領域503−2のy座標の最小値を表し、xmax2は、矩形領域503−2のx座標の最大値を表し、ymax2は、矩形領域503−2のy座標の最大値を表す。
また、ボトル502−7の教師データ512において、商品名は“A茶 緑茶”であり、容量は“525ml”であり、矩形領域503−7の座標は(xmin7,ymin7,xmax7,ymax7)であり、角度は“20°”である。xmin7は、矩形領域503−7のx座標の最小値を表し、ymin7は、矩形領域503−7のy座標の最小値を表し、xmax7は、矩形領域503−7のx座標の最大値を表し、ymax7は、矩形領域503−7のy座標の最大値を表す。
ボトル502−1及びボトル502−3〜ボトル502−6の教師データについても、ボトル502−2及びボトル502−7の教師データと同様である。画像集合421に含まれる他の画像に対しても、画像501と同様の教師データが与えられる。
学習部413は、教師データを用いて画像集合421に対する学習処理を行うことで、様々な角度で陳列されたボトルの矩形領域及び分類情報を推定する、推定モデル422を生成することができる。
推定部414は、推定モデル422を用いて、処理対象画像423内で各物品が写っている物品領域424と、各物品領域424に写っている物品とを推定する。そして、推定部414は、各物品領域424及び各物品の推定結果425を、記憶部411に格納する。
例えば、処理対象画像423が、複数の段を有する棚に陳列された所定数の商品を撮影した画像であり、各段上に複数の商品が陳列されている場合、同じ段上に陳列されている複数の商品のサイズは近似していることが多い。
特定の段上の複数の商品のサイズが同一であるにもかかわらず、特定の物品領域に写っている特定の商品のサイズの推定結果425が、残りの物品領域に写っている商品のサイズの推定結果425と異なることがあり得る。この場合、特定の商品のサイズの推定結果425が誤っている可能性が高い。
そこで、補正部416は、各物品領域424を用いて、複数の段それぞれの水平面に対応する直線を処理対象画像423から検出する。次に、補正部416は、特定の段の水平面に対応する直線に基づいて、その段上の商品が写っている複数の物品領域424を選択する。そして、補正部416は、それらの物品領域424に写っている商品のうち、特定の商品のサイズの推定結果425が、残りの物品領域424に写っている商品のサイズの推定結果425に近づくように、特定の商品の推定結果425を補正する。
文字認識部415は、各物品領域424に対する光学文字認識(Optical Character Recognition,OCR)を行って、各物品領域424から文字列426を抽出し、文字列426を記憶部411に格納する。例えば、商品の表面に商品名が表示されている場合、その商品名を示す文字列426が抽出される。この場合、補正部416は、各物品領域424の商品の推定結果425に含まれる商品名の文字列が、その物品領域424から抽出された文字列426に近づくように、商品の推定結果425を補正する。
出力部417は、各物品領域424の商品の推定結果425を出力する。推定結果425が補正されている場合、補正後の推定結果425が出力される。
図6は、物品推定装置401が行う物品推定処理の例を示している。処理対象画像601には、ボトル602−1〜ボトル602−7が写っている。ボトル602−i(i=1〜7)は、店舗の棚に陳列されたお茶、水等の飲料のボトルである。ボトル602−1及びボトル602−2は、棚の上段に陳列されており、ボトル602−3〜ボトル602−7は、棚の下段に陳列されている。この場合、以下の手順で物品推定処理が行われる。
P1:推定部414は、推定モデル422を用いて、処理対象画像601内で各ボトル602−iが写っている物品領域と、各物品領域に写っているボトル602−iの分類情報とを推定する。これにより、ボトル602−1〜ボトル602−7それぞれの物品領域の推定結果として、矩形領域603−1〜矩形領域603−7それぞれの座標が求められる。
P2:補正部416は、矩形領域603−1〜矩形領域603−7の座標を用いて、棚の各段の水平面に対応する直線を処理対象画像601から検出する。例えば、補正部416は、矩形領域603−1〜矩形領域603−7の下端の座標をハフ(Hough)変換によって変換することで、上段の水平面に対応する直線611と、下段の水平面に対応する直線612とを検出することができる。
直線611は、矩形領域603−1及び矩形領域603−2の下端付近の点を通過する直線であり、直線612は、矩形領域603−3〜矩形領域603−7の下端付近の点を通過する直線である。補正部416は、LSD(Line Segment Detector)等の他の直線検出法により、直線611及び直線612を検出してもよい。
P3:補正部416は、矩形領域603−1〜矩形領域603−7の座標と、検出された直線とを用いて、段毎に矩形領域603−iを選択し、同じ段に陳列されている1本以上のボトルの推定結果をグループ化する。これにより、上段のボトル602−1の推定結果613−1とボトル602−2の推定結果613−2とがグループ化される。同様に、下段のボトル602−3〜ボトル602−7の推定結果もグループ化される。
例えば、各ボトル602−iの推定結果は、商品を示す複数の候補情報を含み、各候補情報は、商品名、容量、及び推定の尤度を含む。各推定結果に含まれる複数の候補情報は、尤度の降順に順位付けされている。
補正部416は、特定のグループ内の特定のボトルの推定結果において、最上位の候補情報が、同じグループ内の残りのボトルに対する最上位の候補情報と異なる場合、そのグループ内の推定結果の尤度を補正する。この場合、特定のボトルの推定結果における最上位の候補情報の順位が下がるように、尤度が補正される。
これにより、他のボトルに対する最上位の候補情報と異なる候補情報の順位が下がり、別の候補情報が最上位に順位付けされるため、特定のボトルに対する最上位の候補情報が他のボトルに対する最上位の候補情報と一致する確率が高くなる。したがって、特定のグループ内の各ボトルの推定結果において、最上位の候補情報を揃えることが可能になる。
例えば、補正部416は、特定のグループ内の特定のボトルの推定結果において、最上位の候補情報の容量が、同じグループ内の残りのボトルに対する最上位の候補情報の容量と異なる場合、そのグループ内の推定結果の尤度を補正する。これにより、特定のグループ内の各ボトルの推定結果において、最上位の候補情報の容量を揃えることが可能になる。
P4:文字認識部415は、OCRにより各矩形領域603−iから文字列を抽出する。この例では、矩形領域603−3から、ボトル602−3の商品名を示す文字列614が抽出されている。
補正部416は、各矩形領域603−iから抽出された文字列を、ボトル602−iの推定結果に含まれる各候補情報の商品名と比較する。そして、補正部416は、抽出された文字列が、最上位以外の順位の候補情報の商品名に含まれる文字列と一致する場合、ボトル602−iの推定結果の尤度を補正する。この場合、最上位以外の順位の候補情報の順位が上がるように、尤度が補正される。
これにより、プライベートブランド商品等のように、ボトルの形状が類似しており、商品名のみが異なっている複数のボトルが、同じ段上に混在している場合であっても、精度良くボトルを推定することが可能になる。
次に、図1に示した画像が処理対象画像423である場合の物品推定処理の例について説明する。この例では、矩形領域101−1〜矩形領域101−6それぞれに写っているボトルの推定結果425として、以下のような推定結果が得られる。
R11 順位1 商品名:A茶 容量:250ml 尤度:0.7
順位2 商品名:A茶 容量:500ml 尤度:0.2
順位3 商品名:B茶 容量:250ml 尤度:0.1
R12 順位1 商品名:A茶 容量:500ml 尤度:0.6
順位2 商品名:A茶 容量:250ml 尤度:0.3
順位3 商品名:B茶 容量:250ml 尤度:0.1
R13 順位1 商品名:A茶 容量:250ml 尤度:0.6
順位2 商品名:A茶 容量:500ml 尤度:0.4
R14 順位1 商品名:B茶 容量:250ml 尤度:0.8
順位2 商品名:B茶 容量:500ml 尤度:0.2
R15 順位1 商品名:B茶 容量:250ml 尤度:0.8
順位2 商品名:B茶 容量:500ml 尤度:0.1
順位3 商品名:A茶 容量:250ml 尤度:0.1
R16 順位1 商品名:B茶 容量:250ml 尤度:0.9
順位2 商品名:B茶 容量:500ml 尤度:0.1
推定結果R11〜推定結果R16は、矩形領域101−1〜矩形領域101−6それぞれに写っているボトルの推定結果425を表す。推定結果R11、推定結果R12、及び推定結果R15は、順位1〜順位3の3個の候補情報を含み、推定結果R13、推定結果R14、及び推定結果R16は、順位1及び順位2の2個の候補情報を含む。各候補情報は、商品名、容量、及び推定の尤度を含み、各推定結果に含まれる複数の候補情報の尤度の総和は1である。
推定結果R11〜推定結果R16それぞれの順位1(最上位)の候補情報は、上述した推定結果R1〜推定結果R6と一致している。
図7は、図1に示した画像から検出された直線の例を示している。この例では、矩形領域101−1〜矩形領域101−6の下端付近の点を通過する直線701が検出されている。この場合、矩形領域101−1〜矩形領域101−6の下端と直線701との距離が一定値以下であるため、これらの矩形領域に写っている6本のボトルが同じ段に陳列されているとみなされ、推定結果R11〜推定結果R16がグループ化される。
補正部416は、推定結果R11〜推定結果R16における順位1の候補情報の容量を比較する。この場合、推定結果R11及び推定結果R13〜推定結果R16の順位1の容量は“250ml”であり、推定結果R12の順位1の容量は“500ml”である。したがって、推定結果R12の順位1の容量は、残りの推定結果の順位1の容量と異なっている。
そこで、補正部416は、推定結果R11〜推定結果R16の順位1の容量の統計値を計算する。統計値としては、平均値、最頻値等を用いることができる。例えば、順位1の容量の平均値M(ml)は、次式により計算される。
M=(250+500+250+250+250+250)/6=291
平均値Mは500mlよりも250mlの方に近いため、補正部416は、この段に陳列されているボトルの推定容量を250mlに決定する。そこで、補正部416は、推定容量と一致しない推定結果R12において、順位1の尤度を半減させ、減少した分の値を順位1以外の順位の尤度に対して均等に分配する。そして、補正部416は、推定結果R12の候補情報を、変更後の尤度の降順に並べ替える。これにより、推定結果R12が次のように補正される。
R12 順位1 商品名:A茶 容量:250ml 尤度:0.45
順位2 商品名:A茶 容量:500ml 尤度:0.3
順位3 商品名:B茶 容量:250ml 尤度:0.25
補正後の推定結果R12では、補正前の順位1の候補情報が順位2に下がっており、補正前の順位2の候補情報が順位1に上がっている。したがって、補正前の順位1の“500ml”が正しい容量である“250ml”に修正されている。補正前の順位3の候補情報は、順位3のままである。
出力部417は、推定結果R11及び推定結果R13〜推定結果R16とともに、補正後の推定結果R12を出力する。このとき、出力部417は、各推定結果に含まれる順位1の候補情報のみを出力してもよい。
次に、物品領域424から抽出された文字列を用いて推定結果425を補正する処理の例について説明する。
図8は、形状及びラベルの色が類似しており、商品名が異なる2本のボトルの矩形領域の例を示している。矩形領域801に写っているボトルの商品名は“XXブランド ゆずれもん”であり、矩形領域802に写っているボトルの商品名は“XXブランド レモン”である。この例では、矩形領域802に写っているボトルの推定結果425として、以下のような推定結果が得られる。
順位1 商品名:XXブランド ゆずれもん 尤度:0.7
順位2 商品名:XXブランド レモン 尤度:0.3
この場合、順位1の候補情報に含まれる商品名は“XXブランド ゆずれもん”であり、正しい商品名である“XXブランド レモン”と一致していない。
図9は、図8の矩形領域801及び矩形領域802から抽出された文字列の例を示している。文字認識部415は、OCRにより、矩形領域801から文字列901を抽出し、矩形領域802から文字列902を抽出する。文字列901は“ゆずれもん”であり、文字列902は“レモン”である。
補正部416は、各矩形領域から抽出された文字列を、その矩形領域のボトルの推定結果に含まれる各候補情報の商品名と比較する。矩形領域802から抽出された文字列902は、順位1の商品名に含まれる“ゆずれもん”とは一致せず、順位2の商品名に含まれる“レモン”と一致する。
そこで、補正部416は、順位2の尤度を2倍にし、増加した分の値を順位2以外の順位の尤度から減算する。そして、補正部416は、推定結果の候補情報を、変更後の尤度の降順に並べ替える。これにより、推定結果が次のように補正される。
順位1 商品名:XXブランド レモン 尤度:0.6
順位2 商品名:XXブランド ゆずれもん 尤度:0.4
補正後の推定結果では、補正前の順位1の候補情報が順位2に下がっており、補正前の順位2の候補情報が順位1に上がっている。したがって、補正前の順位1の“XXブランド ゆずれもん”が正しい商品名である“XXブランド レモン”に修正されている。
図10は、図4の物品推定装置401が行う物品推定処理の具体例を示すフローチャートである。まず、推定部414は、推定モデル422を用いて矩形推定処理を行う(ステップ1001)。これにより、処理対象画像423内で各物品が写っている物品領域424である矩形領域が推定され、各矩形領域に写っている物品の推定結果425が生成される。
次に、補正部416は、各矩形領域の下端のみを表す画像を生成し(ステップ1002)、その画像に対してハフ変換を行うことで、物品が置かれている水平面に対応する直線を検出する(ステップ1003)。
これにより、検出された直線を用いて、同じ水平面上に置かれている複数の物品それぞれの矩形領域を特定し、それらの物品の推定結果425をグループ化することが可能になる。
次に、補正部416は、検出された複数の直線各々についてサイズ推定処理を行う(ステップ1004)。そして、すべての直線についてサイズ推定処理が終了すると、物品推定装置401は、文字列抽出処理を行う(ステップ1005)。
図11は、図10のステップ1004におけるサイズ推定処理の例を示すフローチャートである。まず、補正部416は、処理対象画像423内の複数の矩形領域各々について、ステップ1101及びステップ1102の処理を行う。
ステップ1101において、補正部416は、矩形領域の下端と直線の距離を一定値と比較する。矩形領域の下端と直線の距離が一定値よりも大きい場合(ステップ1101,NO)、補正部416は、次の矩形領域について、ステップ1101以降の処理を繰り返す。
一方、矩形領域の下端と直線の距離が一定値以下である場合(ステップ1101,YES)、補正部416は、その矩形領域に写っている物品の推定結果425を、その直線に対応付けられた矩形リストに追加する(ステップ1102)。矩形リストは、直線に対応する水平面上に置かれた物品のグループを表している。
すべての矩形領域についてステップ1101及びステップ1102の処理が終了すると、補正部416は、複数の矩形リストそれぞれについて、矩形リストに含まれる複数の推定結果425から、最上位のサイズの統計値を計算する(ステップ1103)。そして、補正部416は、計算された統計値から、そのグループの水平面上に置かれた物品の推定サイズを決定する。
次に、補正部416は、複数の矩形リスト各々について、最上位のサイズが推定サイズと一致しない推定結果425を特定し、最上位の候補情報の順位が下がるように、各候補情報の尤度を補正する(ステップ1104)。これにより、特定された推定結果425に含まれる各候補情報の順位が補正される。矩形リスト内のすべての推定結果425の最上位のサイズが推定サイズと一致する場合、推定結果425の補正は行われない。
図11のサイズ推定処理によれば、各矩形リストにおいて、推定サイズと異なるサイズを含む最上位の候補情報の順位が下がり、別の候補情報が最上位に順位付けされるため、最上位の候補情報が推定サイズと一致する確率が高くなる。したがって、矩形リスト内の各物品の推定結果425において、最上位の候補情報のサイズを揃えることが可能になる。
図12は、図10のステップ1005における文字列抽出処理の例を示すフローチャートである。まず、文字認識部415は、OCRにより、処理対象画像423内の複数の矩形領域それぞれから文字列426を抽出する(ステップ1201)。
次に、補正部416は、検出された複数の文字列426各々について、ステップ1202及びステップ1203の処理を行う。ステップ1202において、補正部416は、文字列426を含む矩形領域を特定する。
次に、ステップ1203において、補正部416は、文字列426を、特定された矩形領域の物品の推定結果425に含まれる各候補情報の商品名と比較する。最上位の候補情報の商品名が文字列426と一致しない場合、補正部416は、文字列426と一致する商品名を含む候補情報の順位が上がるように、各候補情報の尤度を補正する。これにより、推定結果425に含まれる各候補情報の順位が補正される。最上位の候補情報の商品名が文字列426と一致する場合、推定結果425の補正は行われない。
図12の文字列抽出処理によれば、商品の形状が類似しており、商品名のみが異なっている複数の商品が、同じ水平面上に混在している場合であっても、精度良く商品を推定することが可能になる。
図2の物品推定装置201及び図4の物品推定装置401の構成は一例に過ぎず、物品推定装置の用途又は条件に応じて一部の構成要素を省略又は変更してもよい。例えば、図4の物品推定装置401において、画像集合421及び処理対象画像423が事前に記憶部411に格納されている場合は、画像取得部412を省略することができる。
学習処理が外部の装置で行われ、推定モデル422が事前に記憶部411に格納されている場合は、学習部413を省略することができる。物品領域424から抽出された文字列に基づく補正処理を行わない場合は、文字認識部415を省略することができる。
図3及び図10〜図12のフローチャートは一例に過ぎず、物品推定装置の構成又は条件に応じて一部の処理を省略又は変更してもよい。例えば、図10の物品推定処理において、水平面毎に物品の推定結果425をグループ化する必要がない場合は、ステップ1002及びステップ1003の処理を省略することができる。この場合、図11のステップ1101及びステップ1102の処理も省略され、すべての物品の推定結果425を含む単一の矩形リストが生成される。
補正部416は、各矩形領域の下端と直線の距離を一定値と比較する代わりに、各矩形領域の下端と各直線の距離を計算し、最も距離が小さい直線を特定してもよい。この場合、補正部416は、各矩形領域に写っている物品の推定結果425を、最も距離が小さい直線に対応付けられた矩形リストに追加する。
物品領域424から抽出された文字列に基づく補正処理を行わない場合は、図10のステップ1005の処理を省略することができる。
図11のステップ1104において、補正部416は、最上位以外の順位の候補情報の順位が上がるように、各候補情報の尤度を補正してもよい。図12のステップ1203において、補正部416は、最上位の候補情報の順位が下がるように、各候補情報の尤度を補正してもよい。
図1及び図5〜図9に示した画像及び矩形領域は一例に過ぎず、画像及び矩形領域は、物品に応じて変化する。物品領域の形状は、矩形以外の多角形、楕円等であってもよい。図6及び図9に示した文字列は一例に過ぎず、文字列は、物品に応じて変化する。
図13は、図2の物品推定装置201及び図4の物品推定装置401として用いられる情報処理装置(コンピュータ)のハードウェア構成例を示している。図13の情報処理装置は、CPU(Central Processing Unit)1301、メモリ1302、入力装置1303、出力装置1304、補助記憶装置1305、媒体駆動装置1306、及びネットワーク接続装置1307を含む。これらの構成要素はハードウェアであり、バス1308により互いに接続されている。
メモリ1302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリであり、処理に用いられるプログラム及びデータを記憶する。メモリ1302は、図2の記憶部211又は図4の記憶部411として用いることができる。
CPU1301(プロセッサ)は、例えば、メモリ1302を利用してプログラムを実行することにより、図2の推定部212及び補正部213として動作する。
CPU1301は、メモリ1302を利用してプログラムを実行することにより、図4の学習部413、推定部414、文字認識部415、及び補正部416としても動作する。
入力装置1303は、例えば、キーボード、ポインティングデバイス等であり、オペレータ又はユーザからの指示又は情報の入力に用いられる。出力装置1304は、例えば、表示装置、プリンタ、スピーカ等であり、オペレータ又はユーザへの問い合わせ又は指示、及び処理結果の出力に用いられる。処理結果は、推定結果425であってもよい。出力部1304は、図2の出力部214又は図4の出力部417として用いることができる。
補助記憶装置1305は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。補助記憶装置1305は、ハードディスクドライブ又はフラッシュメモリであってもよい。情報処理装置は、補助記憶装置1305にプログラム及びデータを格納しておき、それらをメモリ1302にロードして使用することができる。補助記憶装置1305は、図2の記憶部211又は図4の記憶部411として用いることができる。
媒体駆動装置1306は、可搬型記録媒体1309を駆動し、その記録内容にアクセスする。可搬型記録媒体1309は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。可搬型記録媒体1309は、CD−ROM(Compact Disk Read Only Memory)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリ等であってもよい。オペレータ又はユーザは、この可搬型記録媒体1309にプログラム及びデータを格納しておき、それらをメモリ1302にロードして使用することができる。
このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体は、メモリ1302、補助記憶装置1305、又は可搬型記録媒体1309のような、物理的な(非一時的な)記録媒体である。
ネットワーク接続装置1307は、LAN(Local Area Network)、WAN(Wide Area Network)等の通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェース回路である。情報処理装置は、プログラム及びデータを外部の装置からネットワーク接続装置1307を介して受信し、それらをメモリ1302にロードして使用することができる。ネットワーク接続装置1307は、図4の画像取得部412として用いることができる。ネットワーク接続装置1307は、図2の出力部214又は図4の出力部417としても用いることができる。
なお、情報処理装置が図13のすべての構成要素を含む必要はなく、用途又は条件に応じて一部の構成要素を省略することも可能である。例えば、オペレータ又はユーザとのインタフェースが不要な場合は、入力装置1303及び出力装置1304を省略してもよい。可搬型記録媒体1309又は通信ネットワークを使用しない場合は、媒体駆動装置1306又はネットワーク接続装置1307を省略してもよい。
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。
図1乃至図13を参照しながら説明した実施形態に関し、さらに以下の付記を開示する。
(付記1)
画像集合に対する学習処理により生成された、画像に写っている物品を推定する推定モデルに基づいて、複数の物品を撮影した処理対象画像内で前記複数の物品それぞれが写っている物品領域と、前記物品領域に写っている物品とを推定し、
前記処理対象画像内の複数の物品領域のうち特定の物品領域に写っている特定の物品の推定結果が、前記複数の物品領域のうち残りの物品領域に写っている物品の推定結果に近づくように、前記特定の物品の推定結果を補正する、
処理をコンピュータに実行させるための物品推定プログラム。
(付記2)
前記コンピュータは、
前記特定の物品の補正後の推定結果と、前記残りの物品領域に写っている物品の推定結果とを出力する、
ことを特徴とする付記1記載の物品推定プログラム。
(付記3)
前記複数の物品領域それぞれに写っている物品の推定結果は、物品を示す複数の候補情報を含み、
前記複数の候補情報は、尤度に基づいて順位付けされており、
前記コンピュータは、前記特定の物品の推定結果に含まれる最上位の候補情報が、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報と異なる場合、前記特定の物品の推定結果に含まれる最上位の候補情報の順位が下がるように、前記特定の物品の推定結果に含まれる複数の候補情報の順位を補正し、前記特定の物品の補正後の推定結果に含まれる最上位の候補情報と、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報とを出力することを特徴とする付記2記載の物品推定プログラム。
(付記4)
前記複数の物品領域それぞれに写っている物品の推定結果に含まれる複数の候補情報各々は、物品のサイズを含み、
前記コンピュータは、前記特定の物品の推定結果に含まれる最上位の候補情報のサイズが、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報のサイズと異なる場合、前記特定の物品の推定結果に含まれる最上位の候補情報の順位が下がるように、前記特定の物品の推定結果に含まれる複数の候補情報の順位を補正することを特徴とする付記3記載の物品推定プログラム。
(付記5)
前記物品を示す複数の候補情報それぞれは、物品を示す文字列を含み、
前記物品推定プログラムは、前記複数の物品領域それぞれに対する文字認識を行って文字列を抽出する処理を、前記コンピュータにさらに実行させ、
前記コンピュータは、前記複数の物品領域のうちいずれかの物品領域に写っている物品の推定結果に含まれる最上位以外の順位の候補情報の文字列が、前記いずれかの物品領域から抽出された文字列と一致する場合、前記最上位以外の順位の候補情報の順位が上がるように、前記いずれかの物品領域に写っている物品の推定結果に含まれる複数の候補情報の順位を補正することを特徴とする付記3又は4記載の物品推定プログラム。
(付記6)
前記処理対象画像は、前記複数の物品を含む所定数の物品が陳列された棚を撮影した画像であり、
前記所定数の物品各々は、前記棚の複数の段のうちいずれかの段に陳列されており、
前記複数の物品は、前記棚の複数の段のうち特定の段に陳列されており、
前記コンピュータは、前記推定モデルに基づいて、前記処理対象画像内で前記所定数の物品それぞれが写っている物品領域と、前記所定数の物品とを推定し、
前記物品推定プログラムは、
前記処理対象画像内の前記所定数の物品領域に基づいて、前記複数の段それぞれの水平面に対応する直線を前記処理対象画像から検出し、
前記特定の段の水平面に対応する直線に基づいて、前記所定数の物品領域の中から前記複数の物品領域を選択する、
処理を前記コンピュータにさらに実行させることを特徴とする付記1乃至5のいずれか1項に記載の物品推定プログラム。
(付記7)
前記学習処理における教師データは、前記画像集合に含まれる複数の画像それぞれに写っている各物品を示す情報と、各物品が写っている物品領域を示す情報と、各物品の角度を示す情報とを含み、
各物品の角度は、物品が写っている画像を撮影した撮像装置の撮影方向に対する、物品の特徴が表れている方向の角度であることを特徴とする付記1乃至6のいずれか1項に記載の物品推定プログラム。
(付記8)
画像集合に対する学習処理により生成された、画像に写っている物品を推定する推定モデルと、複数の物品を撮影した処理対象画像とを記憶する記憶部と、
前記推定モデルに基づいて、前記処理対象画像内で前記複数の物品それぞれが写っている物品領域と、前記物品領域に写っている物品とを推定する推定部と、
前記処理対象画像内の複数の物品領域のうち特定の物品領域に写っている特定の物品の推定結果が、前記複数の物品領域のうち残りの物品領域に写っている物品の推定結果に近づくように、前記特定の物品の推定結果を補正する補正部と、
を備えることを特徴とする物品推定装置。
(付記9)
前記特定の物品の補正後の推定結果と、前記残りの物品領域に写っている物品の推定結果とを出力する出力部をさらに備えることを特徴とする付記8記載の物品推定装置。
(付記10)
前記複数の物品領域それぞれに写っている物品の推定結果は、物品を示す複数の候補情報を含み、
前記複数の候補情報は、尤度に基づいて順位付けされており、
前記補正部は、前記特定の物品の推定結果に含まれる最上位の候補情報が、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報と異なる場合、前記特定の物品の推定結果に含まれる最上位の候補情報の順位が下がるように、前記特定の物品の推定結果に含まれる複数の候補情報の順位を補正し、
前記出力部は、前記特定の物品の補正後の推定結果に含まれる最上位の候補情報と、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報とを出力することを特徴とする付記8記載の物品推定装置。
(付記11)
前記複数の物品領域それぞれに写っている物品の推定結果に含まれる複数の候補情報各々は、物品のサイズを含み、
前記補正部は、前記特定の物品の推定結果に含まれる最上位の候補情報のサイズが、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報のサイズと異なる場合、前記特定の物品の推定結果に含まれる最上位の候補情報の順位が下がるように、前記特定の物品の推定結果に含まれる複数の候補情報の順位を補正することを特徴とする付記10記載の物品推定装置。
(付記12)
前記物品を示す複数の候補情報それぞれは、物品を示す文字列を含み、
前記物品推定装置は、前記複数の物品領域それぞれに対する文字認識を行って文字列を抽出する文字認識部をさらに備え、
前記補正部は、前記複数の物品領域のうちいずれかの物品領域に写っている物品の推定結果に含まれる最上位以外の順位の候補情報の文字列が、前記いずれかの物品領域から抽出された文字列と一致する場合、前記最上位以外の順位の候補情報の順位が上がるように、前記いずれかの物品領域に写っている物品の推定結果に含まれる複数の候補情報の順位を補正することを特徴とする付記10又は11記載の物品推定装置。
(付記13)
コンピュータによって実行される物品推定方法であって、
前記コンピュータが、
画像集合に対する学習処理により生成された、画像に写っている物品を推定する推定モデルに基づいて、複数の物品を撮影した処理対象画像内で前記複数の物品それぞれが写っている物品領域と、前記物品領域に写っている物品とを推定し、
前記処理対象画像内の複数の物品領域のうち特定の物品領域に写っている特定の物品の推定結果が、前記複数の物品領域のうち残りの物品領域に写っている物品の推定結果に近づくように、前記特定の物品の推定結果を補正する、
ことを特徴とする物品推定方法。
(付記14)
前記コンピュータは、
前記特定の物品の補正後の推定結果と、前記残りの物品領域に写っている物品の推定結果とを出力する、
ことを特徴とする付記13記載の物品推定方法。
(付記15)
前記複数の物品領域それぞれに写っている物品の推定結果は、物品を示す複数の候補情報を含み、
前記複数の候補情報は、尤度に基づいて順位付けされており、
前記コンピュータは、前記特定の物品の推定結果に含まれる最上位の候補情報が、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報と異なる場合、前記特定の物品の推定結果に含まれる最上位の候補情報の順位が下がるように、前記特定の物品の推定結果に含まれる複数の候補情報の順位を補正し、前記特定の物品の補正後の推定結果に含まれる最上位の候補情報と、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報とを出力することを特徴とする付記14記載の物品推定方法。
(付記16)
前記複数の物品領域それぞれに写っている物品の推定結果に含まれる複数の候補情報各々は、物品のサイズを含み、
前記コンピュータは、前記特定の物品の推定結果に含まれる最上位の候補情報のサイズが、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報のサイズと異なる場合、前記特定の物品の推定結果に含まれる最上位の候補情報の順位が下がるように、前記特定の物品の推定結果に含まれる複数の候補情報の順位を補正することを特徴とする付記15記載の物品推定方法。
(付記17)
前記物品を示す複数の候補情報それぞれは、物品を示す文字列を含み、
前記コンピュータは、前記複数の物品領域それぞれに対する文字認識を行って文字列を抽出し、前記複数の物品領域のうちいずれかの物品領域に写っている物品の推定結果に含まれる最上位以外の順位の候補情報の文字列が、前記いずれかの物品領域から抽出された文字列と一致する場合、前記最上位以外の順位の候補情報の順位が上がるように、前記いずれかの物品領域に写っている物品の推定結果に含まれる複数の候補情報の順位を補正することを特徴とする付記15又は16記載の物品推定方法。
101−1〜101−6、503−1〜503−7、603−1〜603−7、801、802 矩形領域
201、401 物品推定装置
211、411 記憶部
212、414 推定部
213、416 補正部
214、417 出力部
221、422 推定モデル
222、423、601 処理対象画像
402 撮像装置
412 画像取得部
413 学習部
415 文字認識部
421 画像集合
424 物品領域
425、613−1、613−2 推定結果
426、614、901、902 文字列
501 画像
502−1〜502−7、602−1〜602−7 ボトル
511、512 教師データ
611、612、701 直線
1301 CPU
1302 メモリ
1303 入力装置
1304 出力装置
1305 補助記憶装置
1306 媒体駆動装置
1307 ネットワーク接続装置
1308 バス
1309 可搬型記録媒体

Claims (8)

  1. 画像集合に対する学習処理により生成された、画像に写っている物品を推定する推定モデルに基づいて、複数の物品を撮影した処理対象画像内で前記複数の物品それぞれが写っている物品領域と、前記物品領域に写っている物品とを推定し、
    前記処理対象画像内の複数の物品領域のうち特定の物品領域に写っている特定の物品の推定結果が、前記複数の物品領域のうち残りの物品領域に写っている物品の推定結果に近づくように、前記特定の物品の推定結果を補正する、
    処理をコンピュータに実行させるための物品推定プログラム。
  2. 前記コンピュータは、
    前記特定の物品の補正後の推定結果と、前記残りの物品領域に写っている物品の推定結果とを出力する、
    ことを特徴とする請求項1記載の物品推定プログラム。
  3. 前記複数の物品領域それぞれに写っている物品の推定結果は、物品を示す複数の候補情報を含み、
    前記複数の候補情報は、尤度に基づいて順位付けされており、
    前記コンピュータは、前記特定の物品の推定結果に含まれる最上位の候補情報が、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報と異なる場合、前記特定の物品の推定結果に含まれる最上位の候補情報の順位が下がるように、前記特定の物品の推定結果に含まれる複数の候補情報の順位を補正し、前記特定の物品の補正後の推定結果に含まれる最上位の候補情報と、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報とを出力することを特徴とする請求項2記載の物品推定プログラム。
  4. 前記複数の物品領域それぞれに写っている物品の推定結果に含まれる複数の候補情報各々は、物品のサイズを含み、
    前記コンピュータは、前記特定の物品の推定結果に含まれる最上位の候補情報のサイズが、前記残りの物品領域に写っている物品の推定結果に含まれる最上位の候補情報のサイズと異なる場合、前記特定の物品の推定結果に含まれる最上位の候補情報の順位が下がるように、前記特定の物品の推定結果に含まれる複数の候補情報の順位を補正することを特徴とする請求項3記載の物品推定プログラム。
  5. 前記物品を示す複数の候補情報それぞれは、物品を示す文字列を含み、
    前記物品推定プログラムは、前記複数の物品領域それぞれに対する文字認識を行って文字列を抽出する処理を、前記コンピュータにさらに実行させ、
    前記コンピュータは、前記複数の物品領域のうちいずれかの物品領域に写っている物品の推定結果に含まれる最上位以外の順位の候補情報の文字列が、前記いずれかの物品領域から抽出された文字列と一致する場合、前記最上位以外の順位の候補情報の順位が上がるように、前記いずれかの物品領域に写っている物品の推定結果に含まれる複数の候補情報の順位を補正することを特徴とする請求項3又は4記載の物品推定プログラム。
  6. 前記処理対象画像は、前記複数の物品を含む所定数の物品が陳列された棚を撮影した画像であり、
    前記所定数の物品各々は、前記棚の複数の段のうちいずれかの段に陳列されており、
    前記複数の物品は、前記棚の複数の段のうち特定の段に陳列されており、
    前記コンピュータは、前記推定モデルに基づいて、前記処理対象画像内で前記所定数の物品それぞれが写っている物品領域と、前記所定数の物品とを推定し、
    前記物品推定プログラムは、
    前記処理対象画像内の前記所定数の物品領域に基づいて、前記複数の段それぞれの水平面に対応する直線を前記処理対象画像から検出し、
    前記特定の段の水平面に対応する直線に基づいて、前記所定数の物品領域の中から前記複数の物品領域を選択する、
    処理を前記コンピュータにさらに実行させることを特徴とする請求項1乃至5のいずれか1項に記載の物品推定プログラム。
  7. 画像集合に対する学習処理により生成された、画像に写っている物品を推定する推定モデルと、複数の物品を撮影した処理対象画像とを記憶する記憶部と、
    前記推定モデルに基づいて、前記処理対象画像内で前記複数の物品それぞれが写っている物品領域と、前記物品領域に写っている物品とを推定する推定部と、
    前記処理対象画像内の複数の物品領域のうち特定の物品領域に写っている特定の物品の推定結果が、前記複数の物品領域のうち残りの物品領域に写っている物品の推定結果に近づくように、前記特定の物品の推定結果を補正する補正部と、
    を備えることを特徴とする物品推定装置。
  8. コンピュータによって実行される物品推定方法であって、
    前記コンピュータが、
    画像集合に対する学習処理により生成された、画像に写っている物品を推定する推定モデルに基づいて、複数の物品を撮影した処理対象画像内で前記複数の物品それぞれが写っている物品領域と、前記物品領域に写っている物品とを推定し、
    前記処理対象画像内の複数の物品領域のうち特定の物品領域に写っている特定の物品の推定結果が、前記複数の物品領域のうち残りの物品領域に写っている物品の推定結果に近づくように、前記特定の物品の推定結果を補正する、
    ことを特徴とする物品推定方法。
JP2019128596A 2019-07-10 2019-07-10 物品推定プログラム、物品推定装置、及び物品推定方法 Active JP7346951B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019128596A JP7346951B2 (ja) 2019-07-10 2019-07-10 物品推定プログラム、物品推定装置、及び物品推定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019128596A JP7346951B2 (ja) 2019-07-10 2019-07-10 物品推定プログラム、物品推定装置、及び物品推定方法

Publications (2)

Publication Number Publication Date
JP2021015368A true JP2021015368A (ja) 2021-02-12
JP7346951B2 JP7346951B2 (ja) 2023-09-20

Family

ID=74532045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019128596A Active JP7346951B2 (ja) 2019-07-10 2019-07-10 物品推定プログラム、物品推定装置、及び物品推定方法

Country Status (1)

Country Link
JP (1) JP7346951B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016063484A1 (ja) * 2014-10-23 2016-04-28 日本電気株式会社 画像処理装置、表示制御装置、画像処理方法、および、記録媒体
WO2019107157A1 (ja) * 2017-11-29 2019-06-06 株式会社Nttドコモ 棚割情報生成装置及び棚割情報生成プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016063484A1 (ja) * 2014-10-23 2016-04-28 日本電気株式会社 画像処理装置、表示制御装置、画像処理方法、および、記録媒体
WO2019107157A1 (ja) * 2017-11-29 2019-06-06 株式会社Nttドコモ 棚割情報生成装置及び棚割情報生成プログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
IPEK BAZ, ERDEM YORUK, MUJDAT CETIN: "Context-Aware Hybrid Classification System for Fine-Grained Retail Product Recognition", 2016 IEEE 12TH IMAGE, VIDEO, AND MULTIDIMENSIONAL SIGNAL PROCESSING WORKSHOP (IVMSP), JPN7023001158, 11 July 2016 (2016-07-11), US, pages 5 pages in total, ISSN: 0005021493 *
MATTTIAS MARDER, SIVAN HARARY, AMNON RIBAK, YOCHAY TZUR, SHARON ALPERT, ASAF TZADOK: "Using image analytics to monitor retail store shelves", IBM JOURNAL OF RESEARCH AND DEVELOPMENT, vol. Vol. 59, No. 2/3 (March-May 2015), JPN6023011578, 24 April 2015 (2015-04-24), US, pages 3 - 1, ISSN: 0005021494 *
赤塚 隼: "Technology Reports", NTT DOCOMOテクニカル・ジャーナル VOL.26 NO.2, JPN6023011579, 31 July 2018 (2018-07-31), JP, pages 22 - 30, ISSN: 0005021492 *

Also Published As

Publication number Publication date
JP7346951B2 (ja) 2023-09-20

Similar Documents

Publication Publication Date Title
CN108985199B (zh) 商品取放操作的检测方法、装置及存储介质
CN108549870B (zh) 一种对物品陈列进行鉴别的方法及装置
US10510038B2 (en) Computer implemented system and method for recognizing and counting products within images
US9805331B2 (en) Smartphone-based asset management system
EP3118813B1 (en) Image recognition device, image sensor, and image recognition method
US11669843B2 (en) Automated planogram anomaly detection
US9990561B2 (en) Identifying consumer products in images
US11126828B2 (en) Method and device for recognizing identity of human target
Kejriwal et al. Product counting using images with application to robot-based retail stock assessment
CN107403128B (zh) 一种物品识别方法及装置
CN105678322A (zh) 样本标注方法和装置
CN111832590B (zh) 物品识别方法和系统
US10785452B2 (en) Identifying consumer products in images
WO2019096222A1 (zh) 一种基于身份识别和商品识别的无人售货方法和设备
US11354549B2 (en) Method and system for region proposal based object recognition for estimating planogram compliance
JP2019045909A (ja) 画像認識システム
JP2019046484A (ja) 画像認識システム
US9858481B2 (en) Identifying consumer products in images
JP2014521134A (ja) 追加を希望する名刺が連絡先リストに存在しているか否かを判断する方法
CN111428743B (zh) 商品识别方法、商品处理方法、装置及电子设备
US20210142092A1 (en) Method and Apparatus for Detecting and Interpreting Price Label Text
JP6541226B2 (ja) 情報端末装置及びプログラム
JP2021015368A (ja) 物品推定プログラム、物品推定装置、及び物品推定方法
US20220414374A1 (en) Reducing a search space for item identification using machine learning
US20220414379A1 (en) Hand detection trigger for item identification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220407

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230328

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230821

R150 Certificate of patent or registration of utility model

Ref document number: 7346951

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150