JP2020095537A - 学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラム - Google Patents
学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラム Download PDFInfo
- Publication number
- JP2020095537A JP2020095537A JP2018233776A JP2018233776A JP2020095537A JP 2020095537 A JP2020095537 A JP 2020095537A JP 2018233776 A JP2018233776 A JP 2018233776A JP 2018233776 A JP2018233776 A JP 2018233776A JP 2020095537 A JP2020095537 A JP 2020095537A
- Authority
- JP
- Japan
- Prior art keywords
- product
- image
- captured
- time
- barcode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Cash Registers Or Receiving Machines (AREA)
- Image Analysis (AREA)
Abstract
【課題】学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラムにおいて、多数の商品画像に商品識別情報をラベル付けした、商品認識用ニューラルネットワークの学習用データセットを自動生成する。【解決手段】サーバ1は、カメラ3から受信した各撮影画像のうち、各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像を抽出する画像抽出部61と、抽出した撮影画像における商品画像を切り取る画像切取部62と、切り取った商品画像の各々に、POSレジ2から受信したJANコードのうち、商品画像の各々の基になる(切り取り前の)撮影画像の撮影時刻に最も近いスキャン時刻にスキャンしたバーコードに対応したJANコードをラベル付けするラベル付け部63とを備える。これにより、サーバ1が、多数の商品画像にJANコードをラベル付けした商品認識用NN学習用データセット20を自動生成することができる。【選択図】図5
Description
本発明は、学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラムに関する。
従来の小売店で販売している商品のうち、メーカが製造した商品には、商品の種類毎に異なる商品コード(日本では、JAN(Japanese Article Number)コード)が付与されており、商品には、上記の商品コードを一次元のコードで表したバーコードが印字されている。従来の小売店では、POSレジスタのスキャナで、商品のバーコードをスキャンすることにより、商品コードを読み取って、商品の識別を行っていた。
これに対して、カメラで撮影した撮影画像に映った商品から、商品の認識(識別)を行うようにした商品認識用ニューラルネットワーク(画像のクラス分類用ニューラルネットワークの一種)が提案されている(例えば、特許文献1参照)。
ところが、上記の特許文献1に示されるように、商品認識用ニューラルネットワークを用いて、撮影画像に映った商品の認識(識別)を行うことができるようにするためには、多数の商品画像とJANコード等の商品コード(商品識別情報)をラベル付けした学習(訓練)用データセットを用いて、商品認識用ニューラルネットワークの機械学習を行う必要がある。特許文献1では、学習用データセットを作成するための教師データは、人の手作業で画像情報に含められる(商品画像にラベル付けされる)が、例えば、JANコードは、13桁の数値で管理されていて、チェックディジットの1桁を除外した12桁に対応する商品の数は、理論上約1兆個にもなる。このため、JANコードに対応する商品画像の各々に、JANコードを手作業で1つずつ登録するには、膨大な時間と労力がかかってしまう。また、商品認識用ニューラルネットワークの学習用データセットの生成をサポートするために、手作業で多角から商品の撮影を行って商品画像をサービスとして提供している会社もあるが、手間・コストがかかり、商品点数の多さを考えると、現実的ではない。
本発明は、上記課題を解決するものであり、多数の商品画像に商品識別情報をラベル付けした、商品認識用ニューラルネットワークの学習用データセットを自動生成することが可能な学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラムを提供することを目的とする。
上記課題を解決するために、本発明の第1の態様による学習用データセット自動生成システムは、固定スキャナを有するPOSレジスタと、前記固定スキャナにより商品のバーコードをスキャンする時に前記商品を撮影することが可能な位置に配置されたカメラと、前記POSレジスタ及び前記カメラと通信回線で接続されて、商品認識用ニューラルネットワークの学習用データセットの自動生成を行うサーバとを備えた学習用データセット自動生成システムにおいて、前記サーバは、前記カメラから、各撮影画像と、前記各撮影画像の撮影時刻とを受信すると共に、前記POSレジスタから、前記固定スキャナによる各商品のバーコードのスキャン時刻と、前記スキャン時刻にスキャンしたバーコードに対応した商品識別情報とを受信する受信部と、前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像を抽出する画像抽出部と、前記画像抽出部により抽出した撮影画像における商品の部分の画像である商品画像を切り取る画像切取部と、前記画像切取部により切り取った前記商品画像の各々に、前記POSレジスタから受信した商品識別情報のうち、前記商品画像の各々の基になる撮影画像の撮影時刻に最も近いスキャン時刻にスキャンしたバーコードに対応した商品識別情報をラベル付けするラベル付け部とを備える。
この学習用データセット自動生成システムにおいて、前記画像抽出部は、前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻に撮影した撮影画像、前記スキャン時刻の所定時間前の時刻に撮影した撮影画像、及び前記スキャン時刻の所定時間後の時刻に撮影した撮影画像を抽出することが望ましい。
この学習用データセット自動生成システムにおいて、前記画像切取部は、前記画像抽出部により抽出した撮影画像から、前記商品画像として、店員の手に持たれている商品と、前記店員の手における、この商品を把持する部分とを含む画像を切り取ることが望ましい。
この学習用データセット自動生成システムにおいて、前記カメラは、複数であり、これらのカメラは、前記固定スキャナにより商品のバーコードをスキャンする時に、前記商品を異なる方向から撮影することが可能な位置に配置されていることが望ましい。
本発明の第2の態様によるサーバは、固定スキャナを有するPOSレジスタから、前記固定スキャナによる各商品のバーコードのスキャン時刻と、前記スキャン時刻にスキャンしたバーコードに対応した商品識別情報とを受信すると共に、前記固定スキャナにより商品のバーコードをスキャンする時に前記商品を撮影することが可能な位置に配置されたカメラから、各撮影画像と、前記各撮影画像の撮影時刻とを受信する受信部と、前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像を抽出する画像抽出部と、前記画像抽出部により抽出した撮影画像における商品の部分の画像である商品画像を切り取る画像切取部と、前記画像切取部により切り取った前記商品画像の各々に、前記POSレジスタから受信した商品識別情報のうち、前記商品画像の各々の基になる撮影画像の撮影時刻に最も近いスキャン時刻にスキャンしたバーコードに対応した商品識別情報をラベル付けするラベル付け部とを備える。
このサーバにおいて、前記画像抽出部は、前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻に撮影した撮影画像、前記スキャン時刻の所定時間前の時刻に撮影した撮影画像、及び前記スキャン時刻の所定時間後の時刻に撮影した撮影画像を抽出することが望ましい。
このサーバにおいて、前記画像切取部は、前記画像抽出部により抽出した撮影画像から、前記商品画像として、店員の手に持たれている商品と、前記店員の手における、この商品を把持する部分とを含む画像を切り取ることが望ましい。
本発明の第3の態様による学習用データセット自動生成プログラムは、コンピュータを、固定スキャナを有するPOSレジスタから、前記固定スキャナによる各商品のバーコードのスキャン時刻と、前記スキャン時刻にスキャンしたバーコードに対応した商品識別情報とを受信すると共に、前記固定スキャナにより商品のバーコードをスキャンする時に前記商品を撮影することが可能な位置に配置されたカメラから、各撮影画像と、前記各撮影画像の撮影時刻とを受信する受信部と、前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像を抽出する画像抽出部と、前記画像抽出部により抽出した撮影画像における商品の部分の画像である商品画像を切り取る画像切取部と、前記画像切取部により切り取った前記商品画像の各々に、前記POSレジスタから受信した商品識別情報のうち、前記商品画像の各々の基になる撮影画像の撮影時刻に最も近いスキャン時刻にスキャンしたバーコードに対応した商品識別情報をラベル付けするラベル付け部として機能させるための、学習用データセット自動生成プログラムである。
この学習用データセット自動生成プログラムにおいて、前記画像抽出部は、前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻に撮影した撮影画像、前記スキャン時刻の所定時間前の時刻に撮影した撮影画像、及び前記スキャン時刻の所定時間後の時刻に撮影した撮影画像を抽出することが望ましい。
この学習用データセット自動生成プログラムにおいて、前記画像切取部は、前記画像抽出部により抽出した撮影画像から、前記商品画像として、店員の手に持たれている商品と、前記店員の手における、この商品を把持する部分とを含む画像を切り取ることが望ましい。
本発明の第1の態様による学習用データセット自動生成システム、第2の態様によるサーバ、及び第3の態様による学習用データセット自動生成プログラムによれば、サーバ又はコンピュータが、カメラから受信した各撮影画像のうち、固定スキャナによる各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像から切り取った商品画像の各々に、POSレジスタから受信した商品識別情報のうち、上記の商品画像の各々の基になる(切り取り前の)撮影画像の撮影時刻に最も近い時刻にスキャンしたバーコードに対応した商品識別情報をラベル付けすることができる。従って、POSレジスタの固定スキャナで、多数の商品のバーコードをスキャンすることにより、多数の商品画像に商品識別情報をラベル付けした、商品認識用ニューラルネットワークの学習用データセットを自動生成することができる。
以下、本発明を具体化した実施形態による学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラムについて、図面を参照して説明する。図1は、本実施形態による学習用データセット自動生成システム10の概略の構成を示すブロック構成図である。この学習用データセット自動生成システム10は、小売店の店舗内に配されたPOSレジスタ(以下、「POSレジ」という)2及びカメラ3と、クラウド上のサーバ1(請求項におけるサーバ、及びコンピュータに相当)とを備えている。上記のカメラ3は、動画の撮影を行うことが可能なカメラであり、POSレジ2の固定スキャナにより商品のバーコードをスキャンする時に商品を撮影することが可能な位置に配置されている(図4の3a及び3b参照)。
図1に示されるように、店舗内の各POSレジ2及び各カメラ3は、有線又は無線(Wifi等)のLAN(Local Area Network)6と、ルータ7とを介して、インターネット8(クラウド)上のサーバ1と接続されている。すなわち、サーバ1は、店舗内の各POSレジ2及び各カメラ3と通信回線で接続されている。詳細については後述するが、サーバ1は、各店舗のPOSレジ2及びカメラ3から受信したデータに基づいて、商品認識用ニューラルネットワークの学習用データセットの自動生成を行う。
次に、図2を参照して、学習用データセット自動生成システム10のハードウェア構成について説明する。POSレジ2は、装置全体の制御と各種演算を行うCPU21を備えている。また、POSレジ2は、通信部22を有しており、通信部22を介して、サーバ1と通信を行う。通信部22は、通信用ICを備えている。
また、POSレジ2は、メモリ23と、液晶タッチパネル24と、客側表示部25と、固定スキャナ26と、ハンディスキャナ27と、キーボード28と、印字部29とを備えている。メモリ23は、各種のプログラムやデータを記憶する。メモリ23に記憶されているプログラム及びデータには、POSレジ2の動作を制御するためのPOSレジ制御プログラム30と、POSレジ2によりスキャンした情報のログファイルであるスキャン情報ログファイル31とが含まれている。上記のスキャン情報ログファイル31には、POSレジ2の固定スキャナ26又はハンディスキャナ27によるスキャン時のJANコード等の情報と、店員のキーボード28による入力時のJANコード等の情報とが、含まれる。
また、カメラ3は、カメラ全体の制御と各種演算を行うCPU31と、撮像素子であるCCD(Charge Coupled Device)等を備えたカメラユニット32と、ハードディスク等で構成されたフォトストレージ34とを備えている。このフォトストレージ34には、カメラユニット32による1日以上の撮影画像(動画)のデータを記憶することができる。この撮影画像(動画)のファイルが、図2における撮影画像ファイル35である。また、カメラ3は、通信用ICから構成される通信部33を有しており、通信部33を介して、サーバ1に、例えば、1日1回のタイムスパンで、撮影画像(動画)を送信する。なお、上記のカメラ3からサーバ1への撮影画像の送信は、PUSH型で行われてもよいし、PULL型で行われもよい。すなわち、カメラ3が、撮影画像を自動的にサーバ1に送信するようにしてもよいし、サーバ1が、カメラ3に対して、撮影画像を送信するように要求し、これに応じて、カメラ3が、撮影画像を送信するようにしてもよい。
上記のPOSレジ2とカメラ3のシステム時刻は、いずれも、日本標準時と一致する(同期する)ようになっている。また、上記のPOSレジ2及びカメラ3は、LANケーブル等により、常時給電されている。
上記のサーバ1は、装置全体の制御と各種演算を行うCPU11を備えている。また、サーバ1は、通信部12(請求項における「受信部」)を有しており、通信部12を介して、POSレジ2及びカメラ3と通信を行う。通信部12は、カメラ3から、各撮影画像と、各撮影画像の撮影時刻とを受信すると共に、POSレジ2から、固定スキャナ26による各商品のバーコードのスキャン時刻と、このスキャン時刻にスキャンしたバーコードに対応したJANコード(請求項における「商品識別情報」)とを受信する。上記の通信部12は、通信用ICを備えている。
また、サーバ1は、各種のプログラムやデータを記憶するハードディスク13と、各種のプログラムの実行時に、実行するプログラムやデータをロードするRAM14と、ディスプレイ15と、各種の入力指示操作に用いられる操作部16とを備えている。上記のハードディスク13には、学習用データセット自動生成プログラム17と、撮影画像ファイル18と、スキャン情報ファイル19と、商品認識用ニューラルネットワークの学習用データセット(以下、「商品認識用NN学習用データセット」という)20とが格納されている。学習用データセット自動生成プログラム17は、商品認識用NN学習用データセット20の自動生成を行うプログラムである。撮影画像ファイル18は、カメラ3側から転送された撮影画像を格納するためのファイルである。
なお、上記図2に示す例では、サーバ1が、ハードディスク13に、学習用データセット自動生成プログラム17、撮影画像ファイル18、スキャン情報ファイル19、及び商品認識用NN学習用データセット20を格納する場合の例を示したが、サーバ1が、SSD(Solid State Drive)を備えて、このSSDに、上記の学習用データセット自動生成プログラム17、撮影画像ファイル18、スキャン情報ファイル19、及び商品認識用NN学習用データセット20を格納してもよい。
図3(a)(b)(c)(d)は、それぞれ、図2中の撮影画像ファイル18、スキャン情報ログファイル31、スキャン情報ファイル19、及び商品認識用NN学習用データセット20のレコードフォーマットを示す。撮影画像ファイル18の各レコードは、図3(a)に示すように、カメラ3側から転送された(カメラ3側の画像ファイル35に含まれる)各撮影画像52と、この撮影画像52の撮影時刻51とを格納している。上記の撮影画像52は、カメラ3で撮影された動画における、撮影時刻51の撮影画像である。また、POSレジ2のスキャン情報ログファイル31の各レコードは、図3(b)に示すように、POSレジ2が取得したJANコード54と、このJANコード54の取得時刻(取得年月日を含む)であるスキャン時刻53と、JANコード54の取得(入力)方法(固定スキャナ26、ハンディスキャナ27、及び店員のキーボード28による手入力のうち、いずれの方法でJANコード54を取得したかという情報)であるコード入力方法55とを格納している。
上記のサーバ1のスキャン情報ファイル19の各レコードは、図3(c)に示すように、POSレジ2から受信した、固定スキャナ26による各商品のバーコードのスキャン時刻56と、このスキャン時刻56にスキャンしたバーコードに対応したJANコード57とを格納している。上記のスキャン時刻56とJANコード57とは、それぞれ、POSレジ2側のスキャン情報ログファイル31に格納されたレコードのうち、固定スキャナ26を用いたバーコードのスキャンにより得られたレコードにおける、スキャン時刻53とJANコード54に対応する。なお、上記のPOSレジ2からサーバ1へのスキャン時刻とJANコードの送信は、PUSH型で行われてもよいし、PULL型で行われもよい。すなわち、POSレジ2が、取得したJANコードとスキャン時刻とを、自動的に、サーバ1に送信するようにしてもよいし、サーバ1が、POSレジ2に対して、JANコードとスキャン時刻とを送信するように要求し、これに応じて、POSレジ2が、JANコードとスキャン時刻とをサーバ1に送信するようにしてもよい。
上記の商品認識用NN学習用データセット20の各レコードは、図3(d)に示すように、商品画像58と、JANコード59とを格納している。上記の商品画像58は、カメラ3から受信した各撮影画像のうち、固定スキャナ26による各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像における商品の部分の画像(を切り取った画像)である。上記の「各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像」とは、例えば、カメラ3から受信した各撮影画像のうち、各商品のバーコードのスキャン時刻に撮影した撮影画像、このスキャン時刻の1秒前に撮影した撮影画像、及びこのスキャン時刻の1秒後に撮影した撮影画像である。また、上記のJANコード59は、スキャン情報ファイル19に格納された各レコードのJANコード57のうち、上記の商品画像58の基になる(切り取り前の)撮影画像の撮影時刻に最も近いスキャン時刻にスキャンしたバーコードに対応したJANコードである。このJANコード59は、同じレコードの商品画像58にアノテーションされた正解ラベルのデータである。
次に、図4を参照して、この学習用データセット自動生成システム10における、商品認識用NN学習用データセット20の自動生成方法の概要について、説明する。図4において、Gは、商品を示し、Bは、商品Gのバーコードを示し、Hは、商品Gを持つ店員の手を示す。また、図4における41a、41bは、買い物かごを示す。さらにまた、図4における矢印は、店員が手に持った商品GのバーコードBを固定スキャナ26でスキャンする時における、商品Gの移動方向を示す。図4に示すように、カメラ3a、3bは、店員がPOSレジ2の固定スキャナ26により商品GのバーコードBをスキャンする時に商品Gを撮影することが可能な位置に配置されているため、固定スキャナ26による商品GのバーコードBのスキャンの際に撮影した撮影画像に映った商品GのJANコードは、このスキャンで読み取ったバーコードBのJANコードであるということになる。従って、各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像52における商品画像の各々に、POSレジ2から受信したJANコード57のうち、上記の商品画像の各々の基になる撮影画像52の撮影時刻51に最も近いスキャン時刻56にスキャンしたバーコードに対応したJANコード57をラベル付けすることにより、上記の商品画像の各々に、正解ラベルのJANコードをラベル付けすることができる。
次に、図5を参照して、上記のサーバ1側のCPU11内の機能ブロックについて、説明する。CPU11内の各ブロック(画像抽出部61、画像切取部62、及びラベル付け部63)の機能は、CPU11が学習用データセット自動生成プログラム17を実行することにより実現される。ただし、この構成に限られず、上記のCPU11における各ブロックの機能の少なくとも一つを、ASIC(Application Specific Integrated Circuit)等によって構成される個別のハードウェアによって実現してもよい。例えば、サーバ1に、GPUを設けて、上記の画像抽出部61、画像切取部62、及びラベル付け部63の機能の少なくとも一つを、GPUで行うようにしてもよい。
上記の画像抽出部61は、カメラ3から受信した(撮影画像ファイル18における)各撮影画像52、及び各撮影画像52の撮影時刻51と、POSレジ2から受信した(スキャン情報ファイル19における)各商品のバーコードのスキャン時刻56とに基づいて、カメラ3から受信した各撮影画像52のうち、各商品のバーコードのスキャン時刻56近辺の時刻に撮影した撮影画像52を抽出する。上記の画像切取部62は、画像抽出部61により抽出した各撮影画像52における商品の部分の画像である商品画像を切り取る。
上記のラベル付け部63は、画像切取部62により切り取った商品画像(各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像52における商品画像)の各々に、POSレジ2から受信した(スキャン情報ファイル19の)JANコード57のうち、上記の商品画像の各々の基になる(切り取り前の)撮影画像52の撮影時刻51に最も近いスキャン時刻56にスキャンしたバーコードに対応したJANコード57をラベル付けする。
次に、本実施形態の学習用データセット自動生成システム10に採用されている、商品認識用NN学習用データセット20に、異なる角度からの商品画像58についての学習用データ(訓練データ)を格納するための工夫について、説明する。この学習用データセット自動生成システム10では、商品認識用NN学習用データセット20に、異なる角度からの商品画像58についての学習用データ(訓練データ)を格納するために、(これらの商品画像58の基になる)異なる角度からの撮影画像を得るための工夫をしている。
上記の異なる角度からの撮影画像を得るための工夫の例としては、学習用データセット自動生成システム10が、図4に示すように、固定スキャナ26により商品GのバーコードBをスキャンする時に、商品Gを異なる方向から撮影することが可能な位置に配置された複数のカメラ3a、3bを備えることが挙げられる。これらのカメラ3a、3bは、それぞれ、POSレジ2の固定スキャナ26から見て、商品GのバーコードBのスキャン後の位置と、スキャン前の位置に配置されている。これらのカメラ3a、3bを用いて、商品Gの異なる角度からの撮影画像を得ることができる。
ただし、学習用データセット自動生成システム10は、必ずしも、図4に示すように、複数のカメラ3a、3bを備える必要はなく、一つのカメラ3を備えていてもよい。このように、学習用データセット自動生成システム10が備えるカメラ3が、一つの場合であっても、図3の説明で述べたように、商品認識用NN学習用データセット20に、各商品のバーコードのスキャン時刻に撮影した撮影画像に基づく商品画像58に加えて、このスキャン時刻の所定時間前(例えば、1秒前)と所定時間後(例えば、1秒後)の時刻に撮影した撮影画像に基づく商品画像58を格納することにより、各商品のバーコードのスキャン時に、異なる角度からの複数の商品画像58についての学習用データを得ることができる。
上記のように、各商品のバーコードのスキャン時に、異なる角度からの複数の商品画像58についての学習用データを得ることにより、学習用データセット自動生成システム10のサーバ1側のシステム管理者またはオペレータが、これらの商品画像58のうち、いわゆるモーションブラー(動いている被写体をカメラで撮影した時に生じるぶれ)が発生していない商品画像58についての学習用データを選択することが可能である。
次に、図6を参照して、サーバ1のCPU11が学習用データセット自動生成プログラム17に従って行う、商品認識用NN学習用データセット20の自動生成処理について、説明する。まず、サーバ1のCPU11は、通信部12を用いて、カメラ3から、撮影画像ファイル35に格納された、各撮影画像と各撮影画像の撮影時刻とを受信すると共に、POSレジ2から、スキャン情報ログファイル31に格納されたレコードにおける、固定スキャナ26による各商品のバーコードのスキャン時刻53(図3(b)参照)と、このスキャン時刻53にスキャンしたバーコードに対応したJANコード54とを受信する(S1)。なお、上記の固定スキャナ26による各商品のバーコードのスキャン時刻53とは、スキャン情報ログファイル31に格納されたレコードのうち、図3(b)に示すコード入力方法55が固定スキャナであるレコードにおけるスキャン時刻53を意味する。サーバ1のCPU11は、上記のカメラ3から受信した各撮影画像と各撮影画像の撮影時刻とを、サーバ1側の撮影画像ファイル18に格納し、POSレジ2から受信したスキャン時刻とJANコードとを、スキャン情報ファイル19に格納する。
なお、上記のカメラ3からの撮影画像等の受信は、カメラ3の撮影画像ファイル35のサーバ1への転送の形で行われる。このカメラ3からサーバ1への撮影画像ファイル転送は、例えば、1日1回の頻度で行われる。また、上記のサーバ1のPOSレジ2からのスキャン時刻53とJANコード54の受信も、バッチ処理で行えばよく、例えば、カメラ3からの撮影画像ファイル転送と同様に、1日1回の頻度で行えばよい。
次に、サーバ1のCPU11の画像抽出部61は、カメラ3から受信した(撮影画像ファイル18における)各撮影画像52及び撮影時刻51と、POSレジ2から受信した(スキャン情報ファイル19における)各商品のバーコードのスキャン時刻56とに基づいて、カメラ3から受信した各撮影画像52のうち、各商品のバーコードのスキャン時刻56近辺の時刻に撮影した撮影画像52を抽出する(S2)。具体的には、画像抽出部61は、スキャン情報ファイル19に格納された1つのレコードを読み出して、撮影画像ファイル18に格納された各撮影画像52のうち、上記の読み出したスキャン情報ファイル19のレコードにおけるスキャン時刻56の近辺の時刻に撮影した撮影画像52を抽出する。
より詳細に説明すると、画像抽出部61は、上記の読み出したスキャン情報ファイル19のレコードにおけるスキャン時刻56と、撮影画像ファイル18に格納された各撮影画像52及び撮影時刻51とに基づいて、撮影画像ファイル18に格納された各撮影画像52のうち、上記の読み出したスキャン情報ファイル19のレコードにおけるスキャン時刻56に撮影した撮影画像52、このスキャン時刻56の所定時間前(例えば、1秒前)の時刻に撮影した撮影画像52、及びスキャン時刻56の所定時間後(例えば、1秒後)の時刻に撮影した撮影画像52を抽出する。
上記S2の撮影画像抽出処理が完了すると、サーバ1のCPU11の画像切取部62は、画像抽出部61により抽出した各撮影画像52における商品の部分の画像である商品画像を切り取る(S3)。より詳細に説明すると、画像切取部62は、画像抽出部61により抽出した各撮影画像52から、商品画像として、店員の手Hに持たれている商品G(図4参照)と、店員の手Hにおける、この商品を把持する部分とを含む画像を切り取る。
次に、サーバ1のCPU11のラベル付け部63は、画像切取部62により切り取った商品画像(上記の読み出したスキャン情報ファイル19のレコードにおけるスキャン時刻56近辺の時刻に撮影した撮影画像52における商品画像)の各々に、スキャン情報ファイル19に記憶されたJANコード57のうち、上記の商品画像の各々の基になる(切り取り前の)撮影画像52の撮影時刻51に最も近いスキャン時刻56にスキャンしたバーコードに対応したJANコード57をラベル付けする(S4)。ただし、本実施形態の場合は、実際には、ラベル付け部63は、画像切取部62により切り取った商品画像(上記の読み出したスキャン情報ファイル19のレコードにおけるスキャン時刻56近辺の時刻に撮影した撮影画像52における商品画像)の各々に、上記の読み出したスキャン情報ファイル19のレコードのJANコード57をラベル付けする。上記の商品画像の各々と、この商品画像にラベル付けされたJANコードは、商品認識用NN学習用データセット20における同じレコードに格納される。
サーバ1のCPU11は、上記S1でPOSレジ2から受信してスキャン情報ファイル19に格納した全てのJANコード57を用いたラベル付け処理が完了するまで(S5でNO)、上記S2乃至S4の処理を繰り返す。
図7は、上記のように、撮影画像52から切り取られて、商品認識用NN学習用データセット20に格納される商品画像58を示す。図7に示すように、画像切取部62により切り取られる商品画像58は、店員の手に持たれている商品の画像GIと、店員の手における、商品を把持する部分の画像(以下、「手画像」という)HIとを含んだ画像である。
ここで、商品認識用ニューラルネットワークを用いた商品認識は、例えば、顧客が買い物かごに商品を入れる時や、顧客が買い物かごから商品を取り出す時等の、顧客が商品を手にもっている時に行われるケースが多い。従って、上記のように、商品認識用NN学習用データセット20に格納される商品画像58に、上記の手画像HIを含むようにすることにより、この商品認識用NN学習用データセット20を用いて学習を行った商品認識用ニューラルネットワークの商品認識の精度を向上させることができる可能性が高い。
なお、上述した各商品のスキャン時に異なる角度からの複数の商品画像を得るための工夫は、学習時に手(画像)を過学習することを防ぐことにもつながる。この点について詳述すると、例えば、上記図4に示すように、複数のカメラ3a、3bを用いて撮影した撮影画像に基づいて異なる角度からの複数の商品画像を得ることにより、商品を持つ手の向きが異なる商品画像を得ることができる。また、図3の説明で述べたように、各商品のバーコードのスキャン時刻に撮影した撮影画像に基づく商品画像に加えて、このスキャン時刻の所定時間前(例えば、1秒前)と所定時間後(例えば、1秒後)の時刻に撮影した撮影画像に基づく商品画像を作成する(切り取る)ことにより、商品を持つ手の位置や向きが異なる商品画像を得ることができる。これらのバリエーションを有する手画像HI(図7参照)を含む商品画像58を格納した商品認識用NN学習用データセット20を用いて、商品認識用ニューラルネットワークの機械学習を行うことにより、手(画像)の過学習を防ぐことができる。
次に、カメラ3の具体的な設置の仕方について、説明する。カメラ3は、固定スキャナ26の真下に位置する買い物かご41aの全景が映る位置に設置される。より具体的に言うと、固定スキャナ26が、POSレジ2の中央部にある場合(図4参照)、固定スキャナ26の左右、又は斜め上に設置される。固定スキャナ26の左右とは、固定スキャナ26から見て、商品のバーコードのスキャン後の位置と、スキャン前の位置に相当する。また、カメラ3のPOSレジ2周辺への固定方法としては、クランプ、クリップ、両面テープ、マグネット等、POSレジ2又はその置台73(図8参照)の形状と材質にマッチしたものを採用すればよい。ただし、カメラ3が外れにくいようにすることを考慮すると、カメラ3を、POSレジ2又はその置台73に、クランプで固定することが望ましい。
図8は、カメラ3を、固定スキャナ26の右側(固定スキャナ26から見て、商品のバーコードのスキャン前の位置)に設置した場合の例を示す。この例では、カメラ3は、ポール71を介して、POSレジ2の置台73に、クランプ72で固定されている。具体的に言うと、図8中のポール71の上端には、ねじ切り(雄ねじ)が設けられており、また、カメラ3の底面には、ねじ孔(雌ねじ)が設けられている。カメラ3の底面に設けられた雌ねじと、ポール71の上端に設けられた雄ねじとを螺合して、ポール71の上端にカメラ3を取り付けた上で、このポール71をクランプ72により置台73に取り付けることにより、カメラ3とポール71を置台73に固定することができる。また、カメラ3をPOSレジ2自体に固定する場合には、例えば、カメラ3を、クランプを用いて、POSレジ2における破線Cの位置(液晶タッチパネル24の側端部の枠の部分)に取り付ける。
上記のように、本実施形態の学習用データセット自動生成システム10、サーバ1、及び学習用データセット自動生成プログラム17によれば、サーバ1が、カメラ3から受信した各撮影画像52のうち、固定スキャナ26による各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像52から切り取った商品画像58の各々に、POSレジ2から受信したJANコード57のうち、上記の商品画像58の各々の基になる(切り取り前の)撮影画像52の撮影時刻51に最も近いスキャン時刻56にスキャンしたバーコードに対応したJANコード57をラベル付けすることができる。従って、従来の小売店で用いられていたPOSレジの固定スキャナと同様な固定スキャナ26で、多数の商品のバーコードをスキャンすることにより、多数の商品画像58にJANコード57をラベル付けした商品認識用NN学習用データセット20を自動生成することができる。
また、この学習用データセット自動生成システム10、サーバ1、及び学習用データセット自動生成プログラム17によれば、サーバ1のCPU11の画像抽出部61が、商品画像58の各々の基になる(切り取り前の)撮影画像52として、カメラ3から受信した各撮影画像52のうち、各商品のバーコードのスキャン時刻56に撮影した撮影画像52、スキャン時刻56の所定時間前(例えば、1秒前)の時刻に撮影した撮影画像52、及びスキャン時刻56の所定時間後(例えば、1秒後)の時刻に撮影した撮影画像52を抽出するようにした。これにより、各商品のバーコードのスキャン時に、異なる角度からの複数の商品画像58についての学習用データを得ることができる。また、このように、各商品のバーコードのスキャン時に、異なる角度からの複数の商品画像58についての学習用データを得ることにより、学習用データセット自動生成システム10のサーバ1側のシステム管理者またはオペレータが、これらの商品画像58のうち、いわゆるモーションブラーが発生していない商品画像58についての学習用データを選択することができる。さらにまた、商品画像58の各々の基になる撮影画像52として、カメラ3から受信した各撮影画像52のうち、各商品のバーコードのスキャン時刻56に撮影した撮影画像52に加えて、スキャン時刻56の所定時間前と所定時間後の時刻に撮影した撮影画像52を抽出するようにしたことにより、商品を持つ手の位置や向きが異なる商品画像を得ることができる。これらのバリエーションを有する手画像を含む商品画像58を格納した商品認識用NN学習用データセット20を用いて、商品認識用ニューラルネットワークの機械学習を行うことにより、手(画像)の過学習を防ぐことができる。
また、この学習用データセット自動生成システム10、サーバ1、及び学習用データセット自動生成プログラム17によれば、サーバ1のCPU11の画像抽出部61により抽出した撮影画像52から、商品画像58として、店員の手に持たれている商品と、店員の手における、この商品を把持する部分とを含む画像(手画像HI)を切り取るようにした。ここで、商品認識用ニューラルネットワークを用いた商品認識は、顧客が商品を手にもっている時に行われるケースが多い。従って、上記のように、商品認識用NN学習用データセット20に格納される商品画像58に、上記の手画像HIを含むようにすることにより、この商品認識用NN学習用データセット20を用いて学習を行った商品認識用ニューラルネットワークの商品認識の精度を向上させることができる可能性が高い。
また、この学習用データセット自動生成システム10によれば、カメラ3を複数とし、これらのカメラ3(例えば、図4におけるカメラ3a、3b)を、固定スキャナ26により商品のバーコードをスキャンする時に、商品を異なる方向から撮影することが可能な位置に配置するようにした。これらのカメラ3を用いて、各商品のバーコードのスキャン時に、異なる角度からの複数の商品画像58についての学習用データを得ることができる。また、このように、各商品のバーコードのスキャン時に、異なる角度からの複数の商品画像58についての学習用データを得ることにより、学習用データセット自動生成システム10のサーバ1側のシステム管理者またはオペレータが、これらの商品画像58のうち、いわゆるモーションブラーが発生していない商品画像58についての学習用データを選択することができる。さらにまた、上記のように、複数のカメラ3を、固定スキャナ26により商品のバーコードをスキャンする時に、商品を異なる方向から撮影することが可能な位置に配置するようにしたことにより、商品を持つ手の向きが異なる商品画像を得ることができる。これらのバリエーションを有する手画像を含む商品画像58を格納した商品認識用NN学習用データセット20を用いて、商品認識用ニューラルネットワークの機械学習を行うことにより、手(画像)の過学習を防ぐことができる。
変形例:
なお、本発明は、上記の各実施形態の構成に限られず、発明の趣旨を変更しない範囲で種々の変形が可能である。次に、本発明の変形例について説明する。
なお、本発明は、上記の各実施形態の構成に限られず、発明の趣旨を変更しない範囲で種々の変形が可能である。次に、本発明の変形例について説明する。
変形例1:
上記の実施形態では、図1等に示すように、サーバ1が、各店舗に配された多数のPOSレジ2とカメラ3から受信したデータに基づいて、商品認識用NN学習用データセット20の自動生成を行う場合の例を示したが、サーバは、特定の店舗に配された特定の(少なくとも一組の)POSレジとカメラから受信したデータに基づいて、商品認識用NN学習用データセットの自動生成を行うようにしてもよい。
上記の実施形態では、図1等に示すように、サーバ1が、各店舗に配された多数のPOSレジ2とカメラ3から受信したデータに基づいて、商品認識用NN学習用データセット20の自動生成を行う場合の例を示したが、サーバは、特定の店舗に配された特定の(少なくとも一組の)POSレジとカメラから受信したデータに基づいて、商品認識用NN学習用データセットの自動生成を行うようにしてもよい。
また、上記の実施形態では、商品認識用NN学習用データセット20の自動生成を行うサーバ1を、クラウド(インターネット8)上に配置した場合の例を示したが、商品認識用NN学習用データセットの自動生成を行うサーバの配置は、これに限られず、例えば、このサーバを、イントラネット内(店舗内)に設置してもよい。
変形例2:
上記の実施形態では、サーバ1のCPU11の画像抽出部61が、商品画像58の基になる(切り取り前の)撮影画像52として、カメラ3から受信した各撮影画像52のうち、各商品のバーコードのスキャン時刻56に撮影した撮影画像52、このスキャン時刻56の所定時間前(例えば、1秒前)の時刻に撮影した撮影画像52、及びスキャン時刻56の所定時間後(例えば、1秒後)の時刻に撮影した撮影画像52を抽出する場合の例を示した。けれども、サーバの画像抽出部が、商品画像の基になる撮影画像として抽出する撮影画像は、カメラから受信した各撮影画像のうち、各商品のバーコードのスキャン時刻近辺の時刻に撮影した一つ以上の撮影画像であればよい。例えば、画像抽出部が抽出する撮影画像は、各商品のバーコードのスキャン時刻に撮影した撮影画像だけであってもよい。また、画像抽出部が抽出する撮影画像は、各商品のバーコードのスキャン時刻に撮影した撮影画像と、スキャン時刻の0.5秒前の時刻に撮影した撮影画像と、スキャン時刻の1秒前の時刻に撮影した撮影画像であってもよいし、各商品のバーコードのスキャン時刻に撮影した撮影画像と、スキャン時刻の0.5秒後の時刻に撮影した撮影画像と、スキャン時刻の1秒後の時刻に撮影した撮影画像であってもよい。
上記の実施形態では、サーバ1のCPU11の画像抽出部61が、商品画像58の基になる(切り取り前の)撮影画像52として、カメラ3から受信した各撮影画像52のうち、各商品のバーコードのスキャン時刻56に撮影した撮影画像52、このスキャン時刻56の所定時間前(例えば、1秒前)の時刻に撮影した撮影画像52、及びスキャン時刻56の所定時間後(例えば、1秒後)の時刻に撮影した撮影画像52を抽出する場合の例を示した。けれども、サーバの画像抽出部が、商品画像の基になる撮影画像として抽出する撮影画像は、カメラから受信した各撮影画像のうち、各商品のバーコードのスキャン時刻近辺の時刻に撮影した一つ以上の撮影画像であればよい。例えば、画像抽出部が抽出する撮影画像は、各商品のバーコードのスキャン時刻に撮影した撮影画像だけであってもよい。また、画像抽出部が抽出する撮影画像は、各商品のバーコードのスキャン時刻に撮影した撮影画像と、スキャン時刻の0.5秒前の時刻に撮影した撮影画像と、スキャン時刻の1秒前の時刻に撮影した撮影画像であってもよいし、各商品のバーコードのスキャン時刻に撮影した撮影画像と、スキャン時刻の0.5秒後の時刻に撮影した撮影画像と、スキャン時刻の1秒後の時刻に撮影した撮影画像であってもよい。
変形例3:
上記の実施形態では、図4において、複数のカメラ3a、3bが、POSレジ2の固定スキャナ26から見て、左側(商品のバーコードのスキャン後の位置)と、右側(スキャン前の位置)に配置されている場合の例を示した。けれども、1台のPOSレジ2の周辺に複数のカメラを配する場合におけるカメラの配置場所の例は、これに限られず、例えば、カメラを、固定スキャナの左側又は右側のいずれか一方と、固定スキャナの斜め上とに設置してもよいし、カメラを、固定スキャナの左側、右側、及び斜め上に設置してもよい。
上記の実施形態では、図4において、複数のカメラ3a、3bが、POSレジ2の固定スキャナ26から見て、左側(商品のバーコードのスキャン後の位置)と、右側(スキャン前の位置)に配置されている場合の例を示した。けれども、1台のPOSレジ2の周辺に複数のカメラを配する場合におけるカメラの配置場所の例は、これに限られず、例えば、カメラを、固定スキャナの左側又は右側のいずれか一方と、固定スキャナの斜め上とに設置してもよいし、カメラを、固定スキャナの左側、右側、及び斜め上に設置してもよい。
変形例4:
上記の実施形態では、画像切取部62が、図7に示すように、画像抽出部61により抽出した各撮影画像52から、商品画像として、店員の手に持たれている商品の画像GIと、店員の手における、商品を把持する部分の画像(手画像HI)とを含んだ画像を切り取るようにした。けれども、画像切取部が、画像抽出部により抽出した各撮影画像から、商品画像として、店員の手に持たれている商品の画像GIのみを切り取るようにしてもよい。
上記の実施形態では、画像切取部62が、図7に示すように、画像抽出部61により抽出した各撮影画像52から、商品画像として、店員の手に持たれている商品の画像GIと、店員の手における、商品を把持する部分の画像(手画像HI)とを含んだ画像を切り取るようにした。けれども、画像切取部が、画像抽出部により抽出した各撮影画像から、商品画像として、店員の手に持たれている商品の画像GIのみを切り取るようにしてもよい。
1 サーバ(サーバ、コンピュータ)
2 POSレジ(POSレジスタ)
3、3a、3b カメラ
10 学習用データセット自動生成システム
12 通信部(受信部)
17 学習用データセット自動生成プログラム
52 撮影画像
58 商品画像
61 画像抽出部
62 画像切取部
63 ラベル付け部
HI 手画像(「店員の手における、この商品を把持する部分」の画像)
GI 店員の手に持たれている商品の画像
2 POSレジ(POSレジスタ)
3、3a、3b カメラ
10 学習用データセット自動生成システム
12 通信部(受信部)
17 学習用データセット自動生成プログラム
52 撮影画像
58 商品画像
61 画像抽出部
62 画像切取部
63 ラベル付け部
HI 手画像(「店員の手における、この商品を把持する部分」の画像)
GI 店員の手に持たれている商品の画像
Claims (10)
- 固定スキャナを有するPOSレジスタと、前記固定スキャナにより商品のバーコードをスキャンする時に前記商品を撮影することが可能な位置に配置されたカメラと、前記POSレジスタ及び前記カメラと通信回線で接続されて、商品認識用ニューラルネットワークの学習用データセットの自動生成を行うサーバとを備えた学習用データセット自動生成システムにおいて、
前記サーバは、
前記カメラから、各撮影画像と、前記各撮影画像の撮影時刻とを受信すると共に、前記POSレジスタから、前記固定スキャナによる各商品のバーコードのスキャン時刻と、前記スキャン時刻にスキャンしたバーコードに対応した商品識別情報とを受信する受信部と、
前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像を抽出する画像抽出部と、
前記画像抽出部により抽出した撮影画像における商品の部分の画像である商品画像を切り取る画像切取部と、
前記画像切取部により切り取った前記商品画像の各々に、前記POSレジスタから受信した商品識別情報のうち、前記商品画像の各々の基になる撮影画像の撮影時刻に最も近いスキャン時刻にスキャンしたバーコードに対応した商品識別情報をラベル付けするラベル付け部とを備える学習用データセット自動生成システム。 - 前記画像抽出部は、前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻に撮影した撮影画像、前記スキャン時刻の所定時間前の時刻に撮影した撮影画像、及び前記スキャン時刻の所定時間後の時刻に撮影した撮影画像を抽出することを特徴とする請求項1に記載の学習用データセット自動生成システム。
- 前記画像切取部は、前記画像抽出部により抽出した撮影画像から、前記商品画像として、店員の手に持たれている商品と、前記店員の手における、この商品を把持する部分とを含む画像を切り取ることを特徴とする請求項1又は請求項2に記載の学習用データセット自動生成システム。
- 前記カメラは、複数であり、これらのカメラは、前記固定スキャナにより商品のバーコードをスキャンする時に、前記商品を異なる方向から撮影することが可能な位置に配置されていることを特徴とする請求項1乃至請求項3のいずれか一項に記載の学習用データセット自動生成システム。
- 固定スキャナを有するPOSレジスタから、前記固定スキャナによる各商品のバーコードのスキャン時刻と、前記スキャン時刻にスキャンしたバーコードに対応した商品識別情報とを受信すると共に、前記固定スキャナにより商品のバーコードをスキャンする時に前記商品を撮影することが可能な位置に配置されたカメラから、各撮影画像と、前記各撮影画像の撮影時刻とを受信する受信部と、
前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像を抽出する画像抽出部と、
前記画像抽出部により抽出した撮影画像における商品の部分の画像である商品画像を切り取る画像切取部と、
前記画像切取部により切り取った前記商品画像の各々に、前記POSレジスタから受信した商品識別情報のうち、前記商品画像の各々の基になる撮影画像の撮影時刻に最も近いスキャン時刻にスキャンしたバーコードに対応した商品識別情報をラベル付けするラベル付け部とを備えるサーバ。 - 前記画像抽出部は、前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻に撮影した撮影画像、前記スキャン時刻の所定時間前の時刻に撮影した撮影画像、及び前記スキャン時刻の所定時間後の時刻に撮影した撮影画像を抽出することを特徴とする請求項5に記載のサーバ。
- 前記画像切取部は、前記画像抽出部により抽出した撮影画像から、前記商品画像として、店員の手に持たれている商品と、前記店員の手における、この商品を把持する部分とを含む画像を切り取ることを特徴とする請求項5又は請求項6に記載のサーバ。
- コンピュータを、
固定スキャナを有するPOSレジスタから、前記固定スキャナによる各商品のバーコードのスキャン時刻と、前記スキャン時刻にスキャンしたバーコードに対応した商品識別情報とを受信すると共に、前記固定スキャナにより商品のバーコードをスキャンする時に前記商品を撮影することが可能な位置に配置されたカメラから、各撮影画像と、前記各撮影画像の撮影時刻とを受信する受信部と、
前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻近辺の時刻に撮影した撮影画像を抽出する画像抽出部と、
前記画像抽出部により抽出した撮影画像における商品の部分の画像である商品画像を切り取る画像切取部と、
前記画像切取部により切り取った前記商品画像の各々に、前記POSレジスタから受信した商品識別情報のうち、前記商品画像の各々の基になる撮影画像の撮影時刻に最も近いスキャン時刻にスキャンしたバーコードに対応した商品識別情報をラベル付けするラベル付け部
として機能させるための、学習用データセット自動生成プログラム。 - 前記画像抽出部は、前記カメラから受信した前記各撮影画像及び前記各撮影画像の撮影時刻と、前記POSレジスタから受信した前記各商品のバーコードのスキャン時刻とに基づいて、前記カメラから受信した前記各撮影画像のうち、前記各商品のバーコードのスキャン時刻に撮影した撮影画像、前記スキャン時刻の所定時間前の時刻に撮影した撮影画像、及び前記スキャン時刻の所定時間後の時刻に撮影した撮影画像を抽出することを特徴とする請求項8に記載の学習用データセット自動生成プログラム。
- 前記画像切取部は、前記画像抽出部により抽出した撮影画像から、前記商品画像として、店員の手に持たれている商品と、前記店員の手における、この商品を把持する部分とを含む画像を切り取ることを特徴とする請求項8又は請求項9に記載の学習用データセット自動生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018233776A JP2020095537A (ja) | 2018-12-13 | 2018-12-13 | 学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018233776A JP2020095537A (ja) | 2018-12-13 | 2018-12-13 | 学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020095537A true JP2020095537A (ja) | 2020-06-18 |
Family
ID=71086408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018233776A Pending JP2020095537A (ja) | 2018-12-13 | 2018-12-13 | 学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020095537A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102365174B1 (ko) * | 2020-08-14 | 2022-02-21 | 한국공항공사 | 물품 데이터의 취득 및 학습 자동화 방법 및 물품 데이터의 취득 및 학습 자동화 시스템 |
WO2022097353A1 (ja) * | 2020-11-09 | 2022-05-12 | 東京ロボティクス株式会社 | データセット生成装置、方法、プログラム及びシステム |
WO2024029533A1 (ja) * | 2022-08-03 | 2024-02-08 | 京セラ株式会社 | 学習データ生成方法、学習済みモデル、情報処理装置、及び情報処理方法 |
-
2018
- 2018-12-13 JP JP2018233776A patent/JP2020095537A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102365174B1 (ko) * | 2020-08-14 | 2022-02-21 | 한국공항공사 | 물품 데이터의 취득 및 학습 자동화 방법 및 물품 데이터의 취득 및 학습 자동화 시스템 |
WO2022097353A1 (ja) * | 2020-11-09 | 2022-05-12 | 東京ロボティクス株式会社 | データセット生成装置、方法、プログラム及びシステム |
JP7446615B2 (ja) | 2020-11-09 | 2024-03-11 | 東京ロボティクス株式会社 | データセット生成装置、生成方法、プログラム、システム、機械学習装置、物体認識装置、及びピッキングシステム |
WO2024029533A1 (ja) * | 2022-08-03 | 2024-02-08 | 京セラ株式会社 | 学習データ生成方法、学習済みモデル、情報処理装置、及び情報処理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5431429B2 (ja) | 情報処理装置及びプログラム | |
JP2020095537A (ja) | 学習用データセット自動生成システム、サーバ、及び学習用データセット自動生成プログラム | |
JP6549558B2 (ja) | 売上登録装置、プログラム及び売上登録方法 | |
US10803438B2 (en) | Reading apparatus | |
CN106203225B (zh) | 基于深度的图像元素删除 | |
JP2012218037A (ja) | 板金工程作業支援システム | |
JP6687199B2 (ja) | 商品棚位置登録プログラム、及び情報処理装置 | |
JP6405826B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6574920B1 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
JP6574921B1 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
US20200298590A1 (en) | Image to script converter | |
US20190108503A1 (en) | Reading apparatus, reading method, and computer readable medium | |
WO2016152891A1 (ja) | 画像処理装置、画像処理方法、及び、プログラム | |
CN103413158A (zh) | 标签识别方法及终端设备 | |
US20120054052A1 (en) | Store system, sales registration apparatus, and control method | |
US9245264B2 (en) | Reading apparatus | |
JP5310040B2 (ja) | 撮像処理装置及びプログラム | |
WO2021033309A1 (ja) | 登録システム、処理装置、処理方法及びプログラム | |
JP7309171B2 (ja) | 光学式認識コード読取装置、方法及びプログラム | |
CN100586153C (zh) | 对编码数据成像的方法和系统 | |
WO2019157944A1 (zh) | 物品信息处理方法、系统、装置和计算机可读存储介质 | |
JP2003187126A (ja) | デジタルカメラ、商品注文書作成プログラム、及び商品注文方法 | |
US10051232B2 (en) | Adjusting times of capture of digital images | |
US11600152B2 (en) | Reading device | |
JP2018077838A (ja) | 情報処理装置、その処理方法及びプログラム |