(実施形態1)
(1)概要
本実施形態に係る学習方法は、第1電子タグ91が付された物品9が読取対象であるか否かを分類する分類器14(図1参照)の判定基準を学習するための方法である。
本開示でいう「読取対象」は、物品情報の読取りの対象となる物品9を意味し、第1読取部2A(図1参照)にて物品情報が読み取られた物品9のうち、0個ないし複数個の物品9が「読取対象」となる。すなわち、第1読取部2Aにて物品情報が読み取られた物品9の全てが直ちに「読取対象」となる訳ではなく、第1読取部2Aにて物品情報が読み取られた物品9と、「読取対象」である物品9とは必ずしも一致しない。すなわち、第1読取部2Aは、第1電子タグ91と電波を媒体とする無線通信を行うことにより、物品9に関する物品情報を読み取るので、「読取対象」でない物品9の物品情報を読み取る可能性がある。例えば、「読取対象」である物品9の周辺に、「読取対象」ではない物品9が存在する場合に、第1読取部2Aでは、「読取対象」である物品9だけでなく「読取対象」でない物品9についても、物品情報を読み取る場合がある。つまり、第1読取部2Aにて物品情報が読み取られた10個の物品9のうち、1個も「読取対象」とならないこともあれば、1個ないし10個の物品9が「読取対象」となることもある。
本実施形態では、「読取対象」である物品9は、図2に示すように、ユーザ90により店舗のレジカウンタ7上の載置エリアA11(後述する)に置かれた物品(商品)である。つまり、本実施形態では、「読取対象」である物品9は、ユーザ(ここでは、顧客)90が店舗に陳列されている複数の物品9の中からピックアップした、ユーザ90が購入予定の物品である。一方、「読取対象」ではない物品9は、レジカウンタ7上の載置エリアA11外にある物品である。一例として、「読取対象」ではない物品9は、ユーザ90がピックアップしていない店舗内の棚に陳列されたままの物品等である。
ここで、「ユーザ」は、顧客に限らず、分類器14の判定基準を機械学習により算出させようとする店員等であってもよい。以下では、特に断りのない限り、「ユーザ」を顧客として説明する。
本開示でいう「物品情報」は、物品9を識別するための情報であって、例えば、日本国で用いられているJAN(Japanese Article Number)コード等の商品識別コードである。この種の商品識別コードには、JANコードの他、欧州等で用いられているEAN(European Article Number)コード、及び米国で用いられているUPC(Universal Product Code)等がある。また、物品情報は、物品9の品種(種類)を識別する情報に限らず、同一品種の物品9を個別に識別するシリアル情報等の情報を含んでいてもよい。これにより、同一品種の物品9が複数ある場合にも、これら同一品種の複数の物品9の各々を物品情報にて特定可能である。この種のコードの例として、EPC(Electronic Product/Code)コード体系に含まれるSGTIN(Serialized Global Trade item Number)がある。
本実施形態の学習方法は、第1取得ステップと、ラベル付与ステップと、学習ステップと、を有する。
第1取得ステップは、第1読取部2Aにて物品9に付された第1電子タグ91と電波を媒体とする無線通信を行うことにより、第1電子タグ91から物品9に関する物品情報を取得するステップである。ここで、第1読取部2Aは、例えばレジカウンタ7(図2参照)等の所定のエリアに設置されており、原則、所定のエリア内にある第1電子タグ91と電波を媒体とする無線通信を行うことにより、物品9の物品情報を読み取る処理を実行する。つまり、第1読取部2Aは、物品9から直接的に物品情報を読み取るのではなく、物品9に付された第1電子タグ91から非接触で物品情報を読み取ることになる。
ラベル付与ステップは、物品情報を取得することで得られる第1電子タグ91の読取情報に対して、物品9が読取対象であるか否かを表すラベルを付与するステップである。
本開示でいう「読取情報」は、一例として、電子タグ(第1電子タグ91)の読取部(第1読取部2A)での読取りの回数、時間間隔、頻度、受信した電波の強度、及び受信した電波の位相のうちの少なくとも1つを含み得る。
本開示でいう「読取りの回数」は、ある期間内に、読取部(第1読取部2A)にて物品情報の読取りが行われた回数を意味し、より詳細には、読取部にて物品情報の読取りに成功した回数である。本開示でいう「読取りの時間間隔」は、ある期間内に、読取部にて物品情報の読取りが行われた時間間隔を意味する。より詳細には、読取部にて物品情報の読取りに2回成功したときの、1回目の物品情報の読取り時点から2回目の物品情報の読取り時点までの時間である。本開示でいう「読取りの頻度」は、ある期間内に、読取部にて物品情報の読取りが行われた頻度を意味し、より詳細には、読取部にて物品情報の読取りに成功した頻度である。本開示でいう「受信した電波の強度」は、アンテナ21(後述する)で受信した電子タグ(第1電子タグ91)から送信される電波の強度であり、一例として、RSSI(Received Signal Strength Indication)値で表される。本開示でいう「受信した電波の位相」は、アンテナ21で受信した電子タグから送信される電波の位相である。
学習ステップは、訓練データを用いて分類器14の判定基準を機械学習により算出するステップである。訓練データは、第1取得ステップにて取得した第1電子タグ91の読取情報に含まれる1以上のパラメータと、ラベル付与ステップで付与されたラベルと、を含むデータである。分類器14は、第1電子タグ91の読取情報と判定基準との比較に基づいて物品9が読取対象であるか否かを分類する。具体的には分類器14は、第1電子タグ91の読取情報から1以上のパラメータが説明変数として入力されると、入力された1以上のパラメータと判定基準とを比較し、第1電子タグ91が付された物品9が読取対象であるか否かを表す2値情報を目的変数として出力する。
ここで、「読取対象」である物品9が、第1読取部2Aにて物品情報を読み取りやすい位置(例えば、載置エリアA11)に配置される、と仮定する。読み取りやすい位置に配置された物品9については、他の物品9と比較して、第1読取部2Aにより物品情報を読み取りやすい。このため、「読取対象」である物品9についての読取情報と、他の物品9についての読取情報との間には、互いを区別する有意な差が生じ得る。したがって、分類器14は、第1電子タグ91の読取情報に基づいて、「読取対象」である物品9と、他の物品9とを区別することが可能である。
上述のように、本実施形態では、第1電子タグ91の読取情報に基づく訓練データを用いて、分類器14の判定基準を学習することが可能である。したがって、本実施形態では、物品9が置かれる環境が変更されたとしても、訓練データを用いて分類器14の判定基準を再調整することで、変更後の環境においても物品9が読取対象であるか否かを分類することが可能である。つまり、本実施形態では、物品9が置かれる環境に依らず、物品9が読取対象であるか否かを分類する精度を向上しやすい、という利点がある。
(2)詳細
以下、本実施形態の学習方法を実現するための学習システム100、及び学習システム100を含む買物支援システム200について図1及び図2を参照して詳しく説明する。本実施形態では、学習システム100は、買物支援システム200に組み込まれていることとして説明するが、買物支援システム200と別のシステムとして構成されていてもよい。
(2.1)買物支援システム
まず、買物支援システム200の概要について説明する。買物支援システム200は、図1に示すように、読取装置5と、決済システム6と、を備えている。読取装置5は、物品9の物品情報を取得するために用いられる。決済システム6は、読取装置5で取得された物品情報を用いて物品9の決済処理を行う。
買物支援システム200は、例えば、コンビニエンスストア、スーパーマーケット、百貨店、ドラッグストア、家電量販店又はホームセンター等の小売店の店舗に導入され、ユーザ90による商品の購入(つまり「買物」)を支援するシステムである。本開示でいう「購入」とは、売主(店舗)から買主(ユーザ)に物品9の所有権を移転し、これに対する対価(代金)を買主が売主に支払う行為(売買)における買主(ユーザ)側の行為を意味する。そのため、店舗に導入される買物支援システム200に読取装置5が用いられる場合、読取装置5を用いて物品情報が取得される物品9は、店舗で販売されている「商品」であって、物品情報は「商品情報」である。本実施形態では、買物支援システム200が導入される店舗としてコンビニエンスストアを例に説明する。
この種の店舗においては、複数の物品9が店内に陳列された状態で、複数の物品9の販売が行われている。そのため、ユーザ90は、店内に陳列されている複数の物品9の中から所望の物品9をピックアップし、ピックアップした物品9について決済(精算)を行うことで、所望の物品9を購入する。本実施形態では、店内に少なくとも1人は店員が存在する有人の店舗を想定する。ただし、この例に限らず、例えば、店舗に店員が居ない無人店舗のような状況においても、買物支援システム200は採用可能である。
読取装置5が買物支援システム200に用いられる場合においては、読取装置5で取得された物品情報は、決済システム6での決済処理に使用される。すなわち、決済システム6は、読取装置5で物品情報が取得された物品9について、物品情報を用いて決済処理を行う。よって、買物支援システム200によれば、店舗に設置された読取装置5にて物品情報の読み取りが行われることにより、物品9の決済処理が可能な状態になる。
本実施形態では、読取装置5は、店舗のレジカウンタ7に収容されている。レジカウンタ7の上面は、ユーザ90の購入対象(つまり、読取対象)の物品9が載せ置かれる載置エリアA11を構成している。そして、読取装置5は、載置エリアA11にある物品9から非接触で物品情報を取得する。そのため、ユーザ90は、店舗に陳列されている複数の物品9の中から、購入対象の物品9を、店内でピックアップし、載置エリアA11に載せ置くことで、読取装置5に物品情報の取得を実施させればよい。本実施形態では、ユーザ90は、購入対象の物品9を収容した買物かご(移動体)8を載置エリアA11に載せ置くことで、読取装置5に物品情報の取得を実施させる。そして、読取装置5で取得された物品情報のうち、読取対象である物品9についての物品情報を用いて決済システム6での決済処理が完了することで、売主(店舗)から買主(ユーザ)へ所有権が移転し、ユーザ90による商品の購入が成立する。ユーザ90は、購入した物品9、つまり決済処理が終了した物品9を持ち帰ることになる。
決済システム6は、読取装置5と通信可能に構成されている。決済システム6と読取装置5との間の通信方式としては、無線通信又は有線通信の適宜の通信方式が採用される。さらに、決済システム6は、例えば、POS(Point Of Sales)端末からなる店舗端末と、直接的に又は中継器等を介して間接的に、通信可能に構成されている。本実施形態では、決済システム6は、読取装置5と同様にレジカウンタ7に収容されている。
決済システム6は、後述する読取装置5のユーザインタフェース4を用いることにより、表示又は音声によって各種の情報をユーザ90に提示したり、ユーザ90の操作(音声入力を含む)を受け付けたりすることができる。ただし、決済システム6による情報の提示は、表示と音声との少なくとも一方で実現されればよく、表示と音声とのいずれか一方で実現されてもよいし、表示と音声との組み合わせで実現されてもよい。
一例として、決済システム6は、来客検知時及び決済処理の完了時に、「いらっしゃいませ。」、「ありがとうございました。」等のメッセージをユーザ90に提示することができる。これにより、ユーザ90に対して、店員が接客するのに近い親近感を与えることができる。また、ユーザ90は、例えば、ユーザインタフェース4に表示される購入対象の物品9の一覧、及び決済金額(精算金額)等を確認し、確認後にユーザインタフェース4を操作して承諾の意思表示を行うことにより、決済システム6での決済処理を行う。決済処理は、例えば、携帯情報端末(スマートフォン又はウェアラブル端末等)、又はIC(Integrated Circuit)カード等と決済システム6との間の近距離無線通信により、実現されてもよい。この場合、ユーザ90は、携帯情報端末又はICカード等を、所定箇所(例えば、ユーザインタフェース4付近)に近づける操作により、決済システム6に決済処理を行わせる。ここで、決済システム6は、プリンタを有していてもよく、その場合、決済処理が完了すれば、プリンタにてレシート(receipt)等を発行(印刷)可能である。ただし、決済処理においてユーザ90の操作を受け付けること、及びレシートを発行することは、買物支援システム200において必須の構成ではない。
また、購入対象の物品9の一覧、及び決済金額等の情報(以下、「購入情報」という)は、決済システム6から、ユーザ90が所有する携帯情報端末(スマートフォン又はタブレット端末等)、又は店舗端末等に送信されてもよい。これにより、ユーザ90が所有する携帯情報端末、又は決済システム6とは別の情報端末にて、購入情報の閲覧又はレシートの発行等が可能になる。さらに、店舗端末等からサーバに購入情報が送信されることで、退店後においても、ユーザ90は、ユーザ90が所有する携帯情報端末にて購入情報を閲覧したり、携帯情報端末にレシートを発行させたりすることが可能になる。
本実施形態では、決済システム6は、ハードウェアとしての1以上のプロセッサ及びメモリを主構成とするコンピュータシステムである。このコンピュータシステムでは、メモリに記録されたプログラムを1以上のプロセッサで実行することによって、決済システム6の機能が実現される。プログラムは、コンピュータシステムのメモリにあらかじめ記録されてもよく、電気通信回線を通じて提供されてもよく、コンピュータシステムで読み取り可能な光学ディスク、ハードディスクドライブ等の非一時的記録媒体に記録されて提供されてもよい。
(2.2)読取装置
次に、読取装置5の構成について図1を参照して説明する。読取装置5は、第1読取部2Aと、メインコンピュータ10と、検知部3と、ユーザインタフェース4と、を備えている。
第1読取部2Aは、物品9に付された第1電子タグ91から物品情報を読み取ることにより、物品情報を取得するように構成されている。すなわち、第1読取部2Aは、物品9に付された第1電子タグ91との間で電波を媒体として無線通信を行うことにより、第1電子タグ91に記憶されている物品情報を取得する。
第1電子タグ91は、例えば、パッシブ型のRFタグであって、少なくとも物品情報を記憶するメモリを有している。ここにおいて、複数の物品9には複数の第1電子タグ91が一対一で対応付けられている。第1電子タグ91には、対応する物品9についての物品情報が記憶されており、第1電子タグ91は、対応する物品9に付されている。
第1電子タグ91は物品9と一体に取り扱い可能な状態で物品9に付されていればよく、第1電子タグ91が物品9に付される具体的な態様としては、様々な態様がある。本実施形態では一例として、第1電子タグ91はシール状であって物品9に貼り付けられている。その他、第1電子タグ91は、例えば、紐等で物品9に繋がっていてもよいし、物品9の梱包材に一体化されていてもよいし、物品9に埋め込まれていてもよいし、物品9に組み込まれていてもよい。さらに、例えば、塗布型半導体等の技術を用いることにより、第1電子タグ91は、物品9自体、又は物品9の梱包材等の表面に、印刷にて直接的に形成されていてもよい。
本実施形態に係る第1読取部2Aは、図2に示すように、矩形板状に形成されており、レジカウンタ7の載置エリアA11の下方に設置されている。第1読取部2Aは、その内部にアンテナ21及び通信部22を有しており(図1参照)、RFID(Radio Frequency Identification)システムを構成するリーダである。第1読取部2Aは、基本的には、第1読取部2Aの上方の載置エリアA11に置かれた物品9の第1電子タグ91と無線通信を行う。つまり、第1読取部2Aは、第1エリアA1に向けて設置されており、第1エリアA1は、読取対象の物品9が載置される載置エリアA11を含んでいる。本実施形態では、第1読取部2Aは、載置エリアA11からの電波の漏洩を低減するためのシールド等を有さない、いわゆる開放型の読取装置である。
アンテナ21は、第1読取部2A上の載置エリアA11に位置する第1電子タグ91との間で、通信媒体となる電波を送受信し、無線通信を行う。すなわち、本実施形態では、アンテナ21は、処理エリアに対して下方から電波を送受信可能となるように配置されている。アンテナ21は、偏波面を考慮し、円偏波のアンテナにて構成されることが好ましい。アンテナ21は、通信部22と電気的に接続されている。アンテナ21は、例えば、パッチアンテナ、モノポールアンテナ、逆F形アンテナ又はスロットアンテナ等で構成される。
ただし、本実施形態では第1読取部2Aは開放型であるので、アンテナ21から送信される電波が届く範囲を規制する構造は特に設けられていない。そのため、アンテナ21から出た通信用の電波が、例えば、レジカウンタ7付近に置かれた商品等、載置エリアA11外に存在する物品9に届くこともある。したがって、第1読取部2Aでは、レジカウンタ7付近に置かれた商品等、載置エリアA11外に存在する物品9から、物品情報を読み取ることがある。
通信部22は、アンテナ21から第1電子タグ91に電波を送信し、この電波によって起動された第1電子タグ91からの物品情報をアンテナ21にて受信する。通信部22は、少なくとも物品情報の受信時に、無線信号(電波)の受信信号強度を計測する。通信部22は、第1電子タグ91から物品情報を受信すると、物品情報に加えて、受信信号強度をメインコンピュータ10に送信する。
検知部3は、物品9の位置を検知する。詳しくは後述するが、レジカウンタ7から一定距離の領域(周辺エリアA21)に物品9が進入したこと、及び載置エリアA11に物品9が置かれたことが検知部3にて検知されたタイミングで、読取装置5における第1電子タグ91との無線通信が開始する。つまり、メインコンピュータ10は、検知部3からのトリガを受けて、制御部15(後述する)にて、読取装置5における第1電子タグ91との無線通信を開始させる。本実施形態では、検知部3は、第1センサ31と、第2センサ32と、を有している。
第1センサ31は、例えば、レジカウンタ7からユーザ90までの距離を測定する測距センサで実現される。具体的には、第1センサ31は、例えば、光学式、超音波式又は電波式等の非接触式の測距センサにて実現される。第1センサ31は、レジカウンタ7から物品9(又は物品9を収容した買物かご8)を持ったユーザ90までの距離を測定することで、レジカウンタ7から一定距離の領域(周辺エリアA21)に物品9が進入したことを検知する。
第2センサ32は、載置エリアA11に載せ置かれた物体の重量を計測する重量センサである。第2センサ32では、載置エリアA11に物品9(又は物品9を収容した買物かご8)が載せ置かれていない場合には物体の重量が計測されず、載置エリアA11に物品9(又は物品9を収容した買物かご8)が載せ置かれた場合には物体の重量が計測される。したがって、第2センサ32は、物体の重量が計測されたか否かにより、載置エリアA11に物品9が存在するか否かを検知する。
つまり、検知部3は、検知範囲(ここでは、載置エリアA11及び周辺エリアA21)における物品9、及び物品9と共に移動する移動体(ここでは、買物かご)8の少なくとも一方の存否を検知する。言い換えれば、本実施形態では、学習方法は、検知範囲における物品9、及び物品9と共に移動する移動体8の少なくとも一方の存否を検知する検知ステップを更に有している。そして、検知部3は、検知ステップの実行主体である。
また、本実施形態では、検知範囲は、載置エリアA11と、周辺エリアA21と、を含んでいる。載置エリアA11は、既に述べたように、読取対象の物品9が載せ置かれるエリアである。周辺エリアA21は、レジカウンタ7から一定距離の領域、つまり載置エリアA11から所定距離離れた位置までのエリアである。
ユーザインタフェース4は、読取装置5において表示又は音声によって各種の情報をユーザ90に提示したり、ユーザ90の操作(音声入力を含む)を受け付けたりする機能を持つ。本実施形態では、ユーザインタフェース4は、表示部41と、操作部42と、を有している。さらに、本実施形態では、表示部41及び操作部42はタッチパネルディスプレイとして一体化されている。ユーザインタフェース4は、一例として、ユーザ90側(前方)に向くようにレジカウンタ7に設置される。ユーザインタフェース4は、表示及び音声に限らず、例えば、ランプの点灯状態(点灯、消灯、光色、点滅パターン又は明るさ等)又はバイブレータを用いた振動等により、情報を提示してもよい。
メインコンピュータ10は、ハードウェアとしての1以上のプロセッサ及びメモリを主構成とするコンピュータシステムである。このコンピュータシステムでは、メモリに記録されたプログラムを1以上のプロセッサで実行することによって、メインコンピュータ10の機能が実現される。プログラムは、コンピュータシステムのメモリにあらかじめ記録されてもよく、電気通信回線を通じて提供されてもよく、コンピュータシステムで読み取り可能な光学ディスク、ハードディスクドライブ等の非一時的記録媒体に記録されて提供されてもよい。
(2.3)学習システム
次に、学習システム100の構成について詳細に説明する。本実施形態では、メインコンピュータ10が学習システム100を構成している。メインコンピュータ10は、取得部11と、ラベル付与部12と、学習部13と、分類器14と、制御部15と、記憶部16と、入力受付部17と、を有している。ただし、学習システム100は、メインコンピュータ10の有する構成を全て備えている必要はなく、少なくとも取得部(第1取得部)11A、ラベル付与部12、及び学習部13を備えていればよい。
取得部11は、複数の物品9についての複数の物品情報を第1読取部2Aから取得する。既に述べたように、第1読取部2Aは、物品9に付された第1電子タグ91との無線通信が確立した際に、第1電子タグ91が付された物品9についての物品情報を、第1電子タグ91から受信する。取得部11は、このようにして第1読取部2Aが第1電子タグ91から読み出した(受信した)物品情報を、第1読取部2Aから取得する。つまり、本実施形態では、取得部11は、第1取得ステップの実行主体である。
ここで、第1読取部2Aが複数の物品9についての物品情報を同時に読み取った場合には、取得部11は、物品9ごとの物品情報を取得する。取得部11は、第1読取部2Aから物品情報を一定時間(例えば、数ミリ秒)間隔で取得し、記憶部16に記憶する。
分類器14は、第1電子タグ91の読取情報と判定基準との比較に基づいて、物品9が読取対象であるか否かを分類する。具体的には、分類器14は、第1電子タグ91の読取情報から1以上のパラメータが説明変数として入力されると、入力された1以上のパラメータと判定基準とを比較し、第1電子タグ91が付された物品9が読取対象であるか否かを表す2値情報を目的変数として出力する。
分類器14は、例えばSVM(Support Vector Machine)等の線形分類器の他、ニューラルネットワークを用いた分類器、又は多層ニューラルネットワークを用いた深層学習(ディープラーニング)により生成される分類器を含み得る。本実施形態では、分類器14は、学習済みのニューラルネットワークを用いた分類器である。学習済みのニューラルネットワークは、例えばCNN(Convolutional Neural Network:畳み込みニューラルネットワーク)、又はBNN(Bayesian Neural Network:ベイズニューラルネットワーク)等を含み得る。分類器14は、ASIC(Application Specific Integrated Circuit)又はFPGA(Field-ProgrammableGate Array)等の集積回路に、学習済みのニューラルネットワークを実装することで実現されている。
分類器14の判定基準は、学習部13にて多数の訓練データを用いて機械学習することにより得られる。本開示でいう「機械学習」は、未学習の分類器14に対して実行される学習の他に、学習済みの分類器14に対して実行される再学習を含み得る。ここでいう「訓練データ」は、分類器14に入力される入力情報と、入力情報に付与されたラベルと、を組み合わせたデータセットである。
「入力情報」は、説明変数であって、第1電子タグ91の読取情報に含まれる1以上のパラメータである。説明変数は、一例として、第1電子タグ91の第1読取部2Aでの読取りの回数の時間変化、又は受信した電波の強度(RSSI値)の時間変化を含み得る。また、説明変数は、一例として、第1電子タグ91の第1読取部2Aでの読取りの回数の分散、受信した電波の強度(RSSI値)若しくは強度の分散、又は受信した電波の位相若しくは位相の分散を含み得る。
「ラベル」は、分類器14に入力された説明変数に対して、分類器14が出力すべき目的変数、つまり分類器14が出力すべき正解を表すデータである。本実施形態では、ラベルは、物品9が読取対象であるか否かを表すデータである。一例として、読取対象の物品9(つまり、載置エリアA11に載せ置かれた物品9)についての訓練データでは、ラベルは、物品9が読取対象であることを表すデータとなる。また、読取対象外の物品9(つまり、載置エリアA11外にある物品9)についての訓練データでは、ラベルは、物品9が読取対象ではないことを表すデータとなる。
なお、本実施形態では、入力情報には、EPC等の商品識別コードが含まれていない。つまり、本実施形態では、分類器14に入力される説明変数には、物品9を特定する情報が含まれていない。ここで、入力情報に商品識別コードが含まれていた場合、分類器14は、物品9を特定する情報に依存して物品9が読取対象であるか否かを判定するように学習される可能性がある。つまり、入力情報から物品9を特定する情報を排除することで、物品9を特定する情報により分類器14の分類結果が左右されるのを防ぐことが可能である。
ラベル付与部12は、取得部11で物品情報を取得することで得られる第1電子タグ91の読取情報に対して、物品9が読取対象であるか否かを表すラベルを付与する。つまり、本実施形態では、ラベル付与部12は、ラベル付与ステップの実行主体である。ラベル付与部12で付与されるラベルと、ラベルの付与対象である第1電子タグ91の読取情報と、を含むデータセットは、訓練データとして記憶部16に記憶される。
本実施形態では、ラベル付与部12は、学習フェーズと推論フェーズとで、第1電子タグ91の読取情報に対してラベルを付与する態様が異なっている。学習フェーズは、分類器14を使用していない期間において、分類器14の判定基準を機械学習により算出するフェーズである。学習フェーズは、一例として、新規の店舗に買物支援システム200を導入する段階、又は店舗内のレイアウトを変更した段階で実行される。推論フェーズは、物品9が読取対象であるか否かを分類するために分類器14を使用しているフェーズである。本実施形態では、推論フェーズにおいても分類器14の判定基準を機械学習(再学習)により更新することが可能である。
学習フェーズでは、ラベル付与部12は、取得部11で取得した物品情報と、記憶部16に記憶してあるリストと、を比較することにより、第1電子タグ91の読取情報に付与するラベルを決定する。物品情報は、一例としてEPC等の商品識別コードである。リストには、読取対象の物品9(つまり、載置エリアA11に載せ置かれる物品9)の物品情報が含まれている。ラベル付与部12は、物品情報がリストに含まれている場合、この物品情報に対応する第1電子タグ91の読取情報に対しては、物品9が読取対象であることを表す正解ラベルを付与する。一方、ラベル付与部12は、物品情報がリストに含まれていない場合、この物品情報に対応する第1電子タグ91の読取情報に対しては、物品9が読取対象ではないことを表す不正解ラベルを付与する。
推論フェーズでは、ラベル付与部12は、入力受付部17(後述する)で受け付けた分類器14の分類結果に対する評価に基づいて、第1電子タグ91の読取情報に付与するラベルを決定する。言い換えれば、本実施形態では、ラベル付与ステップは、入力受付部17(つまり、入力受付ステップ)で受け付けた入力に基づいてラベルを決定する。例えば、ある物品9についての分類器14の分類結果が「読取対象」であって、この評価が正しいという入力を入力受付部17で受け付けた、と仮定する。この場合、ラベル付与部12は、この物品9に付された第1電子タグ91の読取情報に対しては、物品9が読取対象であることを表すラベルを付与する。また、ある物品9についての分類器14の分類結果が「読取対象」であって、この評価が誤りであるという入力を入力受付部17で受け付けた、と仮定する。この場合、ラベル付与部12は、この物品9に付された第1電子タグ91の読取情報に対しては、物品9が読取対象ではないことを表す不正解ラベルを付与する。
本実施形態では、ラベル付与部12は、制御部15により第1読取部2Aと第1電子タグ91との無線通信を開始してから終了するまでの期間にて、ラベルを決定している。この期間は、既に述べたように、検知部3の第1センサ31及び第2センサ32の検知結果に基づいて決定される。つまり、ラベル付与ステップの実行期間は、検知ステップの検知結果に基づいて決定される。
学習部13は、訓練データを用いて、分類器14の判定基準を機械学習により算出する。訓練データは、取得部11(第1取得ステップ)にて取得した第1電子タグ91の読取情報に含まれる1以上のパラメータと、ラベル付与部12(ラベル付与ステップ)で付与されたラベルと、を含むデータである。つまり、本実施形態では、学習部13は、学習ステップの実行主体である。学習部13は、1以上のプロセッサにより構成される。ここでいう「プロセッサ」は、例えばCPU(Central Processing Unit)及びGPU(Graphics Processing Unit)等の汎用のプロセッサの他に、ニューラルネットワークでの演算に特化した専用のプロセッサを含み得る。
本実施形態では、学習部13は、多数の訓練データを用いて、分類器14で用いられるニューラルネットワークの機械学習を行うことで、分類器14の判定基準の機械学習を行う。学習部13は、複数の訓練データの各々について、ニューラルネットワークの入力層に入力情報を入力して演算を実行する。そして、学習部13は、ニューラルネットワークの出力層の複数のニューロンの出力値と、入力情報に対応するラベルとを用いて、バックプロパゲーション(誤差逆伝播法)処理を実行する。ここで、出力層の複数のニューロンは、それぞれ物品9のとり得る複数の状態に対応している。ここでいう「複数の状態」は、物品9が読取対象であるという状態と、物品9が読取対象ではないという状態と、を含む。
バックプロパゲーション処理においては、学習部13は、出力層の複数のニューロンのうち、訓練データに含まれるラベルと対応するニューロンの出力値の最大化を図るように、ニューラルネットワークの重み付け係数を更新する。学習部13は、全ての訓練データについてバックプロパゲーション処理を実行することにより、ニューラルネットワークの重み付け係数の最適化を図る。これにより、ニューラルネットワークの学習が完了する。
制御部15は、少なくとも第1読取部2Aにおける第1電子タグ91との無線通信の開始及び終了の指示を出す。具体的には、制御部15は、第1読取部2Aと第1電子タグ91との無線通信を開始させる際には、第1読取部2Aから無線通信用の電波の出力を開始させるように第1読取部2Aを制御する。また、制御部15は、第1読取部2Aと第1電子タグ91との無線通信を終了させる際には、第1読取部2Aから無線通信用の電波の出力を停止させるように、第1読取部2Aを制御する。
本実施形態では、制御部15は、検知部3の第1センサ31にて周辺エリアA21に物品9が進入したことを検知すると、第1読取部2Aから無線通信用の電波の出力を開始させるように第1読取部2Aを制御する。また、本実施形態では、制御部15は、検知部3の第2センサ32にて物品9(又は物品9が収容された買物かご8)が検知されてから所定時間が経過すると、第1読取部2Aから無線通信用の電波の出力を停止させるように、第1読取部2Aを制御する。
記憶部16は、例えば、書換可能な不揮発性の半導体メモリ等の非一時的記録媒体にて実現される。記憶部16は、取得部11が取得した第1電子タグ91の物品情報を記憶する。また、記憶部16は、ラベル付与部12によりラベルを付与された第1電子タグ91の読取情報、つまり訓練データを記憶する。また、記憶部16は、学習部13により学習された分類器14の判定基準を記憶する。
入力受付部17は、分類器14の分類結果を評価する入力を受け付ける。言い換えれば、本実施形態の学習方法は、分類器14の分類結果を評価する入力を受け付ける入力受付ステップを有している。そして、入力受付部17は、入力受付ステップの実行主体である。本実施形態では、入力は、ユーザインタフェース4の操作部42にて行われる。具体的には、ユーザインタフェース4の表示部41には、分類器14で分類された物品9ごとに、分類器14の分類結果と、分類結果が正しいか否かを問い合わせるメッセージと、正しくない場合に操作される第1アイコンと、が表示される。また、表示部41には、分類結果に対する評価が終了した場合に操作される第2アイコンが表示される。
ユーザ90は、いずれかの物品9において分類器14の分類結果が正しくない場合には、操作部42を操作して、該当する物品9に対応する表示部41上の第1アイコンを選択する。そして、ユーザ90は、全ての物品9について分類器14に対する評価が完了すると、操作部42を操作して、表示部41上の第2アイコンを選択する。これにより、入力受付部17は、分類器14で分類された全ての物品9について、分類器14の分類結果に対する評価を受け付けることになる。なお、操作部42を操作するユーザ90は、顧客であってもよいし、店員等であってもよい。
(3)動作
以下、本実施形態の買物支援システム200の動作の一例と、本実施形態の学習システム100の動作、言い換えれば学習方法の一例と、について説明する。
(3.1)学習フェーズ
まず、学習フェーズにおける学習システム100の動作について説明する。学習フェーズにおける機械学習は、例えば買物支援システム200を導入する店舗で実行される。店舗では、学習部13を用いて、分類器14で用いるニューラルネットワークの機械学習を行う。買物支援システム200を新規の店舗に導入する段階で機械学習を行う場合、ニューラルネットワークの重み付け係数は、初期化されているのが好ましい。一方、既に買物支援システム200を店舗に導入しており、店舗内のレイアウトを変更した段階で機械学習を行う場合、ニューラルネットワークの重み付け係数は、初期化されてもよいし、従前のままであってもよい。
図3に示すように、読取対象の物品9(つまり、載置エリアA11に載せ置かれる物品9)の物品情報が含まれるリストを記憶部16に記憶させる(S1)。次に、リストに挙げられている読取対象の物品9を載置エリアA11に順次載せ置いていく。物品9は、1つずつ載置エリアA11に載せ置いてもよいし、複数個ずつ載置エリアA11に載せ置いてもよい。そして、検知部3(ここでは、第2センサ32)により物品9が載置エリアA11に載せ置かれたことを検知すると(S2:Yes)、第1読取部2Aが物品9に付された第1電子タグ91から物品情報を読み出す。これにより、取得部11が載置エリアA11に載せ置かれた物品9の物品情報を取得する(S3)。このとき、取得部11は、第1電子タグ91の読取情報も取得する(S4)。
次に、取得した物品9の物品情報がリストに含まれている場合(S5:Yes)、ラベル付与部12は、この物品9に付された第1電子タグ91の読取情報に対して、物品9が読取対象であることを表す正解ラベルを付与する(S6A)。一方、取得した物品9の物品情報がリストに含まれていない場合(S5:No)、ラベル付与部12は、この物品9に付された第1電子タグ91の読取情報に対して、物品9が読取対象でないことを表す不正解ラベルを付与する(S6B)。後者の場合は、例えば載置エリアA11の周辺にある物品9に付された第1電子タグ91の物品情報が第1読取部2Aにより読み取られることで生じ得る。そして、ラベル付与部12は、付与したラベルと、ラベルの付与対象の第1電子タグ91の読取情報と、を含むデータセットを訓練データとして記憶部16に記憶させる(S7)。
そして、蓄積された訓練データの数が所定数に達していなければ(S8:No)、学習システム100では、上記のS2〜S7の処理を繰り返すことで訓練データを蓄積する。そして、訓練データの数が所定数に達すると(S8:Yes)、学習部13は、記憶部16に記憶している蓄積された訓練データを用いて、分類器14の判定基準を機械学習させる(S9)。そして、例えば分類器14による物品9が読取対象であるか否かの分類結果の正答率が所定値以上に達すれば、分類器14の判定基準の機械学習が完了する。
(3.2)推論フェーズ
次に、推論フェーズにおける買物支援システム200及び学習システム100の動作について説明する。図4に示すように、まず、分類器14は、記憶部16から判定基準を読み込む(S11)。次に、ユーザ90が購入対象(つまり、読取対象)の物品9を載置エリアA11に順次載せ置いていく。そして、検知部3(ここでは、第2センサ32)により物品9が載置エリアA11に載せ置かれたことを検知すると(S11:Yes)、学習フェーズと同様に、取得部11が載置エリアA11に載せ置かれた物品9の物品情報を取得する(S12)。このとき、取得部11は、学習フェーズと同様に、第1電子タグ91の読取情報も取得する(S13)。
次に、取得部11で取得した第1電子タグ91の読取情報に含まれる1以上のパラメータが分類器14に入力されることで、分類器14は、物品9が読取対象であるか否かを分類する(S14)。そして、分類器14の分類結果が、分類結果が正しいか否かを問い合わせるメッセージ、第1アイコン、及び第2アイコンと併せてユーザインタフェース4の表示部41に表示される(S15)。これにより、ユーザ90は、表示部41に表示された画像を見ながら第1アイコン又は第2アイコンを選択することにより、分類器14の分類結果を評価する。
入力受付部17が分類器14の分類結果に対する評価を受け付けると(S16)、ラベル付与部12は、入力受付部17で受け付けた評価に基づいて、第1電子タグ91の読取情報に対して、正解ラベル又は不正解ラベルを付与する(S17)。そして、ラベル付与部12は、付与したラベルと、ラベルの付与対象の第1電子タグ91の読取情報と、を含むデータセットを訓練データとして記憶部16に記憶させる(S18)。
そして、学習部13は、記憶部16に記憶している蓄積された訓練データを用いて、分類器14の判定基準を再学習させる(S19)。再学習が完了すると、学習部13は、再学習後の分類器14の判定基準を記憶部16に記憶させることで、判定基準を更新する(S20)。なお、学習部13による再学習に時間を要する場合、例えば夜間等の買物支援システム200を使用しない時間帯にて再学習を行ってもよい。
(4)利点
以下、本実施形態の学習方法(学習システム100)の利点について、比較例の買物支援システム300との比較を交えて説明する。比較例の買物支援システム300は、図5及び図6に示すように、レジカウンタ7において読取装置5のメインコンピュータとして内蔵されている。ただし、比較例の買物支援システム300は、上述の学習システム100を備えていない点で、本実施形態の買物支援システム200と相違する。また、比較例の買物支援システム300では、分類器は、第1電子タグ91の読取情報に含まれる1以上のパラメータと閾値とを比較する所定のアルゴリズムにより、物品9が読取対象であるか否かを分類する構成である、と仮定する。
比較例の買物支援システム300では、図5に示す店舗内のレイアウトの元で、分類器の閾値があらかじめ最適化されている、と仮定する。したがって、比較例の買物支援システム300では、分類器は、図5に示す店舗内のレイアウトにおいては、物品9が読取対象であるか否かを分類できている、と仮定する。図5に示す店舗内のレイアウトは、図2に示す店舗内のレイアウトと同じである。
ここで、例えば図6に示すように、陳列棚B1を読取装置5の近傍に移動させることで店舗内のレイアウトを変更した、と仮定する。この場合、比較例の買物支援システム300では、店舗内のレイアウトが変更されたことにより、物品9が読取対象であるか否かを分類器が分類できなくなる可能性がある。例えば、陳列棚B1に陳列されている物品9は、店舗内のレイアウトを変更する前においては、分類器が読取対象ではないと分類していたとしても、店舗内のレイアウトの変更後においては、分類器が読取対象であると誤って分類する可能性がある。
店舗内のレイアウトの変更後においても物品9が読取対象であるか否かを分類器が正しく分類できるようにするためには、分類器の閾値を再調整する必要がある。しかしながら、比較例の買物支援システム300では、多数の物品9に付された第1電子タグ91の物品情報を読取装置5に読み取らせながら、第1電子タグ91の読取情報に含まれる1以上のパラメータの分布を見て閾値を再調整する必要がある。このような閾値の再調整は、システム専門の技術者の手を借りなければ困難であり、店舗内のレイアウトを変更するたびに技術者を店舗に召喚するのは現実的ではない。
これに対して、本実施形態の学習システム100では、取得した第1電子タグ91の読取情報に基づく訓練データを用いて、分類器14の判定基準を学習することが可能である。したがって、本実施形態では、店舗内のレイアウトが変更される等して物品9が置かれる環境が変更されたとしても、訓練データを用いて分類器14の判定基準を再調整することで、変更後の環境においても物品9が読取対象であるか否かを分類することが可能である。この分類器14の判定基準の再調整は、分類器14に訓練データを入力すれば実行されるので、比較例の買物支援システム300とは異なり、システム専門の技術者の手を借りる必要がない。
上述のように、本実施形態では、物品9が置かれる環境に依らず、物品9が読取対象であるか否かを分類する精度を向上しやすい、という利点がある。また、本実施形態では、分類器14の判定基準の再調整に当たってシステム専門の技術者の手を借りる必要がないので、分類器14の判定基準の再調整を容易に行うことが可能である、という利点もある。
(5)変形例
上述の実施形態は、本開示の様々な実施形態の一つに過ぎない。上述の実施形態は、本開示の目的を達成できれば、設計等に応じて種々の変更が可能である。また、学習方法(学習システム100)と同様の機能は、(コンピュータ)プログラム、又はプログラムを記録した非一時的記録媒体等で具現化されてもよい。本開示の一態様に係るプログラムは、1以上のプロセッサに、上記の学習方法を実行させる。
以下、上述の実施形態の変形例を列挙する。以下に説明する変形例は、適宜組み合わせて適用可能である。
本開示における学習システム100では、例えば、メインコンピュータ10等に、コンピュータシステムを含んでいる。コンピュータシステムは、ハードウェアとしてのプロセッサ及びメモリを主構成とする。コンピュータシステムのメモリに記録されたプログラムをプロセッサが実行することによって、本開示における学習システム100としての機能が実現される。プログラムは、コンピュータシステムのメモリに予め記録されてもよく、電気通信回線を通じて提供されてもよく、コンピュータシステムで読み取り可能なメモリカード、光学ディスク、ハードディスクドライブ等の非一時的記録媒体に記録されて提供されてもよい。コンピュータシステムのプロセッサは、半導体集積回路(IC)又は大規模集積回路(LSI)を含む1ないし複数の電子回路で構成される。ここでいうIC又はLSI等の集積回路は、集積の度合いによって呼び方が異なっており、システムLSI、VLSI(Very Large Scale Integration)、又はULSI(Ultra Large Scale Integration)と呼ばれる集積回路を含む。さらに、LSIの製造後にプログラムされる、FPGA(Field-Programmable Gate Array)、又はLSI内部の接合関係の再構成若しくはLSI内部の回路区画の再構成が可能な論理デバイスについても、プロセッサとして採用することができる。複数の電子回路は、1つのチップに集約されていてもよいし、複数のチップに分散して設けられていてもよい。複数のチップは、1つの装置に集約されていてもよいし、複数の装置に分散して設けられていてもよい。ここでいうコンピュータシステムは、1以上のプロセッサ及び1以上のメモリを有するマイクロコントローラを含む。したがって、マイクロコントローラについても、半導体集積回路又は大規模集積回路を含む1ないし複数の電子回路で構成される。
また、学習システム100における複数の機能が、1つの筐体内に集約されていることは学習システム100に必須の構成ではない。学習システム100の構成要素は、複数の筐体に分散して設けられていてもよい。さらに、学習システム100の少なくとも一部の機能は、例えば、サーバ装置及びクラウド(クラウドコンピューティング)等によって実現されてもよい。
一例として、上述の実施形態では、学習システム100は店舗内のメインコンピュータ10により実現されているが、これに限らず、店舗から離れた遠隔地にあるサーバ装置により実現されていてもよい。
上述の実施形態において、入力受付部17は、分類器14による分類結果の確実性に関する指標が所定の範囲内にある場合に、入力を受け付けてもよい。言い換えれば、入力受付ステップは、分類器14による分類結果の確実性に関する指標が所定の範囲内にある場合に実行されてもよい。ここでいう「分類結果の確実性に関する指標」は、一例として、分類器14による物品9が読取対象であるか否かの分類確率である。例えば、分類確率が閾値未満(一例として、90%未満)である場合に、入力受付部17にて入力を受け付ける。つまり、上記の分類確率が閾値未満である場合、この物品9が読取対象であるか否かを正確に分類していない可能性がある。そこで、このような場合に、ユーザ90による分類器14の分類結果に対する評価を受け付けることで、分類器14の分類精度を補完することが可能である。言い換えれば、上記の分類確率が閾値以上である場合、入力受付部17にて分類器14の分類結果に対する評価の入力を受け付けなくてもよい。
上述の実施形態において、検知部3は、物品9の体積又は重量等、物品9の状態を表す状態情報を取得する機能を有していてもよい。言い換えれば、学習方法は、状態情報を取得する状態取得ステップを更に有していてもよい。そして、分類器14に入力される説明変数には、状態情報が含まれていてもよい。この態様では、物品9の状態を加味して物品9が読取対象であるか否かを分類するように分類器14の判定基準が学習されるので、分類器14の分類精度の向上が期待できる、という利点がある。
上述の実施形態において、例えば図7に示すように、移動体(ここでは、買物かご)8に第2電子タグ81が付されていてもよい。第2電子タグ81は、第1電子タグ91と同様にパッシブ型のRFタグであって、少なくとも移動体8を識別するための情報であって、移動体8ごとに割り当てられた固有の識別コードを含む移動体情報を記憶するメモリを有している。第2電子タグ81は、第1電子タグ91と同様に、移動体8と一体に取り扱い可能な状態で移動体8に付されていればよい。
そして、取得部11は、第1電子タグ91の読取情報だけでなく、第1読取部2Aと第2電子タグ81との無線通信により得られる第2電子タグ81の読取情報も取得してもよい。言い換えれば、学習方法は、第1読取部2Aにて、物品9と共に移動する移動体8に付された第2電子タグ81と電波を媒体とする無線通信を行うことにより、第2電子タグ81の読取情報を取得する第3取得ステップを更に有していてもよい。そして、ラベル付与ステップは、第1電子タグ91の読取情報と、第2電子タグ81の読取情報と、の比較結果に基づいてラベルを決定してもよい。
例えば、購入対象(つまり、読取対象)の物品9は、移動体(買物かご)8に収容された状態でレジカウンタ7の載置エリアA11に載せ置かれることになる。このため、この物品9に付された第1電子タグ91の読取情報と、この物品9が収容された移動体8に付された第2電子タグ81の読取情報とは、殆ど同じ時間的な変化を辿る。
したがって、ラベル付与部12は、第1電子タグ91の読取情報と第2電子タグ81の読取情報とが殆ど同じ時間的な変化を辿る場合、この第1電子タグ91の読取情報に対して、物品9が読取対象であることを表す正解ラベルを付与する。一方、ラベル付与部12は、第1電子タグ91の読取情報と第2電子タグ81の読取情報との時間的な変化が互いに異なる場合、この第1電子タグ91の読取情報に対して、物品9が読取対象ではないことを表す不正解ラベルを付与する。この態様では、第2電子タグ81の読取情報を参照しない場合と比較して、第1電子タグ91の読取情報に対して適切なラベルを付与しやすい、という利点がある。また、この態様では、ユーザ90の判断を必要とせずに、第1電子タグ91の読取情報に対してラベルを自動的に付与することが可能である、という利点もある。
上記の態様においては、第2電子タグ81は、移動体8に複数付されていてもよい。そして、複数の第2電子タグ81は、それぞれ異なる方向を向くように配置されてもよい。この態様では、時間的な変化が互いに異なる複数の第2電子タグ81の読取情報を参照することになるので、第1電子タグ91の読取情報に対してより適切なラベルを付与しやすい、という利点がある。また、この態様では、ユーザ90は、移動体(買物かご)8の向きを考慮せずに、レジカウンタ7の載置エリアA11に載せ置くことができる、という利点もある。
上述の実施形態の推論フェーズにおいて、学習部13は、分類器14にて分類結果を出力するごとに得られる訓練データの全てを分類器14の判定基準の再学習に用いなくてもよい。例えば、学習部13は、訓練データの信頼性に基づいて、信頼性の比較的低いデータを訓練データから除外してもよい。言い換えれば、学習ステップは、訓練データの信頼性に関する指標が閾値を下回るデータを訓練データから除外する除外ステップを含んでいてもよい。
ここでいう「信頼性に関する指標」は、一例として、表示部41にて分類器14の分類結果を表示してから、評価の入力がなされるまでの入力時間に基づいて決定される。例えば、入力時間が短い程、ユーザ90が思考を挟まずに入力していると考えられるため、信頼性に関する指標は小さくなる。つまり、指標は、入力受付ステップでの入力に基づいて決定される。
また、指標は、一例として、入力受付ステップでのユーザ90が店員であるか顧客であるかで増減してもよい。例えば、ユーザ90が店員であれば指標が閾値よりも高いこととし、ユーザ90が顧客であれば指標が閾値よりも低いこととしてもよい。この場合、ユーザ90は、例えば入力受付部17での評価の入力前に店員証の認証があった場合は店員であり、そうでない場合は顧客である、と識別され得る。
その他、指標は、訓練データが記憶部16に記憶されている期間に基づいて決定されてもよい。一例として、除外ステップは、記憶部16に記憶されている訓練データのうち、記憶部16に記憶されている期間が所定の期間を上回る訓練データを除外してもよい。
上述の実施形態において、学習部13は、店舗内のレイアウトが変更されたタイミングで、分類器14の判定基準の再学習を行ってもよい。言い換えれば、学習ステップは、読取対象外の物品9の配置が変更された場合に実行されてもよい。一例として、分類器14の判定基準の再学習は、店舗内のレイアウトの変更後において、ユーザ90(ここでは、店員)がユーザインタフェース4の操作部42にて所定の操作を行うことで実行される。この態様では、物品9が置かれる環境に応じて分類器14の判定基準の最適化を図りやすい、という利点がある。
上述の実施形態において、学習フェーズでは、読取対象である物品9についての訓練データを用いて分類器14の判定基準を学習させているが、これに限らない。例えば、学習フェーズでは、読取対象ではない物品9についての訓練データを併せて用いて分類器14の判定基準を学習させてもよい。この態様では、読取対象である物品9についての訓練データのみを用いて分類器14を学習させる場合と比較して、物品9が読取対象であるか否かの境界を分類器14に学習させやすい、という利点がある。
(実施形態2)
本実施形態の学習システム100Aは、図8に示すように、2つの読取部(第1読取部2A及び第2読取部2B)を備えている点で、実施形態1の学習システム100と相違する。つまり、レジカウンタ7は、第1読取部2Aの他に、第1読取部2Aとは異なる第2読取部2Bを備えている。第2読取部2Bは、アンテナ23と、通信部24と、を有している。アンテナ23及び通信部24の構成は、それぞれ第1読取部2Aのアンテナ21及び通信部22と同じである。
アンテナ21(第1読取部2A)は、実施形態1と同様に、第1エリアA1に向けて設置される。第1エリアA1は、読取対象の物品9が載せ置かれる載置エリアA11を含んでいる。一方、アンテナ23(第2読取部2B)は、図9及び図10に示すように、第1エリアA1とは異なる第2エリアA2に向けて設置される。第2エリアA2は、周辺エリアA21を含んでいる。言い換えれば、第2エリアA2は、載置エリアA11を含まないエリアである。第2エリアA2は、一例として、レジカウンタ7の周囲であってユーザ90が並ぶエリアである。
そして、本実施形態では、取得部11は、第2読取部2Bにて第1電子タグ91と電波を媒体とする無線通信を行うことにより、第1電子タグ91から物品情報を取得する。言い換えれば、本実施形態では、学習方法は、第2読取部2Bにて第1電子タグ91と電波を媒体とする無線通信を行うことにより、第1電子タグ91から物品情報を取得する第2取得ステップを更に有している。そして、本実施形態では、ラベル付与ステップは、第1読取部2Aで得られる(つまり、第1取得ステップにより得られる)第1電子タグ91の読取情報と、第2読取部2Bで得られる(つまり、第2取得ステップにより得られる)第1電子タグ91の読取情報と、の比較結果に基づいてラベルを決定する。
特に、本実施形態では、ラベル付与ステップは、第1電波強度と、第2電波強度との大小関係の反転の有無に基づいてラベルを決定する。第1電波強度は、第1読取部2Aが第1電子タグ91から受信する電波の強度である。第2電波強度は、第2読取部2Bが第1電子タグ91から受信する電波の強度である。
以下、本実施形態の学習システム100Aの動作の一例について、図9〜図13を用いて説明する。図11〜図13において、縦軸の「RSSI」は、第1電波強度(又は第2電波強度)のRSSI値を表している。また、縦軸の「差分」は、第1電波強度から第2電波強度を減算した値を表している。したがって、第1電波強度が第2電波強度よりも大きければ、差分は正の値となり、第1電波強度が第2電波強度よりも小さければ、差分は負の値となる。図11〜図13において、横軸の「t1」は、第1センサ31により周辺エリアA21に物体(ここでは、物品9、買物かご8、又はユーザ90)を検知した時点を表している。また、横軸の「t2」は第2センサ32により載置エリアA11に物品9(又は物品9を収容した買物かご8)が載せ置かれたことを検知した時点を表している。さらに、図11〜図13において、丸印は第1電波強度を表しており、バツ印は第2電波強度を表している。
ここで、購入対象(つまり、読取対象)の物品9を収容した買物かご8を持つユーザ90が、図9に示す周辺エリアA21の外側から周辺エリアA21に進入し、図10に示すように載置エリアA11に買物かご8を載置した、と仮定する。この場合、図11に示すように、第1読取部2Aでは、時刻t1から時刻t2にかけて物品9が載置エリアA11に近づく、つまり第1エリアA1に近づくため、第1電波強度が時間経過に伴い上昇する。そして、時刻t2以降においては、物品9が載置エリアA11にて留まるので、第1電波強度がほぼ一定値となる。一方、第2読取部2Bでは、時刻t1から時刻t2にかけて物品9が周辺エリアA21から載置エリアA11へと移行する、つまり物品9が第2エリアA2から離れるため、第2電波強度が時間経過に伴い減少する。そして、時刻t2以降においては、物品9が載置エリアA11にて留まるので、第2電波強度がほぼ一定値となる。
そして、第1電波強度と第2電波強度との差分は、時刻t1においては負の値であるが、時間経過に伴い上昇することで、時刻t1から時刻t2の間において正の値となる。つまり、読取対象の物品9に付された第1電子タグ91については、第1電波強度と第2電波強度との大小関係が反転することになる。
一方、購入対象ではない(つまり、読取対象ではない)物品9に付された第1電子タグ91については、物品9が動かないことから、図12に示すように、第1電波強度及び第2電波強度はいずれもほぼ一定値となる。このため、第1電波強度と第2電波強度との差分も、ほぼ一定値となる。つまり、読取対象ではない物品9に付された第1電子タグ91については、第1電波強度と第2電波強度との大小関係が反転しない。
なお、読取対象の物品9に付された第1電子タグ91と、他の物品9に付された第1電子タグ91とが重なり合う等した場合、第1読取部2A及び第2読取部2Bのいずれにおいても第1電子タグ91から受信する電波の強度が小さくなることが想定される。このような場合でも、図13に示すように、読取対象の物品9に付された第1電子タグ91については、第1電波強度と第2電波強度との差分が時間経過に伴い変化し、大小関係が反転することになる。
そして、ラベル付与部12は、第1電波強度と第2電波強度との大小関係が反転した場合、この第1電子タグ91の読取情報に対しては、物品9が読取対象であることを表す正解ラベルを付与する。一方、ラベル付与部12は、第1電波強度と第2電波強度との大小関係が反転しない場合、この第1電子タグ91の読取情報に対しては、物品9が読取対象ではないことを表す不正解ラベルを付与する。
以下、本実施形態の学習システム100Aの利点について、実施形態1の学習システム100との比較を交えて説明する。実施形態1の学習システム100では、読取部が第1読取部2Aの1つであるため、取得部11は、第1電波強度のみを取得することになる。ここで、実施形態1の学習システム100における第1電波強度の時間的変化を図14及び図15に示す。図14及び図15のいずれにおいても、黒い丸印は読取対象の物品9に付された第1電子タグ91の第1電波強度(以下、「読取対象の電波強度」という)を表している。また、白い丸印は、読取対象ではない物品9に付された第1電子タグ91の第1電波強度(以下、「読取対象外の電波強度」という)を表している。また、図14は、読取対象の物品9に付された第1電子タグ91と、他の物品9に付された第1電子タグ91とが重なり合っていない場合を表している。一方、図15は、読取対象の物品9に付された第1電子タグ91と、他の物品9に付された第1電子タグ91とが重なり合っている場合を表している。
図14に示す例では、読取対象の電波強度と、読取対象外の電波強度とは、時刻t2以降において有意な差を生じているので、適当な閾値を設定することで、ラベル付与部12により適切なラベルを付与することが可能である。しかしながら、図15に示す例では、読取対象の電波強度と、読取対象外の電波強度とは、時刻t2以降においても殆ど差が生じておらず、ラベル付与部12により適切なラベルを付与することが困難である。
これに対して、本実施形態では、複数の第1電子タグ91の重なりの有無に依らず、ラベル付与部12により適切なラベルを付与することが可能である。つまり、本実施形態では、読取部が1つである場合と比較して、第1電子タグ91の読取情報に対して適切なラベルを付与しやすい、という利点がある。また、本実施形態では、ユーザ90の判断を必要とせずに、第1電子タグ91の読取情報に対してラベルを自動的に付与することが可能である、という利点もある。
実施形態2で説明した構成は、実施形態1で説明した種々の構成(変形例を含む)と適宜組み合わせて採用可能である。
(まとめ)
以上述べたように、第1の態様に係る学習方法は、第1取得ステップと、ラベル付与ステップと、学習ステップと、を有する。第1取得ステップは、第1読取部(2A)にて物品(9)に付された第1電子タグ(91)と電波を媒体とする無線通信を行うことにより、第1電子タグ(91)から物品(9)に関する物品情報を取得するステップである。ラベル付与ステップは、物品情報を取得することで得られる第1電子タグ(91)の読取情報に対して、物品(9)が読取対象であるか否かを表すラベルを付与するステップである。学習ステップは、訓練データを用いて、分類器(14)の判定基準を機械学習により算出するステップである。分類器(14)は、第1電子タグ(91)の読取情報と判定基準との比較に基づいて物品(9)が読取対象であるか否かを分類する。訓練データは、第1取得ステップにて取得した第1電子タグ(91)の読取情報に含まれる1以上のパラメータと、ラベル付与ステップで付与されたラベルと、を含むデータである。
この態様によれば、物品(9)が置かれる環境に依らず、物品(9)が読取対象であるか否かを分類する精度を向上しやすい、という利点がある。
第2の態様に係る学習方法は、第1の態様において、分類器(14)の分類結果を評価する入力を受け付ける入力受付ステップを更に有する。ラベル付与ステップは、入力受付ステップで受け付けた入力に基づいてラベルを決定する。
この態様によれば、分類器(14)の分類結果に対する評価を参照することで、第1電子タグ(91)の読取情報に対して適切なラベルを付与しやすい、という利点がある。
第3の態様に係る学習方法では、第2の態様において、入力受付ステップは、分類器(14)による分類結果の確実性に関する指標が所定の範囲内にある場合に実行される。
この態様によれば、分類器(14)による物品(9)が読取対象であるか否かの分類が十分でない場合に、分類器(14)の分類精度を補完することが可能である、という利点がある。
第4の態様に係る学習方法は、第2又は第3の態様において、第2取得ステップを更に有する。第2取得ステップは、第1読取部(2A)とは異なる第2読取部(2B)にて第1電子タグ(91)と電波を媒体とする無線通信を行うことにより、第1電子タグ(91)から物品情報を取得するステップである。ラベル付与ステップは、第1取得ステップにより得られる第1電子タグ(91)の読取情報と、第2取得ステップにより得られる第1電子タグ(91)の読取情報と、の比較結果に基づいてラベルを決定する。
この態様によれば、読取部が1つである場合と比較して、第1電子タグ(91)の読取情報に対して適切なラベルを付与しやすい、という利点がある。
第5の態様に係る学習方法では、第4の態様において、第1読取部(2A)は、第1エリア(A1)に向けて設置される。第2読取部(2B)は、第1エリア(A1)とは異なる第2エリア(A2)に向けて設置される。
この態様によれば、第1読取部(2A)と第2読取部(2B)とで読取情報の取得結果に差をつけやすい、という利点がある。
第6の態様に係る学習方法では、第5の態様において、第1エリア(A1)は、読取対象の物品(9)が載置される載置エリア(A11)を含む。
この態様によれば、第1読取部(2A)と第2読取部(2B)とで読取情報の取得結果に差をつけやすい、という利点がある。
第7の態様に係る学習方法では、第5又は第6の態様において、ラベル付与ステップは、第1読取部(2A)が第1電子タグ(91)から受信する電波の強度と、第2読取部(2B)が第1電子タグ(91)から受信する電波の強度と、の大小関係の反転の有無に基づいてラベルを決定する。
この態様によれば、複数の第1電子タグ(91)の重なりの有無に依らず、第1電子タグ(91)の読取情報に対して適切なラベルを付与することが可能である、という利点がある。
第8の態様に係る学習方法では、第1〜第7のいずれかの態様において、検知ステップを更に有する。検知ステップは、検知範囲における物品(9)、及び物品(9)と共に移動する移動体(8)の少なくとも一方の存否を検知するステップである。ラベル付与ステップの実行期間は、検知ステップの検知結果に基づいて決定される。
この態様によれば、読取対象である物品(9)が存在する期間においてラベル付与ステップを実行しやすくなる、という利点がある。
第9の態様に係る学習方法では、第8の態様において、検知範囲は、載置エリア(A11)と、周辺エリア(A21)と、を含んでいる。載置エリア(A11)は、読取対象の物品(9)が載せ置かれるエリアである。周辺エリア(A21)は、載置エリア(A11)から所定距離離れた位置までのエリアである。
この態様によれば、読取対象である物品(9)が存在する期間においてラベル付与ステップを実行しやすくなる、という利点がある。
第10の態様に係る学習方法は、第1〜第9のいずれかの態様において、物品(9)の状態を表す状態情報を取得する状態取得ステップを更に有する。分類器(14)に入力される説明変数には、状態情報が含まれる。
この態様によれば、物品(9)の状態を加味して物品(9)が読取対象であるか否かを分類するように分類器(14)の判定基準が学習されるので、分類器(14)の分類精度の向上が期待できる、という利点がある。
第11の態様に係る学習方法は、第1〜第10のいずれかの態様において、第3取得ステップを更に有する。第3取得ステップは、第1読取部(2A)にて、物品(9)と共に移動する移動体(8)に付された第2電子タグ(81)と電波を媒体とする無線通信を行うことにより、第2電子タグ(81)の読取情報を取得するステップである。ラベル付与ステップは、第1電子タグ(91)の読取情報と、第2電子タグ(81)の読取情報と、の比較結果に基づいてラベルを決定する。
この態様によれば、第2電子タグ(81)の読取情報を参照しない場合と比較して、第1電子タグ(91)の読取情報に対して適切なラベルを付与しやすい、という利点がある。
第12の態様に係る学習方法では、第11の態様において、第2電子タグ(81)は、移動体(8)に複数付される。複数の第2電子タグ(81)は、それぞれ異なる方向を向くように配置される。
この態様によれば、時間的な変化が互いに異なる複数の第2電子タグ(81)の読取情報を参照することになるので、第1電子タグ(91)の読取情報に対してより適切なラベルを付与しやすい、という利点がある。
第13の態様に係る学習方法では、第1〜第12のいずれかの態様において、学習ステップは、除外ステップを含む。除外ステップは、訓練データの信頼性に関する指標が閾値を下回るデータを訓練データから除外するステップである。
この態様によれば、信頼性の比較的低い訓練データを除外することにより、分類器(14)の分類精度を向上しやすい、という利点がある。
第14の態様に係る学習方法は、第13の態様において、分類器(14)の分類結果を評価する入力を受け付ける入力受付ステップを更に有する。指標は、入力受付ステップでの入力に基づいて決定される。
この態様によれば、訓練データの信頼性を評価しやすい、という利点がある。
第15の態様に係る学習方法では、第1〜第14のいずれかの態様において、分類器(14)に入力される説明変数には、物品(9)を特定する情報が含まれない。
この態様によれば、物品(9)を特定する情報を排除することで、物品(9)を特定する情報により分類器(14)の分類結果が左右されるのを防ぐことが可能である、という利点がある。
第16の態様に係る学習方法では、第1〜第15のいずれかの態様において、学習ステップは、読取対象外の物品(9)の配置が変更された場合に実行される。
この態様によれば、物品(9)が置かれる環境に応じて分類器(14)の判定基準の最適化を図りやすい、という利点がある。
第17の態様に係るプログラムは、1以上のプロセッサに、第1〜第16のいずれかの態様の学習方法を実行させる。
この態様によれば、物品(9)が置かれる環境に依らず、物品(9)が読取対象であるか否かを分類する精度を向上しやすい、という利点がある。
第18の態様に係る学習システム(100)は、取得部(11)と、ラベル付与部(12)と、学習部(13)と、を備える。取得部(11)は、第1読取部(2A)にて物品(9)に付された第1電子タグ(91)と電波を媒体とする無線通信を行うことにより、第1電子タグ(91)から物品(9)に関する物品情報を取得する。ラベル付与部(12)は、物品情報を取得することで得られる第1電子タグ(91)の読取情報に対して、物品(9)が読取対象であるか否かを表すラベルを付与する。学習部(13)は、訓練データを用いて、分類器(14)の判定基準を機械学習により算出する。分類器(14)は、第1電子タグ(91)の読取情報と判定基準との比較に基づいて物品(9)が読取対象であるか否かを分類する。訓練データは、取得部(11)にて取得した第1電子タグ(91)の読取情報に含まれる1以上のパラメータと、ラベル付与部(12)で付与されたラベルと、を含むデータである。
この態様によれば、物品(9)が置かれる環境に依らず、物品(9)が読取対象であるか否かを分類する精度を向上しやすい、という利点がある。
第2〜第16の態様に係る方法については、学習方法に必須の方法ではなく、適宜省略可能である。
ところで、第11の態様に係る学習方法における第3取得ステップの取得結果と、第1取得ステップの取得結果と、を用いれば、分類器14を用いずに物品9が読取対象であるか否かを推定することも可能である。すなわち、第19の態様に係る推定方法は、第1取得ステップと、第3取得ステップと、推定ステップと、を有する。第1取得ステップは、第1読取部(2A)にて物品(9)に付された第1電子タグ(91)と電波を媒体とする無線通信を行うことにより、第1電子タグ(91)から物品(9)に関する物品情報を取得するステップである。第3取得ステップは、第1読取部(2A)にて、物品(9)と共に移動する移動体(8)に付された第2電子タグ(81)と電波を媒体とする無線通信を行うことにより、第2電子タグ(81)の読取情報を取得するステップである。推定ステップは、第1取得ステップにより得られる第1電子タグ(91)の読取情報と、第3取得ステップにより得られる第2電子タグ(81)の読取情報と、の比較結果に基づいて、物品(9)が読取対象であるか否かを推定するステップである。
また、第4の態様に係る学習方法における第2取得ステップの取得結果と、第1取得ステップの取得結果と、を用いれば、分類器14を用いずに物品9が読取対象であるか否かを推定することも可能である。すなわち、第20の態様に係る推定方法は、第1取得ステップと、第2取得ステップと、推定ステップと、を有する。第1取得ステップは、第1読取部(2A)にて物品(9)に付された第1電子タグ(91)と電波を媒体とする無線通信を行うことにより、第1電子タグ(91)から物品(9)に関する物品情報を取得するステップである。第2取得ステップは、第1読取部(2A)とは異なる第2読取部(2B)にて第1電子タグ(91)と電波を媒体とする無線通信を行うことにより、第1電子タグ(91)から物品情報を取得するステップである。推定ステップは、第1取得ステップにより得られる第1電子タグ(91)の読取情報と、第2取得ステップにより得られる第1電子タグ(91)の読取情報と、の比較結果に基づいて、物品(9)が読取対象であるか否かを推定するステップである。