以下では、チェックアウトシステムを例に本実施形態に係る情報処理装置、店舗システム及びプログラムについて、図面を参照して説明する。店舗システムは、一取引に係る商品の登録、精算を行うPOS端末を備えるチェックアウトシステム(POSシステム)等である。本実施形態は、スーパーマーケット等の店舗に導入されたチェックアウトシステムへの適用例である。
図1は、チェックアウトシステム1の一例を示す斜視図である。図1に示すように、チェックアウトシステム1は、商品に関する情報を読み取る商品読取装置101と、一取引に係る商品の登録、精算を行うPOS端末11とを備える。以下では、POS端末11を本実施形態にかかる情報処理装置として適用する例について説明する。
POS端末11は、チェックアウト台41上のドロワ21上面に載置されている。ドロワ21は、POS端末11によって開放動作の制御を受ける。POS端末11の上面には、オペレータ(店員)によって押下操作されるキーボード22が配置されている。キーボード22を操作するオペレータから見てキーボード22よりも奥側には、オペレータに向けて情報を表示する表示デバイス23が設けられている。表示デバイス23は、その表示面23aに情報を表示する。表示面23aには、タッチパネル26が積層されている。表示デバイス23よりも更に奥側には、顧客用表示デバイス24が回転可能に立設されている。顧客用表示デバイス24は、その表示面24aに情報を表示する。なお、図1に示す顧客用表示デバイス24は、表示面24aを図1中手前側に向けているが、表示面24aが図1中奥側に向くように顧客用表示デバイス24を回転させることによって、顧客用表示デバイス24は顧客に向けて情報を表示する。
POS端末11が載置されているチェックアウト台41とL字を形成するようにして、横長テーブル状のカウンタ台151が配置されている。カウンタ台151の上面には、荷受け面152が形成されている。荷受け面152には、商品Gを収納する買物カゴ153が載置される。買物カゴ153は、顧客によって持ち込まれる第1の買物カゴ153aと、第1の買物カゴ153aから商品読取装置101を挟んだ位置に載置される第2の買物カゴ153bとに分けて考えることができる。なお、買物カゴ153は、いわゆるカゴ形状のものに限るものではなく、トレー等であってもよい。また、買物カゴ153(第2の買物カゴ153b)は、いわゆるカゴ形状のものに限らず、箱状や袋状等であってもよい。
カウンタ台151の荷受け面152には、POS端末11とデータ送受信可能に接続された商品読取装置101が設置されている。商品読取装置101は、薄型矩形形状のハウジング102を備える。ハウジング102の正面には読取窓103が配置されている。ハウジング102の上部には、表示・操作部104が取り付けられている。表示・操作部104には、タッチパネル105が表面に積層された表示部である表示デバイス106が設けられている。表示デバイス106の右隣にはキーボード107が配設されている。キーボード107の右隣には、図示しないカードリーダのカード読取溝108が設けられている。オペレータから見て表示・操作部104の裏面左奥側には、顧客に情報を提供するための顧客用表示デバイス109が設置されている。
また、表示・操作部104には、マイク111が設けられている。マイク111は、商品読取装置101の周囲の音や人物の発する声を集音する。
このような商品読取装置101は、商品読取部110(図2参照)を備えている。商品読取部110は、読取窓103の奥側に撮像部164(図2参照)を配置している。
顧客によって持ち込まれた第1の買物カゴ153aには、一取引に係る商品Gが収納されている。第1の買物カゴ153a内の商品Gは、商品読取装置101を操作するオペレータにより第2の買物カゴ153bに移動される。この移動過程で、商品Gが商品読取装置101の読取窓103に向けられる。この際、読取窓103内に配置された撮像部164(図2参照)は商品Gを撮像する。
商品読取装置101では、撮像部164により撮像された画像に含まれる商品Gが、後述するPLUファイルF1(図3参照)に登録されたどの商品に対応するかを指定させるための画面を表示・操作部104に表示し、指定された商品の商品IDをPOS端末11に通知する。POS端末11では、商品読取装置101から通知される商品IDに基づき、当該商品IDに対応する商品の商品分類、商品名、単価等の売上登録に係る情報を、売上マスタファイル(図示しない)等に記録して売上登録を行う。
図2は、POS端末11及び商品読取装置101のハードウェア構成を示すブロック図である。POS端末11は、情報処理を実行する情報処理部としてのマイクロコンピュータ60を備える。マイクロコンピュータ60は、各種演算処理を実行し各部を制御するCPU(Central Processing Unit)61に、ROM(Read Only Memory)62とRAM(Random Access Memory)63とがバス接続されて構成されている。
POS端末11のCPU61には、前述したドロワ21、キーボード22、表示デバイス23、タッチパネル26、顧客用表示デバイス24がいずれも各種の入出力回路(いずれも図示せず)を介して接続されている。これらは、CPU61による制御を受ける。
キーボード22は、「1」、「2」、「3」・・・等の数字や「×」という乗算の演算子が上面に表示されているテンキー22d、仮締めキー22e、及び締めキー22fを含む。
POS端末11のCPU61には、HDD64(Hard Disk Drive)が接続されている。HDD64には、プログラムや各種ファイルが記憶されている。HDD64に記憶されているプログラムや各種ファイルは、POS端末11の起動時に、その全部または一部がRAM63にコピーされてCPU61により実行される。HDD64に記憶されているプログラムの一例は、商品販売データ処理用のプログラムPR1である。HDD64に記憶されているファイルの一例は、ストアコンピュータSCから配信されて格納されているPLUファイルF1である。
PLUファイルF1は、店舗に陳列して販売する商品Gの各々について、商品Gの売上登録に係る情報を格納する商品ファイルである。以下の説明では、PLUファイルF1を辞書として用いるが、辞書はPLUファイルF1と異なるファイルであっても良い。辞書は、撮像した画像データから抽出した商品の照合用データ(特徴量)を記憶する。辞書はPLUファイルF1と異なるファイルである場合、辞書に記憶される照合用データ(特徴量)と、PLUファイルF1の情報(識別情報)は紐付けられる。特徴量は、商品の標準的な形状、表面の色合い、模様、凹凸状況等の外観の特徴をパラメータ化したものである。
図3は、PLUファイルF1のデータ構成を例示する概念図である。図3に示すように、PLUファイルF1は、商品Gごとに、ユニークに割り当てられた識別情報である商品ID、商品Gが属する商品分類、商品名、単価等の商品に関する情報と、その商品を示すイラスト画像と、撮像した商品画像から読み取られる色合いや表面の凹凸状況等の特徴量、テキストデータとを、その商品Gの商品情報として格納するファイルである。尚、特徴量は、後述する類似度の判定に用いられる照合用のデータである。また、テキストデータは、後述するオペレータの発話内容との比較に用いられるものであって、品種名「ふじ」の商品であれば、「クダモノ」「リンゴ」「フジ」のテキストデータが含まれる。なお、PLUファイルF1は、後述する接続インターフェース65を介し、商品読取装置101が読み出し可能に構成されている。
なお、物品のカテゴリ(商品)のみならず品種まで認識(検出)する必要がある場合においては、PLUファイルF1は、図3に示すように、品種ごとに商品名や単価等の商品に関する情報と、その商品を示すイラスト画像と、特徴量とを管理する。例えば、物品のカテゴリ(商品)が「リンゴ」の場合において、「ふじ」「ジョナゴールド」「つがる」「紅玉」のような品種ごとに商品名や単価等の商品に関する情報と、その商品を示すイラスト画像と、特徴量とを管理する。また、候補の表示にイラスト画像を用いず、文字で候補を表示する場合は、イラスト画像をPLUファイルF1に格納しなくてもよい。
図2に戻り、POS端末11のCPU61には、ストアコンピュータSCとデータ通信を実行するための通信インターフェース25が入出力回路(図示せず)を介して接続されている。ストアコンピュータSCは、店舗のバックヤード等に設置されている。ストアコンピュータSCのHDD(図示せず)には、POS端末11に配信されるPLUファイルF1が格納されている。
更に、POS端末11のCPU61には、商品読取装置101との間でデータ送受信を可能にする接続インターフェース65が接続されている。接続インターフェース65には、商品読取装置101が接続されている。また、POS端末11のCPU61には、レシート等に印字を行うプリンタ66が接続されている。POS端末11は、CPU61の制御の下、一取引の取引内容をレシートに印字する。
商品読取装置101も、マイクロコンピュータ160を備える。マイクロコンピュータ160は、CPU161にROM162とRAM163とがバス接続されて構成されている。ROM162には、CPU161によって実行されるプログラムが記憶されている。CPU161には、撮像部164、音声出力部165が各種の入出力回路(いずれも図示せず)を介して接続されている。撮像部164、音声出力部165は、CPU161によって動作が制御される。表示・操作部104は接続インターフェース176を介して、商品読取部110及びPOS端末11に接続されている。表示・操作部104は、商品読取部110のCPU161、POS端末11のCPU61によって動作が制御される。
撮像部164は、カラーCCDイメージセンサやカラーCMOSイメージセンサ等であり、CPU161の制御の下で読取窓103からの撮像を行う撮像手段である。例えば撮像部164では30fpsの動画像の撮像を行う。撮像部164が所定のフレームレートで順次撮像したフレーム画像(撮像画像)はRAM163に保存される。
音声出力部165は、予め設定された警告音等を発生するための音声回路とスピーカ等である。音声出力部165は、CPU161の制御の下で警告音や音声による報知を行う。
更に、CPU161には、POS端末11の接続インターフェース65に接続して、POS端末11との間でデータ送受信を可能にする接続インターフェース175が接続されている。また、CPU161は、接続インターフェース175を介して、表示・操作部104との間でデータ送受信を行う。
次に、CPU161、CPU61がプログラムを実行することで実現されるCPU161、CPU61の機能構成について、図4を参照して説明する。
図4は、POS端末11の機能構成を示すブロック図である。図4に示すように、POS端末11のCPU61は、商品販売データ処理用のプログラムPR1を実行することにより、音声認識部50、画像取込部51、商品検出部52、類似度算出部53、類似度判定部54、商品提示部55、入力受付部57、情報入力部58、売上登録処理手段である売上登録部59としての機能を備える。
(商品登録処理および売上登録処理)
次に、POS端末11の画像取込部51、商品検出部52、類似度算出部53、類似度判定部54、商品提示部55、入力受付部57、情報入力部58による一般物体認識(オブジェクト認識)に応じた商品登録処理、および売上登録部59による売上登録処理について説明する。
画像取込部51は、取込手段として機能するものであって、撮像部164に撮像オン信号を出力して撮像部164に撮像動作を開始させる。画像取込部51は、撮像動作開始後に撮像部164が撮像してRAM163に保存されたフレーム画像を順次取り込む。画像取込部51によるフレーム画像の取り込みは、RAM163に保存された順に行われる。
図5は、画像取込部51によって取り込まれたフレーム画像の一例を示す図である。図5に示すように、オペレータが読取窓103に商品Gをかざすと、撮像部164の読取領域Rには商品Gの全部または一部が撮影されて商品読取装置101の表示デバイス106に表示される。
商品検出部52は、画像取込部51により取り込まれたフレーム画像に含まれる商品Gの全部または一部を、パターンマッチング技術等を用いて検出し、撮像された商品の特徴量を抽出する。具体的には、取り込まれたフレーム画像を2値化した画像から輪郭線等を抽出する。次いで、前回のフレーム画像から抽出された輪郭線と、今回のフレーム画像から抽出された輪郭線とを比較して、売上登録のために読取窓103に向けられた商品を検出する。
なお、商品を検出する別の方法としては、取り込まれたフレーム画像から肌色領域の有無を検出する。次いで、肌色領域が検出された場合、すなわち、オペレータの手が検出された場合は、この肌色領域の近傍において上述した輪郭線の検出を行うことで、オペレータの手が把持していると想定される商品の輪郭抽出を試みる。この時、手の形状を示す輪郭と、手の輪郭の近傍にそれ以外の物体の輪郭とが検出された場合、この物体の輪郭から商品を検出する。
類似度算出部53は、類似度算出手段として機能するものであって、撮像部164により撮像された商品Gの全部または一部の画像から、商品Gの色合いや表面の凹凸状況等の表面の状態を特徴量として読み取る。なお、類似度算出部53は、処理時間の短縮を図るため、商品Gの輪郭や大きさは考慮しないものとする。
また、類似度算出部53は、PLUファイルF1に登録されている各商品(以下、登録商品という)の商品画像の色合いや表面の凹凸状況等の表面の状態である特徴量と、商品Gの特徴量とをそれぞれ比較することで、商品GとPLUファイルF1に登録された登録商品との類似度を算出する。ここで、類似度は、PLUファイルF1に記憶されている各商品の商品登録時の商品画像を100%=「類似度:1.0」とした場合に、商品Gの全部または一部の画像がどの程度類似しているかを示すものである。なお、例えば、色合いと表面の凹凸状況とでは、重み付けを変えて類似度を算出してもよい。
このように画像中に含まれる物体を認識することは一般物体認識(generic object recognition)と呼ばれている。このような一般物体認識については、下記の文献において各種認識技術が解説されている。
柳井 啓司,“一般物体認識の現状と今後”,情報処理学会論文誌,Vol.48,No.SIG16 [平成22年8月10日検索],インターネット<URL: http://mm.cs.uec.ac.jp/IPSJ-TCVIM-Yanai.pdf >
また、画像をオブジェクトごとに領域分割することによって一般物体認識を行う技術が、下記の文献において解説されている。
Jamie Shottonら、“Semantic Texton Forests for Image Categorization and Segmentation”,[平成22年8月10日検索],インターネット<URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.145.3036&rep=rep1&type=pdf >
なお、撮像された商品Gの画像と、PLUファイルF1に登録された登録商品との類似度の算出方法は特に問わないものとする。例えば、撮像された商品Gの画像と、PLUファイルF1に登録された各登録商品との類似度を絶対評価として算出してもよいし、相対評価として算出してもよい。
類似度を絶対評価として算出する場合、撮像された商品Gの画像と、PLUファイルF1に登録された各登録商品とを1対1で比較し、この比較の結果導出される類似度をそのまま採用すればよい。また、類似度を相対評価として算出する場合、PLUファイルF1に5つの登録商品(商品GA、GB、GC、GD、GE)が登録されていたとすると、撮像された商品Gは、商品GAに対して類似度が0.6、商品GBに対しては類似度が0.1、商品GCに対しては類似度が0.1、商品GDに対しては類似度が0.1、商品GEに対しては類似度が0.1等、各登録商品との類似度の総和が1.0(100%)となるよう算出すればよい。
類似度判定部54は、判定手段として機能するものであって、画像取込部51が取り込んだフレーム画像ごとに、商品Gの画像と、PLUファイルF1に登録されている登録商品との類似度を比較する。本実施形態では、登録商品の商品画像と商品Gの画像との類似度について複数の条件が段階的に設けられており、類似度判定部54は、満たされる条件に応じて登録商品の確定あるいは商品の候補の選定を行う。類似度に関する条件は特に限定されるものではないが、以下では条件a〜dを用いる場合について説明する。
ここで、条件aおよび条件bは、本実施形態に係る第1の条件であり、撮像部164が撮像した商品GをPLUファイルF1に登録された登録商品のうち一の商品として確定するための条件である。また、条件cは、本実施形態に係る第2の条件であり、PLUファイルF1に登録された登録商品中に同一のカテゴリ(商品)に属する異なる品種の物品が複数含まれていない場合に、撮像部164が撮像した商品Gの候補を抽出するための条件である。更に、条件dは、本実施形態に係る第3の条件であり、条件cを満たした商品の候補中に同一のカテゴリ(商品)に属する異なる品種の物品が複数含まれている場合に、撮像部164が撮像した商品Gの候補を抽出するための条件である。
類似度判定部54は、条件aまたは条件bを満たす登録商品を、撮像部164が撮像した商品Gに一対一で対応する商品(以下、確定商品という)であると判定(確定)する。また、類似度判定部54は、条件cを満たす登録商品については、確定商品ではなく、撮像部164が撮像した商品Gの候補(以下、商品候補という)であると判定する。そして、PLUファイルF1に登録された複数の登録商品から条件cを満たす登録商品を抽出することにより、商品Gに対する商品候補を抽出する。
また、類似度判定部54は、条件dを満たす登録商品(同一のカテゴリ(商品)に属する異なる品種の物品)についても、確定商品ではなく、撮像部164が撮像した商品Gの候補であると判定する。そして、PLUファイルF1に登録された複数の登録商品から条件dを満たす登録商品を抽出することにより、商品Gに対する商品候補を抽出する。
条件a〜cは類似度に応じて段階的に設定されればその詳細は特に限定されるものではないが、一例として、予め設定された複数の閾値によって条件a〜cを設けることができる。ここでは、第1閾値〜第3閾値によって条件a〜cを設定する場合について説明する。なお、第1閾値〜第3閾値の大小関係は、第1閾値>第2閾値>第3閾値とする。
類似度判定部54は、登録商品との類似度が予め定められた第1閾値(例えば90%)以上となった回数をカウントし、この回数が所定回数以上となった場合に条件aが満たされたと判定する。尚、第1閾値を誤判定が無いよう十分に高く設定した場合には、所定回数を1回として条件aを判定してもよい。
また、類似度判定部54は、登録商品との類似度が第1閾値(例えば90%)未満、かつ、第1閾値より小さい第2閾値(例えば75%)以上となった場合に条件bが満たされたと判定する。そして、条件bを満たした登録商品は、確定商品ではあるがオペレータによる確認操作を要すると判定する。なお、登録商品との類似度が第1閾値(例えば90%)未満、かつ、第1閾値より小さい第2閾値(例えば75%)以上となった回数をカウントし、この回数が所定回数以上となった場合に条件bが満たされたと判定してもよい。
更に、類似度判定部54は、登録商品との類似度が第2閾値(例えば75%)未満、かつ、第2閾値より小さい第3閾値(例えば10%)以上である場合に、条件cが満たされたと判定する。なお、更には登録商品との類似度が第2閾値(例えば75%)未満、かつ、第2閾値より小さい第3閾値(例えば10%)以上となった回数をカウントし、この回数が所定回数以上となった場合に条件cが満たされたと判定してもよい。
なお、各条件a〜cは、類似度の大きさ、判定回数等に応じて適宜設定可能であり、上述した例に限定されるものではない。また、条件a〜cの判断に用いる所定回数はそれぞれ条件毎に異なる回数を設けるものであってもよい。
加えて、類似度判定部54は、条件cを満たした登録商品中に同一のカテゴリ(商品)に属する異なる品種の物品が複数含まれている場合には、当該複数の品種の類似度を合算し、複数の品種の類似度を合算したカテゴリ(商品)の類似度が予め定められた第2閾値(例えば75%)以上となった場合、条件dが満たされたと判定する。
商品提示部55は、報知手段として機能するものであって、撮像部164によって撮像された商品が、条件aまたは条件bを満たした登録商品であるとして一意的に確定されたことを、画像出力や音声出力等によってオペレータや客に報知する。
より詳細には、商品提示部55は、条件aを満たした登録商品が、撮像部164によって撮像された商品(確定商品)として一意的に確定されたことを示す確定画面71(図6参照)を表示デバイス106に表示させる。
図6は、確定画面71の一例を示す図である。条件aを満たす登録商品があった場合に、商品提示部55は読取領域R(図5参照)の撮像画像の表示を停止し、確定商品に対応するイラスト画像G1および商品名「にんじん」をPLUファイルF1から読み出して、確定画面71に表示する。また、商品提示部55は、PLUファイルF1から読み出した確定商品の商品名、商品価格(単価)を、商品名表示領域81、価格表示領域82にそれぞれ表示する。尚、商品提示部55は、イラスト画像G1の代わりに、PLUファイルF1から読み出した商品画像(写真)を表示してもよい。これに限らず、イラストや商品画像を表示せず、商品名を確定画面71に表示するようにしてもよい。この場合、音声出力部165によって、商品が確定したことを報知する。音声は事前に商品に紐付けられて登録された商品名であってもよいし、例えば「ピッ」という電子音であってもよい。
また、商品提示部55は、条件bを満たした登録商品(確定商品)が、撮像部164によって撮像された商品Gであるか否かの最終確認操作を受付ける確認画面72(図7参照)を表示デバイス106に表示させる。
図7は、確認画面72の一例を示す図である。条件bを満たす登録商品があった場合に、商品提示部55は確定商品に対応するイラスト画像G1をPLUファイルF1から読み出して、確認画面72に表示する。また、商品提示部55は、PLUファイルF1から読み出した確定商品の商品名を用いて、読み取られた商品Gがイラスト画像G1の商品であるか否かを問うメッセージを「にんじんですか?」等と表示する。また、確認画面72には、「はい/いいえ」等のボタンがタッチパネル105に対するタッチ操作によって選択操作可能に設けられる。
このように、確認画面72においては、類似度判定の結果、1つの商品Gに対して唯一に選別された登録商品(確定商品)の商品名や商品画像が示され、商品Gと登録商品とが一対一の関係を持って表示される。従って、確認画面72は、条件bを満たす登録商品が撮像部164によって撮像された商品Gとして一意的に確定されたことを報知する画面である。
加えて、商品提示部55は、条件cを満たした登録商品に関する情報を、商品候補として表示デバイス106に表示させる。より詳細には、商品提示部55は、条件cを満たした登録商品のイラスト画像および商品名をPLUファイルF1から読み出し、類似度算出部53が算出した類似度の高いものから、表示デバイス106に順次出力する。表示デバイス106は、商品候補提示領域83(図8参照)において、商品候補のイラスト画像および商品名を類似度の高いものから順に表示する。
図8は、商品候補のイラスト画像G1、G2、G3が表示された画面例を示す図である。図8に示すように、商品候補提示領域83には、類似度の高い登録商品から順に、商品候補のイラスト画像G1、G2、G3および各商品名が表示される。これらイラスト画像G1、G2、G3はタッチパネル105に対する選択操作に応じて選択可能に構成されている。また、商品候補提示領域83の下部には、商品リストから商品を選択するための選択ボタン84が設けられており、商品リストから選択された商品は上述した確定商品として処理される。尚、図8では、イラスト画像G1〜G3に対応する3つの商品候補が表示された例を示したが、商品候補の数や表示方法は特に限定されるものではない。また、イラスト画像に代えて商品画像(写真)を商品候補として表示してもよい。
加えて、商品提示部55は、条件dを満たした同一のカテゴリ(商品)に属する異なる品種の物品である登録商品に関する情報を、商品候補として表示デバイス106に表示させる。より詳細には、商品提示部55は、条件dを満たした登録商品(同一のカテゴリ(商品)に属する異なる品種の物品)のイラスト画像および商品名をPLUファイルF1から読み出し、類似度算出部53が算出した類似度の高いものから、表示デバイス106に順次出力する。表示デバイス106は、品種選択画面85(図9参照)において、商品候補のイラスト画像および商品名を類似度の高いものから順に表示する。
図9は、商品候補の品種選択画面85の例を示す図である。図9に示すように、実際に認識した画像であるフレーム画像に重畳されて表示される品種選択画面85には、類似度の高い登録商品(同一のカテゴリ(商品)に属する異なる品種の物品)から順に、商品候補のイラスト画像G4、G5、G6および各品種名が表示される。なお、商品候補のイラスト画像G4、G5、G6に類似度も表示するようにしてもよい。これらイラスト画像G4、G5、G6はタッチパネル105に対する選択操作に応じて選択可能に構成されている。尚、図9では、イラスト画像G1のカテゴリ(商品)に属する異なる品種の物品である商品候補のイラスト画像G4、G5、G6の3つの商品候補が表示された例を示したが、商品候補の数や表示方法は特に限定されるものではない。商品候補数が多い場合には、「他の品種を選択」ボタンやスクロールボタンを設けるようにして、ボタン操作によって商品候補のイラスト画像を順に表示するようにしてもよい。また、イラスト画像に代えて商品画像(写真)を商品候補として表示してもよい。
入力受付部57は、受付手段として機能するものであって、タッチパネル105またはキーボード107を介して表示デバイス106の表示に対応する各種入力操作を受付ける。例えば入力受付部57は、確認画面72(図7参照)に対する選択操作に基づいて、表示されたイラスト画像G1の商品が確定商品であることを最終確認した旨の入力操作(確認操作)を受付ける。尚、商品提示部55は、入力受付部57が確認操作を受付けた場合に、上述の確定画面71を表示デバイス106に表示する。
入力受付部57は、表示デバイス106に表示された商品候補のイラスト画像G1〜G3(図8参照)の中からいずれか1つのイラスト画像に対する選択操作を受付ける。入力受付部57は、選択されたイラスト画像の登録商品を、商品Gに対する確定商品であるとして受付ける。尚、商品検出部52が複数の商品Gを検出可能である場合には、入力受付部57は商品候補の中から、複数の商品候補の選択操作を受付けてもよい。尚、商品提示部55は、入力受付部57が選択操作を受付けた場合に、受付けた商品候補を確定商品として表示させた確定画面71を表示デバイス106に表示させる。
また、入力受付部57は、表示デバイス106に表示された品種選択画面85のイラスト画像G4〜G6(図9参照)の中からいずれか1つのイラスト画像に対する選択操作を受付ける。尚、商品提示部55は、入力受付部57が選択操作を受付けた場合に、受付けた商品候補を確定商品として表示させた確定画面71を表示デバイス106に表示させる。
情報入力部58は、上述のようにして確定された確定商品について、その商品を示す情報(例えば、商品IDや商品名等)を、接続インターフェース175を介して入力する。
尚、情報入力部58は、タッチパネル105またはキーボード107を介して別途入力された販売個数を、商品ID等とともに入力するとしてもよい。
売上登録部59は、情報入力部58から入力された商品IDと販売個数とに基づいて、対応する商品の売上登録を行う。具体的に、売上登録部59は、PLUファイルF1を参照して、通知された商品ID及び当該商品IDに対応する商品分類、商品名、単価等を、販売個数とともに売上マスタファイル等に記録して売上登録を行う。
音声認識部50は、音声認識手段として機能するものであって、マイク111を介して入力された音声信号を入力として、集音された人物の音声と対応する文字や単語列の音声認識結果を生成する。そして、音声認識部50は、音声認識結果に対して言語辞書との比較を行うことによりオペレータの発話内容を認識する。なお、音声認識部50は、各種の単語を記憶する言語辞書を記憶する辞書メモリを備える。
なお、音声認識部50は、音声信号から個人(オペレータ)の声の認識を行う話者認識を行うようにしても良い。話者認識処理は、音声信号から特徴を抽出し、モデル化して個人(オペレータ)の声の認識を行う周知の技術が適用される。このように個人(オペレータ)の声の認識を行うことにより、複数人の会話が行われている状況であってもオペレータがどの発言をしたかを識別することで、オペレータの発話内容のみを抽出することができる。
また、マイク111は、周囲の雑音の入力を防止するために、周囲の雑音を低減するノイズキャンセリング機能がある単一指向性のマイクであることが望ましい。
次に、チェックアウトシステム1の動作について詳細に説明する。図10は、POS端末11が実行する商品識別処理の手順を示すフローチャートである。図10では、第1閾値を類似度90%(0.90)、第2閾値を類似度75%(0.75)、第3閾値を類似度10%(0.10)と設定した場合について説明するが、各閾値はこれらに限定されるものではない。
POS端末11による商品登録の開始等に応じて処理が開始されると、画像取込部51は、撮像部164に撮像オン信号を出力して撮像部164による撮像を開始し(ステップS10)、マイク111を介して入力された音声信号の音声認識(ステップS11)、および、撮像部164が撮像したフレーム画像(撮像画像)の取り込み(ステップS12)に待機する。
音声認識部50は、マイク111を介して入力された音声信号を入力として、集音された人物の音声と対応する文字や単語列の音声認識結果を生成し、言語辞書との比較を行うことによりオペレータの発話内容を認識する(ステップS11)。
画像取込部51は、撮像部164が撮像してRAM163に保存されたフレーム画像(撮像画像)を取り込む(ステップS12)。
次いで、商品検出部52は、画像取込部51が取り込んだフレーム画像から商品Gの全部または一部の検出を行う(ステップS13)。
続いて、類似度算出部53は、商品Gの全部または一部の画像から商品Gの特徴量を読み取り、PLUファイルF1に登録された各商品画像の特徴量と比較することで登録商品との類似度を算出する(ステップS14)。
なお、類似度算出部53は、ステップS11でオペレータの発話内容が認識されている場合には、オペレータの発話内容に応じてPLUファイルF1に登録されている登録商品を絞りこむことができる。例えば、オペレータの発話内容が「リンゴ」である場合には、PLUファイルF1から「リンゴ」のテキストデータが関連付けられている商品(例えば、商品名「リンゴ」の商品等)が絞り込まれることになる。したがって、音声で「リンゴ」と入力した場合、商品を絞り込む前には画像の候補となる可能性があった、「梨」「メロン」「たまねぎ」などは候補から外すことができる。
このように類似度算出に先立ってPLUファイルF1に登録されている登録商品を絞りこむことにより、一般物体認識(オブジェクト認識)の認識の精度を向上させるとともに、最終的な認識までの速度も向上させることができるので、一般物体認識(オブジェクト認識)による誤認識の改善と認識速度の改善を行うことができる。
なお、言語辞書は、「リンゴ」の前方一致検索に用いられる「リ」の1音、「リン」の2音も「リンゴ」に関連する単語として関連付けるようにしても良い。このようにすることで、カーナビ等で行われている前方一致逐次検索のように、音声による認識を行う際に、「リンゴ」について「リンゴ」の3音を発音しなくとも、「リ」の1音、「リン」の2音で「リンゴ」と関連付けられることにより、不要な発音を省略することができる。
また、例えば、オペレータの発話内容が「フジ」である場合には、PLUファイルF1から「フジ」のテキストデータが関連付けられている商品(例えば、品種名「ふじ」の商品等)にまで一気に絞り込まれることになる。この場合には、「ふじ」「ジョナゴールド」「つがる」「紅玉」のように多品種に渡る「りんご」において、一般物体認識(オブジェクト認識)による誤認識の飛躍的な改善と認識速度の飛躍的な改善を行うことができる。
次いで、類似度判定部54は、類似度が90%以上となる登録商品があるか否かを判定する(ステップS15)。90%以上となる登録商品が無い場合(ステップS15:No)には、ステップS17に移行する。90%以上となる登録商品がある場合(ステップS15:Yes)には、同一の登録商品に対する類似度が90%以上となった回数が所定回数(例えば、3回)となったか否かを判定する(ステップS16)。所定回数に満たない場合(ステップS16:No)は、ステップS12に戻り、画像取込部51は撮像部164により撮像された新たなフレーム画像を取り込む。
所定回数となった場合(ステップS16:Yes)には、商品提示部55は、確定商品のイラスト画像を含む確定画面71(図6参照)を表示させるとともに、確定商品の商品名を音声通知することにより確定商品を報知する(ステップS23)。また、情報入力部58は、確定商品とされた登録商品の商品ID等を、キーボード107を介して別途入力された販売個数とともにRAM63などの一時記憶ファイルに一時的に記憶して(ステップS24)、その後はステップS25の処理に移行する。
ステップS15:Noの場合に、類似度判定部54は、類似度が75%以上90%未満となる登録商品があるか否かを判定する(ステップS17)。類似度がこの範囲内となる登録商品がある場合(ステップS17:Yes)には、その登録商品をオペレータの確認を要する確定商品であると判定し、表示デバイス106に確認画面72を表示させる(ステップS18)。入力受付部57は、確認画面72(図7参照)において「はい」が選択されたか否かを判定する(ステップS19)。「はい」が選択された場合(ステップS19:Yes)にはステップS23に移行し、商品提示部55は確定画面71を表示させる。一方、「いいえ」が選択された場合(ステップS19:No)にはステップS12に戻る。
なお、入力受付部57は、確定画面71における「はい」および「いいえ」の選択による確認を、音声認識部50によるオペレータの発話内容の認識結果に応じて行うようにしても良い。
一方、類似度が75%以上90%未満となる登録商品が無い場合(ステップS17:No)に、類似度判定部54は、類似度が10%以上75%未満の登録商品があるか否かを判定し、類似度がこの範囲内である登録商品を商品Gの商品候補として抽出する(ステップS20)。この範囲内の登録商品が無い場合(ステップS20:No)には、ステップS12に戻る。
類似度が10%以上75%未満の登録商品がある場合(ステップS20:Yes)には、類似度判定部54は、同一のカテゴリに属する異なる品種の物品が複数あるか否かを判定する(ステップS27)。同一のカテゴリに属する異なる品種の物品が複数無い場合(ステップS27:No)には、類似度判定部54は、該当する登録商品を商品Gの商品候補であると判定する。そして、商品提示部55は、商品候補として判定された登録商品のイラスト画像および商品名を、類似度の高い順にソートして商品候補提示領域83に表示する(ステップS21)。
入力受付部57は、登録商品の商品画像に対する選択操作を受付けたか否かを判定する(ステップS22)。選択を受付けた場合(ステップS22:Yes)にはステップS23に移行し、商品提示部55は確定画面71を表示させる。一方、選択を受付けない場合(ステップS22:No)にはステップS12に移行する。
なお、入力受付部57は、商品候補提示領域83における商品候補の選択を、音声認識部50によるオペレータの発話内容の認識結果に応じて行うようにしても良い。例えば、オペレータの発話内容が「ニンジン」である場合には、商品候補提示領域83における商品候補の中から「にんじん」が選択されることになる。
なお、言語辞書は、「ニンジン」の前方一致検索に用いられる「ニ」の1音、「ニン」の2音、「ニンジ」の3音も「ニンジン」に関連する単語として関連付けるようにしても良い。このようにすることで、音声による認識を行う際に、「ニンジン」について「ニンジン」の4音を発音しなくとも、「ニ」の1音、「ニン」の2音、「ニンジ」の3音で「ニンジン」と関連付けられることにより、不要な発音を省略することができる。
一方、同一のカテゴリに属する異なる品種の物品が複数ある場合(ステップS27:Yes)には、当該複数の品種の類似度を合算し(ステップS28)、合算した類似度が予め定められた第2閾値(例えば75%)以上となった場合(ステップS29:Yes)には、類似度判定部54は、同一のカテゴリに属する異なる品種の複数の物品を商品Gの商品候補であると判定する。そして、商品提示部55は、商品候補として判定された登録商品(同一のカテゴリ(商品)に属する異なる品種の物品)のイラスト画像および商品名を、類似度の高い順にソートして商品候補提示領域83に品種選択画面85を表示する(ステップS30)。なお、合算した類似度が予め定められた第2閾値(例えば75%)以上でない場合(ステップS29:No)には、類似度判定部54は、ステップS21に進む。
なお、入力受付部57は、品種選択画面85における商品候補の選択を、音声認識部50によるオペレータの発話内容の認識結果に応じて行うようにしても良い。例えば、オペレータの発話内容が「フジ」である場合には、品種選択画面85における商品候補の中から「ふじ」が選択されることになる。
入力受付部57は、登録商品(同一のカテゴリ(商品)に属する異なる品種の物品)の商品画像に対する選択操作を受付けたか否かを判定する(ステップS31)。選択を受付けた場合(ステップS31:Yes)にはステップS23に移行し、商品提示部55は確定画面71を表示させる。一方、選択を受付けない場合(ステップS31:No)にはステップS12に移行する。
ステップS25においてCPU161は、POS端末11から商品登録の終了通知等による業務終了の有無を判定する。業務を継続する場合(ステップS25:No)、CPU161は、ステップS12へ処理を戻して処理を継続させる。業務を終了する場合(ステップS25:Yes)、画像取込部51は、撮像部164に撮像オフ信号を出力して撮像部164による撮像を終了する(ステップS26)。
次いで、売上登録部59は、ステップS24で記憶した商品ID及び販売個数に基づいて、PLUファイルF1から商品種別や単価等を読み出し、商品読取装置101で読み取られた商品Gの売上を売上マスタファイルに登録する(ステップS32)。
このように、本実施形態の情報処理装置によれば、撮像部164で撮像された物体の画像から抽出される照合用データと、PLUファイルF1に記憶された各物体の照合用データとが、どの程度類似しているかを示す類似度を算出する類似度算出部53において、音声認識部50でオペレータの発話内容が認識されている場合には、オペレータの発話内容に応じてPLUファイルF1に記憶されている物体の照合用データを絞りこむ。これにより、一般物体認識(オブジェクト認識)の認識の精度を向上させるとともに、最終的な認識までの速度も向上させることができるので、一般物体認識(オブジェクト認識)における誤認識の改善と認識速度の改善を行うことができる。
以上、本発明の実施形態を説明したが、上記実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。上記実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更、追加等を行うことができる。また、上記実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
例えば、上記実施形態では、POS端末11がPLUファイルF1を備える形態としたが、これに限らず、商品読取装置101がPLUファイルF1を備える形態としてもよいし、POS端末11及び商品読取装置101がアクセス可能な外部装置がPLUファイルF1を備える形態としてもよい。
また、上記実施形態では、画像取込部51、商品検出部52、類似度算出部53、類似度判定部54、商品提示部55、入力受付部57、情報入力部58、売上登録部59の機能を有する情報処理装置としてPOS端末11を適用したが、これに限らず、画像取込部51、商品検出部52、類似度算出部53、類似度判定部54、商品提示部55、入力受付部57、情報入力部58の機能を備えて、算出結果や判定結果をPOS端末11に出力する情報処理装置として商品読取装置101を適用してもよい。上記実施形態では、照合用データを特徴量として説明したが、照合用データは、撮像された商品画像(基準画像)としてもよい。
また、上記実施形態では、店舗システムとしてPOS端末11と商品読取装置101とで構成されるチェックアウトシステム1を適用したがこれに限るものではなく、POS端末11及び商品読取装置101の機能を備えた1台構成の装置に適用するようにしてもよい。POS端末11及び商品読取装置101の機能を備えた1台構成の装置としては、スーパーマーケット等の店舗に設置されて用いられるセルフチェックアウト装置(以降、単にセルフPOSと称する)が挙げられる。
ここで、図11はセルフPOS200の構成を示す外観斜視図、図12はセルフPOS200のハードウェア構成を示すブロック図である。尚、以下では、図1および図2に示される同様の構成については同一の符号を付して示し、その重複する説明を省略する。図11および図12に示すように、セルフPOS200の本体202は、タッチパネル105が表面に配設された表示デバイス106や、商品の種別等を認識(検出)するために商品画像を読み取る商品読取部110を備えている。
表示デバイス106としては例えば液晶表示器が用いられる。表示デバイス106は、客にセルフPOS200の操作方法を知らせるための案内画面や、各種の入力画面や、商品読取部110で読み込んだ商品情報を表示する登録画面、商品の合計金額や預かり金額、釣銭額等を表示し、支払い方法の選択をする精算画面等を表示する。
商品読取部110は、客が商品に付されたコードシンボルを商品読取部110の読取窓103にかざすことで商品画像を撮像部164により読み取るものである。
また、本体202の右側にはかごに入った未精算の商品を置くための商品載置台203が設けられ、本体202の左側には精算済みの商品を置くための商品載置台204が設けられ、精算済みの商品を入れるための袋を掛けるための袋掛けフック205や、精算済みの商品を袋に入れる前に一時的に置いておくための一時置き台206が設けられている。商品載置台203,204には計量器207,208がそれぞれ備えられており、精算の前後で商品の重量が同じであることを確認する機能を有している。
また、セルフPOS200の本体202には、精算用の紙幣の入金や釣り紙幣の受け取りを行うための釣り銭器201が設けられている。
このような構成のセルフPOS200を店舗システムに適用した場合、セルフPOS200が情報処理装置として機能することになる。
また、上記実施形態の各装置で実行されるプログラムは、各装置が備える記憶媒体(ROMまたは記憶部)に予め組み込んで提供するものとするが、これに限らず、インストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。更に、記憶媒体は、コンピュータ或いは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記憶媒体も含まれる。
また、上記実施形態の各装置で実行されるプログラムをインターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよく、インターネット等のネットワーク経由で提供または配布するように構成してもよい。