JP2010134842A - 自動販売機 - Google Patents
自動販売機 Download PDFInfo
- Publication number
- JP2010134842A JP2010134842A JP2008312313A JP2008312313A JP2010134842A JP 2010134842 A JP2010134842 A JP 2010134842A JP 2008312313 A JP2008312313 A JP 2008312313A JP 2008312313 A JP2008312313 A JP 2008312313A JP 2010134842 A JP2010134842 A JP 2010134842A
- Authority
- JP
- Japan
- Prior art keywords
- image
- user
- face
- pixels
- vending machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Control Of Vending Devices And Auxiliary Devices For Vending Devices (AREA)
Abstract
【課題】顔検出処理の効率を向上できる、自動販売機を提供する。
【解決手段】自動販売機10は、利用者を撮像して第1画像を生成するカメラ32を含む。画像キャプチャ装置34は、カメラ32から出力される第1画像を上部画像と下部画像とに分割し、上部画像を第1バッファメモリ36に格納しかつ下部画像の画素数を削減した削減済み下部画像を第2バッファメモリ38に格納する。コンピュータ40は、上部画像と削減済み下部画像とを結合して第1画像よりも画素数が小さい第2画像を生成する。コンピュータ40は、第2画像からテンプレートマッチングによって利用者の顔を検出できなければ、第1画像の一部分である上部画像からテンプレートマッチングによって利用者の顔を検出する。
【選択図】図6
【解決手段】自動販売機10は、利用者を撮像して第1画像を生成するカメラ32を含む。画像キャプチャ装置34は、カメラ32から出力される第1画像を上部画像と下部画像とに分割し、上部画像を第1バッファメモリ36に格納しかつ下部画像の画素数を削減した削減済み下部画像を第2バッファメモリ38に格納する。コンピュータ40は、上部画像と削減済み下部画像とを結合して第1画像よりも画素数が小さい第2画像を生成する。コンピュータ40は、第2画像からテンプレートマッチングによって利用者の顔を検出できなければ、第1画像の一部分である上部画像からテンプレートマッチングによって利用者の顔を検出する。
【選択図】図6
Description
この発明は自動販売機に関し、より特定的には、撮像した人物画像の特徴から顔検出を行う自動販売機に関する。
この種の従来技術の一例が特許文献1において開示されている。特許文献1には、カメラによって利用者を撮像して生成された画像から利用者の年代や性別等を認識する自動販売機について記載されている。通常、利用者の年代や性別等は、画像から検出された顔を判定することで認識される。
画像に写る利用者の顔は、カメラから利用者の顔までの距離が小さくなれば大きくなり、カメラから利用者の顔までの距離が大きくなれば小さくなる。カメラの位置は固定であるので、商品購入時には利用者が自動販売機に対して略同じ位置に立つものとして、画像に写る利用者の顔の大小は利用者の身長に応じて異なる。画像に写る利用者の顔が小さい場合、当該画像の画素数が小さければ(画質が悪ければ)利用者の顔を検出できないおそれがある。このことから、従来、顔検出処理には、カメラから利用者の顔までの距離が大きくなっても高精度に顔検出できるように、高精度のカメラで撮像した画素数の大きい画像が用いられていた。
特許第3787892号公報
上述のように従来技術では、利用者の身長のばらつきに対応するために一様に画素数が大きい画像を用いていたので、顔検出処理に要する負荷が大きく、処理効率が悪いという問題があった。特許文献1には、利用者の顔を効率よく検出するための具体的な手段については開示されていない。
それゆえに、この発明の主たる目的は、顔検出処理の効率を向上できる、自動販売機を提供することである。
上述の目的を達成するために、請求項1に記載の自動販売機は、仰角または俯角を有するように配置されかつ利用者を撮像して第1画像を生成する撮像手段と、前記第1画像に基づいて前記第1画像よりも画素数が小さい第2画像を生成する生成手段と、前記第2画像から前記利用者の顔を検出する第1顔検出手段と、前記第1顔検出手段の検出結果に基づいて前記第1画像の所定部分から前記利用者の顔を検出する第2顔検出手段とを備える。
請求項2に記載の自動販売機は、請求項1に記載の自動販売機において、前記第2顔検出手段は、前記第1顔検出手段が前記第2画像から前記利用者の顔を検出できなければ前記所定部分から前記利用者の顔を検出することを特徴とする。
請求項3に記載の自動販売機は、請求項1に記載の自動販売機において、前記撮像手段は、仰角を有して100cm〜135cmの高さに配置されることを特徴とする。
請求項4に記載の自動販売機は、請求項1に記載の自動販売機において、前記撮像手段は、俯角を有して165cm〜200cmの高さに配置されることを特徴とする。
請求項5に記載の自動販売機は、請求項1に記載の自動販売機において、商品見本が陳列される陳列部をさらに含み、前記撮像手段は、前記陳列部よりも下側に設けられることを特徴とする。
請求項6に記載の自動販売機は、請求項1に記載の自動販売機において、商品見本が陳列される陳列部をさらに含み、前記撮像手段は、前記陳列部よりも上側に設けられることを特徴とする。
請求項1に記載の自動販売機では、まず、第1画像よりも画素数が小さい第2画像から利用者の顔を検出する。撮像手段から利用者の顔までの距離が小さい場合、すなわち第1画像に利用者の顔が大きく写る場合は、画素数が小さい第2画像からでも顔を検出できる。このような画素数が小さい第2画像からの検出段階で利用者の顔を検出できれば、顔検出処理に要する負荷を大幅に軽減でき、処理効率を大幅に向上できる。一方、たとえば請求項2に記載するように、第2画像から利用者の顔を検出できなければ第1画像の所定部分から利用者の顔を検出する。商品購入時には利用者が当該自動販売機に対して略同じ位置に立つものとして、所定部分は撮像手段と利用者の顔との位置関係から第1画像において利用者の顔が小さく写る部分に設定される。このような第1画像の所定部分から顔検出することによって、第2画像からの顔検出処理と第1画像の所定部分からの顔検出処理とを合わせても、第1画像全体からの顔検出処理よりも負荷を軽減できる。このようにして顔検出処理に要する負荷を軽減でき、顔検出処理の効率を向上できる。
撮像手段が低い位置に設けられる場合、身長が高い利用者の顔を高精度に検出するためには画素数が大きい画像を用いる必要がある。このように身長が高い利用者に合わせて画素数を設定すると、利用者の身長が低ければ無駄に画素数が大きい画像を用いることになり効率が悪い。請求項3に記載の自動販売機では、その軸が上側に傾きかつ地面からその視点までの高さ(地上高)が100cm〜135cmになるように、撮像手段が設けられる。このように撮像手段が低い位置に設けられる場合、まず第2画像を用いて顔検出することによって、利用者の身長が低ければ特に顔検出処理を効率よく行える。
上述とは反対に撮像手段が高い位置に設けられる場合、身長が低い利用者に合わせて画素数が設定され、利用者の身長が高ければ無駄に画素数が大きい画像を用いることになり効率が悪い。請求項4に記載の自動販売機では、その軸が下側に傾きかつ地面からその視点までの高さが165cm〜200cmになるように、撮像手段が設けられる。このように撮像手段が高い位置に設けられる場合、まず第2画像を用いて顔検出することによって、利用者の身長が高ければ特に顔検出処理を効率よく行える。
一般に、商品購入時には利用者が自動販売機に対して略同じ位置に立つものとして、自動販売機の陳列部は、平均的な身長の利用者が見やすい位置(高さ)に設けられる。請求項5に記載の自動販売機では、撮像手段が陳列部よりも下側に設けられることによって、撮像手段が利用者の目に付きにくくなり、利用者は撮像手段をさほど意識することなく当該自動販売機を利用できる。また、このように撮像手段が陳列部よりも下側に設けられる場合、まず第2画像を用いて顔検出することによって、利用者の身長が低ければ特に顔検出処理を効率よく行える。
請求項6に記載の自動販売機では、撮像手段が陳列部よりも上側に設けられることによって、請求項5に記載の自動販売機と同様に、撮像手段が利用者の目に付きにくくなり、利用者は撮像手段をさほど意識することなく当該自動販売機を利用できる。また、このように撮像手段が陳列部よりも上側に設けられる場合、まず第2画像を用いて顔検出することによって、利用者の身長が高ければ特に顔検出処理を効率よく行える。
この発明によれば、顔検出処理の効率を向上できる。
以下、図面を参照してこの発明の実施の形態について説明する。
図1はこの発明の一実施形態の自動販売機10を示す外観図である。図2は自動販売機10の電気的構成を示すブロック図である。
図1はこの発明の一実施形態の自動販売機10を示す外観図である。図2は自動販売機10の電気的構成を示すブロック図である。
図1を参照して、自動販売機10は、陳列部12と、硬貨投入口14と、紙幣投入口16と、電子決済機18と、商品取出口20と、硬貨返却口22とを備える。
陳列部12には、複数の商品見本24と、商品見本24を見ながら欲しい商品を選択するための商品選択ボタン26とが設けられる。このような陳列部12は、平均的な身長(たとえば160cm程度)の利用者が商品見本24を見やすいように自動販売機10の前面上寄りに配置される。図1からわかるように、この実施形態では、陳列部12が自動販売機10の前面上半分のほとんどを占める。
利用者は、必要な貨幣を硬貨投入口14または紙幣投入口16から投入し、商品見本24を見ながら欲しい商品を決定し、その商品選択ボタン26を押す。すると、その商品が商品取出口20に供給され、必要に応じて釣り銭が硬貨返却口22に供給される。電子マネー、プリペイドカード、クレジットカード等を用いた各種電子決済を電子決済機18で実行することによって、商品の購入費用を支払うようにしてもよい。
図2をも参照して、自動販売機10はさらに、自動販売機本体制御装置(以下、単に「本体制御装置」と略す。)28と、貨幣識別装置30と、カメラ32と、画像キャプチャ装置34と、第1バッファメモリ36と、第2バッファメモリ38と、コンピュータ40とを備える。
本体制御装置28は、自動販売機10全体の制御を統括する。
貨幣識別装置30は、紙幣および硬貨の投入を検知し、投入された紙幣および硬貨を識別する。
図1に示すように、カメラ32は、レンズ32aを有し、レンズ32aが露出するように自動販売機10の前面かつやや右寄りに埋設される。また、カメラ32は陳列部12を避けるように陳列部12の下側に配置される。ここで、レンズ32aの表面の中心点をカメラ32の視点Aとする。また、図3を参照して、レンズ32aの表面に直交するように視点Aを通って直線状に延びる線をカメラ32の軸(一点鎖線で示す)とし、地面から視点Aまでの高さをカメラ32の高さHとする。カメラ32の高さ(鉛直方向の位置)は利用者について設定された最低身長に基づいて設定される。
図3は、カメラ32と利用者との位置関係を説明するための図解図である。
図3を参照して、自動販売機10の利用者を18歳以上の日本人と想定した場合、利用者の身長は99%の確率で130cm〜190cmの範囲に入る。これに基づいて、この実施形態では、利用者の最低身長(T1で示す)を130cmとするとともに利用者の最高身長(T3で示す)を190cmとし、カメラ32の高さ(地上高)Hが最低身長以下に設定される。具体的には、カメラ32の高さHは110cmに設定され、カメラ32は陳列部12を避けて陳列部12の下側に配置される。また、カメラ32は、陳列部12の前方にある利用者の顔を撮像するために、その軸(一点鎖線で示す)が水平方向に対して30°程度上側に傾くように配置される。すなわち、カメラ32は、30°程度の仰角を有するように上側に傾けて配置される。このようにカメラ32が設けられることによって、利用者はカメラ32をさほど意識することなく自動販売機10を利用できる。
図3を参照して、自動販売機10の利用者を18歳以上の日本人と想定した場合、利用者の身長は99%の確率で130cm〜190cmの範囲に入る。これに基づいて、この実施形態では、利用者の最低身長(T1で示す)を130cmとするとともに利用者の最高身長(T3で示す)を190cmとし、カメラ32の高さ(地上高)Hが最低身長以下に設定される。具体的には、カメラ32の高さHは110cmに設定され、カメラ32は陳列部12を避けて陳列部12の下側に配置される。また、カメラ32は、陳列部12の前方にある利用者の顔を撮像するために、その軸(一点鎖線で示す)が水平方向に対して30°程度上側に傾くように配置される。すなわち、カメラ32は、30°程度の仰角を有するように上側に傾けて配置される。このようにカメラ32が設けられることによって、利用者はカメラ32をさほど意識することなく自動販売機10を利用できる。
カメラ32は、自動販売機10の前方に立った利用者、特にその顔を撮像して画像(動画)を生成する。すなわち、カメラ32は利用者を撮像して複数フレームの画像を順次生成する。カメラ32は、常時アクティブになっており、画像キャプチャ装置34に所定のフレームレート(たとえば1秒間に30フレーム)で画像を入力する。
図3に示すように利用者の身長がT1,T2およびT3であるとき、それぞれ、図4(a),(b)および(c)に示すような画像が得られる。商品購入時には利用者がカメラ32の真正面に視点Aから水平方向に距離Lだけ離れた位置に立つものとすると、身長T1,T2およびT3であるときの視点Aから利用者の顔の中心点Bまでの距離はそれぞれ、D1,D2およびD3になる。具体的には、T1を130cm(最低身長)、T2を160cm、T3を190cm(最高身長)、Lを35cmとし、利用者の顔の中心点Bを利用者の身長から10cm低い位置とすると、D1は約36cm、D2は約53cm、D3は約78cmになる。D3とD1とを比較してD3はD1の2倍以上になる。その結果、図4(a)と図4(c)とを比較してわかるように、利用者の身長がT3(最高身長)であるときに画像に写る利用者の顔の大きさは、利用者の身長がT1(最低身長)であるときに画像に写る利用者の顔の大きさの2分の1以下になる。カメラ32によって生成される画像の画素数すなわち画質は、身長がT3の利用者でも顔検出できるように設定されている。
画像キャプチャ装置34は、所定のフレームレート(ここでは1秒間に30フレーム)でカメラ32から入力された画像をフレーム毎に抽出(取得)する。後に詳細に説明するように、画像キャプチャ装置34は、取得した1フレームの画像(以下、第1画像という)を上下に2分割して一方を第1バッファメモリ36に与えかつ他方を第2バッファメモリ38に与える。
第1バッファメモリ36および第2バッファメモリ38はそれぞれ、リングバッファ構造を有し、画像キャプチャ装置34からの新しい画像を順次蓄積(記憶)していくとともに、空きの記憶領域がない場合は古い画像から順次消去(上書き)していく。第1バッファメモリ36および第2バッファメモリ38にはそれぞれ、画像キャプチャ装置34から1秒当たり所定数(ここでは30個)の画像が与えられる。第1バッファメモリ36および第2バッファメモリ38はそれぞれ、少なくとも600個の画像(20秒間に入力される画像)を一定期間保持できる程度の容量を有する。
コンピュータ40は、後述する図5および図6に示す動作を行うためのプログラムやデータ等が格納される図示しないメモリを含む。コンピュータ40は、当該メモリに格納されたプログラムに従って、画像の中から利用者の顔を検出する。
この実施形態において、カメラ32が撮像手段に相当し、コンピュータ40が、生成手段、第1および第2顔検出手段として機能する。
ついで、このような自動販売機10の動作の一例について説明する。
自動販売機10は、図5に示す画像格納処理によって第1バッファメモリ36および第2バッファメモリ38に格納(記憶)された画像を用いて図6に示す顔検出処理を実行する。
自動販売機10は、図5に示す画像格納処理によって第1バッファメモリ36および第2バッファメモリ38に格納(記憶)された画像を用いて図6に示す顔検出処理を実行する。
図5を参照して、画像格納処理について説明する。
画像キャプチャ装置34は、ステップS1でカメラ32から画像入力が開始されると、第1画像を取得してこれを上下に2分割する(ステップS3)。そして、画像キャプチャ装置34は、分割した第1画像のうち上半分の部分(以下、上部画像という)を第1バッファメモリ36に格納する(ステップS5)。また、画像キャプチャ装置34は、上下に分割した第1画像のうち下半分の部分(以下、下部画像という)の画素数を削減し(ステップS7)、画素数を削減した下部画像(以下、削減済み下部画像という)を第2バッファメモリ38に格納する(ステップS9)。ステップS9の後、ステップS3に戻り、次の第1画像について同様の処理を繰り返す。
画像キャプチャ装置34は、ステップS1でカメラ32から画像入力が開始されると、第1画像を取得してこれを上下に2分割する(ステップS3)。そして、画像キャプチャ装置34は、分割した第1画像のうち上半分の部分(以下、上部画像という)を第1バッファメモリ36に格納する(ステップS5)。また、画像キャプチャ装置34は、上下に分割した第1画像のうち下半分の部分(以下、下部画像という)の画素数を削減し(ステップS7)、画素数を削減した下部画像(以下、削減済み下部画像という)を第2バッファメモリ38に格納する(ステップS9)。ステップS9の後、ステップS3に戻り、次の第1画像について同様の処理を繰り返す。
第1画像の画素数は、たとえば縦360ピクセル×横480ピクセル=172800ピクセルである。したがって、ステップS3で得られる上部画像および下部画像の画素数はそれぞれ、縦180ピクセル×横480ピクセル=86400ピクセルになる。そして、ステップS5では、この画素数の上部画像が第1バッファメモリ36に格納される。また、ステップS7では、下部画像の画素数を縦120ピクセル×横320ピクセル=38400ピクセルに削減して削減済み下部画像が得られる。ステップS7における画素数の削減方法(間引き方法)としては、ニアレストネイバー法、バイリニア法およびバイキュービック法等の周知のものが用いられる。
すなわち、図5の画像格納処理では、第1画像において顔が小さく写ると想定される上半分の部分(上部画像)を画素数が大きいまま(高画質のまま)第1バッファメモリ36に格納する。一方、第1画像において顔が大きく写ると想定される下半分の部分の画素数を削減し(低画質にし)、削減済み下部画像として第2バッファメモリ38に格納する。
このように画像格納処理において、第1画像を分割して上部画像を第1バッファメモリ36に格納しかつ削減済み下部画像を第2バッファメモリ38に格納することによって、第1画像全体をバッファメモリに格納する場合よりもメモリの容量を節約できる。
ついで、図6を参照して、顔検出処理について説明する。
まず、コンピュータ40は、利用者の購入動作に関するイベントを検知したか否かを判断する(ステップS11)。利用者の購入動作に関するイベントは、硬貨投入口14または紙幣投入口16からの貨幣の投入、電子決済機18による電子決済、あるいは商品選択ボタン26の押し下げを含む。本体制御装置28は、貨幣識別装置30によって貨幣の投入が検知されたとき、商品選択ボタン26によって商品の選択が検知されたとき、および電子決済機18によって決済が検知されたとき、イベント検知信号をコンピュータ40に送信する。したがって、コンピュータ40は、本体制御装置28からのイベント検知信号の有無に基づいてイベントを検知したか否かを判断する。
まず、コンピュータ40は、利用者の購入動作に関するイベントを検知したか否かを判断する(ステップS11)。利用者の購入動作に関するイベントは、硬貨投入口14または紙幣投入口16からの貨幣の投入、電子決済機18による電子決済、あるいは商品選択ボタン26の押し下げを含む。本体制御装置28は、貨幣識別装置30によって貨幣の投入が検知されたとき、商品選択ボタン26によって商品の選択が検知されたとき、および電子決済機18によって決済が検知されたとき、イベント検知信号をコンピュータ40に送信する。したがって、コンピュータ40は、本体制御装置28からのイベント検知信号の有無に基づいてイベントを検知したか否かを判断する。
イベントを検知するまでステップS11に戻り、一方、イベントを検知すればステップS13に進む。ステップS13では、イベント検知前後の所定時間(たとえば10秒)に図5の画像格納処理によって第1バッファメモリ36に格納された上部画像および第2バッファメモリ38に格納された削減済み下部画像が検出対象画像に設定される。そして、検出対象画像に設定された上部画像(削減済み下部画像)の数が検出対象画像数N(以下、単に画像数Nという)に設定される。この実施形態では、1秒間に30個の上部画像が第1バッファメモリ36に格納されかつ1秒間に30個の削減済み下部画像が第2バッファメモリ38に格納される。したがって、画像数Nが30×20=600に設定される。
ステップS13の後、コンピュータ40は、顔を検出できた回数を示すカウント値Sをリセット(「0」に設定し)、かつ処理済みの画像数を示すカウント値Iをリセットする(ステップS15)。つづいて、コンピュータ40は、カウント値Iをインクリメントし(ステップS17)、上部画像を第1バッファメモリ36から取得しかつ削減済み下部画像を第2バッファメモリ38から取得する(ステップS19)。
ステップS19では、検出対象画像に設定された複数(ここでは600個ずつ)の上部画像および削減済み下部画像のうち、第1バッファメモリ36にI番目に格納された上部画像と、第2バッファメモリ38にI番目に格納された削減済み下部画像とが取得される。すなわち、1つの第1画像を2分割して得られた上部画像と削減済み下部画像とが取得される。
ステップS19の後、コンピュータ40は、取得した上部画像および削減済み下部画像を結合して、削減済み下部画像の2倍の画素数の第2画像を生成する(ステップS21)。具体的には、削減済み下部画像の横画素数(横サイズ:320ピクセル)に合わせて上部画像と削減済み下部画像とを結合することによって、縦240ピクセル×横320ピクセル=76800ピクセルの第2画像が生成される。このようにして、第1画像と同様の表示内容でかつ第1画像よりも画素数が小さい第2画像が得られる。
ステップS21の後、コンピュータ40は、生成した第2画像からテンプレートマッチングによって利用者の顔を検出する(ステップS23)。テンプレートマッチングは、利用者(人)の顔の特徴のパターンであるパッチ(テンプレート)を第2画像上に配置し、パッチを移動させつつパッチとパッチが配置された部分とを照合(マッチング)することによってその部分に利用者の顔が写っているか否かを判定するものである。図7を参照して、この実施形態では以下のようにしてパッチPを移動させる。
図7(a)に示すように、まずパッチPを第2画像の左上隅に配置し、そこからマッチングが終わる度にパッチPを所定距離ずつ右方向に移動させる。そして、図7(b)に示すように、パッチPが第2画像の右端に達すれば、パッチPを所定距離だけ下方向に移動させ、今度はマッチングが終わる度にパッチPを所定距離ずつ左方向に移動させる。そして、パッチPが第2画像の左端に達すれば、再びパッチPを所定距離だけ下方向に移動さ、マッチングが終わる度にパッチPを所定距離ずつ右方向に移動させる。これをパッチPが第2画像全体をスキャン(走査)するまで繰り返す。1つのパッチPを移動させ終えれば、すなわち1つのパッチPによる第2画像のスキャンが終われば、異なるサイズのパッチPによって再び第2画像をスキャンする。この実施形態では、ステップS23の処理1回あたりにつき、たとえば、縦20ピクセル×横20ピクセル、縦30ピクセル×横30ピクセル、縦40ピクセル×横40ピクセル、縦50ピクセル×横50ピクセルおよび縦60ピクセル×横60ピクセルの5つのサイズのパッチによって第2画像をスキャンする。
このようなテンプレートマッチングによって第2画像に写る利用者の顔を検出できれば、コンピュータ40は利用者の顔を検出できたときの第2画像上におけるパッチPの位置やサイズ等を顔情報としてメモリに格納する。すなわち、第2画像上における利用者の顔の位置や顔の大きさ等の顔情報がメモリに格納される。当該顔情報は、後に実行される別の処理で利用者の年代や性別等を認識するために用いられる。
ステップS23の後、コンピュータ40は、メモリに顔情報が格納されているか否かを判定する。すなわち、第2画像から利用者の顔を検出できたか否かを判定する(ステップS25)。利用者の顔を検出できていれば、カウント値Sをインクリメントして(ステップS27)、ステップS29に進む。一方、利用者の顔を検出できていなければステップS27を経ることなくステップS29に進む。
ステップS29では、カウント値Iが画像数Nに達したか否かがコンピュータ40によって判定される。カウント値Iが画像数Nに達していなければステップS17に戻り、一方、カウント値Iが画像数Nに達していればステップS31に進む。
ステップS31では、カウント値Sが0か否かがコンピュータ40によって判定される。カウント値Sが「0」であって複数(ここでは600個)の第2画像から1回も利用者の顔を検出できていなければ、コンピュータ40は、カウント値Iをリセットし(ステップS33)、カウント値Iをインクリメントし(ステップS35)、上部画像を第1バッファメモリ36から取得する(ステップS37)。ステップS37では、検出対象画像に設定された複数(ここでは600個)の上部画像のうち、第1バッファメモリ36にI番目に格納された上部画像が取得される。そして、コンピュータ40は、第2画像と同様に、取得した上部画像からテンプレートマッチングによって利用者の顔を検出する(ステップS39)。すなわち、第1画像の所定部分からテンプレートマッチングによって利用者の顔を検出する。その後、コンピュータ40はカウント値Iが画像数Nに達したか否かを判定し(ステップS41)、カウント値Iが画像数Nに達していなければステップS35に戻り、一方、カウント値Iが画像数Nに達していれば顔検出処理を終了する。ステップS31において、カウント値Sが1以上であって複数の第2画像から1回でも利用者の顔を検出できていれば同様に顔検出処理を終了する。
このような自動販売機10によれば、第1画像よりも画素数が小さい第2画像からの検出段階で利用者の顔を検出できれば、マッチング回数を大幅に減らすことができる。また、第2画像から顔を検出できなかった場合であっても、第1画像についてのテンプレートマッチングは所定部分(上部画像)のみである。これによって、第2画像におけるマッチング回数と第1画像の一部分である上部画像におけるマッチング回数とを合わせても、第1画像全体におけるマッチング回数よりも少なくできる。このようにマッチング回数を減らすことができるので、顔検出処理に要する負荷を軽減でき、顔検出処理の効率を向上できる。
カメラ32が陳列部12の下側にその高さが110cmになるように配置されることによって、カメラ32が利用者の目に付きにくくなり、利用者はカメラ32をさほど意識することなく自動販売機10を利用できる。また、このようにカメラ32が低い位置(陳列部12よりも下側)に設けられる場合、まず第2画像を用いて顔検出することによって、利用者の身長が低ければ特に顔検出処理を効率よく行える。
ここで、自動販売機10におけるマッチング回数と、従来技術におけるマッチング回数とについて具体例を挙げて説明する。自動販売機10および従来技術のいずれにおいても上述の5つのサイズのパッチを用いてテンプレートマッチングを行った場合のマッチング回数を以下の表1に示す。なお、従来技術のマッチング回数は、第1画像(縦360ピクセル×横480ピクセルの画像)全体についてテンプレートマッチングを行うことによって得たものである。また、各パッチのマッチング回数は、1回あたりの横方向への移動量および1回あたりの下方向への移動量を表1に示すように設定して得たものである。
表1を参照して、自動販売機10において第2画像からの検出段階で利用者の顔を検出できればそのマッチング回数は30837回となることがわかる。従来技術におけるマッチング回数の合計は74355回であり、第2画像からの検出段階で利用者の顔を検出できれば従来技術に比べてマッチング回数を約59%も削減できる。また、第2画像から利用者の顔を検出できなかった場合であっても、第2画像におけるマッチング回数と上部画像におけるマッチング回数との合計は65085回であり、従来技術に比べてマッチング回数を12%削減できる。このように自動販売機10によれば、マッチング回数を減らすことができ、顔検出処理の効率を向上できることがわかる。
なお、カメラ32の位置は上述の実施形態には限定されない。
たとえば、図8に示すように、利用者について設定された最高身長(T3:ここでは190cm)に基づいて、カメラ32の高さH1がT3と等しくなるようにカメラ32を設けてもよい。この場合、図1に破線で示すように、カメラ32は、陳列部12の上側に設けられるカメラ配置部42に埋設される。また、図8に示すように、カメラ32は、その軸(一点鎖線で示す)が水平方向に対して30°程度下側に傾くように配置される。すなわち、カメラ32は、30°程度の俯角を有するように下側に傾けて陳列部12の上側に配置される。このようにカメラ32を陳列部12の上側に設けることによって、利用者にカメラ32をさほど意識させることなく自動販売機10を利用させることができる。
たとえば、図8に示すように、利用者について設定された最高身長(T3:ここでは190cm)に基づいて、カメラ32の高さH1がT3と等しくなるようにカメラ32を設けてもよい。この場合、図1に破線で示すように、カメラ32は、陳列部12の上側に設けられるカメラ配置部42に埋設される。また、図8に示すように、カメラ32は、その軸(一点鎖線で示す)が水平方向に対して30°程度下側に傾くように配置される。すなわち、カメラ32は、30°程度の俯角を有するように下側に傾けて陳列部12の上側に配置される。このようにカメラ32を陳列部12の上側に設けることによって、利用者にカメラ32をさほど意識させることなく自動販売機10を利用させることができる。
この場合、陳列部12の下側にカメラ32を設ける場合とは反対に、利用者の身長が高いほど第1画像に写る利用者の顔が大きくなる。具体的には、利用者がカメラ32の真正面に視点Aから水平方向に距離L(ここでは35cm)だけ離れた位置に立ったとすると、身長T1,T2およびT3であるときの視点Aから利用者の顔の中心点Bまでの距離D4,D5およびD6はそれぞれ、約78cm、約53cmおよび約36cmになる。その結果、利用者の身長がT1(最低身長)であるときに第1画像に写る利用者の顔の大きさは、利用者の身長がT3(最高身長)であるときに画像に写る利用者の顔の大きさの2分の1以下になる。
このようにカメラ32を陳列部12の上側に設ける場合は、図5に示す画像格納処理に代えて図9に示す画像格納処理を実行すればよい。そして、図9の画像格納処理によって第1バッファメモリ36および第2バッファメモリ38に格納した画像を用いて図10に示す顔検出処理を実行すればよい。
図9を参照して、カメラ32を陳列部12の上側に設ける場合の画像格納処理について説明する。図9において図5と同一の処理については、同一の符号を付して重複する説明を省略する。
図9の画像格納処理では、ステップS5aで第1画像の2分の1の画素数の下部画像が第2バッファメモリ38に格納される。そして、ステップS7aで上部画像の画素数が縦180ピクセル×横480ピクセル=86400ピクセルから縦120ピクセル×横320ピクセル=38400ピクセルに削減され、画素数が削減された上部画像(以下、削減済み上部画像という)がステップS9aで第1バッファメモリ36に格納される。
すなわち、図9の画像格納処理では、第1画像において顔が小さく写ると想定される下半分の部分(下部画像)を画素数が大きいまま第2バッファメモリ38に格納する。一方、第1画像において顔が大きく写ると想定される上半分の部分の画素数を削減し、削減済み上部画像として第1バッファメモリ36に格納する。
ついで、図10を参照して、カメラ32を陳列部12の上側に設ける場合の顔検出処理について説明する。図10において図6と同一の処理については、同一の符号を付して重複する説明を省略する。
図10の顔検出処理では、ステップS19aで削減済み上部画像と下部画像とが取得される。そして、ステップS21aで、縦120ピクセル×横320ピクセルの削減済み上部画像と、縦180ピクセル×横480ピクセルの下部画像とが結合され、削減済み上部画像の横画素数(横サイズ)に合わせて縦240ピクセル×横320ピクセル=76800ピクセルの第2画像が生成される。コンピュータ40は、このように生成した第2画像についてステップS23でテンプレートマッチングを行う。
その後、コンピュータ40は、複数の第2画像から1回も利用者の顔を検出できていなければ、ステップS37aで第2バッファメモリ38から下部画像を取得し、下部画像についてステップS39でテンプレートマッチングを行う。
このような図9の画像格納処理および図10の顔検出処理を実行することによって、カメラ32の視点Aを陳列部12の上側に配置する場合も、表1と同様の結果を得ることができ、上述と同様の効果を奏することができる。
カメラ32が陳列部12の上側にその高さが190cmになるように配置されることによって、カメラ32が利用者の目に付きにくくなり、利用者はカメラ32をさほど意識することなく自動販売機10を利用できる。また、このようにカメラ32が高い位置(陳列部12よりも上側)に設けられる場合、まず第2画像を用いて顔検出することによって、利用者の身長が高ければ特に顔検出処理を効率よく行える。
なお、図5および図9の画像格納処理では、第1画像を分割して一方の画素数を削減する場合について説明したが、これに限定されない。第1画像全体をバッファメモリに格納してもよい。この場合、図6および図10の顔検出処理において、当該第1画像の画素数を削減することによって第2画像を生成すればよい。また、当該第2画像から利用者の顔を検出できなければ、当該第1画像から所定部分を切り出して当該所定部分から利用者の顔を検出すればよい。
上述の実施形態では、第1バッファメモリ36および第2バッファメモリ38を用いる場合について説明したが、1つのメモリの領域を2つに区分し、それらに第1バッファメモリ36および第2バッファメモリ38と同様に画像を格納するようにしてもよい。
上述の実施形態では、第1画像において利用者の顔を検出する所定部分を第1画像の上半分(上部画像)または下半分(下部画像)とする場合について説明したが、所定部分はこれに限定されない。第1画像における所定部分の範囲(画素数)は、第2画像におけるマッチングの回数と所定部分におけるマッチング回数との和が第1画像全体におけるマッチング回数よりも少なくなれば任意に設定できる。
上述の実施形態ではテンプレートマッチングによって利用者の顔を検出する場合について説明したが、これに限定されない。たとえば統計的識別手法等によって利用者の顔を検出するようにしてもよい。この発明によれば、検索対象である画像の画素数が大きくなるほど負荷が大きくなるいずれの顔検出処理においても効率を向上できる。
上述の実施形態では、カメラ32の視点Aの高さを110cmに設定する場合と190cmに設定する場合とについて説明したが、カメラ32の高さはこれらに限定されない。たとえば、カメラ32の高さは、100cm〜135cmの範囲または165cm〜200cmの範囲で任意に設定できる。また、最低身長および最高身長についても上述の実施形態に限定されず、最低身長および最高身長は利用者の身長の統計に応じて適宜設定できる。
上述の実施形態では、カメラ32が陳列部12外に設けられる場合について説明したが、カメラ32は陳列部12内に設けられていてもよい。
10 自動販売機
32 カメラ
32a レンズ
34 画像キャプチャ装置
36 第1バッファメモリ
38 第2バッファメモリ
40 コンピュータ
32 カメラ
32a レンズ
34 画像キャプチャ装置
36 第1バッファメモリ
38 第2バッファメモリ
40 コンピュータ
Claims (6)
- 仰角または俯角を有するように配置されかつ利用者を撮像して第1画像を生成する撮像手段と、
前記第1画像に基づいて前記第1画像よりも画素数が小さい第2画像を生成する生成手段と、
前記第2画像から前記利用者の顔を検出する第1顔検出手段と、
前記第1顔検出手段の検出結果に基づいて前記第1画像の所定部分から前記利用者の顔を検出する第2顔検出手段とを備える、自動販売機。 - 前記第2顔検出手段は、前記第1顔検出手段が前記第2画像から前記利用者の顔を検出できなければ前記所定部分から前記利用者の顔を検出する、請求項1に記載の自動販売機。
- 前記撮像手段は、仰角を有して100cm〜135cmの高さに配置される、請求項1に記載の自動販売機。
- 前記撮像手段は、俯角を有して165cm〜200cmの高さに配置される、請求項1に記載の自動販売機。
- 商品見本が陳列される陳列部をさらに含み、
前記撮像手段は、前記陳列部よりも下側に設けられる、請求項1に記載の自動販売機。 - 商品見本が陳列される陳列部をさらに含み、
前記撮像手段は、前記陳列部よりも上側に設けられる、請求項1に記載の自動販売機。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008312313A JP2010134842A (ja) | 2008-12-08 | 2008-12-08 | 自動販売機 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008312313A JP2010134842A (ja) | 2008-12-08 | 2008-12-08 | 自動販売機 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010134842A true JP2010134842A (ja) | 2010-06-17 |
Family
ID=42346055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008312313A Pending JP2010134842A (ja) | 2008-12-08 | 2008-12-08 | 自動販売機 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010134842A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014203221A (ja) * | 2013-04-03 | 2014-10-27 | 株式会社エーエスケートレーディング | 自販機 |
-
2008
- 2008-12-08 JP JP2008312313A patent/JP2010134842A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014203221A (ja) * | 2013-04-03 | 2014-10-27 | 株式会社エーエスケートレーディング | 自販機 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9922220B2 (en) | Image block selection for efficient time-limited decoding | |
US11798253B2 (en) | Determining a position of an object in a rotation corrected image | |
US9082192B2 (en) | Text image trimming method | |
US9454708B2 (en) | Recognition dictionary creation apparatus and method for creating recognition dictionary by the same | |
US20220130161A1 (en) | Dynamically optimizing photo capture for multiple subjects | |
KR20120126465A (ko) | 모바일 통신기를 이용하는 위폐 감별법 | |
CN107343146A (zh) | 图像处理装置以及图像处理方法 | |
US20120030104A1 (en) | Processing images associated with the remote capture of multiple deposit items | |
US10573022B2 (en) | Object recognition system and method of registering a new object | |
CN110503416B (zh) | 数值转移方法、装置、计算机设备及存储介质 | |
CN106161933B (zh) | 一种图像处理方法及移动终端 | |
JP2016206839A (ja) | 媒体認識装置及び取引装置 | |
US10223584B2 (en) | Document detection | |
CN107577973A (zh) | 一种图像显示方法、图像识别方法及设备 | |
TWI476702B (zh) | 使用者辨識系統及辨識使用者的方法 | |
CN111753568B (zh) | 单据信息处理方法及装置、电子设备及存储介质 | |
JP2010134842A (ja) | 自動販売機 | |
US11941693B2 (en) | Currency information provision system, database server for currency information provision, currency information provision method, and currency information provision program | |
JP2010160702A (ja) | コイン識別装置 | |
EP3518143A1 (en) | Article recognition device and commodity settlement device | |
US20120030118A1 (en) | Remote capture of multiple deposit items using a grid | |
JP2010128903A (ja) | 自動販売機 | |
JP5338178B2 (ja) | 監視装置および方法、並びにプログラム | |
CN115829575A (zh) | 支付验证方法、装置、终端、服务器及存储介质 | |
JP2010146320A (ja) | 自動販売機 |