JP2010134842A

JP2010134842A - 自動販売機

Info

Publication number: JP2010134842A
Application number: JP2008312313A
Authority: JP
Inventors: Shunnosuke Kahata; 俊之介加畑; Mutsumi Yoshida; 睦吉田
Original assignee: Yamaha Motor Co Ltd
Current assignee: Yamaha Motor Co Ltd
Priority date: 2008-12-08
Filing date: 2008-12-08
Publication date: 2010-06-17

Abstract

【課題】顔検出処理の効率を向上できる、自動販売機を提供する。
【解決手段】自動販売機１０は、利用者を撮像して第１画像を生成するカメラ３２を含む。画像キャプチャ装置３４は、カメラ３２から出力される第１画像を上部画像と下部画像とに分割し、上部画像を第１バッファメモリ３６に格納しかつ下部画像の画素数を削減した削減済み下部画像を第２バッファメモリ３８に格納する。コンピュータ４０は、上部画像と削減済み下部画像とを結合して第１画像よりも画素数が小さい第２画像を生成する。コンピュータ４０は、第２画像からテンプレートマッチングによって利用者の顔を検出できなければ、第１画像の一部分である上部画像からテンプレートマッチングによって利用者の顔を検出する。
【選択図】図６

Description

この発明は自動販売機に関し、より特定的には、撮像した人物画像の特徴から顔検出を行う自動販売機に関する。

この種の従来技術の一例が特許文献１において開示されている。特許文献１には、カメラによって利用者を撮像して生成された画像から利用者の年代や性別等を認識する自動販売機について記載されている。通常、利用者の年代や性別等は、画像から検出された顔を判定することで認識される。

画像に写る利用者の顔は、カメラから利用者の顔までの距離が小さくなれば大きくなり、カメラから利用者の顔までの距離が大きくなれば小さくなる。カメラの位置は固定であるので、商品購入時には利用者が自動販売機に対して略同じ位置に立つものとして、画像に写る利用者の顔の大小は利用者の身長に応じて異なる。画像に写る利用者の顔が小さい場合、当該画像の画素数が小さければ（画質が悪ければ）利用者の顔を検出できないおそれがある。このことから、従来、顔検出処理には、カメラから利用者の顔までの距離が大きくなっても高精度に顔検出できるように、高精度のカメラで撮像した画素数の大きい画像が用いられていた。
特許第３７８７８９２号公報

上述のように従来技術では、利用者の身長のばらつきに対応するために一様に画素数が大きい画像を用いていたので、顔検出処理に要する負荷が大きく、処理効率が悪いという問題があった。特許文献１には、利用者の顔を効率よく検出するための具体的な手段については開示されていない。

それゆえに、この発明の主たる目的は、顔検出処理の効率を向上できる、自動販売機を提供することである。

上述の目的を達成するために、請求項１に記載の自動販売機は、仰角または俯角を有するように配置されかつ利用者を撮像して第１画像を生成する撮像手段と、前記第１画像に基づいて前記第１画像よりも画素数が小さい第２画像を生成する生成手段と、前記第２画像から前記利用者の顔を検出する第１顔検出手段と、前記第１顔検出手段の検出結果に基づいて前記第１画像の所定部分から前記利用者の顔を検出する第２顔検出手段とを備える。

請求項２に記載の自動販売機は、請求項１に記載の自動販売機において、前記第２顔検出手段は、前記第１顔検出手段が前記第２画像から前記利用者の顔を検出できなければ前記所定部分から前記利用者の顔を検出することを特徴とする。

請求項３に記載の自動販売機は、請求項１に記載の自動販売機において、前記撮像手段は、仰角を有して１００ｃｍ〜１３５ｃｍの高さに配置されることを特徴とする。

請求項４に記載の自動販売機は、請求項１に記載の自動販売機において、前記撮像手段は、俯角を有して１６５ｃｍ〜２００ｃｍの高さに配置されることを特徴とする。

請求項５に記載の自動販売機は、請求項１に記載の自動販売機において、商品見本が陳列される陳列部をさらに含み、前記撮像手段は、前記陳列部よりも下側に設けられることを特徴とする。

請求項６に記載の自動販売機は、請求項１に記載の自動販売機において、商品見本が陳列される陳列部をさらに含み、前記撮像手段は、前記陳列部よりも上側に設けられることを特徴とする。

請求項１に記載の自動販売機では、まず、第１画像よりも画素数が小さい第２画像から利用者の顔を検出する。撮像手段から利用者の顔までの距離が小さい場合、すなわち第１画像に利用者の顔が大きく写る場合は、画素数が小さい第２画像からでも顔を検出できる。このような画素数が小さい第２画像からの検出段階で利用者の顔を検出できれば、顔検出処理に要する負荷を大幅に軽減でき、処理効率を大幅に向上できる。一方、たとえば請求項２に記載するように、第２画像から利用者の顔を検出できなければ第１画像の所定部分から利用者の顔を検出する。商品購入時には利用者が当該自動販売機に対して略同じ位置に立つものとして、所定部分は撮像手段と利用者の顔との位置関係から第１画像において利用者の顔が小さく写る部分に設定される。このような第１画像の所定部分から顔検出することによって、第２画像からの顔検出処理と第１画像の所定部分からの顔検出処理とを合わせても、第１画像全体からの顔検出処理よりも負荷を軽減できる。このようにして顔検出処理に要する負荷を軽減でき、顔検出処理の効率を向上できる。

撮像手段が低い位置に設けられる場合、身長が高い利用者の顔を高精度に検出するためには画素数が大きい画像を用いる必要がある。このように身長が高い利用者に合わせて画素数を設定すると、利用者の身長が低ければ無駄に画素数が大きい画像を用いることになり効率が悪い。請求項３に記載の自動販売機では、その軸が上側に傾きかつ地面からその視点までの高さ（地上高）が１００ｃｍ〜１３５ｃｍになるように、撮像手段が設けられる。このように撮像手段が低い位置に設けられる場合、まず第２画像を用いて顔検出することによって、利用者の身長が低ければ特に顔検出処理を効率よく行える。

上述とは反対に撮像手段が高い位置に設けられる場合、身長が低い利用者に合わせて画素数が設定され、利用者の身長が高ければ無駄に画素数が大きい画像を用いることになり効率が悪い。請求項４に記載の自動販売機では、その軸が下側に傾きかつ地面からその視点までの高さが１６５ｃｍ〜２００ｃｍになるように、撮像手段が設けられる。このように撮像手段が高い位置に設けられる場合、まず第２画像を用いて顔検出することによって、利用者の身長が高ければ特に顔検出処理を効率よく行える。

一般に、商品購入時には利用者が自動販売機に対して略同じ位置に立つものとして、自動販売機の陳列部は、平均的な身長の利用者が見やすい位置（高さ）に設けられる。請求項５に記載の自動販売機では、撮像手段が陳列部よりも下側に設けられることによって、撮像手段が利用者の目に付きにくくなり、利用者は撮像手段をさほど意識することなく当該自動販売機を利用できる。また、このように撮像手段が陳列部よりも下側に設けられる場合、まず第２画像を用いて顔検出することによって、利用者の身長が低ければ特に顔検出処理を効率よく行える。

請求項６に記載の自動販売機では、撮像手段が陳列部よりも上側に設けられることによって、請求項５に記載の自動販売機と同様に、撮像手段が利用者の目に付きにくくなり、利用者は撮像手段をさほど意識することなく当該自動販売機を利用できる。また、このように撮像手段が陳列部よりも上側に設けられる場合、まず第２画像を用いて顔検出することによって、利用者の身長が高ければ特に顔検出処理を効率よく行える。

この発明によれば、顔検出処理の効率を向上できる。

以下、図面を参照してこの発明の実施の形態について説明する。
図１はこの発明の一実施形態の自動販売機１０を示す外観図である。図２は自動販売機１０の電気的構成を示すブロック図である。

図１を参照して、自動販売機１０は、陳列部１２と、硬貨投入口１４と、紙幣投入口１６と、電子決済機１８と、商品取出口２０と、硬貨返却口２２とを備える。

陳列部１２には、複数の商品見本２４と、商品見本２４を見ながら欲しい商品を選択するための商品選択ボタン２６とが設けられる。このような陳列部１２は、平均的な身長（たとえば１６０ｃｍ程度）の利用者が商品見本２４を見やすいように自動販売機１０の前面上寄りに配置される。図１からわかるように、この実施形態では、陳列部１２が自動販売機１０の前面上半分のほとんどを占める。

利用者は、必要な貨幣を硬貨投入口１４または紙幣投入口１６から投入し、商品見本２４を見ながら欲しい商品を決定し、その商品選択ボタン２６を押す。すると、その商品が商品取出口２０に供給され、必要に応じて釣り銭が硬貨返却口２２に供給される。電子マネー、プリペイドカード、クレジットカード等を用いた各種電子決済を電子決済機１８で実行することによって、商品の購入費用を支払うようにしてもよい。

図２をも参照して、自動販売機１０はさらに、自動販売機本体制御装置（以下、単に「本体制御装置」と略す。）２８と、貨幣識別装置３０と、カメラ３２と、画像キャプチャ装置３４と、第１バッファメモリ３６と、第２バッファメモリ３８と、コンピュータ４０とを備える。

本体制御装置２８は、自動販売機１０全体の制御を統括する。

貨幣識別装置３０は、紙幣および硬貨の投入を検知し、投入された紙幣および硬貨を識別する。

図１に示すように、カメラ３２は、レンズ３２ａを有し、レンズ３２ａが露出するように自動販売機１０の前面かつやや右寄りに埋設される。また、カメラ３２は陳列部１２を避けるように陳列部１２の下側に配置される。ここで、レンズ３２ａの表面の中心点をカメラ３２の視点Ａとする。また、図３を参照して、レンズ３２ａの表面に直交するように視点Ａを通って直線状に延びる線をカメラ３２の軸（一点鎖線で示す）とし、地面から視点Ａまでの高さをカメラ３２の高さＨとする。カメラ３２の高さ（鉛直方向の位置）は利用者について設定された最低身長に基づいて設定される。

図３は、カメラ３２と利用者との位置関係を説明するための図解図である。
図３を参照して、自動販売機１０の利用者を１８歳以上の日本人と想定した場合、利用者の身長は９９％の確率で１３０ｃｍ〜１９０ｃｍの範囲に入る。これに基づいて、この実施形態では、利用者の最低身長（Ｔ１で示す）を１３０ｃｍとするとともに利用者の最高身長（Ｔ３で示す）を１９０ｃｍとし、カメラ３２の高さ（地上高）Ｈが最低身長以下に設定される。具体的には、カメラ３２の高さＨは１１０ｃｍに設定され、カメラ３２は陳列部１２を避けて陳列部１２の下側に配置される。また、カメラ３２は、陳列部１２の前方にある利用者の顔を撮像するために、その軸（一点鎖線で示す）が水平方向に対して３０°程度上側に傾くように配置される。すなわち、カメラ３２は、３０°程度の仰角を有するように上側に傾けて配置される。このようにカメラ３２が設けられることによって、利用者はカメラ３２をさほど意識することなく自動販売機１０を利用できる。

カメラ３２は、自動販売機１０の前方に立った利用者、特にその顔を撮像して画像（動画）を生成する。すなわち、カメラ３２は利用者を撮像して複数フレームの画像を順次生成する。カメラ３２は、常時アクティブになっており、画像キャプチャ装置３４に所定のフレームレート（たとえば１秒間に３０フレーム）で画像を入力する。

図３に示すように利用者の身長がＴ１，Ｔ２およびＴ３であるとき、それぞれ、図４（ａ），（ｂ）および（ｃ）に示すような画像が得られる。商品購入時には利用者がカメラ３２の真正面に視点Ａから水平方向に距離Ｌだけ離れた位置に立つものとすると、身長Ｔ１，Ｔ２およびＴ３であるときの視点Ａから利用者の顔の中心点Ｂまでの距離はそれぞれ、Ｄ１，Ｄ２およびＤ３になる。具体的には、Ｔ１を１３０ｃｍ（最低身長）、Ｔ２を１６０ｃｍ、Ｔ３を１９０ｃｍ（最高身長）、Ｌを３５ｃｍとし、利用者の顔の中心点Ｂを利用者の身長から１０ｃｍ低い位置とすると、Ｄ１は約３６ｃｍ、Ｄ２は約５３ｃｍ、Ｄ３は約７８ｃｍになる。Ｄ３とＤ１とを比較してＤ３はＤ１の２倍以上になる。その結果、図４（ａ）と図４（ｃ）とを比較してわかるように、利用者の身長がＴ３（最高身長）であるときに画像に写る利用者の顔の大きさは、利用者の身長がＴ１（最低身長）であるときに画像に写る利用者の顔の大きさの２分の１以下になる。カメラ３２によって生成される画像の画素数すなわち画質は、身長がＴ３の利用者でも顔検出できるように設定されている。

画像キャプチャ装置３４は、所定のフレームレート（ここでは１秒間に３０フレーム）でカメラ３２から入力された画像をフレーム毎に抽出（取得）する。後に詳細に説明するように、画像キャプチャ装置３４は、取得した１フレームの画像（以下、第１画像という）を上下に２分割して一方を第１バッファメモリ３６に与えかつ他方を第２バッファメモリ３８に与える。

第１バッファメモリ３６および第２バッファメモリ３８はそれぞれ、リングバッファ構造を有し、画像キャプチャ装置３４からの新しい画像を順次蓄積（記憶）していくとともに、空きの記憶領域がない場合は古い画像から順次消去（上書き）していく。第１バッファメモリ３６および第２バッファメモリ３８にはそれぞれ、画像キャプチャ装置３４から１秒当たり所定数（ここでは３０個）の画像が与えられる。第１バッファメモリ３６および第２バッファメモリ３８はそれぞれ、少なくとも６００個の画像（２０秒間に入力される画像）を一定期間保持できる程度の容量を有する。

コンピュータ４０は、後述する図５および図６に示す動作を行うためのプログラムやデータ等が格納される図示しないメモリを含む。コンピュータ４０は、当該メモリに格納されたプログラムに従って、画像の中から利用者の顔を検出する。

この実施形態において、カメラ３２が撮像手段に相当し、コンピュータ４０が、生成手段、第１および第２顔検出手段として機能する。

ついで、このような自動販売機１０の動作の一例について説明する。
自動販売機１０は、図５に示す画像格納処理によって第１バッファメモリ３６および第２バッファメモリ３８に格納（記憶）された画像を用いて図６に示す顔検出処理を実行する。

図５を参照して、画像格納処理について説明する。
画像キャプチャ装置３４は、ステップＳ１でカメラ３２から画像入力が開始されると、第１画像を取得してこれを上下に２分割する（ステップＳ３）。そして、画像キャプチャ装置３４は、分割した第１画像のうち上半分の部分（以下、上部画像という）を第１バッファメモリ３６に格納する（ステップＳ５）。また、画像キャプチャ装置３４は、上下に分割した第１画像のうち下半分の部分（以下、下部画像という）の画素数を削減し（ステップＳ７）、画素数を削減した下部画像（以下、削減済み下部画像という）を第２バッファメモリ３８に格納する（ステップＳ９）。ステップＳ９の後、ステップＳ３に戻り、次の第１画像について同様の処理を繰り返す。

第１画像の画素数は、たとえば縦３６０ピクセル×横４８０ピクセル＝１７２８００ピクセルである。したがって、ステップＳ３で得られる上部画像および下部画像の画素数はそれぞれ、縦１８０ピクセル×横４８０ピクセル＝８６４００ピクセルになる。そして、ステップＳ５では、この画素数の上部画像が第１バッファメモリ３６に格納される。また、ステップＳ７では、下部画像の画素数を縦１２０ピクセル×横３２０ピクセル＝３８４００ピクセルに削減して削減済み下部画像が得られる。ステップＳ７における画素数の削減方法（間引き方法）としては、ニアレストネイバー法、バイリニア法およびバイキュービック法等の周知のものが用いられる。

すなわち、図５の画像格納処理では、第１画像において顔が小さく写ると想定される上半分の部分（上部画像）を画素数が大きいまま（高画質のまま）第１バッファメモリ３６に格納する。一方、第１画像において顔が大きく写ると想定される下半分の部分の画素数を削減し（低画質にし）、削減済み下部画像として第２バッファメモリ３８に格納する。

このように画像格納処理において、第１画像を分割して上部画像を第１バッファメモリ３６に格納しかつ削減済み下部画像を第２バッファメモリ３８に格納することによって、第１画像全体をバッファメモリに格納する場合よりもメモリの容量を節約できる。

ついで、図６を参照して、顔検出処理について説明する。
まず、コンピュータ４０は、利用者の購入動作に関するイベントを検知したか否かを判断する（ステップＳ１１）。利用者の購入動作に関するイベントは、硬貨投入口１４または紙幣投入口１６からの貨幣の投入、電子決済機１８による電子決済、あるいは商品選択ボタン２６の押し下げを含む。本体制御装置２８は、貨幣識別装置３０によって貨幣の投入が検知されたとき、商品選択ボタン２６によって商品の選択が検知されたとき、および電子決済機１８によって決済が検知されたとき、イベント検知信号をコンピュータ４０に送信する。したがって、コンピュータ４０は、本体制御装置２８からのイベント検知信号の有無に基づいてイベントを検知したか否かを判断する。

イベントを検知するまでステップＳ１１に戻り、一方、イベントを検知すればステップＳ１３に進む。ステップＳ１３では、イベント検知前後の所定時間（たとえば１０秒）に図５の画像格納処理によって第１バッファメモリ３６に格納された上部画像および第２バッファメモリ３８に格納された削減済み下部画像が検出対象画像に設定される。そして、検出対象画像に設定された上部画像（削減済み下部画像）の数が検出対象画像数Ｎ（以下、単に画像数Ｎという）に設定される。この実施形態では、１秒間に３０個の上部画像が第１バッファメモリ３６に格納されかつ１秒間に３０個の削減済み下部画像が第２バッファメモリ３８に格納される。したがって、画像数Ｎが３０×２０＝６００に設定される。

ステップＳ１３の後、コンピュータ４０は、顔を検出できた回数を示すカウント値Ｓをリセット（「０」に設定し）、かつ処理済みの画像数を示すカウント値Ｉをリセットする（ステップＳ１５）。つづいて、コンピュータ４０は、カウント値Ｉをインクリメントし（ステップＳ１７）、上部画像を第１バッファメモリ３６から取得しかつ削減済み下部画像を第２バッファメモリ３８から取得する（ステップＳ１９）。

ステップＳ１９では、検出対象画像に設定された複数（ここでは６００個ずつ）の上部画像および削減済み下部画像のうち、第１バッファメモリ３６にＩ番目に格納された上部画像と、第２バッファメモリ３８にＩ番目に格納された削減済み下部画像とが取得される。すなわち、１つの第１画像を２分割して得られた上部画像と削減済み下部画像とが取得される。

ステップＳ１９の後、コンピュータ４０は、取得した上部画像および削減済み下部画像を結合して、削減済み下部画像の２倍の画素数の第２画像を生成する（ステップＳ２１）。具体的には、削減済み下部画像の横画素数（横サイズ：３２０ピクセル）に合わせて上部画像と削減済み下部画像とを結合することによって、縦２４０ピクセル×横３２０ピクセル＝７６８００ピクセルの第２画像が生成される。このようにして、第１画像と同様の表示内容でかつ第１画像よりも画素数が小さい第２画像が得られる。

ステップＳ２１の後、コンピュータ４０は、生成した第２画像からテンプレートマッチングによって利用者の顔を検出する（ステップＳ２３）。テンプレートマッチングは、利用者（人）の顔の特徴のパターンであるパッチ（テンプレート）を第２画像上に配置し、パッチを移動させつつパッチとパッチが配置された部分とを照合（マッチング）することによってその部分に利用者の顔が写っているか否かを判定するものである。図７を参照して、この実施形態では以下のようにしてパッチＰを移動させる。

図７（ａ）に示すように、まずパッチＰを第２画像の左上隅に配置し、そこからマッチングが終わる度にパッチＰを所定距離ずつ右方向に移動させる。そして、図７（ｂ）に示すように、パッチＰが第２画像の右端に達すれば、パッチＰを所定距離だけ下方向に移動させ、今度はマッチングが終わる度にパッチＰを所定距離ずつ左方向に移動させる。そして、パッチＰが第２画像の左端に達すれば、再びパッチＰを所定距離だけ下方向に移動さ、マッチングが終わる度にパッチＰを所定距離ずつ右方向に移動させる。これをパッチＰが第２画像全体をスキャン（走査）するまで繰り返す。１つのパッチＰを移動させ終えれば、すなわち１つのパッチＰによる第２画像のスキャンが終われば、異なるサイズのパッチＰによって再び第２画像をスキャンする。この実施形態では、ステップＳ２３の処理１回あたりにつき、たとえば、縦２０ピクセル×横２０ピクセル、縦３０ピクセル×横３０ピクセル、縦４０ピクセル×横４０ピクセル、縦５０ピクセル×横５０ピクセルおよび縦６０ピクセル×横６０ピクセルの５つのサイズのパッチによって第２画像をスキャンする。

このようなテンプレートマッチングによって第２画像に写る利用者の顔を検出できれば、コンピュータ４０は利用者の顔を検出できたときの第２画像上におけるパッチＰの位置やサイズ等を顔情報としてメモリに格納する。すなわち、第２画像上における利用者の顔の位置や顔の大きさ等の顔情報がメモリに格納される。当該顔情報は、後に実行される別の処理で利用者の年代や性別等を認識するために用いられる。

ステップＳ２３の後、コンピュータ４０は、メモリに顔情報が格納されているか否かを判定する。すなわち、第２画像から利用者の顔を検出できたか否かを判定する（ステップＳ２５）。利用者の顔を検出できていれば、カウント値Ｓをインクリメントして（ステップＳ２７）、ステップＳ２９に進む。一方、利用者の顔を検出できていなければステップＳ２７を経ることなくステップＳ２９に進む。

ステップＳ２９では、カウント値Ｉが画像数Ｎに達したか否かがコンピュータ４０によって判定される。カウント値Ｉが画像数Ｎに達していなければステップＳ１７に戻り、一方、カウント値Ｉが画像数Ｎに達していればステップＳ３１に進む。

ステップＳ３１では、カウント値Ｓが０か否かがコンピュータ４０によって判定される。カウント値Ｓが「０」であって複数（ここでは６００個）の第２画像から１回も利用者の顔を検出できていなければ、コンピュータ４０は、カウント値Ｉをリセットし（ステップＳ３３）、カウント値Ｉをインクリメントし（ステップＳ３５）、上部画像を第１バッファメモリ３６から取得する（ステップＳ３７）。ステップＳ３７では、検出対象画像に設定された複数（ここでは６００個）の上部画像のうち、第１バッファメモリ３６にＩ番目に格納された上部画像が取得される。そして、コンピュータ４０は、第２画像と同様に、取得した上部画像からテンプレートマッチングによって利用者の顔を検出する（ステップＳ３９）。すなわち、第１画像の所定部分からテンプレートマッチングによって利用者の顔を検出する。その後、コンピュータ４０はカウント値Ｉが画像数Ｎに達したか否かを判定し（ステップＳ４１）、カウント値Ｉが画像数Ｎに達していなければステップＳ３５に戻り、一方、カウント値Ｉが画像数Ｎに達していれば顔検出処理を終了する。ステップＳ３１において、カウント値Ｓが１以上であって複数の第２画像から１回でも利用者の顔を検出できていれば同様に顔検出処理を終了する。

このような自動販売機１０によれば、第１画像よりも画素数が小さい第２画像からの検出段階で利用者の顔を検出できれば、マッチング回数を大幅に減らすことができる。また、第２画像から顔を検出できなかった場合であっても、第１画像についてのテンプレートマッチングは所定部分（上部画像）のみである。これによって、第２画像におけるマッチング回数と第１画像の一部分である上部画像におけるマッチング回数とを合わせても、第１画像全体におけるマッチング回数よりも少なくできる。このようにマッチング回数を減らすことができるので、顔検出処理に要する負荷を軽減でき、顔検出処理の効率を向上できる。

カメラ３２が陳列部１２の下側にその高さが１１０ｃｍになるように配置されることによって、カメラ３２が利用者の目に付きにくくなり、利用者はカメラ３２をさほど意識することなく自動販売機１０を利用できる。また、このようにカメラ３２が低い位置（陳列部１２よりも下側）に設けられる場合、まず第２画像を用いて顔検出することによって、利用者の身長が低ければ特に顔検出処理を効率よく行える。

ここで、自動販売機１０におけるマッチング回数と、従来技術におけるマッチング回数とについて具体例を挙げて説明する。自動販売機１０および従来技術のいずれにおいても上述の５つのサイズのパッチを用いてテンプレートマッチングを行った場合のマッチング回数を以下の表１に示す。なお、従来技術のマッチング回数は、第１画像（縦３６０ピクセル×横４８０ピクセルの画像）全体についてテンプレートマッチングを行うことによって得たものである。また、各パッチのマッチング回数は、１回あたりの横方向への移動量および１回あたりの下方向への移動量を表１に示すように設定して得たものである。

表１を参照して、自動販売機１０において第２画像からの検出段階で利用者の顔を検出できればそのマッチング回数は３０８３７回となることがわかる。従来技術におけるマッチング回数の合計は７４３５５回であり、第２画像からの検出段階で利用者の顔を検出できれば従来技術に比べてマッチング回数を約５９％も削減できる。また、第２画像から利用者の顔を検出できなかった場合であっても、第２画像におけるマッチング回数と上部画像におけるマッチング回数との合計は６５０８５回であり、従来技術に比べてマッチング回数を１２％削減できる。このように自動販売機１０によれば、マッチング回数を減らすことができ、顔検出処理の効率を向上できることがわかる。

なお、カメラ３２の位置は上述の実施形態には限定されない。
たとえば、図８に示すように、利用者について設定された最高身長（Ｔ３：ここでは１９０ｃｍ）に基づいて、カメラ３２の高さＨ１がＴ３と等しくなるようにカメラ３２を設けてもよい。この場合、図１に破線で示すように、カメラ３２は、陳列部１２の上側に設けられるカメラ配置部４２に埋設される。また、図８に示すように、カメラ３２は、その軸（一点鎖線で示す）が水平方向に対して３０°程度下側に傾くように配置される。すなわち、カメラ３２は、３０°程度の俯角を有するように下側に傾けて陳列部１２の上側に配置される。このようにカメラ３２を陳列部１２の上側に設けることによって、利用者にカメラ３２をさほど意識させることなく自動販売機１０を利用させることができる。

この場合、陳列部１２の下側にカメラ３２を設ける場合とは反対に、利用者の身長が高いほど第１画像に写る利用者の顔が大きくなる。具体的には、利用者がカメラ３２の真正面に視点Ａから水平方向に距離Ｌ（ここでは３５ｃｍ）だけ離れた位置に立ったとすると、身長Ｔ１，Ｔ２およびＴ３であるときの視点Ａから利用者の顔の中心点Ｂまでの距離Ｄ４，Ｄ５およびＤ６はそれぞれ、約７８ｃｍ、約５３ｃｍおよび約３６ｃｍになる。その結果、利用者の身長がＴ１（最低身長）であるときに第１画像に写る利用者の顔の大きさは、利用者の身長がＴ３（最高身長）であるときに画像に写る利用者の顔の大きさの２分の１以下になる。

このようにカメラ３２を陳列部１２の上側に設ける場合は、図５に示す画像格納処理に代えて図９に示す画像格納処理を実行すればよい。そして、図９の画像格納処理によって第１バッファメモリ３６および第２バッファメモリ３８に格納した画像を用いて図１０に示す顔検出処理を実行すればよい。

図９を参照して、カメラ３２を陳列部１２の上側に設ける場合の画像格納処理について説明する。図９において図５と同一の処理については、同一の符号を付して重複する説明を省略する。

図９の画像格納処理では、ステップＳ５ａで第１画像の２分の１の画素数の下部画像が第２バッファメモリ３８に格納される。そして、ステップＳ７ａで上部画像の画素数が縦１８０ピクセル×横４８０ピクセル＝８６４００ピクセルから縦１２０ピクセル×横３２０ピクセル＝３８４００ピクセルに削減され、画素数が削減された上部画像（以下、削減済み上部画像という）がステップＳ９ａで第１バッファメモリ３６に格納される。

すなわち、図９の画像格納処理では、第１画像において顔が小さく写ると想定される下半分の部分（下部画像）を画素数が大きいまま第２バッファメモリ３８に格納する。一方、第１画像において顔が大きく写ると想定される上半分の部分の画素数を削減し、削減済み上部画像として第１バッファメモリ３６に格納する。

ついで、図１０を参照して、カメラ３２を陳列部１２の上側に設ける場合の顔検出処理について説明する。図１０において図６と同一の処理については、同一の符号を付して重複する説明を省略する。

図１０の顔検出処理では、ステップＳ１９ａで削減済み上部画像と下部画像とが取得される。そして、ステップＳ２１ａで、縦１２０ピクセル×横３２０ピクセルの削減済み上部画像と、縦１８０ピクセル×横４８０ピクセルの下部画像とが結合され、削減済み上部画像の横画素数（横サイズ）に合わせて縦２４０ピクセル×横３２０ピクセル＝７６８００ピクセルの第２画像が生成される。コンピュータ４０は、このように生成した第２画像についてステップＳ２３でテンプレートマッチングを行う。

その後、コンピュータ４０は、複数の第２画像から１回も利用者の顔を検出できていなければ、ステップＳ３７ａで第２バッファメモリ３８から下部画像を取得し、下部画像についてステップＳ３９でテンプレートマッチングを行う。

このような図９の画像格納処理および図１０の顔検出処理を実行することによって、カメラ３２の視点Ａを陳列部１２の上側に配置する場合も、表１と同様の結果を得ることができ、上述と同様の効果を奏することができる。

カメラ３２が陳列部１２の上側にその高さが１９０ｃｍになるように配置されることによって、カメラ３２が利用者の目に付きにくくなり、利用者はカメラ３２をさほど意識することなく自動販売機１０を利用できる。また、このようにカメラ３２が高い位置（陳列部１２よりも上側）に設けられる場合、まず第２画像を用いて顔検出することによって、利用者の身長が高ければ特に顔検出処理を効率よく行える。

なお、図５および図９の画像格納処理では、第１画像を分割して一方の画素数を削減する場合について説明したが、これに限定されない。第１画像全体をバッファメモリに格納してもよい。この場合、図６および図１０の顔検出処理において、当該第１画像の画素数を削減することによって第２画像を生成すればよい。また、当該第２画像から利用者の顔を検出できなければ、当該第１画像から所定部分を切り出して当該所定部分から利用者の顔を検出すればよい。

上述の実施形態では、第１バッファメモリ３６および第２バッファメモリ３８を用いる場合について説明したが、１つのメモリの領域を２つに区分し、それらに第１バッファメモリ３６および第２バッファメモリ３８と同様に画像を格納するようにしてもよい。

上述の実施形態では、第１画像において利用者の顔を検出する所定部分を第１画像の上半分（上部画像）または下半分（下部画像）とする場合について説明したが、所定部分はこれに限定されない。第１画像における所定部分の範囲（画素数）は、第２画像におけるマッチングの回数と所定部分におけるマッチング回数との和が第１画像全体におけるマッチング回数よりも少なくなれば任意に設定できる。

上述の実施形態ではテンプレートマッチングによって利用者の顔を検出する場合について説明したが、これに限定されない。たとえば統計的識別手法等によって利用者の顔を検出するようにしてもよい。この発明によれば、検索対象である画像の画素数が大きくなるほど負荷が大きくなるいずれの顔検出処理においても効率を向上できる。

上述の実施形態では、カメラ３２の視点Ａの高さを１１０ｃｍに設定する場合と１９０ｃｍに設定する場合とについて説明したが、カメラ３２の高さはこれらに限定されない。たとえば、カメラ３２の高さは、１００ｃｍ〜１３５ｃｍの範囲または１６５ｃｍ〜２００ｃｍの範囲で任意に設定できる。また、最低身長および最高身長についても上述の実施形態に限定されず、最低身長および最高身長は利用者の身長の統計に応じて適宜設定できる。

上述の実施形態では、カメラ３２が陳列部１２外に設けられる場合について説明したが、カメラ３２は陳列部１２内に設けられていてもよい。

この発明の一実施形態の自動販売機を示す外観図である。この発明の一実施形態の自動販売機の電気的構成を示すブロック図である。レンズの中心点を最低身長以下に設定した場合のカメラと利用者との位置関係を説明するための図解図である。利用者とカメラとの距離がＤ１，Ｄ２およびＤ３のときに得られる各画像を示す図解図である。この発明の画像格納処理の一例を示すフロー図である。この発明の顔検出処理の一例を示すフロー図である。テンプレートマッチングにおけるパッチの移動態様を説明するための図解図である。レンズの中心点を最高身長以上に設定した場合のカメラと利用者との位置関係を説明するための図解図である。この発明の画像格納処理の他の例を示すフロー図である。この発明の顔検出処理の他の例を示すフロー図である。

符号の説明

１０自動販売機
３２カメラ
３２ａレンズ
３４画像キャプチャ装置
３６第１バッファメモリ
３８第２バッファメモリ
４０コンピュータ

Claims

仰角または俯角を有するように配置されかつ利用者を撮像して第１画像を生成する撮像手段と、
前記第１画像に基づいて前記第１画像よりも画素数が小さい第２画像を生成する生成手段と、
前記第２画像から前記利用者の顔を検出する第１顔検出手段と、
前記第１顔検出手段の検出結果に基づいて前記第１画像の所定部分から前記利用者の顔を検出する第２顔検出手段とを備える、自動販売機。
前記第２顔検出手段は、前記第１顔検出手段が前記第２画像から前記利用者の顔を検出できなければ前記所定部分から前記利用者の顔を検出する、請求項１に記載の自動販売機。
前記撮像手段は、仰角を有して１００ｃｍ〜１３５ｃｍの高さに配置される、請求項１に記載の自動販売機。
前記撮像手段は、俯角を有して１６５ｃｍ〜２００ｃｍの高さに配置される、請求項１に記載の自動販売機。
商品見本が陳列される陳列部をさらに含み、
前記撮像手段は、前記陳列部よりも下側に設けられる、請求項１に記載の自動販売機。
商品見本が陳列される陳列部をさらに含み、
前記撮像手段は、前記陳列部よりも上側に設けられる、請求項１に記載の自動販売機。