次に本発明を実施するための形態について図面を参照して説明する。
<第1の実施の形態>
[1−1.データベースの作成]
従来、人物の顔における複数の特徴量及びこれらの分布に基づいて、当該人物の実際の年齢を推定するようになされた装置が提案されている。
しかしながら、実年齢とユーザの嗜好とが必ずしも一致するわけではなく、推測された実年齢の情報は、マーケティング用途として最適とはいえなかった。
本発明はこのような問題を解決するためになされたもので、その目的は、マーケティング用の情報として有用な情報を提供し得るデータベース作成装置及びデータベース作成プログラムを提供するものである。
図1は本発明によるデータベース作成システム1の一例を示している。データベース作成システム1は、顔画像取得手段としてのビデオカメラ2と、データベース作成装置としてのコンピュータ3とを有している。
ビデオカメラ2は、例えばカムコーダの他、WEBカメラなどの簡単な動画撮影装置が用いられる。ビデオカメラ2は、例えば会社の社員食堂などに許可を得て設置され、人物の顔画像を含む動画像データが撮影される。
コンピュータ3は、図示しないCPU(Central Processing Unit )、ROM(Read Only Memory)及びRAM(Random Access
Memory)から構成されるシステムコントローラ11がコンピュータ3の全体を統括的に制御するようになされている。システムコントローラ11は、フラッシュメモリ、ROM又はハードディスクドライブ等の記憶部12に格納されている基本プログラムやデータベース作成プログラム等をRAMに展開することによって、これらのプログラムに基づいて各種処理や後述するデータベース作成処理を実行するようになされている。
このコンピュータ3は、メモリカードスロットやケーブル端子、無線通信受信部などの外部インターフェース13を介して接続された外部操作部14の操作によりユーザから各種要求がなされた場合、当該要求に応じて生成される要求信号を、外部インターフェース13を介してシステムコントローラ11へ供給するようになされている。また、システムコントローラ11は、各種プログラムに基づいて画面データを生成し、外部インターフェース13を介して接続された表示部4に供給することにより、表示部4に種々の画面を表示させるようになされている。
例えば、データベース作成プログラムの起動要求を表す操作信号が外部インターフェース13から供給されると、システムコントローラ11は、データベース作成処理を実行する。
具体的に、コンピュータ3のシステムコントローラ11は、ユーザの操作部に対する操作に応じて、表示部4に開始画面(図示せず)を表示する。開始画面では、顔画像データの取得ボタンと、見かけ情報入力ボタンが表示されている。システムコントローラ11は、顔画像データの取得ボタンが操作されたことを認識すると、動画像入力画面(図示せず)を表示する。動画像入力画面では、入力される動画像データの履歴情報の入力欄と、動画像データの入力を開始するための開始ボタンが設けられている。
履歴情報の入力欄には、動画像データが撮影された撮影場所・年月が入力されることが想定されている。あらかじめ記憶部11には、撮影場所と地域と職業とを関連づけた履歴情報データベースが記憶されている。例えば、撮影場所が××銀行の虎ノ門支店の社員食堂と入力されると、システムコントローラ11は、履歴情報データベースを読み出し、職場が存在する地域「東京」、職業「銀行」、年月「2012年7月」を履歴情報と認識する。
システムコントローラ11は、ユーザの操作に応じて開始ボタンが操作されたことを認識すると、メモリカードやビデオカメラ2などの外部の記憶部から動画像データを取得する。システムコントローラ11は、動画像データを取得すると、動画像データから人物の顔を検出し、顔画像領域のみを切り出し、顔画像データを生成する。人物の顔の検出は、全てのコマに対して行っても良いが、一定間隔で行うことにより、システムコントローラ11の処理負荷を軽減できるため好ましい。
システムコントローラ11は、顔画像データから特徴量を抽出して比較することにより、同一人物について一つだけの顔画像データを選定し、履歴情報と関連づけて記憶部12に記憶する。
このように、コンピュータ3は、入力された動画像データから顔画像データを取得し、履歴情報と関連づけて記憶部12に記憶するようになされている。
一方、システムコントローラ11は、開始画面において見かけ情報入力ボタンが操作されたことを認識すると、記憶部12に記憶されている顔画像データ及び履歴情報を読み出し、顔表示画面データを生成する。この結果、図3に示すように、表示部4には、顔表示画面21が表示される。顔表示画面21には、人物の顔画像22と、履歴情報23、見かけ年齢入力欄24、見かけ性別入力欄25及び決定ボタン26が設けられている。
システムコントローラ11は、見かけ年齢入力欄24及び見かけ性別入力欄25にそれぞれ見かけ年齢と見かけ性別が入力されたことを認識すると、例えば決定ボタン26を点滅表示やフォーカス表示させることにより、決定ボタン26の操作を促す。システムコントローラ11は、ユーザの決定ボタン26に対する操作に応じて、表示された顔画像データと入力された見かけ年齢及び見かけ性別(以下、これを入力見かけ情報と呼ぶ)を関連づけて記憶部12に記憶する。
そしてシステムコントローラ11は、次の顔画像データを記憶部12から読み出して、当該顔画像データが表示された顔表示画面21を表示部4に表示させ、当該次の顔画像データに対する入力見かけ情報をユーザに入力させる。
システムコントローラ11は、顔画像データに対する入力見かけ情報が所定の入力回数(例えば5回)だけ入力されると、登録見かけ情報として、登録見かけ年齢及び登録見かけ性別を決定する。システムコントローラ11は、登録見かけ年齢として、入力された見かけ年齢の平均値を算出する。
平均値は、例えば入力された見かけ年齢の合計値を入力回数で除算した平均値や、最大値及び最小値を除いた平均値として算出される。また、入力者に応じて重み付けを行った後に平均値が算出されても良い。
システムコントローラ11は、登録見かけ性別を、例えば入力見かけ性別の多数決によって判別する。なお、この多数決も、入力者に応じた重み付けの後に行われるようにしても良い。これらの重み付けは、例えば見かけ情報データベースを使用する地域に住む入力者には重く、異なる地域に住む入力者には軽くなるように行われる。
これにより、見かけ情報データベースを使用する地域に住む人の目からみた入力見かけ年齢及び入力見かけ性別を優先できるため、登録見かけ年齢及び登録見かけ性別の精度を向上させ得る。
システムコントローラ11は、当該顔画像データから特徴量を抽出し、登録見かけ情報及び履歴情報と共に、当該特徴量を登録顔特徴量として見かけ情報データベースに登録する。このときシステムコントローラ11は、顔画像データ及び顔画像データに関連づけられた全情報を記憶部12から削除する。これにより、システムコントローラ11は、顔画像データを二度と表示できないため、顔画像データの元となる人物のプライバシーを保護することが可能となる。
このように、コンピュータ3は、人物の顔の特徴量及び登録見かけ情報が関連づけられた見かけ情報データベースを作成するようになされている。これにより、人物の顔の特徴量から、見かけ年齢及び性別を検出することが可能となる。
ここで、実際は男性であっても女装している人物は、女性用の被服を購入する。また、見かけ年齢が若い人物は、若い服装を好み、見かけ年齢が高い人物は、年齢の高い服装を好む傾向がある。従って、見かけ年齢及び性別を判別することにより、実年齢や実際の性別よりもマーケティング的に有用な情報を得ることが可能となる。従って、見かけ情報データベースは、マーケティング用に有用な情報を与えることが可能である。
このように、本発明のデータベース作成装置は、人物の顔画像を含む画像データを取得する取得手段と、人物の顔画像に対する見かけ年齢及び見かけ性別を、複数人に対して入力させる入力手段と、複数人から入力された見かけ年齢の平均値に基づいて、顔画像についての見かけ年齢を決定する見かけ年齢決定手段と、複数人から入力された見かけ性別に基づいて、顔画像についての見かけ性別を決定する見かけ性別決定手段と、画像データから、顔画像の特徴量である顔特徴量を抽出する特徴量抽出手段と、見かけ年齢及び見かけ性別を、顔特徴量と関連付けて記憶する記憶手段とを有するようにした。
これにより、データベース作成装置は、人物の顔についての顔特徴量と、当該人物の顔についての複数人による統合的な見かけ年齢及び性別とを関連付けることができるため、偏りのない見かけ年齢及び性別を顔特徴量に関連付けることができる。このため、このデータベースを使用することにより、偏りのない見かけ年齢及び性別を検出することが可能となる。
また、本発明のデータベース作成プログラムは、人物の顔画像を含む画像データを取得する取得ステップと、人物の顔画像に対する見かけ年齢及び見かけ性別を、複数人に対して入力させる入力ステップと、複数人から入力された見かけ年齢の平均値に基づいて、顔画像についての見かけ年齢を決定する見かけ年齢決定ステップと、複数人から入力された見かけ性別に基づいて、顔画像についての見かけ性別を決定する見かけ性別決定ステップと、画像データから、顔画像の特徴量である顔特徴量を抽出する特徴量抽出ステップと、見かけ年齢及び見かけ性別を、顔特徴量と関連付けて記憶する記憶ステップとを有するようにした。
これにより、データベース作成プログラムは、人物の顔についての顔特徴量と、当該人物の顔についての複数人による統合的な見かけ年齢及び性別とを関連付けることができるため、偏りのない見かけ年齢及び性別を顔特徴量に関連付けることができる。このため、このデータベースを使用することにより、偏りのない見かけ年齢及び性別を検出することが可能となる。
本発明のデータベース作成装置及びデータベース作成プログラムは、人物の顔についての顔特徴量と、当該人物の顔についての複数人による統合的な見かけ年齢及び性別とを関連付けることができるため、偏りのない見かけ年齢及び性別を顔特徴量に関連付けることができる。このため、このデータベースを使用することにより、偏りのない見かけ年齢及び性別を検出することが可能となり、マーケティング用途として有益な情報を供給することができる。
[1−2.データベース作成処理手順]
次に、データベース作成プログラムに従って実行されるデータベース作成処理について、図4及び図5に示すフローチャートを用いて説明する。
コンピュータ3は、ユーザの操作に応じて、データベース作成プログラムを起動する。コンピュータ3は、ユーザの操作に応じて動画像データの取得処理が選択されたことを認識すると、動画像データ取得処理手順RT1を開始し、次のステップSP1へ移る。
ステップSP1において、コンピュータ3は、履歴情報及び動画像データを取得すると、次のステップSP2へ移る。
ステップSP2において、コンピュータ3は、動画像データから人物の顔領域の検出を行い、顔画像データを抽出すると、次のステップSP3へ移る。
ステップSP3において、コンピュータ3は、ステップSP1において取得した履歴情報及びステップSP2において抽出した顔画像データを記憶すると、終了ステップへ移り、処理を終了する。
一方、コンピュータ3は、ユーザの操作に応じて見かけ情報決定処理が選択されたことを認識すると、見かけ年齢情報処理手順RT2を開始し、次のステップSP11へ移る。
ステップSP11において、コンピュータ3は、履歴情報及び顔画像データを表示し、ユーザに対して見かけ年齢及び性別を入力させると、次のステップSP12へ移る。
ステップSP12において、コンピュータ3は、顔画像データに対する見かけ年齢及び性別が所定の入力回数だけ入力されたか否かについて判別する。ここで否定結果が得られた場合、次のステップSP13へ進む。
ステップSP13において、コンピュータ3は、顔画像データに関連づけて入力見かけ情報を記憶すると、終了ステップへ移り、処理を終了する。
これに対して、ステップSP12において肯定結果が得られた場合、次のステップSP14へ進む。ステップSP14において、コンピュータ3は、顔画像データから登録顔
特徴量を抽出し、次のステップSP15へ移る。
ステップSP15において、コンピュータ3は、入力見かけ年齢の平均値を登録見かけ年齢として算出すると共に、入力見かけ性別の多数決により登録見かけ性別を決定する。コンピュータ3は、これらの登録見かけ情報を登録顔特徴量及び履歴情報と共に見かけ情報データベースに登録すると、次のステップSP16へ移る。
ステップSP16において、コンピュータ3は、例えば顔画像データの削除により顔画像データに対する表示を禁止する処理を行うと、終了ステップへ移って処理を終了する。
[1−3.表情情報の生成]
従来、ビデオカメラで撮影した撮影データから人物を検出し、人数をカウントするようになされた人数判断装置が提案されている(例えば特許文献1参照)。
しかしながら、撮影された人物の人数をカウントするだけでなく、人物の表情を情報として取得したいという要望があった。
本発明は以上の点を考慮してなされたもので、人物の表情に関して有益な情報を生成できる表情情報生成方法及び表情情報生成プログラムを提供しようとするものである。
図6は本発明による表情情報生成システム51の一例を示している。表情情報生成システム51は、人物画像取得手段としてのビデオカメラ52と、表情情報生成装置としてのコンピュータ53とを有している。
ビデオカメラ52は、例えばカムコーダの他、WEBカメラなどの簡単な動画撮影装置が用いられる。ビデオカメラ52は、例えばレストランなどの出入り口に設置され、人物の顔画像を含む動画像データが撮影される。
コンピュータ53は、図示しないCPU(Central Processing Unit)、ROM(Read Only Memory)及びRAM(Random Access
Memory)から構成されるシステムコントローラ61がコンピュータ53の全体を統括的に制御するようになされている。システムコントローラ61は、フラッシュメモリ、ROM又はハードディスクドライブ等の記憶部62に格納されている基本プログラムやマーケティング情報取得処理等をRAMに展開することによって、これらのプログラムに基づいて各種処理や後述する表情情報生成処理を実行するようになされている。
このコンピュータ53は、外部インターフェース63を介して接続された外部操作部55の操作によりユーザから各種要求がなされた場合、外部インターフェース63を介して外部操作部55からの要求信号をシステムコントローラ61へ供給するようになされている。また、システムコントローラ61は、各種プログラムに基づいて表示用の画面データを生成し、外部インターフェース63を介して接続された表示部54に供給することにより、表示部54に種々の画面を表示させるようになされている。
例えば、表情情報生成プログラムの起動要求を表す操作信号が外部インターフェース63から供給されると、システムコントローラ61は、表情情報生成処理を実行する。
具体的に、コンピュータ53のシステムコントローラ61は、ユーザの外部操作部55に対する操作に応じて、表情情報生成処理を開始し、無線又は有線で接続されたビデオカメラ52に対し、動画像データを供給する旨のデータ要求信号を送出する。システムコントローラ61は、データ要求信号に応じて動画像データが供給されると、動画像データから人物の検出を行う。
システムコントローラ61は、例えばエッジ検出により人物の上半身に相当する形(すなわち人型)を検出すると、当該上半身の頭部について、顔の検出を行う。顔の検出は、例えば肌色・目・口などの検出により実行される。システムコントローラ61は、上半身及び顔を検出できた場合、検出された上半身が人物であると認識し、人物数としてカウントする。
システムコントローラ61は、検出された顔から特徴量を抽出する(以下、これを検出顔特徴量と呼ぶ)。システムコントローラ61は、予め記憶部62に記憶された見かけ情報データベースを読み出す。
検出顔特徴量と見かけ情報データベースに登録された登録顔特徴量と照合し、最も近い一の登録顔特徴量を選択する。システムコントローラ61は、選択された登録顔特徴量に関連づけられた登録見かけ情報を検出された人物の検出見かけ年齢及び検出見かけ性別(以下、これらをまとめて検出見かけ情報と呼ぶ)として決定する。また、登録見かけ情報に対してしわや肌の状態などの年齢を決定する年齢特定因子によって補正を行い、当該補正された値を検出見かけ情報としてもよい。
ここで、システムコントローラ61は、予めユーザに照合対象となる照合条件を設定させておくと共に、見かけ情報データベースに登録された履歴情報を照会し、照合条件と合致する登録顔特徴量のみ、照合対象とすることができる。
見かけ年齢は地域や職種などに応じて変化する。システムコントローラ61は、検出される人物の撮影場所(すなわち、居住地や職業)に応じた登録顔特徴量のみを照合対象とすることができる。このため、システムコントローラ61は、検出見かけ情報の精度を向上させることができると共に、照合対象となる登録顔特徴量の数を減少させて、照合の処理負荷を軽減できる。
システムコントローラ61は、上半身をトラッキングすることにより、人物の同一性を確認しながら、当該人物の表情を検出する。システムコントローラ61は、数コマごとに眉毛の角度、目尻の角度、口角の角度、目尻のしわ、歯の露出度、口の大きさなどにより、笑顔度を算出する。笑顔度は、例えば5段階、10段階などのような複数段階に振り分けられることにより、又はパーセンテージなどによって表現される。
例えば、システムコントローラ61は、眉毛の角度、目尻の角度、口角の角度を検出し、それぞれ重み付けをした上で平均値を算出、正規化することにより、パーセンテージによって笑顔度を算出する。
このとき、システムコントローラ61は、例えば、検出された人物の顔を枠で囲むと共に、コマごとに検出された笑顔度を数値及びグラフで枠の隣に笑顔度表示として表示するよう、検出画像データを生成し、これを動画像データに重畳して表示用の画面データを生成する。
ここで、システムコントローラ61は、検出見かけ年齢及び検出見かけ性別をグループ分けし、色分けした検出画像データを生成しても良い。例えば、20歳代男性、20歳代女性、30歳代男性、30歳代女性、40歳代男性、40歳代女性、50歳以上男性、50歳以上女性というように、グループ化することができる。このグループ分けは、マーケティング情報としての有用性に応じて適宜行われることが好ましい。
色分けは、例えば男性を青系、女性を赤系というように系統立てて行うことにより、人物のグループを認識させやすくなり、好ましい。また、マーケティング情報として重要なグループのみ特定の配色を行うことにより、重要なグループに属する人物のみを浮き立たせて表示することができる。
この結果、表示部54には、図8に示すように、人物の顔として検出されたことを表す枠71及び当該検出された人物の笑顔度を表す笑顔度表示72が表示される。これにより、ユーザはリアルタイムで顧客の満足度を知ることが可能となる。
システムコントローラ61は、各人物における笑顔度の平均値(以下、これを笑顔平均値と呼ぶ)を算出すると共に、笑顔平均値が所定の閾値以上であるか否かによって、当該人物が笑顔であったか否かについて判別する。そして、システムコントローラ61は、人物の顔が検出された時間、検出見かけ情報、並びに笑顔の有無を関連づけて記憶する。
このように、コンピュータ53は、表情情報生成処理により、撮影した動画像データから人物数をカウントすると共に、人物の検出見かけ情報、並びに笑顔の有無を関連づけて記憶するようになされている。
コンピュータ53のシステムコントローラ61は、ユーザの操作部に対する操作に応じて、マーケティング情報表示処理を開始する。
具体的に、システムコントローラ61は、ユーザの指定した日の、指定した時間帯において、人物数、検出見かけ情報、及び笑顔の有無を集計し、表示画面データを生成し、外部インターフェース63を介して表示部54に供給する。この結果、表示部54には、例えばグラフ表示やリスト表示により、集計結果が表示される。
これにより、ユーザは、ユーザの指定した日の、指定した時間帯において、何人の人物がその地点を通過したか、通過した人物の検出見かけ年齢及び検出見かけ性別、そしてどのくらいの割合の人物が笑顔であったかを簡単に知ることができる。
[1−4.データベース作成処理手順]
次に、表情情報生成プログラムに従って実行される表情情報生成処理について、図9に示すフローチャートを用いて説明する。
コンピュータ53は、ユーザの操作に応じて、表情情報生成プログラムを起動する。コンピュータ53は、ユーザの操作に応じて動画像データの取得処理が選択されたことを認識すると、マーケティング情報処理手順RT3を開始し、次のステップSP31へ移る。
ステップSP31において、コンピュータ53は人物を検出すると、次のステップSP32へ移る。
ステップSP32において、コンピュータ53は人物の数をカウントするカウンタを「1」加算すると、次のステップSP33へ移る。
ステップSP33において、コンピュータ53は、検出した人物の検出顔特徴量と、見かけ情報データベースに登録されている登録顔特徴量とを比較し、最も近い一の登録顔特徴量から検出見かけ年齢及び検出見かけ性別を決定すると、次のステップSP34へ移る。
ステップSP34において、コンピュータ53は、検出した人物についての笑顔平均値を算出すると、次のステップSP35へ移る。
ステップSP35において、コンピュータ53は、ステップSP34において算出した笑顔平均値が閾値以上であるか否かについて判別する。ここで、肯定結果が得られた場合、コンピュータ53は、次のステップSP36へ移り、検出した人物が笑顔であったと決定し、次のステップSP38へ移る。
一方、ステップSP35において否定結果が得られた場合、コンピュータ53は、次のステップSP37へ移り、検出した人物が笑顔でなかったと決定し、次のステップSP38へ移る。
ステップSP38において、コンピュータ53は、ステップSP33において決定した検出見かけ年齢及び検出見かけ性別、並びにステップSP36及び37で決定した笑顔の有無を記憶すると、次のステップSP39へ移る。
ステップSP39において、コンピュータ53は、ユーザの操作に応じて処理の終了が要求されたか否かを判別し、否定結果が得られた場合、ステップSP31へ戻って処理を継続する。
これに対し、ステップSP39において肯定結果が得られた場合、終了ステップへ移ってマーケティング情報処理手順RT3を終了する。
[1−5.動作及び効果]
以上の構成によれば、データベース作成装置としてのコンピュータ3は、人物の顔画像を含む画像データを取得する取得手段、及び外部操作部14を介して、人物の顔画像に対する見かけ年齢及び見かけ性別を複数人に対して入力させる入力手段としての外部インターフェース13を有している。
また、コンピュータ3は、複数人から入力された見かけ年齢の平均値に基づいて、顔画像についての見かけ年齢を決定する見かけ年齢決定手段、複数人から入力された見かけ性別に基づいて、顔画像についての見かけ性別を決定する見かけ性別決定手段、及び画像データから、顔画像の特徴量である顔特徴量を登録顔特徴量として抽出する特徴量抽出手段としてのシステムコントローラ11を有している。
さらに、コンピュータ3は、見かけ年齢及び見かけ性別を登録見かけ年齢及び登録見かけ性別として、登録顔特徴量と関連付けて記憶する記憶手段としての記憶部12とを有している。
これにより、コンピュータ3は、人物の顔画像についての見かけ年齢及び見かけ性別を、複数人による公正な判断により決定することができるため、ゆるぎない見かけ年齢及び見かけ性別を登録顔特徴量と関連付けて記憶した見かけ情報データベースを作成することができる。
また、コンピュータ3のシステムコントローラ11は、人物に関する履歴情報を取得する。これにより、コンピュータ3は、居住地や職業など、見かけ年齢や見かけ性別を左右する因子を見かけ情報及び登録顔特徴量と関連付けて見かけ情報データベースを作成することができる。このため、ユーザが見かけ情報データベースを用いることにより、履歴情報ごとに見かけ年齢や見かけ性別を判別することが可能となり、見かけ年齢や見かけ性別の判別精度を高めることが可能となる。
さらに、システムコントローラ11は、複数人に対する見かけ年齢及び見かけ性別の入力後、すなわち入力回数だけ入力見かけ情報が入力された後、顔画像データを消去することにより、人物の顔画像である顔画像データの表示を禁止する。
これにより、コンピュータ3は、見かけ情報データベースへの登録後には顔画像データを保存する必要がないため、記憶部12の記憶容量を節約できると共に、不要な顔画像データの保存により、撮影された人物のプライバシーを確実に守ることができる。
コンピュータ3は、履歴情報としてGPS情報を取得するようにした。これにより、ユーザに入力作業をさせる必要がなく、かつ信頼性の高い情報を得ることができる。
コンピュータ3は、インターネットを介して画像データ及び履歴情報を取得するようにした。これにより、コンピュータ3は、不特定多数の大人数から容易に像データ及び履歴情報を集めることが可能となる。
また、システムコントローラ11は、履歴情報として、撮影年月のみを見かけ情報データベースに記憶するようにした。これにより、コンピュータ3は、人物の存在した詳細な日時を残さないため、撮影された人物のプライバシーを確実に守ることができる。
さらに、表情情報生成装置としてのコンピュータ53は、動画像データを取得する取得手段としての外部インターフェース63を有している。
また、コンピュータ53は、動画像データから人物を検出する人物検出手段と、検出された人物の顔から表情を検出する表情検出手段と、特定の時間ごとに、表情としての笑顔度の有無と、人物の数とを統計する統計手段としてのシステムコントローラ61を有している。
さらに、コンピュータ53は、人物の数と、表情と、表情が検出された日時とを関連付けて記憶する記憶手段としての記憶部62を有している。
これにより、コンピュータ53は、ユーザの要求に応じて特定の時間ごとに笑顔の有無及び人物の数を統計することができるため、顧客の満足度や営業マンの接客態度など、非常に有益な情報をユーザに与えることができる。
システムコントローラ61は、検出された人物の顔である顔画像データから検出顔特徴量を抽出し、当該検出顔特徴量を見かけ情報データベースに登録された登録顔特徴量と照合して年齢及び性別としての検出見かけ年齢及び検出見かけ性別を判別する。そして、システムコントローラ61は、ユーザの要求に応じて、検出見かけ年齢及び検出見かけ性別、若しくは検出見かけ年齢及び検出見かけ性別ごとに笑顔の有無と人物の数とを統計する。
これにより、システムコントローラ61は、年齢や性別に応じた顧客の満足度を統計することができ、マーケティング情報として非常に有益な情報をユーザに与えることができる。
システムコントローラ61は、所定間隔で笑顔度を算出し、当該笑顔度の平均値である笑顔平均値に基づいて、人物の笑顔度合いである笑顔の有無を判別する。
これにより、システムコントローラ61は、笑顔度合いを単純化して統計することができるため、わかりやすい情報をユーザに与えることができる。
さらに、コンピュータ53は、動画像データから人物を検出し、検出された人物の顔から表情を検出する表情検出手段と、人物の年齢及び性別を検出情報である検出見かけ情報として決定する検出情報決定手段と、検出みかけ情報に対応して色分けされた枠、及び表情の度合いである笑顔度を、動画像データにおける人物の動きに対応させるよう画面データを生成する画面データ生成手段としてのシステムコントローラ61を有している。
これにより、コンピュータ53は、検出みかけ情報に対応して色分けされた枠71を表示することができるため、ユーザに人物の年齢及び性別を一目で視認させることができ、ユーザに対して人物の年齢及び性別と、笑顔度との関係をわかりやすく視認させることができる。
さらに、コンピュータ53は、枠71の隣に笑顔度を表す笑顔度表示72をグラフ化して表示する。これにより、コンピュータ53は、ユーザに対して笑顔度を一目で視認させることができ、ユーザに対して人物の年齢及び性別と、笑顔度との関係を一段とわかりやすく視認させることができる。
システムコントローラ61は、検出情報として、見かけ年齢及び見かけ性別を決定することにより、顧客の購入意欲に直結する見かけ年齢及び見かけ性別を人物の年齢及び性別とすることができる。これにより、コンピュータ53は、画面データのマーケティング情報としての有益性を一段と高めることができる。
システムコントローラ61は、枠71及び笑顔度表示72を、動画像データに重畳して画面データを生成する。これにより、コンピュータ53は、実際の顔画像データと共に人物の年齢及び性別と、笑顔度との関係を表示部54に表示させることができるため、画面データのマーケティング情報としての有益性を一段と高めることができる。
<第2の実施の形態>
図10〜13に示す第2の実施の形態においては、図1〜図9に示す第1の実施の形態と対応する箇所に同一符号を附して示し、同一部分についての説明を省略する。第2の実施の形態では、履歴情報としてGPS(Global Positioning System)による位置情報を利用する点、人物の動く方向を検出する点、表情情報生成処理において得られた顔画像データを用いて見かけ情報データベースを更新する点が第1の実施の形態と異なっている。
[2−1.データベース作成処理]
第2の実施の形態におけるデータベース作成処理では、GPSによる位置情報を使用して自動的に履歴情報を取得する。
具体的に、ビデオカメラ102は、例えば街角などの任意の場所に設置され、人物の顔画像を含む動画像データが撮影される。このビデオカメラ102には、GPS機能が搭載されており、撮影された場所の位置情報を自動的に取得可能である。また、ビデオカメラに対して外付けのGPS端末を接続しても良い。
動画像データ取得処理において、コンピュータ103のシステムコントローラ111は、ユーザの操作部に対する操作に応じて、表示部4に開始画面(図示せず)を表示する。システムコントローラ111は、ビデオカメラ102から供給される位置情報から撮影場所が存在する地域を特定し、当該撮影場所と撮影日時を履歴情報として認識する。この地域は、例えば「東京」「大阪」や、「東京都中央区」「広島市」、「中国地方」「関東地方」、「日本」「ヨーロッパ」など、都道府県や市町村、地方、国や世界的地域など、予め定められたグループとなることが好ましい。
これにより、システムコントローラ111は、自動的に履歴情報を認識することができるため、ユーザに対して履歴情報の入力を必要とさせず、ユーザの手を煩わせずに済む。
このように、コンピュータ103は、GPSによって取得される位置情報を履歴情報として利用するようになされている。
一方、見かけ情報決定処理において、システムコントローラ111は、顔画像データに対して入力見かけ情報が所定の入力回数だけ入力されると、顔画像データに対し、表示禁止を示すフラグを立てる。これにより、システムコントローラ11は、顔画像データを表示できないため、顔画像データの元となる人物のプライバシーを保護することが可能となる。また、入力回数が変更された場合にのみ、顔画像データを表示可能に設定することにより、入力回数の設定が変更された場合にも対応することができる。
[2−2.表情情報生成処理]
第2の実施の形態における表情情報生成処理では、図10に示すように、ビデオカメラ52から取得された動画像データから人物の進む方向を検出するようになされている。
システムコントローラ161は、人物の上半身に相当する形を検出すると、当該上半身の頭部について、顔の検出を行う。システムコントローラ61は、上半身及び顔を検出できた場合、検出された上半身が人物であると認識し、人物数としてカウントする。
システムコントローラ161は、人物の上半身のトラッキングを行い、画面上において人物の上半身が最初に検出された初期検出地点と、最後に検出された終期検出地点とをつないだ方向を動き方向として検出する。具体的に、図11に示すように、システムコントローラ161は、人物の上半身の中心点(以下、これを動き基準点と呼ぶ)SPを算出し、当該中心点の移動ベクトルから、動き方向を検出する。
この動き方向は、例えば、その角度により、前後左右の4方向として認識される。なお、動き基準点SPは、人物の中で固定可能な基準となる点であれば良く、例えば顔の中心点や、目・口などを動き基準点とすることもできる。なお、この動き方向は、必ずしも4方向である必要はなく、角度に応じて2方向以上に認識されれば良い。
ビデオカメラ52を人物の高さよりも上方向に配置した場合、ビデオカメラ52と人物との距離に応じて撮影角度が変化するため、図12に示すように、画面上下方向に移動することになる。このため、システムコントローラ161は、動き基準点SPが上から下方向へ移動した場合には、人物が前方向へ移動、逆に下から上方向へ移動した場合には人物が後ろ方向へ移動したと認識することができる。
これに対して、ビデオカメラ52を人物の高さと同じ高さに設置した場合、図13に示すように、人物が前後方向に移動したときに動き基準点SPが殆ど変化しない。そこで、システムコントローラは、動き基準点SPが殆ど変化しない場合には、人物の大きさによって動き方向を判断する。
具体的に、システムコントローラ161は、検出された人物の動き方向が人物の目玉の間隔を検出し、当該間隔の変化率によって、人物が前と後ろのどちらに移動したかを判別する。また、人物の上半身や顔・口などの大きさの変化率によっても同様に人物が前と後ろのどちらに移動したかを判別することが可能である。
そして、システムコントローラ161は、人物の検出見かけ情報、並びに笑顔の有無に加え、動き方向を関連づけて記憶する。
システムコントローラ161は、ユーザの要求に応じて、見かけ情報表示処理を開始すると、動き方向ごとに人物の検出見かけ情報、並びに笑顔の有無を集計し、画面データを生成する。
これにより、ユーザは、例えばショッピングセンターの分岐地点において、動き方向ごとに人物の見かけ年齢及び見かけ性別、並びに笑顔の有無を知ることができ、移動する方向に対するみかけ情報や、笑顔の有無を簡単に知ることができる。
[2−3.データベース更新処理]
表情情報生成処理において、システムコントローラ161は、取得した動画像データを所定の期間(例えば1週間)だけ記憶しておく。
そしてシステムコントローラ161は、ユーザの操作部に対する操作に応じて、記憶部62に記憶されている動画像データを読み出し、データベース作成処理を実行する。
これにより、システムコントローラ161は、逐次見かけ情報データベースを更新することができ、一段と多くの登録顔特徴量に基づいて検出見かけ年齢及び性別を判別できるため、検出見かけ年齢及び性別の判別の精度を向上することができる。
一般的に、見かけ年齢は、判断する人の年齢に対するイメージに左右されるため、地域や場所の特性によって大きく変化する。例えば、東京の銀座では、ファッションや化粧に気を遣うため若作りな人物が多く、相対的に見かけ年齢は大きくなる。一方、東北の農村では、見かけ年齢は小さくなる。
データベース更新処理において、システムコントローラ161は、実際にショッピングセンターに足を運んだ顧客の顔画像データを使用して、当該ショッピングセンターの近くに住む従業員などの目線で見かけ年齢を判断し、入力見かけ年齢とすることができる。このため、システムコントローラ161は、地域の特性に見合った見かけ情報データベースを作成することが可能となり、検出見かけ年齢及び性別の判別の精度を向上することができる。
なお、システムコントローラ161は、表情情報生成処理において取得した動画像データの代わりに、人物から検出された顔を切り出した顔画像データのみを記憶することもできる。記憶される顔画像データは、データ容量の観点から、同一人物に対して1枚だけ選択される。なお、システムコントローラ161は、顔の角度(正面、横向きなど)を検出し、角度の異なる顔画像データを同一人物に対して複数枚記憶することも可能である。
これにより、システムコントローラ161は、動画像データを記憶する場合と比較して、格段に記憶容量を節約することが可能である。
[2−4.動作及び効果]
以上の構成によれば、コンピュータ153のシステムコントローラ161は、外部インターフェース63を介して履歴情報としてGPS情報を取得する。
これにより、コンピュータ153は、ユーザに履歴情報を入力させることなく、見かけ情報データベースに対して自動的に履歴情報を登録することができる。
また、システムコントローラ161は、人物の移動する方向を検出し、移動方向及び特定の時間ごとに、笑顔の有無と人物の数とを統計する。
これにより、コンピュータ153は、例えば出口方向に向かう人物や、フードコートの特定の店に向かう人物など、特定の方向へ向かう人物ごとに笑顔の有無と人物の数とを統計できるため、マーケティング情報としての有用性を一段と高めることができる。
さらに、システムコントローラ161は、表情情報生成処理で取得した顔画像データに対してデータベース生成処理を実行し、見かけ情報データベースを更新する。
これにより、コンピュータ153は、見かけ情報データベースが使用される地域に住む人物の顔に基づいて、マーケティング情報を使用するユーザの視点から入力される入力見かけ情報に基づいて見かけ情報データベースを更新することができる。このため、コンピュータ153は、各地域における見かけ情報の特徴を見かけ情報データベースに反映させることができ、見かけ情報の判別の精度を高めることができる。
<第3の実施の形態>
図14〜15に示す第3の実施の形態においては、図1〜図9に示す第1の実施の形態と対応する箇所に同一符号を附して示し、同一部分についての説明を省略する。第3の実施の形態では、データベース作成処理においてインターネットを介して顔画像データの元となる画像データを取得する点と、表情情報生成処理において複数のビデオカメラ52を設置して人物認識を行う点が、第1の実施の形態と異なっている。
[3−1.データベース作成処理]
図14に示すように、データベース作成システム201では、コンピュータ203がインターネット220に接続されている。データベース作成システム201では、例えばアンケート回答サイトやホームページの募集サイトなどを開設、又はアプリケーションを配信することにより、個人情報端末221から顔画像データの元となる動画像データ又は静止画像データ、並びに履歴情報を取得する。
個人情報端末221としては、パーソナルコンピュータやスマートフォン、携帯電話、タブレット端末など、インターネットなどのネットワークに接続可能な端末であれば制限はない。個人情報端末221は、ビデオカメラなどの撮影装置又は個人情報端末221に予め備えられた撮影機能を用いて撮影された動画像データ又は静止画像データを履歴情報と共にアンケート回答サイトに供給する。
コンピュータ203は、インターネット220を介してアンケート回答サイトから動画像データ又は静止画像データ、並びに履歴情報を取得すると、顔画像データを生成し、これを記憶部62に記憶する。
このように、コンピュータ203は、インターネットを介して顔画像データの元となる画像データを取得する。これにより、コンピュータ203は、わざわざビデオカメラ52を設置しなくても、世界各所に住む人々の顔画像データを取得することができる。
[3−2.表情情報生成処理]
図15に示すように、表情情報生成システム251では、ネットワーク270を介して複数台(例えば4台)のビデオカメラ52(52A〜52D)とコンピュータ253とが接続されている。
ビデオカメラ52は、例えば遊園地の各アトラクションの出口に設置され、アトラクションを終了して出てきた顧客を撮影する。
コンピュータ253のシステムコントローラ261は、4台のビデオカメラ52から供給される動画像データから、人物の検出を行うと、処理対象となる人物に対し、検出顔特徴量の抽出、検出見かけ情報の決定、笑顔の有無の判別を行う。そして、システムコントローラ261は、これらの処理を終了すると、処理対象となる人物が既に他のビデオカメラ52によって撮影されたか否かについて判別する。
システムコントローラ261は、抽出された検出顔特徴量と、当日中に記憶部62に記憶された検出顔特徴量(以下、これを当日検出顔特徴量と呼ぶ)との照合を行う。このとき、システムコントローラ261は、抽出された検出顔特徴量及び当日検出顔特徴量の一致率が高いと、抽出された検出顔特徴量の元になる人物が検出顔特徴量の元になる人物と同一であると認識する。
システムコントローラ261は、同一人物であると認識された当日検出顔特徴量に割り振られた識別IDを読み出し、当該識別IDを見かけ年齢及び性別、並びに笑顔の有無の判別、撮影日時に関連づけて記憶部62に記憶する。
一方、システムコントローラ261は、同一人物であると認識された当日検出顔特徴量が存在しない場合、抽出された検出顔特徴量の元になる人物が、当日、初めて検出されたと認識する。そしてシステムコントローラ261は、当該抽出された検出顔特徴量に対して新しい識別IDを付加し、当該抽出された検出顔特徴量を当日検出顔特徴量として、識別IDと共に記憶部12に記憶する、さらに、システムコントローラ261は、当該識別IDを見かけ年齢及び性別、並びに笑顔の有無の判別に関連づけて記憶部12に記憶する。
コンピュータ253のシステムコントローラ261は、ユーザの外部操作部55に対する操作に応じて、マーケティング情報表示処理を開始する。
具体的に、システムコントローラ261は、ユーザの指定した日の、指定した時間帯において、人物数と、人物の検出見かけ年齢及び検出見かけ性別、並びに笑顔の有無を集計し、表示画面データを生成し、外部インターフェース63を介して表示部54に供給する。この結果、表示部54には、例えばグラフ表示やリスト表示により、集計結果が表示される。
さらに、システムコントローラ261は、ユーザの要求に応じて識別IDごとの結果を集計する。例えば、システムコントローラ261は、4台のビデオカメラ52で撮影された動画像データにおいて、全て笑顔であった人物について、撮影時間からアトラクションを出た時間を集計し、表示画面データを生成する。もちろん、笑顔の少なかった人物について、同様の集計が可能である。
これにより、ユーザは、参加したアトラクション及び回る順番と、笑顔の有無との関係を示すマーケティング情報を知ることが可能であり、より多くのマーケティング情報を得ることができる。
[3−2.表情情報生成処理手順]
次に、表情情報生成プログラムに従って実行される表情情報生成処理について、図16に示すフローチャートを用いて説明する。
コンピュータ253は、ユーザの操作に応じて、表情情報生成プログラムを起動する。コンピュータ253は、ユーザの操作に応じて動画像データの取得処理が選択されたことを認識すると、マーケティング情報処理手順RT4を開始し、次のステップSP31へ移る。
ステップSP31〜38において、コンピュータ253は、マーケティング情報処理手順RT3と同様の処理を行うと、次のステップSP51へ移る。
ステップSP51において、コンピュータ253は、ステップSP34において抽出された検出顔特徴量と当日検出顔特徴量とを照合し、検出顔特徴量との一致率により、抽出された検出顔特徴量の元になる人物が、当日既に検出されたか否かについて判別する。
ここで肯定結果が得られた場合、このことは、抽出された検出顔特徴量の元になる人物が、既に識別IDを有していることを意味しており、このとき、コンピュータ253は、次のステップSP52へ移る。
ステップSP52において、コンピュータ253は、一致すると判別された人物の検出顔特徴量に関連付けられた識別IDを読み出し、ステップSP38において記憶した笑顔の有無、並びに見かけ年齢及び性別と関連付けて記憶部62に記憶すると、次のステップSP54へ移る。
これに対してステップSP51において否定結果が得られた場合、このことは、抽出された検出顔特徴量の元になる人物が、識別IDを有していないことを意味しており、このとき、コンピュータ253は、次のステップSP53へ移る。
ステップSP53において、コンピュータ253は、抽出された検出顔特徴量を当日検出顔特徴量として記憶すると共に、当該当日検出顔特徴量に新たな識別IDを付加し、当該当日検出顔特徴量に関連付けて記憶部62に記憶すると、次のステップSP54へ移る。
ステップSP54において、コンピュータ253は、処理を終了すべき旨の要求がユーザからなされたか否かを判別し、否定結果が得られた場合、ステップSP31へ戻って表情情報生成処理手順RT4を継続する。
これに対してステップSP54において、否定結果が得られた場合、コンピュータ253は、終了ステップへ移って表情情報生成処理手順RT4を終了する。
[3−4.動作及び効果]
以上の構成において、コンピュータ253の外部インターフェース63は、インターネットを介して画像データ及び履歴情報を取得する。
これにより、コンピュータ253は、わざわざビデオカメラ52を用いた撮影を行わなくても、本人の使用意志確認が取れた顔画像データを取得することができる。また、撮影を行わないため、世界各国の様々な人種・民族・地域から非常に簡便に顔画像データを取得することができる。
システムコントローラ261は、複数のビデオカメラ52によって撮影された複数の動画像データ間において、検出される人物の同一性を判別する。
これにより、コンピュータ253は、同一人物がどのようなタイミングで複数の動画像データに撮影されたかを把握することができるため、一段とマーケティング情報としての有用性を高めることができる。
<第4の実施の形態>
図17に示す第4の実施の形態においては、図1〜図9に示す第1の実施の形態と対応する箇所に同一符号を附して示し、同一部分についての説明を省略する。第4の実施の形態では、表情情報生成処理において、特定の顧客のみに対してマーケティング情報を取得する点が、第1の実施の形態と異なっている。
[4−1.表情情報生成処理]
第4の実施の形態においては、ビデオカメラ52は旅館やホテルに設置される。例えば、ビデオカメラ52は、旅館の出口に設置される。また、チェックアウトする顧客を特定するためのビデオカメラ69が、ホテルのチェックアウトカウンターに設置される。
コンピュータ353は、チェックアウト処理を行う情報処理端末68(図示せず)と、ビデオカメラ52及び69に接続されている。コンピュータ353のシステムコントローラ361は、チェックアウトの処理を行った顧客についてのみ、マーケティング情報を生成する。
具体的に、コンピュータ353のシステムコントローラ361は、情報処理端末68からチェックアウト処理を行う旨の通信信号が供給されると、ビデオカメラ69から供給される動画像データに対し、顔検出処理を行い、特定顔画像データを取得する。
システムコントローラ361は、特定顔画像データから特徴量を抽出し(以下、これを特定顔特徴量と呼ぶ)、これを記憶部62に記憶する。
システムコントローラ361は、出口に設置されたビデオカメラ52から供給される動画像データに対して人物検出及び顔検出処理を実行し、検出された検出顔特徴量と、特定顔特徴量とを照合する。
システムコントローラ361は、検出顔特徴量と特定顔特徴量との一致率が閾値以上であったことにより、検出顔特徴量の元となる人物がチェックアウト処理を行った顧客であると認識すると、マーケティング情報の生成を行う。
システムコントローラ361は、見かけ年齢及び性別を決定すると共に、笑顔の有無を判別し、これらを記憶部62に記憶する。
このように、コンピュータ353のシステムコントローラ361は、特定の人物に対してのみマーケティング情報の生成を行うことにより、本当に必要なマーケティング情報のみを生成することができる。
[4−2.動作及び効果]
以上の構成において、コンピュータ353のシステムコントローラ361は、検出された人物が特定の人物であるか否かを判別し、検出された人物が特定の人物であった場合にのみ、検出された人物の顔である顔画像データから笑顔の有無を検出する。
これにより、システムコントローラ361は、マーケティング情報として必要となる特定の人物に対してのみ笑顔の有無を検出すれば良いため、不要な情報を排除しつつ処理負荷を軽減できる。
<第5の実施の形態>
[5−1.輝度調整処理]
図20に示す第5の実施の形態においては、図15に示す第3の実施の形態と対応する箇所に同一符号を附して示し、同一部分についての説明を省略する。第5の実施の形態では、設置時点において、ビデオカメラ52A〜Dごとに輝度変化による年齢判定の差異を極力抑制するために輝度調整処理を行う点が、第4の実施の形態と異なっている。
コンピュータ253のシステムコントローラ261は、例えばメニュー画面において、カメラ設置ボタンをクリックするなどのユーザの操作に応じて、カメラ設置モードに移行する。カメラ設置モードにおいて、システムコントローラ261は、輝度調整処理の対象となるビデオカメラとして例えばビデオカメラ52Aが選択されると、ビデオカメラ52Aが撮影中の画像を表示する。
このとき、ビデオカメラ52Aの前には、特定の撮影基準対象が撮影される。撮影基準対象としては、例えば白1色など特定の色をした板や、格子状に種々の色彩が描かれた板、複数の顔が印刷された板などの画像の他に、顔型や卵形、凹凸のある球など、立体形状を有するオブジェ、及び画像とオブジェの組み合わせなどが想定されている。
システムコントローラ261は、ユーザの操作に応じて撮影基準対象の画像を取得すると、例えば予め撮影基準対象に設けられた撮影サイズ補正用のマークに基づいて、撮影された撮影基準対象の大きさを補正する。
撮影基準対象の特定範囲における輝度を特定範囲輝度として検出するこの特定範囲は、撮影基準対象の全部又は一部であって良く、さらに単数であっても複数であっても構わないが、精度向上のために複数設けることが望ましい。
次いで、システムコントローラ261は、コンピュータ253の記憶部262には、予め輝度補正値が記憶されている。システムコントローラ261は、特定範囲の輝度に応じて輝度補正値を特定する。また、システムコントローラ261は、例えば特定範囲輝度の基準値との差異に基づいて、計算により輝度補正値を算出しても良い。
システムコントローラ261は、ユーザの操作に応じて次のカメラ52Bに対する輝度調整処理を実行する旨の要求がなされると、カメラ52Bに対して同様の処理を実行する。そしてシステムコントローラ261は、ユーザの操作に応じてカメラ設置モードを終了する旨の要求がなされると、カメラ設置モードを終了する。
この後、システムコントローラ261は、表情情報生成処理において、検出された検出見かけ年齢に対して例えば輝度補正値を乗算又は加減算などすることにより検出見かけ年齢の値を補正し、最終的な検出見かけ年齢を判定する。この輝度補正値は、一定の値でも良いが、年齢値に対応して変化する変数であっても良い。
このようにコンピュータ253は、撮影された撮影基準対象の輝度値に基づいて年齢値を補正するようにしたことにより、撮影される状況に応じて検出みかけ年齢の値を補正することができ、光の当たり具合などによって検出見かけ年齢の値が変化してしまうことを極力抑制することができる。
[5−2.輝度調整処理手順]
次に、輝度調整プログラムに従って実行される輝度調整処理について、図20に示すフローチャートを用いて説明する。
コンピュータ253は、ユーザの操作に応じてカメラ設置モードに移行すると、輝度調整処理を開始し、次のステップSP101へ移る。
ステップSP101において、コンピュータ253は、ユーザによって輝度調整処理を行う対象となるビデオカメラ52が選択されると、次のステップSP102へ移る。
ステップSP102において、コンピュータ253は、選択されたビデオカメラ52の撮影画像を表示すると、次のステップSP102へ移る。
ステップSP103において、コンピュータ253は、撮影基準対象の画像を取得したか否かを判断し、取得した場合には次のステップSP104へ移り、そうでない場合には取得するまで待ち受ける。
ステップSP104において、コンピュータ253は、画像データにおける撮影基準対象のサイズを調整すると、次のステップSP104へ移る。
ステップSP105において、コンピュータ253は、特定範囲輝度を検出すると、次のステップSP106へ移る。
ステップSP106において、コンピュータ253は、特定範囲輝度に基づいて輝度補正値を決定すると、次のステップSP107へ移る。
ステップSP107において、コンピュータ253は、ユーザの操作に応じてさらに輝度調整処理を実行する旨の操作要求がなされたか否かを判別し、肯定された場合には、ステップSP101へ戻り、次のビデオカメラ52に対する輝度調整処理を実行する。
これに対してステップSP107において否定結果が得られた場合、コンピュータ253は、終了ステップへ移り、輝度調整処理を終了すると共に、カメラ設置モードを解除する。
このように、コンピュータ253は、予め定められた撮影基準対象の画像データの特定範囲における特定範囲輝度に基づいて、輝度補正値を決定し、輝度補正値を用いて年齢値を補正することにより、特定範囲輝度に基づいてみかけ年齢を判別するようにした。
これにより、コンピュータ253は、ビデオカメラ52が設置された場所やビデオカメラ52自身の性能などによって見かけ年齢が変動することを極力抑制でき、見かけ年齢の検出精度を向上させ得る。
<第6の実施の形態>
第6の実施の形態においては、第3の実施の形態と対応する箇所に同一符号を附して示し、同一部分についての説明を省略する。第6の実施の形態では、現在の日時及び天気など、ビデオカメラ52の設置された環境に応じた環境要素を判断し、年齢値を補正する点が第3の実施の形態と異なっている。
コンピュータ253のシステムコントローラ261は、表情情報生成処理において、インターネットなどのネットワークを介して現在の天気情報を取得すると共に、現在の日時から、日照の季節的及び時間的な日時日照強度を決定する。そしてシステムコントローラ261は、天気情報及び日時日照強度及び天気情報から、現在の環境要素に応じた環境補正値を算出する。
例えばコンピュータ253の記憶部262には、日付、時刻、天気の3つの環境要素に応じた環境補正値が予め記憶されている。システムコントローラ261は、表情情報生成処理の際、日付、時刻、天気に基づいて環境補正値を決定し、検出みかけ年齢の値を補正して最終的な検出見かけ年齢を決定する。この環境補正値は、例えば、30分ごと、1時間ごとのように所定時間ごとに変更されることが好ましい。また、環境補正値は、環境要素に応じて計算によって算出されても良い。
このように、本実施の形態における表情情報生成システムでは、環境要素に応じて年齢値を補正して検出見かけ年齢を決定することにより、各ビデオカメラ52A〜Dの設置された状況に拘わらず、ほぼ一定の見かけ年齢を検出することができ、見かけ年齢の検出精度を向上させ得る。
コンピュータ253は、撮影場所における現在の環境に応じた環境要素から環境補正値を決定し、環境補正値を用いて年齢値を補正することにより、環境補正値に基づいてみかけ年齢を判別する。
これにより、コンピュータ253は、ビデオカメラ52が設置された撮影場所における環境の影響を最小限に抑えることができ、見かけ年齢の判別精度を向上させ得る。特に、ビデオカメラ52が屋外に設置されるような場合に、環境の影響を最小限に抑えることができ、非常に有効である。
<第7の実施の形態>
第7の実施の形態においては、第1の実施の形態と対応する箇所に同一符号を附して示し、同一部分についての説明を省略する。第7の実施の形態では、表情情報生成処理を用いて視聴率調査を行う点が第1の実施の形態と異なっている。
図21に示すように、視聴率調査システム751では、コンピュータ756がインターネット720に接続されている。端末装置としてのカメラ付端末752は、撮影手段としてのカメラ、表示手段としての表示部、受信及び送信手段としての通信部を有しており、映像データを受信し、表示部を介して視聴可能になされている。映像データとしては、例えば地上波テレビジョン放送や衛星放送等の電波を受信する他、オンデマンドによるストリーミング放送、インターネットテレビジョン放送、DVD(Digital Versatile Disc)、USB(universal serial bus)などの固定メディアの再生、内蔵HDD(Hard Disc Drive)などの内蔵装置に記憶されたものなどが想定されている。
カメラ付端末752としては、パーソナルコンピュータやスマートフォン、携帯電話、タブレット端末、テレビジョン受信機など、インターネットなどのネットワークに接続可能な端末であれば制限はない。
視聴率調査プログラムは、カメラ付端末752の記憶部(図示しない)に予め記憶されている。カメラ付端末752は、映像データを受信すると、当該映像データに基づく放送画面を表示部に表示すると共に、付属カメラを用いて視聴者の撮影を実行する。なお、視聴者には予め視聴率調査システムに対する許可を得た上で視聴率調査プログラムをダウンロードしておくことが望ましい。
そしてカメラ付端末752は、撮影データに対して表情情報生成処理を実行する。この表情情報生成処理は、例えば1秒ごとなどの所定間隔で実行されることが好ましい。
カメラ付端末752は、検出された検出見かけ年齢、性別及び笑顔度を、映像データのどの部分かを示す時間情報と紐付けし、インターネット720を介してコンピュータ756へ送信する。
なお、カメラ付端末752が映像データの時間情報と紐付けして撮影データをコンピュータ756に対して送信し、コンピュータ756が表情情報生成処理を実行しても良い。
この結果、コンピュータ756の記憶部には、映像データの時間情報と紐付けされた状態で、視聴者の検出見かけ年齢、性別及び笑顔度が記憶される。コンピュータ756のシステムコントローラ(図示せず)は、時間情報ごとに視聴者の検出見かけ年齢、性別及び笑顔度を統計することにより、時間情報ごと、および映像データごとの視聴率を検出見かけ年齢及び検出みかけ性別ごとに算出する。
図22に示すように、コンピュータ756は、ユーザの操作に応じて、表示部54に表示画面780を表示する。図22及び23に示すように、この表示画面780には、映像を表示する映像表示枠781と、映像データの再生位置を示す時間表示枠782と、全映像データのトータルのトータル視聴率グラフ783a及びトータル笑顔度グラフ783bを表すトータル表示枠783と、現在表示中の映像データに対応する視聴率及び笑顔度を表す映像評判枠784と、現在表示中の映像データに対応する視聴率及び笑顔度の性別・年齢ごとの詳細を表示する詳細表示枠785とを有している。
詳細表示枠785に表示された項目は、設定によって変更可能である。例えば、5歳刻みで表示したり、男女合わせた項目を表示することも可能である。
この表示画面780において、時間表示枠781内に表示された時間バー782a上のカーソル786を移動させることにより、再生位置が移動し、再生位置に応じた映像データが表示されると共に、映像データに応じたトータル表示枠783、映像評判枠784及び詳細表示枠785が表示される。また、トータル表示枠783において再生位置を示す再生位置線783cも移動する。
これにより、簡単に再生位置を指定すると共に、当該指定された再生位置における視聴率及び笑顔度の状況を素早く認識できる。
例えば、トータル表示枠783内にカーソル786を置き、ダブルクリックすることにより、図23に示すように、表示画面780におけるトータル表示枠783と映像表示枠781の位置及び大きさを入れ替えることができる。また、詳細表示枠785には、視聴率及び笑顔度の性別・年齢ごとの詳細がグラフで表示されている。
図23の表示画面780において、再生位置線783c上のカーソル786を移動させることにより、再生位置が移動し、再生位置に応じた映像データが表示されると共に、映像データに応じたトータル表示枠783、映像評判枠784及び詳細表示枠785が表示される。
これにより、例えば最も視聴率の高い再生位置を簡単に指定すると共に、当該指定された再生位置における映像データ、並びに視聴率及び笑顔度の詳細な状況を素早く認識できる。
このように、本実施の形態における視聴率調査システム751では、カメラ付端末752が映像データを表示すると共に、映像データを視聴する人物を撮影する。さらにカメラ付端末752は、撮影された動画像データから人物を検出すると共に、検出された前記人物の顔から表情を検出し、人物の数と、笑顔度と、映像データの時間情報とを関連付けて送信するコンピュータ756に送信する。コンピュータ756は、映像データと対応させて表情と人物の数とを統計するようにした。
これにより、コンピュータ756は、映像データの時間情報ごとに視聴率及び笑顔度を算出することができ、映像データの各画面と視聴率及び笑顔度を容易に関連づけることができる。この結果、コンピュータ756は、映像データに対応させて視聴率を統計でき、映像データの各シーンに対する視聴者の反応を容易に視認させることができる。
<他の実施の形態>
なお上述した第1〜第7の実施の形態のデータベース作成処理において、入力手段として、外部インターフェース13に接続された外部操作部14を介して入力見かけ情報を入力させるようにした場合について述べた。本発明はこれに限らず、例えばノートパソコンのキーボードやタッチパネルなどの内部の入力手段から入力見かけ情報を入力させるようにしても良い。
さらに上述した第1〜第7の実施の形態のデータベース作成処理においては、見かけ情報データベースに履歴情報が登録されるようにした場合について述べた。本発明はこれに限らず、履歴情報は必ずしも必須ではない。また、履歴情報として、人種や民族などを含めることができる。人種や民族などの履歴情報は、見かけから入力されるようにしても良く、顔の色や特徴から自動的に判別されるようにしても良い。
さらに上述した第1〜第7の実施の形態のデータベース作成処理においては、見かけ情報として見かけ年齢及び見かけ性別が入力されるようにした場合について述べた。本発明はこれに限らず、人種や民族などを見かけ情報として入力されても良い。
さらに上述した第1〜第7の実施の形態のデータベース作成処理においては、入力回数だけ入力した直後に顔画像データの表示が禁止されるようにした場合について述べた。本発明はこれに限らず、所定期間(例えば1ヶ月)経過後に顔画像データが消去されたり、フラグを立てることによって顔画像データの表示が禁止されても良い。
さらに上述した第3の実施の形態のデータベース作成処理においては、アンケートの募集サイトなどを通じて、インターネットを介して画像データが取得されるようにした場合について述べた。本発明はこれに限らず、例えばコンピュータがホームページなどに公開されている顔画像データを自動的に取得することにより、インターネットを介して画像データを取得するようにしても良い。
さらに上述した第1〜第7の実施の形態のデータベース作成処理においては、人型を検出した後に顔検出処理を実行し、上半身をトラッキングするようにした場合について述べ
、た。本発明はこれに限らず、例えば、顔を検出して人物カウントを行った後に上半身又は服装をトラッキングしたり、顔を検出して人物カウントを行った後にそのまま顔をトラッキングしたりするようにしても良い。
さらに上述した第1〜第7の実施の形態のデータベース作成処理において、動画像データから一つの顔画像データを生成するようにした場合について述べた。本発明はこれに限らず、2以上の顔画像データを生成するようにしても良い。例えば、システムコントローラ11は、人型を検出してトラッキングすることにより同一人物であることを認識しつつ、特徴量の大きく異なる複数枚の顔画像データを記憶部12に記憶する。これにより、一人の人物から例えば横顔や下を向いたときの顔など、照合に有用な複数の顔画像データを得ることができる。
さらに上述した第1〜第7の実施の形態の表情情報生成処理において、コンピュータがビデオカメラ52から取得された画像データを取得するようにした場合について述べた。本発明はこれに限らず、例えばスマートフォンやタブレット端末、他のコンピュータなど、他の情報通信端末から供給される画像データを取得しても良い。
具体的に、表情情報生成システムのコンピュータ553は、クラウドシステムにより、インターネットなどのネットワークを介して他の情報端末に接続される。コンピュータ553は、他の情報端末から動画像データを取得して表示情報生成処理を実行し、画面データを他の情報端末に供給する。他の情報端末は、画像データの供給と画面データの表示処理のみを行う。これにより、表情情報生成システムは、コンピュータ553の処理負荷を著しく低減できるため、例えばコンピュータ553として個人使用の一般的なパソコンや、小さな処理ユニットを使用することが可能となる。
この場合、コンピュータ553は、データベースの更新処理を実行する。これにより、コンピュータ553は、他の情報端末から供給された動画像データから膨大な数の顔画像データを取得することが可能となる。この場合、コンピュータ553は、新たな顔画像データを取得すると、顔特徴量を抽出し、登録顔特徴量との一致率を確認し、登録顔特徴量との一致率が高い顔画像データについては、顔画像データの表示を省略する。これにより、コンピュータ553は、顔画像データの多様性を保ちつつ、照合処理の負荷が過大になることを防止することができる。
さらに上述した第1〜第7の実施の形態の表情情報生成処理において、コンピュータは、検出顔特徴量との一致率が最も高い登録顔特徴量を選択し、当該登録顔特徴量に関連付けられた見かけ年齢及び性別を検出顔特徴量の基となる人物の見かけ年齢及び性別とした場合について述べた。本発明はこれに限らず、例えば、登録顔特徴量を基に、年齢及び性別ごとにモデル特徴量を作成しておき、一致率が最も高いモデル特徴量に関連付けられた見かけ年齢及び性別を検出顔特徴量の基となる人物の見かけ年齢及び性別としても良い。このモデル特徴量は、見かけ年齢及び性別ごとに1つのみ作成されても良く、2以上作成されてもよい。
これにより、表情情報生成システムでは、照合対象の数を著しく低減させることができる。このため、表情情報生成システムでは、コンピュータの処理負荷を著しく低減できるため、例えばコンピュータとして個人使用の一般的なパソコンや、小さな処理ユニットを使用することが可能となる。
さらに上述した第1〜第7の実施の形態の表情情報生成処理においては、特定時間(例えば1時間、1日、曜日など)ごとに、検出見かけ情報及び笑顔の有無が統計されるようにした場合について述べた。本発明はこれに限らず、実年齢のデータベース及び実際の性別判断手法を用いて、実年齢及び実性別並びに検出された表情(笑顔の有無)が統計されるようにしても良い。
さらに上述した第4の実施の形態の表情情報生成処理においては、特定の人物についてのみ見かけ情報及び表情の検出が行われるようにした場合について述べた。本発明はこれに限らず、例えば全ての人物について見かけ情報及び表情の検出が行われるようにしても良い。この場合、特定の人物にのみフラグを立てるなどすることにより、ユーザの要求に応じて特定の人物と不特定の人物とに分けて統計が行われることが好ましい。これにより、全体に対する特定の人物の表情などが明確になるため、マーケティング情報の有用性を高めることができる。
また、特定の人物と不特定の人物とで統計手法を変化させても良い。例えば、コンピュータ653は、店舗など、店員と顧客が入り乱れる環境において、店員のみを特定し、笑顔の検出を行うことにより、店員の笑顔度と顧客の笑顔度とを同時に取得することが可能である。店員の笑顔度を取得する場合、コンピュータ653は、例えば笑顔度を複数段階に分け、笑顔度の段階と時間との関係を統計することにより、笑顔度と時間との関係を統計する。一方、コンピュータ653は、顧客に対しては笑顔度の平均値や笑顔の有無を算出する。
さらに上述した第1〜第7の実施の形態の表情情報生成処理においては、笑顔度の平均値から笑顔の有無を判別するようにした場合について述べた。本発明はこれに限らず、例えば笑顔の大・中・小や、0〜20%、20〜40%、40〜60%、60〜80%、80〜100%というように、笑顔度の値に応じて3段階以上に分類しても良い。また、笑顔度をそのまま使用することも可能である。これにより、例えば接客業では自然な笑顔が要求され、顧客に対しては満面の笑顔が要求されるように、目的に応じて要求される笑顔に対しても柔軟に対応することが可能となる。
さらに上述した第1〜第7の実施の携帯の表情情報生成処理においては、人型及び顔を検出すると人物であると認識するようにした場合について述べた。本発明はこれに限らず、例えばコンピュータは、人型の検出のみにより人数をカウントしたり、顔の検出や、表情の検出に応じて人数をカウントしても良い。
さらに上述した第1〜第7の実施の携帯の表情情報生成処理においては、人型を検出するようにした場合について述べた。本発明はこれに限らず、コンピュータは、必ずしも人型を検出する必要はない。例えば顔の検出により人数をカウントし、そのまま表情を検出するようにしても良い。
さらに上述した第1〜第7の実施の形態の表情情報生成処理においては、人物の笑顔の有無を判別するようにした場合について述べた。本発明はこれに限らず、例えば怒り顔、悲しみ顔のように、他の顔の表情についての有無やその程度を判別するようにしても良い。この場合、目尻や眉の角度、口角の角度に加えて、手の動きや目の開口率、眉間のしわなどを検出することによっても表情についての有無やその程度を判別することができる。
この場合、例えば図19に示すように、コンピュータ753は、人物の動きに対応させて動く枠471を検出見かけ情報に応じた色分けをして表示すると共に、枠471の内部に表情を表す表情表示472を表示する。この表情表示472の色は、枠471と同じでも良いが、表情ごとに色分けすることにより、視認しやすくできる。
表情表示472は、枠471の外側に表示しても良く、表情の度合いをグラフ化して一緒に表示することも可能である。また、例えば怒り=赤、悲しみ=青、笑い=黄色のように、表情を色で表示することも可能である。また、枠471は、その内部が塗りつぶされても良い。
この場合、コンピュータ753人物の動きに対応する枠471及び表情の度合いのみを表示し、動画像データを必ずしも重畳しなくても良い。これにより、コンピュータ753は、本当に必要となる人物の動き及びその表情についての情報を表示させつつ、撮影した顔画像をむやみやたらに表示させずに済み、撮影された人物のプライバシーを保護する事が可能となる。
また、コンピュータ753は、必ずしもリアルタイムでかかる画面を表示する必要はなく、ユーザからの要求に応じて記憶部62に記憶された動画像データを表示することができる。この場合、動画像データの代わりに人物の移動点(例えば顔の中心点)のみを記憶部62に記憶しておくことにより、動画像データを記憶する場合と比較して格段にデータ容量を節約可能である。
さらに上述した第1〜第7の実施の形態の表情情報生成処理においては、ビデオカメラ52から取得した動画像データからマーケティング情報を生成するようにした場合について述べた。本発明はこれに限らず、例えば、ICレコーダなどの録音機能を同時に用いるようにしても良い。
これにより、例えば営業マンと顧客との会話が撮影・録音された場合において、コンピュータが顧客の表情が変化した時点や笑顔度が高い時点を指定して再生することにより、営業マンのどの話の部分においてこれらの状況が生じたかを非常に簡単に後から追うことが可能となる。
さらに上述した第1〜第7の実施の形態においては、表情情報生成処理において、レストラン、ショッピングセンター、遊園地、ホテルに設置されたビデオカメラ52によって動画像データを撮影するようにした場合について述べた。本発明はこれに限らず、例えば、旅館、銀行、住宅販売所など、種々の場所に設置されたビデオカメラ52によって動画像データを撮影するようにしても良い。
さらに上述した第5の実施の形態においては、輝度調整処理においてユーザの操作に応じて撮影基準対象の画像を取得するようにした場合について述べた。本発明はこれに限らず、撮影基準対象に撮影基準対象であることを示すマークを付すことにより、システムコントローラ261が撮影基準対象を自動検知して、自動的に撮影基準対象を撮影することも可能である。この場合、必ずしも選択されたビデオカメラ52の撮影中の画像を表示する必要はない。
さらに上述した第5の実施の形態においては、輝度調整処理において、ひとつのビデオカメラ52を選択するようにした場合について述べた。本発明はこれに限らず、例えばビデオカメラ52が一つしか設置されていない場合には、ビデオカメラ52の選択は不要である。また、画像データにおける撮影基準対象のサイズ調整も必ずしも必要ではない。
さらに上述した第5及び第6の実施の形態においては、表情情報生成処理において、検出みかけ年齢の値を直接的に補正するようにした場合について述べた。本発明はこれに限らず、例えば、検出された顔の画像や検出顔特徴量に対してコントラストやシャープ度を調整するなどの画像処理を施すことにより、間接的に検出みかけ年齢の値をを補正しても良い。
さらに上述した6の実施の形態においては、表情情報生成処理において、日付、時刻、天気の3つの環境要素に応じた環境補正値を決定するようにした場合について述べた。本発明はこれに限らず、例えば、これらのうちの1要素のみ若しくは2要素を組み合わせて環境補正値を決定しても良い。また、照度計などで日照の強度を測定したデータを環境要素として取得し、又は直接測定し、これに基づいて環境補正値を決定しても良い。
さらに上述した第7の実施の形態においては、視聴率調査システム751において、カメラ付端末752が表情情報生成処理を実行するようにした場合について述べた。本発明はこれに限らず、コンピュータ756に対してカメラ付端末752が動画像データを送信し、コンピュータ756が表情情報生成処理を実行しても良い。これにより、カメラ付端末752の処理負荷を軽減できる。
さらに上述した第7の実施の形態においては、視聴率調査システム751において、映像データに対応する視聴率及び笑顔度を表示するようにした場合について述べた。本発明はこれに限らず、例えば視聴人数と表情度合いのように、少なくとも検出された人物数と表情度とを統計した結果得られる値が表示されればよい。
さらに上述した第7の実施の形態における視聴率調査システム751では、カメラ付端末752が表情情報生成処理を実行するようにした場合について述べた。本発明はこれに限らず、カメラ付端末752が撮影した動画像データと映像データの時間情報とを関連付けた状態でコンピュータ756に供給し、コンピュータ756が表情情報生成処理を実行するようにしても良い。
すなわち、この視聴率調査システムでは、映像データを表示する表示手段と、映像データを視聴する人物を撮影する撮影手段と、撮影手段によって撮影された動画像データを送信する送信手段とを有する端末装置と、動画像データを取得する取得手段と、動画像データから人物を検出する人物検出手段と、検出された人物の顔から表情を検出する表情検出手段と、人物の数と、表情と、表情が検出された日時とを関連付けて記憶する記憶手段と特定の時間ごとに、表情と人物の数とを統計する統計手段とを有する表情情報生成装置とを有する。
これにより、視聴率調査システムは、表情と人物の数とを映像データと関連付けて統計できるだけでなく、リアルタイムで人物の表情を確認できる。
さらに上述した第7の実施の形態における視聴率調査システム751は、映像データを表示するカメラ付端末752として、例えば街頭などで広告情報を画面表示する、いわゆるサイネージ端末を用いることも可能である。この場合、表情情報生成処理として、トラッキング処理や個人IDの付加によって人物の同一性を特定し、人物ごとの滞留時間を検出することが好ましい。
さらに上述した第1〜第7の実施の形態の各要素を適宜組み合わせることが可能である。
さらに、上述した実施の形態においては、データベース作成プログラム及び表情情報生成プログラム等をROM又はハードディスクドライブなどに予め格納した場合について述べた。本発明はこれに限らず、メモリカードなどの外部記憶媒体からコンピュータ内部のフラッシュメモリやハードディスクドライブなどにインストールするようにしても良い。また、データベース作成プログラムなどをUSB(Universal Serial Bus)やEthernet(登録商標)(Institute
of Electrical and Electronics Engineers)802.11a/b/gなどの無線LAN(Local Area Network)を介して外部から取得し、さらに、は地上ディジタルテレビジョン放送やBSディジタルテレビジョン放送により配信されるようにしても良い。
さらに上述した第1の実施の形態のデータベース作成処理においては、画像取得手段及入力手段としての外部インターフェース13と、見かけ年齢決定手段、見かけ性別決定手段及び特徴量抽出手段としてのシステムコントローラ11と、記憶手段としての記憶部12とによって本発明のデータベース作成装置としてのコンピュータ3を構成するようにした場合について述べた。本発明はこれに限らず、種々の構成による画像取得手段、入力手段、見かけ年齢決定手段、見かけ性別決定手段、特徴量抽出手段及び記憶手段によって本発明のデータベース作成装置を構成するようにしても良い。
さらに上述した第1の実施の形態の表情情報生成処理においては、取得手段としての外部インターフェース63と、人物検出手段、表情検出手段、統計手段としてのシステムコントローラ61と、記憶手段としての記憶部62とによって表情情報生成装置としてのコンピュータ53を構成する用にした場合について述べた。本発明はこれに限らず、種々の構成による取得手段、人物検出手段、表情検出手段、統計手段及び記憶手段によって本発明の表情情報生成装置を構成するようにしても良い。
さらに上述した第1の実施の形態の表情情報生成処理においては、表情検出手段、検出情報決定手段、画面データ生成手段としてのシステムコントローラ61によって表情情報生成装置としてのコンピュータ53を構成する用にした場合について述べた。本発明はこれに限らず、種々の構成による表情検出手段、検出情報決定手段、画面データ生成手段によって本発明の表情情報生成装置を構成するようにしても良い。