JP6428062B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP6428062B2
JP6428062B2 JP2014179880A JP2014179880A JP6428062B2 JP 6428062 B2 JP6428062 B2 JP 6428062B2 JP 2014179880 A JP2014179880 A JP 2014179880A JP 2014179880 A JP2014179880 A JP 2014179880A JP 6428062 B2 JP6428062 B2 JP 6428062B2
Authority
JP
Japan
Prior art keywords
customer
module
frame
face
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014179880A
Other languages
English (en)
Other versions
JP2016053869A (ja
Inventor
福井 基文
基文 福井
祐介 宇野
祐介 宇野
昌嗣 外池
昌嗣 外池
公亮 村口
公亮 村口
新宮 淳
淳 新宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2014179880A priority Critical patent/JP6428062B2/ja
Priority to PCT/JP2015/052270 priority patent/WO2016035351A1/ja
Publication of JP2016053869A publication Critical patent/JP2016053869A/ja
Application granted granted Critical
Publication of JP6428062B2 publication Critical patent/JP6428062B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、広告の効果をより客観的、正確さを持って検証できるプロモーション効果判定技術を提供することを目的とし、ターゲティング条件に適合する対象顧客を、広告を渡すべき実験顧客と広告を渡さない制御顧客とに分ける制御条件演算手段と、実験顧客に対して広告用情報を出力する広告出力手段とを備え、また、当該実験顧客が購入する商品が広告用情報に含まれている広告対象商品であるか否かを判断するための第一演算手段と、制御顧客が購入する商品が前記広告用情報に含まれている広告対象商品であるか否かを判断するための第二演算手段と、第一演算手段及び第二演算手段の演算結果を比較する比較手段とを備えることが開示されている。
特許文献2には、視聴者の放送中のCMに対する反応の程度を正確かつリアルタイムで集計することを可能にすることを課題とし、放送局から顧客へ配信されるCMに対する顧客の反応を調査するコマーシャルメッセージ反応調査方法であり、CMに対応付けられ、そのCMに対する反応の程度を表す反応情報を顧客が入力可能なデータ放送用コンテンツを作成し、作成したコンテンツを放送局に対して送信するステップと、放送局から顧客に対して配信されたデータ放送用コンテンツに応じて顧客から送信されてきたCMに対する反応情報を受信するステップとを備えていることが開示されている。
特許文献3には、精密かつ柔軟性のある放送広告の評価情報収集方式を得ることを課題とし、広告に関する評価情報を収集する調査会社は、インターネット等のネットワーク通信網により視聴者が自由にアクセス・ダウンロード可能なホームページを開設し、このホームページは、放送番組の内容や、それに付随して放送されるCMについての視聴者の評価・反応を通信網を介して視聴者に番組情報・CM情報・番組制作詳細情報・CM制作詳細情報・景品情報などを提供することにより、このホームページで視聴者からの各種評価情報を収集して、整理・分析し、調査会社はこの整理・分析した評価情報を放送局に有償提供し、このように、インターネット等の広く普及したネットワーク通信網を利用することにより、放送局が行っている放送に対する視聴者からの広告に関する具体的な評価を、簡便に大規模に収集することが可能となることが開示されている。
特許文献4には、ユーザ(顧客)にアプローチするためのサプライヤのプロモーション情報並びにプロモーションの実施によるユーザのレスポンス情報や、プロモーション情報とレスポンス情報との照合、分析によるプロモーション効果の検証情報を低労力にて短時間で提供できるようにすることを課題とし、プロモーション情報登録手段と、サプライヤが管理する販売企画情報データベース、販売管理情報データ、ユーザ情報データベースと、ユーザ端末機にネットワークを介して接続され、そのユーザからの注文や問い合わせやユーザの登録申請などの受け付けと、そのユーザに対してプロモーション企画など販売企画情報の提供をするデータサーバを備え、登録されたプロモーション情報やユーザレスポンス情報、プロモーション効果情報の提供サービスをすることが開示されている。
特許文献5には、視聴者自身による記入などといった作業負荷を軽減し、通常の視聴形態におけるコンテンツの視聴質の自動集計を可能とする技術の提供を目的とし、センシング装置で、視聴者についてのセンシングデータやそれを認識処理することで得られる視聴者についての認識データを収集することで、再生コンテンツに対しての視聴者の反応を示す視聴者反応データを収集し、一方、ユーザ端末で、画面操作履歴の情報を含む再生コンテンツについての視聴データを収集すると、ユーザ端末あるいは情報提供装置で、その収集した視聴者反応データとその収集した視聴データとを時間同期させて統合し、情報提供装置で、その統合データに基づいて、再生コンテンツに対しての視聴者の質的な反応を示す視聴質データを生成して、その生成した視聴質データの流通用の視聴メタデータを作成することが開示されている。
特許文献6には、広告や番組の視聴者のプライバシーを保護しつつ広告メディアや広告番組の効果をより客観的に評価できるコンテンツ評価装置及びコンテンツ評価方法を提供することを課題とし、コンテンツ評価装置は、カメラが撮影した画像から動領域を検出する動領域検出部と、該動領域が人物であるか否かを検出する人物検出部とを有する通行人物検出部と、該人物の顔を検出する顔検出処理部と、該顔の方向を検出する顔方向検出処理部とを有する注視人物検出部とを備えたシステムサーバと、通行人物検出部により検出された通行人数を算出する通行人数算出部と、注視人物検出部により検出されたコンテンツの注視人数を算出する注視人数算出部と、通行人数と注視人数とから該コンテンツの注視率を算出する注視率算出部とを備えた集計センタサーバとを有することが開示されている。
特許文献7には、閲覧者が特定の広告ディスプレイと向き合っている時間量に基づいて広告の好みを確定するビジネスシステム及び方法を提供することを課題とし、消費者が広告ディスプレイを見ている時間量を求め、一連の画像が、広告ディスプレイの正面のシーンのカメラによって取得され、一連の画像から顔が検出され、検出された顔のそれぞれについて、広告ディスプレイに対する顔の向きが求められ、特定の広告についての好みを確定できることが開示されている。
特許文献8には、宣伝広告の評価を的確に実施できる宣伝効果評価システム及びシステムに適用される装置、プログラム、広告訴求度測定装置を提供することを課題とし、商品を販売する店舗に、予め定めた宣伝広告対象商品の宣伝広告を前記店舗の営業時間内の1つ以上の時点で行うPOP装置を設け、提供される宣伝広告を視聴した人とその人の視聴時間を広告訴求度測定手段が検出し、その訴求度情報を、訴求度時系列データ書き込み手段が時系列的に記録して宣伝広告訴求度の時系列的データを作成し、前記店舗内の前記宣伝広告対象商品の売り上げ情報の時系列的データをPOS装置のPOS取引ジャーナル書き込み手段が求め、店舗サーバ装置の宣伝効果評価手段が、前記宣伝広告対象商品の売り上げ情報の時系列的データと前記宣伝広告訴求度の時系列的データとの相関関係を統計的に分析評価することが開示されている。
特許文献9には、顔検出が不完全なものであっても、精度の高い注目者数を算出でき、広告効果として測定できる広告効果測定装置を提供することを課題とし、画像入力部と、顔検出部と、顔の姿勢を表すパラメータ値を推定する顔姿勢推定部と、検出された顔の現フレームの状態を判別する状態判別部と、前記現フレームの顔状態と前検出状態記憶から渡される検出ID及び注視時間に基づいて、検出された顔の検出IDと注視時間情報を付与する検出ID・注視時間付与部と、顔検出時刻、検出位置、大きさ、顔状態と、検出ID、注視時間の各情報を一時的に記憶する前検出状態記憶と、検出結果である検出時刻、検出ID、注視時間の各情報を注目者ログとして蓄積する注目者ログ記憶部と、前記注目者ログから指定期間内の注目者を計数する注目者数集計部と、集計結果を出力する結果出力部とを備えることが開示されている。
特許文献10には、コンテンツの改善への活用が容易なコンテンツの評価を視聴ユーザの生体信号から決定可能なコンテンツ評価装置を提供することを課題とし、コンテンツ評価装置は、ユーザの脳血流と視線位置とを取得する取得部と、取得した脳血流を基にユーザの画像コンテンツに対する反応種別を識別する反応識別部と、画像コンテンツ内に含まれる画像である提供画像の表示領域と提供画像が表示領域に表示される表示時間とを含む情報である提供情報を蓄積している提供情報蓄積部と、提供情報を参照し、視線位置に基づいてユーザの提供画像への注視度を算出する注視度算出部と、評価情報テンプレートを蓄積している評価情報蓄積部と、評価情報テンプレートを参照し、注視度と反応種別とに対応する評価情報を画像コンテンツに対するユーザの評価として決定する評価情報決定部とを備えることが開示されている。
特許文献11には、広告の有効性を良好に評価及び判定する広告システムを提供することを課題とし、システムは、ディスプレイを備えた、ディスプレイを通じて潜在顧客に広告コンテンツを提供するように構成された広告ステーションと、この広告ステーションに潜在顧客が接近すると、この潜在顧客の画像を捕捉するように構成された1つ以上のカメラとを含み、さらに、データ処理システムを含み、捕捉された画像を解析することにより、潜在顧客の視線方向及び身体姿勢方向を判定し、判定された視線方向及び身体姿勢方向に基づいて、広告コンテンツにおける潜在顧客の関心度を判定することが開示されている。
特開2000−056720号公報 特開2001−357191号公報 特開2002−109139号公報 特開2003−030404号公報 特開2005−142975号公報 特開2007−181070号公報 特開2008−305379号公報 特開2009−140238号公報 特開2009−301085号公報 特開2012−234405号公報 特開2013−050945号公報
本発明は、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴に対して、顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する抽出手段と、前記抽出手段によって特徴を抽出した前記顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成する作成手段を具備し、前記広告は映像を用いたものであり、前記抽出手段は、前記映像の各フレーム時に対応する静止画像における特徴を抽出し、前記作成手段は、前記各フレーム時に対応する静止画像における特徴に前記教師信号による学習モデルを生成し、前記フレーム時に対応する静止画像で購入と判断される度合いが高いフレームを、前記広告の映像において購入効果のあるフレームとして判定する、又は、前記フレーム時に対応する静止画像で購入と判断される度合いが低いフレームを、前記広告の映像において購入効果のないフレームとして判定する判定手段をさらに具備することを特徴とする情報処理装置である。
請求項2の発明は、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する第2の抽出手段と、前記第2の抽出手段によって抽出された特徴を、前記作成手段によって作成された学習モデルに適用することによって、前記顧客の購入意欲を判定する判定手段を具備することを特徴とする請求項1に記載の情報処理装置である。
請求項3の発明は、前記作成手段は、レジカウンター又は店舗の出口における画像内の顧客の体又は顔の特徴と前記抽出手段によって抽出された特徴との照合結果を、前記教師信号として用いることを特徴とする請求項1又は2に記載の情報処理装置である。
請求項の発明は、前記作成手段は、前記商品を前記顧客が触れたか否かを該商品に対する興味があるか否かを示す教師信号として用いることを特徴とする請求項1からのいずれか一項に記載の情報処理装置である。
請求項の発明は、コンピュータを、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する抽出手段と、前記抽出手段によって特徴を抽出した前記顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成する作成手段として機能させ、前記広告は映像を用いたものであり、前記抽出手段は、前記映像の各フレーム時に対応する静止画像における特徴を抽出し、前記作成手段は、前記各フレーム時に対応する静止画像における特徴に前記教師信号による学習モデルを生成し、前記フレーム時に対応する静止画像で購入と判断される度合いが高いフレームを、前記広告の映像において購入効果のあるフレームとして判定する、又は、前記フレーム時に対応する静止画像で購入と判断される度合いが低いフレームを、前記広告の映像において購入効果のないフレームとして判定する判定手段としてさらに機能させるための情報処理プログラムである。
請求項1の情報処理装置によれば、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴に対して、顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成することができる。また、広告の映像において購入効果のあるフレーム、又は、購入効果のないフレームを判定することができる。
請求項2の情報処理装置によれば、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を、学習モデルに適用することによって、顧客の購入意欲を判定することができる。
請求項3の情報処理装置によれば、レジカウンター又は店舗の出口における画像内の顧客の体又は顔の特徴の照合結果を、教師信号として用いることができる。
請求項の情報処理装置によれば、商品を顧客が触れたか否かを、その商品に対する興味があるか否かを示す教師信号として用いることができる。
請求項の情報処理プログラムによれば、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴に対して、顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成することができる。また、広告の映像において購入効果のあるフレーム、又は、購入効果のないフレームを判定することができる。
本実施の形態(情報処理(判定)装置)の構成例についての概念的なモジュール構成図である。 本実施の形態(情報処理(学習)装置)の構成例についての概念的なモジュール構成図である。 本実施の形態(情報処理(判定・学習)装置)の構成例についての概念的なモジュール構成図である。 本実施の形態を実現した場合のシステム構成例を示す説明図である。 本実施の形態(情報処理(判定)装置)による処理例を示すフローチャートである。 本実施の形態(モニタ)による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態(情報処理(学習)装置)による処理例を示すフローチャートである。 教師信号作成モジュール内の構成例とその周辺のモジュールとの関係構成図である。 画像特徴テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 第2の教師信号作成モジュールを加えた場合の本実施の形態の構成例についての概念的なモジュール構成図である。 教師信号テーブルのデータ構造例を示す説明図である。 第3の教師信号作成モジュールを加えた場合の本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態(情報処理(判定)装置)の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、すべての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
以下の説明で用いる用語の説明をする。
二分類器とは、入力に対して排他的な2つのラベルのいずれかを付与する装置であり、例えば、“○”か“×”か等を付与するものである。例えば、サポートベクタマシン、ブースティング等がある。
学習とは、学習データを用いて上記のような二分類器を作成することである。二分類器を複数作成することにより、多分類器を構築することも可能である。
度数とは、対象となるものの個数を示す。
小売業等においては、顧客の購買意欲を刺激するために人による実演販売やキャンペーン動画の提供など様々な広告(以下、プロモーションともいう)を展開している。しかしながらプロモーションが本当に有効なものであるのかを知ることは非常に難しい。アンケート調査等で知ることはできるが、実態を必ずしも反映できているとはいえない。
本実施の形態は、顧客の画像情報を使った学習モデルを作成することにより、そのプロモーションを見ている顧客が対象商品を買うのか買わないのかを事前に予想する。また、複数の顧客の購買意欲に関する予想結果からプロモーションのどの箇所が顧客の購買意欲を活性化させるのに貢献するのか、逆にプロモーションのどの箇所が購買意欲を減退化させるのかを判定する。
図3は、本実施の形態全体を示す図である。本実施の形態は、大きく分けて情報処理(学習)装置200と情報処理(判定)装置100によって構成されている。情報処理(学習)装置200は、画像特徴と教師信号の関係を表現する学習モデルを構築する装置である。情報処理(判定)装置100は、その作成された学習モデルを用いて現在得た画像特徴が購買意欲のあるものかどうかを判定する装置である。さらに、プロモーションにおいて価値のある箇所(つまり顧客の購買意欲を高める箇所)及び価値のない又は修正すべき箇所を選択することもできる。
本実施の形態である情報処理(判定)装置100は、機械学習された学習モデルを用いて顧客の購入意欲を判定するものであって、図1の例に示すように、人・顔検出モジュール130、画像特徴抽出モジュール140、顧客購買意欲判定モジュール150、プロモーション選択モジュール160を有している。顧客購買意欲判定モジュール150は、学習モデル記憶モジュール155を有している。また、情報処理(判定)装置100は、プロモーション装置110、撮像装置120と接続されている。
情報処理(判定)装置100は、例えば、プロモーションを見た顧客に購買意欲があるのか否かを事前に(つまり、実際に対象商品を購入するかどうかを判断する前に)、店員に知らせること等に用いる。
具体的には、プロモーションを見た顧客の動画像を取得しておき、実際にその顧客が対象商品を購入したかどうかを教師信号として学習モデルを作成しておく。そしてそのプロモーションを見た顧客群の動画情報から作成した学習モデルを用いて、プロモーションを見たある顧客が対象商品を購入するかどうかを事前に判断する。
プロモーション装置110は、撮像装置120、情報処理(判定)装置100のプロモーション選択モジュール160と接続されている。プロモーション装置110は、人(販売員等)の実演販売や商品プロモーションビデオをモニタリングする巨大モニタ、スクリーン等の装置である。なお、人の実演販売(パフォーマンス)そのものであってもよい。
撮像装置120は、プロモーション装置110、情報処理(判定)装置100の人・顔検出モジュール130と接続されている。撮像装置120は、プロモーション装置110を見ている顧客を撮像するための装置である。ビデオカメラ等が該当する。
人・顔検出モジュール130は、撮像装置120、画像特徴抽出モジュール140と接続されている。人・顔検出モジュール130は、撮像装置120によって撮像した画像データから人領域(又は顔領域)を抽出する。なお、リアルタイム性はあってもなくてもよい。
画像特徴抽出モジュール140は、人・顔検出モジュール130、顧客購買意欲判定モジュール150と接続されている。画像特徴抽出モジュール140は、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する。具体的には、画像特徴抽出モジュール140は、人(又は顔)と判断した領域から画像特徴を抽出する。例えば、Gabor特徴やHaar特徴、Haar−like特徴などテクスチャに関連した画像特徴等を抽出する。
顧客購買意欲判定モジュール150は、画像特徴抽出モジュール140、プロモーション選択モジュール160と接続されている。顧客購買意欲判定モジュール150は、抽出した画像特徴を入力として学習モデルを使って、対象人物(顧客)に購買意欲があるか否かを判定する。つまり、顧客購買意欲判定モジュール150は、画像特徴抽出モジュール140によって抽出された特徴を、学習モデル記憶モジュール155内の学習モデル(後述する情報処理(学習)装置200の学習モデル作成保存モジュール270によって作成された学習モデル)に適用することによって、顧客の購入意欲を判定する。この購入意欲は、広告の対象となっている商品の購入意欲としてもよい。
学習モデル記憶モジュール155は、後述する情報処理(学習)装置200の学習モデル作成保存モジュール270によって作成された学習モデルを記憶している。顧客購買意欲判定モジュール150は、学習モデル記憶モジュール155内の学習モデルを用いて判定処理を行う。
プロモーション選択モジュール160は、プロモーション装置110、顧客購買意欲判定モジュール150と接続されている。プロモーション選択モジュール160は、複数顧客の購買意欲判定結果(顧客購買意欲判定モジュール150による処理結果)からプロモーションの時間単位での注目プロモーション領域を検出する。なお、プロモーション装置110が人の実演販売そのものである場合は、その人に対して、検出したプロモーションを、液晶ディスプレイ等の表示装置に提示するようにしてもよい。
図2は、本実施の形態(情報処理(学習)装置200)の構成例についての概念的なモジュール構成図である。情報処理(学習)装置200は、顧客の購入意欲を判定できるように、学習モデルを作成するものであって、図2の例に示すように、人・顔検出モジュール230、画像特徴抽出モジュール240、画像特徴DB250、教師信号作成モジュール260、学習モデル作成保存モジュール270を有している。
プロモーション装置210は、撮像装置220と接続されている。プロモーション装置210は、前述のプロモーション装置110と同等のものである。
撮像装置220は、プロモーション装置210、情報処理(学習)装置200の人・顔検出モジュール230と接続されている。撮像装置220は、前述の撮像装置120と同等のものである。
人・顔検出モジュール230は、撮像装置220、画像特徴抽出モジュール240と接続されている。人・顔検出モジュール230は、前述の人・顔検出モジュール130と同等のものである。
画像特徴抽出モジュール240は、人・顔検出モジュール230、画像特徴DB250と接続されている。画像特徴抽出モジュール240は、前述の画像特徴抽出モジュール140と同等のものであり、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する。
画像特徴DB250は、画像特徴抽出モジュール240、教師信号作成モジュール260、学習モデル作成保存モジュール270と接続されている。画像特徴DB250は、画像特徴抽出モジュール240によって抽出された画像特徴等を格納するデータベースである。
教師信号作成モジュール260は、画像特徴DB250、学習モデル作成保存モジュール270と接続されている。教師信号作成モジュール260は、対象としている人物(顧客)が対象商品を購入したか否かの情報を作成する。
学習モデル作成保存モジュール270は、画像特徴DB250、教師信号作成モジュール260、情報処理(判定)装置100の学習モデル記憶モジュール155と接続されている。学習モデル作成保存モジュール270は、画像特徴抽出モジュール240によって特徴を抽出した顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成する。学習モデルの作成として、例えば、ニューラルネットワークサポートベクタマシン等を利用すればよい。また、画像特徴抽出モジュール240によって特徴が抽出された顧客が、プロモーションが対象としている商品を購買したか否かを示す情報を教師信号として、学習モデルを作成してもよい。そして、作成した学習モデルを、情報処理(判定)装置100の学習モデル記憶モジュール155に記憶させる。
また、ここで、教師信号に関して、レジカウンター又は店舗の出口における画像内の顧客の体又は顔の特徴と画像特徴抽出モジュール240によって抽出された特徴との照合結果を、教師信号として用いるようにしてもよい。例えば、レジカウンターにおける画像内の顧客は購入した者とし、それ以外の顧客は購入していない者としてもよい。さらに、店舗の出口における画像内の顧客であって、それ以前のレジカウンターにおける画像内の顧客以外の顧客は、購入していない者としてもよい。この教師信号の作成処理については、図9、図15の例を用いて後述する。
また、学習モデル作成保存モジュール270は、商品を顧客が触れた(手にする、手にもつ等)か否かを、その商品に対する興味があるか否かを示す教師信号として用いるようにしてもよい。この教師信号の作成処理については、図13の例を用いて後述する。
また、広告は映像を用いたものである場合には、次のような処理を行うようにしてもよい。
画像特徴抽出モジュール240は、その映像の各フレーム時に対応する静止画像における特徴を抽出する。
そして、学習モデル作成保存モジュール270は、各フレーム時に対応する静止画像における特徴に教師信号による学習モデルを生成するようにしてもよい。
そして、その学習モデルを図1の例に示した情報処理(判定)装置100で利用した場合、その情報処理(判定)装置100のプロモーション選択モジュール160は、フレーム時に対応する静止画像で購入と判断される度合いが高いフレームを、広告の映像において購入効果のあるフレームとして判定する、又は、フレーム時に対応する静止画像で購入と判断される度合いが低いフレームを、広告の映像において購入効果のないフレームとして判定するようにしてもよい。この判定処理については、図11、図12の例を用いて後述する。
前述の学習モデルで、顧客の静止画像に基づいて学習しておき、そのプロモーションを見ている顧客の静止画像情報に基づいて逐次、顧客がその商品を購入しそうかしないかを判定する。多くの顧客が「購入しない」の状態から「購入する」の状態に移行する時間に対応するプロモーションがよいプロモーションだと判断する。そして、例えば、プロモーションのその部分を強調するようにしてもよい。逆に、「購入する」の状態から「購入しない」の状態に移行する時間に対応する部分のプロモーションが悪い部分のプロモーションだと判断する。そして、例えば、プロモーションのその部分を改善点として指摘するようにしてもよい。
図3は、本実施の形態(情報処理(判定・学習)装置300)の構成例についての概念的なモジュール構成図である。
情報処理(判定・学習)装置300は、情報処理(判定)装置100、情報処理(学習)装置200を有しており、一体化させたものである。つまり、情報処理(判定・学習)装置300の情報処理(学習)装置200が学習モデルを作成し、情報処理(判定)装置100がその学習モデルを用いて判定処理を行う。
なお、プロモーション装置110とプロモーション装置210、撮像装置120と撮像装置220、人・顔検出モジュール130と人・顔検出モジュール230、画像特徴抽出モジュール140と画像特徴抽出モジュール240をそれぞれ有しているが、いずれか一方であってもよい。つまり、情報処理(判定)装置100と情報処理(学習)装置200で、それらのモジュールを共有して利用してもよい。
図4は、本実施の形態を実現した場合のシステム構成例を示す説明図である。
店舗システム400A、店舗システム400B、店舗システム400C、店舗システム400D、店舗(学習)システム410A、情報処理(判定)装置100E、情報処理(学習)装置200B等が通信回線290を介して接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット等であってもよい。
店舗システム400Aは、情報処理(判定)装置100A、プロモーション装置110A、撮像装置120Aを有している。店舗システム400Bは、情報処理(判定)装置100B、プロモーション装置110B、撮像装置120Bを有している。店舗システム400Cは、プロモーション装置110C、撮像装置120Cを有している。店舗システム400Dは、プロモーション装置110D、撮像装置120Dを有している。店舗(学習)システム410Aは、情報処理(学習)装置200A、プロモーション装置210A、撮像装置220Aを有している。
例えば、各店舗内にプロモーション装置110、撮像装置120、情報処理(判定)装置100の組み合わせ(例えば、店舗システム400A、店舗システム400B)を有していてもよい。また、プロモーション装置110、撮像装置120の組み合わせ(例えば、店舗システム400C、店舗システム400D)を有して、情報処理(判定)装置100Eによって判定させてもよい。その判定結果を各店舗内のパーソナルコンピュータ等の情報処理装置に送信するようにしてもよい。
また、学習モデル作成用にプロモーション装置210、撮像装置220、情報処理(学習)装置200の組み合わせ(例えば、店舗(学習)システム410A)を有していてもよいし、各店舗内の撮像装置120、撮像装置220から、映像を受信して、情報処理(学習)装置200Bによって学習モデルを作成してもよい。そして、情報処理(学習)装置200A又は情報処理(学習)装置200Bによって作成された学習モデルを情報処理(判定)装置100A、情報処理(判定)装置100B、情報処理(判定)装置100Eに送信する。
なお、図3の例に示した情報処理(判定・学習)装置300を通信回線290に接続させるようにしてもよい。
図5は、本実施の形態(情報処理(判定)装置100)による処理例を示すフローチャートである。
ステップS502では、プロモーション装置110が、プロモーションを開始する。具体的には、図6の例を用いて後述する。
ステップS504では、撮像装置120が、プロモーション装置110の近辺にいる顧客を撮影する。
ステップS506では、人・顔検出モジュール130が、画像から人又は顔の領域を検出する。
ステップS508では、画像特徴抽出モジュール140が、人又は顔の領域内の特徴を抽出する。
ステップS510では、顧客購買意欲判定モジュール150が、特徴を学習モデル記憶モジュール155内の学習モデルに適用して顧客の購買意欲を判定する。
ステップS512では、プロモーション選択モジュール160が、判定結果にしたがって、プロモーションを選択する。
ステップS514では、プロモーション選択モジュール160が、最後であるか否かを判断し、最後である場合は処理を終了し(ステップS599)、それ以外の場合はステップS502へ戻る。
図6は、本実施の形態(モニタ610)による処理例を示す説明図である。
モニタ610は、プロモーション装置110、プロモーション装置210の例であり、撮像装置620は、撮像装置120、撮像装置220の例である。
プロモーションには様々な形態があるが、ここでは、大きなモニタに対象商品のプロモーションとしてのビデオが流れているものを例にあげる。そして、このモニタ610で繰り返し同じプロモーションビデオが流れている場合を想定するが、例えば、複数種類のキャンペーン動画を顧客がボタン等で選択する形式のものでもよい。モニタ610にはビデオカメラなどの撮像装置620が取り付けられており、キャンペーン動画を見る顧客600を捉えることができる。撮像対象となる顧客600は複数人が同時に映っていてもよい。撮像装置620で撮像された画像は人・顔検出モジュール230に送られる。
図7は、本実施の形態による処理例を示す説明図である。
人・顔検出モジュール130、230は、撮像装置120、220から送られてきた画像から人や人の顔を検出するモジュールである。対象となる画像はフレーム毎に区切られた静止画像でも動画像であってもよい。人や人の顔を抽出する方法は既存技術を使うものとする。例えば、顔画像の抽出として、
非特許情報:P.Viola and MJ.Jones, ”Robust Real−Time Face Detection.”,IJCV, 57(2), 2004.
人画像の抽出として、
非特許情報:N.Dalal and B.Triggs, ”Histograms of Oriented Gradients for Human Detection.”,CVPR, 2005.
等に記載の技術を使うことによって実現できる。こうして獲得された人物領域は画像中の矩形領域として検出される。図7はその例であり、図7(A)は顔領域検出の例を示しており、図7(B)は人領域検出の例を示している。例えば、画像710から顧客602の顔領域712、顧客604の顔領域714を抽出している。画像720から顧客606の人領域726、顧客608の人領域728を抽出している。
次に、選択した矩形領域から画像特徴抽出モジュール140、240において、画像特徴を抽出する。この画像特徴は、人物検出に用いた画像特徴を用いてもよいし、別の画像特徴を用いてもよい。画像特徴は、静止画フレームに対して抽出するものとし、1つの矩形領域に対して1つの画像特徴を抽出する。簡単のため、人・顔検出モジュール130、230では、特定人物が映っている間、とり逃しフレームが存在しないと仮定する。人物HがフレームF1〜Fnに映っているものとし、フレームFiから抽出した人物画像特徴をfiとする。f1〜fnから顧客Hに対する画像特徴fを生成する。生成方法としては、各fiの統計値(例えば、平均値、中央値、最頻値等)を取ったり、画像特徴fiの特徴次元をdとして画像特徴をnxd次元の行列Lとして表現し、事前にdxn次元の行列Kを作成することでf=K*Lとする等の方法がある。また、別の形態として、fを作成せずに、n個の画像特徴f1〜fnをそのまま利用する手法であってもよい。
画像特徴抽出モジュール140で抽出した画像特徴fは、顧客購買意欲判定モジュール150に渡される。画像特徴抽出モジュール240で抽出した画像特徴fは、画像特徴DB250に蓄えられる。
図8は、本実施の形態(情報処理(学習)装置200)による処理例を示すフローチャートである。
ステップS802では、プロモーション装置210が、プロモーションを開始する。
ステップS804では、撮像装置220が、プロモーション装置210の近辺にいる顧客を撮影する。
ステップS806では、人・顔検出モジュール230が、画像から人又は顔の領域を検出する。
ステップS808では、画像特徴抽出モジュール240が、人又は顔の領域内の特徴を抽出し、その特徴を画像特徴DB250に記憶させる。
ステップS810では、教師信号作成モジュール260が、教師信号を作成する。
ステップS812では、学習モデル作成保存モジュール270が、画像特徴DB250内の特徴と教師信号により学習モデルを作成する。
ステップS814では、学習モデル作成保存モジュール270が、学習モデルを各情報処理(判定)装置100の学習モデル記憶モジュール155に記憶させる。
教師信号作成モジュール260は、実際に顧客Hが対象商品を購入したか否かの情報を入手するモジュールである。対象商品を購入したか否かは、顧客Hがレジカウンターを通過したか否かによって判定可能である。顧客Hを特定する手法として、例えば、次のように行ってもよい。
(1)画像特徴を使う、
(2)ポイントカード、クレジットカード等の各種カードを使う手法、
がある。
画像特徴を使う場合、既存技術である顔照合技術を使う方法が使用可能である。撮像装置620において撮像した顔画像とレジカウンターで撮像した顔画像とを照合し、レジカウンターにおいて顧客Hを特定する。また、プロモーション装置(モニタ610)からレジカウンターまで人物を追跡し続けることによって、顧客Hを認証することも可能である。
図9の例は、顔画像を用いて個人認証する場合の処理例を示している。図9は、教師信号作成モジュール260内の構成例とその周辺のモジュールとの関係構成図である。プロモーション装置210、撮像装置220、顔検出モジュール930、画像特徴抽出モジュール240、画像特徴DB250、教師信号作成モジュール260の関係例を示したものである。前述の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。なお、図9に示す例は、図2に示す例の人・顔検出モジュール230を顔画像を主な対象とする顔検出モジュール930(人・顔検出モジュール230内の機能のうち、顔画像に関する処理を行うモジュール)としたものであるが、人・顔検出モジュール230を人画像を主な対象とする人検出モジュールとしてもよい。その場合、顔検出モジュール964、顔照合モジュール966を、それぞれ人検出モジュール、人照合モジュールとすればよい。また、図9の例では顔検出モジュール930と画像特徴DB250を接続しているが、図2の例と同様に画像特徴抽出モジュール240を介して接続するようにしてもよいし、逆に、図2の例に示す人・顔検出モジュール230と画像特徴DB250を接続するようにしてもよい。つまり、人・顔検出モジュール230による処理結果を画像特徴DB250に記憶させるようにしてもよい。以下、照合のために顔画像を用いる場合の例を示す。
画像特徴DB250は、顔検出モジュール930、画像特徴抽出モジュール240、教師信号作成モジュール260の顔照合モジュール966と接続されている。画像特徴DB250は、顔検出モジュール930の処理結果である顔画像の領域、その顔画像に対する画像特徴抽出モジュール240による処理結果を記憶している。顔情報は、顔画像又は顔画像特徴である(顔画像特徴と前述の画像特徴fが一致する場合もありうる)。顔情報はフレーム毎に入手できるが、照合に必要な数フレーム分保存しておけばよい。
教師信号作成モジュール260は、レジ撮像装置962、顔検出モジュール964、顔照合モジュール966を有している。教師信号作成モジュール260による処理結果を学習モデル作成保存モジュール270に渡す。
レジ撮像装置962は、顔検出モジュール964と接続されている。レジ撮像装置962は、レジカウンターの周囲(又は購入する顧客)を撮影する。
顔検出モジュール964は、レジ撮像装置962、顔照合モジュール966と接続されている。顔検出モジュール964は、レジ撮像装置962によって撮影された画像から、顔検出モジュール930(人・顔検出モジュール230内の機能のうち、顔画像に関する処理)と同等の処理を行い、顔画像を検出する。
顔照合モジュール966は、顔検出モジュール964、画像特徴DB250と接続されている。顔照合モジュール966は、現在レジカウンターにいる顧客と画像特徴DB250にあるデータとの照合処理を行う。レジカウンターにいる顧客の画像特徴が画像特徴DB250のデータと一致する場合、その顧客が対象となる商品を購入したことを示す情報を画像特徴DB250に記憶する。
図10に示す例は、画像特徴DB250に格納されているデータの一例を示す。図10は、画像特徴テーブル1000のデータ構造例を示す説明図である。画像特徴テーブル1000は、顧客ID欄1010、顔画像特徴欄1020、顔画像欄1030、プロモーションの種類欄1040、画像特徴欄1050、購入・非購入欄1060を有している。顧客ID欄1010は、本実施の形態において、顧客を一意に識別するための情報(顧客ID:IDentification)を記憶している。顔画像特徴欄1020は、その顧客IDの顧客の顔画像特徴を記憶している。顔画像欄1030は、その顧客の顔画像を記憶している。顔画像そのものであってもよいし、その顔画像のファイル名等であってもよい。プロモーションの種類欄1040は、その顧客が見たプロモーションの種類を示す情報記憶している。画像特徴欄1050は、画像特徴を記憶している。購入・非購入欄1060は、プロモーションの対象としている商品毎に、購入・非購入を示す情報を記憶している。つまり、顧客が参加したプロモーションの種類とその画像特徴及び、購入又は非購入の情報が入っており、購入/非購入が確定していない場合は空欄になっている。顔画像特徴、顔画像は少なくとも1つあればよく、照合精度を向上させるため、複数の顔画像特徴及び顔画像を登録することができる。顧客がレジカウンターを通過しない場合、教師信号を画像特徴DB250に付与することはできない。画像特徴が画像特徴DB250に保存されてから予め定められた時間後に教師信号が得られない場合は、“非購入”のラベルを付与するようにしてもよい。
一方、人物照合を顔画像を用いないで、各種カードや指紋認証等を使用するようにしてもよい。この場合、次のような処理を行えばよい。顧客がプレゼンテーションを見る直前等に各種認証方法で個人を特定し、画像特徴と顧客を関連付ける。さらに、レジカウンターで精算をする際に、カード等にて個人を特定し、画像特徴と照合させる等の処理を行う。このような処理の結果、画像特徴DB250の中では、画像特徴と購入・非購入の対からなる学習データが作成される。
次に、学習モデル作成保存モジュール270は、前述の学習データを用いて学習モデル(判定モデル)を作成し、その学習モデルを保存する。教師信号が購入と非購入しかない場合、汎用的な二分類器(例えば、サポートベクタマシン、ブースティング等)を用いて、学習モデルを構築する。作成した学習モデルは、情報処理(判定)装置100の学習モデル記憶モジュール155に記憶させる。例えば、サーバコンピュータのストレージ等に格納しておき、情報処理(判定)装置100の顧客購買意欲判定モジュール150は、そのストレージ等から学習モデルを学習モデル記憶モジュール155にダウンロードする。また、対象プロモーションが複数に及ぶ場合、学習モデルはそのプロモーションの数だけ作成される。以上が情報処理(学習)装置200の説明である。
次に情報処理(判定)装置100について説明する。情報処理(判定)装置100で実施することは、以下の2つである。
1)プロモーションを見ている顧客が対象商品を購入しそうか否かを予想すること、
2)プロモーションの中で良い箇所と悪い箇所を発見すること、
画像特徴抽出モジュール140は、対象プロモーションPを見ている顧客の画像特徴を抽出する。使用する画像特徴の種類は学習モデル作成の時と同じものを使う。対象顧客のプロモーションPに対する画像特徴がすでに存在する場合、対象顧客のデータは学習モデルの中で使われているので使用しない(例えば、同じプロモーションに対して複数回訪れた顧客が該当する)。得られた画像特徴を、顧客購買意欲判定モジュール150は、学習モデルに入力してその出力を得る。その出力値は“購入する”又は“購入しない”のいずれかを示すラベルの値である。例えば、プロモーションを見た顧客が“購入しない”と判定した場合には、その判定結果を店舗内のパーソナルコンピュータに送信し、判定結果を通知された店員はその顧客に商品を購入してもらえるようなアプローチをかけることが可能となる。
次にプロモーションの中の良い箇所・悪い箇所を特定する手法について説明する。つまり、顧客に影響を与えるプロモーションの時間位置(開始何秒後など)を特定し、プロモーションを改善するために行う処理である。
その際、学習モデルを作成するための画像特徴は、複数フレームの出力値を変換して1つにまとめたものではなく、各フレームから抽出した画像特徴を使う。つまり、あるプロモーションPを見た顧客Hに対する画像フレームからの画像特徴fiをすべて使うものとし、教師信号として実際に対象商品を購入したか否かを示す情報を付与するものとする。つまり、プロモーションP、顧客Hに関連付けされる画像特徴には、すべて同一のラベルが教師信号として付与される。又は、すべての画像特徴を使うのではなく、購入・非購入の判定に重要だと思われる対象フレームの後半に対する画像特徴を学習データの対象としてもよい。なお、ここでの後半とは、プロモーションの開始から予め定められた時間以降をいう。これらを用いて、学習モデルを前述の説明と同様に構成する。
次に、あるプロモーションPを見ている顧客の画像特徴を抽出し、それを学習モデルの入力データとすることで、“購入”又は“非購入”の予想ラベルをフレーム毎に付与する。このようなデータを、複数人分収集する。図11に示す例は、プロモーションビデオの時間軸に対して、“購入”と判定された画像(静止画像)を何枚収集できたかを示す図である。p番目のフレームFpに対する画像特徴で“購入”と判定された度数が最も大きく、またq番目のフレームFqに対する画像特徴で“非購入”と判定された度数が最も小さいとする。このとき、Fp周辺のフレームが良いプロモーションだと判定し、Fq周辺のフレームが悪いプロモーションだと判定する。図11の例では、度数が最大のところ、及び最小のところのみに着目したが、図11の度数分布で極大及び極小をとる時間軸を抽出して、極大周辺のフレームは良いプロモーション、極小周辺のプロモーションは悪いプロモーションと判定するようにしてもよい。図12に示す例では、極大値がp1,p2,p3であり、極小値がq1,q2となっており、それぞれの極値を中心として良いフレーム、悪いフレームを判定することで、良いプロモーションと悪いプロモーションを抽出する。又は、プロモーションPを見て良いと判定された画像の総数をフレーム数で割ったもの(特定フレームを見て“購入”と判定する平均枚数)が予め定められた閾値A以上の場合、そのプロモーション自体が良いプロモーション、予め定められた閾値B未満の場合、悪いプロモーションと判定するようにしてもよい。閾値Aと閾値Bは、同じ値であってもよいし、異なる値であってもよい。
以上の説明では教師信号は“購入”か“非購入”の二択であった。“非購入”でも実際に対象商品を手に取ったかなど商品に関心を示したか否かの情報は、購買意欲という観点において重要な情報である。よって、“非購入だが関心がある”という教師信号を作成し、“非購入(関心示さず)”、“非購入(関心あり)”、“購入(明らかに関心あり)”の3つの教師信号を作成する例を示す。
図13は、第2の教師信号作成モジュール1360を加えた場合の本実施の形態の構成例についての概念的なモジュール構成図である。つまり、第二の教師信号を得るための説明図である。図9の例に教師信号作成モジュール1360を加えたものである。
教師信号作成モジュール1360は、商品設置場所撮像装置1362、顔検出モジュール1364、行動検出モジュール1366を有している。
画像特徴DB250は、顔検出モジュール930、画像特徴抽出モジュール240、教師信号作成モジュール260の顔照合モジュール966、教師信号作成モジュール1360の顔検出モジュール1364、行動検出モジュール1366と接続されている。
商品設置場所撮像装置1362は、顔検出モジュール1364、行動検出モジュール1366と接続されている。商品設置場所撮像装置1362は、商品の設置場所(商品売り場)に設置されており、その場所にいる顧客を撮影する。ここでの商品は、プロモーションの対象となっている商品であってもよい。
顔検出モジュール1364は、商品設置場所撮像装置1362、画像特徴DB250、教師信号作成モジュール260の顔照合モジュール966と接続されている。顔検出モジュール1364は、商品設置場所撮像装置1362によって撮影された画像から、顔検出モジュール930と同等の処理を行い、顔画像を検出する。
行動検出モジュール1366は、商品設置場所撮像装置1362、画像特徴DB250、教師信号作成モジュール260の顔照合モジュール966と接続されている。行動検出モジュール1366は、商品設置場所撮像装置1362によって撮影された画像から、対象としている商品を顧客が触れたことを検出する。
具体的に説明する。
“非購入(関心あり)”の教師信号を作成するために、対象商品設置場所にビデオカメラ等の撮像装置220を設置して、近づいてきた顧客の顔を検出する。先にプロモーション装置210を見た顧客のみを対象とする場合、画像特徴DB250に保存されていない顔は検出対象から省いてもよい。又は、プロモーション装置210を見る前に対象商品設置場所に訪れる顧客も対象にする場合、検出した顔画像特徴及び行動検出モジュール1366で判定した対象商品に興味があるか否かを示す情報を画像特徴DB250に記憶させておき、プロモーション装置210設置場所に、その顧客が訪れたか否かの判断を行う。行動検出モジュール1366では視線検出や手検出を行い、
1)対象商品に触れたか、
2)どのくらいの時間、対象商品設置場所に滞在したか、
等の情報から総合的に顧客が対象商品に興味があるか否かを判定する。
図14に示す例は、図13の例に示すように教師信号作成モジュール1360を導入したことにより、図10の例に示した画像特徴テーブル1000に加えて画像特徴DB250に記憶される情報を示す。図14は、教師信号テーブル1400のデータ構造例を示す説明図である。教師信号テーブル1400は、顧客ID欄1410、顔画像特徴欄1420、顔画像欄1430、プロモーション(対象商品)の種類欄1440、関心あり・なし欄1450を有している。顧客ID欄1410は、顧客IDを記憶している。顔画像特徴欄1420は、その顧客IDの顧客の顔画像特徴を記憶している。顔画像欄1430は、その顧客の顔画像を記憶している。プロモーション(対象商品)の種類欄1440は、プロモーション(対象商品)の種類を記憶している。関心あり・なし欄1450は、プロモーションの対象としている商品毎に、関心あり・関心なしを示す情報を記憶している。
教師信号作成モジュール1360からの情報の中で、顔情報(顔画像特徴欄1420、顔画像欄1430)はプロモーション装置210で入手した顔情報との照合のみに必要であり、顔情報は、顔照合モジュール966による照合が終了すれば、画像特徴DB250から削除してもよい。照合の際、最終的に必要な情報は“関心ある・関心なし”に関する情報のうち、“関心がある”という情報であり、“関心がある”にもかかわらず実際に対象商品を購入しなかったという教師信号を得ることである。また、先に対象商品設置場所に行って、予め定められた時間以内に、プロモーション装置210に向かわない顧客は、画像特徴DB250から削除の対象とするようにしてもよい。
以上の処理例により、3つの教師信号からなる学習モデルを同様に作成し、プロモーションを見ている顧客の画像情報から、事前に“興味があるが購入しないだろう”という予想を得る。そして、非購入が予想される客の中から対象商品に関心がありそうな顧客を絞り込むことができる。これによって、さらに別の対応を事前に実施することができる。
また、別の処理例として顧客の分類をする際に、プロモーション装置210からの画像だけでなく、対象商品に関心を示したか否かの情報を教師信号作成モジュール1360同様の手法で入手し、“関心がありそう”に関する判定精度をさらに上昇させるようにしてもよい。
なお、学習モデルを作成する際には、所謂one−vs−allの識別器を2つ(例えば“購入”と「それ以外」の識別器、「それ以外」をさらに“関心あり”と“関心なし”の識別器)構築することによって学習モデルを作成することができる。
図15は、第3の教師信号作成モジュール1560を加えた場合の本実施の形態の構成例についての概念的なモジュール構成図である。図9の例に教師信号作成モジュール1560を加えたものである。店舗等の出口に、ビデオカメラ等の出口撮像装置1562を設置して、レジカウンターを通過しないで出口から出た人物の顔情報から“非購入”のラベルを付与するようにしてもよい。
教師信号作成モジュール1560は、出口撮像装置1562、顔検出モジュール1564を有している。
出口撮像装置1562は、顔検出モジュール1564と接続されている。出口撮像装置1562は、店舗等の出口に設置されており、店舗等から出る顧客を撮影する。
顔検出モジュール1564は、出口撮像装置1562、教師信号作成モジュール260の顔照合モジュール966と接続されている。顔検出モジュール1564は、出口撮像装置1562によって撮影された画像から、顔検出モジュール930と同等の処理を行い、顔画像を検出する。
顔照合モジュール966は、顔検出モジュール964、画像特徴DB250、顔検出モジュール1564と接続されている。顔照合モジュール966は、図9の例で示した顔照合モジュール966の処理に加えて、顔検出モジュール1564によって検出された顧客の顔画像の特徴と、レジカウンターにいた顧客の顔画像の特徴が合致しない場合、顔検出モジュール1564によって検出された顧客は、商品を購入しなかったことを示す情報を画像特徴DB250に記憶する。
図16を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図16に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部1617と、プリンタ等のデータ出力部1618を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1601は、前述の実施の形態において説明した各種のモジュール、すなわち、人・顔検出モジュール130、画像特徴抽出モジュール140、顧客購買意欲判定モジュール150、プロモーション選択モジュール160、人・顔検出モジュール230、画像特徴抽出モジュール240、教師信号作成モジュール260、学習モデル作成保存モジュール270、顔検出モジュール930、レジ撮像装置962、顔検出モジュール964、顔照合モジュール966、商品設置場所撮像装置1362、顔検出モジュール1364、行動検出モジュール1366、出口撮像装置1562、顔検出モジュール1564等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1602は、CPU1601が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1603は、CPU1601の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス1604により相互に接続されている。
ホストバス1604は、ブリッジ1605を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス1606に接続されている。
キーボード1608、マウス等のポインティングデバイス1609は、操作者により操作される入力デバイスである。ディスプレイ1610は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1611は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1601によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、画像、画像内の顧客の人又は顔の特徴、教師信号、学習モデル等が格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1612は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1613に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1607、外部バス1606、ブリッジ1605、及びホストバス1604を介して接続されているRAM1603に供給する。リムーバブル記録媒体1613も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1614は、外部接続機器1615を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1614は、インタフェース1607、及び外部バス1606、ブリッジ1605、ホストバス1604等を介してCPU1601等に接続されている。通信部1616は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1617は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1618は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図16に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図16に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図16に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等に組み込まれていてもよい。
また、前述の実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…情報処理(判定)装置
110…プロモーション装置
120…撮像装置
130…人・顔検出モジュール
140…画像特徴抽出モジュール
150…顧客購買意欲判定モジュール
155…学習モデル記憶モジュール
160…プロモーション選択モジュール
200…情報処理(学習)装置
210…プロモーション装置
220…撮像装置
230…人・顔検出モジュール
240…画像特徴抽出モジュール
250…画像特徴DB
260…教師信号作成モジュール
270…学習モデル作成保存モジュール
290…通信回線
300…情報処理(判定・学習)装置
400…店舗システム
410…店舗(学習)システム
930…顔検出モジュール
962…レジ撮像装置
964…顔検出モジュール
966…顔照合モジュール
1360…教師信号作成モジュール
1362…商品設置場所撮像装置
1364…顔検出モジュール
1366…行動検出モジュール
1560…教師信号作成モジュール
1562…出口撮像装置
1564…顔検出モジュール

Claims (5)

  1. 商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する抽出手段と、
    前記抽出手段によって特徴を抽出した前記顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成する作成手段
    を具備し、
    前記広告は映像を用いたものであり、
    前記抽出手段は、前記映像の各フレーム時に対応する静止画像における特徴を抽出し、
    前記作成手段は、前記各フレーム時に対応する静止画像における特徴に前記教師信号による学習モデルを生成し、
    前記フレーム時に対応する静止画像で購入と判断される度合いが高いフレームを、前記広告の映像において購入効果のあるフレームとして判定する、又は、前記フレーム時に対応する静止画像で購入と判断される度合いが低いフレームを、前記広告の映像において購入効果のないフレームとして判定する判定手段
    をさらに具備することを特徴とする情報処理装置。
  2. 商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する第2の抽出手段と、
    前記第2の抽出手段によって抽出された特徴を、前記作成手段によって作成された学習モデルに適用することによって、前記顧客の購入意欲を判定する判定手段
    を具備することを特徴とする請求項1に記載の情報処理装置。
  3. 前記作成手段は、レジカウンター又は店舗の出口における画像内の顧客の体又は顔の特徴と前記抽出手段によって抽出された特徴との照合結果を、前記教師信号として用いる
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記作成手段は、前記商品を前記顧客が触れたか否かを該商品に対する興味があるか否かを示す教師信号として用いる
    ことを特徴とする請求項1からのいずれか一項に記載の情報処理装置。
  5. コンピュータを、
    商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する抽出手段と、
    前記抽出手段によって特徴を抽出した前記顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成する作成手段
    として機能させ
    前記広告は映像を用いたものであり、
    前記抽出手段は、前記映像の各フレーム時に対応する静止画像における特徴を抽出し、
    前記作成手段は、前記各フレーム時に対応する静止画像における特徴に前記教師信号による学習モデルを生成し、
    前記フレーム時に対応する静止画像で購入と判断される度合いが高いフレームを、前記広告の映像において購入効果のあるフレームとして判定する、又は、前記フレーム時に対応する静止画像で購入と判断される度合いが低いフレームを、前記広告の映像において購入効果のないフレームとして判定する判定手段
    としてさらに機能させるための情報処理プログラム。
JP2014179880A 2014-09-04 2014-09-04 情報処理装置及び情報処理プログラム Expired - Fee Related JP6428062B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014179880A JP6428062B2 (ja) 2014-09-04 2014-09-04 情報処理装置及び情報処理プログラム
PCT/JP2015/052270 WO2016035351A1 (ja) 2014-09-04 2015-01-28 情報処理装置、情報処理プログラム、情報処理方法及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014179880A JP6428062B2 (ja) 2014-09-04 2014-09-04 情報処理装置及び情報処理プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017075119A Division JP6418270B2 (ja) 2017-04-05 2017-04-05 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2016053869A JP2016053869A (ja) 2016-04-14
JP6428062B2 true JP6428062B2 (ja) 2018-11-28

Family

ID=55439426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014179880A Expired - Fee Related JP6428062B2 (ja) 2014-09-04 2014-09-04 情報処理装置及び情報処理プログラム

Country Status (2)

Country Link
JP (1) JP6428062B2 (ja)
WO (1) WO2016035351A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2018066300A1 (ja) * 2016-10-07 2019-08-08 日本電気株式会社 バリデーションシステム、バリデーションの実施方法およびバリデーション用プログラム
US10810461B2 (en) 2017-02-03 2020-10-20 Panasonic Intellectual Property Management Co., Ltd. Learned model generating method, learned model generating device, and learned model use device
CN109299715B (zh) * 2017-07-24 2021-07-13 图灵通诺(北京)科技有限公司 基于卷积神经网络的图像识别技术的结算方法和装置
KR102610494B1 (ko) * 2020-12-31 2023-12-06 주식회사 메이아이 엣지 컴퓨팅 환경에서 영상에 기초하여 방문객을 분석하기 위한 방법, 디바이스 및 비일시성의 컴퓨터 판독 가능한 기록 매체

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355453A (ja) * 2003-05-30 2004-12-16 Matsushita Electric Ind Co Ltd マーケティング用情報取得システム
US8219438B1 (en) * 2008-06-30 2012-07-10 Videomining Corporation Method and system for measuring shopper response to products based on behavior and facial expression
WO2013018913A1 (ja) * 2011-08-04 2013-02-07 日本電気株式会社 映像処理システム、視聴者の嗜好判定方法、映像処理装置およびその制御方法と制御プログラム

Also Published As

Publication number Publication date
WO2016035351A1 (ja) 2016-03-10
JP2016053869A (ja) 2016-04-14

Similar Documents

Publication Publication Date Title
US8351647B2 (en) Automatic detection and aggregation of demographics and behavior of people
US20190108551A1 (en) Method and apparatus for customer identification and tracking system
US7267277B2 (en) Method and system for targeted marketing by leveraging video-based demographic insights
US8295597B1 (en) Method and system for segmenting people in a physical space based on automatic behavior analysis
JP5238933B2 (ja) 客層付販売情報生成システム
US20120140069A1 (en) Systems and methods for gathering viewership statistics and providing viewer-driven mass media content
WO2019093293A1 (ja) 接客支援装置、接客支援方法、及びコンピュータ読み取り可能な記録媒体
JP6428062B2 (ja) 情報処理装置及び情報処理プログラム
JP6500374B2 (ja) 画像処理装置及び画像処理プログラム
JP6418270B2 (ja) 情報処理装置及び情報処理プログラム
US11615430B1 (en) Method and system for measuring in-store location effectiveness based on shopper response and behavior analysis
JP6520218B2 (ja) 情報処理装置及び情報処理プログラム
JP2017083980A (ja) 行動分析装置及びシステム及び方法
WO2013095923A1 (en) Utilizing real-time metrics to normalize an advertisement based on consumer reaction
JP7294663B2 (ja) 接客支援装置、接客支援方法、及びプログラム
US20150363822A1 (en) Splitting a purchase panel into sub-groups
WO2015003287A1 (zh) 一种行为辨识及追踪系统及其运作方法
US20160042362A1 (en) Recording purchase behavior using device with multiple feedback and input modalities
TW201502999A (zh) 一種行為辨識及追蹤系統
JP6476678B2 (ja) 情報処理装置及び情報処理プログラム
JP6112156B2 (ja) 行動分析装置及び行動分析プログラム
US20130290107A1 (en) Behavior based bundling
WO2020016861A1 (en) Method and system for conducting electronic commerce and retailing using emotion detection
US20230101275A1 (en) Audited training data for an item recognition machine learning model system
JP6944020B2 (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181015

R150 Certificate of patent or registration of utility model

Ref document number: 6428062

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees