JP6428062B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP6428062B2 JP6428062B2 JP2014179880A JP2014179880A JP6428062B2 JP 6428062 B2 JP6428062 B2 JP 6428062B2 JP 2014179880 A JP2014179880 A JP 2014179880A JP 2014179880 A JP2014179880 A JP 2014179880A JP 6428062 B2 JP6428062 B2 JP 6428062B2
- Authority
- JP
- Japan
- Prior art keywords
- customer
- module
- frame
- face
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 84
- 238000000605 extraction Methods 0.000 claims description 50
- 238000012545 processing Methods 0.000 claims description 36
- 230000000694 effects Effects 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 9
- 238000001514 detection method Methods 0.000 description 97
- 238000003384 imaging method Methods 0.000 description 60
- 238000000034 method Methods 0.000 description 40
- 238000003860 storage Methods 0.000 description 30
- 238000010586 diagram Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 18
- 238000011156 evaluation Methods 0.000 description 18
- 238000009434 installation Methods 0.000 description 13
- 230000004044 response Effects 0.000 description 13
- 230000008450 motivation Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 9
- 230000006399 behavior Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 230000001815 facial effect Effects 0.000 description 4
- 230000001737 promoting effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 241000405217 Viola <butterfly> Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003727 cerebral blood flow Effects 0.000 description 1
- 238000006757 chemical reactions by type Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
請求項1の発明は、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する抽出手段と、前記抽出手段によって特徴を抽出した前記顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成する作成手段を具備し、前記広告は映像を用いたものであり、前記抽出手段は、前記映像の各フレーム時に対応する静止画像における特徴を抽出し、前記作成手段は、前記各フレーム時に対応する静止画像における特徴に前記教師信号による学習モデルを生成し、前記フレーム時に対応する静止画像で購入と判断される度合いが高いフレームを、前記広告の映像において購入効果のあるフレームとして判定する、又は、前記フレーム時に対応する静止画像で購入と判断される度合いが低いフレームを、前記広告の映像において購入効果のないフレームとして判定する判定手段をさらに具備することを特徴とする情報処理装置である。
図1は、本実施の形態(情報処理(判定)装置)の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、すべての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
二分類器とは、入力に対して排他的な2つのラベルのいずれかを付与する装置であり、例えば、“○”か“×”か等を付与するものである。例えば、サポートベクタマシン、ブースティング等がある。
学習とは、学習データを用いて上記のような二分類器を作成することである。二分類器を複数作成することにより、多分類器を構築することも可能である。
度数とは、対象となるものの個数を示す。
本実施の形態は、顧客の画像情報を使った学習モデルを作成することにより、そのプロモーションを見ている顧客が対象商品を買うのか買わないのかを事前に予想する。また、複数の顧客の購買意欲に関する予想結果からプロモーションのどの箇所が顧客の購買意欲を活性化させるのに貢献するのか、逆にプロモーションのどの箇所が購買意欲を減退化させるのかを判定する。
情報処理(判定)装置100は、例えば、プロモーションを見た顧客に購買意欲があるのか否かを事前に(つまり、実際に対象商品を購入するかどうかを判断する前に)、店員に知らせること等に用いる。
具体的には、プロモーションを見た顧客の動画像を取得しておき、実際にその顧客が対象商品を購入したかどうかを教師信号として学習モデルを作成しておく。そしてそのプロモーションを見た顧客群の動画情報から作成した学習モデルを用いて、プロモーションを見たある顧客が対象商品を購入するかどうかを事前に判断する。
撮像装置120は、プロモーション装置110、情報処理(判定)装置100の人・顔検出モジュール130と接続されている。撮像装置120は、プロモーション装置110を見ている顧客を撮像するための装置である。ビデオカメラ等が該当する。
画像特徴抽出モジュール140は、人・顔検出モジュール130、顧客購買意欲判定モジュール150と接続されている。画像特徴抽出モジュール140は、商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する。具体的には、画像特徴抽出モジュール140は、人(又は顔)と判断した領域から画像特徴を抽出する。例えば、Gabor特徴やHaar特徴、Haar−like特徴などテクスチャに関連した画像特徴等を抽出する。
学習モデル記憶モジュール155は、後述する情報処理(学習)装置200の学習モデル作成保存モジュール270によって作成された学習モデルを記憶している。顧客購買意欲判定モジュール150は、学習モデル記憶モジュール155内の学習モデルを用いて判定処理を行う。
プロモーション装置210は、撮像装置220と接続されている。プロモーション装置210は、前述のプロモーション装置110と同等のものである。
撮像装置220は、プロモーション装置210、情報処理(学習)装置200の人・顔検出モジュール230と接続されている。撮像装置220は、前述の撮像装置120と同等のものである。
人・顔検出モジュール230は、撮像装置220、画像特徴抽出モジュール240と接続されている。人・顔検出モジュール230は、前述の人・顔検出モジュール130と同等のものである。
画像特徴DB250は、画像特徴抽出モジュール240、教師信号作成モジュール260、学習モデル作成保存モジュール270と接続されている。画像特徴DB250は、画像特徴抽出モジュール240によって抽出された画像特徴等を格納するデータベースである。
教師信号作成モジュール260は、画像特徴DB250、学習モデル作成保存モジュール270と接続されている。教師信号作成モジュール260は、対象としている人物(顧客)が対象商品を購入したか否かの情報を作成する。
また、ここで、教師信号に関して、レジカウンター又は店舗の出口における画像内の顧客の体又は顔の特徴と画像特徴抽出モジュール240によって抽出された特徴との照合結果を、教師信号として用いるようにしてもよい。例えば、レジカウンターにおける画像内の顧客は購入した者とし、それ以外の顧客は購入していない者としてもよい。さらに、店舗の出口における画像内の顧客であって、それ以前のレジカウンターにおける画像内の顧客以外の顧客は、購入していない者としてもよい。この教師信号の作成処理については、図9、図15の例を用いて後述する。
また、学習モデル作成保存モジュール270は、商品を顧客が触れた(手にする、手にもつ等)か否かを、その商品に対する興味があるか否かを示す教師信号として用いるようにしてもよい。この教師信号の作成処理については、図13の例を用いて後述する。
画像特徴抽出モジュール240は、その映像の各フレーム時に対応する静止画像における特徴を抽出する。
そして、学習モデル作成保存モジュール270は、各フレーム時に対応する静止画像における特徴に教師信号による学習モデルを生成するようにしてもよい。
そして、その学習モデルを図1の例に示した情報処理(判定)装置100で利用した場合、その情報処理(判定)装置100のプロモーション選択モジュール160は、フレーム時に対応する静止画像で購入と判断される度合いが高いフレームを、広告の映像において購入効果のあるフレームとして判定する、又は、フレーム時に対応する静止画像で購入と判断される度合いが低いフレームを、広告の映像において購入効果のないフレームとして判定するようにしてもよい。この判定処理については、図11、図12の例を用いて後述する。
前述の学習モデルで、顧客の静止画像に基づいて学習しておき、そのプロモーションを見ている顧客の静止画像情報に基づいて逐次、顧客がその商品を購入しそうかしないかを判定する。多くの顧客が「購入しない」の状態から「購入する」の状態に移行する時間に対応するプロモーションがよいプロモーションだと判断する。そして、例えば、プロモーションのその部分を強調するようにしてもよい。逆に、「購入する」の状態から「購入しない」の状態に移行する時間に対応する部分のプロモーションが悪い部分のプロモーションだと判断する。そして、例えば、プロモーションのその部分を改善点として指摘するようにしてもよい。
情報処理(判定・学習)装置300は、情報処理(判定)装置100、情報処理(学習)装置200を有しており、一体化させたものである。つまり、情報処理(判定・学習)装置300の情報処理(学習)装置200が学習モデルを作成し、情報処理(判定)装置100がその学習モデルを用いて判定処理を行う。
なお、プロモーション装置110とプロモーション装置210、撮像装置120と撮像装置220、人・顔検出モジュール130と人・顔検出モジュール230、画像特徴抽出モジュール140と画像特徴抽出モジュール240をそれぞれ有しているが、いずれか一方であってもよい。つまり、情報処理(判定)装置100と情報処理(学習)装置200で、それらのモジュールを共有して利用してもよい。
店舗システム400A、店舗システム400B、店舗システム400C、店舗システム400D、店舗(学習)システム410A、情報処理(判定)装置100E、情報処理(学習)装置200B等が通信回線290を介して接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット等であってもよい。
店舗システム400Aは、情報処理(判定)装置100A、プロモーション装置110A、撮像装置120Aを有している。店舗システム400Bは、情報処理(判定)装置100B、プロモーション装置110B、撮像装置120Bを有している。店舗システム400Cは、プロモーション装置110C、撮像装置120Cを有している。店舗システム400Dは、プロモーション装置110D、撮像装置120Dを有している。店舗(学習)システム410Aは、情報処理(学習)装置200A、プロモーション装置210A、撮像装置220Aを有している。
例えば、各店舗内にプロモーション装置110、撮像装置120、情報処理(判定)装置100の組み合わせ(例えば、店舗システム400A、店舗システム400B)を有していてもよい。また、プロモーション装置110、撮像装置120の組み合わせ(例えば、店舗システム400C、店舗システム400D)を有して、情報処理(判定)装置100Eによって判定させてもよい。その判定結果を各店舗内のパーソナルコンピュータ等の情報処理装置に送信するようにしてもよい。
また、学習モデル作成用にプロモーション装置210、撮像装置220、情報処理(学習)装置200の組み合わせ(例えば、店舗(学習)システム410A)を有していてもよいし、各店舗内の撮像装置120、撮像装置220から、映像を受信して、情報処理(学習)装置200Bによって学習モデルを作成してもよい。そして、情報処理(学習)装置200A又は情報処理(学習)装置200Bによって作成された学習モデルを情報処理(判定)装置100A、情報処理(判定)装置100B、情報処理(判定)装置100Eに送信する。
なお、図3の例に示した情報処理(判定・学習)装置300を通信回線290に接続させるようにしてもよい。
ステップS502では、プロモーション装置110が、プロモーションを開始する。具体的には、図6の例を用いて後述する。
ステップS504では、撮像装置120が、プロモーション装置110の近辺にいる顧客を撮影する。
ステップS506では、人・顔検出モジュール130が、画像から人又は顔の領域を検出する。
ステップS508では、画像特徴抽出モジュール140が、人又は顔の領域内の特徴を抽出する。
ステップS510では、顧客購買意欲判定モジュール150が、特徴を学習モデル記憶モジュール155内の学習モデルに適用して顧客の購買意欲を判定する。
ステップS512では、プロモーション選択モジュール160が、判定結果にしたがって、プロモーションを選択する。
ステップS514では、プロモーション選択モジュール160が、最後であるか否かを判断し、最後である場合は処理を終了し(ステップS599)、それ以外の場合はステップS502へ戻る。
モニタ610は、プロモーション装置110、プロモーション装置210の例であり、撮像装置620は、撮像装置120、撮像装置220の例である。
プロモーションには様々な形態があるが、ここでは、大きなモニタに対象商品のプロモーションとしてのビデオが流れているものを例にあげる。そして、このモニタ610で繰り返し同じプロモーションビデオが流れている場合を想定するが、例えば、複数種類のキャンペーン動画を顧客がボタン等で選択する形式のものでもよい。モニタ610にはビデオカメラなどの撮像装置620が取り付けられており、キャンペーン動画を見る顧客600を捉えることができる。撮像対象となる顧客600は複数人が同時に映っていてもよい。撮像装置620で撮像された画像は人・顔検出モジュール230に送られる。
人・顔検出モジュール130、230は、撮像装置120、220から送られてきた画像から人や人の顔を検出するモジュールである。対象となる画像はフレーム毎に区切られた静止画像でも動画像であってもよい。人や人の顔を抽出する方法は既存技術を使うものとする。例えば、顔画像の抽出として、
非特許情報:P.Viola and MJ.Jones, ”Robust Real−Time Face Detection.”,IJCV, 57(2), 2004.
人画像の抽出として、
非特許情報:N.Dalal and B.Triggs, ”Histograms of Oriented Gradients for Human Detection.”,CVPR, 2005.
等に記載の技術を使うことによって実現できる。こうして獲得された人物領域は画像中の矩形領域として検出される。図7はその例であり、図7(A)は顔領域検出の例を示しており、図7(B)は人領域検出の例を示している。例えば、画像710から顧客602の顔領域712、顧客604の顔領域714を抽出している。画像720から顧客606の人領域726、顧客608の人領域728を抽出している。
画像特徴抽出モジュール140で抽出した画像特徴fHは、顧客購買意欲判定モジュール150に渡される。画像特徴抽出モジュール240で抽出した画像特徴fHは、画像特徴DB250に蓄えられる。
ステップS802では、プロモーション装置210が、プロモーションを開始する。
ステップS804では、撮像装置220が、プロモーション装置210の近辺にいる顧客を撮影する。
ステップS806では、人・顔検出モジュール230が、画像から人又は顔の領域を検出する。
ステップS808では、画像特徴抽出モジュール240が、人又は顔の領域内の特徴を抽出し、その特徴を画像特徴DB250に記憶させる。
ステップS810では、教師信号作成モジュール260が、教師信号を作成する。
ステップS812では、学習モデル作成保存モジュール270が、画像特徴DB250内の特徴と教師信号により学習モデルを作成する。
ステップS814では、学習モデル作成保存モジュール270が、学習モデルを各情報処理(判定)装置100の学習モデル記憶モジュール155に記憶させる。
(1)画像特徴を使う、
(2)ポイントカード、クレジットカード等の各種カードを使う手法、
がある。
画像特徴を使う場合、既存技術である顔照合技術を使う方法が使用可能である。撮像装置620において撮像した顔画像とレジカウンターで撮像した顔画像とを照合し、レジカウンターにおいて顧客Hを特定する。また、プロモーション装置(モニタ610)からレジカウンターまで人物を追跡し続けることによって、顧客Hを認証することも可能である。
図9の例は、顔画像を用いて個人認証する場合の処理例を示している。図9は、教師信号作成モジュール260内の構成例とその周辺のモジュールとの関係構成図である。プロモーション装置210、撮像装置220、顔検出モジュール930、画像特徴抽出モジュール240、画像特徴DB250、教師信号作成モジュール260の関係例を示したものである。前述の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。なお、図9に示す例は、図2に示す例の人・顔検出モジュール230を顔画像を主な対象とする顔検出モジュール930(人・顔検出モジュール230内の機能のうち、顔画像に関する処理を行うモジュール)としたものであるが、人・顔検出モジュール230を人画像を主な対象とする人検出モジュールとしてもよい。その場合、顔検出モジュール964、顔照合モジュール966を、それぞれ人検出モジュール、人照合モジュールとすればよい。また、図9の例では顔検出モジュール930と画像特徴DB250を接続しているが、図2の例と同様に画像特徴抽出モジュール240を介して接続するようにしてもよいし、逆に、図2の例に示す人・顔検出モジュール230と画像特徴DB250を接続するようにしてもよい。つまり、人・顔検出モジュール230による処理結果を画像特徴DB250に記憶させるようにしてもよい。以下、照合のために顔画像を用いる場合の例を示す。
教師信号作成モジュール260は、レジ撮像装置962、顔検出モジュール964、顔照合モジュール966を有している。教師信号作成モジュール260による処理結果を学習モデル作成保存モジュール270に渡す。
レジ撮像装置962は、顔検出モジュール964と接続されている。レジ撮像装置962は、レジカウンターの周囲(又は購入する顧客)を撮影する。
顔検出モジュール964は、レジ撮像装置962、顔照合モジュール966と接続されている。顔検出モジュール964は、レジ撮像装置962によって撮影された画像から、顔検出モジュール930(人・顔検出モジュール230内の機能のうち、顔画像に関する処理)と同等の処理を行い、顔画像を検出する。
顔照合モジュール966は、顔検出モジュール964、画像特徴DB250と接続されている。顔照合モジュール966は、現在レジカウンターにいる顧客と画像特徴DB250にあるデータとの照合処理を行う。レジカウンターにいる顧客の画像特徴が画像特徴DB250のデータと一致する場合、その顧客が対象となる商品を購入したことを示す情報を画像特徴DB250に記憶する。
一方、人物照合を顔画像を用いないで、各種カードや指紋認証等を使用するようにしてもよい。この場合、次のような処理を行えばよい。顧客がプレゼンテーションを見る直前等に各種認証方法で個人を特定し、画像特徴と顧客を関連付ける。さらに、レジカウンターで精算をする際に、カード等にて個人を特定し、画像特徴と照合させる等の処理を行う。このような処理の結果、画像特徴DB250の中では、画像特徴と購入・非購入の対からなる学習データが作成される。
1)プロモーションを見ている顧客が対象商品を購入しそうか否かを予想すること、
2)プロモーションの中で良い箇所と悪い箇所を発見すること、
画像特徴抽出モジュール140は、対象プロモーションPを見ている顧客の画像特徴を抽出する。使用する画像特徴の種類は学習モデル作成の時と同じものを使う。対象顧客のプロモーションPに対する画像特徴がすでに存在する場合、対象顧客のデータは学習モデルの中で使われているので使用しない(例えば、同じプロモーションに対して複数回訪れた顧客が該当する)。得られた画像特徴を、顧客購買意欲判定モジュール150は、学習モデルに入力してその出力を得る。その出力値は“購入する”又は“購入しない”のいずれかを示すラベルの値である。例えば、プロモーションを見た顧客が“購入しない”と判定した場合には、その判定結果を店舗内のパーソナルコンピュータに送信し、判定結果を通知された店員はその顧客に商品を購入してもらえるようなアプローチをかけることが可能となる。
その際、学習モデルを作成するための画像特徴は、複数フレームの出力値を変換して1つにまとめたものではなく、各フレームから抽出した画像特徴を使う。つまり、あるプロモーションPを見た顧客Hに対する画像フレームからの画像特徴fiをすべて使うものとし、教師信号として実際に対象商品を購入したか否かを示す情報を付与するものとする。つまり、プロモーションP、顧客Hに関連付けされる画像特徴には、すべて同一のラベルが教師信号として付与される。又は、すべての画像特徴を使うのではなく、購入・非購入の判定に重要だと思われる対象フレームの後半に対する画像特徴を学習データの対象としてもよい。なお、ここでの後半とは、プロモーションの開始から予め定められた時間以降をいう。これらを用いて、学習モデルを前述の説明と同様に構成する。
次に、あるプロモーションPを見ている顧客の画像特徴を抽出し、それを学習モデルの入力データとすることで、“購入”又は“非購入”の予想ラベルをフレーム毎に付与する。このようなデータを、複数人分収集する。図11に示す例は、プロモーションビデオの時間軸に対して、“購入”と判定された画像(静止画像)を何枚収集できたかを示す図である。p番目のフレームFpに対する画像特徴で“購入”と判定された度数が最も大きく、またq番目のフレームFqに対する画像特徴で“非購入”と判定された度数が最も小さいとする。このとき、Fp周辺のフレームが良いプロモーションだと判定し、Fq周辺のフレームが悪いプロモーションだと判定する。図11の例では、度数が最大のところ、及び最小のところのみに着目したが、図11の度数分布で極大及び極小をとる時間軸を抽出して、極大周辺のフレームは良いプロモーション、極小周辺のプロモーションは悪いプロモーションと判定するようにしてもよい。図12に示す例では、極大値がp1,p2,p3であり、極小値がq1,q2となっており、それぞれの極値を中心として良いフレーム、悪いフレームを判定することで、良いプロモーションと悪いプロモーションを抽出する。又は、プロモーションPを見て良いと判定された画像の総数をフレーム数で割ったもの(特定フレームを見て“購入”と判定する平均枚数)が予め定められた閾値A以上の場合、そのプロモーション自体が良いプロモーション、予め定められた閾値B未満の場合、悪いプロモーションと判定するようにしてもよい。閾値Aと閾値Bは、同じ値であってもよいし、異なる値であってもよい。
図13は、第2の教師信号作成モジュール1360を加えた場合の本実施の形態の構成例についての概念的なモジュール構成図である。つまり、第二の教師信号を得るための説明図である。図9の例に教師信号作成モジュール1360を加えたものである。
教師信号作成モジュール1360は、商品設置場所撮像装置1362、顔検出モジュール1364、行動検出モジュール1366を有している。
画像特徴DB250は、顔検出モジュール930、画像特徴抽出モジュール240、教師信号作成モジュール260の顔照合モジュール966、教師信号作成モジュール1360の顔検出モジュール1364、行動検出モジュール1366と接続されている。
商品設置場所撮像装置1362は、顔検出モジュール1364、行動検出モジュール1366と接続されている。商品設置場所撮像装置1362は、商品の設置場所(商品売り場)に設置されており、その場所にいる顧客を撮影する。ここでの商品は、プロモーションの対象となっている商品であってもよい。
顔検出モジュール1364は、商品設置場所撮像装置1362、画像特徴DB250、教師信号作成モジュール260の顔照合モジュール966と接続されている。顔検出モジュール1364は、商品設置場所撮像装置1362によって撮影された画像から、顔検出モジュール930と同等の処理を行い、顔画像を検出する。
行動検出モジュール1366は、商品設置場所撮像装置1362、画像特徴DB250、教師信号作成モジュール260の顔照合モジュール966と接続されている。行動検出モジュール1366は、商品設置場所撮像装置1362によって撮影された画像から、対象としている商品を顧客が触れたことを検出する。
“非購入(関心あり)”の教師信号を作成するために、対象商品設置場所にビデオカメラ等の撮像装置220を設置して、近づいてきた顧客の顔を検出する。先にプロモーション装置210を見た顧客のみを対象とする場合、画像特徴DB250に保存されていない顔は検出対象から省いてもよい。又は、プロモーション装置210を見る前に対象商品設置場所に訪れる顧客も対象にする場合、検出した顔画像特徴及び行動検出モジュール1366で判定した対象商品に興味があるか否かを示す情報を画像特徴DB250に記憶させておき、プロモーション装置210設置場所に、その顧客が訪れたか否かの判断を行う。行動検出モジュール1366では視線検出や手検出を行い、
1)対象商品に触れたか、
2)どのくらいの時間、対象商品設置場所に滞在したか、
等の情報から総合的に顧客が対象商品に興味があるか否かを判定する。
図14に示す例は、図13の例に示すように教師信号作成モジュール1360を導入したことにより、図10の例に示した画像特徴テーブル1000に加えて画像特徴DB250に記憶される情報を示す。図14は、教師信号テーブル1400のデータ構造例を示す説明図である。教師信号テーブル1400は、顧客ID欄1410、顔画像特徴欄1420、顔画像欄1430、プロモーション(対象商品)の種類欄1440、関心あり・なし欄1450を有している。顧客ID欄1410は、顧客IDを記憶している。顔画像特徴欄1420は、その顧客IDの顧客の顔画像特徴を記憶している。顔画像欄1430は、その顧客の顔画像を記憶している。プロモーション(対象商品)の種類欄1440は、プロモーション(対象商品)の種類を記憶している。関心あり・なし欄1450は、プロモーションの対象としている商品毎に、関心あり・関心なしを示す情報を記憶している。
以上の処理例により、3つの教師信号からなる学習モデルを同様に作成し、プロモーションを見ている顧客の画像情報から、事前に“興味があるが購入しないだろう”という予想を得る。そして、非購入が予想される客の中から対象商品に関心がありそうな顧客を絞り込むことができる。これによって、さらに別の対応を事前に実施することができる。
また、別の処理例として顧客の分類をする際に、プロモーション装置210からの画像だけでなく、対象商品に関心を示したか否かの情報を教師信号作成モジュール1360同様の手法で入手し、“関心がありそう”に関する判定精度をさらに上昇させるようにしてもよい。
なお、学習モデルを作成する際には、所謂one−vs−allの識別器を2つ(例えば“購入”と「それ以外」の識別器、「それ以外」をさらに“関心あり”と“関心なし”の識別器)構築することによって学習モデルを作成することができる。
教師信号作成モジュール1560は、出口撮像装置1562、顔検出モジュール1564を有している。
出口撮像装置1562は、顔検出モジュール1564と接続されている。出口撮像装置1562は、店舗等の出口に設置されており、店舗等から出る顧客を撮影する。
顔検出モジュール1564は、出口撮像装置1562、教師信号作成モジュール260の顔照合モジュール966と接続されている。顔検出モジュール1564は、出口撮像装置1562によって撮影された画像から、顔検出モジュール930と同等の処理を行い、顔画像を検出する。
顔照合モジュール966は、顔検出モジュール964、画像特徴DB250、顔検出モジュール1564と接続されている。顔照合モジュール966は、図9の例で示した顔照合モジュール966の処理に加えて、顔検出モジュール1564によって検出された顧客の顔画像の特徴と、レジカウンターにいた顧客の顔画像の特徴が合致しない場合、顔検出モジュール1564によって検出された顧客は、商品を購入しなかったことを示す情報を画像特徴DB250に記憶する。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
110…プロモーション装置
120…撮像装置
130…人・顔検出モジュール
140…画像特徴抽出モジュール
150…顧客購買意欲判定モジュール
155…学習モデル記憶モジュール
160…プロモーション選択モジュール
200…情報処理(学習)装置
210…プロモーション装置
220…撮像装置
230…人・顔検出モジュール
240…画像特徴抽出モジュール
250…画像特徴DB
260…教師信号作成モジュール
270…学習モデル作成保存モジュール
290…通信回線
300…情報処理(判定・学習)装置
400…店舗システム
410…店舗(学習)システム
930…顔検出モジュール
962…レジ撮像装置
964…顔検出モジュール
966…顔照合モジュール
1360…教師信号作成モジュール
1362…商品設置場所撮像装置
1364…顔検出モジュール
1366…行動検出モジュール
1560…教師信号作成モジュール
1562…出口撮像装置
1564…顔検出モジュール
Claims (5)
- 商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する抽出手段と、
前記抽出手段によって特徴を抽出した前記顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成する作成手段
を具備し、
前記広告は映像を用いたものであり、
前記抽出手段は、前記映像の各フレーム時に対応する静止画像における特徴を抽出し、
前記作成手段は、前記各フレーム時に対応する静止画像における特徴に前記教師信号による学習モデルを生成し、
前記フレーム時に対応する静止画像で購入と判断される度合いが高いフレームを、前記広告の映像において購入効果のあるフレームとして判定する、又は、前記フレーム時に対応する静止画像で購入と判断される度合いが低いフレームを、前記広告の映像において購入効果のないフレームとして判定する判定手段
をさらに具備することを特徴とする情報処理装置。 - 商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する第2の抽出手段と、
前記第2の抽出手段によって抽出された特徴を、前記作成手段によって作成された学習モデルに適用することによって、前記顧客の購入意欲を判定する判定手段
を具備することを特徴とする請求項1に記載の情報処理装置。 - 前記作成手段は、レジカウンター又は店舗の出口における画像内の顧客の体又は顔の特徴と前記抽出手段によって抽出された特徴との照合結果を、前記教師信号として用いる
ことを特徴とする請求項1又は2に記載の情報処理装置。 - 前記作成手段は、前記商品を前記顧客が触れたか否かを該商品に対する興味があるか否かを示す教師信号として用いる
ことを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。 - コンピュータを、
商品の広告を行っている場所を撮影した画像内の顧客の体又は顔の特徴を抽出する抽出手段と、
前記抽出手段によって特徴を抽出した前記顧客が購入したか否かを示す情報を教師信号として、学習モデルを作成する作成手段
として機能させ、
前記広告は映像を用いたものであり、
前記抽出手段は、前記映像の各フレーム時に対応する静止画像における特徴を抽出し、
前記作成手段は、前記各フレーム時に対応する静止画像における特徴に前記教師信号による学習モデルを生成し、
前記フレーム時に対応する静止画像で購入と判断される度合いが高いフレームを、前記広告の映像において購入効果のあるフレームとして判定する、又は、前記フレーム時に対応する静止画像で購入と判断される度合いが低いフレームを、前記広告の映像において購入効果のないフレームとして判定する判定手段
としてさらに機能させるための情報処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014179880A JP6428062B2 (ja) | 2014-09-04 | 2014-09-04 | 情報処理装置及び情報処理プログラム |
PCT/JP2015/052270 WO2016035351A1 (ja) | 2014-09-04 | 2015-01-28 | 情報処理装置、情報処理プログラム、情報処理方法及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014179880A JP6428062B2 (ja) | 2014-09-04 | 2014-09-04 | 情報処理装置及び情報処理プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017075119A Division JP6418270B2 (ja) | 2017-04-05 | 2017-04-05 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016053869A JP2016053869A (ja) | 2016-04-14 |
JP6428062B2 true JP6428062B2 (ja) | 2018-11-28 |
Family
ID=55439426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014179880A Expired - Fee Related JP6428062B2 (ja) | 2014-09-04 | 2014-09-04 | 情報処理装置及び情報処理プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6428062B2 (ja) |
WO (1) | WO2016035351A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2018066300A1 (ja) * | 2016-10-07 | 2019-08-08 | 日本電気株式会社 | バリデーションシステム、バリデーションの実施方法およびバリデーション用プログラム |
US10810461B2 (en) | 2017-02-03 | 2020-10-20 | Panasonic Intellectual Property Management Co., Ltd. | Learned model generating method, learned model generating device, and learned model use device |
CN109299715B (zh) * | 2017-07-24 | 2021-07-13 | 图灵通诺(北京)科技有限公司 | 基于卷积神经网络的图像识别技术的结算方法和装置 |
KR102610494B1 (ko) * | 2020-12-31 | 2023-12-06 | 주식회사 메이아이 | 엣지 컴퓨팅 환경에서 영상에 기초하여 방문객을 분석하기 위한 방법, 디바이스 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004355453A (ja) * | 2003-05-30 | 2004-12-16 | Matsushita Electric Ind Co Ltd | マーケティング用情報取得システム |
US8219438B1 (en) * | 2008-06-30 | 2012-07-10 | Videomining Corporation | Method and system for measuring shopper response to products based on behavior and facial expression |
WO2013018913A1 (ja) * | 2011-08-04 | 2013-02-07 | 日本電気株式会社 | 映像処理システム、視聴者の嗜好判定方法、映像処理装置およびその制御方法と制御プログラム |
-
2014
- 2014-09-04 JP JP2014179880A patent/JP6428062B2/ja not_active Expired - Fee Related
-
2015
- 2015-01-28 WO PCT/JP2015/052270 patent/WO2016035351A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2016035351A1 (ja) | 2016-03-10 |
JP2016053869A (ja) | 2016-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8351647B2 (en) | Automatic detection and aggregation of demographics and behavior of people | |
US20190108551A1 (en) | Method and apparatus for customer identification and tracking system | |
US7267277B2 (en) | Method and system for targeted marketing by leveraging video-based demographic insights | |
US8295597B1 (en) | Method and system for segmenting people in a physical space based on automatic behavior analysis | |
JP5238933B2 (ja) | 客層付販売情報生成システム | |
US20120140069A1 (en) | Systems and methods for gathering viewership statistics and providing viewer-driven mass media content | |
WO2019093293A1 (ja) | 接客支援装置、接客支援方法、及びコンピュータ読み取り可能な記録媒体 | |
JP6428062B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6500374B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6418270B2 (ja) | 情報処理装置及び情報処理プログラム | |
US11615430B1 (en) | Method and system for measuring in-store location effectiveness based on shopper response and behavior analysis | |
JP6520218B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2017083980A (ja) | 行動分析装置及びシステム及び方法 | |
WO2013095923A1 (en) | Utilizing real-time metrics to normalize an advertisement based on consumer reaction | |
JP7294663B2 (ja) | 接客支援装置、接客支援方法、及びプログラム | |
US20150363822A1 (en) | Splitting a purchase panel into sub-groups | |
WO2015003287A1 (zh) | 一种行为辨识及追踪系统及其运作方法 | |
US20160042362A1 (en) | Recording purchase behavior using device with multiple feedback and input modalities | |
TW201502999A (zh) | 一種行為辨識及追蹤系統 | |
JP6476678B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6112156B2 (ja) | 行動分析装置及び行動分析プログラム | |
US20130290107A1 (en) | Behavior based bundling | |
WO2020016861A1 (en) | Method and system for conducting electronic commerce and retailing using emotion detection | |
US20230101275A1 (en) | Audited training data for an item recognition machine learning model system | |
JP6944020B2 (ja) | 情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180703 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181002 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6428062 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |