WO2024018545A1

WO2024018545A1 - 生成プログラム、生成方法および情報処理装置

Info

Publication number: WO2024018545A1
Application number: PCT/JP2022/028127
Authority: WO
Inventors: 太郎外川; 克久中里; 源太鈴木; 駿木幡
Original assignee: 富士通株式会社
Priority date: 2022-07-19
Filing date: 2022-07-19
Publication date: 2024-01-25
Also published as: EP4560559A1; JPWO2024018545A1; US20250124710A1; EP4560559A4

Abstract

情報処理装置は、映像データを取得する。情報処理装置は、取得した映像データを機械学習モデルに入力することで、映像データに含まれる人物の行動のクラスと、クラスの信頼度とを特定する。情報処理装置は、特定された信頼度に基づいて、特定されたクラスに関連する質問情報を生成する。

Description

生成プログラム、生成方法および情報処理装置

　本発明は、生成プログラム、生成方法および情報処理装置に関する。

　商品の購買履歴、施設の利用履歴、飲食店の注文履歴などを含むユーザの行動履歴をデータベース化して蓄積し、今後のサービスに役立てることが広く行われている。例えば、テーブル等にアンケートを用意したり、後日ユーザにアンケートを送付したりして、アンケートの回答結果をデータベース化することが行われている。

国際公開第２０１９／０４９２１６号

　しかしながら、アンケートの結果を収集、精査、入力などの多くの処理が発生し、データベースの構築には多くの処理量が要求される。なお、より有益な情報をデータベース化したいことから、アンケートの項目数が多くなる傾向にあり、ユーザの負担が増加し、アンケートに回答しないユーザも多い。

　一つの側面では、データベースの構築にかかる処理量を削減することができる生成プログラム、生成方法および情報処理装置を提供することを目的とする。

　第１の案では、生成プログラムは、コンピュータに、映像データを取得し、取得した前記映像データを機械学習モデルに入力することで、前記映像データに含まれる人物の行動のクラスと、クラスの信頼度とを特定し、特定された前記信頼度に基づいて、特定された前記クラスに関連する質問情報を生成する、処理を実行させることを特徴とする。

　一実施形態によれば、データベースの構築にかかる処理量を削減することができる。

図１は、実施例１にかかる情報処理システムの全体構成例を示す図である。図２は、参考技術を説明する図である。図３は、実施例１にかかる情報処理装置を説明する図である。図４は、実施例１にかかる情報処理装置の機能構成を示す機能ブロック図である。図５は、顧客ＤＢを説明する図である。図６は、アンケートＤＢを説明する図である。図７は、分析結果ＤＢを説明する図である。図８は、訓練データを説明する図である。図９は、関係性モデルの機械学習を説明する図である。図１０は、行動認識モデルの生成を説明する図である。図１１は、関係性の特定を説明する図である。図１２は、ＨＯＩＤによる関係性の特定を説明する図である。図１３は、行動認識を説明する図である。図１４は、アンケートの生成と送信を説明する図である。図１５は、分析結果の登録を説明する図である。図１６は、実施例１にかかる処理の流れを示すフローチャートである。図１７は、シーングラフの一例を示す図である。図１８は、人と物の関係性を示すシーングラフの生成例を説明する図である。図１９は、シーングラフによる関係性の特定を説明する図である。図２０は、実施例３にかかる行動認識モデルを説明する図である。図２１は、実施例３にかかる行動認識モデルの機械学習について説明する図である。図２２は、実施例３にかかる行動認識モデルを用いたアンケート送信を説明する図である。図２３は、実施例４にかかるアンケート送信を説明する図である。図２４は、実施例４にかかるアンケート送信の具体例を説明する図である。図２５は、実施例４にかかる処理の流れを示すフローチャートである。図２６は、実施例４にかかるサイネージのアンケート表示例を説明する図である。図２７は、情報処理装置のハードウェア構成例を説明する図である。図２８は、サイネージのハードウェア構成例を説明する図である。

　以下に、本発明にかかる生成プログラム、生成方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。

＜全体構成＞
　図１は、実施例１にかかる情報処理システムの全体構成例を示す図である。図１に示すように、この情報処理システムは、物体の一例である商品が配置されるエリアを有する空間の一例である店舗１と、それぞれが店舗１内の異なる場所に設置された複数のカメラ２と、映像データの解析を実行する情報処理装置１０とがネットワークＮを介して接続される。なお、ネットワークＮには、有線や無線を問わず、インターネットや専用線などの様々な通信網を採用することができる。

　店舗１は、例えばスーパーマーケットやコンビニエンスストアのように、顧客５が購入する商品が陳列されており、例えば電子決済などを用いたセルフレジなどが利用される。なお、店舗１の例としては、予め顧客５を登録しておき、登録済みの顧客５のみが利用できる無人店舗などが想定される。例えば、顧客５は、店舗１を運営する運営者のホームページなどアクセスして、氏名、年齢、連絡先（例えばメールアドレスなど）、決済方法（例えばクレジットカードの番号など）を登録する。顧客５は、登録後に発行されるユーザＩＤとパスワードや入店カードを用いることで、店舗１に入店し、登録されている決済方法で支払いを行うことで、買い物を行うことができる。

　複数のカメラ２それぞれは、店舗１内の所定領域を撮像する監視カメラの一例であり、撮像した映像のデータを、情報処理装置１０に送信する。以下の説明では、映像のデータを「映像データ」と表記する場合がある。また、映像データには、時系列の複数のフレームが含まれる。各フレームには、時系列の昇順に、フレーム番号が付与される。１つのフレームは、カメラ２があるタイミングで撮影した静止画像の画像データである。

　情報処理装置１０は、店舗１への入店が許可された顧客５に関する情報を記憶する顧客ＤＢを有し、複数のカメラ２から映像データを受信し、顧客５に対するサービス向上を行うための各種データなどを収集するコンピュータ装置の一例である。顧客ＤＢには、氏名、年齢、連絡先（例えばメールアドレスなど）、決済方法（例えばクレジットカードの番号など）などが登録される。

（参考技術の説明）
　顧客５に対するサービス向上の施策として、顧客５に対するアンケートが利用される。図２は、参考技術を説明する図である。図２に示すように、店舗１で商品を購入した顧客５または店舗１に入店したが商品を購入したかった顧客５に対して、退店時に店員６がアンケート用紙を顧客５に手渡す。顧客５は、手渡されたアンケート用紙に記入して郵送等で送付する。その後、店員７が、各顧客５から送付されたアンケート用紙の集計を行ってＤＢ化する。このようにしてＤＢ化された情報にしたがって、店員による声掛けのタイミング、商品の配列や商品の拡充等の検討がなされる。

　このように、参考技術では、アンケートの結果の収集、精査、入力などの多くの処理が発生し、データベースの構築には多くの処理量が要求される。また、より有益な情報をデータベース化したいことから、アンケートの項目数が多くなる傾向にあり、ユーザの負担が増加し、アンケートに回答しないユーザも多い。

（実施例１の説明）
　そこで、実施例１にかかる情報処理装置１０は、店舗１内の映像から人、モノ、環境、行動の関係性や人の属性を認識し、売場の状況（コンテキスト）をデジタル化して分析可能な情報のＤＢ化の処理を削減する。具体的には、情報処理装置１０は、商品が配置された店舗１内のエリアを撮像した映像データを機械学習モデルに入力することで、映像データに含まれる特定のユーザ（顧客５）の商品に対する行動における、顧客５と商品の関係性を特定する。続いて、情報処理装置１０は、関係性が特定された商品に対する顧客５の心理的な評価を取得する。その後、情報処理装置１０は、記憶部に記憶される商品の分析結果を示すデータベースに、特定された関係性に関連する結果と、顧客５心理的な評価とを対応づけて登録する。

　図３は、実施例１にかかる情報処理装置１０を説明する図である。図３に示すように、情報処理装置１０は、店舗１内を撮像した映像データを取得し、訓練済みである機械学習モデルに映像データ内の各フレームを入力して、顧客５と商品との関係性を特定する。例えば、情報処理装置１０は、商品の購入有無、時間、場所、商品に対する行動（例えば把持）などを特定する。

　続いて、情報処理装置１０は、顧客５と商品との関係性に基づき映像から特定できなかった項目を、心理的な評価として特定し、その心理的な評価に関するアンケートを生成して、顧客５の端末等に送信する。例えば、情報処理装置１０は、商品を購入しなかった顧客５に対して、「なぜ商品を購入しなかったのか？」の理由を質問するアンケートを送信する。

　その後、情報処理装置１０は、アンケートに対する回答を受信すると、映像から特定された特定結果と、アンケート結果とを対応付けてＤＢ化する。例えば、情報処理装置１０は、映像から特定された「年齢、性別、商品購入の有無」と、アンケート結果「商品を購入しなかった理由」とを対応付けて記憶する。

　このように、情報処理装置１０は、店頭映像などからリアルタイムに来客の行動を認識し、対象の来客と送信タイミングを絞り込んでアンケートを自動送信することができる。したがって、情報処理装置１０は、効果的なアンケート結果のみを取得することができるので、データベースの構築にかかる処理量を削減することができる。

＜機能構成＞
　図４は、実施例１にかかる情報処理装置１０の機能構成を示す機能ブロック図である。図４に示すように、情報処理装置１０は、通信部１１、記憶部１２、制御部２０を有する。

　通信部１１は、他の装置の間の通信を制御する処理部であり、例えば通信インタフェースなどである。例えば、通信部１１は、各カメラ２から映像データなどを受信し、情報処理装置１０の処理結果などを、予め指定された装置等に出力する。

　記憶部１２は、各種データや制御部２０が実行するプログラムなどを記憶する処理部であり、例えばメモリやハードディスクなどにより実現される。この記憶部１２は、顧客ＤＢ１３、アンケートＤＢ１４、映像データＤＢ１５、訓練データＤＢ１６、関係性モデル１７、行動認識モデル１８、分析結果ＤＢ１９を記憶する。

　顧客ＤＢ１３は、顧客５に関する情報を記憶するデータベースである。ここで記憶される情報は、店舗１に来店して商品の購入を希望する顧客（ユーザ）５の情報であり、来店前にユーザ登録を行うことで収集及び登録される。

　図５は、顧客ＤＢ１３を説明する図である。図５に示すように、顧客ＤＢ１３は、「顧客ＩＤ、氏名、年齢、性別、家族構成、通知先、来店回数、カード情報」などを記憶する。「顧客ＩＤ」は、顧客５を識別する識別子である。「氏名、年齢、性別、家族構成、カード情報」は、ユーザ登録時に顧客５が入力した情報であり、「来店回数」は、入店時にカウントされる来店の回数である。

　アンケートＤＢ１４は、顧客５に送信するアンケートを記憶するデータベースである。図６は、アンケートＤＢ１４を説明する図である。図６に示すように、送信対象のアンケートには、質問（Ｑ）と選択項目とを対応付けた複数の質問項目を含めることができる。

　図６の例では、質問１（Ｑ１）は、顧客の年齢や性別を問い合わせる質問項目であり、回答の選択項目として「女性／男性、２０代／３０代／４０代／５０代／６０代／７０代以上」が用意されている。また、質問３（Ｑ３）は、購入した商品の種別を問い合わせる質問項目であり、回答の選択項目として「食品／日用品／その他」が用意されている。

　なお、各質問には、質問の意図を示す５Ｗ１Ｈ（いつ（Ｗｈｅｎ）、どこで（Ｗｈｅｒｅ）、誰が（Ｗｈｏ）、何を（Ｗｈａｔ)、なぜ（Ｗｈｙ）、どのように（Ｈｏｗ））を対応付けることもできる。例えば、Ｑ１「年齢、性別を教えてください」には、「誰が（Ｗｈｏ）」、Ｑ６の「サービスに不満な理由をお聞かせ下さい。」には、「なぜ（Ｗｈｙ）」などが対応付けられる。

　映像データＤＢ１５は、店舗１に設置される複数のカメラ２それぞれにより撮像された映像データを記憶するデータベースである。例えば、映像データＤＢ１５は、カメラ２ごと、または、撮像された時間帯ごとに、映像データを記憶する。

　訓練データＤＢ１６は、関係性モデル１７、行動認識モデル１８などを含む、実施例で説明する各種機械学習モデルの生成に用いられる各種訓練データを記憶するデータベースである。ここで記憶される訓練データには、正解情報が付加された教師ありの訓練データや、正解情報が付加されていない教師なしの訓練データを含めることができる。

　関係性モデル１７は、映像データに含まれる特定のユーザの物体に対する行動における、人物と物体の関係性を特定する機械学習モデルの一例である。具体的には、関係性モデル１７は、人物と人物の関係性、または、人物と物（物体）の関係性を識別する、機械学習により生成されたＨＯＩＤ（Human　Object　Interaction　Detection）用のモデルである。

　例えば、人物と人物の関係性の特定時には、関係性モデル１７として、映像データ内のフレームの入力に応じて、第一の人物を示す第１クラスおよび第一の人物が出現する領域を示す第１領域情報と、第二の人物を示す第２クラスおよび第二の人物が出現する領域を示す第２領域情報と、第１クラスと第２クラスとの関係性と、を特定して出力するＨＯＩＤ用のモデルが用いられる。

　また、人物と物体の関係性の特定時には、関係性モデル１７として、人物を示す第１クラスおよび人物が出現する領域を示す第１領域情報と、物体を示す第２クラスおよび物体が出現する領域を示す第２領域情報と、第１クラスと第２クラスとの関係性と、を特定して出力するＨＯＩＤ用のモデルが用いられる。

　なお、ここで示した関係性とは、あくまで一例として、「持つ」などの単純な関係性に限らず、「商品Ａを右手に持つ」、「商品Ｂを棚に戻す」、「商品を買い物かごに入れる」などの複雑な関係性が含まれる。なお、関係性モデル１７として、上記２つのＨＯＩＤ用のモデルを別々に用いてもよく、人物と人物の関係性および人物と物体の関係性の両方を識別するように生成された１つのＨＯＩＤ用のモデルを用いてもよい。また、関係性モデル１７は、後述する制御部２０により生成されるが、予め生成されたモデルを使用してもよい。

　行動認識モデル１８は、映像データから人物の骨格情報や行動認識を実行する機械学習モデルの一例である。具体的には、行動認識モデル１８は、画像データの入力に応じて、２次元の骨格情報や行動認識結果を出力する。例えば、行動認識モデル１８は、人物の２次元画像データに対して、頭、手首、腰、足首などの２次元の関節位置（骨格座標）を推定し、基本となる動作の認識やユーザが定義したルールの認識を行う深層学習器の一例である。

　この行動認識モデル１８を用いることで、人物の基本動作を認識することができ、足首の位置、顏の向き、身体の向きを取得することができる。基本となる動作とは、例えば歩く、走る、止まるなどである。ユーザが定義したルールとは、商品を手に取るまでの各行動に該当する骨格情報の遷移などである。なお、行動認識モデル１８は、後述する制御部２０により生成されるが、予め生成されたデータを使用してもよい。

　分析結果ＤＢ１９は、情報処理装置１０により収集される分析結果に関する情報を記憶するデータベースである。図７は、分析結果ＤＢ１９を説明する図である。図７に示すように、分析結果ＤＢ１９は、「ＩＤ、氏名、ユーザ情報、商品、購入有無、アンケート結果」などを記憶する。

　「ＩＤ」は、分析結果を識別する識別子である。「氏名」は、顧客５の氏名であり、入店時や商品購入時に、顧客ＤＢ１３を用いて特定される。「ユーザ情報」は、顧客５の年齢、性別、家族構成などであり、顧客ＤＢ１３を用いて特定される。「商品」は、顧客５が購入した商品の情報であり、商品購入時に、顧客ＤＢ１３を用いて特定される。「購入有無」は、来店時に商品を購入したか否かを示す情報であり、商品購入時に、顧客ＤＢ１３を用いて特定される。「アンケート結果」は、後述する制御部２０により送信されたアンケートに対する回答である。

　図７の例では、「特許花子」さんは、「３０代、女性」であり、「化粧品と食品」を購入し、アンケートに「サービスに不満（店員が不親切）」を回答したことが示される。ここで記憶される情報は、売場の状況を検知および対応方針の決定に利用される。例えば、「来客あり、家族連れ、若い男女、女性が主導権」などの情報が登録されると、店員にファミリー向けかつ女性に人気の商品を推奨させる。

　図４に戻り、制御部２０は、情報処理装置１０全体を司る処理部であり、例えばプロセッサなどにより実現される。この制御部２０は、事前処理部３０と運用処理部４０を有する。なお、事前処理部３０と運用処理部４０は、プロセッサが有する電子回路やプロセッサが実行するプロセスなどにより実現される。

＜事前処理部３０＞
　事前処理部３０は、運用処理部４０による行動予測やアンケート集計の運用に先立って、記憶部１２に記憶される訓練データを用いて、各モデルやルールなどの生成を実行する処理部である。

（関係性モデルの生成）
　事前処理部３０は、訓練データＤＢ１６に記憶される訓練データを用いて、関係性モデル１７を生成する処理部である。ここでは、一例として、関係性モデル１７として、ニューラルネットワークなどを用いたＨＯＩＤ用のモデルを生成する例で説明する。なお、あくまで一例として、人物と物体の関係性を特定するＨＯＩＤ用のモデルの生成について説明するが、人物と人物の関係性を特定するＨＯＩＤ用のモデルについても同様に生成することができる。

　まず、ＨＯＩＤ用のモデルの機械学習に利用する訓練データについて説明する。図８は、訓練データを説明する図である。図８に示すように、各訓練データは、入力データとなる画像データ（説明変数）と、当該画像データに対して設定された正解情報（目的変数）とを有する。

　正解情報には、検出対象である人物のクラス（第１クラス）と、人物による購入や操作対象である物体のクラス（第２クラス）と、人物と物体の相互作用を示す関係性クラスと、各クラスの領域を示すＢｂｏｘ（Bounding　Box：物体の領域情報）とが設定される。すなわち、正解情報として、人物が把持している物体に関する情報が設定される。なお、人物と物体の相互作用は、人物と物体の関係性の一例である。また、人物と人物の関係性の特定に利用する場合には、第２クラスとして他方の人物を示すクラス、第２クラスの領域情報として他方の人の領域情報、関係性クラスとして人物と人物の関係性を用いる。

　次に、訓練データを用いたＨＯＩＤ用のモデルの機械学習について説明する。図９は、関係性モデル１７の機械学習を説明する図である。図９に示すように、事前処理部３０は、訓練データをＨＯＩＤ用のモデルに入力し、ＨＯＩＤ用のモデルの出力結果を取得する。この出力結果には、ＨＯＩＤ用のモデルが検出した人物のクラスと、物体のクラスと、人物と物体の関係性（相互作用）などが含まれる。そして、事前処理部３０は、訓練データの正解情報とＨＯＩＤ用のモデルの出力結果との誤差情報を算出し、誤差が小さくなるように、誤差逆伝播により、ＨＯＩＤ用のモデルが有するパラメータの更新を行う機械学習を実行する。

（行動認識モデル１８の生成）
　事前処理部３０は、訓練データを用いて、行動認識モデル１８の生成を実行する処理部である。具体的には、事前処理部３０は、正解情報（ラベル）付の訓練データを用いた教師あり学習により、行動認識モデル１８を生成する。

　図１０は、行動認識モデル１８の生成を説明する図である。図１０に示すように、事前処理部３０は、基本動作のラベルが付与された基本動作の画像データを行動認識モデル１８に入力し、行動認識モデル１８の出力結果とラベルとの誤差が小さくなるように、行動認識モデル１８の機械学習を実行する。例えば、行動認識モデル１８は、ニューラルネットワークである。事前処理部３０は、行動認識モデル１８の機械学習を実行することで、ニューラルネットワークのパラメータを変更する。行動認識モデル１８は、画像データ（例えば基本動作の動作をしている人物の画像データ）である説明変数をニューラルネットワークに入力する。そして、行動認識モデル１８は、ニューラルネットワークが出力する出力結果と、基本動作のラベルである正解データ（目的変数）との誤差が小さくなるように、ニューラルネットワークのパラメータを変更した機械学習モデルを生成する。

　なお、訓練データとしては、「ラベル」として「歩く」、「走る」、「止まる」、「立つ」、「棚の前に立つ」、「商品を取る」、「首を右に回す」、「首を左に回す」、「上を向く」、「頭を下に傾ける」などが付加された各画像データを用いることができる。なお、行動認識モデル１８の生成は、あくまで一例であり、他の手法を用いることができる。また、行動認識モデル１８としては、特開２０２０－７１６６５号公報、特開２０２０－７７３４３号公報に開示される行動認識を用いることもできる。

＜運用処理部４０＞
　図４に戻り、運用処理部４０は、取得部４１、関係性特定部４２、行動認識部４３、評価取得部４４、登録部４５を有し、事前処理部３０により事前に準備された各モデルを用いて、映像データに写る人物に対してアンケート送信を実行する処理部である。

　取得部４１は、各カメラ２から映像データを取得して映像データＤＢ２１に格納する処理部である。例えば、取得部４１は、各カメラ２から随時取得してもよく、定期的に取得してもよい。

　また、取得部４１は、顧客５の入店時に顧客情報を取得して、運用処理部４０の各処理部に出力する。例えば、取得部４１は、ユーザカード、指紋認証、ＩＤとパスワードなどを入店時にユーザに実行させることで、入店した「顧客ＩＤ」を取得する。そして、取得部４１は、顧客ＤＢ１３を参照し、「顧客ＩＤ」と対応付けられる氏名や年齢等を取得する。

（関係性の特定）
　関係性特定部４２は、関係性モデル１７を用いて、映像データに写る人物と人物との関係性、または、人物と物体との関係性を特定する関係性特定処理を実行する処理部である。具体的には、関係性特定部４２は、映像データに含まれるフレームごとに、各フレームを関係性モデル１７に入力し、関係性モデル１７の出力結果に応じて、関係性を特定する。そして、関係性特定部４２は、特定された関係性を、評価取得部４４や登録部４５等に出力する。

　図１１は、関係性の特定を説明する図である。図１１に示すように、関係性特定部４２は、フレーム１を機械学習済みの関係性モデル１７に入力して、第１の人物のクラス、第２の人物のクラス、人物間の関係性を特定する。別例としては、関係性特定部４２は、フレームを機械学習済みの関係性モデル１７に入力して、人物のクラス、物体のクラス、人物と物体の関係性を特定する。このように、関係性特定部４２は、関係性モデル１７を用いて、フレームごとに、人物間の関係性または人物と物体との間の関係性を特定する。

　図１２は、ＨＯＩＤによる関係性の特定を説明する図である。図１２に示すように、関係性特定部４２は、映像データに含まれる各フレーム（画像データ）をＨＯＩＤ（関係性モデル１７）に入力し、ＨＯＩＤの出力結果を取得する。具体的には、関係性特定部４２は、人物のＢｂｏｘ、人物のクラス名、物体のＢｂｏｘ、物体のクラス名、人物と物体の相互作用の確率値、人物と物体の相互作用のクラス名を取得する。

　この結果、例えば、関係性特定部４２は、人物のクラスとして「人（客）」と「商品（物）」などを特定し、「人（客）」と「商品（物）」との関係性「客が商品を持つ」を特定する。関係性特定部４２は、フレーム２やフレーム３などの後続の各フレームについても上記関係性特定処理を実行することで、フレームごとに関係性「商品Ａを持つ」、関係性「商品Ａを渡す」などを特定する。なお、関係性特定部４２は、商品の購入有無については、セルフレジなどや退店時の情報により、取得することもできる。

　また、関係性特定部４２は、映像データに含まれる顧客の物体に対する行動から、行動が実施された時間、場所および関係性に関連する情報を特定することもできる。例えば、関係性特定部４２は、関係性が特定された映像データ内のフレームの時間、当該映像データを撮像したカメラ２の場所などを特定する。

（行動認識）
　行動認識部４３は、行動認識モデル１８を用いて、映像データから人物の行動やしぐさを認識する処理部である。具体的には、行動認識部４３は、映像データ内の各フレームを行動認識モデル１８に入力し、行動認識モデル１８から得られる人物の各部位の骨格情報や基本動作を用いて、人物の行動やしぐさを特定し、評価取得部４４や登録部４５等に出力する。

　図１３は、行動認識を説明する図である。図１３に示すように、行動認識部４３は、画像データであるフレーム１を行動認識モデル１８に入力する。行動認識モデル１８は、フレーム１の入力に応じて各部位の骨格情報を生成し、各部位の骨格情報にしたがって各部位の動作を出力する。例えば、行動認識部４３は、行動認識モデル１８を用いることで、「顔：正面を向く、腕：上げる、足：歩く、・・・」などの各部位の動作情報を取得できる。

　また、行動認識部４３は、行動認識モデル１８を用いた認識処理をフレーム２やフレーム３の後続の各フレームについても実行して、フレームごとに、フレームに写る人物の各部位の動作情報を特定する。そして、行動認識部４３は、予め対応付けて保持する代表的なしぐさと行動の変化とを対応付けを参照し、行動認識結果（すなわち、各部位の動作情報）の変化を用いて、より具体的な行動やしぐさなどを特定することもできる。

　例えば、行動認識部４３は、５フレームの間に顔の向きが左右に移動した場合や、商品を持ってから１５フレーム以上経過した後に商品を元に戻した場合など、予め指定した「不満げな動作」を検出した場合は、しぐさ「不満げ」と認識することができる。また、行動認識部４３は、商品を持ってから３フレーム未満で商品をかごに入れた場合など、予め指定した「満足げな動作」を検出した場合は、しぐさ「満足」と認識することができる。

　評価取得部４４は、関係性特定部４２により関係性が特定された商品に対する顧客５の心理的な評価を取得する処理部である。具体的には、評価取得部４４は、行動認識部４３により認識された「しぐさ」を心理的な評価として採用することもできる。

　また、評価取得部４４は、顧客２の商品に関する心理的指標に関するアンケートを、顧客５と対応付けられた端末に送信し、端末から受信したアンケートの回答結果を、顧客の心理的な評価として取得することもできる。

　具体例を挙げると、評価取得部４４は、アンケートＤＢ１４に記憶されるアンケートの含まれる複数の項目のうち、顧客２の商品に対する行動から特定されなかった項目を問い合わせる部分アンケートを生成する。そして、評価取得部４４は、部分アンケートを、顧客の端末に送信し、端末から受信したアンケートの回答結果を、顧客の心理的な評価として取得することもできる。

　図１４は、アンケートの生成と送信を説明する図である。図１４に示すように、評価取得部４４は、取得部２２により取得された顧客情報（３０代、女性、来店回数（１０回目）を用いて、アンケートＱ１の「年齢、性別」に「３０代、女性」を自動入力し、アンケートＱ２の「はじめてのご来店ですか？」に「２回目以上」を自動入力する。

　また、評価取得部４４は、関係性特定部４２により特定された顧客と商品の関係性「商品Ａ、未購入」を用いて、商品の購入有無を問い合わせるアンケートＱ３と、購入商品の満足度を問い合わせるアンケートＱ４とをアンケートの対象外とする。評価取得部４４は、行動認識部４３により特定された行動およびしぐさ「不満げ」を用いて、アンケートＱ５の「サービスに満足されましたか？」に「不満」を自動入力する。

　さらに、評価取得部４４は、関係性特定部４２により特定された顧客と商品の関係性「商品Ａ、未購入」と、行動認識部４３により特定された行動およびしぐさ「不満げ」とを用いて、「なぜ商品を購入しなかったのか、なぜ不満げなのか」を特定する。つまり、評価取得部４４は、「なぜ？」が顧客の心理的な評価に該当すると判定する。この結果、評価取得部４４は、アンケートに含まれる項目のうち、「なぜ？」に該当するＱ６の「サービスに不満な理由をお聞かせ下さい。」を部分アンケート６１として選択し、顧客ＤＢ１３に記憶される「通知先」に送信する。

　そして、評価取得部４４は、部分アンケート６１の回答「店員が不親切」を受信した場合、顧客の心理的な評価を「店員が不親切」に決定する。なお、評価取得部４４は、関係性の特定結果と行動認識の結果との組合せごとに５Ｗ１Ｈの少なくとも１つを対応付けた管理データを用いて、どのアンケート項目を部分アンケートに選択するかを決定することもできる。また、一般的には、「なぜ」のアンケートが最も欲しい情報であることから、評価取得部４４は、「なぜ」に該当するアンケート項目のみを部分アンケートとして、送信することもできる。

　登録部４５は、分析結果ＤＢ１９に、関係性特定部２３により特定された顧客２と商品の関係性に関連する情報と、評価取得部４４により取得された顧客２の心理的な評価とを対応づけて登録する処理部である。具体的には、登録部４５は、特定された時間、場所および関係性に関連する情報と、部分アンケートの回答結果とを対応付けて、分析結果ＤＢ１９に登録をする。

　図１５は、分析結果の登録を説明する図である。図１５に示すように、登録部４５は、アンケートの項目のうち、評価取得部４４により自動入力された「女性、３０代、来店２回以上、サービスに不満足」を取得するとともに、部分アンケート６１の結果「店員が不親切」を取得する。そして、登録部４５は、取得した「女性、３０代、来店２回以上、サービスに不満足、店員が不親切」を分析結果ＤＢ１９に登録をする。

　なお、登録部４５は、関係性特定部４２により関係性が特定された映像データ内のフレームの時間、当該映像データを撮像したカメラ２の場所などの各種情報を分析結果ＤＢ１９に登録をすることもできる。例えば、登録部４５は、時間「１３：００」、場所「商品棚ＹＹ」、関係性に関する情報「商品Ａを手に持った」や「商品棚ＹＹに立ち止まった」などを分析結果ＤＢ１９に登録をすることもできる。また、登録部４５は、顧客情報および部分アンケートの回答結果のみを分析結果ＤＢ１９に登録をすることもできる。つまり、登録部４５は、ユーザが要望する任意の分析項目を登録することができる。

＜処理の流れ＞
　図１６は、実施例１にかかる処理の流れを示すフローチャートである。なお、ここでは、１人の顧客が入店してから退店するまでの処理を例示として説明するが、運用処理部４０は、１人の顧客の追従することは要求されず、各カメラ２に写る各映像データを用いて上記処理を実行することができる。その場合、運用処理部４０は、入店時の映像データに写っている各人物を認識して識別子などを付与することで、各顧客を区別することができる。また、事前処理は完了済とする。

　図１６に示すように、情報処理装置１０の運用処理部４０は、顧客２の入店を検出すると（Ｓ１０１：Ｙｅｓ）、入店者を特定し、顧客情報を取得する（Ｓ１０２）。

　続いて、運用処理部４０は、映像データを取得すると（Ｓ１０３：Ｙｅｓ）、映像データと関係性モデル１７とを用いて、顧客と商品の関係性を特定し（Ｓ１０４）、映像データと行動認識モデル１８とを用いて、顧客の商品に対する行動やしぐさを特定する（Ｓ１０５）。

　その後、退店が検出されるまで（Ｓ１０６：Ｎｏ）、Ｓ１０３以降が繰り返され、退店が検出された場合（Ｓ１０６：Ｙｅｓ）、運用処理部４０は、特定された関係性や行動、しぐさを用いて、アンケート内容を決定する（Ｓ１０７）。

　そして、運用処理部４０は、決定されたアンケート内容を問い合わせるアンケート（部分アンケート６１）を送信し（Ｓ１０８）、アンケート結果を受信すると（Ｓ１０９：Ｙｅｓ）、分析結果を生成し（Ｓ１１０）、分析結果を分析結果ＤＢ１９に登録する（Ｓ１１１）。

＜効果＞
　上述したように、情報処理装置１０は、アンケートの項目数のうち、ほとんどの項目を映像データから自動入力し、映像データから特定できないアンケート項目のみを送信することができる。したがって、情報処理装置１０は、顧客の負担を軽減してアンケートに回答する顧客数の増加を実現し、より有益な情報の収集を可能とし、データベースの構築にかかる処理量を削減することができる。

　また、情報処理装置１０は、ピンポイントでのアンケート送信を実現することができるので、回答者のアンケート忌避感の軽減や回答率の向上を実現することができる。

　ところで、実施例１では、顧客と商品との関係性を特定する例として、ＨＯＩＤ用のモデルを用いた例を説明したが、これに限定されるものではなく、映像データに含まれる各対象物の関係を示すグラフデータの一例であるシーングラフを用いることもできる。

　そこで、実施例２では、運用処理部４０の関係性特定部４２が、シーングラフを用いて、顧客と商品との関係性を特定する例を説明する。シーングラフは、映像データ内の各画像データに含まれる各物体（人物や商品など）と、各物体間の関係性が記述されるグラフデータである。

　図１７は、シーングラフの一例を示す図である。図１７に示すように、シーングラフは、画像データに写るオブジェクトをノードとし、各ノードは属性（例えばオブジェクトの種類）を有し、ノード間に関係する関係性を有向エッジとする有向グラフである。図１７の例では、属性「店員」のノード「人」から属性「客」のノード「人」への関係性「話す」であることが示されている。すなわち、「店員が客と話す」の関係を有することが定義される。また、属性「客」のノード「人」から属性「大型」のノード「商品」への関係性「立つ」であることが示されている。すなわち、「客が大型商品の商品棚の前に立つ」の関係を有することが定義される。

　ここで示した関係性は、あくまで一例である。例えば、「持つ」などの単純な関係性に限らず、「商品Ａを右手に持つ」などの複雑な関係性が含まれる。なお、人と人の関係性に対応するシーングラフと、人と物の関係性に対応するシーングラフのそれぞれを記憶してもよく、各関係性を含む１つのシーングラフを記憶してもよい。また、シーングラフは、後述する制御部２０により生成されるが、予め生成されたデータを使用してもよい。

　続いて、シーングラフの生成について説明する。図１８は、人と物の関係性を示すシーングラフの生成例を説明する図である。図１８に示すように、事前処理部３０は、画像データを訓練済みの認識モデルに入力し、認識モデルの出力結果として、ラベル「人（男性）」、ラベル「飲み物（緑）」、関係「持つ」を取得する。つまり、事前処理部３０は、「男性が緑の飲み物を持っている」ことを取得する。この結果、事前処理部３０は、属性「男性」を有するノード「人」から、属性「緑」を有するノード「飲み物」への関係性「持つ」を関係づけるシーングラフを生成する。なお、シーングラフの生成は、あくまで一例であり、他の手法を用いることもでき、管理者等が手動で生成することもできる。

　次に、シーングラフを用いた関係性の特定について説明する。関係性特定部４２は、シーングラフにしたがって、映像データに写る人物と人物との関係性、または、人物と物との関係性を特定する関係性特定処理を実行する。具体的には、関係性特定部４２は、映像データに含まれるフレームごとに、フレームに写る人の種類や物の種類を特定し、特定した各情報を用いてシーングラフを検索して関係性を特定する。そして、関係性特定部４２は、特定された関係性を、各処理部に出力する。

　図１９は、シーングラフによる関係性の特定を説明する図である。図１９に示すように、関係性特定部４２は、フレーム１に対して、フレーム１を機械学習済みの機械学習モデルに入力して得られる結果やフレーム１に対する公知の画像解析により、フレーム１内の人の種類、物の種類、人物の人数などを特定する。例えば、関係性特定部４２は、人の種類として「人（客）」、物の種類「商品（商品Ａ）」とを特定する。その後、関係性特定部４２は、シーングラフにしたがって、属性「客」のノード「人」と、属性「食品」のノード「商品Ａ」との関係性「人（客）が商品（商品Ａ）を持つ」を特定する。関係性特定部４２は、フレーム２やフレーム３などの後続の各フレームについても上記関係性特定処理を実行することで、フレームごとに関係性を特定する。

　上述したように、実施例２にかかる情報処理装置１０は、例えば店舗ごとに生成したシーングラフを用いることで、機械学習モデルなどのように店舗に合わせた再学習を行うことなく、容易に店舗に適した関係性の判定を実行することができる。したがって、実施例２にかかる情報処理装置１０は、本実施例でシステムの導入などを容易に実行することができる。

　ところで、上述した行動認識モデル１８として、映像データから人物の行動やしぐさを認識する機械学習モデル以外にも、２値クラスの分類を行う機械学習モデルを用いることもできる。すなわち、行動認識モデル１８として、アンケート送付対象の行動またはしぐさに該当する「迷った」行動を検出するモデルを用いることができる。

　図２０は、実施例３にかかる行動認識モデル１８を説明する図である。図２０に示すように、行動認識モデル１８は、画像データの入力に応じて、クラス１「商品の購入に迷った」またはクラス２「商品の購入に迷わなかった」の２値を判定する。なお、行動認識モデル１８の出力結果には、各クラスの信頼度（例えば確率値）が含まれる。

　次に、実施例３にかかる行動認識モデル１８の訓練について説明する。図２１は、実施例３にかかる行動認識モデル１８の機械学習について説明する図である。図２１に示すように、事前処理部３０は、説明変数として人物が商品を選んでいる状態が写っている「画像データ」、目的変数である正解ラベルとして「迷った」または「迷わなかった」を有する訓練データを、行動認識モデル１８に入力し、行動認識モデル１８の出力結果を取得する。その後、事前処理部３０は、行動認識モデル１８の出力結果と、正解ラベルとの誤差が小さくなるように、行動認識モデル１８のパラメータ更新を実行する。このようにして、事前処理部３０は、行動認識モデル１８の訓練を実行し、行動認識モデル１８を生成する。

　次に、訓練済みの行動認識モデル１８を用いてアンケート送信について説明する。図２２は、実施例３にかかる行動認識モデル１８を用いたアンケート送信を説明する図である。図２２に示すように、運用処理部４０は、カメラ２に撮像された映像データ内の各フレームを行動認識モデル１８に入力し、行動認識モデル１８の出力結果を取得する。

　そして、運用処理部４０は、行動認識モデル１８の出力結果として、クラス１「迷った」が取得されるとともに、クラス１「迷った」の信頼度とクラス２「迷わなかった」の信頼度との差が閾値以上であり、出力結果が高信頼度の場合は、アンケート送信を抑制する。

　一方、運用処理部４０は、行動認識モデル１８の出力結果として、クラス１「迷った」が取得されるとともに、クラス１「迷った」の信頼度とクラス２「迷わなかった」の信頼度との差が閾値未満であり、出力結果が低信頼度の場合は、アンケート送信を実行する。なお、運用処理部４０は、行動認識モデル１８の出力結果として、クラス２「迷っていない」が取得された場合は、信頼度の差に関わらず、アンケート送信を実行する。

　つまり、運用処理部４０は、クラス１「迷った」が特定された場合の信頼度に応じて、アンケート送信の制御を実行する。

　さらに、運用処理部４０は、アンケート結果を用いて再訓練データを生成することもできる。例えば、運用処理部４０は、画像データＡＡを行動認識モデル１８に入力して得られた出力結果がクラス１「迷った」かつ低信頼度であることから、アンケート送信を実行し、アンケートの回答として「迷わなかった」を受信したとする。この場合、運用処理部４０は、説明変数として「画像データＡＡ」、目的変数として「迷わなかった」を有する再訓練用の訓練データを生成することができる。事前処理部３０は、この再訓練用の訓練データを用いて行動認識モデル１８の再訓練を実行することで、行動認識モデル１８の認識精度を向上させることができる。

　なお、ここで送信されるアンケートは、上述した部分アンケート６１でもよい。例えば、運用処理部４０は、認識結果が第１の条件の一例である「クラス１「迷った」かつ高信頼度」の場合、実施例１で説明した自動取得を用いて分析結果を登録する。一方、運用処理部４０は、認識結果が第２の条件の一例である「クラス１「迷った」かつ低信頼度」または「クラス２「迷わなかった」」の場合、実施例１で説明した自動取得および部分アンケートの回答結果を用いて分析結果を登録する。

　また、送信されるアンケートは、実施例１で説明したアンケート全体でもよく、予め用意した別の質問情報でもよい。つまり、運用処理部４０は、実施例１の関係性特定処理や、行動およびしぐさの特定処理などを実行せず、実施例３の行動認識モデル１８により高信頼度のクラス１「迷った」が検出された場合にのみ、アンケート６０の送信を実行することもできる。

　また、２値分類に限らず、多値分類を行う行動認識モデル１８を用いることもできる。例えば、行動認識モデル１８は、クラス１「非常に迷った」、クラス２「迷った」、クラス３「迷わなかった」、クラス４「どちらでもない」などの多値クラス分類を行う。この場合、行動認識モデル１８は、信頼度が最も大きいクラスと信頼度が２番目に大きいクラスとの差が閾値以上であれば、実施例１で説明した自動取得を用いて分析結果を登録する。一方、行動認識モデル１８は、信頼度が最も大きいクラスと信頼度が２番目に大きいクラスとの差が閾値未満であれば、実施例１で説明した自動取得および部分アンケートの回答結果を用いて分析結果を登録する。

　このように、実施例３にかかる情報処理装置１０は、行動認識モデル１８の認識結果の信頼度に応じてアンケート送信を制御することができるので、顧客の心理的な評価が悪い状態に限らず、顧客の心理的な評価が少し悪い状態であっても、アンケートによるユーザ評価を取得することができる。この結果、情報処理装置１０は、正確な分析結果を収集することができる。

　ところで、例えば、高齢者や不満気な客など、条件を絞り込んで個人対象のアンケートを実施したい場合がある。人手を介さない自動アンケートの場合、スマホなどの個人端末にアンケートを送付できれば個人対象のアンケートを実施できるが、小売店舗などでは来客の個人情報が不明で個人端末へアンケートを送付できない場合がある。このような場合でも、情報処理装置１０は、顧客の端末に限らず、任意の場所にアンケートを送信することができる。

　図２３は、実施例４にかかるアンケート送信を説明する図である。図２３に示すように、情報処理装置１０の運用処理部４０は、アンケート６０または部分アンケート６１を、セルフレジ７０のディスプレイや店舗２のサイネージ８０に送信することができる。

　ところが、タッチ機能付きデジタルサイネージなどの店舗２の設備を用いて個人対象アンケートを実施しようとする場合、対象者とは別の来客がアンケートに回答してしまい、条件を絞り込んだアンケートが成立しない可能性がある。

　そこで、情報処理装置１０は、アンケート回答用サイネージ、アンケート対象者、対象者以外の周辺の人物、の各位置関係と、各人物の姿勢の情報とを用いて、対象者しかアンケートに回答し得ない状況でのみ、サイネージにアンケート回答用の画面を表示し、アンケート回答を促す。

　例えば、情報処理装置１０は、顧客または商品を含む第一のエリアを撮影した映像を分析することで、映像に含まれる複数の人物のうち顧客の商品に対する状態を特定する。情報処理装置１０は、顧客の商品に対する状態に基づいて、顧客または商品に関連するアンケートを生成する。そして、情報処理装置１０は、サイネージを含む第二のエリアを撮影した映像を分析することで、サイネージに対する複数の顧客それぞれの位置および向きを特定する。その後、情報処理装置１０は、特定された位置および向きに基づいて、特定の顧客がサイネージに最も接近しサイネージを向いている状態であるとともに他の顧客が特定の顧客からサイネージから離れていてサイネージを向いていないときに、サイネージに特定の顧客に対するアンケートを表示させる。

　図２４は、実施例４にかかるアンケート送信の具体例を説明する図である。図２４に示すように、情報処理装置１０の運用処理部４０は、映像データ内の各画像データ（各フレーム）を行動認識モデル１８に入力して、各画像データに写っている人物の位置および向きを特定する。ここで、運用処理部４０は、関係性特定部４２の処理結果から、商品を手に持った顧客、支払いを行った顧客、商品棚の前に一定時間以上滞在した顧客を、アンケート対象者（特定の顧客）と特定する。

　そして、運用処理部４０は、図２４の（ａ）に示すように、各画像データに写っている人物の位置および向きにより、アンケート対象者がサイネージ８０の方を向いて操作可能な位置にいるとともに、アンケート非対象者がサイネージ８０の方を向いておらず、操作可能な位置にいないと特定された場合に、サイネージ８０にアンケートを表示する。

　一方、運用処理部４０は、図２４の（ｂ）に示すように、各画像データに写っている人物の位置および向きにより、アンケート対象者がサイネージ８０の方を向いておらず、アンケート非対象者がサイネージ８０の方を向いて操作可能な位置にいると特定された場合に、サイネージ８０にアンケートを表示しない。

　また、運用処理部４０は、図２４の（ｃ）に示すように、各画像データに写っている人物の位置および向きにより、アンケート対象者がサイネージ８０の方を向いているが操作可能な位置におらず、アンケート非対象者がサイネージ８０の方を向いていないと特定された場合に、アンケート対象者がサイネージ８０に近づくようなメッセージを表示する。

　図２５は、実施例４にかかる処理の流れを示すフローチャートである。図２５に示すように、運用処理部４０は、現場の映像データを取得し（Ｓ２０１）、映像データの分析を実行する（Ｓ２０２）。例えば、運用処理部４０は、関係性の特定、人物の位置や向きの特定、行動やしぐさの特定などを実行する。

　続いて、運用処理部４０は、アンケート対象者およびアンケート表示条件の判定を実行する（Ｓ２０３）。例えば、運用処理部４０は、予め定められたアンケート内容や対象者条件を読み込み、分析結果を用いて表示条件に該当するか否かを判定する。

　ここで、運用処理部４０は、アンケートを表示しないと判定した場合（Ｓ２０４：Ｎｏ）、Ｓ２０１以降を繰り返す。一方、運用処理部４０は、アンケートを表示すると判定した場合（Ｓ２０４：Ｙｅｓ）、サイネージ８０などの表示装置へのアンケート表示と回答受付を実行する（Ｓ２０５）。

　その後、運用処理部４０は、アンケートの回答入力を受け付けると（Ｓ２０６：Ｙｅｓ）、アンケートの記録を実行し（Ｓ２０７）、アンケートの非表示を実行する（Ｓ２０９）。一方、運用処理部４０は、アンケートの回答入力を受け付けず（Ｓ２０６：Ｎｏ）、タイムアウトに達するまで（Ｓ２０８：Ｎｏ）、サイネージ８０などの表示装置へのアンケート表示と回答受付を実行する（Ｓ２０５）。なお、運用処理部４０は、アンケートの回答入力を受け付けず（Ｓ２０６：Ｎｏ）、タイムアウトに達した場合（Ｓ２０８：Ｙｅｓ）、アンケートの非表示を実行する（Ｓ２０９）。

　なお、運用処理部４０は、特に大画面のサイネージ８０などの場合には、分析に用いないダミーアンケートを表示することもできる。図２６は、実施例４にかかるサイネージのアンケート表示例を説明する図である。

　図２６に示すように、運用処理部４０は、各画像データに写っている人物の位置および向きにより、アンケート対象者とアンケート非対象者との各位置および各向きを特定する。そして、運用処理部４０は、アンケート対象者と対面するサイネージ８０の領域にはアンケート６２を表示し、アンケート非対象者と対面するサイネージ８０の領域にはダミーのアンケート６３を表示する。

　その後、運用処理部４０は、アンケート６２の回答結果を分析結果として登録し、ダミーのアンケート６３の回答結果は破棄する。なお、ダミーアンケート６３の回答結果は、同行者の情報として管理することも有益である。

　このように、情報処理装置１０は、監視カメラ等の映像を用い、アンケート回答用のサイネージ８０とアンケート対象者およびその周辺にいる人物の位置や姿勢を判定する。情報処理装置１０は、アンケート回答用のサイネージ８０に最も近付いている人物がアンケート対象者で、かつ対象者がサイネージ８０に体を向け、かつ対象者以外がサイネージ８０に体を向けていないという条件下でのみ、サイネージ８０にアンケート回答用の画面を表示する。この結果、情報処理装置１０は、アンケート対象でない人物がアンケートに回答してしまい、回答の質が低下する状況を防止することができる。

　さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。

＜数値等＞
　上記実施例で用いた数値例、カメラ数、ラベル名、ルール例、行動例、状態例等は、あくまで一例であり、任意に変更することができる。また、各フローチャートで説明した処理の流れも矛盾のない範囲内で適宜変更することができる。また、上記実施例では、店舗を例にして説明したが、これに限定されるものではなく、例えば倉庫、工場、教室、電車の車内や飛行機の客室などにも適用することができる。

＜システム＞
　上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

　さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

＜情報処理装置１０のハードウェア＞
　図２７は、情報処理装置１０のハードウェア構成例を説明する図である。図２７に示すように、情報処理装置１０は、通信装置１０ａ、ＨＤＤ（Hard　Disk　Drive）１０ｂ、メモリ１０ｃ、プロセッサ１０ｄを有する。また、図２７に示した各部は、バス等で相互に接続される。

　通信装置１０ａは、ネットワークインタフェースカードなどであり、他の装置との通信を行う。ＨＤＤ１０ｂは、図４に示した機能を動作させるプログラムやＤＢを記憶する。

　プロセッサ１０ｄは、図４に示した各処理部と同様の処理を実行するプログラムをＨＤＤ１０ｂ等から読み出してメモリ１０ｃに展開することで、図４等で説明した各機能を実行するプロセスを動作させる。例えば、このプロセスは、情報処理装置１０が有する各処理部と同様の機能を実行する。具体的には、プロセッサ１０ｄは、事前処理部３０と運用処理部４０等と同様の機能を有するプログラムをＨＤＤ１０ｂ等から読み出す。そして、プロセッサ１０ｄは、事前処理部３０と運用処理部４０等と同様の処理を実行するプロセスを実行する。

　このように、情報処理装置１０は、プログラムを読み出して実行することで情報処理方法を実行する情報処理装置として動作する。また、情報処理装置１０は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、情報処理装置１０によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、上記実施例が同様に適用されてもよい。

　このプログラムは、インターネットなどのネットワークを介して配布されてもよい。また、このプログラムは、ハードディスク、フレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＭＯ（Magneto－Optical　disk）、ＤＶＤ（Digital　Versatile　Disc）などのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行されてもよい。

＜サイネージ８０のハードウェア＞
　図２８は、サイネージ８０のハードウェア構成例を説明する図である。図２８に示すように、サイネージ８０は、通信装置８０ａ、タッチパネル８０ｂ、ＨＤＤ８０ｃ、メモリ８０ｄ、プロセッサ８０ｅを有する。また、図２８に示した各部は、バス等で相互に接続される。

　通信装置８０ａは、ネットワークインタフェースカードなどであり、他の装置との通信を行う。タッチパネル８０ｂは、アンケートを表示し、アンケートの回答を受け付ける。ＨＤＤ８０ｃは、各種プログラムやＤＢを記憶する。

　プロセッサ８０ｅは、実施例４で説明した処理と同様の処理を実行するプログラムをＨＤＤ８０ｃ等から読み出してメモリ８０ｄに展開することで、各処理を実行するプロセスを動作させる。例えば、このプロセスは、アンケートの受信、アンケートの表示、アンケートの回答受付と同様の機能を実行する。

　このように、サイネージ８０は、プログラムを読み出して実行することで表示方法を実行する情報処理装置として動作する。また、サイネージ８０は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、サイネージ８０によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、上記実施例が同様に適用されてもよい。

　このプログラムは、インターネットなどのネットワークを介して配布されてもよい。また、このプログラムは、ハードディスク、フレキシブルディスク、ＣＤ－ＲＯＭ、ＭＯ、ＤＶＤなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行されてもよい。

　１０　情報処理装置
　１１　通信部
　１２　記憶部
　１３　顧客ＤＢ
　１４　アンケートＤＢ
　１５　映像データＤＢ
　１６　訓練データＤＢ
　１７　関係性モデル
　１８　行動認識モデル
　１９　分析結果ＤＢ
　２０　制御部
　３０　事前処理部
　４０　運用処理部
　４１　取得部
　４２　関係性特定部
　４３　行動認識部
　４４　評価取得部
　４５　登録部
　８０　サイネージ

Claims

　コンピュータに、
　映像データを取得し、
　取得した前記映像データを機械学習モデルに入力することで、前記映像データに含まれる人物の行動のクラスと、クラスの信頼度とを特定し、
　特定された前記信頼度に基づいて、特定された前記クラスに関連する質問情報を生成する、
　処理を実行させることを特徴とする生成プログラム。
　前記特定する処理は、
　人物と物体とを含む画像データと、人物の物体に対する行動を示すクラスとを含む訓練データとに基づいて、複数のクラスに分類するように機械学習された前記機械学習モデルを取得し、
　取得をした前記機械学習モデルに対して前記映像データに含まれる人物を入力することで、複数のクラスのそれぞれにおける信頼度を特定し、
　特定をされた前記信頼度が高い最も高い第１のクラスと信頼度が２番目に高い第２のクラスとの信頼度の差を算出し、
　算出をされた前記信頼度の差が所定の条件を満たすときに、前記映像データに含まれる人物と、物体に関連する質問情報とを対応づけたアンケートを出力する
　ことを特徴とする請求項１に記載の生成プログラム。
　前記特定する処理は、
　特定をされた前記信頼度が高い最も高い第１のクラスと信頼度が２番目に高い第２のクラスとの信頼度の差を算出し、
　算出をされた前記信頼度の差が第一の条件を満たすときに、記憶部に記憶されたデータベースが有する複数の項目のうち、特定されたクラスに関連する項目に対して、特定されたクラスに関連する情報を登録し、
　算出をされた前記信頼度の差が第二の条件を満たすときに、前記記憶部に記憶されたデータベースが有する複数の項目のうち、特定されたクラスに関連する項目に対して、前記人物が端末を通じて入力をされた前記アンケートへの回答結果を登録する、
　ことを特徴とする請求項２に記載の生成プログラム。
　前記映像データを説明変数、前記アンケートへの回答結果を目的変数とする再訓練用の訓練データを生成し、
　前記再訓練用の訓練データを用いて、前記機械学習モデルの再訓練を実行する、
　処理を前記コンピュータに実行させることを特徴とする請求項３に記載の生成プログラム。
　コンピュータが、
　映像データを取得し、
　取得した前記映像データを機械学習モデルに入力することで、前記映像データに含まれる人物の行動のクラスと、クラスの信頼度とを特定し、
　特定された前記信頼度に基づいて、特定された前記クラスに関連する質問情報を生成する、
　処理を実行することを特徴とする生成方法。
　映像データを取得し、
　取得した前記映像データを機械学習モデルに入力することで、前記映像データに含まれる人物の行動のクラスと、クラスの信頼度とを特定し、
　特定された前記信頼度に基づいて、特定された前記クラスに関連する質問情報を生成する、
　制御部を有することを特徴とする情報処理装置。