以下、本発明の一実施形態について添付図面を参照して詳細に説明する。ただし、この実施形態は例示であり、本発明はこれに限定されるものではない。
(1)学習データ生成システム及び推定システムの基本構成
図1は、本発明の一実施形態に係る学習データ生成システム及び推定システムの基本構成を概略的に示す図である。図1に示すように、本実施形態に係る学習データ生成システムでは、例えば屋内等の所定空間SPに動体(本実施形態では、対象者T)が存在する場合に、空間SP内の所定位置(図1の例では、空間SPの中央上部)に設けられた撮像装置10によって撮像された対象者Tの画像と、計測装置20によって計測された対象者Tの状態に関する情報と、を生成装置30が取得するようになっている。
また、生成装置30は、所定期間内に撮像された画像に基づいて推定された対象者Tの当該所定期間内の位置及び行動のうち少なくとも一方に関する情報を取得し、当該所定期間内の対象者Tの状態に関する情報に対して、対象者Tの当該所定期間内の位置及び行動のうち少なくとも一方に関する情報をラベルとして付与することによって、対象者Tの状態に関する情報に基づいて対象者Tの位置及び行動のうち少なくとも一方を推定するための学習データを生成するようになっている。ここで、撮像装置10及び計測装置20の各々と、生成装置30とは、例えばインターネットやLAN(Local Area Network)等の通信網NW(ネットワーク)に接続されている。
また、本実施形態に係る行動推定システムでは、生成装置30は、計測装置20によって計測された対象者Tの状態に関する情報を取得すると、取得した対象者Tの状態に関する情報と、学習データ生成システムによって生成された学習データを用いた機械学習に基づく学習済モデルと、に基づいて、対象者Tの位置及び行動のうち少なくとも一方を推定するようになっている。
撮像装置10は、例えば、動画像及び/又は静止画像を撮像する撮像装置(例えば、デジタルカメラやデジタルビデオカメラ等)であってもよく、空間SP内の所定位置において空間SPを撮像するように設けられている。また、撮像装置10は、例えば、所定のフレームレート(例えば、30fps(flames per second)等)で撮像処理を行って、撮像した画像を、通信網NWを介して生成装置30に送信するように構成されている。なお、撮像装置10は、生成装置30から所定の撮像指示信号を受信した場合に撮像処理を行ってもよい。
ここで、撮像装置10は、全方位画像(例えば、周囲360°(図1の例では、水平方向の周囲360°)の画像)を撮像する撮像装置(例えば、全方位カメラ等)であってもよい。この場合、撮像範囲が広がることによって、対象者Tの行動を広範囲に亘って把握することができる。
また、撮像装置10は、赤外線画像を撮像する撮像装置(例えば、赤外線カメラ等)であってもよい。これにより、例えば、対象者Tが、視界の悪い環境(例えば、夜間、暗い場所、悪天候の場所等)に存在している場合であっても、例えば学習データの生成者等は、学習データを生成する際に、撮像画像を参照することによって対象者Tの行動を把握することができる。
さらに、撮像装置10は、ステレオ画像を撮像する撮像装置(例えば、ステレオカメラ等)であってもよい。ここで、ステレオ画像とは、例えば、所定の視差を有する2つの画像のセットであってもよい。
なお、本実施形態では、1つの撮像装置10を用いて空間SPを撮像する場合を一例として説明しているが、複数の撮像装置(例えば、水平方向及び/又は垂直方向に間隔をおいて設けられた2つの撮像装置等)を用いて空間SPを撮像してもよい。
計測装置20は、対象者Tの状態を連続的又は断続的(例えば、所定間隔(例えば300ミリ秒や1秒等)毎)に計測する装置である。ここで、対象者Tの状態に関する情報とは、例えば、対象者Tの身体状態を表す値であってもよいし、対象者Tの身体状態を表す値を所定の計算式に代入することによって得られた値であってもよいし、対象者Tの身体状態の度合いを表す情報であってもよいし、対象者Tの位置に関する情報であってもよい。また、対象者Tの位置に関する情報は、例えば、一方の装置が送信した信号を他方の装置が受信したときの受信信号強度(RSSI)に関する情報を含んでもよい。さらに、受信信号強度に関する情報は、例えば、受信信号強度の値であってもよいし、受信信号強度の値を所定の計算式に代入することによって得られた値であってもよいし、受信信号強度の度合いを表す情報であってもよい。
計測装置20は、例えば、対象者Tの身体状態(例えば、3軸方向の加速度(対象者Tの所定部位の加速度であってもよい)、3軸方向の角速度(対象者Tの所定部位の角速度であってもよい)、心拍数(脈拍)、血圧、体温、発汗量、歩数、歩行速度、姿勢、運動強度(例えば、心拍数÷最大心拍数)又は消費カロリー等)を計測する装置(例えば、心拍計、血圧計、体温計、発汗計、3軸加速度センサ、3軸ジャイロセンサ、モーションセンサ等)であってもよい。
また、計測装置20は、図1に示すように、対象者Tが所持可能又は対象者Tの身体に装着可能な第1計測装置21と、空間SP内の異なる位置にそれぞれ配置された複数(図1の例では、3つ)の第2計測装置22であって、第1計測装置21が空間SP内に存在する場合に第1計測装置21と無線通信を行う複数の第2計測装置22と、から構成されてもよい。
この場合、第1計測装置21は、空間SP内に存在する場合に、所定の無線通信方式(例えば、無線LAN(例えば、Wi-Fi(登録商標)))を用いて複数の第2計測装置22と無線通信を行うことができるように構成されてもよい。また、第1計測装置21は、複数の第2計測装置22との間で無線通信を行うために、自身の識別情報(例えば、MAC(Media Access Control)アドレス等)を含む無線信号(例えば、プローブ要求等)を所定間隔(例えば、数百ミリ秒間隔等)で送信するように構成されてもよい。さらに、第1計測装置21は、例えば、対象者Tに装着可能なデバイス(例えば、ウェアラブルデバイス)であってもよいし、対象者Tが所持可能な携帯型デバイスであってもよい。さらにまた、第1計測装置21は、例えば、携帯端末、スマートフォン、PDA(Personal Digital Assistant)、パーソナルコンピュータ、双方向の通信機能を備えたテレビジョン受像機(いわゆる多機能型のスマートテレビも含む。)等のように、個々のユーザによって操作される通信装置であってもよい。
複数の第2計測装置22は、空間SP内で所定の無線通信方式(例えば、無線LAN(例えば、Wi-Fi(登録商標)))を用いて第1計測装置21と無線通信を行うことが可能な位置に設けられてもよい。また、複数の第2計測装置22は、例えば、空間SP内に存在する2つ以上の第1計測装置21間の無線通信を中継する装置であってもよいし、第1計測装置21と空間SP内に存在する他の装置(図示省略)との間の無線通信を中継する装置であってもよいし、第1計測装置21と、通信網NWを介して接続された他の装置(例えば、生成装置30等)との間の通信を中継する装置であってもよい。また、複数の第2計測装置22は、パケットキャプチャであってもよい。
また、第1計測装置21と、複数の第2計測装置22と、のうち何れか一方には、他方が送信した信号を受信したときの受信信号強度(RSSI)を検出するRSSI回路が設けられていてもよい。さらに、この信号には、信号を送信した計測装置(第1計測装置21又は第2計測装置22)の識別情報(例えば、MACアドレス等)が含まれていてもよく、この信号の受信信号強度がRSSI回路によって検出されると、検出された受信信号強度と、この信号を送信した装置の識別情報と、が互いに対応付けられた状態で、この信号を受信した計測装置(第1計測装置21又は第2計測装置22)に設けられた記憶装置(図示省略)に記憶されてもよい。
なお、ここでは、Wi-Fi(登録商標)を用いて無線通信を行う場合を一例として説明しているが、通信方式は、この場合に限られない。例えば、Bluetooth(登録商標)、ZigBee(登録商標)、UWB、光無線通信(例えば、赤外線)等の無線通信方式が用いられてもよいし、USB等の有線通信方式が用いられてもよい。
計測装置20(第1計測装置21及び/又は複数の第2計測装置22)は、対象者Tの状態を検出する毎に、検出した状態に関する情報を、通信網NWを介して生成装置30に送信するように構成されている。
なお、本実施形態では、1つの第1計測装置21が対象者Tに設けられている場合を一例として説明しているが、複数の第1計測装置21が対象者Tに設けられてもよい。また、本実施形態では、3つの第2計測装置22が空間SP内に設けられている場合を一例として説明しているが、空間SP内に設けられる第2計測装置22の数は、2つ以下であってもよいし、4つ以上であってもよい。
さらに、撮像装置10及び計測装置20は、生成装置30との間で有線又は無線接続方式を用いて直接通信を行うように構成されてもよいし、所定の中継装置(図示省略)との間で有線又は無線接続方式を用いて情報の送受信を行うことによって、当該中継装置を介して生成装置30と通信を行うように構成されてもよい。
生成装置30は、通信網NWを介して撮像装置10及び計測装置20の各々と通信を行い、撮像装置10が撮像した画像と、計測装置20が計測した対象者Tの状態に関する情報とを、通信網NWを介して経時的に取得するように構成されている。生成装置30は、例えば、携帯端末、スマートフォン、PDA、パーソナルコンピュータ、双方向の通信機能を備えたテレビジョン受像機(いわゆる多機能型のスマートテレビも含む。)等のように、個々のユーザによって操作される端末装置であってもよい。
(2)生成装置の構成
図2を参照して生成装置30の構成について説明する。図2は、生成装置30の内部構成を示すブロック図である。図2に示すように、生成装置30は、CPU(Central Processing Unit)31と、ROM(Read Only Memory)32と、RAM(Random Access Memory)33と、記憶装置34と、表示処理部35と、表示部36と、入力部37と、通信インタフェース部38と、を備えており、各部間の制御信号又はデータ信号を伝送するためのバス30aが設けられている。
CPU31は、電源が生成装置30に投入されると、ROM32又は記憶装置34に記憶された各種のプログラムをRAM33にロードして実行する。本実施形態では、CPU31は、ROM32又は記憶装置34に記憶されたプログラムを読み出して実行することにより、後述する第1取得手段41、第2取得手段42、検出手段43、第3取得手段44、生成手段45、情報取得手段46、学習手段47及び推定手段48(図3に示す)の機能を実現する。
記憶装置34は、例えば、フラッシュメモリ、SSD(Solid State Drive)、磁気記憶装置(例えばHDD(Hard Disk Drive)、フロッピーディスク(登録商標)、磁気テープ等)、光ディスク等の不揮発性の記憶装置であってもよいし、RAM等の揮発性の記憶装置であってもよく、CPU31が実行するプログラムやCPU31が参照するデータを格納する。また、記憶装置34には、後述する第1取得データ(図4に示す)、第2取得データ(図5に示す)、第1学習データ(図8に示す)、第2学習データ(図9及び図10に示す)及び推定データ(図11及び図12に示す)が記憶されている。
表示処理部35は、CPU31から与えられる表示用データを表示部36に表示する。表示部36は、例えば、マトリクス状に画素単位で配置された薄膜トランジスタを含むLCD(Liquid Crystal Display)モニタであり、表示用データに基づいて薄膜トランジスタを駆動することで、表示されるデータを表示画面に表示する。
生成装置30が釦入力方式の装置である場合には、入力部37は、ユーザの操作入力を受け入れるための方向指示釦及び決定釦等の複数の指示入力釦を含む釦群と、テンキー等の複数の指示入力釦を含む釦群とを備え、各釦の押下(操作)入力を認識してCPU31へ出力するためのインタフェース回路を含む。
生成装置30がタッチパネル入力方式の装置である場合には、入力部37は、主として表示画面に指先又はペンで触れることによるタッチパネル方式の入力を受け付ける。タッチパネル入力方式は、静電容量方式等の公知の方式であってもよい。
また、生成装置30が音声入力可能な装置である場合には、入力部37は、音声入力用のマイクを含むように構成されてもよいし、外付けのマイクを介して入力された音声データをCPU31へ出力するためのインタフェース回路を備えてもよい。さらに、生成装置30が動画像及び/又は静止画像を入力可能な装置である場合には、入力部37は、画像入力用のデジタルカメラやデジタルビデオカメラを含むように構成されてもよいし、外付けのデジタルカメラやデジタルビデオカメラで撮像された画像データを受け付けてCPU31へ出力するためのインタフェース回路を備えてもよい。
通信インタフェース部38は、通信網NWを介して他の装置(例えば、撮像装置10及び計測装置20等)と通信を行うためのインタフェース回路を含む。
(3)学習データ生成システム及び推定システムにおける各機能の概要
本実施形態の学習データ生成システム及び推定システムで実現される機能について、図3を参照して説明する。図3は、本実施形態の学習データ生成システム及び推定システムで主要な役割を果たす機能を説明するための機能ブロック図である。図3の機能ブロック図では、第1取得手段41、第2取得手段42、第3取得手段44及び生成手段45が本発明の学習データ生成システムの主要な構成に対応しており、情報取得手段46及び推定手段48が本発明の推定システムの主要な構成に対応している。他の手段(検出手段43及び学習手段47)は必ずしも必須の構成ではないが、本発明をさらに好ましくするための構成要素である。
第1取得手段41は、撮像装置10によって撮像された対象者T(動体)の画像を取得する機能を備える。
第1取得手段41の機能は、例えば以下のように実現される。先ず、撮像装置10は、例えば、対象者Tが空間SP内に存在する場合に、所定のフレームレート(例えば、30fps等)で撮像処理を行い、撮像処理を行う毎に、撮像した画像の画像データを、通信網NWを介して生成装置30に送信する。ここで、撮像装置10によって撮像された画像の画像データは、撮像日時及び撮像装置10の識別情報(例えば、撮像装置10のシリアル番号やMAC(Media Access Control)アドレス等)と対応付けた状態で生成装置30に送信されてもよい。
一方、生成装置30のCPU31は、撮像装置10から送信された画像データを、通信インタフェース部38を介して受信(取得)する毎に、受信した画像データを、当該画像の撮像日時と対応付けた状態で例えば図4に示す第1取得データに記憶する。第1取得データは、画像の撮像日時毎に、当該画像の画像データが対応付けられた状態で記述されているデータである。このようにして、第1取得手段41は、撮像装置10によって撮像された対象者Tの画像を取得することができる。
なお、CPU31は、撮像装置10によって撮像された対象者T(動体)のステレオ画像を取得してもよい。この場合、対象者Tのステレオ画像に基づいて対象者Tの三次元モデルを生成することができるので、後述する検出手段43の機能において、この三次元モデルに基づいて、対象者Tの少なくとも1つの部位の三次元空間上の位置(座標)をもとめることが可能になる。これにより、例えば対象者Tの二次元モデルを用いる場合と比較して、対象者Tの少なくとも1つの部位の位置をより正確に捉えることが可能になるので、対象者Tの画像に基づく当該対象者Tの行動の推定精度を向上させることができる。
また、例えば、水平方向及び/又は垂直方向に間隔をおいて設けられた2つの撮像装置が空間SP内に設けられている場合には、CPU31は、各撮像装置が実質的に同じタイミングで撮像した2つの画像(例えば、撮像日時が同じ2つの画像であってもよいし、撮像日時の時間差が所定範囲(例えば、数ミリ秒~数十ミリ秒等)内の2つの画像等であってもよい)を、所定の視差を有する画像のセット(つまり、ステレオ画像)として取得してもよい。
第2取得手段42は、計測装置20によって計測された対象者T(動体)の状態に関する情報を取得する機能を備える。
ここで、対象者T(動体)の状態に関する情報は、計測装置20(第1計測装置21又は複数の第2計測装置22)が受信した信号の受信信号強度(RSSI)、対象者Tの加速度、対象者Tの角速度及び対象者Tの温度のうち少なくとも1つを含んでもよい。これにより、計測装置20が受信した信号のRSSI、対象者Tの加速度、対象者Tの角速度及び対象者Tの温度のうち少なくとも1つに基づいて、対象者Tの位置及び行動のうち少なくとも一方を推定するための学習データを生成することができる。
第2取得手段42の機能は、例えば以下のように実現される。先ず、第1計測装置21は、例えば、対象者Tが空間SP内に存在する場合に、対象者Tの状態(例えば、対象者Tの3軸方向又は2軸方向の加速度と、対象者Tの3軸方向又は2軸方向の角速度と、対象者Tの温度と、のうち少なくとも1つ)を連続的又は断続的(例えば、所定間隔(例えば300ミリ秒毎や1秒等)毎)に計測する毎に、計測した状態に関する情報を、通信網NWを介して生成装置30に送信する。ここで、第1計測装置21によって計測された対象者Tの状態に関する情報は、計測日時及び第1計測装置21の識別情報(例えば、第1計測装置21のシリアル番号やMACアドレス等)と対応付けた状態で生成装置30に送信されてもよい。
また、第1計測装置21は、例えば、対象者Tが空間SP内に存在する場合に、複数の第2計測装置22の各々と無線通信を行い、複数の第2計測装置22の各々から所定間隔(例えば、数百ミリ秒間隔等)で送信された無線信号(例えば、ビーコン信号等)を受信する毎に、RSSI回路によって検出(計測)された当該無線信号の受信信号強度(RSSI)の値を、第1計測装置21に設けられた記憶装置(図示省略)に記憶する。ここで、RSSIの値は、計測日時(例えば、第1計測装置21が当該RSSIの値に対応する無線信号を何れかの第2計測装置22から受信した日時)及び当該RSSIの値に対応する無線信号を送信した何れかの第2計測装置22の識別情報(例えば、第2計測装置22のシリアル番号やMACアドレス等)と対応付けられた状態で記憶されてもよい。そして、第1計測装置21は、所定期間(例えば、3秒毎等)が経過する毎に、当該所定期間内に第1計測装置21によって計測された対象者Tの状態に関する情報(つまり、当該所定期間内に第1計測装置21が複数の第2計測装置22から受信した全ての無線信号のRSSI)の値を、通信網NWを介して生成装置30に送信してもよい。ここで、所定期間内に第1計測装置21によって計測された対象者Tの状態に関する情報は、第1計測装置21の識別情報(例えば、第1計測装置21のシリアル番号やMACアドレス等)と対応付けた状態で生成装置30に送信されてもよい。
なお、ここでは、第1計測装置21が、複数の第2計測装置22の各々から送信された無線信号を受信したときのRSSIの値を、対象者Tの状態に関する情報として生成装置30に送信する場合を一例として説明したが、複数の第2計測装置22の各々が、第1計測装置21から送信された無線信号を受信したときのRSSIの値を、対象者Tの状態に関する情報として生成装置30に送信してもよい。
一方、生成装置30のCPU31は、計測装置20から送信された対象者Tの状態に関する情報を、通信インタフェース部38を介して受信(取得)する毎に、受信した状態に関する情報を、当該情報の計測日時と対応付けた状態で例えば図5に示す第2取得データに記憶する。第2取得データは、計測日時毎に、対象者Tの状態に関する情報(図の例では、「計測情報」)が対応付けられた状態で記述されているデータである。このようにして、第2取得手段42は、計測装置20によって計測された対象者Tの状態(ここでは、対象者Tの3軸方向又は2軸方向の加速度と、対象者Tの3軸方向又は2軸方向の角速度と、対象者Tの温度と、複数の第2計測装置22の各々から送信された無線信号のRSSIの値と、のうち少なくとも1つ)を取得することができる。
なお、生成装置30のCPU31は、第2取得手段42の機能に基づいて、対象者Tの3軸方向又は2軸方向の加速度の平均及び/又は分散と、対象者Tの3軸方向又は2軸方向の角速度の平均及び/又は分散と、対象者Tの温度と、複数の第2計測装置22の各々から送信された無線信号のRSSIの値と、のうち少なくとも1つを取得してもよい。
また、複数の第2計測装置22の各々から送信された無線信号を第1計測装置21が受信したときのRSSIに基づいて、第1計測装置21と複数の第2計測装置22の各々との距離、ひいては、空間SP内の第1計測装置21の位置(つまり、対象者Tの位置)をもとめることができる。具体的に説明すると、第1計測装置21と複数の第2計測装置22の各々との距離は、例えば、以下の式(1)及び(2)を用いることによって算出することができる。
P
r=P
t+G
r+G
t-L …(1)
式(1)中、P
rはRSSI(dBm)を示し、P
tは第2計測装置22の送信電力(dBm)を示し、G
rは第1計測装置21の受信アンテナの利得(dBi)を示し、G
tは第2計測装置22の送信アンテナの利得(dBi)を示し、Lは自由空間損失(dBm)を示している。このLは式(2)でもとめられ、式(2)中、dは第1計測装置21と第2計測装置22との距離(m)を示し、fは無線信号の周波数(Hz)を示し、cは光速(=2.99792458×10
8)(m/s)を示している。式(1)及び式(2)によってもとめられる距離とRSSIの値との関係は、例えば図6に示す対数関数で表される。図6に示すように、第1計測装置21と第2計測装置22との距離が短いほど、RSSI(図の例では、受信信号強度)の値が大きいことがわかる。
検出手段43は、取得した画像に基づいて、対象者T(動体)の少なくとも1つの部位を検出する機能を備える。
検出手段43の機能は、例えば以下のように実現される。生成装置30のCPU31は、例えば、第1取得手段41の機能に基づいて、撮像装置10から送信された画像データを第1取得データに記憶する毎に、対象者Tの少なくとも1つの部位の各々の位置に対応するノードを画像内に設定するとともに、各ノードの画像内の座標を算出してもよい。ここで、各ノードの設定及び座標の算出は、例えば、深層学習による特徴点(キーポイント)検出技術(例えば、OpenPose等)を用いて行われてもよい。また、各ノードの座標は、二次元座標であってもよいし、例えば、画像データ(ステレオ画像)によって対象者Tの三次元モデルが生成される場合には、三次元座標であってもよい。
なお、例えば、撮像装置10が全方位画像を撮像する場合には、CPU31は、撮像装置10が撮像した全方位画像をパノラマ画像に展開して、展開したパノラマ画像に対してノードの設定及びノードの座標の算出を行ってもよい。
また、対象者Tのステレオ画像が取得された場合には、CPU31は、所定の視差を有する画像のセットの各画像に対して事前処理(例えば、ノイズ除去等)を実行し、さらには、周知のステレオマッチング処理を実行して、対象者Tの三次元モデルを生成してもよい。
CPU31は、例えば図7に示すように、撮像装置10が撮像した画像において、対象者Tの少なくとも1つの部位(図の例では、「首」、「右肩」、「左肩」、「右臀部」、「左臀部」等)の位置(図の例では、X方向の座標及びY方向の座標)を検出し、検出した部位の各々に対応するノード(図の例では、14個のノード)を設定する。ここで、各ノードの座標は、各ノードが設定された画像に対応付けられた状態で第1取得データに記憶されてもよい。
第3取得手段44は、所定期間内に撮像された画像に基づいて推定された対象者T(動体)の当該所定期間内の位置及び行動のうち少なくとも一方に関する情報を取得する機能を備える。
また、第3取得手段44は、所定期間内の対象者T(動体)の少なくとも1つの部位の移動態様に基づいて推定された対象者Tの当該所定期間内の行動に関する情報を取得してもよい。これにより、所定期間内の対象者Tの状態に関する情報に対して、当該所定期間内の対象者Tの少なくとも1つの部位の移動態様に基づいて推定された対象者Tの行動に関する情報をラベルとして付与することができる。
さらに、第3取得手段44は、所定期間内の対象者T(動体)の移動態様に関する情報と、対象者Tの移動態様に関する情報を学習データとして用いた機械学習に基づく学習済モデルと、に基づいて推定された対象者Tの当該所定期間内の行動に関する情報を取得してもよい。これにより、学習済モデルを用いることによって、所定期間内に撮像された画像に基づいて、当該所定期間内の対象者Tの行動を容易に推定することができる。
第3取得手段44の機能は、例えば以下のように実現される。先ず、第3取得手段44が、所定期間内の対象者T(動体)の少なくとも1つの部位の移動態様に関する情報と、対象者Tの少なくとも1つの部位の移動態様に関する情報を学習データとして用いた機械学習に基づく学習済モデルと、に基づいて推定された対象者Tの当該所定期間内の行動に関する情報を取得する場合について説明する。
生成装置30のCPU31は、例えば、第1取得データにアクセスして、所定の撮像日時を起点として所定期間(例えば、3秒等)が経過する毎に、当該所定期間内に撮像された全ての画像データを抽出する。ここで、抽出された全ての画像データには、検出手段43の機能に基づいて検出された対象者Tの少なくとも1つの部位に対応するノードの各々の座標が対応付けられている。次に、CPU31は、抽出した全ての画像データから、対象者Tの少なくとも1つの部位(本実施形態では、「首」、「右肩」、「左肩」、「右臀部」、「左臀部」等)に対応するノードの各々の座標をさらに抽出する。これにより、所定期間内の対象者Tの少なくとも1つの部位の位置の時間推移に関する情報が得られる。ここで、所定期間内の対象者Tの少なくとも1つの部位の位置の時間推移に関する情報は、本発明の「所定期間内の動体の少なくとも1つの部位の移動態様に関する情報」の一例である。
次いで、CPU31は、対象者Tの少なくとも1つの部位に対応するノードの各々の座標(所定期間内の対象者Tの少なくとも1つの部位の位置の時間推移に関する情報)を、対象者Tの少なくとも1つの部位の移動態様に関する情報を第1学習データとして用いた機械学習に基づく学習済モデルに入力することによって、当該所定期間内の対象者Tの行動を撮像画像に基づいて推定してもよい。
第1学習データの一例を図8に示す。図8に示す第1学習データは、対象者Tが所定の行動(図の例では、「外装を外す」、「ケーブルを接続」、「本体にシールを貼る」、「バーコードを読み込む」、「組み立て」等の何れか)を行っている場合の対象者Tの少なくとも1つの部位(図の例では、「首」、「右肩」、「左肩」、「右臀部」、「左臀部」)の位置の所定期間内の時間推移を、当該行動(行動ラベル)に対応付けた状態で記述されているデータである。これにより、機械学習の結果として、所定の行動を行う対象者Tの少なくとも1つの部位の位置の所定期間内の時間推移と、当該行動との関係を示す学習済モデルが構成される。
なお、第1学習データに記述されるデータは、同一の対象者が異なる行動を行った場合のデータを含んでもよいし、異なる対象者が同一の行動を行った場合のデータを含んでもよい。
また、CPU31は、対象者Tの少なくとも1つの部位の移動態様に関する情報を第1学習データとして用いた機械学習によって、対象者Tの行動を撮像画像に基づいて推定するのに用いられるモデルを学習してもよい。
この場合、CPU31は、例えば、所定のモデル学習指示が入力部37を用いて入力されると、図8に示す第1学習データを用いてモデルの学習を行ってもよい。CPU31は、例えば、時系列対応型ニューラルネットワークモデルを用いて学習してもよい。ここで、時系列対応型ニューラルネットワークとして、例えば、RNN(Recurrent Neural Network)や、RNNの発展型であるLSTM(Long Short-Term Memory)等を適用することができる。また、CPU31は、例えば、畳み込みニューラルネットワーク(CNN)モデル、サポートベクターマシン(SVM)モデル、全結合ニューラルネットワーク(FNN)モデル、勾配ブースティング(HGB)モデル、ウェーブネット(WN)モデル等の複数のモデルのうち何れかのモデルを用いて学習してもよい。
このようにして、CPU31は、対象者Tの少なくとも1つの部位に対応するノードの各々の座標(所定期間内の対象者Tの少なくとも1つの部位の位置の推移に関する情報)を学習済モデルに入力することによって、当該所定期間内の対象者Tの行動(ここでは、「外装を外す」、「ケーブルを接続」、「本体にシールを貼る」、「バーコードを読み込む」、「組み立て」等の何れか)に関する情報を取得することができる。
なお、本実施形態では、CPU31が、生成装置30内に設けられたモデルを学習し、この学習済モデルを用いて、対象者Tの行動を撮像画像に基づいて推定する場合を一例として説明したが、この場合に限られない。例えば、対象者Tの行動を撮像画像に基づいて推定するのに用いられるモデルは、生成装置30以外の他の装置に設けられてもよい。この場合、CPU31は、対象者Tの少なくとも1つの部位に対応するノードの各々の座標(所定期間内の対象者Tの少なくとも1つの部位の位置の推移に関する情報)を、他の装置に設けられた学習済モデルに入力し、当該学習済モデルによって推定された行動に関する情報を受信(取得)してもよい。
また、本実施形態では、CPU31が、学習済モデルを用いて対象者Tの行動を推定する場合を一例として説明したが、この場合に限られない。例えば、CPU31は、所定期間内に撮像された全ての画像データを抽出した場合に、抽出した全ての画像データを表示部36に表示させてもよい。この場合、例えば学習データの生成者等は、表示部36に表示された画像を参照又は分析することによって、所定期間内の対象者Tの行動を視覚的に把握することが可能になる。また、CPU31は、例えば学習データの生成者等が、入力部37を用いて行動に関する情報を入力した場合に、入力された行動に関する情報を例えばRAM33又は記憶装置34等に記憶(取得)してもよい。
さらに、本実施形態では、対象者Tの複数(図の例では、5つ)の部位の各々の位置の時間推移に基づいて対象者Tの行動を推定する場合を一例として説明しているが、例えば、対象者Tの1つの部位の位置の時間推移に基づいて対象者Tの行動を推定してもよい。但し、それぞれの行動について特徴的な動きをする部位の数を多くするほど、行動の推定精度を向上させることができる。
次に、第3取得手段44が、所定期間内に撮像された画像に基づいて推定された対象者T(動体)の当該所定期間内の位置に関する情報を取得する場合について説明する。
生成装置30のCPU31は、例えば、第1取得データにアクセスして、所定の撮像日時を起点として所定期間(例えば、3秒等)が経過する毎に、当該所定期間内に撮像された全ての画像データを抽出する。次に、CPU31は、上述したように、抽出した全ての画像データから、対象者Tの少なくとも1つの部位に対応するノードの各々の座標をさらに抽出する。次いで、CPU31は、対象者Tの少なくとも1つの部位に対応するノードの各々の座標に基づいて、所定期間内の対象者Tの空間SP内の位置をもとめる。ここで、CPU31は、例えば、対象者Tの少なくとも1つの部位に対応するノードの各々の座標を、画像上の座標から空間SP上の座標に変換するための所定の計算式に代入することによって、所定期間内の対象者Tの空間SP内の位置をもとめてもよい。
本実施形態では、CPU31が、所定の計算式を用いて対象者Tの空間SP内の位置をもとめる場合を一例として説明したが、この場合に限られない。例えば、CPU31は、所定期間内に撮像された全ての画像データを抽出した場合に、抽出した全ての画像データを表示部36に表示させてもよい。この場合、例えば学習データの生成者等は、表示部36に表示された画像を参照又は分析することによって、所定期間内の対象者Tの位置を視覚的に把握することが可能になる。この場合、CPU31は、例えば学習データの生成者等が、入力部37を用いて対象者Tの位置に関する情報を入力した場合に、入力された位置に関する情報を例えばRAM33又は記憶装置34等に記憶(取得)してもよい。
このようにして、CPU31は、所定期間内の対象者Tの空間SP内の位置に関する情報を取得することができる。
生成手段45は、所定期間内の対象者T(動体)の状態に関する情報に対して、対象者Tの当該所定期間内の位置及び行動のうち少なくとも一方に関する情報をラベルとして付与することによって、対象者Tの状態に関する情報に基づいて対象者Tの行動を推定するための学習データを生成する機能を備える。
生成手段45の機能は、例えば以下のように実現される。生成装置30のCPU31は、例えば、第3取得手段44の機能に基づいて、所定期間内に撮像された画像に基づいて推定された対象者Tの当該所定期間内の位置及び行動のうち少なくとも一方に関する情報を取得すると、第2取得データにアクセスして、当該所定期間内に計測された全ての計測情報(対象者Tの状態に関する情報)を抽出する。これにより、所定期間内の対象者Tの計測情報の時間推移に関する情報が得られる。
次に、CPU31は、例えば図9(a)に示す第2学習データにアクセスする。図9(a)に示す第2学習データは、対象者Tが所定の行動(本実施形態では、「外装を外す」、「ケーブルを接続」、「本体にシールを貼る」、「バーコードを読み込む」、「組み立て」等の何れか)を行っている場合の所定期間内の対象者Tの計測情報の時間推移(図の例では、「計測情報の推移」)を、当該行動(行動ラベル)に対応付けた状態で記述されているデータである。これにより、機械学習の結果として、所定の行動を行う対象者Tの所定期間内の計測情報の時間推移と、当該行動との関係を示す学習済モデルが構成される。
なお、第2学習データに記述されるデータは、同一の対象者が異なる行動を行った場合のデータを含んでもよいし、異なる対象者が同一の行動を行った場合のデータを含んでもよい。
CPU31は、例えば図9(b)に示すように、第2取得データから抽出した所定期間内の対象者Tの計測情報の時間推移に関する情報(当該所定期間内に計測された全ての計測情報)を、第2学習データの「計測情報の推移」の項目に追記する。また、CPU31は、例えば図9(c)に示すように、第3取得手段44の機能に基づいて取得した対象者Tの所定期間内の行動に関する情報(図の例では、「外装を外す」)を、追加された計測情報の時間推移に関する情報に対応付けた状態で、第2学習データの「行動(行動ラベル)」の項目に追記する。
このようにして、所定期間内の対象者Tの状態に関する情報に対して、所定期間内に撮像された画像に基づいて推定された対象者Tの所定期間内の行動に関する情報がラベルとして付与される。
また、CPU31は、例えば図10(a)に示す第2学習データにアクセスしてもよい。図10(a)に示す第2学習データは、対象者Tが空間SP内の所定の位置(図の例では、「x1,y1」、「x2,y2」等)に存在している場合の所定期間内の対象者Tの計測情報の時間推移(図の例では、「受信信号強度の推移」)を、当該位置(位置ラベル)に対応付けた状態で記述されているデータである。これにより、機械学習の結果として、空間SP内の所定の位置に存在する対象者Tの所定期間内の受信信号強度の時間推移と、当該位置との関係を示す学習済モデルが構成される。
なお、第2学習データに記述されるデータは、同一の対象者が空間SP内の異なる位置に存在する場合のデータを含んでもよいし、異なる対象者が空間SP内の同一の位置に存在する場合のデータを含んでもよい。
CPU31は、例えば図10(b)に示すように、第2取得データから抽出した所定期間内の対象者Tの計測情報(受信信号強度)の時間推移に関する情報を、第2学習データの「受信信号強度の推移」の項目に追記する。また、CPU31は、例えば図10(c)に示すように、第3取得手段44の機能に基づいて取得した対象者Tの所定期間内の位置に関する情報(図の例では、「x1,y1」)を、追加された計測情報の時間推移に関する情報に対応付けた状態で、第2学習データの「位置(位置ラベル)」の項目に追記する。
このようにして、所定期間内の対象者Tの状態に関する情報に対して、所定期間内に撮像された画像に基づいて推定された対象者Tの所定期間内の位置に関する情報がラベルとして付与される。
情報取得手段46は、計測装置20によって計測された対象者T(動体)の状態に関する情報を取得する機能を備える。
情報取得手段46の機能は、例えば以下のように実現される。先ず、第1計測装置21は、例えば、対象者Tが空間SP内に存在する場合に、対象者Tの状態(例えば、対象者Tの3軸方向又は2軸方向の加速度と、対象者Tの3軸方向又は2軸方向の角速度と、対象者Tの温度と、のうち少なくとも1つ)を連続的又は断続的(例えば、所定間隔(例えば300ミリ秒毎や1秒等)毎)に計測する毎に、計測した状態に関する情報を、通信網NWを介して生成装置30に送信する。ここで、第1計測装置21によって計測された対象者Tの状態に関する情報は、計測日時及び第1計測装置21の識別情報(例えば、第1計測装置21のシリアル番号やMACアドレス等)と対応付けた状態で生成装置30に送信されてもよい。
また、第1計測装置21は、例えば、対象者Tが空間SP内に存在する場合に、複数の第2計測装置22の各々と無線通信を行い、複数の第2計測装置22の各々から所定間隔(例えば、数百ミリ秒間隔等)で送信された無線信号(例えば、ビーコン信号等)を受信する毎に、RSSI回路によって検出(計測)された当該無線信号の受信信号強度(RSSI)の値を、第1計測装置21に設けられた記憶装置(図示省略)に記憶する。ここで、RSSIの値は、計測日時(例えば、第1計測装置21が当該RSSIの値に対応する無線信号を何れかの第2計測装置22から受信した日時)及び当該RSSIの値に対応する無線信号を送信した何れかの第2計測装置22の識別情報(例えば、第2計測装置22のシリアル番号やMACアドレス等)と対応付けられた状態で記憶されてもよい。そして、第1計測装置21は、所定期間(例えば、3秒毎等)が経過する毎に、当該所定期間内に第1計測装置21によって計測された対象者Tの状態に関する情報(つまり、当該所定期間内に第1計測装置21が複数の第2計測装置22から受信した全ての無線信号のRSSI)の値を、通信網NWを介して生成装置30に送信してもよい。ここで、所定期間内に第1計測装置21によって計測された対象者Tの状態に関する情報は、第1計測装置21の識別情報(例えば、第1計測装置21のシリアル番号やMACアドレス等)と対応付けた状態で生成装置30に送信されてもよい。
一方、生成装置30のCPU31は、第2取得手段42の機能と同様に、計測装置20から送信された対象者Tの状態に関する情報を受信(取得)する毎に、受信した状態に関する情報を、当該情報の計測日時と対応付けた状態で例えば図5に示す第2取得データに記憶する。
学習手段47は、取得した対象者T(動体)の状態に関する情報を学習データとして用いた機械学習によって、対象者Tの位置及び行動のうち少なくとも一方を推定するのに用いられるモデルを学習する機能を備える。
学習手段47の機能は、例えば以下のように実現される。生成装置30のCPU31は、例えば、所定のモデル学習指示が入力部37を用いて入力されると、図9に示す第2学習データを用いて、対象者Tの行動を推定するのに用いられるモデルの学習を行ってもよいし、図10に示す第2学習データを用いて、対象者Tの位置を推定するのに用いられるモデルの学習を行ってもよいし、これらの各々のモデルの学習を行ってもよい。CPU31は、例えば、時系列対応型ニューラルネットワークモデルを用いて学習してもよい。ここで、時系列対応型ニューラルネットワークとして、例えば、RNN(Recurrent Neural Network)や、RNNの発展型であるLSTM(Long Short-Term Memory)等を適用することができる。また、CPU31は、例えば、畳み込みニューラルネットワーク(CNN)モデル、サポートベクターマシン(SVM)モデル、全結合ニューラルネットワーク(FNN)モデル、勾配ブースティング(HGB)モデル、ウェーブネット(WN)モデル等の複数のモデルのうち何れかのモデルを用いて学習してもよい。
推定手段48は、取得した対象者T(動体)の状態に関する情報と、学習データ生成システムによって生成された学習データを用いた機械学習に基づく学習済モデルと、に基づいて、対象者Tの位置及び行動のうち少なくとも一方を推定する機能を備える。
推定手段48の機能は、例えば以下のように実現される。生成装置30のCPU31は、例えば、第2取得データにアクセスして、所定の計測日時を起点として所定期間(例えば、3秒等)が経過する毎に、当該所定期間内に計測された全ての計測情報(対象者Tの状態に関する情報)を抽出する。これにより、所定期間内の対象者Tの計測情報の時間推移に関する情報が得られる。
次に、CPU31は、第2取得データから抽出した所定期間内の対象者Tの計測情報の時間推移に関する情報(当該所定期間内に計測された全ての計測情報)を、学習手段47の機能に基づいて構成された学習済モデルに入力することによって、当該所定期間内の対象者Tの位置及び行動のうち少なくとも一方を推定してもよい。また、CPU31は、所定期間内の対象者Tの計測情報の時間推移に関する情報と、推定された当該所定期間内の対象者Tの行動と、を例えば図11及び/又は図12に示す推定データに記憶してもよい。図11に示す推定データは、所定期間内の対象者Tの計測情報の時間推移毎に、当該所定期間内に対象者Tが行っていると推定された行動に関する情報が対応付けられた状態で記述されているデータである。また、図12に示す推定データは、所定期間内の対象者Tの計測情報(受信信号強度)の時間推移毎に、当該所定期間内に対象者Tが存在すると推定された空間SP内の位置に関する情報が対応付けられた状態で記述されているデータである。
このようにして、CPU31は、所定期間内の対象者Tの計測情報の時間推移に関する情報を学習済モデルに入力することによって、対象者Tの行動(本実施形態では、「外装を外す」、「ケーブルを接続」、「本体にシールを貼る」、「バーコードを読み込む」、「組み立て」等の何れか)及び空間SP内の位置のうち少なくとも一方を推定することができる。
また、本実施形態によれば、対象者Tの状態に関する情報を用いて容易に生成された第2学習データに基づいて、対象者Tの位置及び行動のうち少なくとも一方を容易に推定することができる。
なお、CPU31は、推定された対象者Tの位置及び行動のうち少なくとも一方に関する情報を提示してもよい。例えば、CPU31は、対象者Tの位置及び行動のうち少なくとも一方を推定すると、推定された対象者Tの位置及び行動のうち少なくとも一方に関する情報を例えば表示部36に表示してもよい。ここで、対象者Tの位置及び行動のうち少なくとも一方に関する情報は、テキストデータで構成されてもよいし、画像データ等で構成されてもよい。また、対象者Tの位置及び行動のうち少なくとも一方に関する情報が音声データで構成されている場合には、CPU31は、対象者Tの位置及び行動のうち少なくとも一方に関する情報を、スピーカ等の音声出力装置から出力してもよい。
また、CPU31は、推定された対象者Tの位置及び行動のうち少なくとも一方に関する情報を、通信網NWを介して生成装置30に接続された他のコンピュータ(例えば、サーバ等)に送信してもよい。
(4)本実施形態の学習データ生成システムの主要な処理のフロー
次に、本実施形態の学習データ生成システムにより行われる主要な処理のフローの一例について、図13のフローチャートを参照して説明する。
生成装置30のCPU31は、撮像装置10によって撮像された対象者T(動体)の画像を取得する(ステップS100)。具体的に説明すると、先ず、撮像装置10は、例えば、対象者Tが空間SP内に存在する場合に、所定のフレームレート(例えば、30fps(flames per second)等)で撮像処理を行い、撮像処理を行う毎に、撮像した画像の画像データを、通信網NWを介して生成装置30に送信する。
一方、生成装置30のCPU31は、撮像装置10から送信された画像データを、通信インタフェース部38を介して受信(取得)する毎に、受信した画像データを、当該画像の撮像日時と対応付けた状態で第1取得データに記憶する。
また、生成装置30のCPU31は、計測装置20によって計測された対象者T(動体)の状態に関する情報を取得する(ステップS102)。具体的に説明すると、先ず、第1計測装置21は、例えば、対象者Tが空間SP内に存在する場合に、対象者Tの状態(例えば、対象者Tの3軸方向又は2軸方向の加速度と、対象者Tの3軸方向又は2軸方向の角速度と、対象者Tの温度と、のうち少なくとも1つ)を連続的又は断続的(例えば、所定間隔(例えば300ミリ秒毎や1秒等)毎)に計測する毎に、計測した状態に関する情報を、通信網NWを介して生成装置30に送信する。
また、第1計測装置21は、例えば、対象者Tが空間SP内に存在する場合に、複数の第2計測装置22の各々と無線通信を行い、複数の第2計測装置22の各々から所定間隔(例えば、数百ミリ秒間隔等)で送信された無線信号(例えば、ビーコン信号等)を受信する毎に、RSSI回路によって検出(計測)された当該無線信号の受信信号強度(RSSI)の値を、第1計測装置21に設けられた記憶装置(図示省略)に記憶する。そして、第1計測装置21は、所定期間(例えば、3秒毎等)が経過する毎に、当該所定期間内に第1計測装置21によって計測された対象者Tの状態に関する情報(つまり、当該所定期間内に第1計測装置21が複数の第2計測装置22から受信した全ての無線信号のRSSI)の値を、通信網NWを介して生成装置30に送信してもよい。
一方、生成装置30のCPU31は、計測装置20から送信された対象者Tの状態に関する情報を、通信インタフェース部38を介して受信(取得)する毎に、受信した状態に関する情報を、当該情報の計測日時と対応付けた状態で例えば図5に示す第2取得データに記憶する。
なお、生成装置30のCPU31は、ステップS100において取得した画像に基づいて、対象者T(動体)の少なくとも1つの部位を検出してもよい。具体的に説明すると、CPU31は、ステップS100において撮像装置10から送信された画像データを第1取得データに記憶する毎に、画像データにおいて、対象者Tの少なくとも1つの部位の各々の位置に対応するノードを設定するとともに、各ノードの座標を算出してもよい。ここで、各ノードの設定及び座標の算出は、例えば、深層学習による特徴点(キーポイント)検出技術(例えば、OpenPose等)を用いて行われてもよい。
次に、生成装置30のCPU31は、所定期間内に撮像された画像に基づいて推定された対象者T(動体)の当該所定期間内の位置及び行動のうち少なくとも一方に関する情報を取得する(ステップS104)。具体的に説明すると、CPU31は、例えば、第1取得データにアクセスして、所定の撮像日時を起点として所定期間(例えば、3秒等)が経過する毎に、当該所定期間内に撮像された全ての画像データを抽出する。次いで、CPU31は、対象者Tの少なくとも1つの部位に対応するノードの各々の座標(所定期間内の対象者Tの少なくとも1つの部位の位置の時間推移に関する情報)を、対象者Tの少なくとも1つの部位の移動態様に関する情報を第1学習データとして用いた機械学習に基づく学習済モデルに入力することによって、当該所定期間内の対象者Tの行動を撮像画像に基づいて推定してもよい。
また、CPU31は、対象者Tの少なくとも1つの部位に対応するノードの各々の座標に基づいて、所定期間内の対象者Tの空間SP内の位置をもとめてもよい。ここで、CPU31は、例えば、対象者Tの少なくとも1つの部位に対応するノードの各々の座標を、画像上の座標から空間SP上の座標に変換するための所定の計算式に代入することによって、所定期間内の対象者Tの空間SP内の位置をもとめてもよい。
そして、生成装置30のCPU31は、所定期間内の対象者T(動体)の状態に関する情報に対して、対象者Tの当該所定期間内の行動に関する情報をラベルとして付与することによって、対象者Tの状態に関する情報に基づいて対象者Tの位置及び行動のうち少なくとも一方を推定するための学習データを生成する(ステップS106)。具体的に説明すると、CPU31は、例えば、ステップS104の処理において、対象者Tの所定期間内の位置及び行動のうち少なくとも一方に関する情報を取得すると、第2取得データにアクセスして、当該所定期間内に計測された全ての計測情報(対象者Tの状態に関する情報)を抽出する。次に、CPU31は、第2取得データから抽出した所定期間内の対象者Tの計測情報の時間推移に関する情報(当該所定期間内に計測された全ての計測情報)と、ステップS104の処理において取得した対象者Tの所定期間内の位置及び行動のうち少なくとも一方に関する情報と、を対応付けた状態で第2学習データに記憶する。
このようにして、所定期間内の対象者Tの状態に関する情報に対して、所定期間内に撮像された画像に基づいて推定された対象者Tの所定期間内の位置及び行動のうち少なくとも一方に関する情報がラベルとして付与される。
(5)本実施形態の推定システムの主要な処理のフロー
次に、本実施形態の推定システムにより行われる主要な処理のフローの一例について、図14のフローチャートを参照して説明する。
先ず、生成装置30のCPU31は、計測装置20によって計測された対象者T(動体)の状態に関する情報を取得する(ステップS200)。具体的に説明すると、先ず、計測装置20は、例えば、対象者Tが空間SP内に存在する場合に、対象者Tの状態(例えば、対象者Tの3軸方向又は2軸方向の加速度と、対象者Tの3軸方向又は2軸方向の角速度と、対象者Tの温度と、のうち少なくとも1つ)を連続的又は断続的(例えば、所定間隔(例えば300ミリ秒毎や1秒等)毎)に計測する毎に、計測した状態に関する情報を、通信網NWを介して生成装置30に送信する。
また、第1計測装置21は、例えば、対象者Tが空間SP内に存在する場合に、複数の第2計測装置22の各々と無線通信を行い、複数の第2計測装置22の各々から所定間隔(例えば、数百ミリ秒間隔等)で送信された無線信号(例えば、ビーコン信号等)を受信する毎に、RSSI回路によって検出(計測)された当該無線信号の受信信号強度(RSSI)の値を、第1計測装置21に設けられた記憶装置(図示省略)に記憶する。そして、第1計測装置21は、所定期間(例えば、3秒毎等)が経過する毎に、当該所定期間内に第1計測装置21によって計測された対象者Tの状態に関する情報(つまり、当該所定期間内に第1計測装置21が複数の第2計測装置22から受信した全ての無線信号のRSSI)の値を、通信網NWを介して生成装置30に送信してもよい。
一方、生成装置30のCPU31は、計測装置20から送信された対象者Tの状態に関する情報を受信(取得)する毎に、受信した状態に関する情報を、当該情報の計測日時と対応付けた状態で第2取得データに記憶する。
なお、生成装置30のCPU31は、取得した対象者T(動体)の状態に関する情報を学習データとして用いた機械学習によって、対象者Tの位置及び行動のうち少なくとも一方を推定するのに用いられるモデルを学習してもよい。具体的に説明すると、CPU31は、例えば、所定のモデル学習指示が入力部37を用いて入力されると、図9及び/又は図10に示す第2学習データを用いてモデルの学習を行ってもよい。CPU31は、例えば、時系列対応型ニューラルネットワークモデルを用いて学習してもよい。ここで、時系列対応型ニューラルネットワークとして、例えば、RNN(Recurrent Neural Network)や、RNNの発展型であるLSTM(Long Short-Term Memory)等を適用することができる。また、CPU31は、例えば、畳み込みニューラルネットワーク(CNN)モデル、サポートベクターマシン(SVM)モデル、全結合ニューラルネットワーク(FNN)モデル、勾配ブースティング(HGB)モデル、ウェーブネット(WN)モデル等の複数のモデルのうち何れかのモデルを用いて学習してもよい。
次に、生成装置30のCPU31は、取得した対象者T(動体)の状態に関する情報と、学習データ生成システムによって生成された学習データを用いた機械学習に基づく学習済モデルと、に基づいて、対象者Tの位置及び行動のうち少なくとも一方を推定する(ステップS202)。具体的に説明すると、CPU31は、例えば、第2取得データにアクセスして、所定の計測日時を起点として所定期間(例えば、3秒等)が経過する毎に、当該所定期間内に計測された全ての計測情報(対象者Tの状態に関する情報)を抽出する。そして、CPU31は、第2取得データから抽出した所定期間内の対象者Tの計測情報の時間推移に関する情報(当該所定期間内に計測された全ての計測情報)を、学習手段47の機能に基づいて構成された学習済モデルに入力することによって、当該所定期間内の対象者Tの位置及び行動のうち少なくとも一方を推定してもよい。
このようにして、CPU31は、所定期間内の対象者Tの計測情報の時間推移に関する情報を学習済モデルに入力することによって、対象者Tの行動(本実施形態では、「外装を外す」、「ケーブルを接続」、「本体にシールを貼る」、「バーコードを読み込む」、「組み立て」等の何れか)及び空間SP内の位置のうち少なくとも一方を推定することができる。
上述したように、本実施形態の学習データ生成システム、学習データ生成方法、プログラムによれば、所定期間内の対象者T(動体)の状態に関する情報に対して、所定期間内に撮像された画像に基づいて推定された対象者Tの所定期間内の位置及び行動のうち少なくとも一方に関する情報がラベルとして付与される。この場合、例えば学習データの生成者等は、所定期間内の対象者Tの状態に関する情報ではなく、当該所定期間内に撮像された画像を参照又は分析等することによって、当該所定期間内の対象者Tの位置及び行動のうち少なくとも一方を視覚的に把握することができるので、当該所定期間内の対象者Tの状態に関する情報に対して適切なラベルを付与することが可能になる。これにより、対象者Tの状態に関する情報に基づいて、対象者Tの位置及び行動のうち少なくとも一方を推定するための学習データを容易に生成することができる。
また、本実施形態の推定システム、推定方法、プログラムによれば、対象者T(動体)の状態に関する情報を用いて容易に生成された学習データに基づいて、対象者Tの位置及び行動のうち少なくとも一方を容易に推定することができる。
以下、上述した実施形態の変形例について説明する。
(変形例)
上記実施形態では、第3取得手段44が、所定期間内の対象者T(動体)の移動態様に関する情報と、対象者Tの移動態様に関する情報を学習データとして用いた機械学習に基づく学習済モデルと、に基づいて推定された対象者Tの当該所定期間内の行動に関する情報を取得する場合を一例として説明したが、この場合に限られない。例えば、第3取得手段44は、所定期間内の対象者T(動体)の少なくとも1つの部位の移動態様が、所定の行動に対応する所定の条件を満たす場合に、対象者Tが当該所定の行動を行っていると推定してもよい。ここで、所定の条件とは、例えば、少なくとも1つの部位の移動範囲が、所定の行動に対応する当該部位の位置の範囲に含まれることであってもよい。
この場合、生成装置30のCPU31は、図15に示す行動データを参照して、対象者Tの行動を撮像画像に基づいて推定してもよい。行動データは、複数の行動(図の例では、「外装を外す」、「ケーブルを接続」、「本体にシールを貼る」、「バーコードを読み込む」、「組み立て」等)毎に、対応する行動が行われていると推定される場合の少なくとも1つの部位(上記実施形態では、「首」、「右肩」、「左肩」、「右臀部」、「左臀部」等)の位置の範囲の時間推移が対応付けられた状態で記述されているデータである。行動データは、例えば記憶装置34に記憶されていてもよい。
CPU31は、例えば、少なくとも1つの部位の各々の位置の時間推移が、行動データ内の何れかの行動に対応する各々の部位の位置の範囲に含まれる場合に、対象者Tが当該何れかの行動(例えば、「外装を外す」)を行っていると推定し、推定した行動に関する情報を例えばRAM33又は記憶装置34に記憶(取得)してもよい。
このように、本変形例にかかる学習データ生成システム、推定システム、学習データ生成方法、推定方法、プログラムによれば、上述した実施形態と同様の作用効果を発揮することが可能である。
なお、本発明のプログラムは、コンピュータで読み取り可能な記憶媒体に記憶されていてもよい。このプログラムを記録した記憶媒体は、図2に示す生成装置30のROM32、RAM33又は記憶装置34であってもよい。また、記憶媒体は、例えばCD-ROMドライブ等のプログラム読取装置に挿入されることで読み取り可能なCD-ROM等であってもよい。さらに、記憶媒体は、磁気テープ、カセットテープ、フレキシブルディスク、MO/MD/DVD等であってもよいし、半導体メモリであってもよい。
以上説明した実施形態及び変形例は、本発明の理解を容易にするために記載されたものであって、本発明を限定するために記載されたものではない。したがって、上記実施形態及び変形例に開示された各要素は、本発明の技術的範囲に属する全ての設計変更や均等物をも含む趣旨である。
例えば、上述した実施形態では、動体が人物(対象者T)である場合を一例として説明したが、この場合に限られない。動体は、行動推定の対象となり得るものであれば如何なるものであってもよく、例えば、人物以外の動物であってもよいし、作業機械、車両、飛行体等のオブジェクトであってもよい。
また、上述した実施形態では、対象者T(動体)の首、右肩、左肩、右臀部、左臀部が、対象者Tの部位として検出される場合を一例として説明したが、他の部位(例えば、頭、手、足、関節等)が検出されてもよい。
さらに、上述した実施形態では、空間SP内の1つの動体(対象者T)の行動が推定される場合を一例として説明したが、空間SP内の複数の動体の各々の行動が推定されてもよい。また、空間SP内の複数の動体の各々の撮像画像及び状態に関する情報に基づいて、学習データが生成されてもよい。
さらにまた、上述した実施形態では、「外装を外す」、「ケーブルを接続」、「本体にシールを貼る」、「バーコードを読み込む」、「組み立て」のうち何れかの行動が動体(対象者T)の行動として推定される場合を一例として説明したが、行動の内容はこれらに限定されない。
また、上述した実施形態では、1つの生成装置30が設けられている場合を一例として説明したが、この場合に限られない。例えば、複数の生成装置30が設けられてもよく、この場合には、何れかの生成装置30上の操作内容及び処理結果等が他の生成装置30上でリアルタイムに提示されてもよいし、何れかの生成装置30での処理結果等が複数の生成装置30間で共有されてもよい。
さらに、上述した実施形態では、所定期間内の対象者Tの少なくとも1つの部位の位置の時間推移に関する情報が、本発明の「所定期間内の動体の少なくとも1つの部位の移動態様に関する情報」に対応する場合を一例として説明したが、この場合に限られない。「所定期間内の動体の少なくとも1つの部位の移動態様に関する情報」は、例えば、所定期間内の対象者Tの少なくとも1つの部位の角度の時間推移に関する情報であってもよいし、所定期間内の対象者Tの複数の部位間の距離の時間推移に関する情報等であってもよい。
また、上述した実施形態では、生成装置30によって、第1取得手段41、第2取得手段42、検出手段43、第3取得手段44、生成手段45、情報取得手段46、学習手段47及び推定手段48の各機能を実現する構成としたが、この構成に限られない。例えば、インターネットやLAN等の通信網を介して生成装置30と通信可能に接続されたコンピュータ等(例えば、汎用のパーソナルコンピュータやサーバコンピュータ等)から構成された推定装置50(図16に示す)であって、動体の行動を推定するのに用いられる推定装置50が設けられてもよい。この場合、生成装置30及び推定装置50は、実質的に同一のハードウェア構成を採ることができるので、上記実施形態において説明した各手段41~48のうち少なくとも1つの手段の機能を推定装置50によって実現することが可能になる。例えば、図3に示した機能ブロック図の各機能は、図16(a),(b)に示すように、生成装置30と推定装置50との間で任意に分担されてもよい。
さらに、上記各手段41~48のうち少なくとも1つの手段の機能を、撮像装置10及び/又は計測装置20によって実現する構成としてもよい。