WO2022162780A1

WO2022162780A1 - 部分行動区間推定モデル構築装置、部分行動区間推定モデル構築方法及び部分行動区間推定モデル構築プログラム

Info

Publication number: WO2022162780A1
Application number: PCT/JP2021/002815
Authority: WO
Inventors: 純也藤本; 收文中山
Original assignee: 富士通株式会社
Priority date: 2021-01-27
Filing date: 2021-01-27
Publication date: 2022-08-04
Also published as: EP4258183A4; EP4258183A1; JPWO2022162780A1; US20230343080A1

Abstract

隠れセミマルコフモデルは、各々が人の動作の種類を状態とする複数の第１隠れマルコフモデルを含む第２隠れマルコフモデルを複数含む。複数の第２隠れマルコフモデルの各々は、複数の動作を組み合わせて定まる行動の部分である部分行動を状態とする。隠れセミマルコフモデルにおいて、複数の第１隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習する。学習した観測確率を固定し、入力された第１教師ありデータを水増しすることで第２教師ありデータとし、第１隠れマルコフモデルの動作の遷移確率を第２教師ありデータを使用した教師あり学習で学習する。学習した観測確率及び遷移確率を使用して部分行動の区間を推定するモデルである隠れセミマルコフモデルを構築する。

Description

部分行動区間推定モデル構築装置、部分行動区間推定モデル構築方法及び部分行動区間推定モデル構築プログラム

　本開示は、部分行動区間推定モデル構築装置、部分行動区間推定モデル構築方法及び部分行動区間推定モデル構築プログラムに関する。

　ディープラーニング技術の発展により通常のＲＧＢカメラで撮影した人の映像から姿勢を高精度に認識できるようになり、この認識情報を利用して人の行動を推定する様々な研究開発が行われている。当該状況下において、人の映像から観測した姿勢の時系列データから指定した行動が発生した時間区間を推定する取り組みが行われている。

山本龍一、酒向慎司、北村正、「隠れセミマルコフモデルと線形動的システムを組み合わせた音楽音響信号と楽譜の実時間アライメント手法」、研究報告音楽情報科学（ＭＵＳ）、２０１２年Ｓｈｕｎ－ＺｈｅｎｇＹｕ、「Ｈｉｄｄｅｎ　ｓｅｍｉ－Ｍａｒｋｏｖ　ｍｏｄｅｌｓ」、Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ、Ｖｏｌｕｍｅ　１７４、Ｉｓｓｕｅ　２、２０１０年２月、２１５～２４３頁若林啓、三浦孝夫、「階層型隠れマルコフモデルの高速パラメータ推定」、電子情報通信学会論文誌、２０１１年 "映像から人の様々な行動を認識するＡＩ技術「行動分析技術　Ａｃｔｌｙｚｅｒ」を開発"、［ｏｎｌｉｎｅ］、２０１９年１１月２５日、富士通株式会社、［２０２１年１月１９日検索］、インターネット（ＵＲＬ：ｈｔｔｐｓ：／／ｐｒ．ｆｕｊｉｔｓｕ．ｃｏｍ／ｊｐ／ｎｅｗｓ／２０１９／１１／２５．ｈｔｍｌ）

　行動の時間区間を推定するモデルを学習させる際の教師ありデータの教師情報を作成するコストが高い。

　本開示は、１つの側面として、部分行動区間推定モデルを効率的に構築することを目的とする。

　１つの実施形態では、隠れセミマルコフモデルは、各々が人の動作の種類を状態とする複数の第１隠れマルコフモデルを含む第２隠れマルコフモデルを複数含む。複数の第２隠れマルコフモデルの各々は、複数の動作を組み合わせて定まる行動の部分である部分行動を状態とする。隠れセミマルコフモデルにおいて、複数の第１隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習する。学習した観測確率を固定し、入力された第１教師ありデータを水増しすることで第２教師ありデータとし、第１隠れマルコフモデルの動作の遷移確率を第２教師ありデータを使用した教師あり学習で学習する。学習した観測確率及び遷移確率を使用して部分行動の区間を推定するモデルである隠れセミマルコフモデルを構築する。

　本開示は、１つの側面として、部分行動区間推定モデルを効率的に構築することができる。

本実施形態の隠れセミマルコフモデルを例示する概念図である。本実施形態の機能構成を例示するブロック図である。本実施形態の第１隠れマルコフモデルの状態を例示する概念図である。教師ありデータの水増しを説明する概念図である。教師ありデータの水増しを説明する概念図である。教師ありデータの水増しを説明する概念図である。教師ありデータの水増しを説明する概念図である。本実施形態のハードウェア構成を例示するブロック図である。行動フェーズ区間推定モデル構築処理の流れを例示するフローチャートである。特徴ベクトル抽出処理の流れを例示するフローチャートである。行動区間推定処理の流れを例示するフローチャートである。関連技術の行動を説明する概念図である。関連技術の階層型隠れマルコフモデルを例示する概念図である。関連技術の概要を例示する概念図である。本実施形態の概要を例示する概念図である。本実施形態の隠れセミマルコフモデルを説明する概念図である。関連技術の隠れセミマルコフモデルを例示する概念図である。行動に含まれる動作の揺らぎを例示する概念図である。行動区間の誤推定を例示する概念図である。

　本実施形態では、人の行動が発生した時間区間を推定する部分行動区間推定モデルの一例として、図１に例示するような隠れセミマルコフモデル（以下、ＨＳＭＭ（Ｈｉｄｄｅｎ　ｓｅｍｉ－Ｍａｒｋｏｖ　ｍｏｄｅｌ）という。）を構築する。ＨＳＭＭは、隠れマルコフモデル（以下、ＨＭＭ（Ｈｉｄｄｅｎ　Ｍａｒｋｏｖ　ｍｏｄｅｌ）という。）のパラメータに加え、状態ごとの継続時間の確率分布をパラメータとしてもつ。

　本実施形態のＨＳＭＭは、人の動作の各々を状態とする複数の第１ＨＭＭと、部分行動に対応する行動フェーズを状態とする第２ＨＭＭと、を含む。ｍ１、ｍ２、ｍ３は動作の一例であり、ａ１、ａ２、ａ３は行動フェーズの一例である。動作は複数の姿勢の組合せである。行動は複数の動作の組合せであり、複数の行動フェーズの組合せでもある。行動フェーズは、動作の組合せであるが、行動フェーズに含まれる動作の数は行動に含まれる動作の数より少ない。行動フェーズは、後述するように、例えば、行動を所定数に分割することで生成してもよい。行動の分割数は実験的に定めることができる。

　パラメータを設定することで構築されたＨＳＭＭに人の姿勢を検知することで生成された時系列センサデータが与えられると、ＨＳＭＭは最適な行動フェーズの時間区間（以下、行動区間という。）を推定する。ｄ１、ｄ２、ｄ３は行動フェーズ区間の一例である。

　ＨＭＭのパラメータには、観測確率及び遷移確率が存在する。Ｏ１、…、Ｏ８は観測確率の一例であり、遷移確率は状態をつなぐ矢印に対応する確率である。観測確率とは、各状態において、ある特徴が観測される確率であり、遷移確率とは、ある状態から別の状態に遷移する確率である。遷移の順番が定まっている場合は、遷移確率は不要である。なお、動作の数、行動フェーズの数、即ち、第１ＨＭＭの数、第２ＨＭＭの数は例示であり、図１に例示される数に限定されない。

　図２は、本実施形態の行動フェーズ区間推定モデル構築装置１０の機能ブロック図の一例である。行動フェーズ区間推定モデル構築装置１０は、観測確率学習部１１、遷移確率学習部１２、構築部１３を有する。観測確率学習部１１は、以下に説明するように、教師なしデータで行動フェーズ区間推定モデルの一例であるＨＳＭＭの観測確率を学習する。

　本実施形態では、ある作業目標を達成するための限定された行動を対象とする。このような行動は、例えば、工場のラインで行われる定型作業での行動であり、以下の性質を有する。
　性質１：作業を構成する各行動の違いは、限定された複数の動作の組合せの違いである。
　性質２：同じ作業を行う際に観測される複数の姿勢は類似している。

　本実施形態では、性質１に基づいて、全ての行動が１つの動作群に含まれる動作で構成される。図３に例示するように、動作群には、例えば、３つの動作ｍ１１、ｍ１２、ｍ１３が含まれている。

　例えば、動作ｍ１１は「腕を上げる」、動作ｍ１２は「腕を降ろす」、動作ｍ１３は「腕を前に伸ばす」であってよい。動作群に含まれる動作の数は図３の例に限定されない。また、各行動に含まれる動作の数も図３の例に限定されない。

　図３のＨＭＭにおいて、破線矢印に対応する各動作の観測確率は行動フェーズには依存しないため、行動フェーズ区間の教師なしデータで学習することができる。学習は、例えば、機械学習、ニューラルネットワーク、ディープラーニングなどを使用して行う。

　詳細には、観測確率の教師なし学習に使用するモデルは混合ガウス分布（以下、ＧＭＭ（Ｇａｕｓｓｉａｎ　Ｍｉｘｔｕｒｅ　Ｍｏｄｅｌ）という。）であってよい。各観測は動作のうちの１つの動作が確率的に選択され、その動作についてのガウス分布により生成されると仮定する。これは、観測の時系列的な依存関係を使用しない教師あり学習とは異なる仮定である。学習したＧＭＭの各ガウス分布のパラメータを各動作における観測確率の確率分布であるガウス分布に割り当てる。

　遷移確率学習部１２は、以下に説明するように、教師情報をもつ学習データ（以下、教師ありデータという。）で、第１ＨＭＭの動作の遷移確率を学習する。教師情報は、姿勢の時系列データに対して各行動フェーズが発生している時間区間の正解を与える情報である。学習は、例えば、最尤推定やＥＭアルゴリズム（Ｅｘｐｅｃｔａｔｉｏｎ－Ｍａｘｉｍｉｚａｔｉｏｎ　ａｌｇｏｒｉｔｈｍ）などを使用して行う（その他の機械学習、ニューラルネットワーク、ディープラーニングなどの方式を使用してもよい）。

　教師ありデータの生成には、時間及び労力がかかる。したがって、本実施形態では、観測確率学習部１１で学習した観測確率を固定し、既存の教師ありデータから遷移確率を学習する。

　詳細には、図４に例示するように、第１教師ありデータの一例である既存の教師ありデータのデータを種データＳＤとし、種データＳＤにノイズを付加し、オーバーサンプリングすることでデータを水増しする。上記性質２によれば、同じ作業の姿勢は類似しているため、ノイズを付加することで、図５に例示するように実際の観測ごとのばらつきに類似したばらつきをもつデータを生成することができる。ノイズは、例えば、ランダムノイズであってよい。

　種データＳＤの教師情報ＴＩを、水増ししたデータの各々に共通に適用することで教師ありデータを水増しする。第２教師ありデータの一例である水増しした教師ありデータを使用して、第１ＨＭＭの複数の動作の遷移確率を教師あり学習で学習する。

　オーバーサンプリングでは、各時刻の観測サンプルに所定の範囲のノイズを生成して付加する。ノイズを生成する際に、当該観測サンプルを生成した確率が高い動作を特定し、当該動作のサンプル群と別の動作のサンプル群との特徴空間内での広がり方の関係を考慮して適切な大きさのノイズを生成して付加する。これにより、より適切な教師ありデータを生成することができる。

　例えば、特定した動作のサンプル群の共分散の定数倍の共分散の多変量ガウス分布から生成したノイズを付加してもよい。また、特定した動作のサンプル群から最も中心距離が近い動作のサンプル群までの中心距離ｄを算出し、特徴空間の各軸方向の標準偏差がｄの定数倍となる等方性のガウス分布（共分散行列が対角行列である）から生成したノイズを付加してもよい。

　各動作のサンプル群に含まれるサンプルの散らばり、即ち、特徴空間内での広がりには差がある。即ち、散らばりが非常に小さい動作もあるし、非常に大きい動作もある。全ての動作について一律の範囲のランダムノイズを使用した場合、ある動作のサンプル群が散らばりの大きいサンプルを含むと、ランダムノイズによるばらつかせ方が相対的に小さい。一方、ある動作のサンプル群が散らばりの小さいサンプルを含むと、ランダムノイズによるばらつかせ方が相対的に大きい。

　図６は、動作ｍ３１、動作ｍ３２、及び動作ｍ３３のサンプル群を例示する。図７は、動作ｍ３２のサンプル群にランダムノイズを付加した状態を例示する。図７では、ランダムノイズの範囲が大きいため、元の動作ｍ３２から離れているサンプルが多い。このような場合にも、上記したように、ある動作のサンプル群と別の動作のサンプル群との特徴空間内での広がり方の関係を考慮して適切な大きさのノイズを付加することで、より適切な教師ありデータを水増しすることができる。

　構築部１３は、観測確率学習部１１で学習した観測確率、及び遷移確率学習部１２で学習した状態遷移確率を使用して、図１に例示するようなＨＳＭＭを構築する。Ｏ１、Ｏ２、…、Ｏ８は、観測確率学習部１１で学習した観測確率を表し、行動フェーズａ１、ａ２、ａ３の各々に含まれる動作ｍ１、ｍ２、及びｍ３間の矢印は、遷移確率学習部１２で学習した状態遷移確率に対応する。ｄ１、ｄ２、ｄ３は、各行動フェーズの継続時間を表し、継続時間の確率分布は、教師情報の行動フェーズの継続時間から決定される。例えば、継続時間の確率分布は、一定範囲の一様分布であってよい。構築したＨＳＭＭに、センサで人の姿勢を検知して生成したセンサデータを適用して、各行動フェーズの時間区間である行動フェーズ区間を推定する。推定についての詳細は、後述する。

　本実施形態の行動フェーズ区間推定モデル構築装置１０は、以下の特徴を有する。
１．第１ＨＭＭの全行動で共通な動作の観測確率は教師なし学習で学習する。
２．第１ＨＭＭの動作間の遷移確率は、教師あり種データから水増しした教師ありデータを使用して、教師あり学習で学習する。

　行動フェーズ区間推定モデル構築装置１０は、一例として、図８に示すように、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）５１、一次記憶装置５２、二次記憶装置５３、及び、外部インターフェイス５４を含む。ＣＰＵ５１は、ハードウェアであるプロセッサの一例である。ＣＰＵ５１、一次記憶装置５２、二次記憶装置５３、及び、外部インターフェイス５４は、バス５９を介して相互に接続されている。ＣＰＵ５１は、単一のプロセッサであってもよいし、複数のプロセッサであってもよい。また、ＣＰＵ５１に代えて、例えば、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）が使用されてもよい。

　一次記憶装置５２は、例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などの揮発性のメモリである。二次記憶装置５３は、例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）、又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）などの不揮発性のメモリである。

　二次記憶装置５３は、プログラム格納領域５３Ａ及びデータ格納領域５３Ｂを含む。プログラム格納領域５３Ａは、一例として、行動フェーズ区間推定モデル構築プログラムなどのプログラムを記憶している。データ格納領域５３Ｂは、一例として、教師ありデータ、教師なしデータ、学習した観測確率、及び遷移確率などを記憶する。

　ＣＰＵ５１は、プログラム格納領域５３Ａから行動フェーズ区間推定モデル構築プログラムを読み出して一次記憶装置５２に展開する。ＣＰＵ５１は、行動フェーズ区間推定モデル構築プログラムをロードして実行することで、図２の観測確率学習部１１、遷移確率学習部１２、及び、構築部１３として動作する。

　なお、行動フェーズ区間推定モデル構築プログラムなどのプログラムは、外部サーバに記憶され、ネットワークを介して、一次記憶装置５２に展開されてもよい。また、行動フェーズ区間推定モデル生成プログラムなどのプログラムは、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）などの非一時的記録媒体に記憶され、記録媒体読込装置を介して、一次記憶装置５２に展開されてもよい。

　外部インターフェイス５４には外部装置が接続され、外部インターフェイス５４は、外部装置とＣＰＵ５１との間の各種情報の送受信を司る。図８では、外部インターフェイス５４に、ディスプレイ５５Ａ及び外部記憶装置５５Ｂが接続されている例を示している。外部記憶装置５５Ｂには、例えば、教師ありデータ、教師なしデータ、及び、構築したＨＳＭＭなどを記憶する。ディスプレイ５５Ａは、例えば、構築したＨＳＭＭモデルを視認可能に表示する。

　行動フェーズ区間推定モデル構築装置１０は、例えば、パーソナルコンピュータ、サーバ、及び、クラウド上のコンピュータなどであってよい。

　図９に、行動フェーズ区間推定モデル構築処理の流れを例示する。ＣＰＵ５１は、ステップ１０１で、後述するように、学習データから人の姿勢の連鎖である運動を表す特徴ベクトルを抽出する。ＣＰＵ５１は、ステップ１０２で、ステップ１０１で抽出した特徴ベクトルのクラスタリング（ＧＭＭのパラメータ推定）により、要素となる動作に分類し、各動作の観測確率を教師なし学習で学習する。

　ＣＰＵ５１は、ステップ１０３で、教師あり種データにノイズを付加し、オーバーサンプリングして生成したデータに教師あり種データの教師情報を付与することで、教師ありデータを水増しする。ＣＰＵ５１は、ステップ１０４で、教師ありデータについて、教師情報で与えられた各行動の時間区間ごとに特徴ベクトルを振り分ける。

　ＣＰＵ５１は、ステップ１０５で、ステップ１０４で振り分けた時間区間内の特徴ベクトルの系列を観測データとして、ステップ１０３で水増しした教師ありデータを使用し、第１ＨＭＭの動作の遷移確率を教師あり学習で学習する。

　ＣＰＵ５１は、ステップ１０６で、各行動フェーズの継続時間の確率分布として、教師情報で与えられた各行動フェーズの継続時間に対して所定の範囲の一様分布を設定する。ＣＰＵ５１は、ステップ１０２で学習した観測確率及びステップ１０５で学習した遷移確率を使用して、ＨＳＭＭを構築する。ステップ１０６の設定で一定時間継続後に教師情報で与えられた各行動フェーズの順番に第２ＨＭＭの行動が遷移するＨＳＭＭを構築する。構築したＨＳＭＭは、例えば、データ格納領域５３Ｂに格納されてもよい。

　図１０は、図９のステップ１０１の特徴ベクトル抽出処理の詳細を例示する。ＣＰＵ５１は、ステップ１５１で、学習に使用するデータから人を観測し、追跡することで、人の姿勢情報を取得する。ＣＰＵ５１は、ステップ１５２で、ステップ１５１で取得した姿勢情報が複数人の姿勢情報を含む場合、姿勢情報の時系列データから分析対象とする姿勢情報の時系列データを取得する。分析対象とする姿勢情報は、人を囲むバウンディングボックスの大きさ、及び時間などから選択する。

　ＣＰＵ５１は、ステップ１５３で、ステップ１５２で取得した姿勢情報の時系列データから身体の各部位についての運動情報の時系列データを取得する。運動情報の時系列とは、例えば、各部位の曲げの程度、曲げの速度などであってよい。各部位とは、例えば、肘、膝などであってよい。

　ＣＰＵ５１は、ステップ１５４で、スライディングタイムウィンドウにより一定の時間間隔ごとにウィンドウ内のステップ１５３の運動情報を時間方向で平均化して特徴ベクトルを算出する。

　図１１に、本実施形態で構築したＨＳＭＭを使用した行動区間推定処理の流れを例示する。図８の行動区間推定モデル構築装置１０は、構築したＨＳＭＭをデータ格納領域５３Ｂに格納することで行動フェーズ区間推定装置として機能してもよい。

　ＣＰＵ５１は、ステップ２０１で、センサで人の姿勢を検知することにより生成されたセンサデータから特徴ベクトルを抽出する。センサは、人の姿勢を検知するデバイスであり、例えば、カメラ、赤外線センサ、モーションキャプチャデバイスなどであってよい。図１１のステップ２０１は、図９のステップ１０１と同様であるため、詳細な説明は省略する。

　ＣＰＵ５１は、ステップ２０２で、ステップ２０１で抽出した特徴ベクトルの系列を観測データとして、行動フェーズ区間推定モデル構築処理で構築したＨＳＭＭと照合して各行動フェーズの継続時間を推定する。ＣＰＵ５１は、ステップ２０４で、各行動に含まれる行動フェーズの継続時間を加算することで、各行動の継続時間を算出し、各行動状態の継続時間から各行動の時間区間を推定する。

　例えば、映像を入力として、映像における特定の行動を認識するような技術では、基本動作認識、要素行動認識、及び上位行動認識を行う。映像における特定の行動とは、要素行動の組合せで、さらに複雑な上位行動であり、基本動作認識とは、フレームごとの姿勢認識であり、要素行動認識とは、時間的空間的認識を行い、ある程度の時間長における単純行動を認識することである。上位行動認識とは、ある程度の時間長における複雑行動の認識である。当該技術において、行動区間推定モデル構築処理及び構築した行動区間推定モデルを適用し、行動区間を推定することができる。

　関連技術では、行動に含まれる動作が特に限定されないＨＳＭＭが使用され得る。当該関連技術では、図１２に例示するように、例えば、以下の動作が存在すると仮定する。
（１）腕を上げる、（２）腕を降ろす、（３）腕を前に伸ばす、（４）両手を身体の前で近づける、（５）前に移動する、（６）横に移動する、（７）しゃがむ、（８）立つ

　行動の例は、例えば、以下の通りである。
行動Ａ３１：（１）腕を上げる→（３）腕を前に伸ばす→（１）腕を上げる→（４）両手を身体の前で近づける→（７）しゃがむ、
行動Ａ３２：（７）しゃがむ→（４）両手を身体の前で近づける→（８）立つ→（５）前に移動する→（３）腕を前に伸ばす、など

　上記のように、一般的な行動の動作、即ち、推定する行動が制限されない複数の動作をＨＭＭが含む場合、動作の観測確率を１つの単純な確率分布で表すことは困難である。この問題に対処するために、階層型隠れマルコフモデルを使用する技術が存在する。階層型隠れマルコフモデルは、図１３に例示するように、上位階層ＨＭＭが複数の下位階層ＨＭＭを状態として含む。行動Ａ５１、Ａ５２、及びＡ５３は、下位階層ＨＭＭの例である。下位階層ＨＭＭの各々は、動作を状態として含み、ｍ５１、ｍ５２、ｍ５３、ｍ６１、ｍ６２、ｍ６３、ｍ７１、及びｍ７２は、動作の例である。

　階層型ＨＭＭでは、図１４に例示するように、教師情報ＴＩＬをもつ学習データＬＤを使用して、各行動の動作の観測確率及び遷移確率を教師あり学習で学習する。図１４では、行動Ａ５１の観測確率ｐ１１、遷移確率ｐ２１、行動Ａ５２の観測確率ｐ１２、遷移確率ｐ２２、行動Ａ５３の観測確率ｐ１３、遷移確率ｐ２３を例示する。しかしながら、階層型ＨＭＭでは、パラメータの数が多く、パラメータの自由度が高いため、パラメータの学習のために教師ありデータを多数使用する。教師ありデータの教師情報を作成するには、時間及び労力を要する。

　一方、本開示では、図１５に例示するように、ＨＳＭＭの行動に対応する第１ＨＭＭの各々で共通の観測確率ｐ１は教師なしデータＬＤＮを使用して教師なし学習で学習する。学習した観測確率ｐ１を固定して、第１ＨＭＭの各々の動作の遷移確率ｐ２１Ｄ、ｐ２２Ｄ、ｐ２３Ｄを教師ありデータを使用して教師あり学習で学習する。本開示では、既存の教師ありデータＬＤＤにノイズを付加しオーバーサンプリングし生成したデータに、教師ありデータＬＤＤの教師情報ＴＩＬを付加することで、教師ありデータを水増しして教師あり学習に使用する。したがって、本実施形態では、既存の教師ありデータが少ない場合でも、行動フェーズ区間推定モデルを効率的に構築することができる。

　本開示では、図１６に例示するように、第２ＨＭＭの各々は、行動フェーズに対応する。図１６の例では、動作３、１、５、３、６、１、２を含む行動Ａ６１は、行動フェーズａ７１、ａ７２、ａ７３に時間的に等しく分割され、動作６、７、２、８、５、４、１を含む行動Ａ６２は、行動フェーズａ８１、ａ８２、ａ８３に等しく分割されている。図１６の下のＨＳＭＭは、行動フェーズａ７１、ａ７２、ａ７３、ａ８１、ａ８２、ａ８３に対応する第２ＨＭＭを含む。行動を分割することで端数の時間が生じる場合には、行動を略等しく分割することで行動フェーズを生成してもよい。

　図１７に例示するように、第２ＨＭＭの各々が行動に対応する場合について検討する。図１８に例示するように、基本データに含まれる動作の順序により行動をモデル化する。しかしながら、実際の作業中の動作及び動作の順序には同じ行動であっても揺らぎがあり、完全に同じにはならない。例えば、図１８の例では、基本データの行動Ａ６１に含まれる動作は、動作３、７、６、２の順序であるが、観測データでは、動作３、５、６、２の順序である。

　図１７に例示するように、基本データから動作間の遷移確率で各行動の動作の順序をモデル化することで、観測データにおいて、動作の出現順序に揺らぎがある場合であっても、全体として確率が高い行動系列を推定することができる。しかしながら、動作間の遷移確率によるモデル化では順序制約が弱く、順序が大きく異なる場合であっても高評価が示される場合がある。

　詳細には、１つの行動内で共通の動作間の遷移確率でモデル化されるため、行動の開始時点付近では動作１の後は動作２である確率が高いが、行動の終了時点付近では動作１の後は動作３である確率が高い、というモデル化を行うことができない。即ち、動作の出現順序ではなく、動作の遷移関係、即ち、第１動作の後には第２動作が出現しやすい、という関係が学習される。したがって、本来、第１行動ではなく、第２行動に含まれると判定されるべき動作が第１行動に含まれる、と判定される場合が生じる。

　例えば、図１９に例示するように、行動Ａ９１が「部品Ｘ１をとり操作Ｙ１を行う」という行動であり、行動Ａ９２が「部品Ｘ２をとり操作Ｙ２を行う」という行動である場合、誤推定が生じやすい。図１９に例示されるように、「部品Ｘ１をとる」と「部品Ｘ２をとる」とは、双方とも同じ順序で発生する動作１、２を含むため、本来行動Ａ９２の開始部分に含まれる動作１、２が行動Ａ９１の終了部分に含まれると誤推定されている。

　本開示では、各行動を分割して生成した行動フェーズについて動作の遷移確率をモデル化する。各行動に含まれる複数の動作は、例えば、ユーザの定義などにより予め定められるため、各行動に含まれる動作の数を制御することはできない。しかしながら、本開示では、各行動を分割して行動フェーズを生成することで動作の数を制御し、確率的ではなく、決定的な順序で出現する行動フェーズでモデル化を行う。

　これにより、１つの行動内の各行動フェーズにおける動作の遷移確率を別々に取り扱うことができるため、順序的な制約を強めることができる。また、行動の分割数を増大させ、行動フェーズに含まれる動作の数を低減することで、順序制約をさらに強めることができる。即ち、基本データと同様の順序でない観測データは高評価とならない。したがって、行動の分割数を実験的に決定することで順序制約の強さを調整することができる。

　例えば、行動内の動作の数、即ち、動作の遷移回数に基づいて分割数を決定してもよい。時間的に短い行動と長い行動とでは、同じ動作の出現しやすさが異なり、分割数を等しくした場合、順序性に対する制約の強さに差異が生じるため、行動の分割数を実験的に決定しようとすると手間がかかる。しかしながら、行動内の動作の数に基づいて分割数を決定することで、手間を省くことができる。

　行動フェーズ内の動作の遷移回数が多過ぎると、当該行動フェーズ内で、及び隣接する行動フェーズと、同様の動作が出現しやすい。一方、行動フェーズ内の動作の遷移回数が少な過ぎると、確率的な遷移で順序をモデル化する効果が薄れる。即ち、基本データと、動作の出現順序が完全に一致しない場合でも、尤もらしい動作の順序を評価する効果が薄れる。したがって、行動フェーズに含まれる動作の遷移回数が等しくなるように、分割数を決定する。行動を分割することで端数の動作が生じる場合には、行動を略等しく分割することで行動フェーズを生成してもよい。例えば、行動に含まれる動作の数が１５である場合、行動フェーズに含まれる動作の数を５、５、５としてもよいし、行動に含まれる動作の数が１６である場合、行動フェーズに含まれる動作の数を５、５、６としてもよい。

　本実施形態では、隠れセミマルコフモデルは、各々が人の動作の種類を状態とする複数の第１隠れマルコフモデルを含む第２隠れマルコフモデルを複数含む。複数の第２隠れマルコフモデルの各々は、複数の動作を組み合わせて定まる行動の部分である部分行動を状態とする。隠れセミマルコフモデルにおいて、複数の第１隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習する。学習した観測確率を固定し、入力された第１教師ありデータを水増しすることで第２教師ありデータとし、第１隠れマルコフモデルの動作の遷移確率を第２教師ありデータを使用した教師あり学習で学習する。学習した観測確率及び遷移確率を使用して部分行動の区間を推定するモデルである隠れセミマルコフモデルを構築する。

　本開示によれば、部分行動区間推定モデルを効率的に構築することができる。即ち、例えば、工場での定型作業、ダンス、武道の型のように決まった順序で動作を行う複数の行動について、発生する順序に制約があるという条件の下で各行動の時間区間を正確に推定することができる。また、本開示によれば、部分行動の時間区間が適切に推定されることで、部分行動を含む行動の時間区間をより適切に推定することができる。

１０　行動フェーズ区間推定モデル構築装置
１１　観測確率学習部
１２　遷移確率学習部
１３　構築部
５１　ＣＰＵ
５２　一次記憶装置
５３　二次記憶装置

Claims

　各々が人の動作の種類を状態とする複数の第１隠れマルコフモデルを含む第２隠れマルコフモデルを複数含む隠れセミマルコフモデルであって、複数の第２隠れマルコフモデルの各々が複数の前記動作を組み合わせて定まる行動の部分である部分行動を状態とする隠れセミマルコフモデルにおいて、前記複数の第１隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習する観測確率学習部と、
　前記観測確率学習部にて学習した前記観測確率を固定し、入力された第１教師ありデータを水増しすることで第２教師ありデータとし、前記第１隠れマルコフモデルの前記動作の遷移確率を前記第２教師ありデータを使用した教師あり学習で学習する遷移確率学習部と、
　前記観測確率学習部で学習した前記観測確率及び前記遷移確率学習部で学習した前記遷移確率を使用して前記部分行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する構築部と、
　を含む部分行動区間推定モデル構築装置。
　前記部分行動は、各々が等しい長さの時間を含むように前記行動を分割することで生成される、
　請求項１に記載の部分行動区間推定モデル構築装置。
　前記部分行動は、各々が等しい数の動作を含むように前記行動を分割することで生成される、
　請求項１に記載の部分行動区間推定モデル構築装置。
　前記遷移確率学習部は、前記第１教師ありデータにノイズを付加してオーバーサンプリングすることで生成したデータの各々に前記第１教師ありデータの教師情報を付加することで水増しをする、
　請求項１～請求項３の何れか１項に記載の部分行動区間推定モデル構築装置。
　前記ノイズはランダムノイズである、
　請求項４に記載の部分行動区間推定モデル構築装置。
　前記ノイズは、前記動作のサンプルの散らばりが大きいほど大きくばらつくノイズである、
　請求項４に記載の部分行動区間推定モデル構築装置。
　コンピュータが、
　各々が人の動作の種類を状態とする複数の第１隠れマルコフモデルを含む第２隠れマルコフモデルを複数含む隠れセミマルコフモデルであって、複数の第２隠れマルコフモデルの各々が複数の前記動作を組み合わせて定まる行動の部分である部分行動を状態とする隠れセミマルコフモデルにおいて、前記複数の第１隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
　学習した前記観測確率を固定し、入力された第１教師ありデータを水増しすることで第２教師ありデータとし、前記第１隠れマルコフモデルの前記動作の遷移確率を前記第２教師ありデータを使用した教師あり学習で学習し、
　学習した前記観測確率及び前記遷移確率を使用して前記部分行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
　部分行動区間推定モデル構築方法。
　前記部分行動は、各々が等しい長さの時間を含むように前記行動を分割することで生成される、
　請求項７に記載の部分行動区間推定モデル構築方法。
　前記部分行動は、各々が等しい数の動作を含むように前記行動を分割することで生成される、
　請求項７に記載の部分行動区間推定モデル構築方法。
　前記第１教師ありデータにノイズを付加してオーバーサンプリングすることで生成したデータの各々に前記第１教師ありデータの教師情報を付加することで水増しをする、
　請求項７～請求項９の何れか１項に記載の部分行動区間推定モデル構築方法。
　前記ノイズはランダムノイズである、
　請求項１０に記載の部分行動区間推定モデル構築方法。
　前記ノイズは、前記動作のサンプルの散らばりが大きいほど大きくばらつくノイズである、
　請求項１０に記載の部分行動区間推定モデル構築方法。
　各々が人の動作の種類を状態とする複数の第１隠れマルコフモデルを含む第２隠れマルコフモデルを複数含む隠れセミマルコフモデルであって、複数の第２隠れマルコフモデルの各々が複数の前記動作を組み合わせて定まる行動の部分である部分行動を状態とする隠れセミマルコフモデルにおいて、前記複数の第１隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
　学習した前記観測確率を固定し、入力された第１教師ありデータを水増しすることで第２教師ありデータとし、前記第１隠れマルコフモデルの前記動作の遷移確率を前記第２教師ありデータを使用した教師あり学習で学習し、
　学習した前記観測確率及び前記遷移確率を使用して前記部分行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
　処理をコンピュータに実行させる部分行動区間推定モデル構築プログラム。
　前記部分行動は、各々が等しい長さの時間を含むように前記行動を分割することで生成される、
　請求項１３に記載の部分行動区間推定モデル構築プログラム。
　前記部分行動は、各々が等しい数の動作を含むように前記行動を分割することで生成される、
　請求項１３に記載の部分行動区間推定モデル構築プログラム。
　前記第１教師ありデータにノイズを付加してオーバーサンプリングすることで生成したデータの各々に前記第１教師ありデータの教師情報を付加することで水増しをする、
　請求項１３～請求項１５の何れか１項に記載の部分行動区間推定モデル構築プログラム。
　前記ノイズはランダムノイズである、
　請求項１６に記載の部分行動区間推定モデル構築プログラム。
　前記ノイズは、前記動作のサンプルの散らばりが大きいほど大きくばらつくノイズである、
　請求項１６に記載の部分行動区間推定モデル構築プログラム。