JP7130155B2

JP7130155B2 - 動作モデル生成装置、動作モデル生成方法及び動作モデル生成プログラム

Info

Publication number: JP7130155B2
Application number: JP2021573162A
Authority: JP
Inventors: 史記長澤; 士人新井; 亮史服部; 誠司奥村
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2020-03-24
Filing date: 2020-03-24
Publication date: 2022-09-02
Anticipated expiration: 2040-03-24
Also published as: WO2021192062A1; JPWO2021192062A1; US20220375267A1

Description

本開示は、可動体の動作を認識するための動作モデルの生成に関する。

特許文献１には、人物が映り込む映像データから行動を認識するようにコンピュータを機能させる行動認識プログラムが開示されている。より具体的には、特許文献１には、スケルトン情報抽出手段と、関節認識エンジンと、領域切出し手段と、動体認識エンジンと、スコア統合手段とが開示されている。
スケルトン情報抽出手段は、映像データから、人物の関節に基づくスケルトン情報を時系列に抽出する。関節認識エンジンは、映像データのスケルトン情報から、行動を認識する。領域切出し手段は、映像データから、スケルトン情報の囲み領域を抽出する。動体認識エンジンは、映像データの囲み領域から、行動を認識する。スコア統合手段は、行動ごとに、関節認識エンジン及び動体認識エンジンそれぞれのスコアを統合した統合スコアを出力する。

特開２０１９－１４４８３０号公報

特許文献１の技術では、例えば、「飲む」、「食べる」、「走る」、「畳む」といった比較的単純な動作を認識可能なモデルを用いて、これら動作を認識する。このような単純な動作の映像データはサンプル数が多いため、これらの動作の適切なモデルを生成することは難しくない。しかしながら、複雑な動作については映像データのサンプル数が少なく、適切なモデルを生成することが困難であるという課題がある。

本開示は、上記のような課題を解決することを主な目的の一つとしている。より具体的には、本開示は、複雑な動作についても適切なモデルを生成できるようにすることを主な目的とする。

本開示に係る動作モデル生成装置は、
可動体が基本動作を行う際の前記可動体の複数の部位の状態を部位ごとに解析して生成された、基本動作を認識するためのモデルである基本動作モデルを、複数の基本動作の各々について取得する基本動作モデル取得部と、
基本動作よりも複雑な動作である応用動作を認識するためのモデルである応用動作モデルを、複数の基本動作モデルのうちの２以上の基本動作モデルを組み合わせて生成する応用動作モデル生成部とを有する。

本開示によれば、複雑な動作についても適切なモデルを生成することができる。

実施の形態１に係る動作モデル生成装置のハードウェア構成例を示す図。実施の形態１に係る動作モデル生成装置の機能構成例を示す図。実施の形態１に係る動作モデル生成装置の動作例を示すフローチャート。実施の形態１に係る基本動作モデルの生成例を示す図。実施の形態１に係る基本動作モデルの例を示す図。実施の形態１に係る基本動作モデルの生成例を示す図。実施の形態１に係る基本動作モデルの例を示す図。実施の形態１に係る暫定モデルの例を示す図。実施の形態１に係る候補モデルの例を示す図。実施の形態１に係る応用動作モデルの例を示す図。実施の形態１に係る応用動作モデルの例を示す図。実施の形態１に係る身体の一部が隠れている映像データの例を示す図。実施の形態２に係る動作モデル生成装置の動作例を示すフローチャート。実施の形態３に係る動作モデル生成装置の動作例を示すフローチャート。実施の形態３に係る変更対象応用動作モデルと変更対象部分の例を示す図。実施の形態３に係る変更用モデルと変更用部分の例を示す図。実施の形態３に係る新たな応用動作モデルの例を示す図。

以下、実施の形態を図を用いて説明する。以下の実施の形態の説明及び図面において、同一の符号を付したものは、同一の部分又は相当する部分を示す。

実施の形態１．
＊＊＊概要＊＊＊
本実施の形態では、動作モデルを生成する動作モデル生成装置１００を説明する。
本実施の形態に係る動作モデル生成装置１００は、可動体の基本動作を認識するためのモデル（以下、「基本動作モデル」という）を２以上組み合わせて、応用動作を認識するためのモデル（以下、「応用動作モデル」という）を生成する。

可動体は、複数の部位をもち、複数の部位が動く物体である。可動体は、典型的には人物である。また、可動体には、人物の他、動物、ロボット、工作機械等も含まれる。以下では、可動体の例として主に人物を用いて説明を進める。
可動体の部位は、人物の場合は関節がある部位である。例えば、可動体の部位は、光学式モーションキャプチャ技術で反射マーカを取り付ける位置である。また、本実施の形態では、可動体が触れている要素も可動体の部位として扱う。例えば、可動体が人物の場合は、人物が触れているスマートフォン、缶入り飲料、キーボード、マウス、ペン等も人物の部位として扱う。

また、基本動作とは、基本となる単純な動作である。人物の場合は、基本動作は、例えば、「歩く」、「走る」、「座る」、「食べる」、「書く」、「スマートフォンを見る」、「キーボードを打鍵する」等である。例えば、動作モデル生成装置１００のユーザがどのような動作を基本動作とするかを任意に決定することができる。

応用動作は、基本動作よりも複雑な動作である。応用動作の例として、歩きながらスマートフォンを見るという動作（以下、「歩きスマートフォン」という）がある。「歩きスマートフォン」では、「歩く」という動作と「スマートフォンを見る」という２つの動作が含まれており、複雑な動作である。以下では、応用動作の例として主に「歩きスマートフォン」を用いて説明を進める。

応用動作の映像データに対して基本動作モデルを適用しても、正確に応用動作を識別することはできない。具体的には、「歩きスマートフォン」の映像データに対して基本動作「歩く」の基本動作モデルを適用した場合は、「歩きスマートフォン」を「歩く」動作であると認識できる可能性はあるが、正確に「歩きスマートフォン」と認識することはできない。
また、応用動作は、複雑な動作であるため、映像データのサンプル数が少ない傾向にある。このため、映像データを用いた学習を行っても、映像データのサンプル数の少なさから、応用動作を正確に認識できるモデルを生成することは難しい。
このため、本実施の形態に係る動作モデル生成装置１００は、応用動作「歩きスマートフォン」の応用動作モデルを基本動作「歩く」の基本動作モデルと基本動作「スマートフォンを見る」の基本動作モデルを組み合わせて生成する。

＊＊＊構成の説明＊＊＊
図１は、本実施の形態に係る動作モデル生成装置１００のハードウェア構成例を示す。
本実施の形態に係る動作モデル生成装置１００は、コンピュータである。動作モデル生成装置１００の動作手順は、動作モデル生成方法に相当する。また、動作モデル生成装置１００の動作を実現するプログラムは、動作モデル生成プログラムに相当する。

動作モデル生成装置１００は、ハードウェアとして、プロセッサ１５１、主記憶装置１５２、補助記憶装置１５３及び入出力装置１５４を備える。
補助記憶装置１５３には、後述する基本動作モデル生成部１０１、基本動作モデル取得部１０３及び応用動作モデル生成部１０４の機能を実現するプログラムが記憶されている。
これらプログラムは、補助記憶装置１５３から主記憶装置１５２にロードされる。そして、プロセッサ１５１がこれらプログラムを実行して、後述する基本動作モデル生成部１０１、基本動作モデル取得部１０３及び応用動作モデル生成部１０４の動作を行う。
図１では、プロセッサ１５１が基本動作モデル生成部１０１、基本動作モデル取得部１０３及び応用動作モデル生成部１０４の機能を実現するプログラムを実行している状態を模式的に表している。
入出力装置１５４は、例えばマウス、キーボード及びディスプレイである。

図２は、本実施の形態に係る動作モデル生成装置１００の機能構成例を示す。
動作モデル生成装置１００は、基本動作モデル生成部１０１、基本動作モデル記憶部１０２、基本動作モデル取得部１０３、応用動作モデル生成部１０４及び応用動作モデル記憶部１０５により構成される。

基本動作モデル生成部１０１は、基本動作モデルを生成する。より具体的には、基本動作モデル生成部１０１は、例えば映像データを学習して、可動体が基本動作を行う際の複数の部位の状態を部位ごとに解析する。そして、基本動作モデル生成部１０１は、解析により得られた複数の部位の状態を用いて基本動作モデルを生成する。

基本動作モデル記憶部１０２は、基本動作モデル生成部１０１により生成された複数の基本動作モデルを記憶する。
基本動作モデル記憶部１０２は、例えば、主記憶装置１５２又は補助記憶装置１５３により実現される。

基本動作モデル取得部１０３は、動作モデル生成装置１００のユーザからの要求に基づき、基本動作モデル記憶部１０２から、複数の基本動作に対応する複数の基本動作モデルを取得する。
なお、基本動作モデル取得部１０３により行われる処理は基本動作モデル取得処理に相当する。

応用動作モデル生成部１０４は、複数の基本動作モデルのうちの２以上の基本動作モデルを組み合わせて応用動作モデルを生成する。より具体的には、応用動作モデル生成部１０４は、可動体が応用動作を行う際の複数の部位の状態を部位ごとに解析する。そして、応用動作モデル生成部１０４は、解析により得られた複数の部位の状態を用いて、応用動作を認識するためのモデルを暫定モデルとして生成する。更に、応用動作モデル生成部１０４は、組み合わせた結果が暫定モデルに類似する２以上の基本動作モデルを用いて応用動作モデルを生成する。
応用動作モデル生成部１０４により行われる処理は応用動作モデル生成処理に相当する。

応用動作モデル記憶部１０５は、応用動作モデル生成部１０４により生成された応用動作モデルを記憶する。
応用動作モデル記憶部１０５は、例えば、主記憶装置１５２又は補助記憶装置１５３により実現される。
応用動作モデル記憶部１０５に格納された応用動作モデルは、映像データを解析する映像データ解析装置（不図示）での映像データの解析に使われる。

＊＊＊動作の説明＊＊＊
図３は、本実施の形態に係る動作モデル生成装置１００の動作例を示す。ここでは、主に、動作モデル生成装置１００が応用動作「歩きスマートフォン」の応用動作モデルを基本動作「歩く」の基本動作モデルと基本動作「スマートフォンを見る」の基本動作モデルを組み合わせて生成する例を説明する。

先ず、ステップＳ１０１において、基本動作モデル生成部１０１が基本動作モデルを生成する。
より具体的には、基本動作モデル生成部１０１は、基本動作が示される映像データを教師データとして用いた学習を行う。そして、基本動作モデル生成部１０１は、可動体の部位ごとの状態の遷移を解析し、可動体の部位ごとの状態の遷移が示される基本動作モデルを生成する。基本動作モデル生成部１０１は、複数の基本動作に対応させて複数の基本動作モデルを生成する。
そして、基本動作モデル生成部１０１は、生成した基本動作モデルを基本動作モデル記憶部１０２に格納する。

図４は、ステップＳ１０１において、基本動作モデル生成部１０１が「歩く」動作の基本動作モデルを生成する例を示す。
基本動作モデル生成部１０１は、例えば、図４の矢印の方向に、（ａ）～（ｆ）の順に人物が歩く映像データ（動画データ）を学習する。このとき、基本動作モデル生成部１０１は、図４において符号４０１～４２４の白丸で表現している人物の身体部位ごとの状態（角度、位置等）を（ａ）～（ｆ）の各段階で学習する。図４では、作図上の理由から、図４の（ａ）にのみ、身体部位を表す白丸を示しているが、図４の（ｂ）～（ｆ）でも、基本動作モデル生成部１０１は、図４の（ａ）と同じ身体部位の状態を学習する。
このようにして、基本動作モデル生成部１０１は、基本動作「歩く」における身体部位の状態の時間推移を学習することができる。

基本動作モデル生成部１０１は、「歩く」動作について複数の映像データを学習することで、身体部位ごとの動きが反映された、「歩く」動作が正確に反映された基本動作モデルを生成する。
例えば、基本動作モデル生成部１０１は、図５に示すように、部位ごとの状態の時間推移が示される「歩く」動作の基本動作モデルを生成する。図５では、図４の身体部位４０１～４２４の各々について、図４の段階（ａ）～（ｆ）の各段階での座標値（ｘ、ｙ、ｚ）が示される。
また、基本動作モデル生成部１０１は、基本動作の検知に対する影響度が小さい身体部位の情報を基本動作モデルから取り除いてもよい。例えば、「歩く」動作の基本動作モデルについては、頭の動きなどの「歩く」動作に直接関係のない身体部位の情報を基本動作モデルから取り除いてもよい。このときに使用する影響度はとして、基本動作モデル生成部１０１は、例えば、基本動作モデルの生成時に用いられた機械学習毎に算出されるスコア値を用いることができる。本実施の形態では、基本動作モデル生成部１０１は、影響度が小さい身体部位の情報を取り除かないものとする。
なお、学習対象の身体部位４０１～４２４は一例であり、基本動作モデル生成部１０１は、図４とは異なる身体部位を学習してもよい。また、基本動作モデルにおける各身体部位の値も座標値（ｘ、ｙ、ｚ）でなくてもよい。

図６は、ステップＳ１０１において、基本動作モデル生成部１０１が「スマートフォンを見る」動作の基本動作モデルを生成する例を示す。
基本動作モデル生成部１０１は、例えば図６において符号６０１～６１６の白丸で表現している人物の身体部位ごとの状態（角度、位置等）を学習する。これにより、基本動作モデル生成部１０１は、基本動作「スマートフォンを見る」における身体部位の状態を学習することができる。

基本動作モデル生成部１０１は、「スマートフォンを見る」動作の複数の映像データを学習することで、身体部位ごとの状態が反映された、「スマートフォンを見る」動作の基本動作モデルを生成する。
基本動作モデル生成部１０１は、例えば、図７に示すような「スマートフォンを見る」動作の基本動作モデルを生成する。図７では、図６に示す身体部位６０１～６１６の各々の座標値（ｘ、ｙ、ｚ）が示される。
なお、「スマートフォンを見る」動作は時刻ごとの各身体部位の状態の変化が少ないので、基本動作モデル生成部１０１は、動画データではなく静止画データを学習することでもよい。
なお、学習対象の身体部位６０１～６１６は一例であり、基本動作モデル生成部１０１は、図６とは異なる身体部位を学習してもよい。また、基本動作モデルにおける各身体部位の値も座標値（ｘ、ｙ、ｚ）でなくてもよい。

図３に戻り、ステップＳ１０２において、基本動作モデル取得部１０３は、動作モデル生成装置１００のユーザから応用動作モデルの生成が要求されたか否かを判定する。生成要求には、生成対象の応用動作モデルが指定されている。本実施の形態では、生成要求において「歩きスマートフォン」の応用動作モデルの生成が指定されているものとする。
なお、動作モデル生成装置１００のユーザは、例えばマウス又はキーボードの操作により応用動作モデルの生成を要求する。
動作モデル生成装置１００のユーザから応用動作モデルの生成が要求された場合は、処理がステップＳ１０３に進む。

ステップＳ１０３において、基本動作モデル取得部１０３は、基本動作モデル記憶部１０２から複数の基本動作モデルを取得する。

次に、ステップＳ１０４において、応用動作モデル生成部１０４が暫定モデルを生成する。
具体的には、応用動作モデル生成部１０４は、「歩きスマートフォン」の映像データを教師データとして用いた学習を行う。そして、応用動作モデル生成部１０４は、身体部位ごとの状態の遷移を解析し、身体部位ごとの状態の遷移が示される暫定モデルを生成する。暫定モデルの生成方法は、ステップＳ１０１の基本動作モデルの生成方法と同様である。
複雑な動作である「歩きスマートフォン」の映像データのサンプル数は少ない。このため、応用動作モデル生成部１０４は、「歩きスマートフォン」の動作が反映された精密なモデルは生成できないが、「歩きスマートフォン」の動作の最低限の特徴を捉えた暫定モデルは生成することができる。

次に、ステップＳ１０５において、応用動作モデル生成部１０４が基本動作モデル取得部１０３により取得された複数の基本動作モデルのうちの２以上の基本動作モデルを組み合わせて候補モデルを生成する。応用動作モデル生成部１０４は、基本的に、同一の身体部位についての情報を持たない基本動作モデルの組み合わせによって候補モデルを生成する。しかし、応用動作モデル生成部１０４は、同一の身体部位についての情報を持つ基本動作モデルを組み合わせて候補モデルを生成してもよい。この場合は、応用動作モデル生成部１０４は、対応する身体部位についての情報の平均をとるなどの方法で基本動作モデルを組み合わせる。
組み合わせる２以上の基本動作モデルの向きが違っている場合は、応用動作モデル生成部１０４は、向きの違いによる影響を小さくするための調整を行う。具体的には、応用動作モデル生成部１０４は、組み合わせる２以上の基本動作モデルの特定の身体部位が一定の方向を向くように調整を行う。応用動作モデル生成部１０４は、例えば、腰や首などの代表的な身体部位の向きが一致するように、２以上の基本動作モデルの少なくともいずれかを回転させる。
なお、応用動作モデル生成部１０４は、応用動作と根本的に異なる基本動作の基本動作モデルはステップＳ１０５の組合せから除外してもよい。応用動作「歩きスマートフォン」の例では、応用動作モデル生成部１０４は、例えば、基本動作「食べる」の基本動作モデル、基本動作「書く」の基本動作モデル等はステップＳ１０５の組合せから除外することができる。

次に、ステップＳ１０６において、応用動作モデル生成部１０４は、暫定モデルと候補モデルとの類似度を算出する。
応用動作モデル生成部１０４は、例えば、ハミング距離を用いた手法により暫定モデルと候補モデルとの類似度を算出する。また、応用動作モデル生成部１０４は、暫定モデルと候補モデルとの対応する身体部位各々の座標値（ｘ、ｙ、ｚ）の差の絶対値の総和を用いて暫定モデルと候補モデルとの類似度を算出してもよい。例えば、応用動作モデル生成部１０４は、暫定モデルと候補モデルとの対応する身体部位各々の座標値（ｘ、ｙ、ｚ）の差の絶対値の総和を距離として扱う。そして、応用動作モデル生成部１０４は、距離の逆数を類似度として算出してもよい。この場合に、暫定モデルと候補モデルの向きが違っている場合は、応用動作モデル生成部１０４は、前述したような向きの違いによる影響を小さくするための調整を行う。

そして、ステップＳ１０７において、応用動作モデル生成部１０４は、ステップＳ１０６で算出した類似度を既定の記憶領域に格納する。

次に、ステップＳ１０８において、応用動作モデル生成部１０４は、候補モデルの生成が完了しているか否かを判定する。
未生成の候補モデルがある場合は、処理がステップＳ１０５に戻る。一方、候補モデルの生成が完了している場合は、処理がステップＳ１０９に進む。

ステップＳ１０９では、応用動作モデル生成部１０４は、最も類似度が高い候補モデルを応用動作モデルに指定する。
以上により、２以上の基本動作モデルを組み合わせた応用動作モデルが得られた。

最後に、ステップＳ１１０において、応用動作モデル生成部１０４が、ステップＳ１０９で指定した応用動作モデルを応用動作モデル記憶部１０５に格納する。

図８は、ステップＳ１０４で生成される暫定モデルの例を示す。
応用動作モデル生成部１０４は、図４と同様に、矢印の方向に、（ａ）～（ｆ）の順に人物が歩く映像データ（動画データ）を学習して、「歩きスマートフォン」の暫定モデルを生成する。
「歩きスマートフォン」の映像データの数が少ないため、例えば、図８に示すように脚部が鞄７００で隠れてしまっている映像データしか得られない。図８の映像データからは、鞄７００で隠れた脚部については正しい学習結果が得られないので、暫定モデルでは、脚部についての座標値（ｘ、ｙ、ｚ）は不正確である。

図９及び図１０は、ステップＳ１０５で生成される候補モデルの例を示す。
図９は、「歩く」の基本動作モデルと「缶入り飲料を飲む」の基本動作モデルを組み合わせて得られる候補モデルの例を示す。
図１０は、「歩く」の基本動作モデルと「スマートフォンを見る」の基本動作モデルを組み合わせて得られる候補モデルの例である。
「歩きスマートフォン」の場合は、「歩く」の基本動作モデルと「スマートフォンを見る」の基本動作モデルを組み合わせることが適切であると容易に想起することができる。しかし、応用動作の態様によっては、いずれの基本動作を組み合わせればよいのかが明らかではない場合がある。このため、応用動作モデル生成部１０４は、２以上の基本動作モデルを総当たり的に組み合わせて候補モデルを複数生成する。

応用動作モデル生成部１０４は、「歩きスマートフォン」の暫定モデル（図８）と、候補モデル（図９及び図１０）の各々との類似度を算出する。
そして、図８の暫定モデルでは脚部が鞄７００で隠れてしまっているものの、応用動作モデル生成部１０４は、図１０の候補モデルの方が類似度が高いと判定し、図１０の候補モデルを応用動作モデルに指定する。

図１０の応用動作モデルでは、例えば、図１１に示すように、図６の人物部位６０１～６１６の状態と図４の人物部位４１３～４２４の状態とで構成される。
図１０では、作図上の理由により全ての人物部位に符号をつけていないが、図６に示す人物部位６０１～６１６と、図４に示す人物部位４１３～４２４が含まれている。

＊＊＊実施の形態の効果の説明＊＊＊
本実施の形態によれば、映像データのサンプル数が少ない複雑な動作についても適切なモデルを生成することができる。

また、本実施の形態では、暫定モデルと候補モデルを生成し、暫定モデルとの類似度が最も高い候補モデルを応用動作モデルに指定する。このため、本実施の形態によれば、応用動作モデルに用いるべき基本動作モデルが明らかではない場合でも、適切な基本動作モデルを組み合わせて応用動作モデルを生成することができる。

また、本実施の形態では、可動体の部位ごとに部位の状態が示される基本動作モデルを組み合わせて応用動作モデルを生成する。このため、本実施の形態によれば、可動体の一部の部位が隠れている場合にも適切に応用動作を認識することができる。
例えば、図８に示すように鞄７００で人物の身体の一部が隠れているような場合、また、図１２に示すようにガードレール８００で人物の身体の一部が隠れているような場合でも、「歩きスマートフォン」の応用動作を用いて、正確に「歩きスマートフォン」動作を検知することができる。

なお、本実施の形態では、動作モデル生成装置１００内で基本動作モデル生成部１０１が基本動作モデルを生成する例を説明した。これに代えて、動作モデル生成装置１００の外部の外部装置が基本動作モデルを生成するようにしてもよい。この場合の外部装置による基本動作モデルの生成方法は上述した基本動作モデル生成部１０１による基本動作モデルの生成方法と同じである。
動作モデル生成装置１００では、基本動作モデル取得部１０３が外部装置から基本動作モデルを取得する。外部装置が基本動作モデルを生成する場合は、図２の構成から、基本動作モデル生成部１０１と基本動作モデル記憶部１０２を省略することができる。

実施の形態２．
本実施の形態では、主に実施の形態１との差異を説明する。
なお、以下で説明していない事項は、実施の形態１と同様である。

実施の形態１で示した図３のフローチャートでは、応用動作モデル生成部１０４が暫定モデルと候補モデルを生成し、暫定モデルとの類似度が最も高い候補モデルを応用動作モデルに指定する。これに代えて、図１３に示すように、応用動作モデル生成部１０４は、動作モデル生成装置１００のユーザの指定に従って応用動作モデルを生成するようにしてもよい。
以下、図１３のフローを説明する。

ステップＳ１０１とステップＳ１０２は図３と同様であるため、説明を省略する。

次に、ステップＳ１２１において、応用動作モデル生成部１０４は、動作モデル生成装置１００のユーザから応用動作モデルに用いる基本動作モデルが指定されているか否かを判定する。
「歩きスマートフォン」の応用動作モデルの生成を要求する場合は、動作モデル生成装置１００のユーザは、例えば、「歩く」動作の基本動作モデルと「スマートフォンを見る」動作の基本動作モデルを指定する。
動作モデル生成装置１００のユーザに基本動作モデルが指定されている場合は、処理がステップＳ１２２に進む。一方、基本動作モデルが指定されていない場合は図３のステップＳ１０３～Ｓ１０９が行われる。

ステップＳ１２２では、応用動作モデル生成部１０４は、ユーザに指定された基本動作モデルを組み合わせて応用動作モデルを生成する。
前述の例では、応用動作モデル生成部１０４は、ユーザにより指定された「歩く」動作の基本動作モデルと「スマートフォンを見る」動作の基本動作モデルを組み合わせて、「歩きスマートフォン」の応用動作モデルを生成する。

最後に、ステップＳ１２３において、応用動作モデル生成部１０４が、ステップＳ１２２で生成した応用動作モデルを応用動作モデル記憶部１０５に格納する。

以上、本実施の形態によっても、映像データのサンプル数が少ない複雑な動作についても適切なモデルを生成することができる。

実施の形態３．
本実施の形態では、主に実施の形態１との差異を説明する。
なお、以下で説明していない事項は、実施の形態１と同様である。

実施の形態１及び実施の形態２では、２以上の基本動作を組み合わせて応用動作モデルを生成する例を説明した。
本実施の形態では、動作モデル生成装置１００が、生成済みの応用動作モデルの一部を基本動作モデルの少なくとも一部又は他の応用動作モデルの少なくとも一部と置き換えて新たな応用動作モデルを生成する例を説明する。

本実施の形態においても、動作モデル生成装置１００のハードウェア構成例は図１に示す通りである。また、動作モデル生成装置１００の機能構成例は図２に示す通りである。

図１４は、本実施の形態に係る動作モデル生成装置１００の動作例を示す。

先ず、ステップＳ１３１において、応用動作モデル生成部１０４は応用動作モデルの変更が要求されたか否かを判定する。
ここでは、動作モデル生成装置１００のユーザは、一部が変更される応用動作モデル（以下、「変更対象応用動作モデル」という）と、変更対象応用動作モデルの変更に用いられる基本動作モデル又は他の応用動作モデル（以下、「変更用モデル」という）を指定する。更に、動作モデル生成装置１００のユーザは、変更対象応用動作モデルのうちの変更の対象となる部分（以下、「変更対象部分」という）と、変更用モデルのうちの変更対象部分の変更に用いられる部分（以下、「変更用部分」）とを指定する。
ユーザにより要求動作モデルの変更が要求された場合は、処理がステップＳ１３２に進む。

ステップＳ１３２では、応用動作モデル生成部１０４は、変更対象応用動作モデルの変更対象部分を変更用モデルの変更用部分で置き換えて新たな応用動作モデルを生成する。

最後に、ステップＳ１３３において、応用動作モデル生成部１０４は、ステップＳ１３２で生成した新たな応用動作モデルを応用動作モデル記憶部１０５に格納する。

ここで、具体例を用いて、実施の形態３に係る動作モデル生成装置１００の動作例を説明する。

図１５は、動作モデル生成装置１００のユーザにより指定された変更対象応用動作モデルと変更対象部分の例を示す。図１５の例では、「歩きスマートフォン」の応用動作モデルが変更対象応用動作モデルとして指定されている。また、符号９０１の部分が変更対象部分として指定されている。

図１６は、動作モデル生成装置１００のユーザにより指定された変更用モデルと変更用部分の例を示す。図１６の例では、「自転車の運転」の基本動作モデルが変更用モデルとして指定されている。また、符号９０２の部分が変更用部分として指定されている。

応用動作モデル生成部１０４は、図１５の変更対象部分９０１を図１６の変更用部分９０２に置き換えて、図１７に示す「自転車運転中のスマートフォン」動作の応用動作モデルを新たに生成する。

このように、本実施の形態によれば、生成済みの応用動作モデルの一部を変更して新たな応用動作モデルを生成することができる。
従来は、例えば、図１７に示す「自転車運転中のスマートフォン」動作のモデルを生成する場合は、「自転車運転中のスマートフォン」動作の映像データを用いた学習が必要であった。これに対して、本実施の形態では、更なる学習を行わずに、「自転車運転中のスマートフォン」動作に対応した新たな応用動作モデルを生成することができる。
この結果、「自転車運転中のスマートフォン」動作に対応する新たな応用動作モデルを用いて、自転車を運転しながらスマートフォンを見ている動作を検知することができる。

以上、実施の形態１～３を説明したが、これらの実施の形態のうち、２つ以上を組み合わせて実施しても構わない。
あるいは、これらの実施の形態のうち、１つを部分的に実施しても構わない。
あるいは、これらの実施の形態のうち、２つ以上を部分的に組み合わせて実施しても構わない。
また、これらの実施の形態に記載された構成及び手順を必要に応じて変更してもよい。

＊＊＊ハードウェア構成の補足説明＊＊＊
最後に、動作モデル生成装置１００のハードウェア構成の補足説明を行う。
図１に示すプロセッサ１５１は、プロセッシングを行うＩＣ（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）である。
プロセッサ１５１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）等である。
図１に示す主記憶装置１５２は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）である。
図１に示す補助記憶装置１５３は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、フラッシュメモリ、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）等である。

また、補助記憶装置１５３には、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）も記憶されている。
そして、ＯＳの少なくとも一部がプロセッサ１５１により実行される。
プロセッサ１５１はＯＳの少なくとも一部を実行しながら、基本動作モデル生成部１０１、基本動作モデル取得部１０３及び応用動作モデル生成部１０４の機能を実現するプログラムを実行する。
プロセッサ１５１がＯＳを実行することで、タスク管理、メモリ管理、ファイル管理、通信制御等が行われる。
また、基本動作モデル生成部１０１、基本動作モデル取得部１０３及び応用動作モデル生成部１０４の処理の結果を示す情報、データ、信号値及び変数値の少なくともいずれかが、主記憶装置１５２、補助記憶装置１５３、プロセッサ１５１内のレジスタ及びキャッシュメモリの少なくともいずれかに記憶される。
また、基本動作モデル生成部１０１、基本動作モデル取得部１０３及び応用動作モデル生成部１０４の機能を実現するプログラムは、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ（登録商標）ディスク、ＤＶＤ等の可搬記録媒体に格納されていてもよい。そして、基本動作モデル生成部１０１、基本動作モデル取得部１０３及び応用動作モデル生成部１０４の機能を実現するプログラムが格納された可搬記録媒体を流通させてもよい。

また、基本動作モデル生成部１０１、基本動作モデル取得部１０３及び応用動作モデル生成部１０４の「部」を、「回路」又は「工程」又は「手順」又は「処理」に読み替えてもよい。
また、動作モデル生成装置１００は、処理回路により実現されてもよい。処理回路は、例えば、ロジックＩＣ（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、ＧＡ（ＧａｔｅＡｒｒａｙ）、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）である。
なお、本明細書では、プロセッサと処理回路との上位概念を、「プロセッシングサーキットリー」という。
つまり、プロセッサと処理回路とは、それぞれ「プロセッシングサーキットリー」の具体例である。

１００動作モデル生成装置、１０１基本動作モデル生成部、１０２基本動作モデル記憶部、１０３基本動作モデル取得部、１０４応用動作モデル生成部、１０５応用動作モデル記憶部、１５１プロセッサ、１５２主記憶装置、１５３補助記憶装置、１５４入出力装置。

Claims

可動体の基本動作が示される映像データを教師データとして学習を行い、前記可動体の複数の部位の状態の遷移を部位ごとに解析して、前記可動体の部位ごとの状態の遷移が示された、前記基本動作を認識するためのモデルである基本動作モデルを生成する基本動作モデル生成部と、
前記基本動作モデル生成部で生成された前記基本動作モデルを、複数の基本動作の各々について取得する基本動作モデル取得部と、
前記基本動作よりも複雑な動作である応用動作が示される映像データを教師データとして学習を行い、前記可動体の複数の部位の状態の遷移を部位ごとに解析して、前記可動体の部位ごとの状態の遷移が示された、前記応用動作を認識するためのモデルを暫定モデルとして生成し、複数の前記基本動作モデルのうち、組み合わせた結果が前記暫定モデルに類似する２以上の前記基本動作モデルを組み合わせて前記応用動作を認識するためのモデルである応用動作モデルを生成する応用動作モデル生成部と、
を有する動作モデル生成装置。
前記応用動作モデル生成部は、
前記複数の前記基本動作モデルのうちの２以上の基本動作モデルを組み合わせて前記応用動作モデルの候補である候補モデルを複数生成し、
複数の候補モデルの各々と前記暫定モデルとの類似度を算出し、最も類似度が高い候補モデルを前記応用動作モデルに指定する請求項１に記載の動作モデル生成装置。
前記応用動作モデル生成部は、
前記複数の前記基本動作モデルの中から指定された２以上の基本動作モデルを組み合わせて前記応用動作モデルを生成する請求項１に記載の動作モデル生成装置。
可動体の基本動作が示される映像データを教師データとして学習を行い、前記可動体の複数の部位の状態の遷移を部位ごとに解析して、前記可動体の部位ごとの状態の遷移が示された、前記基本動作を認識するためのモデルである基本動作モデルを生成する基本動作モデル生成部と、
前記基本動作モデル生成部で生成された前記基本動作モデルを、複数の基本動作の各々について取得する基本動作モデル取得部と、
前記基本動作よりも複雑な動作である応用動作を認識するためのモデルである応用動作モデルを、複数の前記基本動作モデルのうちの２以上の前記基本動作モデルを組み合わせて生成し、生成した応用動作モデルの一部を、前記基本動作モデルの少なくとも一部又は他の応用動作モデルの少なくとも一部で置換して新たな応用動作を認識するための新たな応用動作モデルを生成する応用動作モデル生成部と、
を有する動作モデル生成装置。
コンピュータが、可動体の基本動作が示される映像データを教師データとして学習を行い、前記可動体の複数の部位の状態の遷移を部位ごとに解析して、前記可動体の部位ごとの状態の遷移が示された、前記基本動作を認識するためのモデルである基本動作モデルを生成し、
生成された前記基本動作モデルを、前記コンピュータが、複数の基本動作の各々について取得し、
前記コンピュータが、前記基本動作よりも複雑な動作である応用動作が示される映像データを教師データとして学習を行い、前記可動体の複数の部位の状態の遷移を部位ごとに解析して、前記可動体の部位ごとの状態の遷移が示された、前記応用動作を認識するためのモデルを暫定モデルとして生成し、複数の前記基本動作モデルのうち、組み合わせた結果が前記暫定モデルに類似する２以上の前記基本動作モデルを組み合わせて前記応用動作を認識するためのモデルである応用動作モデルを生成する動作モデル生成方法。
コンピュータが、可動体の基本動作が示される映像データを教師データとして学習を行い、前記可動体の複数の部位の状態の遷移を部位ごとに解析して、前記可動体の部位ごとの状態の遷移が示された、前記基本動作を認識するためのモデルである基本動作モデルを生成し、
生成された前記基本動作モデルを、前記コンピュータが、複数の基本動作の各々について取得し、
前記コンピュータが、前記基本動作よりも複雑な動作である応用動作を認識するためのモデルである応用動作モデルを、複数の前記基本動作モデルのうちの２以上の前記基本動作モデルを組み合わせて生成し、生成した応用動作モデルの一部を、前記基本動作モデルの少なくとも一部又は他の応用動作モデルの少なくとも一部で置換して新たな応用動作を認識するための新たな応用動作モデルを生成する動作モデル生成方法。
可動体の基本動作が示される映像データを教師データとして学習を行い、前記可動体の複数の部位の状態の遷移を部位ごとに解析して、前記可動体の部位ごとの状態の遷移が示された、前記基本動作を認識するためのモデルである基本動作モデルを生成する基本動作モデル生成処理と、
前記基本動作モデル生成処理で生成された前記基本動作モデルを、複数の基本動作の各々について取得する基本動作モデル取得処理と、
前記基本動作よりも複雑な動作である応用動作が示される映像データを教師データとして学習を行い、前記可動体の複数の部位の状態の遷移を部位ごとに解析して、前記可動体の部位ごとの状態の遷移が示された、前記応用動作を認識するためのモデルを暫定モデルとして生成し、複数の前記基本動作モデルのうち、組み合わせた結果が前記暫定モデルに類似する２以上の前記基本動作モデルを組み合わせて前記応用動作を認識するためのモデルである応用動作モデルを生成する応用動作モデル生成処理と、
をコンピュータに実行させる動作モデル生成プログラム。
可動体の基本動作が示される映像データを教師データとして学習を行い、前記可動体の複数の部位の状態の遷移を部位ごとに解析して、前記可動体の部位ごとの状態の遷移が示された、前記基本動作を認識するためのモデルである基本動作モデルを生成する基本動作モデル生成処理と、
前記基本動作モデル生成処理で生成された前記基本動作モデルを、複数の基本動作の各々について取得する基本動作モデル取得処理と、
前記基本動作よりも複雑な動作である応用動作を認識するためのモデルである応用動作モデルを、複数の前記基本動作モデルのうちの２以上の前記基本動作モデルを組み合わせて生成し、生成した応用動作モデルの一部を、前記基本動作モデルの少なくとも一部又は他の応用動作モデルの少なくとも一部で置換して新たな応用動作を認識するための新たな応用動作モデルを生成する応用動作モデル生成処理と、
をコンピュータに実行させる動作モデル生成プログラム。