JP7387069B1 - 機械学習装置、熟練行動判定装置、機械学習方法、及び機械学習プログラム - Google Patents
機械学習装置、熟練行動判定装置、機械学習方法、及び機械学習プログラム Download PDFInfo
- Publication number
- JP7387069B1 JP7387069B1 JP2023532819A JP2023532819A JP7387069B1 JP 7387069 B1 JP7387069 B1 JP 7387069B1 JP 2023532819 A JP2023532819 A JP 2023532819A JP 2023532819 A JP2023532819 A JP 2023532819A JP 7387069 B1 JP7387069 B1 JP 7387069B1
- Authority
- JP
- Japan
- Prior art keywords
- graph
- machine learning
- image
- feature
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 126
- 230000006399 behavior Effects 0.000 title claims abstract description 88
- 230000009471 action Effects 0.000 claims abstract description 65
- 239000000284 extract Substances 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 6
- 238000000605 extraction Methods 0.000 claims description 67
- 238000000034 method Methods 0.000 claims description 24
- 230000003542 behavioural effect Effects 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 26
- 238000012545 processing Methods 0.000 description 15
- 238000013527 convolutional neural network Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 9
- 230000001364 causal effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000010304 firing Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000013526 transfer learning Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000037308 hair color Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
Description
《1-1》構成
図1は、実施の形態1に係る機械学習装置100のハードウェア構成の例を示す図である。実施の形態1に係る機械学習装置100は、機械学習を行うことで学習モデルMを生成する学習プロセスを実行する装置である。また、機械学習装置100は、熟練行動判定装置でもある。機械学習装置100は、CPU(Central Processing Unit)などのプロセッサ101と、揮発性の記憶装置であるメモリ102と、ハードディスクドライブ(HDD)又はソリッドステートドライブ(SSD)などの不揮発性記憶装置103と、インタフェース104とを有している。メモリ102は、例えば、RAM(Random Access Memory)などの半導体メモリである。機械学習装置100は、外部の装置との通信を行う通信装置を有してもよい。
図3は、実施の形態1に係る機械学習装置100の学習時の動作を示す説明図である。図4は、機械学習装置100の学習時の動作の例を示す情報を表形式で示す図である。
図6は、実施の形態1に係る機械学習装置(熟練行動判定装置)100の推論時の動作を示す説明図である。図7は、機械学習装置(熟練行動判定装置)100の推論時の動作を示すフローチャートである。
グラフ入力部15で、ユーザが予めオブジェクト同士の相互関係を与え、解きたい課題に合わせて、認識すべきオブジェクトの抽出方法を指定することができる。このような実施の形態により、解きたい課題に関連するユーザの知見を知識グラフという形で機械学習に取り込むことができるようになる。
《2-1》構成
図8は、実施の形態2に係る機械学習装置200の構成を概略的に示す機能ブロック図である。図8において、図2に示される構成と同一又は対応する構成には、図2に示される符号と同じ符号が付されている。機械学習装置200は、オブジェクト認識部28の動作の点で、実施の形態1に係る機械学習装置100と相違する。機械学習装置200は、実施の形態4に係る機械学習方法を実施できる装置である。機械学習装置200のハードウェア構成は、図1のものと同様である。
図10は、機械学習装置200の学習時の動作を示すフローチャートである。図10の動作は、オブジェクト認識部28の動作とグラフ-オブジェクト特徴抽出部16の動作の点で、実施の形態1に係る機械学習装置100の動作と相違する。機械学習装置200は、オブジェクトの認識(ステップS201)、第1の特徴量F1の抽出(ステップS202)、着目領域Aの生成(ステップS203)、グラフオブジェクト特徴(第2の特徴量F2)の抽出(ステップS204)、学習モデルとしてのグラフモデルの生成(ステップS205)を行う。
実施の形態2によれば、オブジェクト認識部2で、オブジェクトが存在しないもしくは重なり合っていることを検知し、これに基づいて適切にノードに割り当てる特徴量を決定することで、ある時刻でオブジェクトが検出されない場合でもより安定的にST-GCNのような学習を実行することができる。
《3-1》構成
図11は、実施の形態3に係る機械学習装置300の構成を概略的に示す機能ブロック図である。図11において、図2に示される構成と同一又は対応する構成には、図2に示される符号と同じ符号が付されている。機械学習装置300は、学習データ生成部35を有する点及び特徴行動判定モデル31の構成及び動作の点において、実施の形態1に係る機械学習装置100と相違する。機械学習装置300は、実施の形態3に係る機械学習方法を実施できる装置である。機械学習装置300のハードウェア構成は、図1のものと同様である。
図12は、機械学習装置300の学習時の動作を示す説明図である。学習率調整部32を設け、最初はCNNに比重を置いて特徴抽出して、後半に行くほどST-GCNに比重を置くことで、右手、左手、頭の相互関係を習得しやすくする。学習データ生成部35は、オブジェクト認識部28により、右手、左手、頭などの認識結果をデータセット記憶部60に登録する。これに基づいて、先ず、オブジェクト認識・熟練行動判定モデル学習部33は、通常のCNN等のモデルでマルチタスクラーニングを行い、学習用データから熟練度と右手、左手、頭も含めた特徴量とを抽出する。
以上に説明したように、実施の形態3によれば、オブジェクト認識・熟練行動判定モデル学習部33を設けることで、ST-GCNに対してオブジェクトに関する特徴も持たせることができ、その結果、手及び頭の抽出に関する特徴をベースに熟練行動を判定するような学習が可能となる。これにより、学習をより安定にすることが期待できる。
《4-1》構成
図15は、実施の形態4に係る機械学習装置400の構成を概略的に示す機能ブロック図である。図15において、図2に示される構成と同一又は対応する構成には、図2に示される符号と同じ符号が付されている。機械学習装置400は、熟練行動判定モデル41の構成の点及びグラフ候補生成部43を有する点において、実施の形態1に係る機械学習装置100と相違する。機械学習装置400は、実施の形態4に係る機械学習方法を実施できる装置である。機械学習装置400のハードウェア構成は、図1のものと同様である。
図16は、機械学習装置400の学習時の動作を示すフローチャートである。機械学習装置400は、オブジェクトの認識(ステップS401)、第1の特徴量F1の抽出(ステップS402)、着目領域Aの生成(ステップS403)、グラフオブジェクト特徴(第2の特徴量F2)の抽出(ステップS404)、学習モデルとしてのグラフモデルの生成(ステップS405)を行う。
以上に説明したように、実施の形態4によれば、グラフ候補生成部43がユーザ50のノードに対し、関係性を発見できるようにする情報を提示することで、ノード間の不適切な関係性の入力によって、ノイズとなるような関係性の定義を与えることを回避できる。
Claims (11)
- 画像内の動作主体の行動の熟練度を推論するための学習モデルを学習する機械学習装置であって、
ユーザの入力操作に基づいて、前記動作主体の複数の部分に対応する複数のノードと前記複数のノードの間の関係性を示す情報とで構成されるグラフを取得するグラフ入力部と、
前記グラフ入力部で取得された前記グラフを記憶する記憶部と、
前記複数のノードに対応する複数のオブジェクトが存在する、前記画像内における複数のオブジェクト領域を認識して出力するオブジェクト認識部と、
前記画像内に存在する前記動作主体の前記複数の部分の行動の特徴量である第1の特徴量を抽出する熟練行動特徴抽出部と、
前記第1の特徴量に基づいて前記画像内における着目領域を生成する着目領域生成部と、
前記着目領域と前記オブジェクト領域とが重なる領域について前記第1の特徴量を強調した第2の特徴量を生成するグラフ-オブジェクト特徴抽出部と、
前記画像が予め収集された学習用データであるときにおける前記第2の特徴量に基づいて、前記学習モデルを生成するグラフモデル学習部と、
を有することを特徴とする機械学習装置。 - 前記オブジェクト認識部は、前記複数のノードに対応する複数のオブジェクトの位置及び速度に関する過去の情報を保持し、前記過去の情報に基づいて前記複数のオブジェクト領域の位置を予測して、前記複数のオブジェクト領域の重なり合いを判定し、
前記グラフ-オブジェクト特徴抽出部は、前記複数のオブジェクト領域のうちの重なり合うオブジェクト領域の前記第1の特徴量に基づいて、前記重なり合うオブジェクト領域の前記第1の特徴量を変更する
ことを特徴とする請求項1に記載の機械学習装置。 - 画像内の動作主体の行動の熟練度を推論するための学習モデルを学習する機械学習装置であって、
ユーザの入力操作に基づいて、前記動作主体の複数の部分に対応する複数のノードと前記複数のノードの間の関係性を示す情報とで構成されるグラフを取得するグラフ入力部と、
前記グラフ入力部で取得された前記グラフを記憶する記憶部と、
前記複数のノードに対応する複数のオブジェクトが存在する、前記画像内における複数のオブジェクト領域を認識して出力するオブジェクト認識部と、
前記複数のオブジェクト領域に紐づけられた学習用データを生成する学習データ生成部と、
前記複数のオブジェクト領域に紐づけられた、前記画像内に存在する前記動作主体の前記複数の部分の行動であって、前記複数のオブジェクト領域に紐づけられた行動を推論するための行動推論モデルを学習する行動判定モデル学習部と、
前記行動推論モデルを用いて推論された、前記複数のオブジェクト領域に紐づけられた行動を認識し、前記行動の特徴量である第1の特徴量を抽出するオブジェクト認識・熟練行動特徴抽出部と、
前記第1の特徴量を強調した第2の特徴量を生成するグラフ-オブジェクト特徴抽出部と、
前記画像が前記学習用データであるときにおける前記第2の特徴量に基づいて、前記学習モデルを生成するグラフモデル学習部と、
を有することを特徴とする機械学習装置。 - 画像内の動作主体の行動の熟練度を推論するための学習モデルを学習する機械学習装置であって、
ユーザの入力操作に基づいて、前記動作主体の複数の部分に対応する複数のノードと前記複数のノードの間の関係性を示す情報とで構成されるグラフを取得するグラフ入力部と、
前記グラフ入力部で取得された前記グラフを記憶する記憶部と、
前記複数のノードに対応する複数のオブジェクトが存在する、前記画像内における複数のオブジェクト領域を認識して出力するオブジェクト認識部と、
前記画像内に存在する前記動作主体の前記複数の部分の行動の特徴量である第1の特徴量を抽出する熟練行動特徴抽出部と、
前記複数のオブジェクト領域及び前記第1の特徴量に基づいて、前記複数のオブジェクト領域のいずれかに重なる着目領域を生成し、前記着目領域をヒートマップとして出力する着目領域生成部と、
前記ヒートマップに基づいて、前記グラフ入力部から入力される前記グラフの候補を前記ユーザに提示するための情報を生成するグラフ候補生成部と、
前記着目領域について前記第1の特徴量を強調した第2の特徴量を生成するグラフ-オブジェクト特徴抽出部と、
前記画像が予め収集された学習用データであるときにおける前記第2の特徴量に基づいて、前記学習モデルを生成するグラフモデル学習部と、
を有することを特徴とする機械学習装置。 - 前記動作主体は、人であり、
前記複数の部分は、前記人の複数の身体部位を含む
ことを特徴とする請求項1から4のいずれか1項に記載の機械学習装置。 - 前記動作主体は、人の身体の部位の動きに連動して動く機構であり、
前記複数の部分は、前記機構の複数の部分である
ことを特徴とする請求項1から4のいずれか1項に記載の機械学習装置。 - 前記複数のノードの間の関係性を示す前記情報は、有向エッジである
ことを特徴とする請求項1から6のいずれか1項に記載の機械学習装置。 - 前記複数のノードの間の関係性を示す前記情報は、前記複数の部分の各々の動きを示す情報を含む
ことを特徴とする請求項1から6のいずれか1項に記載の機械学習装置。 - 請求項1から8のいずれか1項に記載の機械学習装置と、
前記熟練行動特徴抽出部に入力される前記画像が推論対象の画像であるときにおける前記第2の特徴量に基づいて、前記動作主体の行動の熟練度を推論する前記学習モデルと、
を有することを特徴とする熟練行動判定装置。 - 画像内の動作主体の行動の熟練度を推論するための学習モデルを学習する機械学習装置によって実施される機械学習方法であって、
前記画像内に存在する前記動作主体の複数の部分の行動の特徴量である第1の特徴量を抽出するステップと、
ユーザの入力操作に基づいて、前記動作主体の前記複数の部分に対応する複数のノードと前記複数のノードの間の関係性を示す情報とで構成されるグラフを取得し、前記グラフを記憶するステップと、
前記複数のノードに対応する複数のオブジェクトが存在する、前記画像内における複数のオブジェクト領域を認識して出力するステップと、
前記第1の特徴量に基づいて前記画像内における着目領域を生成するステップと、
前記着目領域と前記オブジェクト領域とが重なる領域について前記第1の特徴量を強調した第2の特徴量を生成するステップと、
前記画像が予め収集された学習用データであるときにおける前記第2の特徴量に基づいて、前記学習モデルを生成するステップと、
を有することを特徴とする機械学習方法。 - 画像内の動作主体の行動の熟練度を推論するための学習モデルを学習するコンピュータに、
前記画像内に存在する前記動作主体の複数の部分の行動の特徴量である第1の特徴量を抽出するステップと、
ユーザの入力操作に基づいて、前記動作主体の前記複数の部分に対応する複数のノードと前記複数のノードの間の関係性を示す情報とで構成されるグラフを取得し、前記グラフを記憶するステップと、
前記複数のノードに対応する複数のオブジェクトが存在する、前記画像内における複数のオブジェクト領域を認識して出力するステップと、
前記第1の特徴量に基づいて前記画像内における着目領域を生成するステップと、
前記着目領域と前記オブジェクト領域とが重なる領域について前記第1の特徴量を強調した第2の特徴量を生成するステップと、
前記画像が予め収集された学習用データであるときにおける前記第2の特徴量に基づいて、前記学習モデルを生成するステップと、
を実行させることを特徴とする機械学習プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2022/004364 WO2023148909A1 (ja) | 2022-02-04 | 2022-02-04 | 機械学習装置、熟練行動判定装置、機械学習方法、及び機械学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2023148909A1 JPWO2023148909A1 (ja) | 2023-08-10 |
JP7387069B1 true JP7387069B1 (ja) | 2023-11-27 |
Family
ID=87553402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023532819A Active JP7387069B1 (ja) | 2022-02-04 | 2022-02-04 | 機械学習装置、熟練行動判定装置、機械学習方法、及び機械学習プログラム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7387069B1 (ja) |
TW (1) | TW202333089A (ja) |
WO (1) | WO2023148909A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009048098A (ja) * | 2007-08-22 | 2009-03-05 | Fujitsu Ltd | スキル測定プログラム、該プログラムを記録したコンピュータに読み取り可能な記録媒体、スキル測定装置、およびスキル測定方法 |
JP2021077230A (ja) * | 2019-11-12 | 2021-05-20 | オムロン株式会社 | 動作認識装置、動作認識方法、動作認識プログラム及び動作認識システム |
CN113239897A (zh) * | 2021-06-16 | 2021-08-10 | 石家庄铁道大学 | 基于时空特征组合回归的人体动作评价方法 |
JP2021135898A (ja) * | 2020-02-28 | 2021-09-13 | 富士通株式会社 | 行動認識方法、行動認識プログラム及び行動認識装置 |
JP2021163293A (ja) * | 2020-04-01 | 2021-10-11 | 株式会社デンソーウェーブ | 作業分析装置及び作業分析プログラム |
-
2022
- 2022-02-04 WO PCT/JP2022/004364 patent/WO2023148909A1/ja active Application Filing
- 2022-02-04 JP JP2023532819A patent/JP7387069B1/ja active Active
- 2022-07-26 TW TW111127906A patent/TW202333089A/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009048098A (ja) * | 2007-08-22 | 2009-03-05 | Fujitsu Ltd | スキル測定プログラム、該プログラムを記録したコンピュータに読み取り可能な記録媒体、スキル測定装置、およびスキル測定方法 |
JP2021077230A (ja) * | 2019-11-12 | 2021-05-20 | オムロン株式会社 | 動作認識装置、動作認識方法、動作認識プログラム及び動作認識システム |
JP2021135898A (ja) * | 2020-02-28 | 2021-09-13 | 富士通株式会社 | 行動認識方法、行動認識プログラム及び行動認識装置 |
JP2021163293A (ja) * | 2020-04-01 | 2021-10-11 | 株式会社デンソーウェーブ | 作業分析装置及び作業分析プログラム |
CN113239897A (zh) * | 2021-06-16 | 2021-08-10 | 石家庄铁道大学 | 基于时空特征组合回归的人体动作评价方法 |
Also Published As
Publication number | Publication date |
---|---|
TW202333089A (zh) | 2023-08-16 |
JPWO2023148909A1 (ja) | 2023-08-10 |
WO2023148909A1 (ja) | 2023-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020224403A1 (zh) | 分类任务模型的训练方法、装置、设备及存储介质 | |
CN109670474B (zh) | 一种基于视频的人体姿态估计方法、装置及设备 | |
JP7274048B2 (ja) | 動作認識方法、装置、コンピュータプログラム及びコンピュータデバイス | |
Kuncheva et al. | PCA feature extraction for change detection in multidimensional unlabeled data | |
Raheja et al. | Robust gesture recognition using Kinect: A comparison between DTW and HMM | |
Guo et al. | Sparse adaptive graph convolutional network for leg agility assessment in Parkinson’s disease | |
CN112506340B (zh) | 设备控制方法、装置、电子设备及存储介质 | |
JP6835218B2 (ja) | 群衆状態認識装置、学習方法および学習プログラム | |
Huang et al. | Deepfinger: A cascade convolutional neuron network approach to finger key point detection in egocentric vision with mobile camera | |
Krejov et al. | Multi-touchless: Real-time fingertip detection and tracking using geodesic maxima | |
CN107357414B (zh) | 一种点击动作的识别方法及点击动作识别装置 | |
Wang et al. | Immersive human–computer interactive virtual environment using large-scale display system | |
Hardegger et al. | Enhancing action recognition through simultaneous semantic mapping from body-worn motion sensors | |
Adhikari et al. | A Novel Machine Learning-Based Hand Gesture Recognition Using HCI on IoT Assisted Cloud Platform. | |
Zhou et al. | A study on attention-based LSTM for abnormal behavior recognition with variable pooling | |
KR20230080938A (ko) | 컨볼루션 블록 어텐션 모듈을 이용한 동작 인식 및 분류 방법 및 장치 | |
Michel et al. | Gesture recognition supporting the interaction of humans with socially assistive robots | |
Abdulhamied et al. | Real-time recognition of American sign language using long-short term memory neural network and hand detection | |
Ehsani et al. | Object manipulation via visual target localization | |
Firouznia et al. | Adaptive chaotic sampling particle filter to handle occlusion and fast motion in visual object tracking | |
JP7387069B1 (ja) | 機械学習装置、熟練行動判定装置、機械学習方法、及び機械学習プログラム | |
KR102542683B1 (ko) | 손 추적 기반 행위 분류 방법 및 장치 | |
JP7254262B2 (ja) | 作業推定装置、作業推定方法、及び、作業推定プログラム | |
Le et al. | Accurate continuous action and gesture recognition method based on skeleton and sliding windows techniques | |
Waichal et al. | Survey paper on Hand Gesture Recognition Based Virtual Mouse |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230530 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231017 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7387069 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |