JPWO2022162782A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2022162782A5
JPWO2022162782A5 JP2022577874A JP2022577874A JPWO2022162782A5 JP WO2022162782 A5 JPWO2022162782 A5 JP WO2022162782A5 JP 2022577874 A JP2022577874 A JP 2022577874A JP 2022577874 A JP2022577874 A JP 2022577874A JP WO2022162782 A5 JPWO2022162782 A5 JP WO2022162782A5
Authority
JP
Japan
Prior art keywords
hidden
supervised
action
model
supervised data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022577874A
Other languages
English (en)
Other versions
JPWO2022162782A1 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/JP2021/002817 external-priority patent/WO2022162782A1/ja
Publication of JPWO2022162782A1 publication Critical patent/JPWO2022162782A1/ja
Publication of JPWO2022162782A5 publication Critical patent/JPWO2022162782A5/ja
Pending legal-status Critical Current

Links

Claims (7)

  1. 各々が人の動作の種類を状態とする複数の第1隠れマルコフモデルを含む第2隠れマルコフモデルを複数含む隠れセミマルコフモデルであって、複数の第2隠れマルコフモデルの各々が複数の前記動作を組み合わせて定まる行動を状態とする隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習する観測確率学習部と、
    前記観測確率学習部にて学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習する遷移確率学習部と、
    前記観測確率学習部で学習した前記観測確率及び前記遷移確率学習部で学習した前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する構築部と、
    を含み、
    前記遷移確率学習部は、前記第1教師ありデータに、時間方向のオーバーサンプリング及び特徴空間上のオーバーサンプリングの少なくとも一方を行うことで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しする、
    行動区間推定モデル構築装置。
  2. 前記時間方向のオーバーサンプリングは、各時刻でランダムに設定されたオリジナルパラメータを減衰させながら前後の時刻に伝播し、
    各時刻において、前記オリジナルパラメータ、前後の時刻から伝播されたパラメータの内、最大のパラメータの時刻に対応する前記動作の特徴値を前記各時刻の特徴値として選択する、
    請求項1に記載の行動区間推定モデル構築装置。
  3. 前記オリジナルパラメータは、所定数離れた時刻で0となるように減衰される、
    請求項2に記載の行動区間推定モデル構築装置。
  4. 前記特徴空間上のオーバーサンプリングは、前記第1教師ありデータに、動作を行う人の身体部位ごとの速度に関連するノイズを前記身体部位ごとの前記動作の特徴値に付加する、
    請求項1~請求項3の何れか1項に記載の行動区間推定モデル構築装置。
  5. 前記身体部位ごとの速度に関連するノイズの大きさは、前記身体部位ごとの角速度の各々が大きいほど大きい、
    請求項4に記載の行動区間推定モデル構築装置。
  6. 各々が人の動作の種類を状態とする複数の第1隠れマルコフモデルを含む第2隠れマルコフモデルを複数含む隠れセミマルコフモデルであって、複数の第2隠れマルコフモデルの各々が複数の前記動作を組み合わせて定まる行動を状態とする隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
    学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習し、
    学習した前記観測確率及び前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
    行動区間推定モデル構築方法であって、
    前記第1教師ありデータに、時間方向のオーバーサンプリング及び特徴空間上のオーバーサンプリングの少なくとも一方を行うことで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しする、
    行動区間推定モデル構築方法。
  7. 各々が人の動作の種類を状態とする複数の第1隠れマルコフモデルを含む第2隠れマルコフモデルを複数含む隠れセミマルコフモデルであって、複数の第2隠れマルコフモデルの各々が複数の前記動作を組み合わせて定まる行動を状態とする隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
    学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習し、
    学習した前記観測確率及び前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
    処理であって、
    前記第1教師ありデータに、時間方向のオーバーサンプリング及び特徴空間上のオーバーサンプリングの少なくとも一方を行うことで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しする、
    処理をコンピュータに実行させる行動区間推定モデル構築プログラム。
JP2022577874A 2021-01-27 2021-01-27 Pending JPWO2022162782A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/002817 WO2022162782A1 (ja) 2021-01-27 2021-01-27 行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム

Publications (2)

Publication Number Publication Date
JPWO2022162782A1 JPWO2022162782A1 (ja) 2022-08-04
JPWO2022162782A5 true JPWO2022162782A5 (ja) 2023-09-22

Family

ID=82653119

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022577874A Pending JPWO2022162782A1 (ja) 2021-01-27 2021-01-27

Country Status (4)

Country Link
US (1) US20230343142A1 (ja)
EP (1) EP4287078A4 (ja)
JP (1) JPWO2022162782A1 (ja)
WO (1) WO2022162782A1 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7146247B2 (ja) * 2018-09-03 2022-10-04 国立大学法人 東京大学 動作認識方法及び装置

Similar Documents

Publication Publication Date Title
JP6605259B2 (ja) ニューラルネットワーク構造拡張方法、次元縮小方法、及びその方法を用いた装置
JP6614981B2 (ja) ニューラルネットワークの学習方法及び装置、及び認識方法及び装置
Jeerige et al. Comparison of deep reinforcement learning approaches for intelligent game playing
KR102239714B1 (ko) 신경망 학습 방법 및 장치, 데이터 처리 장치
Jena et al. Augmenting gail with bc for sample efficient imitation learning
KR20180045635A (ko) 뉴럴 네트워크 간소화 방법 및 장치
CN111144580A (zh) 一种基于模仿学习的层级强化学习训练方法和装置
Lanka et al. Archer: Aggressive rewards to counter bias in hindsight experience replay
Chaput The constructivist learning architecture: A model of cognitive development for robust autonomous robots
WO2021080793A1 (en) Providing automated user input to an application during a disruption
KR20200020545A (ko) 전자 장치 및 그 제어 방법
KR20190099930A (ko) 완전 연결 네트워크의 데이터 입력 및 출력을 제어하는 방법 및 장치
WO2023231961A1 (zh) 一种多智能体强化学习方法及相关装置
KR20230122619A (ko) 적응형 오디오 믹싱
Dambekodi et al. Playing text-based games with common sense
Muñoz et al. Hardware opposition-based PSO applied to mobile robot controllers
KR20230044976A (ko) 학습 기반 사용자 맞춤형 인지 모델을 이용하여, 인지검사 태스크를 대체 수행하는 인지모델 기반의 인지 상태 평가 장치 및 그 동작 방법
Khrennikov et al. Automaton model of protein: dynamics of conformational and functional states
Sukthankar et al. An introduction to plan, activity, and intent recognition
Luger et al. From Alan Turing to modern AI: practical solutions and an implicit epistemic stance
JPWO2022162782A5 (ja)
Castro-Garcia et al. Emergent multilingual language acquisition using developmental networks
US10984637B2 (en) Haptic control interface for detecting content features using machine learning to induce haptic effects
Zuo et al. Off-policy adversarial imitation learning for robotic tasks with low-quality demonstrations
JPWO2022162780A5 (ja)