JPWO2022162782A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2022162782A5 JPWO2022162782A5 JP2022577874A JP2022577874A JPWO2022162782A5 JP WO2022162782 A5 JPWO2022162782 A5 JP WO2022162782A5 JP 2022577874 A JP2022577874 A JP 2022577874A JP 2022577874 A JP2022577874 A JP 2022577874A JP WO2022162782 A5 JPWO2022162782 A5 JP WO2022162782A5
- Authority
- JP
- Japan
- Prior art keywords
- hidden
- supervised
- action
- model
- supervised data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Claims (7)
- 各々が人の動作の種類を状態とする複数の第1隠れマルコフモデルを含む第2隠れマルコフモデルを複数含む隠れセミマルコフモデルであって、複数の第2隠れマルコフモデルの各々が複数の前記動作を組み合わせて定まる行動を状態とする隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習する観測確率学習部と、
前記観測確率学習部にて学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習する遷移確率学習部と、
前記観測確率学習部で学習した前記観測確率及び前記遷移確率学習部で学習した前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する構築部と、
を含み、
前記遷移確率学習部は、前記第1教師ありデータに、時間方向のオーバーサンプリング及び特徴空間上のオーバーサンプリングの少なくとも一方を行うことで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しする、
行動区間推定モデル構築装置。 - 前記時間方向のオーバーサンプリングは、各時刻でランダムに設定されたオリジナルパラメータを減衰させながら前後の時刻に伝播し、
各時刻において、前記オリジナルパラメータ、前後の時刻から伝播されたパラメータの内、最大のパラメータの時刻に対応する前記動作の特徴値を前記各時刻の特徴値として選択する、
請求項1に記載の行動区間推定モデル構築装置。 - 前記オリジナルパラメータは、所定数離れた時刻で0となるように減衰される、
請求項2に記載の行動区間推定モデル構築装置。 - 前記特徴空間上のオーバーサンプリングは、前記第1教師ありデータに、動作を行う人の身体部位ごとの速度に関連するノイズを前記身体部位ごとの前記動作の特徴値に付加する、
請求項1~請求項3の何れか1項に記載の行動区間推定モデル構築装置。 - 前記身体部位ごとの速度に関連するノイズの大きさは、前記身体部位ごとの角速度の各々が大きいほど大きい、
請求項4に記載の行動区間推定モデル構築装置。 - 各々が人の動作の種類を状態とする複数の第1隠れマルコフモデルを含む第2隠れマルコフモデルを複数含む隠れセミマルコフモデルであって、複数の第2隠れマルコフモデルの各々が複数の前記動作を組み合わせて定まる行動を状態とする隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習し、
学習した前記観測確率及び前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
行動区間推定モデル構築方法であって、
前記第1教師ありデータに、時間方向のオーバーサンプリング及び特徴空間上のオーバーサンプリングの少なくとも一方を行うことで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しする、
行動区間推定モデル構築方法。 - 各々が人の動作の種類を状態とする複数の第1隠れマルコフモデルを含む第2隠れマルコフモデルを複数含む隠れセミマルコフモデルであって、複数の第2隠れマルコフモデルの各々が複数の前記動作を組み合わせて定まる行動を状態とする隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習し、
学習した前記観測確率及び前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
処理であって、
前記第1教師ありデータに、時間方向のオーバーサンプリング及び特徴空間上のオーバーサンプリングの少なくとも一方を行うことで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しする、
処理をコンピュータに実行させる行動区間推定モデル構築プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/002817 WO2022162782A1 (ja) | 2021-01-27 | 2021-01-27 | 行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2022162782A1 JPWO2022162782A1 (ja) | 2022-08-04 |
JPWO2022162782A5 true JPWO2022162782A5 (ja) | 2023-09-22 |
Family
ID=82653119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022577874A Pending JPWO2022162782A1 (ja) | 2021-01-27 | 2021-01-27 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230343142A1 (ja) |
EP (1) | EP4287078A4 (ja) |
JP (1) | JPWO2022162782A1 (ja) |
WO (1) | WO2022162782A1 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7146247B2 (ja) * | 2018-09-03 | 2022-10-04 | 国立大学法人 東京大学 | 動作認識方法及び装置 |
-
2021
- 2021-01-27 JP JP2022577874A patent/JPWO2022162782A1/ja active Pending
- 2021-01-27 WO PCT/JP2021/002817 patent/WO2022162782A1/ja active Application Filing
- 2021-01-27 EP EP21922806.1A patent/EP4287078A4/en active Pending
-
2023
- 2023-06-26 US US18/341,583 patent/US20230343142A1/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6605259B2 (ja) | ニューラルネットワーク構造拡張方法、次元縮小方法、及びその方法を用いた装置 | |
JP6614981B2 (ja) | ニューラルネットワークの学習方法及び装置、及び認識方法及び装置 | |
Jeerige et al. | Comparison of deep reinforcement learning approaches for intelligent game playing | |
KR102239714B1 (ko) | 신경망 학습 방법 및 장치, 데이터 처리 장치 | |
Jena et al. | Augmenting gail with bc for sample efficient imitation learning | |
KR20180045635A (ko) | 뉴럴 네트워크 간소화 방법 및 장치 | |
CN111144580A (zh) | 一种基于模仿学习的层级强化学习训练方法和装置 | |
Lanka et al. | Archer: Aggressive rewards to counter bias in hindsight experience replay | |
Chaput | The constructivist learning architecture: A model of cognitive development for robust autonomous robots | |
WO2021080793A1 (en) | Providing automated user input to an application during a disruption | |
KR20200020545A (ko) | 전자 장치 및 그 제어 방법 | |
KR20190099930A (ko) | 완전 연결 네트워크의 데이터 입력 및 출력을 제어하는 방법 및 장치 | |
WO2023231961A1 (zh) | 一种多智能体强化学习方法及相关装置 | |
KR20230122619A (ko) | 적응형 오디오 믹싱 | |
Dambekodi et al. | Playing text-based games with common sense | |
Muñoz et al. | Hardware opposition-based PSO applied to mobile robot controllers | |
KR20230044976A (ko) | 학습 기반 사용자 맞춤형 인지 모델을 이용하여, 인지검사 태스크를 대체 수행하는 인지모델 기반의 인지 상태 평가 장치 및 그 동작 방법 | |
Khrennikov et al. | Automaton model of protein: dynamics of conformational and functional states | |
Sukthankar et al. | An introduction to plan, activity, and intent recognition | |
Luger et al. | From Alan Turing to modern AI: practical solutions and an implicit epistemic stance | |
JPWO2022162782A5 (ja) | ||
Castro-Garcia et al. | Emergent multilingual language acquisition using developmental networks | |
US10984637B2 (en) | Haptic control interface for detecting content features using machine learning to induce haptic effects | |
Zuo et al. | Off-policy adversarial imitation learning for robotic tasks with low-quality demonstrations | |
JPWO2022162780A5 (ja) |