KR20220140178A - 강화학습모델을 이용한 보행 동작 정보 출력 방법 및 서비스 장치 - Google Patents
강화학습모델을 이용한 보행 동작 정보 출력 방법 및 서비스 장치 Download PDFInfo
- Publication number
- KR20220140178A KR20220140178A KR1020210046348A KR20210046348A KR20220140178A KR 20220140178 A KR20220140178 A KR 20220140178A KR 1020210046348 A KR1020210046348 A KR 1020210046348A KR 20210046348 A KR20210046348 A KR 20210046348A KR 20220140178 A KR20220140178 A KR 20220140178A
- Authority
- KR
- South Korea
- Prior art keywords
- character
- gait
- information
- motion
- state
- Prior art date
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 122
- 230000002787 reinforcement Effects 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000009471 action Effects 0.000 claims abstract description 54
- 238000003062 neural network model Methods 0.000 claims abstract description 23
- 230000005021 gait Effects 0.000 claims description 103
- 230000006399 behavior Effects 0.000 claims description 4
- 210000002414 leg Anatomy 0.000 description 16
- 210000001503 joint Anatomy 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 210000001624 hip Anatomy 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000013136 deep learning model Methods 0.000 description 5
- 210000002683 foot Anatomy 0.000 description 5
- 239000000470 constituent Substances 0.000 description 4
- 210000003127 knee Anatomy 0.000 description 4
- 210000004197 pelvis Anatomy 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 210000003423 ankle Anatomy 0.000 description 3
- 210000004394 hip joint Anatomy 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 210000000629 knee joint Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/23—Recognition of whole body movements, e.g. for sport training
- G06V40/25—Recognition of walking or running movements, e.g. gait recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
- G06V2201/033—Recognition of patterns in medical or anatomical images of skeletal patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Manipulator (AREA)
Abstract
Description
도 2는 보행 동작을 정의하는 유한 상태 기계의 예이다.
도 3은 캐릭터 특이적인 보행 파라미터를 도시한 예이다.
도 4는 컴퓨터 장치가 캐릭터의 보행 동작을 산출하는 과정에 대한 예이다
도 5는 보행 동작을 산출하는 컴퓨터 장치에 대한 예이다.
Claims (12)
- 컴퓨터 장치가 시점 t에서의 캐릭터의 상태 정보를 획득하는 단계;
상기 컴퓨터 장치가 상기 상태 정보를 사전에 구축한 신경망 모델에 입력하여 액션 정보를 생성하는 단계; 및
상기 컴퓨터 장치가 상기 시점 t에서의 상기 액션 정보를 상기 캐릭터 또는 상기 캐릭터의 동작을 출력하는 장치에 전달하는 단계를 포함하되,
상기 신경망 모델은 캐릭터의 보행 동작 상태를 포함하는 상기 상태 정보를 입력받아 강화 학습의 보상을 최대화하는 행동 정보를 결정하는 강화학습모델을 이용한 보행 동작 정보 출력 방법. - 제1항에 있어서,
상기 상태 정보는 상기 캐릭터에 특이적인 보행 동작 파라미터 및 스윙하는 다리의 식별자를 더 포함하고,
상기 보행 동작 파라미터는 상기 캐릭터의 걸음의 길이, 걸음의 소요 시간 및 스윙하는 발의 최대 높이를 포함하는 강화학습모델을 이용한 보행 동작 정보 출력 방법. - 제1항에 있어서,
상기 액션 정보는 스윙 업(swing up) 상태와 스윙 다운(swing down) 상태 각각에 대한 정보로 구성되고, 상기 액션 정보는 보행 동작을 정의하는 다리 관절들의 특정 각도를 포함하는 강화학습모델을 이용한 보행 동작 정보 출력 방법. - 제1항에 있어서,
상기 신경망 모델은
보행 동작을 정의하는 스윙 업(swing up) 상태와 스윙 다운(swing down) 상태 각각에 대하여 보행 동작을 정의하는 복수의 관절 부위의 회전 가용 범위를 기준으로 액션 정보를 출력하도록 학습되는 강화학습모델을 이용한 보행 동작 정보 출력 방법. - 제1항에 있어서,
상기 보상은 캐릭터에 대한 현재 보행 파리미터와 목표 보행 파라미터의 편차 교정, 캐릭터가 서 있는 상태를 유지하도록 교정, 캐릭터의 목표 진행 방향으로의 교정 및 보행에 관여하는 관절들의 토크값을 기준값 이하로 교정하는 항목을 포함하는 강화학습모델을 이용한 보행 동작 정보 출력 방법. - 제1항에 있어서,
상기 신경망 모델은 상기 캐릭터가 특정 시점에서 한 걸음에 소요되는 시간을 기준으로 조절된 상기 보상을 기준으로 학습되는 강화학습모델을 이용한 보행 동작 정보 출력 방법. - 시점 t에서의 캐릭터의 동작 정보를 입력받는 입력장치;
캐릭터의 보행에 대한 상태 정보를 기준으로 액션 정보를 출력하는 신경망 모델을 저장하는 저장장치; 및
상기 동작 정보를 포함하는 상태 정보를 상기 신경망 모델에 입력하여 액션 정보를 출력하고, 상기 출력된 액션 정보를 기준으로 상기 시점 t에서 상기 캐릭터의 보행 동작을 위한 제어 정보를 생성하는 연산장치를 포함하되,
상기 신경망 모델은 캐릭터의 보행 동작 상태를 포함하는 상기 상태 정보를 입력받아 강화 학습의 보상을 최대화하는 액션 정보를 결정하는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치. - 제7항에 있어서,
상기 상태 정보는 상기 캐릭터에 특이적인 보행 동작 파라미터 및 스윙하는 다리의 식별자를 더 포함하고,
상기 보행 동작 파라미터는 상기 캐릭터의 걸음의 길이, 걸음의 소요 시간 및 스윙하는 발의 최대 높이를 포함하는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치. - 제7항에 있어서,
상기 액션 정보는 스윙 업(swing up) 상태와 스윙 다운(swing down) 상태 각각에 대한 정보로 구성되고, 상기 액션 정보는 보행 동작을 정의하는 다리 관절들의 특정 각도를 포함하는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치. - 제7항에 있어서,
상기 신경망 모델은 보행 동작을 정의하는 스윙 업(swing up) 상태와 스윙 다운(swing down) 상태 각각에 대하여 보행 동작을 정의하는 복수의 관절 부위의 회전 가용 범위를 기준으로 액션 정보를 출력하도록 학습되는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치. - 제7항에 있어서,
상기 보상은 캐릭터에 대한 현재 보행 파리미터와 목표 보행 파라미터의 편차 교정, 캐릭터가 서 있는 상태를 유지하도록 교정, 캐릭터의 목표 진행 방향으로의 교정 및 보행에 관여하는 관절들의 토크값을 기준값 이하로 교정하는 항목을 포함하는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치. - 제7항에 있어서,
상기 신경망 모델은 상기 캐릭터가 특정 시점에서 한 걸음에 소요되는 시간을 기준으로 조절된 상기 보상을 기준으로 학습되는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210046348A KR102611126B1 (ko) | 2021-04-09 | 2021-04-09 | 강화학습모델을 이용한 보행 동작 정보 출력 방법 및 서비스 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210046348A KR102611126B1 (ko) | 2021-04-09 | 2021-04-09 | 강화학습모델을 이용한 보행 동작 정보 출력 방법 및 서비스 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220140178A true KR20220140178A (ko) | 2022-10-18 |
KR102611126B1 KR102611126B1 (ko) | 2023-12-06 |
Family
ID=83803517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210046348A KR102611126B1 (ko) | 2021-04-09 | 2021-04-09 | 강화학습모델을 이용한 보행 동작 정보 출력 방법 및 서비스 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102611126B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117555339A (zh) * | 2024-01-11 | 2024-02-13 | 科大讯飞股份有限公司 | 策略网络训练方法及人形双足机器人步态控制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070072314A (ko) * | 2005-12-31 | 2007-07-04 | 고려대학교 산학협력단 | 신경망을 이용하는 로봇의 자세 제어 방법 및 그 기록매체, 신경망을 이용하는 로봇의 자세 제어 장치 및 그장치를 구비한 로봇 |
KR100856824B1 (ko) | 2007-07-23 | 2008-09-05 | 재단법인서울대학교산학협력재단 | 캐릭터 시뮬레이션 방법 및 시스템 |
JP2018092653A (ja) * | 2018-02-19 | 2018-06-14 | 株式会社ドワンゴ | 情報処理装置、情報処理方法およびプログラム |
-
2021
- 2021-04-09 KR KR1020210046348A patent/KR102611126B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070072314A (ko) * | 2005-12-31 | 2007-07-04 | 고려대학교 산학협력단 | 신경망을 이용하는 로봇의 자세 제어 방법 및 그 기록매체, 신경망을 이용하는 로봇의 자세 제어 장치 및 그장치를 구비한 로봇 |
KR100856824B1 (ko) | 2007-07-23 | 2008-09-05 | 재단법인서울대학교산학협력재단 | 캐릭터 시뮬레이션 방법 및 시스템 |
JP2018092653A (ja) * | 2018-02-19 | 2018-06-14 | 株式会社ドワンゴ | 情報処理装置、情報処理方法およびプログラム |
Non-Patent Citations (2)
Title |
---|
Kang et al. * |
강규철, "심층강화학습을 이용한 유한 상태 기반 보행 제어기의 학습", 한양대학교(2020.02.) 1부.* * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117555339A (zh) * | 2024-01-11 | 2024-02-13 | 科大讯飞股份有限公司 | 策略网络训练方法及人形双足机器人步态控制方法 |
CN117555339B (zh) * | 2024-01-11 | 2024-04-26 | 科大讯飞股份有限公司 | 策略网络训练方法及人形双足机器人步态控制方法 |
Also Published As
Publication number | Publication date |
---|---|
KR102611126B1 (ko) | 2023-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jiang et al. | Synthesis of biologically realistic human motion using joint torque actuation | |
US11022983B2 (en) | Gait control method, device, and terminal device for biped robot | |
JP6227683B2 (ja) | アニメーション・キャラクターに合致する動きを得るためのロボットを開発および制御する方法。 | |
Kulić et al. | Anthropomorphic movement analysis and synthesis: A survey of methods and applications | |
Miura et al. | Human-like walking with toe supporting for humanoids | |
Li et al. | Gait planning and stability control of a quadruped robot | |
CN110764416A (zh) | 基于深度q网络的仿人机器人步态优化控制方法 | |
JP5118220B2 (ja) | 動作モデリング装置及び方法、並びにプログラム | |
Mummolo et al. | Passive and dynamic gait measures for biped mechanism: formulation and simulation analysis | |
CN112060075B (zh) | 步态生成网络的训练方法、训练设备以及存储介质 | |
Kim et al. | Dynamic motion planning of 3D human locomotion using gradient-based optimization | |
CN115128960A (zh) | 一种基于深度强化学习双足机器人运动控制方法及系统 | |
Kang et al. | Finite state machine-based motion-free learning of biped walking | |
Kry et al. | Modal locomotion: Animating virtual characters with natural vibrations | |
KR102611126B1 (ko) | 강화학습모델을 이용한 보행 동작 정보 출력 방법 및 서비스 장치 | |
Allen et al. | Evolved controllers for simulated locomotion | |
Petrič et al. | Reflexive stability control framework for humanoid robots | |
Klimina et al. | Three-Link Mechanism as a Model of a Person on a Swing | |
Elibol et al. | Power usage reduction of humanoid standing process using q-learning | |
Kavafoglu et al. | Style-based biped walking control | |
KR102580138B1 (ko) | 목표 위치로 이동하는 캐릭터의 동작 정보 생성 방법 및 컴퓨터 장치 | |
KR101635684B1 (ko) | 보행 동작 생성 및 제어 방법, 보행 컨트롤러 | |
Park et al. | Multi-segment foot modeling for human animation | |
Calderon et al. | Generating human-like soccer primitives from human data | |
Bao | Exploration of virtual human running based on CCD algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20210409 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230307 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230926 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20231204 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20231204 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |