KR101109568B1 - 행동유발성 확률모델을 이용한 로봇의 행동 선택 방법 - Google Patents
행동유발성 확률모델을 이용한 로봇의 행동 선택 방법 Download PDFInfo
- Publication number
- KR101109568B1 KR101109568B1 KR1020090031934A KR20090031934A KR101109568B1 KR 101109568 B1 KR101109568 B1 KR 101109568B1 KR 1020090031934 A KR1020090031934 A KR 1020090031934A KR 20090031934 A KR20090031934 A KR 20090031934A KR 101109568 B1 KR101109568 B1 KR 101109568B1
- Authority
- KR
- South Korea
- Prior art keywords
- behavior
- robot
- behavioral
- bayesian network
- skill
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0224—Process history based detection method, e.g. whereby history implies the availability of large amounts of data
- G05B23/024—Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Automation & Control Theory (AREA)
- Evolutionary Computation (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
Abstract
Description
Claims (7)
- 삭제
- 삭제
- 행동유발성 확률 모델을 이용한 로봇의 행동 선택 방법에 있어서,로봇이 임무 수행에 필요한 각 스킬에 관한 행동유발성을 각각 베이지안 네트워크로 생성하기 위해, 상기 로봇에 상기 행동유발성별로 상기 베이지안 네트워크를 구성하는 변수들을 선택, 입력하는 단계;상기 로봇이 상기 각 스킬을 동작하도록 제어하여, 상기 행동유발성별로 상기 베이지안 네트워크를 구성하는 상기 변수들과 관련된 학습데이터들을 센서를 통해 획득하는 단계;상기 로봇이 상기 학습데이터들을 상기 베이지안 네트워크에 적용하여 상기 행동유발성별로 상기 베이지안 네트워크의 확률모델을 개별적으로 생성하는 단계;상기 로봇에 임무 수행에 필요한 상기 행동유발성들을 순차적으로 입력 또는 선택하는 단계; 및상기 로봇이 상기 행동유발성들을 순차적으로 연결하기 위한 소프트 행동-동기 스위치를 상기 행동유발성들 각각에 연결하여 상기 스킬들을 생성하는 단계;상기 로봇이 상기 스킬들의 상기 소프트 행동-동기 스위치들을 연결하여 소프트 행동-동기 네트워크를 생성하는 단계를 포함하는 것을 특징으로 하는 행동 유발성 확률 모델을 이용한 로봇의 행동 선택 방법.
- 행동유발성 확률 모델을 이용한 로봇의 행동 선택 방법에 있어서,로봇이 임무 수행에 필요한 각 스킬에 관한 행동유발성을 각각 베이지안 네트워크로 생성하기 위해, 상기 로봇에 상기 행동유발성별로 상기 베이지안 네트워크를 구성하는 변수들을 선택, 입력하는 단계;상기 로봇이 상기 각 스킬을 동작하도록 제어하여, 상기 행동유발성별로 상기 베이지안 네트워크를 구성하는 상기 변수들과 관련된 학습데이터들을 센서를 통해 획득하는 단계;상기 로봇이 상기 학습데이터들을 상기 베이지안 네트워크에 적용하여 상기 행동유발성별로 상기 베이지안 네트워크의 확률모델을 개별적으로 생성하는 단계;상기 로봇이 상기 행동유발성들을 순차적으로 연결하기 위한 소프트 행동-동기 스위치를 상기 행동유발성들 각각에 연결하여 상기 스킬들을 생성하는 단계;상기 로봇에 임무 수행에 필요한 상기 스킬들을 순차적으로 입력 또는 선택하는 단계; 및상기 로봇이 상기 스킬들의 상기 소프트 행동-동기 스위치들을 연결하여 소프트 행동-동기 네트워크를 생성하는 단계를 포함하는 것을 특징으로 하는 행동 유발성 확률 모델을 이용한 로봇의 행동 선택 방법.
- 제3항 또는 제4항에 있어서, 상기 로봇의 행동 선택 방법은,상기 로봇이 아래 식 1 및 2를 이용하여 현재 인지된 정보와 상기 행동유발성을 가지고, 상기 스킬들의 행동을 평가하기 위한 2-튜플값을 산출하는 단계:[식 1][식 2](여기서, 여기서, zi는 인지에 연관된 변수들을 나타내고, A, ai는 행동에 연관된 변수들을 나타내며, ei는 결과에 연관된 변수를 나타내고, σ는 학습 데이터의 집합을 나타내며, π는 사전 지식(Preliminary Knowledge)을 의미하며, vi는 ith 스킬의 jth 행동을 사용한 확률적 분포에 의한 최대값이고, ai *는 ith 스킬에서 값을 최대화하기 위한 jth 행동임, Ti는 2-튜플 값을 의미함); 및아래 식 3을 이용하여 상기 2-튜플값에 기초하여 상기 스킬을 선택하는 단계를 더 포함하는 것을 특징으로 하는 행동 유발성 확률 모델을 이용한 로봇의 행동 선택 방법:[식 3]
- 제3항 또는 제4항에 있어서, 상기 로봇의 행동 선택 방법은,상기 베이지안 네트워크는 인지-행동-결과로 이루어진 구조를 갖고,상기 변수들은 상기 인지-행동-결과에 연관된 변수들인 것을 특징으로 하는 행동 유발성 확률 모델을 이용한 로봇의 행동 선택 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090031934A KR101109568B1 (ko) | 2009-04-13 | 2009-04-13 | 행동유발성 확률모델을 이용한 로봇의 행동 선택 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090031934A KR101109568B1 (ko) | 2009-04-13 | 2009-04-13 | 행동유발성 확률모델을 이용한 로봇의 행동 선택 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100113382A KR20100113382A (ko) | 2010-10-21 |
KR101109568B1 true KR101109568B1 (ko) | 2012-01-31 |
Family
ID=43132979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090031934A KR101109568B1 (ko) | 2009-04-13 | 2009-04-13 | 행동유발성 확률모델을 이용한 로봇의 행동 선택 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101109568B1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101919831B1 (ko) | 2012-01-11 | 2018-11-19 | 삼성전자주식회사 | 오브젝트 인식 장치, 분류 트리 학습 장치 및 그 동작 방법 |
US9984099B2 (en) | 2012-08-30 | 2018-05-29 | Research & Business Foundation Sungkyunkwan University | System and method using affordance feature repository |
CN107631238B (zh) * | 2017-09-22 | 2019-06-25 | 武汉科技大学 | 一种仿萤火虫同步发光群体机器人及其同步发光方法 |
KR102174431B1 (ko) * | 2018-11-30 | 2020-11-04 | 아주대학교 산학협력단 | 자가 적응 시스템의 목표를 달성하기 위한 방법 및 장치 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060072597A (ko) * | 2004-12-23 | 2006-06-28 | 한국전자통신연구원 | 가변 우선순위 기반의 로봇 행동선택 구조 및 그 방법 |
-
2009
- 2009-04-13 KR KR1020090031934A patent/KR101109568B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060072597A (ko) * | 2004-12-23 | 2006-06-28 | 한국전자통신연구원 | 가변 우선순위 기반의 로봇 행동선택 구조 및 그 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20100113382A (ko) | 2010-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sewak | Deep reinforcement learning | |
Barreto et al. | The option keyboard: Combining skills in reinforcement learning | |
Everitt et al. | Reward tampering problems and solutions in reinforcement learning: A causal influence diagram perspective | |
Chitnis et al. | Guided search for task and motion plans using learned heuristics | |
Lison | A hybrid approach to dialogue management based on probabilistic rules | |
García-Martínez et al. | An integrated approach of learning, planning, and execution | |
Van Otterlo | A survey of reinforcement learning in relational domains | |
KR101109568B1 (ko) | 행동유발성 확률모델을 이용한 로봇의 행동 선택 방법 | |
US20230144995A1 (en) | Learning options for action selection with meta-gradients in multi-task reinforcement learning | |
Sridharan et al. | A refinement-based architecture for knowledge representation and reasoning in robotics | |
Yalciner et al. | Hybrid conditional planning using answer set programming | |
Ahmed et al. | Deep reinforcement learning for multi-agent interaction | |
Claßen | Planning and verification in the agent language Golog | |
Zhang et al. | Performance guaranteed human-robot collaboration with POMDP supervisory control | |
Baldassarre | Planning with neural networks and reinforcement learning | |
Smart et al. | Reinforcement learning for robot control | |
Brunskill et al. | Provably efficient learning with typed parametric models | |
Anas et al. | Comparison of deep Q-learning, Q-learning and SARSA reinforced learning for robot local navigation | |
Davoodabadi Farahani et al. | Acquiring reusable skills in intrinsically motivated reinforcement learning | |
Tenorio-González et al. | Automatic discovery of concepts and actions | |
Grzes | Improving exploration in reinforcement learning through domain knowledge and parameter analysis | |
Hawes et al. | Architecture and representations | |
Beernaert et al. | Framing the concept of autonomy in system design | |
WO2020117358A2 (en) | Systems and methods for operating robots using object-oriented partially observable markov decision processes | |
Osterdiekhoff | Incorporating Sense of Control in Dynamic Multi-tasking Problems: A Model-based Hierarchical Reinforcement Learning Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150507 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151214 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170102 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190102 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20200102 Year of fee payment: 9 |