KR101977274B1 - 자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치 - Google Patents

자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치 Download PDF

Info

Publication number
KR101977274B1
KR101977274B1 KR1020170184593A KR20170184593A KR101977274B1 KR 101977274 B1 KR101977274 B1 KR 101977274B1 KR 1020170184593 A KR1020170184593 A KR 1020170184593A KR 20170184593 A KR20170184593 A KR 20170184593A KR 101977274 B1 KR101977274 B1 KR 101977274B1
Authority
KR
South Korea
Prior art keywords
autonomous robot
hidden markov
framework
markov model
states
Prior art date
Application number
KR1020170184593A
Other languages
English (en)
Inventor
이상형
이제희
조남준
박영빈
서일홍
Original Assignee
한국생산기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생산기술연구원 filed Critical 한국생산기술연구원
Priority to KR1020170184593A priority Critical patent/KR101977274B1/ko
Application granted granted Critical
Publication of KR101977274B1 publication Critical patent/KR101977274B1/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed

Abstract

본 발명은 자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치에 관한 것이다.
본 발명의 일 실시예에 따르면, 자율 로봇을 위한 프레임 워크를 설정하기 위하여, (a) 은닉 마르코프 모델을 이용하여 시연자의 시연 정보를 모델링하는 단계, (b) 자율 로봇의 타겟 상황에 대한 태스크 계획을 수립하기 위해 PDDL(Planning Domain Definition Language)를 이용하여 도메인(Domain) 데이터와 문제(Problem) 데이터를 생성하는 단계, (c) 상기 도메인 데이터 및 상기 문제 데이터를 이용하여 명목상 계획(Norminal Plan)을 수립하는 단계 및 (d) 반응적 행동 선택에 따라 행동을 선택하여 수행하는 단계를 포함하는, 자율 로봇을 위한 프레임 워크 설정 방법을 제공한다.

Description

자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치{FRAMEWORK SETTING METHOD FOR AUTONOMOUS ROBOT AND DIGITAL CONTROL DEVICE}
본 발명은 자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치에 관한 것이다.
로봇은 일련의 기본 동작을 순차적으로 실행하여 작업을 수행한다. 그러므로, 자율 로봇은 원시 행동과 시퀀스를 표현할 수 있어야 하며 목표와 현재 상황에 따라 순차적으로 원시 행동을 수행해야 한다.
또한, 자율 로봇은 주어진 태스크를 완수하기 위해서 주변 상황을 인식하고, 주변 상황 및 태스크의 목표에 맞게 행동을 선택하고, 선택된 행동을 수행하기 위한 로봇 경로를 생성할 수 있어야 한다.
그러나, 종래에는 자율 로봇의 동작과 관련하여 행동 경로를 학습하는 방법, 태스크 계획을 수립하는 방법, 주변 상황 및 태스크의 목적에 맞는 행동을 선택하는 방법을 개별적으로 제시해왔다.
따라서, 자율로봇이 효과적으로 태스크를 완수하기 위하여 개별적으로 제시된 방법들을 통합할 수 있는 방안이 요구된다.
또한, 종래의 자율 로봇은 작업을 수행하기 위해서 로봇 프로그래머가 작업 프로그램을 손수 작성해 주어야 하는 불편함을 갖고 있었다.
한국 등록특허공보 제10-1577711호(2015.12.09.)
본 발명은 확률적 로봇 경로 학습 방법, 부호적 태스크 계획 방법 및 이들을 연결하여 현재 상황 및 태스크의 목표에 맞게 반응적 행동 선택을 할 수 있는 통합 소프트웨어 플랫폼의 구조를 갖는 자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치를 제공하는 것이다.
본 발명의 일 실시예에 따르면, 자율 로봇을 위한 프레임 워크를 설정하기 위하여, (a) 은닉 마르코프 모델을 이용하여 시연자의 시연 정보를 모델링하는 단계, (b) 자율 로봇의 타겟 상황에 대한 태스크 계획을 수립하기 위해 PDDL(Planning Domain Definition Language)를 이용하여 도메인(Domain) 데이터와 문제(Problem) 데이터를 생성하는 단계, (c) 상기 도메인 데이터 및 상기 문제 데이터를 이용하여 명목상 계획(Nominal Plan)을 수립하는 단계 및 (d) 반응적 행동 선택에 따라 행동을 선택하여 수행하는 단계를 포함하는, 자율 로봇을 위한 프레임 워크 설정 방법을 제공한다.
또한, 상기 (a) 단계에서는, 시연자가 시연하는 동작을 학습하도록 시연 정보를 동작 경로로 입력받아 상기 은닉 마르코프 모델을 이용하여 하위 목표를 자동으로 설정할 수 있다.
또한, 상기 (a) 단계에서는, 시연자에 의한 복수의 시연 정보를 복수의 은닉 마르코프 모델로 모델링하되, 상기 복수의 은닉 마르코프 모델 각각의 스테이트의 파라미터를 비교하여 스테이트를 결합하거나 분리하여 모델링할 수 있다.
또한, 상기 (a) 단계에서는, 상기 은닉 마르코프 모델의 스테이트를 시간 파라미터 및 공간 파라미터로 구성된 가우시안 혼합 모델의 분산값으로 나타내고, 시간 및 공간 파라미터 분산값으로부터 시간 엔트로피 및 공간 엔트로피를 계산하여 스테이트의 결합 또는 분리를 위한 중요도를 검출할 수 있다.
또한, 상기 (a) 단계에서는, i번째 은닉 마르코프 모델의 첫번째 스테이트의 중요도와, i+1번째 은닉 마르코프 모델의 첫번째 스테이트의 중요도가
Figure 112017131310809-pat00001
의 수학식을 만족할 경우 두 개의 은닉 마르코프 모델의 스테이트를 결합시킬 수 있다.
또한, 상기 (c) 단계에서는, 상기 은닉 마르코프 모델이 배치되는 순서를 결정할 수 있다.
또한, 상기 (d) 단계에서는, 자율 로봇이 동시에 인식된 두가지 스테이트 중 타겟 상황에 가까운 스테이트를 선택하도록 반영된 확률값에 따라 행동을 선택할 수 있다.
또한, 상기 (d) 단계에서는, 복수의 은닉 마르코프 모델 각각에서 출력되는 확률값 중 가장 높은 값을 갖는 은닉 마르코프 모델을 선택하고, 선택된 은닉 마르코프 모델로부터 자율 로봇의 행동을 수행할 수 있다.
본 발명에 따르면, 자율 로봇은 별도의 작업 프로그램의 작성 절차 없이 시연자의 시연으로부터 작업 프로그램을 스스로 생성할 수 있고, 생성된 작업 프로그램을 통해 로봇은 주변 환경 변화 및 주어진 태스크에 따라 적절하게 행동을 선택하고 선택된 행동을 수행할 수 있다.
또한, 본 발명은 확률적 모델링에서 시간 엔트로피 및 공간 엔트로피로 계산된 중요도를 이용하여 스테이트의 파라미터를 결합하거나 분리시킴으로써 오버피팅 현상을 방지할 수 있다.
도 1은 본 발명의 일 실시예에 따른 자율 로봇을 위한 프레임 워크 설정 방법을 나타내는 순서도이다.
도 2 및 도 3은 HMM 스테이트의 결합 또는 분리를 설명하기 위한 도면들이다.
도 4는 자율 로봇이 컵에 티백을 넣는 과정을 보여주는 예제이다.
도 5는 HMM과 PDDL 기반의 명목상 계획을 결합한 행동 선택 매커니즘을 설명하는 도면이다.
이하에서는, 본 발명의 바람직한 실시예에 기초하여 본 발명을 보다 구체적으로 설명한다. 그러나, 하기 실시예는 본 발명의 이해를 돕기 위한 일 예에 불과한 것으로 이에 의해 본 발명의 권리범위가 축소되거나 한정되는 것은 아니다.
도 1은 본 발명의 일 실시예에 따른 자율 로봇을 위한 프레임 워크 설정 방법을 나타내는 순서도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 자율 로봇을 위한 프레임 워크 설정 방법은 은닉 마르코프 모델(Hidden Markov Model: 이하, HMM)을 이용하여 시연자의 시연 정보를 모델링하는 단계(S100), 자율 로봇의 타겟 상황에 대한 태스크 계획을 수립하기 위해 PDDL(Planning Domain Definition Language)를 이용하여 도메인(Domain) 데이터와 문제(Problem) 데이터를 생성하는 단계(S200), 도메인 데이터 및 문제 데이터를 이용하여 명목상 계획(Norminal Plan)을 수립하는 단계(S300), 및 반응적 행동 선택에 따라 행동을 선택하여 수행하는 단계(S400)를 포함할 수 있다.
단계 S100에서는, 시연자가 시연하는 동작을 학습하도록 시연 정보를 동작 경로(motion trajectory)로 입력받아 HMM을 이용하여 하위 목표(subgoal)를 자동으로 설정할 수 있다. 여기서, HMM은 확률적 접근 방법으로서, 다양한 상황에서 여러번 시연이 발생할 경우 시연의 다양성을 고려하는 장점을 갖는다. 또한, HMM은 자율 로봇의 현재 상황을 확률적으로 인식하고, 인식된 상황에서 자율 로봇의 동작 경로를 설정하는데 사용될 수 있다.
또한, 단계 S100에서는, 시연자에 의한 복수의 시연 정보를 입력받을 수 있으며, 복수의 시연 정보 각각을 복수의 HMM으로 모델링할 수 있다.
이때, 자율 로봇의 동작 경로는 HMM의 스테이트(state)로 구분지어 정의될 수 있다. 또한, 복수로 생성된 HMM 각각의 스테이트의 파라미터를 비교하여 복수의 HMM를 결합할 수 있다. 개별 하위 목표로 설정된 복수의 HMM은 확률값을 계산할 수 있고, 계산된 확률값에 따라 현재 상황을 인식하여 인식된 상황에서의 하위 목표를 위해 동작할 수 있다.
다만, 학습 데이터가 많으면 과적합에 의한 오버피팅이 발생할 수 있으므로, 본 발명에서는 오버피팅을 극복하기 위하여 HMM을 모델링할 때 파라미터의 중요도에 따라 스테이트를 결합하거나 분리하여 모델링할 수 있다.
여기서는 도 2를 참조하여 두 개의 개별 HMM의 스테이트 결합 또는 분리를 설명한다.
도 2를 참조하면, 우선 HMM의 하나의 스테이트의 옵저베이션은 아래의 수학식 1과 같이 가우시안 혼합 모델로 표현할 수 있다.
Figure 112017131310809-pat00002
여기서, 가우시안 혼합 모델의 분산은 아래의 수학식 2와 같이 시간과 공간 파라미터로 구성될 수 있다.
Figure 112017131310809-pat00003
수학식 2에서
Figure 112017131310809-pat00004
는 시간에 관한 파라미터 분산값이고,
Figure 112017131310809-pat00005
는 공간에 관한 파라미터 분산값이다.
다음, 시간 및 공간에 관한 파라미터 분산값으로부터 아래의 수학식 3 및 4와 같이 시간 엔트로피와 공간 엔트로피를 계산할 수 있다.
Figure 112017131310809-pat00006
Figure 112017131310809-pat00007
수학식 3은 시간 엔트로피를 계산하기 위한 식이고, 수학식 4는 공간 엔트로피를 계산하기 위한 식이다. 여기서, 엔트로피는 얼마나 다양한 정보가 있는지 분석하기 위한 정보의 양을 나타낼 수 있다.
다음, 시간 엔트로피와 공간 엔트로피를 결합하여 아래의 수학식 5와 같이 HMM의 스테이트 결합 또는 분리를 위한 값(중요도)을 생성할 수 있다.
Figure 112017131310809-pat00008
수학식 5를 참조하면 시간 엔트로피가 크다는 것은 자율 로봇의 행동 시간이 길다는 것을 의미하고, 공간 엔트로피가 작다는 것은 자율 로봇의 행동이 여러 번 반복했을 때 동일하다는 것을 의미할 수 있다. 결과적으로 행동 시간이 길고 반복 정밀도가 높은 행동의
Figure 112017131310809-pat00009
(중요도)가 크다는 것을 알수 있다.
도 3을 참조하면 i번째 HMM의 첫번째 스테이트의 값
Figure 112017131310809-pat00010
과 i+1번째 HMM의 첫번째 스테이트의 값
Figure 112017131310809-pat00011
이 아래의 수학식 6과 같을 때 두 개의 HMM의 스테이트는 결합시키고, 수학식 7과 같을 때 두 개의 HMM의 스테이트를 그대로 분리시킬 수 있다.
Figure 112017131310809-pat00012
Figure 112017131310809-pat00013
여기서,
Figure 112017131310809-pat00014
Figure 112017131310809-pat00015
은 개별적으로 HMM을 생성한 후 계산된 값이고,
Figure 112017131310809-pat00016
은 두 개의 HMM을 생성할 때 사용한 데이터를 함께 놓고 생성한 HMM으로부터 계산된 값을 의미한다.
다시 말해, 한 개의 HMM으로 만들었을 때의 S값이 두 개의 HMM을 별도로 만들었을 때 S값의 평균보다 작으면 그 HMM의 스테이트들은 하나로 표현해도 무방하다.
이는, HMM의 스테이트가 결합되었을 때 엔트로피가 별도로 만든 것보다 크지 않다는 것을 의미한다.
여기서, α는 중요도에 대한 상수값으로 실험적으로 설정할 수 있다. α값의 증가함에 따라 별도의 HMM의 스테이트가 합쳐지는 것이 엄격해질 수 있다.
정리하면, 단계 S100에서는 입력으로 들어오는 y(시연 정보)값을 옵저베이션(observation)으로 보고 HMM을 모델링할 수 있다. 이때, 각각의 은닉 스테이트(hidden state)들은 옵저베이션을 통해 모델링될 수 있고, 이 옵저베이션은 가우시안 혼합 모델(Gaussian mixture model)로 모델링할 수 있다. 이와 같이 가우시안 혼합 모델로 모델링된 옵저베이션들은 분산값을 가질 수 있다. 분산값은 시간에 대한 파라미터와 공간에 대한 파라미터로 구성되며, 각 분산값으로부터 시간 엔트로피와 공간 엔트로피를 계산할 수 있다. 또한, 시간 엔트로피를 공간 엔트로피로 나누면 하나의 값을 얻을 수 있는데 이는 그 옵저베이션의 특징을 나타내는 중요한 값이 될 수 있다. 결과적으로 구한 S값은 행동의 시간과 반복 정밀도의 정도를 나타낼 수 있다.
또한, 두 개의 HMM의 스테이트들을 별도로 모델링했을 때의 S값이 두 개의 HMM을 모델링할 때 사용한 데이터를 하나의 스테이트로 모델링했을 때의 S값보다 작은 경우, 이는 두 개의 HMM 스테이트들을 별도로 모델링할 필요가 없음을 나타낼 수 있다. 두 개의 스테이트를 하나로 합쳐도 그 엔트로피가 작기 때문에 하나로 표현해도 오버피팅으로 인해 파라미터가 깨지지 않을 수 있다.
단계 S200에서는, 자율 로봇의 (단위)동작 및 동작에 따른 결과를 정의하여 도메인 데이터를 설정하고, 현재 상황과 타겟 상황을 설정하고 어떤 동작을 수행하는지 정의하여 문제 데이터를 설정할 수 있다.
예를 들면, 자율 로봇이 컵을 잡으려다가 놓친다거나 사용자에 의해 방해를 받을 경우 확률 불확실성을 고려해야 하고, 자동적으로 도메인 데이터와 문제 데이터가 설정되어야 하므로 본 발명에서는 단계 S100에서 모델링된 HMM의 라벨을 단계 S200에서 이용할 수 있다.
즉, 본 발명에서는 도메인 데이터 및 문제 데이터를 심볼로 설정하는 것이 아니라 HMM 라벨을 이용하여 확률을 고려하면서 사용 편의성을 향상시킬 수 있다.
단계 S300에서는 단계 S400에서 개별 하위 목표를 선택적으로 수행할 수 있도록 명목상 계획을 수립할 수 있다.
예를 들면, 도 4와 같이 자율 로봇이 컵에 티백을 넣는 과정에 대하여 명목상 계획을 수립할 수 있다. 이때, 명목상 계획은 자율 로봇이 컵에 다가가는 다가가기 행동, 자율 로봇이 컵을 잡는 잡기 행동, 자율 로봇이 컵에 티백을 놓는 놓기 행동으로 수립될 수 있다.
단계 S400에서는 HMM과 PDDL 기반의 명목상 계획을 결합한 행동 선택 매커니즘에 따라 상황에 따른 자율 로봇의 행동을 선택하여 수행할 수 있다.
도 5를 참조하여 설명하면, 3개의 HMM이 각각 p_i, p_(i+1), p_(i+2)의 인식(확률)값을 결과로 출력했을 때 그 값이 배치된 구조에 따라 전달되는 수식을 보여주고 있다.
자율 로봇은 최종적으로 v_i, v_(i+1), v_(i+2)의 값 중 가장 높은 값의 HMM을 선택하고 최종적으로 그 HMM으로부터 자율 로봇의 경로를 생성할 수 있다.
여기서, PDDL 기반의 명목상 계획은 HMM이 배치되는 순서를 결정할 수 있다. 이때, 아래쪽 HMM일수록 타겟 상황(메인 목표)에 가까운 스테이트일 수 있다.
또한, 도 5의 수학식
Figure 112017131310809-pat00017
에서 "+" 기호는 상위의 값을 전달받기 위한 수식이고, "×" 기호는 자신의 확률값을 반영하기 위한 수식이다.
여기서, "+" 기호는 p_i와 p_(i+1)이 동일할 때 상위의 값을 하위로 전달시켜 v_i보다 v_(i+1)을 크게 만들기 위함이다.
또한, "×" 기호는 자신의 HMM 확률값에 의해 전체값을 조절하기 위함이다.
이러한, "+" 기호 및 "×" 기호는 자율 로봇이 동시에 인식된 두 가지 스테이트 중 타겟 상황(메인 목표)에 가까운 스테이트를 선택할 수 있도록 확률값을 반영시키기 위하여 설정될 수 있다.
참고로, 도 5의 HMM의 순서는 목표를 달성하는데 매우 중요하며, 주변의 아무런 방해가 없다면 자율 로봇은 위에서 아래 방향으로 HMM들을 수행하면 타겟 상황을 달성할 수 있습니다. 따라서, 자율 로봇이 HMM들 중 동시에 두 가지를 인식할 경우 타겟 상황에 가까운 HMM을 수행하는 것이 바람직하므로, 타겟 상황에 가까운 HMM이 선택될 수 있도록 확률값을 반영하기 위하여 도 와 같이 행동 선택 매커니즘이 설정될 수 있다.
예를 들어, 자율 로봇이 다가가기 행동과 잡기 행동 모두 가능한 상황이라고 가정하면, p_i(다가가기)와 p_(i+1)(잡기)가 모두 0.5의 확률값일 때, v_i(다가가기)는 0.45이고 v_(i+1)는 0.475이므로 잡기 행동이 더 높은 값을 갖는다. 여기서, 다가가기 행동 이전 행동인 v_(i-1)은 0.4로 가정하고, 다가가기 행동과 잡기 행동이 가능한 상황이기 때문에 v_(i-1)은 상대적으로 작은 값을 갖는다.
본 발명에 따르면, 자율 로봇은 별도의 작업 프로그램의 작성 절차 없이 시연자의 시연으로부터 작업 프로그램을 스스로 생성할 수 있고, 생성된 작업 프로그램을 통해 로봇은 주변 환경 변화 및 주어진 태스크에 따라 적절하게 행동을 선택하고 선택된 행동을 수행할 수 있다.
또한, 본 발명은 확률적 모델링에서 시간 엔트로피 및 공간 엔트로피로 계산된 중요도를 이용하여 스테이트의 파라미터를 결합하거나 분리시킴으로써 오버피팅 현상을 방지할 수 있다.
한편, 본 발명은 상술한 단계들이 하나 이상의 전자 또는 디지털 제어 장치 상에서 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어의 조합에 의해 수행될 수 있음이 이해될 것이다. 소프트웨어는 하나 이상의 기능적 시스템, 컨트롤러, 장치, 컴포넌트, 모듈, 또는 서브 모듈과 같은 적절한 전자 프로세싱 컴포넌트 또는 시스템 내의 소프트웨어 메모리(도시되지 않음) 내에 상주할 수 있다. 소프트웨어 메모리는 논리 기능(즉, 디지털 회로 또는 소스 코드와 같은 디지털 형태로 또는 아날로그 전기, 소리, 또는 비디오 신호와 같은 아날로그 소스와 같은 아날로그 형태로 구현될 수 있는 "로직")을 구현하는 실행 가능한 명령어의 정렬된 목록을 포함할 수 있다.
실행 가능한 명령어는 전자 시스템의 프로세싱 모듈에 의해 실행될 때, 전자 시스템이 명령어를 수행하게 하는, 저장된 명령어를 가진 컴퓨터 프로그램 프로덕트로 구현될 수 있다. 컴퓨터 프로그램 프로덕트는 명령어 실행 시스템, 장치, 또는 디바이스로부터 명령어를 선택적으로 불러들이고(fetch) 그 명령어를 실행할 수 있는 전자식 컴퓨터 기반 시스템, 프로세서 내장 시스템, 또는 다른 시스템과 같은, 명령어 실행 시스템, 장치, 또는 디바이스에 의해, 또는 이들에 연결되어 사용하기 위한 임의의 비일시적(non-transitory) 컴퓨터 판독 가능한 저장 매체에 선택적으로 내장될 수 있다.
본 명세서의 맥락에서, 컴퓨터 판독 가능한 저장 매체는 명령어 실행 시스템, 장치 또는 디바이스에 의해 또는 이들에 연결되어 사용하기 위한, 프로그램을 저장할 수 있는 임의의 비일시적 수단이다. 비일시적 컴퓨터 판독 가능한 저장 매체는 선택적으로, 예컨대, 전자, 자성, 광, 전자기, 적외선, 또는 반도체 시스템, 장치, 또는 디바이스일 수 있다. 비일시적 컴퓨터 판독 가능한 매체의 더 구체적인 예의 개괄적인 목록은 하나 이상의 와이어를 가진 전기적 연결(전자), 휴대용 컴퓨터 디스켓(자성); 랜덤 액세스, 즉, 휘발성 메모리(전자), 판독 전용 메모리(전자), 예컨대, 플래시 메모리와 같은 삭제 가능하고 프로그래밍 가능한 판독 전용 메모리(전자), 예컨대, CD-ROM, CD-R, CD-RW와 같은 컴팩트 디스크 메모리(광), 및 디지털 다기능 디스크 메모리, 즉, DVD(광)를 포함한다. 프로그램이, 예컨대, 종이 또는 다른 매체의 광 스캐닝을 통해 전자적으로 캡처 된 후, 컴파일되거나, 해석되거나, 또는 필요하다면 적절한 방식으로 프로세싱된 다음 컴퓨터 메모리 또는 기계 메모리에 저장될 수 있으므로, 비일시적 컴퓨터 판독 가능한 저장 매체가 심지어 그 위에 프로그램이 인쇄될 수 있는 종이 또는 다른 적절한 매체일 수도 있음을 이해해야 한다.
이상에서 본 발명에 대한 기술 사상을 첨부 도면과 함께 서술하였지만, 이는, 본 발명의 바람직한 실시예을 예시적으로 설명한 것이지 본 발명을 한정하는 것은 아니다. 또한, 이 기술 분야의 통상의 지식을 가진 자라면 누구나 본 발명의 기술 사상의 범주를 이탈하지 않는 범위 내에서 다양한 변형 및 모방이 가능함은 명백한 사실이다.

Claims (10)

  1. 자율 로봇을 위한 프레임 워크를 설정하기 위하여,
    (a) 은닉 마르코프 모델을 이용하여 시연자의 시연 정보를 모델링하는 단계;
    (b) 자율 로봇의 타겟 상황에 대한 태스크 계획을 수립하기 위해 PDDL(Planning Domain Definition Language)를 이용하여 도메인(Domain) 데이터와 문제(Problem) 데이터를 생성하는 단계;
    (c) 상기 도메인 데이터 및 상기 문제 데이터를 이용하여 명목상 계획(Norminal Plan)을 수립하는 단계; 및
    (d) 반응적 행동 선택에 따라 행동을 선택하여 수행하는 단계;를 포함하고,
    상기 (a) 단계에서는, 시연자가 시연하는 동작을 학습하도록 시연 정보를 동작 경로로 입력받아 상기 은닉 마르코프 모델을 이용하여 하위 목표를 자동으로 설정하고,
    시연자에 의한 복수의 시연 정보를 복수의 은닉 마르코프 모델로 모델링하되, 상기 복수의 은닉 마르코프 모델 각각의 스테이트의 파라미터를 비교하여 스테이트를 결합하거나 분리하여 모델링하며,
    상기 은닉 마르코프 모델의 스테이트를 시간 파라미터 및 공간 파라미터로 구성된 가우시안 혼합 모델의 분산값으로 나타내고, 시간 및 공간 파라미터 분산값으로부터 시간 엔트로피 및 공간 엔트로피를 계산하여 스테이트의 결합 또는 분리를 위한 중요도를 검출하고,
    i번째 은닉 마르코프 모델의 첫번째 스테이트의 중요도와, i+1번째 은닉 마르코프 모델의 첫번째 스테이트의 중요도가
    Figure 112019001089237-pat00024
    의 수학식을 만족할 경우 두 개의 은닉 마르코프 모델의 스테이트를 결합시키는, 자율 로봇을 위한 프레임 워크 설정 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 제1항에 있어서,
    상기 (c) 단계에서는, 상기 은닉 마르코프 모델이 배치되는 순서를 결정하는, 자율 로봇을 위한 프레임 워크 설정 방법.
  7. 제1항에 있어서,
    상기 (d) 단계에서는, 자율 로봇이 동시에 인식된 두가지 스테이트 중 타겟 상황에 가까운 스테이트를 선택하도록 반영된 확률값에 따라 행동을 선택하는, 자율 로봇을 위한 프레임 워크 설정 방법.
  8. 제7항에 있어서,
    상기 (d) 단계에서는, 복수의 은닉 마르코프 모델 각각에서 출력되는 확률값 중 가장 높은 값을 갖는 은닉 마르코프 모델을 선택하고, 선택된 은닉 마르코프 모델로부터 자율 로봇의 행동을 수행하는, 자율 로봇을 위한 프레임 워크 설정 방법.
  9. 제1항 및 제6항 내지 제8항 중 어느 한 항의 자율 로봇을 위한 프레임 워크 설정 방법을 수행하는 디지털 제어 장치.
  10. 제1항 및 제6항 내지 제8항 중 어느 한 항의 자율 로봇을 위한 프레임 워크 설정 방법이 기록된 컴퓨터 판독 가능한 저장 매체
KR1020170184593A 2017-12-29 2017-12-29 자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치 KR101977274B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170184593A KR101977274B1 (ko) 2017-12-29 2017-12-29 자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170184593A KR101977274B1 (ko) 2017-12-29 2017-12-29 자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치

Publications (1)

Publication Number Publication Date
KR101977274B1 true KR101977274B1 (ko) 2019-08-28

Family

ID=67775327

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170184593A KR101977274B1 (ko) 2017-12-29 2017-12-29 자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치

Country Status (1)

Country Link
KR (1) KR101977274B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113524196A (zh) * 2021-08-10 2021-10-22 南京深一科技有限公司 一种基于平面视觉深度强化学习的机械臂抓取控制方法
KR20210147685A (ko) * 2020-05-29 2021-12-07 한국로봇융합연구원 다중 자율 로봇의 작업 계획 관리 장치 및 방법
EP4013579A4 (en) * 2019-12-03 2022-11-02 Samsung Electronics Co., Ltd. ROBOTS AND METHODS OF CONTROL THEREOF

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004330361A (ja) * 2003-05-08 2004-11-25 Japan Science & Technology Agency 隠れマルコフモデルによる運動データの認識・生成方法、それを用いた運動制御方法及びそのシステム
JP2007087089A (ja) * 2005-09-21 2007-04-05 Fujitsu Ltd ジェスチャ認識装置、ジェスチャ認識プログラムおよびジェスチャ認識方法
KR20080072446A (ko) * 2007-02-02 2008-08-06 주식회사 유진로봇 로봇 미들웨어 프레임워크 시스템
KR20130097307A (ko) * 2012-02-24 2013-09-03 한양대학교 산학협력단 작업 솜씨 학습을 위한 모델링 방법 및 이를 이용한 로봇
KR20130137185A (ko) * 2010-11-11 2013-12-16 더 존스 홉킨스 유니버시티 인간-기계 협력 로봇 시스템
KR20150128006A (ko) * 2014-05-08 2015-11-18 한양대학교 산학협력단 계층적 은닉 마르코프 모델을 이용한 행동 인식 방법 및 장치
KR101577711B1 (ko) 2014-05-23 2015-12-15 한양대학교 산학협력단 시간 및 공간적 관계를 이용한 작업 솜씨 학습 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004330361A (ja) * 2003-05-08 2004-11-25 Japan Science & Technology Agency 隠れマルコフモデルによる運動データの認識・生成方法、それを用いた運動制御方法及びそのシステム
JP2007087089A (ja) * 2005-09-21 2007-04-05 Fujitsu Ltd ジェスチャ認識装置、ジェスチャ認識プログラムおよびジェスチャ認識方法
KR20080072446A (ko) * 2007-02-02 2008-08-06 주식회사 유진로봇 로봇 미들웨어 프레임워크 시스템
KR20130137185A (ko) * 2010-11-11 2013-12-16 더 존스 홉킨스 유니버시티 인간-기계 협력 로봇 시스템
KR20130097307A (ko) * 2012-02-24 2013-09-03 한양대학교 산학협력단 작업 솜씨 학습을 위한 모델링 방법 및 이를 이용한 로봇
KR20150128006A (ko) * 2014-05-08 2015-11-18 한양대학교 산학협력단 계층적 은닉 마르코프 모델을 이용한 행동 인식 방법 및 장치
KR101577711B1 (ko) 2014-05-23 2015-12-15 한양대학교 산학협력단 시간 및 공간적 관계를 이용한 작업 솜씨 학습 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4013579A4 (en) * 2019-12-03 2022-11-02 Samsung Electronics Co., Ltd. ROBOTS AND METHODS OF CONTROL THEREOF
KR20210147685A (ko) * 2020-05-29 2021-12-07 한국로봇융합연구원 다중 자율 로봇의 작업 계획 관리 장치 및 방법
KR102439584B1 (ko) * 2020-05-29 2022-09-01 한국로봇융합연구원 다중 자율 로봇의 작업 계획 관리 장치 및 방법
CN113524196A (zh) * 2021-08-10 2021-10-22 南京深一科技有限公司 一种基于平面视觉深度强化学习的机械臂抓取控制方法

Similar Documents

Publication Publication Date Title
US10293483B2 (en) Apparatus and methods for training path navigation by robots
KR101977274B1 (ko) 자율 로봇을 위한 프레임 워크 설정 방법 및 이를 수행하는 디지털 제어 장치
Islam et al. Understanding human motion and gestures for underwater human–robot collaboration
CN105320986A (zh) 神经网络训练方法和设备及数据处理设备
KR102318027B1 (ko) 자율 주행을 위한 비전-기반 샘플-효율적 강화 학습 프레임워크
US20210201181A1 (en) Inferencing and learning based on sensorimotor input data
EP3686724A1 (en) Robot interaction method and device
US20190228294A1 (en) Method and system for processing neural network model using plurality of electronic devices
JP5141876B2 (ja) 軌道探索装置
JP2019049604A (ja) 命令文推定システムおよび命令文推定方法
US11825278B2 (en) Device and method for auto audio and video focusing
Rohrer BECCA: Reintegrating AI for natural world interaction
US11797824B2 (en) Electronic apparatus and method for controlling thereof
CN107545895A (zh) 信息处理方法和电子设备
US11218803B2 (en) Device and method of performing automatic audio focusing on multiple objects
US11100414B2 (en) Inferencing and learning based on sensorimotor input data
Mehmood et al. Techniques and approaches in Robocup@ Home-A review
Cohen-Lhyver et al. Modulating the auditory turn-to reflex on the basis of multimodal feedback loops: the dynamic weighting model
KR102572309B1 (ko) 로봇 제어 장치 및 이의 동작 방법
KR102443330B1 (ko) 치아 기반 개인 식별 장치 및 방법
US20230234221A1 (en) Robot and method for controlling thereof
KR102663375B1 (ko) 음성 및 영상 자동 포커싱 방법 및 장치
WO2021131739A1 (ja) 情報処理システム、および情報処理方法、並びにプログラム
JP7416199B2 (ja) 制御装置、制御方法及びプログラム
US20230343142A1 (en) Action segment estimation model building device, method, and non-transitory recording medium