KR102595095B1 - 유아-모사 베이지안 학습 방법 및 이를 수행하기 위한 컴퓨팅 장치 - Google Patents

유아-모사 베이지안 학습 방법 및 이를 수행하기 위한 컴퓨팅 장치 Download PDF

Info

Publication number
KR102595095B1
KR102595095B1 KR1020210013224A KR20210013224A KR102595095B1 KR 102595095 B1 KR102595095 B1 KR 102595095B1 KR 1020210013224 A KR1020210013224 A KR 1020210013224A KR 20210013224 A KR20210013224 A KR 20210013224A KR 102595095 B1 KR102595095 B1 KR 102595095B1
Authority
KR
South Korea
Prior art keywords
bayesian
infant
information
task
prior distribution
Prior art date
Application number
KR1020210013224A
Other languages
English (en)
Other versions
KR20220073599A (ko
Inventor
장병탁
이영기
박준석
박관영
오현석
장유원
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to US17/467,971 priority Critical patent/US20220164689A1/en
Publication of KR20220073599A publication Critical patent/KR20220073599A/ko
Application granted granted Critical
Publication of KR102595095B1 publication Critical patent/KR102595095B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

일 실시예에 따른 유아-모사 베이지안 학습(Toddler-Inspired Bayesian Learning) 방법은, 에이전트가 탐색을 수행하는 과정에서 적어도 하나의 과제와 관련한 정보를 수집하는 단계 및 상기 수집된 정보를 베이지안 사전정보로서 이용하여 상기 적어도 하나의 과제에 대한 베이지안 추론을 수행하는 단계를 포함한다.

Description

유아-모사 베이지안 학습 방법 및 이를 수행하기 위한 컴퓨팅 장치 {TODDLER-INSPIRED BAYESIAN LEARNING METHOD AND COMPUTING APPARATUS FOR PERFORMING THE SAME}
본 명세서에서 개시되는 실시예들은 기계학습에 관한 것이며, 구체적으로 대량의 라벨링된 학습데이터를 필요로 하는 기존의 지도학습의 한계를 극복하기 위해 유아(toddler)의 학습 방식을 응용한 베이지안 학습 방법에 관한 것이다.
기존의 지도학습 알고리즘에 의할 경우 학습을 위해 대량의 라벨링된 데이터가 필요하며, 단일 과제에 대해서 학습한 지식을 다른 과제에 적용하기 어려운 한계가 있다.
한편 인간이 학습하는 과정을 살펴보면, 인간은 주변환경과 활발히 상호작용을 하며 얻은 경험을 통해 지식을 축적하고 확장해 나간다. 즉, 인간은 학습을 위한 데이터가 주어지지 않더라도 능동적으로 학습을 수행할 수 있다.
특히, 유아의 경우 사물을 보고 만지고 느끼는 방식으로 상호작용을 수행하여 사물에 대한 데이터를 축적하고, 이를 기반으로 사물의 종류나 사물의 촉감, 사물과의 거리 등을 판단하기 위한 지식을 쌓을 수 있다.
따라서, 유아가 학습하는 방식을 기계학습 알고리즘에 반영한다면 라벨링된 데이터가 없어도 능동적으로 학습을 수행할 수 있을 뿐만 아니라, 특정 과제에 대해서 학습된 지식을 다른 과제로 확장할 수 있는 효과도 기대할 수 있을 것이다.
한편, 전술한 배경기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.
본 명세서에서 개시되는 실시예들은, 상호작용을 통해 능동적으로 지식을 습득하는 유아의 학습 방법을 기계학습에 응용함으로써, 라벨링된 학습데이터 없이도 지식을 확장할 수 있는 베이지안 학습 방법을 제공하고자 한다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 일 실시예에 따르면 유아-모사 베이지안 학습 방법은, 에이전트가 탐색을 수행하는 과정에서 적어도 하나의 과제와 관련한 정보를 수집하는 단계 및 상기 수집된 정보를 베이지안 사전정보로서 이용하여 상기 적어도 하나의 과제에 대한 베이지안 추론을 수행하는 단계를 포함할 수 있다.
다른 실시예에 따르면, 유아-모사 베이지안 학습 방법을 수행하기 위한 컴퓨터 프로그램으로서, 유아-모사 베이지안 학습 방법은, 에이전트가 탐색을 수행하는 과정에서 적어도 하나의 과제와 관련한 정보를 수집하는 단계 및 상기 수집된 정보를 베이지안 사전정보로서 이용하여 상기 적어도 하나의 과제에 대한 베이지안 추론을 수행하는 단계를 포함할 수 있다.
또 다른 실시예에 따르면, 유아-모사 베이지안 학습 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체로서, 유아-모사 베이지안 학습 방법은, 에이전트가 탐색을 수행하는 과정에서 적어도 하나의 과제와 관련한 정보를 수집하는 단계 및 상기 수집된 정보를 베이지안 사전정보로서 이용하여 상기 적어도 하나의 과제에 대한 베이지안 추론을 수행하는 단계를 포함할 수 있다.
또 다른 실시예에 따르면, 유아-모사 베이지안 학습을 수행하기 위한 컴퓨팅 장치는, 데이터를 입력 받고, 이를 연산 처리한 결과를 출력하기 위한 입출력부, 유아-모사 베이지안 학습을 수행하기 위한 프로그램 및 데이터가 저장되는 저장부 및 적어도 하나의 프로세서를 포함하며, 상기 프로그램을 실행시킴으로써 상기 유아-모사 베이지안 학습을 수행하는 제어부를 포함하며, 상기 제어부가 상기 프로그램을 실행함으로써 구현되는 유아-모사 베이지안 학습 모델은, 에이전트가 탐색을 수행하는 과정에서 적어도 하나의 과제와 관련한 정보를 수집하고, 상기 수집된 정보를 베이지안 사전정보로서 이용하여 상기 적어도 하나의 과제에 대한 베이지안 추론을 수행할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 에이전트가 탐색을 수행하는 과정에서 수집한 정보를 베이지안 사전정보로서 이용하여 베이지안 추론을 수행함으로써, 라벨링된 데이터가 없어도 탐색을 통해 수집한 정보를 반영하여 지식을 확장시키는 효과를 기대할 수 있다.
개시되는 실시예들에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 개시되는 실시예들이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 일 실시예에 따른 유아-모사 베이지안 학습을 수행하기 위한 컴퓨팅 장치의 구성을 도시한 도면이다.
도 2는 일 실시예에 따른 유아-모사 베이지안 학습을 수행함에 있어서, 에이전트가 탐색을 통해 정보를 수집하기 위한 가상환경을 설명하기 위한 도면이다.
도 3은 일 실시예에 따른 유아-모사 베이지안 학습을 수행하기 위한 신경망 모델을 도시한 도면이다.
도 4 내지 도 7은 실시예들에 따른 유아-모사 베이지안 학습 방법을 설명하기 위한 순서도들이다.
아래에서는 첨부한 도면을 참조하여 다양한 실시예들을 상세히 설명한다. 아래에서 설명되는 실시예들은 여러 가지 상이한 형태로 변형되어 실시될 수도 있다. 실시예들의 특징을 보다 명확히 설명하기 위하여, 이하의 실시예들이 속하는 기술분야에서 통상의 지식을 가진 자에게 널리 알려져 있는 사항들에 관해서 자세한 설명은 생략하였다. 그리고, 도면에서 실시예들의 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 구성이 다른 구성과 "연결"되어 있다고 할 때, 이는 '직접적으로 연결'되어 있는 경우뿐 아니라, '그 중간에 다른 구성을 사이에 두고 연결'되어 있는 경우도 포함한다. 또한, 어떤 구성이 어떤 구성을 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한, 그 외 다른 구성을 제외하는 것이 아니라 다른 구성들을 더 포함할 수도 있음을 의미한다.
본격적으로 실시예들을 설명하기에 앞서 본 명세서에서 자주 사용되는 용어에 대해서 먼저 설명한다.
'베이지안 학습(Bayesian learning)'이란 베이지안 확률 이론을 기계학습에 적용한 것을 의미하며, 특히 이미지 분류 등의 추론 수행 시 베이지안 추론을 통해 산출한 사후확률을 이용하는 방식을 의미한다. 본 명세서에서는 베이지안 학습에 유아의 학습 방식을 적용한 실시예를 개시하는데, 그 특성을 나타내기 위해 '유아-모사 베이지안 학습(Toddler-Inspired Bayesian Learning)'이라고 명칭을 정한다.
이하 첨부된 도면을 참고하여 실시예들을 상세히 설명하기로 한다. 먼저 도 1을 참조하여 일 실시예에 따른 유아-모사 베이지안 학습을 수행하기 위한 컴퓨팅 장치의 구성에 대해서 간략히 설명하고, 이어서 도 2 및 도 3을 참조하여 일 실시예에 따른 유아-모사 베이지안 학습을 수행하는 과정에 대해서 자세히 설명한다.
도 1은 일 실시예에 따른 유아-모사 베이지안 학습을 수행하기 위한 컴퓨팅 장치의 구성을 도시한 도면이다. 도 1을 참고하면, 일 실시예에 따른 컴퓨팅 장치(100)는 입출력부(110), 저장부(120) 및 제어부(130)를 포함할 수 있다.
입출력부(110)는 유아-모사 베이지안 학습과 관련된 사용자의 명령이나 데이터를 수신하고, 유아-모사 베이지안 학습을 수행한 결과를 출력하기 위한 구성이다. 입출력부(110)는 사용자로부터 입력을 수신하기 위한 다양한 종류의 입력장치(e.g. 키보드, 터치스크린 등)를 포함할 수 있으며, 또한 유아-모사 베이지안 학습에 사용되는 데이터 및 학습 결과 데이터를 송수신하기 위한 연결 포트나 통신 모듈을 포함할 수도 있다.
저장부(120)는 파일 및 프로그램이 저장될 수 있는 구성으로서 다양한 종류의 메모리를 통해 구성될 수 있다. 특히, 저장부(120)에는 후술할 제어부(130)가 이하에서 제시되는 프로세스에 따라 유아-모사 베이지안 학습을 위한 연산을 수행할 수 있도록 하는 데이터 및 프로그램이 저장될 수 있다.
제어부(130)는 CPU 등과 같은 적어도 하나의 프로세서를 포함하는 구성으로서, 저장부(120)에 저장된 프로그램을 실행함으로써 이하에서 제시되는 프로세스에 따라 유아-모사 베이지안 학습을 수행한다. 다시 말해, 제어부(130)가 저장부(120)에 저장된 프로그램을 실행함으로써 도 3에 도시된 유아-모사 베이지안 학습 모델(300)이 구현되고, 제어부(130)는 이를 통해 학습을 수행한다.
이하에서는 제어부(130)가 저장부(120)에 저장된 프로그램을 실행시킴으로써 일 실시예에 따른 유아-모사 베이지안 학습을 수행하는 과정에 대해서, 도 1 내지 도 3을 참조하여 자세히 설명한다.
도 2는 일 실시예에 따른 유아-모사 베이지안 학습을 수행함에 있어서, 에이전트가 탐색을 통해 정보를 수집하기 위한 가상환경을 설명하기 위한 도면이고, 도 3은 일 실시예에 따른 유아-모사 베이지안 학습을 수행하기 위한 신경망 모델을 도시한 도면이다.
다시 말해, 도 2에 도시된 가상환경(20), 그리고 가상환경(20) 내에 존재하는 에이전트(1) 및 객체들(210, 220, 230)은 도 3의 유아-모사 베이지안 학습 모델(300)이 정보(310)를 수집하는 과정에서 이용하는 구성이다.
앞서 설명한 바와 같이 유아-모사 베이지안 학습 모델(300)은 제어부(130)가 저장부(120)에 저장된 프로그램을 실행함으로써 구현되는 것이므로, 이후의 실시예들에서 유아-모사 베이지안 학습 모델(300)이 수행한다고 설명되는 동작이나 프로세스는, 실제로는 제어부(130)가 수행하는 것으로 볼 수 있다. 또한, 유아-모사 베이지안 학습 모델(300)에 포함되는 세부 구성들은 유아-모사 베이지안 학습을 수행하는 전체적인 프로그램에서 특정 기능이나 역할을 담당하는 소프트웨어 단위로 볼 수 있다.
먼저 도 2를 참조하여 유아-모사 베이지안 학습 모델(300)이 베이지안 사전정보로서 이용할 정보(310)를 수집하는 과정에 대해서 설명한다. 도 2에 도시된 가상환경(20)과 그 안에 존재하는 에이전트(1) 및 객체들(210, 220, 230)은 유아-모사 베이지안 학습 모델(300)에 의해 구현되는 것이다.
에이전트(1)는 가상환경(20) 내를 자유롭게 이동하면서 탐색(exploration)을 수행하며 객체들(210, 220, 230)과 상호작용을 수행할 수 있다. 예를 들어, 에이전트(1)는 84*84 크기의 RGB 이미지를 입력으로 받으며, 2차원 속도 벡터로 표현되는 '걷기' 동작을 수행할 수 있다. 또한, 에이전트(1)는 객체들(210, 220, 230) 중 어느 하나와 접촉하였을 때 객체를 잡거나, 눌러보거나 또는 차보거나 하는 식의 동작을 함으로써 상호작용을 수행할 수 있다. 에이전트(1)는 객체들(210, 220, 230)에 어떤 상호작용을 했는지에 따라서 대응되는 보상을 받는다. 일 실시예에 따르면, 에이전트(1)는 강화학습 알고리즘에 따라서 가상환경(20)을 탐색함으로써 자신이 받는 보상을 최대화하도록 할 수 있다.
이와 같이 에이전트(1)는 강화학습 알고리즘에 따라 가상환경(20) 내에서 복수의 종류의 동작을 랜덤하게 수행하고, 가상환경(20)에 존재하는 객체들(210, 220, 230)과의 상호작용에 따라서 보상을 획득하는 방식으로, 유아-모사 베이지안 학습 모델(300)이 추론하고자 하는 과제들(e.g. 이미지 분류, 거리 예측 등)과 관련된 정보를 수집할 수 있다.
한편, 도 2에는 에이전트(1)가 가상환경(20) 내에서 탐색을 수행하며 정보를 수집하는 실시예만을 도시하였으나, 이와 다르게 유아-모사 베이지안 학습 모델(300)은 실제 환경에서 동작 가능한 에이전트(e.g. 로봇 등)가 탐색을 수행하면서 실제 물체들과의 상호작용을 통해 수집한 정보를 이용하여 베이지안 추론을 수행할 수도 있다.
도 3에 도시된 유아-모사 베이지안 학습 모델(300)은 에이전트(1)가 탐색을 수행하는 과정에서 수집한 정보(310)를 베이지안 사전정보로서 이용하여 적어도 하나의 과제에 대한 베이지안 추론을 수행할 수 있다. 유아-모사 베이지안 학습 모델(300)이 수집된 정보(310)를 베이지안 사전정보로서 이용하여 베이지안 추론을 수행하는 과정에 대해서 자세히 설명하면 다음과 같다.
도 3을 참고하면, 유아-모사 베이지안 학습 모델(300)은 에이전트(1)가 가상환경(20)을 탐색하여 객체들(210, 220, 230)과의 상호작용을 통해 수집된 정보(310)인 시각정보()를, 콘볼루션 신경망(320)에 대한 입력으로 인가한다. 이때 사용되는 콘볼루션 신경망(320)은 유아-모사 베이지안 학습 모델(300)이 수행하려는 적어도 하나의 과제(e.g. 이미지 분류, 거리 예측 등)에 대해서 이미 학습이 수행된 신경망일 수 있다. 그 결과 콘볼루션 신경망(320)에서는 특징지도(feature map)(330)가 출력된다.
이어서, 유아-모사 베이지안 학습 모델(300)은 특징지도와 에이전트(1)의 탐색 중 학습된 가중치 행렬 를 이용하여 서포트 벡터 머신(Support Vector Machine, 이하 'SVM')(351, 352)이 베이지안 추론 시 사용할 베이지안 사전분포()(340)를 산출한다. 이때, 는 베이지안 사전분포(340)의 차원을 나타낸다.
유아-모사 베이지안 학습 모델(300)이 특징지도와 가중치 행렬 를 이용하여 베이지안 사전분포(340)를 산출하는 과정에 대해서 자세히 설명하면 다음과 같다.
먼저 유아-모사 베이지안 학습 모델(300)은 플래튼 함수 를 이용하여 특징지도(330)를 특징벡터 로 변환한다. 이때, 플래튼 함수는 주어진 행렬을 벡터로 변환하는 함수이다.
이와 같이, 수집된 정보(310) 를 특징벡터 로 변환하는 과정은 다음의 수학식 1로 나타낼 수 있다.
콘볼루션 신경망(320)은 로 표현되었다.
이어서, 유아-모사 베이지안 학습 모델(300)은 가중치 행렬 를 통해 특징벡터 를 선형 사영(linear projection)함으로써 베이지안 사전분포(340)를 산출할 수 있다. 이를 수식으로 표현하면 다음의 수학식 2와 같다.
이때, RBF(Radical Basis Function)은 SVM에 사용되는 커널(kernel)의 한 종류이다.
이와 같은 과정을 통해 산출된 베이지안 사전분포(340)는 각각 제1 SVM(351) 및 제2 SVM(352)에 대한 입력으로 인가되고, 제1 및 제2 SVM(351, 352)은 입력받은 베이지안 사전분포(340)에 따라 각각에 할당된 과제와 관련된 사후확률을 산출하고, 산출된 사후확률에 기초하여 각각의 과제에 대한 추론 결과를 출력할 수 있다. 도 3에 도시된 실시예에서는 이러한 과정을 거쳐 제1 SVM(351)은 수집된 정보(310)에 대한 이미지 분류 결과(“Ball”)를 출력하고, 제2 SVM(352)은 수집된 정보(310)에 대한 거리 예측 결과(“2.57m”)를 출력하였다.
이와 같이 유아-모사 베이지안 학습 모델(300)은 에이전트(1)가 가상환경(20)을 자유롭게 탐색하며 객체들(210, 220, 230)과 상호작용하는 과정에서 수집한 정보(310)를 라벨링 없이 바로 이용하여 복수의 과제들(이미지 분류 및 거리 예측)에 대한 추론을 수행할 수 있다. 따라서, 인위적인 라벨링 과정 없이도 지식을 축적할 수 있을 뿐 아니라, 축적된 지식을 다양한 과제에 확장 가능한 효과를 기대할 수 있다.
이하에서는 상술한 바와 같은 컴퓨팅 장치(100)를 이용하여 유아-모사 베이지안 학습을 수행하는 방법을 설명한다. 도 4 내지 도 7은 실시예들에 따른 유아-모사 베이지안 학습 방법을 설명하기 위한 순서도들이다.
도 4 내지 도 7에 도시된 실시예들에 따른 유아-모사 베이지안 학습 방법은 도 1에 도시된 컴퓨팅 장치(100)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하에서 생략된 내용이라고 하더라도 도 1의 컴퓨팅 장치(100)에 관하여 이상에서 기술한 내용은 도 4 내지 도 7에 도시된 실시예들에 따른 유아-모사 베이지안 학습 방법에도 적용될 수 있다. 특히, 도 4 내지 도 7에 도시된 순서도들에 포함된 단계들을 수행하는 주체는 제어부(130)가 저장부(120)에 저장된 프로그램을 실행함으로써 구현된 유아-모사 베이지안 학습 모델(300)이 된다.
도 4를 참고하면, 401 단계에서 에이전트가 탐색을 수행하는 과정에서 적어도 하나의 과제와 관련한 정보를 수집한다. 401 단계에 포함되는 세부 단계들을 도 5에 도시하였다.
도 5를 참고하면, 501 단계에서 에이전트는 강화학습 알고리즘에 따라 가상환경상에서 복수의 종류의 동작을 랜덤하게 수행할 수 있다. 502 단계에서 에이전트는 가상환경에 존재하는 객체들과의 상호작용에 따라서 보상을 획득할 수 있다.
다시 도 4로 돌아와서, 402 단계에서 유아-모사 베이지안 학습 모델(300)은 수집된 정보를 베이지안 사전정보로서 이용하여 적어도 하나의 과제에 대한 베이지안 추론을 수행할 수 있다. 402 단계에 포함되는 세부 단계들을 도 6에 도시하였다.
도 6을 참고하면, 601 단계에서 유아-모사 베이지안 학습 모델(300)은 수집된 정보를 인공신경망(콘볼루션 신경망)에 통과시켜 특징지도를 획득한다. 602 단계에서 유아-모사 베이지안 학습 모델(300)은 특징지도와, 에이전트의 탐색 중 학습된 가중치 행렬을 이용하여 베이지안 추론에 사용할 사전분포를 산출할 수 있다. 603 단계에서 유아-모사 베이지안 학습 모델(300)은 사전분포를 베이지안 SVM에 적용함으로써 적어도 하나의 과제와 관련된 사후확률을 산출할 수 있다. 유아-모사 베이지안 학습 모델(300)은 산출된 사후확률에 기초하여 적어도 하나의 과제에 대한 추론 결과를 출력할 수 있다.
한편, 602 단계에 포함되는 세부 단계들을 도 7에 도시하였다. 도 7을 참고하면, 701 단계에서 유아-모사 베이지안 학습 모델(300)은 플래튼 함수를 이용하여 특징지도를 특징벡터로 변환한다. 702 단계에서 유아-모사 베이지안 학습 모델(300)은 가중치 행렬을 통해 특징벡터를 선형 사영함으로써 사전분포를 산출한다.
이상에서 설명한 실시예들에 따르면, 에이전트가 탐색을 수행하는 과정에서 수집한 정보를 베이지안 사전정보로서 이용하여 베이지안 추론을 수행함으로써, 라벨링된 데이터가 없어도 탐색을 통해 수집한 정보를 반영하여 지식을 확장시키는 효과를 기대할 수 있다.
이상의 실시예들에서 사용되는 '~부'라는 용어는 소프트웨어 또는 FPGA(field programmable gate array) 또는 ASIC 와 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다. 그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램특허 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함한다.
구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로부터 분리될 수 있다.
뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU 들을 재생시키도록 구현될 수도 있다.
도 4 내지 도 7을 통해 설명된 실시예들에 따른 유아-모사 베이지안 학습 방법은 컴퓨터에 의해 실행 가능한 명령어 및 데이터를 저장하는, 컴퓨터로 판독 가능한 매체의 형태로도 구현될 수 있다. 이때, 명령어 및 데이터는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 소정의 프로그램 모듈을 생성하여 소정의 동작을 수행할 수 있다. 또한, 컴퓨터로 판독 가능한 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터로 판독 가능한 매체는 컴퓨터 기록 매체일 수 있는데, 컴퓨터 기록 매체는 컴퓨터 판독 가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함할 수 있다. 예를 들어, 컴퓨터 기록 매체는 HDD 및 SSD 등과 같은 마그네틱 저장 매체, CD, DVD 및 블루레이 디스크 등과 같은 광학적 기록 매체, 또는 네트워크를 통해 접근 가능한 서버에 포함되는 메모리일 수 있다.
또한 도 4 내지 도 7을 통해 설명된 실시예들에 따른 유아-모사 베이지안 학습 방법은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 컴퓨터 프로그램(또는 컴퓨터 프로그램 제품)으로 구현될 수도 있다. 컴퓨터 프로그램은 프로세서에 의해 처리되는 프로그래밍 가능한 기계 명령어를 포함하고, 고레벨 프로그래밍 언어(High-level Programming Language), 객체 지향 프로그래밍 언어(Object-oriented Programming Language), 어셈블리 언어 또는 기계 언어 등으로 구현될 수 있다. 또한 컴퓨터 프로그램은 유형의 컴퓨터 판독가능 기록매체(예를 들어, 메모리, 하드디스크, 자기/광학 매체 또는 SSD(Solid-State Drive) 등)에 기록될 수 있다.
따라서 도 4 내지 도 7을 통해 설명된 실시예들에 따른 유아-모사 베이지안 학습 방법은 상술한 바와 같은 컴퓨터 프로그램이 컴퓨팅 장치에 의해 실행됨으로써 구현될 수 있다. 컴퓨팅 장치는 프로세서와, 메모리와, 저장 장치와, 메모리 및 고속 확장포트에 접속하고 있는 고속 인터페이스와, 저속 버스와 저장 장치에 접속하고 있는 저속 인터페이스 중 적어도 일부를 포함할 수 있다. 이러한 성분들 각각은 다양한 버스를 이용하여 서로 접속되어 있으며, 공통 머더보드에 탑재되거나 다른 적절한 방식으로 장착될 수 있다.
여기서 프로세서는 컴퓨팅 장치 내에서 명령어를 처리할 수 있는데, 이런 명령어로는, 예컨대 고속 인터페이스에 접속된 디스플레이처럼 외부 입력, 출력 장치상에 GUI(Graphic User Interface)를 제공하기 위한 그래픽 정보를 표시하기 위해 메모리나 저장 장치에 저장된 명령어를 들 수 있다. 다른 실시예로서, 다수의 프로세서 및(또는) 다수의 버스가 적절히 다수의 메모리 및 메모리 형태와 함께 이용될 수 있다. 또한 프로세서는 독립적인 다수의 아날로그 및(또는) 디지털 프로세서를 포함하는 칩들이 이루는 칩셋으로 구현될 수 있다.
또한 메모리는 컴퓨팅 장치 내에서 정보를 저장한다. 일례로, 메모리는 휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 다른 예로, 메모리는 비휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 또한 메모리는 예컨대, 자기 혹은 광 디스크와 같이 다른 형태의 컴퓨터 판독 가능한 매체일 수도 있다.
그리고 저장장치는 컴퓨팅 장치에게 대용량의 저장공간을 제공할 수 있다. 저장 장치는 컴퓨터 판독 가능한 매체이거나 이런 매체를 포함하는 구성일 수 있으며, 예를 들어 SAN(Storage Area Network) 내의 장치들이나 다른 구성도 포함할 수 있고, 플로피 디스크 장치, 하드 디스크 장치, 광 디스크 장치, 혹은 테이프 장치, 플래시 메모리, 그와 유사한 다른 반도체 메모리 장치 혹은 장치 어레이일 수 있다.
상술된 실시예들은 예시를 위한 것이며, 상술된 실시예들이 속하는 기술분야의 통상의 지식을 가진 자는 상술된 실시예들이 갖는 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 상술된 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 명세서를 통해 보호 받고자 하는 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태를 포함하는 것으로 해석되어야 한다.
100: 컴퓨팅 장치 110: 입출력부
120: 저장부 130: 제어부
20: 가상환경 1: 에이전트
210, 220, 230: 객체 300: 유아-모사 베이지안 학습 모델

Claims (16)

  1. 유아-모사 베이지안 학습(Toddler-Inspired Bayesian Learning) 방법에 있어서,
    에이전트가 탐색을 수행하는 과정에서 적어도 하나의 과제와 관련한 정보를 수집하는 단계; 및
    상기 수집된 정보를 베이지안 사전정보로서 이용하여 상기 적어도 하나의 과제에 대한 베이지안 추론을 수행하는 단계를 포함하며,
    상기 정보를 수집하는 단계는,
    상기 에이전트가 강화학습 알고리즘에 따라 가상환경에서 자유롭게 탐색을 수행하는 과정에서 복수의 종류의 동작을 랜덤하게 수행하고 상기 가상환경에 존재하는 객체들과의 상호작용에 따라서 보상을 획득하는 방식으로 상기 정보를 수집하는 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 베이지안 추론을 수행하는 단계는,
    상기 수집된 정보를 인공신경망에 통과시켜 특징지도(feature map)를 획득하는 단계;
    상기 특징지도와, 상기 에이전트의 탐색 중 학습된 가중치 행렬을 이용하여 베이지안 추론에 사용할 사전분포를 산출하는 단계; 및
    상기 사전분포를 베이지안 서포트 벡터 머신(Support Vector Machine, SVM)에 적용함으로써 상기 적어도 하나의 과제와 관련된 사후확률을 산출하는 단계를 포함하는 것을 특징으로 하는 방법.
  5. 제4항에 있어서,
    상기 특징지도를 획득하는 단계는,
    상기 수집된 정보를, 상기 적어도 하나의 과제와 관련된 학습이 수행된 콘볼루션 신경망에 입력함으로써 상기 특징지도를 획득하는 것을 특징으로 하는 방법.
  6. 제4항에 있어서,
    상기 사전분포를 산출하는 단계는,
    플래튼(flatten) 함수를 이용하여 상기 특징지도를 특징벡터로 변환하는 단계; 및
    상기 가중치 행렬을 통해 상기 특징벡터를 선형 사영(linear projection)함으로써 상기 사전분포를 산출하는 단계를 포함하는 것을 특징으로 하는 방법.
  7. 제6항에 있어서,
    상기 선형 사영함으로써 사전분포를 산출하는 단계는,
    상기 특징벡터와 상기 가중치 행렬의 전치행렬을 곱한 결과를 RBF(Radical Basis Function) 커널에 적용함으로써 상기 사전분포를 산출하는 것을 특징으로 하는 방법.
  8. 컴퓨터에 제1항에 기재된 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
  9. 컴퓨팅 장치에 의해 수행되며, 제1항에 기재된 방법을 수행하기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.
  10. 유아-모사 베이지안 학습(Toddler-Inspired Bayesian Learning)을 수행하기 위한 컴퓨팅 장치에 있어서,
    데이터를 입력 받고, 이를 연산 처리한 결과를 출력하기 위한 입출력부;
    유아-모사 베이지안 학습을 수행하기 위한 프로그램 및 데이터가 저장되는 저장부; 및
    적어도 하나의 프로세서를 포함하며, 상기 프로그램을 실행시킴으로써 상기 유아-모사 베이지안 학습을 수행하는 제어부를 포함하며,
    상기 제어부가 상기 프로그램을 실행함으로써 구현되는 유아-모사 베이지안 학습 모델은,
    에이전트가 탐색을 수행하는 과정에서 적어도 하나의 과제와 관련한 정보를 수집하고, 상기 수집된 정보를 베이지안 사전정보로서 이용하여 상기 적어도 하나의 과제에 대한 베이지안 추론을 수행하며,
    상기 유아-모사 베이지안 학습 모델은 상기 정보를 수집함에 있어서, 상기 에이전트가 강화학습 알고리즘에 따라 가상환경에서 자유롭게 탐색을 수행하는 과정에서 복수의 종류의 동작을 랜덤하게 수행하고 상기 가상환경에 존재하는 객체들과의 상호작용에 따라서 보상을 획득하는 방식으로 상기 정보를 수집하는, 컴퓨팅 장치.
  11. 삭제
  12. 삭제
  13. 제10항에 있어서,
    상기 유아-모사 베이지안 학습 모델은 상기 베이지안 추론을 수행함에 있어서,
    상기 수집된 정보를 인공신경망에 통과시켜 특징지도(feature map)를 획득하고, 상기 특징지도와, 상기 에이전트의 탐색 중 학습된 가중치 행렬을 이용하여 베이지안 추론에 사용할 사전분포를 산출한 후, 상기 사전분포를 베이지안 서포트 벡터 머신(Support Vector Machine, SVM)에 적용함으로써 상기 적어도 하나의 과제와 관련된 사후확률을 산출하는 것을 특징으로 하는 컴퓨팅 장치.
  14. 제13항에 있어서,
    상기 유아-모사 베이지안 학습 모델은 상기 특징지도를 획득함에 있어서,
    상기 수집된 정보를, 상기 적어도 하나의 과제와 관련된 학습이 수행된 콘볼루션 신경망에 입력함으로써 상기 특징지도를 획득하는 것을 특징으로 하는 컴퓨팅 장치.
  15. 제13항에 있어서,
    상기 유아-모사 베이지안 학습 모델은 상기 사전분포를 산출함에 있어서,
    플래튼(flatten) 함수를 이용하여 상기 특징지도를 특징벡터로 변환하고, 상기 가중치 행렬을 통해 상기 특징벡터를 선형 사영(linear projection)함으로써 상기 사전분포를 산출하는 것을 특징으로 하는 컴퓨팅 장치.
  16. 제15항에 있어서,
    상기 유아-모사 베이지안 학습 모델은 상기 선형 사영함으로써 사전분포를 산출함에 있어서,
    상기 특징벡터와 상기 가중치 행렬의 전치행렬을 곱한 결과를 RBF(Radical Basis Function) 커널에 적용함으로써 상기 사전분포를 산출하는 것을 특징으로 하는 컴퓨팅 장치.
KR1020210013224A 2020-11-26 2021-01-29 유아-모사 베이지안 학습 방법 및 이를 수행하기 위한 컴퓨팅 장치 KR102595095B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/467,971 US20220164689A1 (en) 2020-11-26 2021-09-07 Toddler-inspired bayesian learning method and computing apparatus for performing the same

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200161732 2020-11-26
KR20200161732 2020-11-26

Publications (2)

Publication Number Publication Date
KR20220073599A KR20220073599A (ko) 2022-06-03
KR102595095B1 true KR102595095B1 (ko) 2023-10-27

Family

ID=81983660

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210013224A KR102595095B1 (ko) 2020-11-26 2021-01-29 유아-모사 베이지안 학습 방법 및 이를 수행하기 위한 컴퓨팅 장치

Country Status (1)

Country Link
KR (1) KR102595095B1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150242745A1 (en) * 2014-02-21 2015-08-27 Qualcomm Incorporated Event-based inference and learning for stochastic spiking bayesian networks
KR102261055B1 (ko) * 2019-03-07 2021-06-04 네이버 주식회사 클릭율 최대화를 위한 이미지 디자인 파라미터 최적화 방법 및 시스템

Also Published As

Publication number Publication date
KR20220073599A (ko) 2022-06-03

Similar Documents

Publication Publication Date Title
AU2019200270B2 (en) Concept mask: large-scale segmentation from semantic concepts
JP2016503220A (ja) ジェスチャ認識のためのパーツ及び状態検出
US20150227849A1 (en) Method and System for Invariant Pattern Recognition
Zhang et al. Unsupervised video object segmentation with joint hotspot tracking
WO2013149077A1 (en) Finding engaging media with initialized explore-exploit
JP7472658B2 (ja) 行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム
KR102160390B1 (ko) 인공지능 기반의 사용자 의료정보 분석 방법 및 시스템
Haggag et al. Semantic body parts segmentation for quadrupedal animals
Huttunen Deep neural networks: A signal processing perspective
JP2020535518A (ja) 量子トモグラフィを容易化するためのシステム、コンピュータによって実施される方法、およびコンピュータ・プログラム
KR102345267B1 (ko) 목표 지향적 강화학습 방법 및 이를 수행하기 위한 장치
JP2023548512A (ja) 対照学習を用いたビデオドメイン適応
KR102595095B1 (ko) 유아-모사 베이지안 학습 방법 및 이를 수행하기 위한 컴퓨팅 장치
JP2023551787A (ja) Oct画像データを正規化すること
KR102206843B1 (ko) 딥러닝 네트워크를 이용하여 복수의 이미지들로부터 이야기를 생성하기 위한 방법 및 장치
US11314984B2 (en) Intelligent generation of image-like representations of ordered and heterogenous data to enable explainability of artificial intelligence results
KR20230012785A (ko) 비디오 스토리 질의응답을 위한 트랜스포머 모델을 구축하는 방법 및 이를 수행하기 위한 컴퓨팅 장치
KR102559036B1 (ko) 음수값을 갖는 활성화 함수에서 제로 스키핑을 제공하는 방법 및 장치
KR20230109931A (ko) 비디오 스토리 질의 응답을 위한 트랜스포머 모델을 구축하는 장치 및 방법
KR102560188B1 (ko) 멀티모달 인공지능 에이전트를 이용하여 강화학습을 수행하는 방법 및 이를 수행하기 위한 컴퓨팅 장치
US20220164689A1 (en) Toddler-inspired bayesian learning method and computing apparatus for performing the same
KR102675490B1 (ko) 다수준 등장인물 주의집중을 통한 비디오 스토리 이해 방법 및 이를 수행하기 위한 컴퓨팅 장치
US11887367B1 (en) Using machine learning to train and use a model to perform automatic interface actions based on video and input datasets
KR102321064B1 (ko) 부호화된 네트워크 생성 장치 및 방법
Mahbub et al. Contactless human monitoring: Challenges and future direction

Legal Events

Date Code Title Description
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant