KR20220141537A - 피드백 데이터 기반 자가 학습 장치 및 방법 - Google Patents
피드백 데이터 기반 자가 학습 장치 및 방법 Download PDFInfo
- Publication number
- KR20220141537A KR20220141537A KR1020210047767A KR20210047767A KR20220141537A KR 20220141537 A KR20220141537 A KR 20220141537A KR 1020210047767 A KR1020210047767 A KR 1020210047767A KR 20210047767 A KR20210047767 A KR 20210047767A KR 20220141537 A KR20220141537 A KR 20220141537A
- Authority
- KR
- South Korea
- Prior art keywords
- image
- data
- feedback data
- question
- learning
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000013136 deep learning model Methods 0.000 claims abstract description 49
- 238000004590 computer program Methods 0.000 claims description 9
- 238000013135 deep learning Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000000007 visual effect Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000001771 impaired effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000009223 counseling Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G06N3/0445—
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Electrically Operated Instructional Devices (AREA)
- Image Analysis (AREA)
Abstract
일 실시예에 따른 피드백 데이터 기반 자가 학습 장치에 의해 수행되는 피드백 데이터 기반 자가 학습 방법은 이미지와 상기 이미지에 관한 질문을 입력 받는 단계와, 기 학습되어 있는 딥러닝 모델을 이용하여 상기 질문에 대한 답변 데이터를 생성하는 단계와, 상기 답변 데이터에 기초한 피드백 데이터를 상기 사용자로부터 입력 받아, 상기 피드백 데이터를 기초로 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는 단계를 포함할 수 있다.
Description
본 발명은 피드백 데이터 기반 자가 학습 장치 및 방법에 관한 것이다.
시각 정보 기반의 질의응답 기술(VQA: Visual Question Answering)이란 시각 정보(Visual, 이미지 또는 영상)와 시각 정보에 대한 질문(Question)이 주어졌을 때, 해당 질문에 맞는 올바른 답변(Answer)을 만들어내는 기술이다.
이러한, 시각 정보 기반의 질의응답 기술은 사람의 의사소통 방법과 매우 흡사한 인공지능 기술로써, 로봇제어, 인공지능 비서, 시각 장애인 보조 시스템 등의 분야에 활용되고 있다.
하지만, 현재의 시각 정보 기반의 질의응답 기술은 개인화가 불가능하여 사용자가 원하는 분야의 질문에 대한 정확한 답변을 생성할 수 없으며, 기 학습된 학습 데이터에 포함되지 않은 새로운 물체는 인식할 수는 없다.
본 발명의 해결하고자 하는 과제는, 피드백 데이터 기반 자가 학습 장치 및 방법을 제공하는 것이다.
또한, 사용자로부터 입력 받은 피드백 데이터를 이용하여 사용자가 원하는 분야의 질문에 대한 정확한 답변을 생성하도록 기 학습되어 있는 딥러닝 모델을 재 학습시키는 것 등이 본 발명의 해결하고자 하는 과제에 포함될 수 있다.
다만, 본 발명의 해결하고자 하는 과제는 이상에서 언급한 것으로 제한되지 않으며, 언급되지 않은 또 다른 해결하고자 하는 과제는 아래의 기재로부터 본 발명이 속하는 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시예에 따른 피드백 데이터 기반 자가 학습 방법은, 피드백 데이터 기반 자가 학습 장치에 의해 수행되는 피드백 데이터 기반 자가 학습 방법에 있어서, 이미지와 상기 이미지에 관한 질문을 입력 받는 단계와, 기 학습되어 있는 딥러닝 모델을 이용하여 상기 질문에 대한 답변 데이터를 생성하는 단계와, 상기 답변 데이터에 기초한 피드백 데이터를 사용자로부터 입력 받아, 상기 피드백 데이터를 기초로 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는 단계를 포함할 수 있다.
또한, 상기 피드백 데이터는, 상기 답변 데이터에 대한 답변 만족도 및 상기 질문에 대한 기대 답변 데이터 중 적어도 하나를 포함할 수 있다.
또한, 상기 딥러닝 모델을 재 학습시키는 단계는, 상기 답변 만족도를 기초로 상기 답변 데이터에 대한 가중치를 조절하여 상기 딥러닝 모델을 재 학습시킬 수 있다.
또한, 상기 딥러닝 모델을 재 학습시키는 단계는, 상기 이미지와 상기 이미지에 관한 질문을 입력으로, 상기 기대 답변 데이터를 레이블 데이터로 하여 상기 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
또한, 상기 딥러닝 모델을 재 학습시키는 단계는, 상기 이미지를 기초로 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성하는 단계와, 상기 이미지, 상기 다수의 이미지 및 상기 이미지에 관한 질문을 입력으로, 상기 기대 답변 데이터를 레이블 데이터로 하여 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는 단계를 포함할 수 있다.
또한, 상기 다수의 이미지를 생성하는 단계는, 상기 이미지를 기초로 상기 이미지의 각도 또는 상기 이미지의 색을 변형하여 상기 이미지에서 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성할 수 있다.
본 발명의 일 실시예에 따른 피드백 데이터 기반 자가 학습 장치는, 이미지와 상기 이미지에 관한 질문을 입력 받는 입출력부; 메모리; 및 상기 메모리와 전기적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 기 학습되어 있는 딥러닝 모델을 이용하여 상기 질문에 대한 답변 데이터를 생성하고, 상기 입출력부를 통해 상기 답변 데이터에 기초한 피드백 데이터를 사용자로부터 입력 받아, 상기 피드백 데이터를 기초로 상기 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
또한, 상기 피드백 데이터는, 상기 답변 데이터에 대한 답변 만족도 및 상기 질문에 대한 기대 답변 데이터 중 적어도 하나를 포함할 수 있다.
또한, 상기 프로세서는, 상기 답변 만족도를 기초로 상기 답변 데이터에 대한 가중치를 조절하여 상기 딥러닝 모델을 재 학습시킬 수 있다.
또한, 상기 프로세서는, 상기 이미지와 상기 이미지에 관한 질문을 입력으로, 상기 기대 답변 데이터를 레이블 데이터로 하여 상기 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
또한, 상기 프로세서는, 상기 이미지를 기초로 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성하고, 상기 이미지, 상기 다수의 이미지 및 상기 이미지에 관한 질문을 입력으로, 상기 기대 답변 데이터를 레이블 데이터로 하여 상기 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
또한, 상기 프로세서는, 상기 이미지를 기초로 상기 이미지의 각도 또는 상기 이미지의 색을 변형하여 상기 이미지에서 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성할 수 있다.
본 발명의 실시예에 대한 피드백 데이터 기반 자가 학습 장치는, 사용자로부터 제공받은 피드백 데이터를 이용하여 사용자가 원하는 분야의 질문에 대한 정확한 답변을 생성하도록 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
또한, 본 발명의 실시예에 대한 피드백 데이터 기반 자가 학습 장치는 로봇제어, 시각정보와 음성정보를 함께 사용하는 인공지능 비서, 시각 장애인 보조 시스템 및 심리상담 또는 콜센터 등의 어플리케이션 등에서 사용될 수 있다.
다만, 본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 피드백 데이터 기반 자가 학습 장치의 블록도이다.
도 2는 본 발명의 일 실시예에 따른 사용자로부터 피드백 데이터를 획득하는 것을 설명하기 위한 도면이다
도 3은 본 발명의 일 실시예에 따른 피드백 데이터 기반 자가 학습 방법의 절차에 대한 예시적인 순서도이다.
도 2는 본 발명의 일 실시예에 따른 사용자로부터 피드백 데이터를 획득하는 것을 설명하기 위한 도면이다
도 3은 본 발명의 일 실시예에 따른 피드백 데이터 기반 자가 학습 방법의 절차에 대한 예시적인 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 발명의 실시예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 피드백 데이터 기반 자가 학습 장치의 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 피드백 데이터 기반 자가 학습 장치(100)는 입출력부(101), 통신부(102), 메모리(110) 및/또는 프로세서(120)를 포함할 수 있다.
입출력부(101)는, 예를 들면, 사용자 또는 다른 외부 기기로부터 입력된 명령 또는 데이터를 일 실시예에 따른 피드백 데이터 기반 자가 학습 장치(100)의 다른 구성요소(들)에 전달하거나, 또는 일 실시예에 따른 피드백 데이터 기반 자가 학습 장치(100)의 다른 구성요소(들)로부터 수신된 명령 또는 데이터를 사용자 또는 외부 기기로 출력할 수 있다.
예를 들어, 입출력부(101)는 이미지와 이미지에 관한 질문(예를 들어, 질문에 관련된 텍스트 데이터)을 입력받을 수 있으나, 이에 한정되지 않고 동적인 이미지로서 영상과 영상에 관한 질문을 입력받을 수도 있다.
통신부(102)는 피드백 데이터 기반 자가 학습 장치(100)와 외부 장치와의 유선 또는 무선 통신 채널의 수립 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다.
메모리(110)는 피드백 데이터 기반 자가 학습 장치(100)의 적어도 하나의 구성요소(프로세서(120), 입출력부(101) 및/또는 통신부(102))에 의해 사용되는 다양한 데이터, 예를 들어, 소프트웨어(예: 프로그램) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 저장할 수 있다. 메모리(110)는, 휘발성 메모리 또는 비휘발성 메모리를 포함할 수 있다.
프로세서(120)(제어부, 제어 장치 또는 제어 회로라고도 함)는 연결된 피드백 데이터 기반 자가 학습 장치(100)의 적어도 하나의 다른 구성요소(예: 하드웨어 구성 요소(예: 입출력 부(101), 통신부(102) 및/또는 메모리(110)) 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 및 연산을 수행할 수 있다.
또한, 프로세서(120)는 다른 구성요소들 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장할 수 있다.
이를 위해, 프로세서(120)는 해당 동작을 수행하기 위한 전용 프로세서(예를 들어, 임베디드 프로세서) 또는 메모리 디바이스에 저장된 하나 이상의 소프트웨어 프로그램을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예를 들어, CPU 또는 application processor 또는 MCU(Micro controller unit) 등)로 구현될 수 있다.
보다 구체적으로, 프로세서(120)는 기 학습되어 있는 딥러닝 모델을 이용하여 입출력부(101)에서 입력 받은 이미지에 관한 질문에 대한 답변 데이터를 생성할 수 있다.
이때, 프로세서(120)는 메모리(110)에 기 저장된 기 학습된 기계학습 모델을 이용하여 입출력부(101)에서 입력 받은 이미지에 관한 질문에 대한 답변 데이터를 생성하거나, 프로세서(120)는 외부의 다른 장치로부터 기 학습된 기계학습 모델을 로드한 후, 기 학습된 기계학습 모델을 이용하여 입출력부(101)에서 입력 받은 이미지에 관한 질문에 대한 답변 데이터를 생성할 수 있다.
여기서, 기계학습 모델은 다수의 이미지와 다수의 이미지에 관한 질문을 입력으로, 질문에 관한 답변 데이터를 레이블 데이터로 하여 기 학습되어 있을 수 있다.
이후, 입출력부(101)는 답변 데이터를 출력한 후, 답변 데이터에 기초한 피드백 데이터를 사용자로부터 입력받을 수 있는데, 이때 프로세서(120)는 사용자로부터 입력 받은 피드백 데이터를 기초로 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
이때, 프로세서(120)는 실시간으로 사용자로부터 입력 받은 피드백 데이터를 기초로 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수도 있으나, 사용자로부터 입력 받은 피드백 데이터를 축적하고, 축적된 피드백 데이터를 기초로 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수도 있다.
여기서, 사용자로부터 입력 받은 피드백 데이터는 답변 데이터에 대한 답변 만족도 및 질문에 대한 기대 답변 데이터 중 적어도 하나를 포함할 수 있다.
예를 들어, 답변 만족도는 3가지 형태의 정보로써 좋음, 보통, 나쁨에 관한 정보일 수 있으며, 질문에 대한 기대 답변 데이터는 사용자가 질문에 대하여 원하는 답변 데이터일 수 있다.
이때, 피드백 데이터는 텍스트 데이터일 수 있으나, 이에 한정되지 않으며, 이미지, 영상 또는 음성 데이터일 수도 있다.
일 실시예로서, 프로세서(120)는 답변 만족도를 기초로 답변 데이터에 대한 가중치를 조절하는 방식으로 상기 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
다른 실시예로서, 프로세서(120)는 입출력부(101)에서 입력 받은 이미지와 이미지에 관한 질문을 입력으로, 사용자로부터 입력 받은 기대 답변 데이터를 레이블 데이터로 하여 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
또 다른 실시예로서, 프로세서(120)는 입출력부(101)에서 입력 받은 이미지를 기초로 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성하고, 상기 입출력부(101)에서 입력 받은 이미지, 생성된 다수의 이미지 및 입출력부(101)에서 입력 받은 이미지 관한 질문을 입력으로, 기대 답변 데이터를 레이블 데이터로 하여 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
이때, 프로세서(120)는 입출력부(101)에서 입력 받은 이미지를 기초로 이미지의 각도 또는 이미지의 색을 변형하여 이미지에서 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성할 수 있다.
따라서, 프로세서(120)는 입출력부(101)에서 입력 받은 이미지를 기초로 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성하고, 생성한 다수의 이미지를 학습 데이터 셋으로 이용하여 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
한편, 본 발명의 일 실시예에 따른 피드백 데이터 기반 자가 학습 장치(100)는 다양한 플랫폼에서 사용될 수 있으며, 예를 들어 페이스북, 카카오톡 등의 메신저 어플리케이션, 로봇제어, 시각정보와 음성정보를 함께 사용하는 인공지능 비서, 시각 장애인 보조 시스템 및 심리상담 또는 콜센터 등의 어플리케이션 등에서 사용될 수 있다.
이하, 본 발명의 일 실시예에 따른 피드백 데이터 기반 자가 학습 장치(100)가 메신저 어플리케이션에서 사용되는 것에 대하여 도 2를 통하여 설명하도록 한다.
도 2는 본 발명의 일 실시예에 따른 사용자로부터 피드백 데이터를 획득하는 것을 설명하기 위한 도면이다.
도 2를 참조하면, 사용자가 메신저 어플리케이션에 이미지(200)와 이미지에 관한 질문(210)을 입력할 경우, 입출력부(101)는 이미지에 관한 질문을 입력 받고, 프로세서(120)는 기 학습되어 있는 딥러닝 모델을 이용하여 질문에 대한 답변 데이터(220)를 생성할 수 있다.
이후, 입출력부(101)는 프로세서(120)에서 생성한 답변 데이터(220)를 메신저 어플리케이션에 출력한 후, 사용자로부터 답변 데이터에 기초한 피드백 데이터(230, 240)를 입력받을 수 있는데, 이때 프로세서(120)는 사용자로부터 입력 받은 피드백 데이터(230, 240)를 기초로 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
예를 들어, 사용자는 메신저 어플리케이션에 여성이 아기를 안고 있는 이미지(200)와, 이미지에 대한 질문으로 “아기가 어디에 안겨 있어?” 텍스트(210)를 입력하면, 프로세서(120)는 여성이 아기를 안고 있는 이미지(200)와 이미지에 대한 질문인 “아기가 어디에 안겨 있어?”라는 질문(210)에 대한 답변 데이터(“집”)(220)를 생성하고, 입출력부(101)는 프로세서(120)에서 생성한 답변 데이터로서 텍스트 데이터 “집”을 메신저 어플리케이션에 출력할 수 있다.
이후, 사용자는 메신저 어플리케이션에 출력된 답변 데이터에 기초한 피드백 데이터(230, 240)로, 답변 만족도(230)로 “보통”, 기대 답변 데이터(240)로 “팔”을 입력할 수 있다.
이때, 프로세서(120)는 사용자로부터 입력 받은 답변 만족도(230)를 이용하여 답변 데이터(“집”)에 대한 가중치를 조정하여 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
다른 예로서, 프로세서(120)는 여성이 아기를 안고 있는 이미지(200)와 이미지에 대한 질문(210)인 “아기가 어디에 안겨 있어?”라는 질문을 입력으로, 사용자로부터 입력된 기대 답변 데이터(240)인 “팔”을 레이블 데이터로 하여, 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
또 다른 예로서, 프로세서(120)는 여성이 아기를 안고 있는 이미지의 각도를 변경하거나 이미지의 색을 다르게 하여, 여성이 아기를 안고 있는 이미지를 기초로 여성이 아기를 안고 있는 이미지에서 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성할 수 있고, 여성이 아기를 안고 있는 이미지, 생성된 다수의 이미지 및 “아기가 어디에 안겨 있어?”라는 질문을 입력으로, 사용자로부터 입력된 기대 답변 데이터인 “팔”을 레이블 데이터로 하여, 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수도 있다.
도 3은 본 발명의 일 측면에 따른 피드백 데이터 기반 자가 학습 방법의 절차에 대한 예시적인 순서도이다. 도 3의 피드백 데이터 기반 자가 학습 방법은 도 1에 도시된 피드백 데이터 기반 자가 학습 장치(100)에 의해 수행 가능하다. 아울러, 도 3에 도시된 피드백 데이터 기반 자가 학습 방법은 예시적인 것에 불과하다.
도 3을 참조하면, 입출력부(101)는 이미지와 이미지에 관한 질문을 입력 받을 수 있다(단계 S10).
이후, 프로세서(120)는 기 학습되어 있는 딥러닝 모델을 이용하여 질문에 대한 답변 데이터를 생성할 수 있다(단계 S20).
이때, 프로세서(120)에서 답변 데이터를 생성하면, 입출력부(101)은 프로세서(120)에서 생성한 답변 데이터를 출력할 수 있다.
이후, 입출력부(101)는 답변 데이터에 기초한 피드백 데이터를 사용자로부터 입력 받고, 프로세서(120)는 입력 받은 피드백 데이터를 기초로 기 학습되어 있는 딥러닝 모델을 재학습시킬 수 있다(단계 S30).
일 실시예로서, 프로세서(120)는 답변 만족도를 기초로 답변 데이터에 대한 가중치를 조절하는 방식으로 상기 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
다른 실시예로서, 프로세서(120)는 입출력부(101)에서 입력 받은 이미지와 이미지에 관한 질문을 입력으로, 사용자로부터 입력 받은 기대 답변 데이터를 레이블 데이터로 하여 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
또 다른 실시예로서, 프로세서(120)는 입출력부(101)에서 입력 받은 이미지를 기초로 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성하고, 상기 입출력부(101)에서 입력 받은 이미지, 생성된 다수의 이미지 및 입출력부(101)에서 입력 받은 이미지 관한 질문을 입력으로, 기대 답변 데이터를 레이블 데이터로 하여 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
이때, 프로세서(120)는 입출력부(101)에서 입력 받은 이미지를 기초로 이미지의 각도 또는 이미지의 색을 변형하여 이미지에서 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성할 수 있다.
이상에서 살펴본 바와 같이, 본 발명의 실시예에 대한 피드백 데이터 기반 자가 학습 장치는, 피드백 데이터를 이용하여 사용자가 원하는 분야의 질문에 대한 정확한 답변을 생성하도록 기 학습되어 있는 딥러닝 모델을 재 학습시킬 수 있다.
본 발명에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 인코딩 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 인코딩 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방법으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 품질에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 피드백 데이터 기반 자가 학습 장치
101: 입출력부
110: 메모리
120: 프로세서
101: 입출력부
110: 메모리
120: 프로세서
Claims (14)
- 피드백 데이터 기반 자가 학습 장치에 의해 수행되는 피드백 데이터 기반 자가 학습 방법에 있어서,
이미지와 상기 이미지에 관한 질문을 입력 받는 단계와,
기 학습되어 있는 딥러닝 모델을 이용하여 상기 질문에 대한 답변 데이터를 생성하는 단계와,
상기 답변 데이터에 기초한 피드백 데이터를 사용자로부터 입력 받아, 상기 피드백 데이터를 기초로 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는 단계를 포함하는
피드백 데이터 기반 자가 학습 방법. - 제 1 항에 있어서,
상기 피드백 데이터는,
상기 답변 데이터에 대한 답변 만족도 및 상기 질문에 대한 기대 답변 데이터 중 적어도 하나를 포함하는
피드백 데이터 기반 자가 학습 방법. - 제 2 항에 있어서,
상기 딥러닝 모델을 재 학습시키는 단계는,
상기 답변 만족도를 기초로 상기 답변 데이터에 대한 가중치를 조절하여 상기 딥러닝 모델을 재 학습시키는
피드백 데이터 기반 자가 학습 방법. - 제 2 항에 있어서,
상기 딥러닝 모델을 재 학습시키는 단계는,
상기 이미지와 상기 이미지에 관한 질문을 입력으로, 상기 기대 답변 데이터를 레이블 데이터로 하여 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는
피드백 데이터 기반 자가 학습 방법. - 제 2 항에 있어서,
상기 딥러닝 모델을 재 학습시키는 단계는,
상기 이미지를 기초로 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성하는 단계와,
상기 이미지, 상기 다수의 이미지 및 상기 이미지에 관한 질문을 입력으로, 상기 기대 답변 데이터를 레이블 데이터로 하여 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는 단계를 포함하는
피드백 데이터 기반 자가 학습 방법. - 제 5 항에 있어서,
상기 다수의 이미지를 생성하는 단계는,
상기 이미지를 기초로 상기 이미지의 각도 또는 상기 이미지의 색을 변형하여 상기 이미지에서 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성하는
피드백 데이터 기반 자가 학습 방법. - 이미지와 상기 이미지에 관한 질문을 입력 받는 입출력부;
메모리; 및
상기 메모리와 전기적으로 연결된 프로세서를 포함하고,
상기 프로세서는,
기 학습되어 있는 딥러닝 모델을 이용하여 상기 질문에 대한 답변 데이터를 생성하고, 상기 입출력부를 통해 상기 답변 데이터에 기초한 피드백 데이터를 사용자로부터 입력 받아, 상기 피드백 데이터를 기초로 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는
피드백 데이터 기반 자가 학습 장치. - 제 7 항에 있어서,
상기 피드백 데이터는,
상기 답변 데이터에 대한 답변 만족도 및 상기 질문에 대한 기대 답변 데이터 중 적어도 하나를 포함하는
피드백 데이터 기반 자가 학습 장치. - 제 8 항에 있어서,
상기 프로세서는,
상기 답변 만족도를 기초로 상기 답변 데이터에 대한 가중치를 조절하여 상기 딥러닝 모델을 재 학습시키는
피드백 데이터 기반 자가 학습 장치. - 제 8 항에 있어서,
상기 프로세서는,
상기 이미지와 상기 이미지에 관한 질문을 입력으로, 상기 기대 답변 데이터를 레이블 데이터로 하여 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는
피드백 데이터 기반 자가 학습 장치. - 제 8 항에 있어서,
상기 프로세서는,
상기 이미지를 기초로 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성하고, 상기 이미지, 상기 다수의 이미지 및 상기 이미지에 관한 질문을 입력으로, 상기 기대 답변 데이터를 레이블 데이터로 하여 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는
피드백 데이터 기반 자가 학습 장치. - 제 11 항에 있어서,
상기 프로세서는,
상기 이미지를 기초로 상기 이미지의 각도 또는 상기 이미지의 색을 변형하여 상기 이미지에서 서로 상이하게 소정 부분 변형된 다수의 이미지를 생성하는
피드백 데이터 기반 자가 학습 장치. - 컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,
상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면,
이미지와 상기 이미지에 관한 질문을 입력 받는 단계와,
기 학습되어 있는 딥러닝 모델을 이용하여 상기 질문에 대한 답변 데이터를 생성하는 단계와,
상기 답변 데이터에 기초한 피드백 데이터를 사용자로부터 입력 받아, 상기 피드백 데이터를 기초로 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는 단계를 포함하는 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는
컴퓨터 판독 가능한 기록매체. - 컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,
상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면,
이미지와 상기 이미지에 관한 질문을 입력 받는 단계와,
기 학습되어 있는 딥러닝 모델을 이용하여 상기 질문에 대한 답변 데이터를 생성하는 단계와,
상기 답변 데이터에 기초한 피드백 데이터를 사용자로부터 입력 받아, 상기 피드백 데이터를 기초로 상기 기 학습되어 있는 딥러닝 모델을 재 학습시키는 단계를 포함하는 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는
컴퓨터 프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210047767A KR20220141537A (ko) | 2021-04-13 | 2021-04-13 | 피드백 데이터 기반 자가 학습 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210047767A KR20220141537A (ko) | 2021-04-13 | 2021-04-13 | 피드백 데이터 기반 자가 학습 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220141537A true KR20220141537A (ko) | 2022-10-20 |
Family
ID=83804825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210047767A KR20220141537A (ko) | 2021-04-13 | 2021-04-13 | 피드백 데이터 기반 자가 학습 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20220141537A (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180038937A (ko) | 2015-11-03 | 2018-04-17 | 바이두 유에스에이 엘엘씨 | 시각 문답을 위한 시스템 및 방법 |
-
2021
- 2021-04-13 KR KR1020210047767A patent/KR20220141537A/ko not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180038937A (ko) | 2015-11-03 | 2018-04-17 | 바이두 유에스에이 엘엘씨 | 시각 문답을 위한 시스템 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102069096B1 (ko) | 피지컬 디바이스의 직접적 원격 제어 장치 | |
JP7313558B2 (ja) | 対話応答生成システムのためのシステムおよび方法 | |
KR102239186B1 (ko) | 인공지능 기반 로봇 매니퓰레이터의 자동 제어 시스템 및 방법 | |
Cruz et al. | Interactive reinforcement learning through speech guidance in a domestic scenario | |
US20190102648A1 (en) | Simple programming method and device based on image recognition | |
CN105929948B (zh) | 基于增强现实自学习型智能头盔及其运行方法 | |
KR102283416B1 (ko) | Gan 기반 딥러닝 모델을 이용한 이미지 생성 방법 및 장치 | |
CN104985599A (zh) | 基于人工智能的智能机器人控制方法、系统及智能机器人 | |
KR20210033809A (ko) | 인공 신경망을 이용하여 로봇을 제어하는 제어 서버 및 방법와, 이를 구현하는 로봇 | |
US11738465B2 (en) | Robot and controlling method thereof | |
US10997947B2 (en) | Electronic device and control method thereof | |
Mahadevan et al. | Generative expressive robot behaviors using large language models | |
KR102102418B1 (ko) | 인공지능 솔루션을 테스트하는 장치 및 방법 | |
CN116205294A (zh) | 一种用于机器人社交的知识库自更新方法、装置及机器人 | |
KR20220141537A (ko) | 피드백 데이터 기반 자가 학습 장치 및 방법 | |
US20210142690A1 (en) | System and method for reporting educational robot programming | |
CN116324763A (zh) | 使用多个聊天机器人进行问题应答的电子设备及其控制方法 | |
CN117635383A (zh) | 一种虚拟导师与多人协作口才培训系统、方法及设备 | |
CN106251717A (zh) | 智能机器人语言跟读学习方法和装置 | |
WO2024103637A1 (zh) | 舞蹈动作生成方法、计算机设备及存储介质 | |
KR102069093B1 (ko) | 피지컬 소프트웨어 코딩교육장치 | |
Liu et al. | A demonstration of human-robot communication based on multiskilled language-image analysis | |
Moulin-Frier et al. | Autonomous development of turn-taking behaviors in agent populations: A computational study | |
Demeter et al. | Cognitive robotics software development aspects based on experiments of future software engineers | |
KR102336500B1 (ko) | 의사-레이블 데이터 생성 방법 및 장치, 의사-레이블 데이터를 이용한 심층 신경망 학습 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |