KR20210083726A

KR20210083726A - 알고리즘의 갱신을 위한 학습 데이터 결정 방법 및 장치

Info

Publication number: KR20210083726A
Application number: KR1020190176316A
Authority: KR
Inventors: 이충희
Original assignee: 재단법인대구경북과학기술원
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2021-07-07
Also published as: KR102315622B1

Abstract

알고리즘 갱신을 위한 학습 데이터를 결정하기 위해, 복수의 데이터들 중 시드 데이터를 결정하고, 시드 데이터에 기초하여 학습 영역이 설정되고, 학습 영역 내의 타겟 데이터들에 기초하여 알고리즘을 갱신하고, 알고리즘의 성능이 미리 설정된 조건을 만족하는지 여부를 결정하고, 만족 여부에 기초하여 타겟 데이터들을 학습 데이터로 결정한다.

Description

알고리즘의 갱신을 위한 학습 데이터 결정 방법 및 장치{METHOD AND APPARATUS FOR DETERMINING TRAINING DATA FOR UPDATING ALGORITHM}

아래의 실시예들은 알고리즘의 갱신을 위한 학습 데이터를 결정하는 기술에 관한 것으로, 구체적으로 복수의 데이터들 중 시드 데이터에 기초하여 습 데이터를 결정하는 기술에 관한 것이다.

최근 인공지능 기술의 발달로 다양한 분야에서 인공지능 기술을 접목하여 지능형 시스템을 개발하고자 하는 노력이 많이 이루어지고 있다. 부분의 인공지능은 다양한 학습 데이터를 기반으로 학습을 통하여 모델을 구축하고, 구축된 모델에 기초하여 새로운 데이터가 입력된 경우 이에 대한 결과를 출력한다. 정확한 결과가 출력되기 위해서는, 정확한 모델 구축이 요구되며 이를 위해서는 학습 데이터의 개수 및 품질이 중요하다.

일 실시예는 알고리즘 갱신을 위해 사용되는 학습 데이터를 결정하는 방법 및 장치를 제공할 수 있다.

일 실시예는 복수의 데이터들 중 시드 데이터를 결정하고, 시드 데이터에 기초하여 학습 데이터를 결정하는 방법 및 장치를 제공할 수 있다.

일 측면에 따른, 전자 장치에 의해 수행되는, 학습 데이터 결정 방법은, 적어도 2차원의 좌표를 갖는 복수의 데이터들 중 시드 데이터를 결정하는 단계, 상기 시드 데이터에 기초하여 제1 학습 영역을 설정하는 단계, 상기 제1 학습 영역 내의 제1 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하는 단계, 상기 갱신된 타겟 알고리즘의 제1 성능을 결정하는 단계, 상기 제1 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정하는 단계, 상기 조건이 만족되지 않은 경우, 상기 시드 데이터에 기초하여 상기 제1 학습 영역 보다 큰 제2 학습 영역을 설정하는 단계, 상기 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 상기 타겟 알고리즘을 갱신하는 단계, 상기 갱신된 타겟 알고리즘의 제2 성능을 결정하는 단계, 상기 제2 성능에 기초하여 상기 조건이 만족되는지 여부를 결정하는 단계, 및 상기 조건이 만족된 경우, 상기 제2 타겟 데이터들을 학습 데이터로 결정하는 단계를 포함한다.

상기 시드 데이터를 결정하는 단계는, 상기 복수의 데이터들 각각 간의 거리를 계산하는 단계, 및 다른 데이터들과의 거리의 합이 가장 짧은 데이터를 상기 시드 데이터로 결정하는 단계를 포함할 수 있다.

상기 미리 설정된 조건은 이전 성능에 비하여 현재 성능이 개선되지 않았고, 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하인 경우일 수 있다.

상기 제2 학습 영역을 설정하는 단계는, 상기 시드 데이터로부터 미리 설정된 거리를 갖는 범위 이내의 영역을 상기 제2 학습 영역으로 설정하는 단계를 포함할 수 있다.

상기 제2 학습 영역을 설정하는 단계는, 상기 제2 타겟 데이터들의 개수가 미리 설정된 개수가 되도록 상기 제2 학습 영역을 설정하는 단계를 포함할 수 있다.

상기 학습 데이터 결정 방법은, 새로운 데이터들을 수신하는 단계, 및 상기 제2 학습 영역에 기초하여 상기 새로운 데이터들 중 추가 학습 데이터를 결정하는 단계를 더 포함할 수 있다.

다른 일 측면에 따른, 학습 데이터를 결정하는 전자 장치는, 학습 데이터를 결정하는 프로그램이 기록된 메모리, 및 상기 프로그램을 수행하는 프로세서를 포함하고, 상기 프로그램은, 적어도 2차원의 좌표를 갖는 복수의 데이터들 중 시드 데이터를 결정하는 단계, 상기 시드 데이터에 기초하여 제1 학습 영역을 설정하는 단계, 상기 제1 학습 영역 내의 제1 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하는 단계, 상기 갱신된 타겟 알고리즘의 제1 성능을 결정하는 단계, 상기 제1 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정하는 단계, 상기 조건이 만족되지 않은 경우, 상기 시드 데이터에 기초하여 상기 제1 학습 영역 보다 큰 제2 학습 영역을 설정하는 단계, 상기 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 상기 타겟 알고리즘을 갱신하는 단계, 상기 갱신된 타겟 알고리즘의 제2 성능을 결정하는 단계, 상기 제2 성능에 기초하여 상기 조건이 만족되는지 여부를 결정하는 단계, 및 상기 조건이 만족된 경우, 상기 제2 타겟 데이터들을 학습 데이터로 결정하는 단계를 수행한다.

또 다른 일 측면에 따른, 전자 장치에 의해 수행되는, 학습 데이터 결정 방법은, 적어도 2차원의 좌표를 갖는 복수의 데이터들 중 제1 시드 데이터를 결정하는 단계, 상기 제1 시드 데이터에 기초하여 제1 학습 영역을 설정하는 단계, 상기 제1 학습 영역 내의 제1 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하는 단계, 상기 갱신된 타겟 알고리즘의 제1 성능을 결정하는 단계, 상기 제1 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정하는 단계, 상기 제1 시드 데이터로부터 미리 설정된 거리 이내에 있는 데이터에 기초하여 제2 시드 데이터를 결정하는 단계, 상기 제2 시드 데이터에 기초하여 제2 학습 영역을 설정하는 단계, 상기 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 상기 타겟 알고리즘을 갱신하는 단계, 상기 갱신된 타겟 알고리즘의 제2 성능을 결정하는 단계, 상기 제2 성능에 기초하여 상기 조건이 만족되는지 여부를 결정하는 단계, 및 상기 조건이 만족된 경우, 상기 제2 타겟 데이터들을 학습 데이터로 결정하는 단계를 포함한다.

상기 제2 학습 영역을 설정하는 단계는, 상기 제1 학습 영역의 크기와 동일하도록 상기 제2 학습 영역을 설정하는 단계를 포함할 수 있다.

상기 제1 학습 영역을 설정하는 단계는, 상기 복수의 데이터들 중 미리 설정된 개수 이상이 포함되도록 상기 제1 학습 영역을 설정하는 단계를 포함할 수 있다.

상기 제2 시드 데이터를 결정하는 단계는, 상기 제1 타겟 데이터들 중 하나 이상의 최 외곽 데이터들을 결정하는 단계, 및 상기 하나 이상의 최 외곽 데이터들 중 어느 하나를 상기 제2 시드 데이터로 결정하는 단계를 포함하고, 상기 제2 학습 영역을 설정하는 단계는, 상기 제1 학습 영역의 크기 보다 작도록 상기 제2 학습 영역을 설정하는 단계를 포함할 수 있다.

또 다른 일 측면에 따른, 학습 데이터를 결정하는 전자 장치는, 학습 데이터를 결정하는 프로그램이 기록된 메모리, 및 상기 프로그램을 수행하는 프로세서를 포함하고, 상기 프로그램은, 적어도 2차원의 좌표를 갖는 복수의 데이터들 중 제1 시드 데이터를 결정하는 단계, 상기 제1 시드 데이터에 기초하여 제1 학습 영역을 설정하는 단계, 상기 제1 학습 영역 내의 제1 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하는 단계, 상기 갱신된 타겟 알고리즘의 제1 성능을 결정하는 단계, 상기 제1 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정하는 단계, 상기 제1 시드 데이터로부터 미리 설정된 거리 이내에 있는 데이터에 기초하여 제2 시드 데이터를 결정하는 단계, 상기 제2 시드 데이터에 기초하여 제2 학습 영역을 설정하는 단계, 상기 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 상기 타겟 알고리즘을 갱신하는 단계, 상기 갱신된 타겟 알고리즘의 제2 성능을 결정하는 단계, 상기 제2 성능에 기초하여 상기 조건이 만족되는지 여부를 결정하는 단계, 및 상기 조건이 만족된 경우, 상기 제2 타겟 데이터들을 학습 데이터로 결정하는 단계를 수행한다.

도 1은 일 예에 따른 알고리즘 갱신 방법의 개략도이다.
도 2는 일 실시예 따른 학습 데이터를 결정하는 전자 장치의 구성도이다.
도 3은 일 실시예 따른 학습 데이터를 결정하는 방법의 흐름도이다.
도 4는 일 예에 따른 제1 시드 데이터를 결정하는 방법의 흐름도이다.
도 5는 일 예에 따른 제1 시드 데이터 및 제1 학습 영역을 도시한다.
도 6은 일 예에 따른 학습 데이터를 결정하기 위해 미리 설정된 조건을 도시한다.
도 7은 일 예에 따른 제2 학습 영역 및 제3 학습 영역을 도시한다.
도 8은 일 예에 따른 새로운 데이터들 중 추가 학습 데이터를 결정하는 방법의 흐름도이다.
도 9는 다른 일 실시예에 따른 학습 데이터를 결정하는 방법의 흐름도이다.
도 10은 다른 일 예에 따른 학습 데이터를 결정하기 위해 미리 설정된 조건을 도시한다.
도 11은 일 예에 따른 결정된 제2 시드 데이터를 도시한다.
도 12는 일 예에 따른 최 외곽 데이터에 기초하여 제2 시드 데이터를 결정하는 방법을 도시한다.
도 13은 일 예에 따른 최 외곽 데이터에 기초하여 결정된 제2 시드 데이터를 도시한다.
도 14는 또 다른 일 예에 따른 학습 데이터를 결정하기 위해 미리 설정된 조건을 도시한다.

이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.

아래 설명하는 실시예들에는 다양한 변경이 가해질 수 있다. 아래 설명하는 실시예들은 실시 형태에 대해 한정하려는 것이 아니며, 이들에 대한 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

실시예에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 실시예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

도 1은 일 예에 따른 알고리즘 갱신 방법의 개략도이다.

일 측면에 따른, 알고리즘(또는, 학습 모델)은 신경망(neural network)에 기초한 알고리즘, SVM(support vector machine)과 같이 훈련 또는 학습이 가능한 알고리즘일 수 있고, 기재된 실시예로 한정되지 않는다. 예를 들어, 알고리즘은 복수의 레이더들을 포함하고, 레이어들의 노드들 간에 설정된 파라미터에 기초하여 입력에 대응하는 출력을 생성한다. 알고리즘의 일 예로서, 알고리즘은 이미지가 입력되면, 출력으로서 이미지 내의 오브젝트가 개인지 또는 고양이인지 결정할 수 있다.

알고리즘이 정확한 결과를 출력하기 위해서는, 알고리즘을 구성하는 레이어들 및 노드들에 대한 정확한 파라미터가 결정되어야 한다. 예를 들어, 관리자는 학습 데이터를 알고리즘에 입력하고, 알고리즘의 결과가 오류인 경우 그 오류가 알고리즘에 반영되도록 알고리즘이 갱신될 수 있다. 알고리즘을 갱신하기 위해, 역전파(back propagation)와 같은 방법이 사용될 수 있고, 기재된 실시예로 한정되지 않는다.

그러나 학습 데이터에는 다양한 에러가 존재할 수 있으며, 에러가 있는 데이터를 학습 데이터로 사용하였을 때, 알고리즘의 정확도에는 악영향을 줄 수 있다. 일반적으로 다양하고 많은 개수의 양질의 학습 데이터는 알고리즘의 성능 향상에 많은 도움을 주지만, 품질이 나쁜 학습 데이터는 알고리즘에 오히려 악영향을 주어 성능 저하를 가져올 수 있다. 특히 영상 데이터의 경우에는 사람이 직접 보면서 판단하여 에러가 있거나 품질이 나쁜 영상을 제거할 수 있다. 그러나 센서 데이터를 학습 데이터로 취득한 경우에는, 센서 데이터에 대한 에러를 판단하기 어려울 수 있다.

아래에서 도 2 내지 도 14를 참조하여 복수의 데이터들 중 알고리즘의 갱신을 위한 학습 데이터를 결정하는 방법에 대해 상세히 설명된다.

도 2는 일 실시예 따른 학습 데이터를 결정하는 전자 장치의 구성도이다.

전자 장치(200)는 통신부(210), 프로세서(220), 및 메모리(230)를 포함한다.

통신부(210)는 프로세서(220), 및 메모리(230)와 연결되어 데이터를 송수신한다. 통신부(210)는 외부의 다른 장치와 연결되어 데이터를 송수신할 수 있다. 이하에서 "A"를 송수신한다라는 표현은 "A를 나타내는 정보(information) 또는 데이터"를 송수신하는 것을 나타낼 수 있다.

통신부(210)는 전자 장치(200) 내의 회로망(circuitry)으로 구현될 수 있다. 예를 들어, 통신부(210)는 내부 버스(internal bus) 및 외부 버스(external bus)를 포함할 수 있다. 다른 예로, 통신부(210)는 전자 장치(200)와 외부의 장치를 연결하는 요소일 수 있다. 통신부(210)는 인터페이스(interface)일 수 있다. 통신부(210)는 외부의 장치로부터 데이터를 수신하여, 프로세서(220) 및 메모리(230)에 데이터를 전송할 수 있다.

프로세서(220)는 통신부(210)가 수신한 데이터 및 메모리(230)에 저장된 데이터를 처리한다. "프로세서"는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 데이터 처리 장치일 수 있다. 예를 들어, 목적하는 동작들은 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다. 예를 들어, 하드웨어로 구현된 데이터 처리 장치는 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array)를 포함할 수 있다.

프로세서(220)는 메모리(예를 들어, 메모리(230))에 저장된 컴퓨터로 읽을 수 있는 코드(예를 들어, 소프트웨어) 및 프로세서(220)에 의해 유발된 인스트럭션들을 실행한다.

메모리(230)는 통신부(210)가 수신한 데이터 및 프로세서(220)가 처리한 데이터를 저장한다. 예를 들어, 메모리(230)는 프로그램(또는 어플리케이션, 소프트웨어)을 저장할 수 있다. 저장되는 프로그램은 학습 데이터를 결정할 수 있도록 코딩되어 프로세서(220)에 의해 실행 가능한 신텍스(syntax)들의 집합일 수 있다.

일 측면에 따르면, 메모리(230)는 하나 이상의 휘발성 메모리, 비휘발성 메모리 및 RAM(Random Access Memory), 플래시 메모리, 하드 디스크 드라이브 및 광학 디스크 드라이브를 포함할 수 있다.

메모리(230)는 전자 장치(200)를 동작 시키는 명령어 세트(예를 들어, 소프트웨어)를 저장한다. 전자 장치(200)를 동작 시키는 명령어 세트는 프로세서(220)에 의해 실행된다.

통신부(210), 프로세서(220), 및 메모리(230)에 대해, 아래에서 도 3 내지 도 14를 참조하여 상세히 설명된다.

도 3은 일 실시예 따른 학습 데이터를 결정하는 방법의 흐름도이다.

아래의 단계들(310 내지 370)은 도 2를 참조하여 전술된 전자 장치(200)에 의해 수행된다.

단계(310)에서, 전자 장치(200)는 적어도 2차원의 좌표를 갖는 복수의 데이터들 중 시드(seed) 데이터를 결정한다. 예를 들어, 데이터는 2가지 이상에 대한 센싱 결과 값들을 포함하고, 결과 값들에 기초하여 2차원의 좌표를 가질 수 있다.

시드 데이터는 복수의 데이터들 중 대표성이 높은 데이터일 수 있고, 시드 데이터를 결정하는 방법에 대해, 아래에서 도 4 및 5를 참조하여 상세히 설명된다.

단계(320)에서, 전자 장치(200)는 시드 데이터에 기초하여 학습 영역을 설정한다.

처음 설정되는 학습 영역은 제1 학습 영역으로 정의될 수 있다. 예를 들어, 시드 데이터로부터 미리 설정된 제1 거리를 갖는 범위 이내의 영역이 제1 학습 영역으로 설정될 수 있다. 제1 학습 영역 내의 데이터들이 제1 타겟 데이터들로 정의된다.

단계(330)에서, 전자 장치(200)는 학습 영역 내의 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신한다. 예를 들어, 타겟 데이터들이 알고리즘에 입력된 경우, 그 결과에 기초하여 타겟 알고리즘이 갱신될 수 있다.

단계(340)에서, 전자 장치(200)는 갱신된 타겟 알고리즘의 성능을 결정한다. 예를 들어, 제1 타겟 데이터에 기초하여 타겟 알고리즘이 갱신된 경우, 제1 성능이 결정될 수 있다. 성능은 결과의 정확도에 비례한다.

단계(350)에서, 전자 장치(200)는 성능에 기초하여 미리 설정된 조건이 만족되었는지 여부를 결정한다. 예를 들어, 미리 설정된 조건은 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하이고(제1 조건), 이전 성능에 비하여 현재 성능이 개선되지 않은 경우(제2 조건)일 수 있다. 제1 조건 및 제2 조건이 동시에 만족된 경우 미리 설정된 조건이 만족된 것으로 결정될 수 있다. 제1 조건 및 제2 조건에 대해, 아래에서 도 6을 참조하여 상세히 설명된다.

단계(360)에서, 전자 장치(200)는 미리 설정된 조건이 만족된 경우, 타겟 데이터를 학습 데이터로 결정한다. 또한, 학습 영역에 대한 정보가 저장될 수 있다.

단계(370)에서, 전자 장치(200)는 미리 설정된 조건이 만족되지 않은 경우, 시드 데이터에 기초하여 새로운 학습 영역을 설정한다. 새로운 학습 영역은 제2 학습 영역으로 정의된다.

학습 영역이 제2 학습 영역으로 정의된 경우, 전술된 단계들(330 내지 350)이 재 수행될 수 있다. 즉, 전자 장치(200)는 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하고(단계(330)), 갱신된 타겟 알고리즘의 제2 성능을 결정하고(단계(340)), 제2 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정한다(단계(350)). 미리 설정된 조건이 만족된 경우, 단계(360)가 수행되고, 미리 설정된 조건이 만족되지 않는 경우, 단계(370)가 수행되어 새로운 학습 영역으로서 제3 학습 영역이 설정된다.

도 4는 일 예에 따른 제1 시드 데이터를 결정하는 방법의 흐름도이다.

일 측면에 따르면, 도 3을 참조하여 전술된 단계(310)는 아래의 단계들(410 및 420)을 포함할 수 있다.

단계(410)에서, 전자 장치(200)는 복수의 데이터들 각각 간의 거리를 계산한다. 예를 들어, 거리는 L1-norm 또는 L2-norm을 사용한 방법이 사용될 수 있으나, 기재된 실시예로 한정되지 않는다.

단계(420)에서, 전자 장치(200)는 다른 데이터들과의 거리의 합이 가장 짧은 데이터를 시드 데이터로 결정한다.

도 5는 일 예에 따른 제1 시드 데이터 및 제1 학습 영역을 도시한다.

도 5의 상단 그림은 2차원의 좌표를 갖는 복수의 데이터들을 도시하고, 중간 그림은 데이터(510)와 다른 데이터들(511, 512, 513) 각각에 대한 거리를 나타낸다. 중간 그림은 데이터(510)를 기준으로 도시되었으나, 예를 들어, 데이터(511)와 다른 데이터들(510, 512, 513) 각각에 대한 거리가 계산된다.

데이터(510)에 대한 거리의 합이 다른 데이터들(510, 512, 513)에 대한 거리의 합들 보다 짧은 경우, 데이터(510)가 시드 데이터로 결정된다.

데이터(510)로부터 미리 설정된 거리를 갖는 범위 이내의 영역이 제1 학습 영역(520)으로 설정된다. 제1 학습 영역(520) 내의 데이터들이 제1 타겟 데이터들로 정의된다. 제1 학습 영역을 정의하는 거리는 전체 데이터들의 개수에 따라 다르게 설정될 수 있다.

도 6은 일 예에 따른 학습 데이터를 결정하기 위해 미리 설정된 조건을 도시한다.

일 측면에 따르면, 제1 조건은 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하일 수 있다. 알고리즘의 갱신 횟수가 증가하여 학습 영역을 정의하는 거리가 길어질수록(즉, 학습 영역의 크기가 커질수록) 초기에는 타겟 데이터의 개수가 급격하게 증가하지만, 나중에는 증가 속도가 감소하는 경향이 있다. 이에 따라, 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하는 대부분의 데이터들이 타겟 데이터로 정의되었다는 것을 의미할 수 있다.

학습 영역의 크기 대비 타겟 데이터 개수를 나타내는 관계(610)를 나타내는 도 6의 상단 그래프에서 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하인 지점(611)이 결정될 수 있다.

일 측면에 따르면, 제2 조건은 알고리즘의 이전 성능에 비하여 현재 성능이 개선되지 않은 경우일 수 있다. 훈련이 상당히 진행된 경우에는 결과의 정확도가 더 상승하지 않을 수 있고, 학습 데이터의 품질이 나쁜 경우에는 오히려 정확도가 감소될 수도 있다.

알고리즘의 갱신 횟수 대비 성능을 나타내는 관계(620)를 나타내는 도 6의 하단 그래프에서 알고리즘의 이전 성능에 비하여 현재 성능이 개선되지 않는 지점(621)이 결정될 수 있다.

예를 들어, 지점(621)이 지점(611)에 비해 늦게 나타나는 경우, 지점(621)과 관련된 타겟 데이터들이 학습 데이터로 결정될 수 있다.

도 7은 일 예에 따른 제2 학습 영역 및 제3 학습 영역을 도시한다.

도 7의 상단 그림은 제2 학습 영역을 도시하고, 도 7의 하단 그림은 제3 학습 영역을 도시한다.

제2 학습 영역은 제1 학습 영역에 비해 넓은 면적을 포함하고, 제3 학습 영역은 제2 학습 영역에 비해 넓은 면적을 포함한다. 알고리즘의 갱신 횟수가 증가할수록 해당 학습 영역의 면적은 증가할 수 있다.

일 측면에 따르면, 제2 학습 영역은 시드 데이터로부터 미리 설정된 범위 이내의 영역을 갖도록 설정될 수 있다. 즉, 시드 데이터로부터의 직경이 미리 설정될 수 있다.

일 측면에 따르면, 제2 학습 영역은 제2 타겟 데이터들의 개수가 미리 설정된 개수가 되도록 설정될 수 있다. 상기의 경우에는 데이터들의 분포에 따라 설정되는 학습 영역의 크기가 달라질 수 있다.

도 8은 일 예에 따른 새로운 데이터들 중 추가 학습 데이터를 결정하는 방법의 흐름도이다.

일 측면에 따르면, 아래의 단계(810)는 도 3을 참조하여 전술된 단계(360)가 수행된 후 수행될 수 있다.

단계(810)에서, 전자 장치(200)는 새로운 데이터들을 수신한다. 새로운 데이터는 알고리즘의 갱신이 완료된 이후에 추가로 수신된 데이터일 수 있다.

단계(820)에서, 전자 장치(200)는 학습 영역에 기초하여 새로운 데이터들 중 추가 학습 데이터를 결정한다. 예를 들어, 새로운 데이터들 중 학습 영역 내에 포함되는 데이터는 학습 데이터에서 배제될 수 있다. 다른 예로, 새로운 데이터들로 인하여 새로운 집단이 형성되는 경우, 학습 데이터에서 배제되었던 데이터들(기존 데이터 및 새로운 데이터 포함)이 추가 학습 데이터로서 결정될 수 있다.

도 9는 다른 일 실시예에 따른 학습 데이터를 결정하는 방법의 흐름도이다.

아래의 단계들(910 내지 970)은 도 2를 참조하여 전술된 전자 장치(200)에 의해 수행된다.

단계(910)에서, 전자 장치(200)는 복수의 데이터들 중 시드 데이터를 결정한다. 시드 데이터를 결정하는 방법은 도 3 내지 5를 참조하여 전술된 시드 데이터를 결정하는 방법과 유사하므로, 간결하고 명확한 설명을 위해 이하에서 생략한다. 처음으로 결정되는 제1 시드 데이터로 정의된다.

단계(920)에서, 전자 장치(200)는 시드 데이터에 기초하여 학습 영역을 설정한다. 예를 들어, 제1 시드 데이터로부터 미리 설정된 거리를 갖는 범위 이내의 영역이 제1 학습 영역으로 설정될 수 있다.

단계(930)에서, 전자 장치(200)는 학습 영역 내의 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신한다

단계(940)에서, 전자 장치(200)는 갱신된 타겟 알고리즘의 성능을 결정한다. 예를 들어, 제1 타겟 데이터에 기초하여 타겟 알고리즘이 갱신된 경우, 제1 성능이 결정될 수 있다. 성능은 결과의 정확도에 비례한다.

단계(950)에서, 전자 장치(200)는 성능에 기초하여 미리 설정된 조건이 만족되었는지 여부를 결정한다. 예를 들어, 미리 설정된 조건은 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하이고(제1 조건), 이전 성능에 비하여 현재 성능이 개선되지 않은 경우(제2 조건)일 수 있다. 제1 조건 및 제2 조건이 동시에 만족된 경우 미리 설정된 조건이 만족된 것으로 결정될 수 있다. 제1 조건 및 제2 조건에 대해, 아래에서 도 10 및 도 14를 참조하여 상세히 설명된다.

단계(960)에서, 전자 장치(200)는 미리 설정된 조건이 만족된 경우, 타겟 데이터를 학습 데이터로 결정한다. 또한, 학습 영역에 대한 정보가 저장될 수 있다.

단계(970)에서, 전자 장치(200)는 미리 설정된 조건이 만족되지 않은 경우, 시드 데이터로부터 미리 설정된 거리 이내에 있는 데이터에 기초하여 새로운 시드 데이터를 결정한다. 현재의 시드 데이터가 제1 시드 데이터인 경우, 새로운 시드 데이터는 제2 시드 데이터로 정의된다.

새로운 시드 데이터(예를 들어, 제2 시드 데이터)가 결정된 경우, 전술된 단계들(920 내지 950)이 재 수행될 수 있다. 즉, 전자 장치(200)는 제2 시드 데이터에 기초하여 제2 학습 영역을 설정(단계(920))하고, 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하고(단계(930)), 갱신된 타겟 알고리즘의 제2 성능을 결정하고(단계(940)), 제2 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정한다(단계(950)). 미리 설정된 조건이 만족된 경우, 단계(960)가 수행되고, 미리 설정된 조건이 만족되지 않는 경우, 단계(970)가 수행되어 새로운 시드 데이터로서 제3 시드 데이터가 결정된다.

도 10은 다른 일 예에 따른 학습 데이터를 결정하기 위해 미리 설정된 조건을 도시한다.

일 측면에 따르면, 제1 학습 영역의 크기와 동일하도록 제2 학습 영역이 설정되는 실시예에 대한 미리 설정된 조건이 아래에서 설명된다.

일 측면에 따르면, 제1 조건은 알고리즘의 갱신 횟수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하일 수 있다. 새롭게 생성되는 학습 영역의 크기는 이전의 학습 영역의 크기와 동일하므로, 알고리즘의 갱신이 반복될수록 새롭게 타겟 데이터로 설정되는 데이터의 개수가 감소하는 경향이 있다. 이에 따라, 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하는 대부분의 데이터들이 타겟 데이터로 정의되었다는 것을 의미할 수 있다.

알고리즘의 갱신 횟수 대비 타겟 데이터 개수를 나타내는 관계(1010)를 나타내는 도 10의 상단 그래프에서 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하인 지점(1011)이 결정될 수 있다.

알고리즘의 갱신 횟수 대비 성능을 나타내는 관계(1020)를 나타내는 도 10의 하단 그래프에서 알고리즘의 이전 성능에 비하여 현재 성능이 개선되지 않는 지점(1021)이 결정될 수 있다.

예를 들어, 지점(1021)이 지점(1011)에 비해 늦게 나타나는 경우, 지점(1021)과 관련된 타겟 데이터들이 학습 데이터로 결정될 수 있다.

도 11은 일 예에 따른 결정된 제2 시드 데이터를 도시한다.

일 측면에 따르면, 제1 시드 데이터(1110)와 미리 설정된 거리 이내에 있는 데이터가 제2 시드 데이터(1130)로 결정될 수 있다. 제2 시드 데이터(1130)에 기초하여 제2 학습 영역이 설정될 수 있다. 예를 들어, 제1 학습 영역의 크기와 동일하도록 제2 학습 영역이 설정될 수 있다.

새로운 시드 데이터의 결정은 임의적이나, 특정 방향에서 결정된 시드 데이터에 기초한 알고리즘 갱신에 의한 성능이 많이 향상된 경우 해당 방향으로 가중치를 더 주어서 시드 데이터가 결정되도록 할 수 있다.

도 10 내지 11을 참조하여 설명된 실시예와는 상이한 실시예가 도 12 내지 14를 참조하여 설명된다.

도 12는 일 예에 따른 최 외곽 데이터에 기초하여 제2 시드 데이터를 결정하는 방법을 도시한다.

일 측면에 따르면, 도 9를 참조하여 전술된 단계(970)는 아래의 단계들(1210 및 1220)을 포함할 수 있다.

단계(1210)에서, 전자 장치(200)는 제1 타겟 데이터들 중 하나 이상의 최 외곽 데이터들을 결정한다.

단계(1220)에서, 전자 장치(200)는 최 외곽 데이터들 중 어느 하나를 제2 시드 데이터로 결정한다. 제2 시드 데이터가 최 외곽 데이터들 중 임의적으로 결정될 수 있다.

제2 시드 데이터에 기초하여 설정되는 제2 학습 영역의 크기는 제1 학습 영역의 크기 보다 작을 수 있다. 처음 설정되는 제1 학습 영역은 복수의 데이터들 중 미리 설정된 개수 이상이 포함되도록 설정될 수 있다. 예를 들어, 80% 이상의 데이터들이 포함되도록 제1 학습 영역이 설정될 수 있다.

도 13은 일 예에 따른 최 외곽 데이터에 기초하여 결정된 제2 시드 데이터를 도시한다.

일 측면에 따르면, 제1 시드 데이터(1310)에 기초하여 설정된 제1 학습 영역(1320)의 하나 이상의 최 외곽 데이터들이 결정될 수 있다. 예를 들어, 제1 학습 영역(1320)의 경계에서 미리 설정된 거리 이내의 데이터가 최 외곽 데이터로 결정될 수 있다.

하나 이상의 최 외곽 데이터들 중 어느 하나가 임의로 제2 시드 데이터(1330)로 결정될 수 있다. 제2 시드 데이터(1330)에 기초하여 제2 학습 영역(1330)이 설정될 수 있다.

추가적으로, 결정되는 제3 시드 데이터도 제1 학습 영역(1320)의 하나 이상의 최 외곽 데이터들 중 어느 하나가 임의로 결정될 수 있다.

도 14는 또 다른 일 예에 따른 학습 데이터를 결정하기 위해 미리 설정된 조건을 도시한다.

일 측면에 따르면, 제1 학습 영역의 최 외곽 데이터인 제2 시드 데이터에 기초하여 제2 학습 영역이 설정되는 실시예에 대한 미리 설정된 조건이 아래에서 설명된다.

일 측면에 따르면, 제1 조건은 알고리즘의 갱신 횟수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하일 수 있다. 새롭게 생성되는 학습 영역의 크기는 이전의 학습 영역의 크기 보다 작고, 이전 학습 영역과 중복되므로, 알고리즘의 갱신이 반복될수록 새롭게 타겟 데이터로 설정되는 데이터의 개수가 감소하는 경향이 있다. 이에 따라, 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하는 대부분의 데이터들이 타겟 데이터로 정의되었다는 것을 의미할 수 있다.

알고리즘의 갱신 횟수 대비 타겟 데이터 개수를 나타내는 관계(1410)를 나타내는 도 14의 상단 그래프에서 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하인 지점(1411)이 결정될 수 있다.

알고리즘의 갱신 횟수 대비 성능을 나타내는 관계(1420)를 나타내는 도 14의 하단 그래프에서 알고리즘의 이전 성능에 비하여 현재 성능이 개선되지 않는 지점(1421)이 결정될 수 있다.

예를 들어, 지점(1421)이 지점(1411)에 비해 늦게 나타나는 경우, 지점(1421)과 관련된 타겟 데이터들이 학습 데이터로 결정될 수 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

　이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

200: 전자 장치
210: 통신부
220: 프로세서
230: 메모리

Claims

전자 장치에 의해 수행되는, 학습 데이터 결정 방법은,
적어도 2차원의 좌표를 갖는 복수의 데이터들 중 시드 데이터를 결정하는 단계;
상기 시드 데이터에 기초하여 제1 학습 영역을 설정하는 단계;
상기 제1 학습 영역 내의 제1 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하는 단계;
상기 갱신된 타겟 알고리즘의 제1 성능을 결정하는 단계;
상기 제1 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정하는 단계;
상기 조건이 만족되지 않은 경우, 상기 시드 데이터에 기초하여 상기 제1 학습 영역 보다 큰 제2 학습 영역을 설정하는 단계;
상기 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 상기 타겟 알고리즘을 갱신하는 단계;
상기 갱신된 타겟 알고리즘의 제2 성능을 결정하는 단계;
상기 제2 성능에 기초하여 상기 조건이 만족되는지 여부를 결정하는 단계; 및
상기 조건이 만족된 경우, 상기 제2 타겟 데이터들을 학습 데이터로 결정하는 단계
를 포함하는,
학습 데이터 결정 방법.
제1항에 있어서,
상기 시드 데이터를 결정하는 단계는,
상기 복수의 데이터들 각각 간의 거리를 계산하는 단계; 및
다른 데이터들과의 거리의 합이 가장 짧은 데이터를 상기 시드 데이터로 결정하는 단계
를 포함하는,
학습 데이터 결정 방법.
제1항에 있어서,
상기 미리 설정된 조건은 이전 성능에 비하여 현재 성능이 개선되지 않았고, 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하인 경우인,
학습 데이터 결정 방법.
제1항에 있어서,
상기 제2 학습 영역을 설정하는 단계는,
상기 시드 데이터로부터 미리 설정된 거리를 갖는 범위 이내의 영역을 상기 제2 학습 영역으로 설정하는 단계
를 포함하는,
학습 데이터 결정 방법.
제1항에 있어서,
상기 제2 학습 영역을 설정하는 단계는,
상기 제2 타겟 데이터들의 개수가 미리 설정된 개수가 되도록 상기 제2 학습 영역을 설정하는 단계
를 포함하는,
학습 데이터 결정 방법.
제1항에 있어서,
새로운 데이터들을 수신하는 단계; 및
상기 제2 학습 영역에 기초하여 상기 새로운 데이터들 중 추가 학습 데이터를 결정하는 단계
를 더 포함하는,
학습 데이터 결정 방법.
제1항 내지 제6항 중 어느 한 항의 방법을 수행하는 프로그램을 수록한 컴퓨터 판독 가능 기록 매체.
학습 데이터를 결정하는 전자 장치는,
학습 데이터를 결정하는 프로그램이 기록된 메모리; 및
상기 프로그램을 수행하는 프로세서
를 포함하고,
상기 프로그램은,
적어도 2차원의 좌표를 갖는 복수의 데이터들 중 시드 데이터를 결정하는 단계;
상기 시드 데이터에 기초하여 제1 학습 영역을 설정하는 단계;
상기 제1 학습 영역 내의 제1 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하는 단계;
상기 갱신된 타겟 알고리즘의 제1 성능을 결정하는 단계;
상기 제1 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정하는 단계;
상기 조건이 만족되지 않은 경우, 상기 시드 데이터에 기초하여 상기 제1 학습 영역 보다 큰 제2 학습 영역을 설정하는 단계;
상기 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 상기 타겟 알고리즘을 갱신하는 단계;
상기 갱신된 타겟 알고리즘의 제2 성능을 결정하는 단계;
상기 제2 성능에 기초하여 상기 조건이 만족되는지 여부를 결정하는 단계; 및
상기 조건이 만족된 경우, 상기 제2 타겟 데이터들을 학습 데이터로 결정하는 단계
를 수행하는,
전자 장치.
전자 장치에 의해 수행되는, 학습 데이터 결정 방법은,
적어도 2차원의 좌표를 갖는 복수의 데이터들 중 제1 시드 데이터를 결정하는 단계;
상기 제1 시드 데이터에 기초하여 제1 학습 영역을 설정하는 단계;
상기 제1 학습 영역 내의 제1 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하는 단계;
상기 갱신된 타겟 알고리즘의 제1 성능을 결정하는 단계;
상기 제1 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정하는 단계;
상기 제1 시드 데이터로부터 미리 설정된 거리 이내에 있는 데이터에 기초하여 제2 시드 데이터를 결정하는 단계;
상기 제2 시드 데이터에 기초하여 제2 학습 영역을 설정하는 단계;
상기 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 상기 타겟 알고리즘을 갱신하는 단계;
상기 갱신된 타겟 알고리즘의 제2 성능을 결정하는 단계;
상기 제2 성능에 기초하여 상기 조건이 만족되는지 여부를 결정하는 단계; 및
상기 조건이 만족된 경우, 상기 제2 타겟 데이터들을 학습 데이터로 결정하는 단계
를 포함하는,
학습 데이터 결정 방법.
제9항에 있어서,
상기 시드 데이터를 결정하는 단계는,
상기 복수의 데이터들 각각 간의 거리를 계산하는 단계; 및
다른 데이터들과의 거리의 합이 가장 짧은 데이터를 상기 시드 데이터로 결정하는 단계
를 포함하는,
학습 데이터 결정 방법.
제9항에 있어서,
상기 미리 설정된 조건은 이전 성능에 비하여 현재 성능이 개선되지 않았고, 이전 타겟 데이터들의 개수와 현재 타겟 데이터들의 개수 간의 차이가 미리 설정된 개수 이하인 경우인,
학습 데이터 결정 방법.
제9항에 있어서,
상기 제2 학습 영역을 설정하는 단계는,
상기 제1 학습 영역의 크기와 동일하도록 상기 제2 학습 영역을 설정하는 단계
를 포함하는,
학습 데이터 결정 방법.
제9항에 있어서,
상기 제1 학습 영역을 설정하는 단계는,
상기 복수의 데이터들 중 미리 설정된 개수 이상이 포함되도록 상기 제1 학습 영역을 설정하는 단계
를 포함하는,
학습 데이터 결정 방법.
제13항에 있어서,
상기 제2 시드 데이터를 결정하는 단계는,
상기 제1 타겟 데이터들 중 하나 이상의 최 외곽 데이터들을 결정하는 단계; 및
상기 하나 이상의 최 외곽 데이터들 중 어느 하나를 상기 제2 시드 데이터로 결정하는 단계
를 포함하고,
상기 제2 학습 영역을 설정하는 단계는,
상기 제1 학습 영역의 크기 보다 작도록 상기 제2 학습 영역을 설정하는 단계
를 포함하는,
학습 데이터 결정 방법.
제9항에 있어서,
새로운 데이터들을 수신하는 단계; 및
상기 제2 학습 영역에 기초하여 상기 새로운 데이터들 중 추가 학습 데이터를 결정하는 단계
를 더 포함하는,
학습 데이터 결정 방법.
제9항 내지 제15항 중 어느 한 항의 방법을 수행하는 프로그램을 수록한 컴퓨터 판독 가능 기록 매체.
학습 데이터를 결정하는 전자 장치는,
학습 데이터를 결정하는 프로그램이 기록된 메모리; 및
상기 프로그램을 수행하는 프로세서
를 포함하고,
상기 프로그램은,
적어도 2차원의 좌표를 갖는 복수의 데이터들 중 제1 시드 데이터를 결정하는 단계;
상기 제1 시드 데이터에 기초하여 제1 학습 영역을 설정하는 단계;
상기 제1 학습 영역 내의 제1 타겟 데이터들에 기초하여 타겟 알고리즘을 갱신하는 단계;
상기 갱신된 타겟 알고리즘의 제1 성능을 결정하는 단계;
상기 제1 성능에 기초하여 미리 설정된 조건이 만족되는지 여부를 결정하는 단계;
상기 제1 시드 데이터로부터 미리 설정된 거리 이내에 있는 데이터에 기초하여 제2 시드 데이터를 결정하는 단계;
상기 제2 시드 데이터에 기초하여 제2 학습 영역을 설정하는 단계;
상기 제2 학습 영역 내의 제2 타겟 데이터들에 기초하여 상기 타겟 알고리즘을 갱신하는 단계;
상기 갱신된 타겟 알고리즘의 제2 성능을 결정하는 단계;
상기 제2 성능에 기초하여 상기 조건이 만족되는지 여부를 결정하는 단계;
상기 조건이 만족된 경우, 상기 제2 타겟 데이터들을 학습 데이터로 결정하는 단계
를 수행하는,
전자 장치.