KR102264041B1

KR102264041B1 - 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법 및 장치

Info

Publication number: KR102264041B1
Application number: KR1020200180089A
Authority: KR
Inventors: 강승완; 김남헌
Original assignee: 주식회사 아이메디신
Priority date: 2020-12-21
Filing date: 2020-12-21
Publication date: 2021-06-15
Also published as: US11875878B2; US20220399081A1; KR102264041B9; WO2022139168A1

Abstract

본 발명은 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법 및 장치는 복수의 피처들을 포함하는 피처 집합을 정의하는 단계; 상기 피처 집합에 대해 n차원(상기 n은 자연수)의 피처들로 구성된 복수의 피처 조합들을 생성하는 단계; 상기 복수의 피처 조합들에 대한 피처 모델들을 독립적으로 구축하고 소정의 데이터 세트에 관한 예측 결과로서 상기 피처 모델들의 예측 정확도(Accuracy)를 각각 산출하는 단계; 상기 피처 모델들을 상기 예측 정확도에 따라 정렬하여 기 설정된 기준을 충족하는 적어도 하나의 우수 피처 모델을 결정하는 단계; 상기 적어도 하나의 우수 피처 모델의 해당 피처 집합에 포함된 피처들 중에서 적어도 하나의 우수 피처를 결정하는 단계; 및 상기 적어도 하나의 우수 피처만을 포함하도록 상기 피처 집합을 갱신하고 상기 갱신된 피처 집합을 기초로 (n+1)차원의 피처 조합에 관한 우수 피처 모델을 재결정하는 단계를 포함한다.

Description

유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법 및 장치{MACHINE LEARNING METHOD AND APPARATUS USING STEPS FEATURE SELECTION BASED ON GENETIC ALGORITHM}

본 발명은 기계학습을 위한 변수의 단계적 선택 기술에 관한 것으로, 보다 상세하게는 유전자알고리즘을 이용하여 탐색공간을 합리적으로 줄이고 병증에 따른 뇌파의 변화를 판단하기에 최적의 근사한 성능을 가지는 특징을 추출해 낼 수 있는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법 및 장치에 관한 것이다.

국내외 주요 선진국들에서 고령화에 따라 노인성 질환인 치매환자도 빠르게 증가하고 있다. 또한, 치매로 인한 의료서비스 비용도 기하급수적으로 증가하고 있어, 치매의 조기발견과 예방의 중요성이 강조되고 있다. 한편, 치매환자의 뇌내에서 높은 비율로 베타 아밀로이드(amyloid)라는 단백질이 발견된다는 사실이 알려져 있다.

의료계에서는 치매의 전 단계인 경도인지장애(MCI) 환자의 뇌내에서 베타 아밀로이드가 발견되면 치매로 발전할 가능성이 크다고 판단한다. 따라서, 치매의 진행 완화를 위한 약을 처방받기 위해서는 뇌내의 베타 아밀로이드를 확인해야 한다. 기존에 뇌내의 베타 아밀로이드의 유무를 파악하는 방법으로는 아밀로이드 PET라는 검사가 있다. 하지만 아밀로이드 PET 검사의 경우 일반적으로 감당하기 비싼 기법이며, 양성 결과를 받아 약을 처방받을 수 있다는 보장도 없다.

한편, 뇌파(EEG)는 여러 뇌의 활동을 측정하는 방법들 중에 상대적으로 저비용이며 신체적으로도 부담이 적은 방식이다. 최근에는 기계학습, 딥 러닝 기술의 발달로 뇌파를 측정하여 병리증상을 진단하는 방법이 더욱 고도화되고 있다. 이때, 뇌파의 어느 채널, 어느 주파수에 정상인과는 다른 특징이 드러나는지, 그 양상은 병증에 따라 다르다. 병증의 성공적인 예측을 위해서는 그 변화가 현저하게 드러나는, 최적의 채널과 주파수를 파악해야 할 것이다.

한국공개특허 제10-2008-0082665호 (2008.09.11)

본 발명의 일 실시예는 유전자알고리즘을 이용하여 탐색공간을 합리적으로 줄이고 병증에 따른 뇌파의 변화를 판단하기에 최적의 근사한 성능을 가지는 특징을 추출해 낼 수 있는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법 및 장치를 제공하고자 한다.

본 발명의 일 실시예는 각종 병리적인 증상을 뇌파의 공간/주파수 특징을 기초로 분류하는 정확도 높은 학습 모델을 구축함으로써 저비용으로 검사 및 진단이 가능할 수 있는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법 및 장치를 제공하고자 한다.

실시예들 중에서, 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법은 복수의 피처들을 포함하는 피처 집합을 정의하는 단계; 상기 피처 집합에 대해 n차원(상기 n은 자연수)의 피처들로 구성된 복수의 피처 조합들을 생성하는 단계; 상기 복수의 피처 조합들에 대한 피처 모델들을 독립적으로 구축하고 소정의 데이터 세트에 관한 예측 결과로서 상기 피처 모델들의 예측 정확도(Accuracy)를 각각 산출하는 단계; 상기 피처 모델들을 상기 예측 정확도에 따라 정렬하여 기 설정된 기준을 충족하는 적어도 하나의 우수 피처 모델을 결정하는 단계; 상기 적어도 하나의 우수 피처 모델의 해당 피처 집합에 포함된 피처들 중에서 적어도 하나의 우수 피처를 결정하는 단계; 및 상기 적어도 하나의 우수 피처만을 포함하도록 상기 피처 집합을 갱신하고 상기 갱신된 피처 집합을 기초로 (n+1)차원의 피처 조합에 관한 우수 피처 모델을 재결정하는 단계를 포함한다.

상기 피처 집합을 정의하는 단계는 뇌파 신호에 관한 뇌파 발생 위치 및 뇌파 주파수 대역 간의 조합들을 상기 복수의 피처들로 정의하는 단계를 포함할 수 있다.

상기 피처 집합을 정의하는 단계는 10-20 전극법(10-20 System)에 따른 두피 전극 위치를 상기 뇌파 발생 위치로 결정하고 상기 뇌파 신호의 주파수 성분에 따라 상기 뇌파 주파수 대역을 델타(delta), 세타(theta), 알파(alpha), 베타(beta) 및 감마(gamma)로 구분하여 결정하는 단계를 포함할 수 있다.

상기 복수의 피처 조합들을 생성하는 단계는 상기 복수의 피처들 중 상기 n개의 피처들로 구성 가능한 모든 조합에 대응하여 상기 복수의 피처 조합들을 생성하는 단계를 포함할 수 있다.

상기 예측 정확도를 각각 산출하는 단계는 상기 피처 모델들 각각이 상기 소정의 데이터 세트에 대해 아밀로이드 유무에 관한 예측값과 실제값 간의 일치 여부를 기초로 상기 예측 정확도를 산출하는 단계를 포함할 수 있다.

상기 우수 피처 모델을 결정하는 단계는 상기 예측 정확도가 높은 순서에 따라 상위 m(상기 m은 자연수)개의 피처 모델들을 상기 적어도 하나의 우수 피처 모델로서 결정하는 단계를 포함할 수 있다.

상기 우수 피처를 결정하는 단계는 상기 해당 피처 집합의 각 피처들의 빈도 수를 카운팅(counting) 하고 상기 빈도 수가 높은 순서에 따라 상위 k(상기 k는 자연수)개의 피처들을 상기 적어도 하나의 우수 피처로서 결정하는 단계를 포함할 수 있다.

상기 우수 피처 모델을 재결정하는 단계는 상기 피처 집합의 갱신과 상기 피처 조합의 차원 증가에 따라 우수 피처 모델에 관한 재결정 과정을 반복적으로 수행하고, 해당 우수 피처 모델의 예측 정확도와 이전 단계의 예측 정확도 간의 차이가 기 설정된 기준값 이하인 경우에는 상기 재결정 과정의 반복을 종료하는 단계를 포함할 수 있다.

상기 우수 피처 모델을 재결정하는 단계는 상기 해당 우수 피처 모델이 복수인 경우 해당 예측 정확도들의 평균 또는 최소값을 상기 이전 단계의 예측 정확도와 비교하는 단계를 포함할 수 있다.

상기 방법은 상기 우수 피처 모델이 상기 소정의 데이터 세트에 대해 예측한 결과에 따라 상기 우수 피처 모델에 대한 강화학습을 수행하는 단계를 더 포함할 수 있다.

상기 강화학습을 수행하는 단계는 상기 예측한 결과가 실제값과 일치하는 경우 해당 예측값에 대해 강화 계수를 적용하여 상기 해당 예측값을 조정하는 단계를 포함할 수 있다.

상기 강화 계수는 상기 우수 피처 모델이 복수인 경우 상기 예측한 결과의 평균값을 기초로 특정 배수를 적용하여 산출될 수 있다.

상기 강화 계수는 상기 평균값 및 상기 특정 배수를 기초로 다음의 수학식을 통해 산출될 수 있다.

[수학식]

α = 1 + β * x

(여기에서, α는 강화 계수이고, β는 상기 평균값의 소수점 이하의 값이며, x는 특정 배수이다.)

실시예들 중에서, 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 장치는 복수의 피처들을 포함하는 피처 집합을 정의하는 피처 집합 정의부; 상기 피처 집합에 대해 n차원(상기 n은 자연수)의 피처들로 구성된 복수의 피처 조합들을 생성하는 피처 조합 생성부; 상기 복수의 피처 조합들에 대한 피처 모델들을 독립적으로 구축하고 소정의 데이터 세트에 관한 예측 결과로서 상기 피처 모델들의 예측 정확도(Accuracy)를 각각 산출하는 피처 모델 분석부; 상기 피처 모델들을 상기 예측 정확도에 따라 정렬하여 기 설정된 기준을 충족하는 적어도 하나의 우수 피처 모델을 결정하는 우수 피처 모델 결정부; 상기 적어도 하나의 우수 피처 모델의 해당 피처 집합에 포함된 피처들 중에서 적어도 하나의 우수 피처를 결정하는 우수 피처 추출부; 및 상기 적어도 하나의 우수 피처만을 포함하도록 상기 피처 집합을 갱신하고 상기 갱신된 피처 집합을 기초로 (n+1)차원의 피처 조합에 관한 우수 피처 모델을 재결정하는 모델 성능 개선부를 포함한다.

개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.

본 발명의 일 실시예에 따른 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법 및 장치는 유전자알고리즘을 이용하여 탐색공간을 합리적으로 줄이고 병증에 따른 뇌파의 변화를 판단하기에 최적의 근사한 성능을 가지는 특징을 추출해 낼 수 있다.

본 발명의 일 실시예에 따른 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법 및 장치는 각종 병리적인 증상을 뇌파의 공간/주파수 특징을 기초로 분류하는 정확도 높은 학습 모델을 구축함으로써 저비용으로 검사 및 진단이 가능할 수 있다.

도 1은 본 발명에 따른 뇌파 분석 시스템을 설명하는 도면이다.
도 2는 도 1의 뇌파분석 장치의 시스템 구성을 설명하는 도면이다.
도 3은 본 발명에 따른 기계학습 장치의 기능적 구성을 설명하는 도면이다.
도 4는 본 발명에 따른 기계학습 방법을 설명하는 순서도이다.
도 5는 본 발명에 따른 유전자 알고리즘 기반의 단계적인 피처 선택 과정을 설명하는 도면이다.
도 6은 본 발명에 따른 피처 선택 과정의 일 실시예를 설명하는 도면이다.
도 7은 본 발명에 따른 피처 집합의 일 실시예를 설명하는 도면이다.
도 8은 본 발명에 따른 우수 피처 모델에서 발견된 피처들의 빈도 수를 산출하는 과정을 설명하는 도면이다.
도 9 내지 11은 본 발명에 따른 우수 피처 모델에 대한 강화학습 과정을 설명하는 도면이다.
도 12는 본 발명에 따른 기계학습 모델의 성능에 관한 그래프를 설명하는 도면이다.

본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.

한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.

"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.

어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.

본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.

도 1은 본 발명에 따른 뇌파 분석 시스템을 설명하는 도면이다.

도 1을 참조하면, 뇌파 분석 시스템(100)은 사용자 단말(110), 뇌파분석 장치(130) 및 데이터베이스(150)를 포함할 수 있다.

사용자 단말(110)은 뇌파 분석을 위한 데이터를 생성하고 뇌파 분석 결과를 확인할 수 있는 컴퓨팅 장치에 해당할 수 있다. 즉, 사용자 단말(110)은 사용자에 부착되어 사용자의 뇌파 신호를 측정하고 이를 수집할 수 있는 측정 장치에 해당할 수 있다. 또한, 사용자 단말(110)은 뇌파분석 장치(130)와 연결되어 동작하는 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC 등 다양한 디바이스로도 구현될 수 있다. 이 경우, 사용자 단말(110)은 별도의 신호 측정 장치와 연동하여 뇌파 신호를 수집하고 해당 정보를 뇌파분석 장치(130)에 전송하도록 구현될 수 있다.

즉, 사용자 단말(110)은 뇌파 분석 장치(130)와 네트워크를 통해 연결될 수 있고, 복수의 사용자 단말(110)들은 뇌파 분석 장치(130)와 동시에 연결될 수 있다. 또한, 사용자 단말(110)은 뇌파 분석 시스템(100)에 접근하여 소정의 서비스를 이용할 수 있는 전용 프로그램 또는 어플리케이션을 설치하여 실행할 수 있다.

뇌파분석 장치(130)는 다양한 사용자들의 뇌파 신호 및 병리증상 진단 데이터를 학습하고 이를 기초로 뇌파 신호를 분석하여 다양한 분석 정보를 생성할 수 있는 컴퓨터 또는 프로그램에 해당하는 서버로 구현될 수 있다. 뇌파분석 장치(130)는 사용자 단말(110)과 유선 네트워크 또는 블루투스, WiFi 등과 같은 무선 네트워크로 연결될 수 있고, 네트워크를 통해 사용자 단말(110)과 데이터를 송·수신할 수 있다. 또한, 뇌파분석 장치(130)는 데이터의 수집 또는 추가 기능의 제공을 위하여 별도의 외부 시스템(도 1에 미도시함)과 연동하여 동작하도록 구현될 수도 있다.

일 실시예에서, 뇌파분석 장치(130)는 본 발명에 따른 기계학습 장치를 포함하여 구현될 수 있다. 즉, 뇌파분석 장치(130)는 본 발명에 따른 기계학습 장치에 의해 구축된 학습 모델을 이용하여 사용자의 뇌파 신호를 분석하여 다양한 병리증상을 진단 및 예측할 수 있다. 또한, 뇌파분석 장치(130)는 본 발명에 따른 기계학습 방법을 사용하여 독립적인 학습 모델을 구축할 수 있고, 이를 활용하여 뇌파분석을 수행할 수 있다. 따라서, 뇌파 분석 시스템(100)의 뇌파분석 장치(130)는 필요에 따라 본 발명에 따른 기계학습 장치에 대응되는 구성으로 이해될 수 있다.

데이터베이스(150)는 뇌파분석 장치(130)의 동작 과정에서 필요한 다양한 정보들을 저장하는 저장장치에 해당할 수 있다. 예를 들어, 데이터베이스(150)는 다양한 출처로부터 수집된 기계학습을 위한 학습 데이터를 저장할 수 있고, 기계학습을 통해 구축된 학습 모델들에 관한 정보를 저장할 수 있으며, 반드시 이에 한정되지 않고, 뇌파분석 장치(130)가 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다.

한편, 도 1에서, 데이터베이스(150)는 뇌파분석 장치(130)와 독립적인 장치로서 도시되어 있으나, 반드시 이에 한정되지 않고, 뇌파분석 장치(130)의 논리적인 저장장치로서 뇌파분석 장치(130)에 포함되어 구현될 수 있음은 물론이다.

도 2는 도 1의 뇌파분석 장치의 시스템 구성을 설명하는 도면이다.

도 2를 참조하면, 뇌파분석 장치(130)는 프로세서(210), 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)를 포함하여 구현될 수 있다.

프로세서(210)는 뇌파분석 장치(130)가 동작하는 과정에서의 각 단계들을 처리하는 프로시저를 실행할 수 있고, 그 과정 전반에서 읽혀지거나 작성되는 메모리(230)를 관리할 수 있으며, 메모리(230)에 있는 휘발성 메모리와 비휘발성 메모리 간의 동기화 시간을 스케줄할 수 있다. 프로세서(210)는 뇌파분석 장치(130)의 동작 전반을 제어할 수 있고, 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)와 전기적으로 연결되어 이들 간의 데이터 흐름을 제어할 수 있다. 프로세서(210)는 뇌파분석 장치(130)의 CPU(Central Processing Unit)로 구현될 수 있다.

메모리(230)는 SSD(Solid State Drive) 또는 HDD(Hard Disk Drive)와 같은 비휘발성 메모리로 구현되어 뇌파분석 장치(130)에 필요한 데이터 전반을 저장하는데 사용되는 보조기억장치를 포함할 수 있고, RAM(Random Access Memory)과 같은 휘발성 메모리로 구현된 주기억장치를 포함할 수 있다.

사용자 입출력부(250)는 사용자 입력을 수신하기 위한 환경 및 사용자에게 특정 정보를 출력하기 위한 환경을 포함할 수 있다. 예를 들어, 사용자 입출력부(250)는 터치 패드, 터치 스크린, 화상 키보드 또는 포인팅 장치와 같은 어댑터를 포함하는 입력장치 및 모니터 또는 터치스크린과 같은 어댑터를 포함하는 출력장치를 포함할 수 있다. 일 실시예에서, 사용자 입출력부(250)는 원격 접속을 통해 접속되는 컴퓨팅 장치에 해당할 수 있고, 그러한 경우, 뇌파분석 장치(130)는 독립적인 서버로서 수행될 수 있다.

네트워크 입출력부(270)은 네트워크를 통해 외부 장치 또는 시스템과 연결하기 위한 환경을 포함하고, 예를 들어, LAN(Local Area Network), MAN(Metropolitan Area Network), WAN(Wide Area Network) 및 VAN(Value Added Network) 등의 통신을 위한 어댑터를 포함할 수 있다.

도 3은 본 발명에 따른 기계학습 장치의 기능적 구성을 설명하는 도면이다.

도 3을 참조하면, 기계학습 장치(300)는 피처 집합 정의부(310), 피처 조합 생성부(320), 피처 모델 분석부(330), 우수 피처 모델 결정부(340), 우수 피처 추출부(350), 모델 성능 개선부(360), 강화학습 수행부(370) 및 제어부(도 3에 미도시함)을 포함할 수 있다.

피처 집합 정의부(310)는 복수의 피처들을 포함하는 피처 집합을 정의할 수 있다. 여기에서, 피처 집합은 피처(feature)들로 구성된 집합에 해당할 수 있으며, 피처(feature)는 데이터를 특정하는 특성에 관한 정보에 해당할 수 있다. 피처 집합 정의부(310)에 의해 정의된 피처 집합은 이후 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 과정에서 학습 데이터의 범위를 특정하는 역할을 수행할 수 있다.

일 실시예에서, 피처 집합 정의부(310)는 뇌파 신호에 관한 뇌파 발생 위치 및 뇌파 주파수 대역 간의 조합들을 복수의 피처들로 정의할 수 있다. 보다 구체적으로, 사용자의 뇌파(EEG, Electroencephalogram) 신호는 뇌의 전기적인 활동을 머리 표면에 부착한 전극에 의해 비침습적으로 측정한 전기신호에 해당할 수 있으며, 뇌파 발생 위치와 뇌파 주파수 대역에 따라 다양한 신호값으로 측정될 수 있다. 여기에서, 뇌파 발생 위치는 뇌파가 발생하는 위치에 해당할 수 있고, 뇌파 측정 기기가 부착되어 뇌파를 측정하는 전극 위치에 대응될 수 있다. 또한, 뇌파 주파수 대역은 뇌파 신호를 다양한 주파수 성분으로 분해하기 위해 설정된 주파수 범위에 해당할 수 있다. 즉, 피처 집합 정의부(310)는 뇌파 발생 위치와 뇌파 주파수 대역 간의 다양한 조합들을 피처들로 정의할 수 있으며, 각 피처는 뇌파 발생 위치와 뇌파 주파수 대역을 특정하는 정보로 구성될 수 있다.

일 실시예에서, 피처 집합 정의부(310)는 10-20 전극법(10-20 System)에 따른 두피 전극 위치를 뇌파 발생 위치로 결정하고 뇌파 신호의 주파수 성분에 따라 뇌파 주파수 대역을 델타(delta), 세타(theta), 알파(alpha), 베타(beta) 및 감마(gamma)로 구분하여 결정할 수 있다. 10-20 전극법(10-20 System)은 뇌파를 측정하기 위한 두피 전극의 위치를 정의하는 대표적인 방법에 해당할 수 있다. '10'과 '20'은 인접한 전극 사이의 실제 거리가 두개골의 전체 앞뒤 또는 오른쪽 거리의 10% 또는 20%라는 사실에 해당할 수 있다. 각 전극의 위치는 전두엽(Fp), 전두엽(F), 측두구(T), 정수리(P), 후두(O) 및 중앙(C)으로 표현될 수 있다.

또한, 뇌파 주파수 대역은 델타 0 ~ 4 Hz, 세타 4 ~ 8 Hz, 알파 8 ~ 13 Hz, 베타 13 ~ 30 Hz 및 감마 30 ~ 50 Hz으로 정의될 수 있다. 예를 들어, 피처 집합 정의부(310)는 특정 피처를 'Fp1d'으로 정의할 수 있고, 이 경우 해당 피처는 Fp1 전극 위치에서 측정된 delta파의 신호값에 대응될 수 있다.

피처 조합 생성부(320)는 피처 집합에 대해 n차원(상기 n은 자연수)의 피처들로 구성된 복수의 피처 조합들을 생성할 수 있다. 피처 조합 생성부(320)는 피처 집합으로 정의된 다양한 피처들을 이용하여 차원별 피처 조합을 생성할 수 있다. 이때, 차원은 피처 조합을 구성하는 피처의 개수에 해당할 수 있다. 예를 들어, 1차원의 피처 조합은 하나의 피처로 구성될 수 있고, 2차원의 피처 조합은 2개의 피처들로 구성될 수 있다. 기계학습 장치(300)는 단계적인 피처 선택을 위한 피처 조합의 시작 차원을 사전에 특정할 수 있고, 피처 조합 생성부(320)는 이를 참조하여 해당 차원에 대응되는 피처 조합을 생성할 수 있다.

일 실시예에서, 피처 조합 생성부(320)는 복수의 피처들 중 n개의 피처들로 구성 가능한 모든 조합에 대응하여 복수의 피처 조합들을 생성할 수 있다. 피처 조합 생성부(320)는 특정된 차원에 대해 해당 차원에 대응되는 수의 피처들로 구성된 피처 조합을 선택적으로 생성할 수 있으며, 필요에 따라 해당 차원에 대해 모든 피처 조합들을 생성할 수도 있다. 예를 들어, 피처 집합이 총 10개의 피처들을 포함하는 경우, 1차원의 피처 조합은 10개, 2차원의 피처 조합은 45개, 3차원의 피처 조합은 120개 등이 각각 생성될 수 있다.

피처 모델 분석부(330)는 복수의 피처 조합들에 대한 피처 모델들을 독립적으로 구축하고 소정의 데이터 세트에 관한 예측 결과로서 피처 모델들의 예측 정확도(Accuracy)를 각각 산출할 수 있다. 피처 모델 분석부(330)는 정해진 차원 내에서 가능한 피처 조합들에 대해 해당 학습 데이터들을 독립적으로 학습하여 피처 모델을 생성할 수 있다. 이때, 학습 알고리즘은 SVM(Suport Vector Machine), K-means 군집화(Clustering), 의사 결정 트리(Decision tree) 등이 사용될 수 있다. 피처 모델 분석부(330)는 각 학습 모델을 구축한 이후 소정의 테스트 세트를 이용하여 모델별 예측 정확도를 산출할 수 있다. 예측 정확도는 테스트 데이터 수에 대한 예측 성공 수의 비율로 도출될 수 있다.

일 실시예에서, 피처 모델 분석부(330)는 피처 모델들 각각이 소정의 데이터 세트에 대해 아밀로이드 유무에 관한 예측값과 실제값 간의 일치 여부를 기초로 예측 정확도를 산출할 수 있다. 만약 뇌파 신호에 관한 피처 집합이 정의되고 뇌파 발생 위치와 뇌파 주파수 대역에 관한 피처 조합에 대해 뇌파 분석을 위한 피처 모델들이 구축된 경우 피처 모델 분석부(330)는 소정의 데이터 세트의 각 테스트 데이터를 피처 모델에 입력하여 아밀로이드 유무에 관한 예측값을 획득할 수 있다. 피처 모델 분석부(330)는 피처 모델이 예측한 예측값이 실제값과 일치하는지를 카운팅하여 모델별 예측 정확도를 산출할 수 있다. 피처 모델은 학습에 사용된 학습 데이터의 특성에 따라 다양한 예측 확률을 가질 수 있으며, 피처 모델 분석부(330)는 모델별 예측 정확도를 산출하여 각 모델의 구축에 사용된 학습 데이터의 특성과 아밀로이드 유무 예측에 관한 상관관계를 분석할 수 있다.

우수 피처 모델 결정부(340)는 피처 모델들을 예측 정확도에 따라 정렬하여 기 설정된 기준을 충족하는 적어도 하나의 우수 피처 모델을 결정할 수 있다. 우수 피처 모델 결정부(340)는 기 구축된 피처 모델들 중에서 예측 성능이 우수한 것으로 평가된 피처 모델을 우수 피처 모델로 결정할 수 있다. 이를 위하여, 우수 피처 모델 결정부(340)는 피처 모델의 예측 정확도에 관한 기준을 설정할 수 있다. 예를 들어, 예측 정확도에 관한 기준이 90%로 설정된 경우 우수 피처 모델 결정부(340)는 테스트 세트에 대한 예측 정확도가 90% 이상인 피처 모델들을 선별하여 우수 피처 모델로 결정할 수 있다.

한편, 우수 피처 모델 결정부(340)는 기 설정된 기준을 충족하는 피처 모델이 존재하지 않는 경우, 기 설정된 기준을 소정의 비율만큼 조정한 후 조정된 기준에 따라 우수 피처 모델을 결정할 수 있다. 본 발명에 따른 기계학습 방법은 반복적인 피처 선택과 학습을 통해 학습 모델의 성능을 점차적으로 개선시키는 방식으로 동작할 수 있으며, 따라서 초기에 구축된 피처 모델들이 기 설정된 기준을 충족하지 못한 경우라 하더라도 기준을 동적으로 조정하여 피처 선택과 학습이 반복적으로 동작하도록 유연한 제어 방식으로 구현될 수 있다.

일 실시예에서, 우수 피처 모델 결정부(340)는 예측 정확도가 높은 순서에 따라 상위 m(상기 m은 자연수)개의 피처 모델들을 적어도 하나의 우수 피처 모델로서 결정할 수 있다. 즉, 우수 피처 모델 결정부(340)는 절대적인 기준의 충족 여부를 기초로 우수 피처 모델을 결정할 수 있으며, 예측 정확도라는 상대적 기준에 따라 정렬된 리스트 상에서 상위 m개의 피처 모델을 순서대로 우수 피처 모델로서 결정할 수도 있다. 이를 통해, 별도의 절대적 기준 설정 없이도 각 단계에서 소정의 우수 피처 모델이 선택되어 다음 단계로의 동작이 자연스럽게 진행될 수 있다. 한편, m은 기계학습 장치(300)를 통해 사전에 설정될 수 있으며, 동작 환경이나 조건에 따라 다양한 값으로 설정될 수 있음은 물론이다.

우수 피처 추출부(350)는 적어도 하나의 우수 피처 모델의 해당 피처 집합에 포함된 피처들 중에서 적어도 하나의 우수 피처를 결정할 수 있다. 성능이 상대적으로 우수한 우수 피처 모델의 구축에 사용된 피처들은 다른 피처들보다 해당 예측 결과와 보다 밀접한 상관관계에 있음이 예상될 수 있고, 우수 피처 추출부(350)는 우수 피처 모델의 구축에 사용된 피처들에서 우수 피처를 결정할 수 있다. 즉, 우수 피처는 피처 모델을 통해 예측하고자 하는 분석 정보와의 상관관계가 상대적으로 높은 피처에 해당할 수 있으며, 다음 단계의 동작 과정에서 갱신된 피처 집합에 포함될 수 있다.

일 실시예에서, 우수 피처 추출부(350)는 해당 피처 집합의 각 피처들의 빈도 수를 카운팅(counting) 하고 빈도 수가 높은 순서에 따라 상위 k(상기 k는 자연수)개의 피처들을 적어도 하나의 우수 피처로서 결정할 수 있다. 즉, 우수 피처는 우수 피처 모델들에서 더 자주 사용된 피처에 해당될 수 있고, 우수 피처 추출부(350)는 각 우수 피처 모델들에서 사용된 피처들을 집계하여 피처별 빈도 수를 산출할 수 있다. 또한, 우수 피처 추출부(350)는 집계된 피처별 빈도 수에 따라 정렬한 후 상위 k개의 피처들만 우수 피처로 결정할 수 있다. 이때, k는 기계학습 장치(300)를 통해 사전에 설정될 수 있으며, 동작 환경이나 조건에 따라 다양한 값으로 설정될 수 있음은 물론이다. 한편, 우수 피처 추출부(350)는 집계된 피처별 빈도 수에 대해 절대적인 기준값을 적용하여 해당 기준값보다 더 큰 빈도 수를 갖는 피처를 우수 피처로 결정할 수도 있다.

모델 성능 개선부(360)는 적어도 하나의 우수 피처만을 포함하도록 피처 집합을 갱신하고 갱신된 피처 집합을 기초로 (n+1)차원의 피처 조합에 관한 우수 피처 모델을 재결정할 수 있다. 보다 구체적으로, 현재 단계에서 우수 피처 추출부(350)에 의해 결정된 우수 피처들은 다음 단계의 피처 집합으로 정의될 수 있고, 갱신된 피처 집합에 대해 피처 조합의 생성과 피처 모델의 구축 및 검증을 통한 우수 피처 모델의 결정 과정이 반복하여 수행될 수 있다.

이때, 갱신된 피처 집합에 대해 생성되는 피처 조합은 이전 단계의 차원보다 한 차원 더 높게 설정될 수 있다. 즉, 피처 조합의 차원이 증가할수록 경우의 수가 많아져 이를 처리하기 위한 연산량도 함께 증가할 수 있으며, 이는 전체적인 동작 속도나 성능에 부정적인 영향을 미칠 수 있다. 따라서, 모델 성능 개선부(360)는 단계 별로 차원을 점차적으로 증가시키면서도 이전 단계의 우수 피처들만으로 피처 조합을 생성함으로써 모델링 과정에서 요구되는 연산량을 효과적으로 줄일 수 있다.

일 실시예에서, 모델 성능 개선부(360)는 피처 집합의 갱신과 피처 조합의 차원 증가에 따라 우수 피처 모델에 관한 재결정 과정을 반복적으로 수행하고, 해당 우수 피처 모델의 예측 정확도와 이전 단계의 예측 정확도 간의 차이가 기 설정된 기준값 이하인 경우에는 재결정 과정의 반복을 종료할 수 있다. 모델 성능 개선부(360)는 단계의 진행에 따라 피처 조합의 차원을 점차적으로 증가시킬 수 있으며, 차원의 증가에 따라 기계학습을 통해 구축된 피처 모델의 예측 성능도 증가될 수 있다. 다만, 소정의 단계를 반복한 이후에는 생성된 피처 모델의 성능 변화가 크지 않을 수 있고, 이에 따라 모델 성능 개선부(360)는 이전 단계의 우수 피처 모델과 현재 단계의 우수 피처 모델 간의 성능 비교를 통해 그 변화가 기 설정된 기준값 이하인 경우에는 성능 개선을 위한 반복 동작을 종료하고, 마지막 단계에서 생성된 우수 피처 모델을 최종 학습 결과로서 결정할 수 있다.

일 실시예에서, 모델 성능 개선부(360)는 해당 우수 피처 모델이 복수인 경우 해당 예측 정확도들의 평균 또는 최소값을 이전 단계의 예측 정확도와 비교할 수 있다. 우수 피처 모델이 하나인 경우에는 해당 모델의 예측 정확도 만을 이전 단계의 그것과 비교할 수 있으며, 만약 우수 피처 모델이 복수인 경우라면 모델별 예측 정확도들의 평균, 최소값 및 최대값 중 어느 하나를 기초로 이전 단계의 그것과 비교할 수 있다. 한편, 현재 단계와 이전 단계의 우수 피처 모델의 성능 비교 연산은 상기의 방법뿐만 아니라 다양한 방법이 적용될 수 있음은 물론이다.

강화학습 수행부(370)는 우수 피처 모델이 소정의 데이터 세트에 대해 예측한 결과에 따라 우수 피처 모델에 대한 강화학습을 수행할 수 있다. 강화학습(Reinforcement learning)은 기계학습의 하나로서 행동심리학에서 영감을 받아 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법에 해당할 수 있다. 강화학습 수행부(370)는 우수 피처 모델에 대한 강화학습을 수행하여 상대적으로 정확도가 부족한 예측 성능을 보완할 수 있다.

일 실시예에서, 강화학습 수행부(370)는 예측한 결과가 실제값과 일치하는 경우 해당 예측값에 대해 강화 계수를 적용하여 해당 예측값을 조정할 수 있다. 여기에서, 강화 계수는 강화학습을 위해 예측 결과에 곱연산으로 적용되는 계수에 해당할 수 있다. 즉, 강화학습 수행부(370)는 각 우수 예측 모델에 대해 예측값과 실제값이 일치하는 경우 예측값에 대해 소정의 강화 계수를 적용하여 강화학습을 수행할 수 있다. 예를 들어, 뇌파 신호에 기초한 아밀로이드 유무(또는 +/-)에 대한 예측에 있어 강화학습 수행부(370)는 예측값이 실제값과 일치하는 경우에 있어서 아밀로이드 '+' 또는 '-'에 따라 강화학습을 독립적으로 수행할 수 있다.

일 실시예에서, 강화 계수는 우수 피처 모델이 복수인 경우 상기 예측한 결과의 평균값을 기초로 특정 배수를 적용하여 산출될 수 있다. 강화 계수는 배수 별로 산출될 수 있고, 강화학습 수행부(370)에 의해 복수의 배수들 중 어느 하나가 선택적으로 적용될 수 있다. 특히, 강화 계수는 우수 피처 모델들의 예측 결과의 평균값을 이용하여 구체적으로 산출될 수 있으며, 이를 기초로 각 우수 피처 모델들에 대한 강화학습이 수행될 수 있다. 결과적으로, 강화학습 수행부(370)는 강화학습을 통해 각 우수 피처 모델들의 예측 성능을 보완할 수 있다.

일 실시예에서, 강화 계수는 평균값 및 상기 특정 배수를 기초로 다음의 수학식을 통해 산출될 수 있다.

[수학식]

α = 1 + β * x

여기에서, α는 강화 계수이고, β는 상기 평균값의 소수점 이하의 값이며, x는 특정 배수이다. 이에 대해서는 도 9 내지 11에서 보다 자세히 설명한다.

제어부(도 3에 미도시함)는 기계학습 장치(300)의 전체적인 동작을 제어하고, 피처 집합 정의부(310), 피처 조합 생성부(320), 피처 모델 분석부(330), 우수 피처 모델 결정부(340), 우수 피처 추출부(350), 모델 성능 개선부(360) 및 강화학습 수행부(370) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.

도 4는 본 발명에 따른 기계학습 방법을 설명하는 순서도이다.

도 4를 참조하면, 기계학습 장치(300)는 피처 집합 정의부(310)를 통해 복수의 피처들을 포함하는 피처 집합을 정의할 수 있다(단계 S410). 기계학습 장치(300)는 피처 조합 생성부(320)를 통해 피처 집합에 대해 n차원(상기 n은 자연수)의 피처들로 구성된 복수의 피처 조합들을 생성할 수 있다(단계 S420).

또한, 기계학습 장치(300)는 피처 모델 분석부(330)를 통해 복수의 피처 조합들에 대한 피처 모델들을 독립적으로 구축할 수 있고(단계 S430), 소정의 데이터 세트에 관한 예측 결과로서 피처 모델들의 예측 정확도(Accuracy)를 각각 산출할 수 있다(단계 S440).

또한, 기계학습 장치(300)는 우수 피처 모델 결정부(340)를 통해 피처 모델들을 예측 정확도에 따라 정렬하여 기 설정된 기준을 충족하는 적어도 하나의 우수 피처 모델을 결정할 수 있다(단계 S450).

이후, 기계학습 장치(300)는 우수 피처 모델에서 빈번하게 사용되는 우수한 유전자들 만을 우수 피처로서 추출할 수 있고, 반복적인 학습을 통해 뇌파 분석에 사용하기 위한 모델의 성능을 단계적으로 향상시킬 수 있다.

도 5는 본 발명에 따른 유전자 알고리즘 기반의 단계적인 피처 선택 과정을 설명하는 도면이다.

도 5를 참조하면, 기계학습 장치(300)는 정해진 차원 내에서 가능한 모든 피처 조합에 대해 독립적인 피처 모델을 구축할 수 있다(S510). 피처 모델이 구축되면 기계학습 장치(300)는 모델 검증을 수행할 수 있다(S530).

즉, 기계학습 장치(300)는 각각의 모델의 예측 정확도를 계산하고, 예측 정확도에 관한 성능이 우수한 피처 모델을 결정하여 우수한 유전자들(Good Features)를 결정할 수 있다(S550). 여기에서, 우수한 유전자는 예측 성능이 높은 모델에 포함된 피처에 해당할 수 있으며, 반복적인 동작을 통해 차원이 높은 모델이 구축될수록 우수한 유전자에 해당하는 피처만이 살아남을 수 있다.

또한, 기계학습 장치(300)는 우수한 유전자들을 포함하도록 하여 한 차원 높은 피처 모델을 생성할 수 있으며, 피처 모델의 성능이 더 이상 오르지 않을 때까지 상기 과정을 반복적으로 수행할 수 있다. 결과적으로, 기계학습 장치(300)는 예측 결과에 큰 영향을 미치는 우수한 유전자들을 단계적으로 선택하여 예측을 위한 학습과 검증을 반복적으로 수행하여 최종적으로 가장 성능이 우수한 피처 모델들(Best Models)을 생성할 수 있다.

도 6은 본 발명에 따른 피처 선택 과정의 일 실시예를 설명하는 도면이다.

도 6을 참조하면, 본 발명에 따른 기계학습 방법은 구체적인 단계들로 정의되는 피처 선택 과정을 통해 수행될 수 있다. 보다 구체적으로, 제1 단계(Step1)에서는 정해진 차원 내에서 가능한 모든 조합으로 모델을 만들 수 있다. 제2 단계(Step2)에서는 각각의 모델의 정확도를 계산하고, 그것을 기준으로 내림차순으로 배열할 수 있다. 제3 단계(Step3)에서는 일정 기준 이상의 우수한 성능을 보이는 모델(우수 피처 모델, 610)을 따로 모을 수 있다. 제4 단계(Step4)에서는 우수 피처 모델(610) 안에서 어떤 유전자가 가장 빈번하게 등장하는지를 계산할 수 있다. 제5 단계(Step5)에서는 일정 수준을 설정하여 기준 이상의 우수한 유전자(우수 피처, 630)만을 추출할 수 있다. 마지막으로, 제6 단계(Step6)에서는 그 유전자들을 포함하도록 하여 한 차원 높은 모델을 생성할 수 있다.

본 발명에 따른 기계학습 방법은 상기 제1 내지 제6 단계들이 반복적으로 수행되는 과정을 통해 진행될 수 있으며, 각 반복마다 예측 성능에 영향을 미치는 우수한 유전자들(Good Features)만으로 예측 모델이 구축된 결과, 최종적인 예측 모델은 높은 수준의 예측 정확도를 가질 수 있다.

도 7은 본 발명에 따른 피처 집합의 일 실시예를 설명하는 도면이다.

도 7을 참조하면, 본 발명에 따른 기계학습 장치(300)는 뇌파 분석용 기계학습을 위한 피처 집합을 정의하여 활용할 수 있다. 도 7에서, 행(710)은 10/20 System에서의 위치를 나타내고, 열(730)은 뇌파의 주파수 대역을 나타낼 수 있다.

뇌파 발생 위치와 뇌파 주파수 대역의 조합을 통해 1가지의 피처만 선택(이하, 1차원 모델링)하는 경우, 19*8=152가지의 경우의 수가 도출될 수 있다(예를 들어, Fp1*Delta). 기계학습(머신러닝) 모델링을 수행할 때, 도 7의 피처들 중 2가지의 피처들을 선택하는 경우(이하, 2차원 모델링) 11,476가지의 경우의 수가 도출될 수 있으며, 3가지의 피처들을 선택하는 경우 573,800가지의 경우의 수가 도출될 수 있다.

따라서, 피처 선택에 따른 경우의 수가 많아지면 많아질수록 연산량을 감당하기 어려워져, 4차원 모델링 이상부터는 유전자 알고리즘을 응용하여 특정 기준을 만족하는 피처들에 대해서만 조합하여 모델링 동작이 수행될 수 있다.

도 8은 본 발명에 따른 우수 피처 모델에서 발견된 피처들의 빈도 수를 산출하는 과정을 설명하는 도면이다.

도 8을 참조하면, 기계학습 장치(300)는 우수 피처 모델을 결정할 수 있으며, 우수 피처 모델들에서 발견된 피처들의 빈도 수를 기초로 우수 피처를 결정할 수 있다.

예를 들어, 3차원 모델링 단계에서 생성된 573,800개의 모델들에 대해 기계학습 장치(300)는 각각 테스트 세트(Test set)에 대해 예측한 값(Amyloid +/- 여부)이 실제 값(Amyloid +/- 여부)과 동일한 지 검증할 수 있다. [Fp1 delta, Fp2 delta, T3 theta]로 구성된 제1 피처 모델이 Amyloid +/- 여부를 정확하게 예측했고, [Fp1 delta, Fp2 delta, F3 alpha1]로 구성된 제2 피처 모델이 Amyloid +/-여부를 정확하게 예측하였다고 가정하면, 각각의 피처마다 빈도수를 산출할 수 있다.

한편, 도 8의 경우, 아밀로이드 +/- 여부를 정확하게 예측한 모델들에서 발견된 피처들의 개수를 나타낼 수 있다. 각 피처들은 빈도수(810)를 기준으로 정렬될 수 있으며, 기계학습 장치(300)는 빈도수(810)의 순서에 따라 상위 k(상기 k는 자연수)개의 피처들을 우수 피처(830)로 결정할 수 있다. 이때, 우수 피처(830)들은 다음 단계에서 피처 집합으로 추가되어 차원이 증가된 피처 조합에 관한 우수 피처 모델을 결정하는데 활용될 수 있다.

도 9 내지 11은 본 발명에 따른 우수 피처 모델에 대한 강화학습 과정을 설명하는 도면이다.

도 9 내지 11을 참조하면, 기계학습 장치(300)는 우수 예측 모델들에 대해 강화학습을 수행할 수 있다. 도 9는 도 5의 우수한 피처 모델들(Best Models)의 테스트 데이터(test data)에 대한 예측값을 나타낼 수 있다. 이때, 열은 우수한 피처 모델들(Best Models)을 나타내고, 행은 테스트 데이터에 대한 각 우수한 피처 모델들(Best Models)의 예측값을 나타낼 수 있다. 또한, 각 테스트 데이터에 대한 우수 피처 모델(910)들의 예측값의 평균(score)(930)이 우측에 표시되어 있다.

여기에서, 예측값의 평균이 21에 가까울수록 Normal Amyloid - (정상인이면서 아밀로이드 -)를 잘 예측한 것에 해당할 수 있다. 즉, 정상인인 경우 일반적으로 두뇌에 아밀로이드(Amyloid) 단백질이 존재하지 않는, Amyloid -가 일반적일 수 있다. 이와 반대로, 경도인지장애(MCI)가 있는 경우에는 두뇌에 아밀로이드(Amyloid) 단백질이 존재하게 되는, Amyloid +가 나타날 수 있다.

한편, 도 9에서는 12개의 우수 피처 모델(910)들을 예시하여 설명하고 있으나, 반드시 이에 한정되지 않고, 필요에 따라 다양한 개수의 우수 피처 모델들을 이용하여 동작할 수 있음은 물론이다.

도 10은 Amyloid -에 대한 강화학습을 수행하는 과정에 해당할 수 있다. 강화학습에 대한 접근은 기존의 우수 피처 모델(Best Model)들이 정확하게 예측하지 못한 테스트 데이터(test data)(1010)에 대해서는 좀 더 정확하게 예측할 필요가 있고, 상대적으로 예측을 정확한 테스트 데이터(test data)(나머지 데이터들)에 대해서는 정확도가 다소 떨어지더라도 결과에 영향을 미치지 않는다는 점에 기초할 수 있다.

보다 구체적으로, 위에서부터 test data1, 2, 3, …, 18이라 할 때, 1배수의 경우 기계학습 장치(300)는 test data1에 대해 정확하게 예측한 경우 1.573, test data2에 대해 정확하게 예측한 경우 1.535, …, test data18에 대해 정확하게 예측한 경우 1.081를 강화 계수로 적용하여 강화학습을 수행할 수 있다. 이때, test data1의 강화 계수 1.573은 1+0.573을 통해 산출될 수 있으며, test data1에 대한 예측값의 평균(score)인 21.573에서 소수점 이하의 값인 0.573을 이용할 수 있다.

또한, 2배수의 경우 기계학습 장치(300)는 test data1에 대해 정확하게 예측한 경우 2.146, test data2에 대해 정확하게 예측한 경우 2.07, …, test data18에 대해 정확하게 예측한 경우 1.162를 강화 계수로 적용하여 강화학습을 수행할 수 있다. 이때, test data1의 강화 계수 2.146은 1+2*0.573을 통해 산출될 수 있으며, test data1에 대한 예측값의 평균(score)인 21.573에서 소수점 이하의 값인 0.573을 이용할 수 있다.

한편, 상기의 1배수 및 2배수 강화 방법은 실시예일 뿐 다양한 방법이 존재할 수 있음은 물론이다. 예를 들어, 2배수의 경우 test data1의 강화 계수는 1+2*0.508을 통해 산출될 수 있으며, test data1에 대한 1배수 예측값의 평균(score)인 21.508에서 소수점 이하의 값인 0.508을 이용할 수 있다.

도 11은 Amyloid +에 대한 수행하는 과정에 해당할 수 있다. 보다 구체적으로, 1배수의 경우 기계학습 장치(300)는 test data1에 대해 정확하게 예측한 경우 1.048, test data2에 대해 정확하게 예측한 경우 1.084, …, test data18에 대해 정확하게 예측한 경우 1.722를 강화 계수로 적용하여 강화 학습을 수행할 수 있다. 이때, test data1의 강화 계수 1.048은 1+(1-0.952)를 통해 산출될 수 있으며, test data1에 대한 예측값의 평균(score)인 21.952에서 소수점 이하의 값인 0.952를 이용할 수 있다. 또한, 2배수의 경우 기계학습 장치(300)는 도 10의 방안과 동일하게 수행할 수 있다.

도 12는 본 발명에 따른 기계학습 모델의 성능에 관한 그래프를 설명하는 도면이다.

도 12를 참조하면, 기계학습 장치(300)는 실제 유전자 알고리즘의 차원이 증가함에 따라 변화하는 아밀로이드 유무를 판단하는 기계학습 성능을 나타내는 그래프에 해당할 수 있다. 즉, 도 5의 우수한 피처 모델들(Best Models)의 예측 정확도와 AUC에 대한 평균에 해당할 수 있으며, 각각 2 내지 5차원의 피처 조합들(즉, 피처들의 개수)에 대한 성능 비교 결과에 해당할 수 있다.

본 발명에 따른 기계학습 방법은 뇌파의 각 채널, 각 주파수 대역의 파워를 각각 유전자라고 가정하고 정해진 차원 내에서 가능한 모든 조합으로 모델을 만들 수 있다. 본 발명에 따른 기계학습 방법은 각각의 모델의 성능을 계산하고, 우수한 성능을 보이는 모델을 따로 모을 수 있다. 본 발명에 따른 기계학습 방법은 우수한 모델 안에서 어떤 유전자가 가장 빈번하게 등장하는지를 계산할 수 있으며, 우수한 모델에서 빈번하게 등장하는 유전자일수록 좋은 모델을 만들기 위해 필요한 우수한 유전자라고 추론할 수 있다. 본 발명에 따른 기계학습 방법은 일정 수준을 설정하여 기준 이상의 우수한 유전자를 추출할 수 있고, 해당 유전자들만 이용하여 한단계 높은 차원의 모델을 만들 수 있다. 본 발명에 따른 기계학습 방법은 상기의 과정을 반복적으로 수행한 결과로서 최적에 근사한 모델을 획득할 수 있다.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

100: 뇌파 분석 시스템
300: 기계학습 장치
610: 우수 피처 모델 630: 우수 피처
810: 빈도수 830: 우수 피처
910: 우수 피처 모델 930: 예측값의 평균

Claims

피처 집합 정의부, 피처 조합 생성부, 피처 모델 분석부, 우수 피처 모델 결정부, 우수 피처 추출부, 모델 성능 개선부 및 강화학습 수행부를 포함하는 장치에서 수행되는 기계학습 방법에 있어서,
(a) 상기 피처 집합 정의부를 통해, 뇌파 신호의 뇌파 발생 위치와 뇌파 주파수 대역의 쌍들을 복수의 피처들로 포함하는 피처 집합을 정의하는 단계;
(b) 상기 피처 조합 생성부를 통해, 상기 피처 집합에 대해 n차원(상기 n은 자연수)의 피처들로 구성된 복수의 피처 조합들을 생성하는 단계;
(c) 상기 피처 모델 분석부를 통해, 상기 복수의 피처 조합들에 대한 피처 모델들을 독립적으로 구축하고 상기 피처 모델들 각각이 소정의 데이터 세트에 관한 예측 결과로서 상기 피처 모델들의 예측 정확도(Accuracy)를 각각 산출하는 단계;
(d) 상기 우수 피처 모델 결정부를 통해, 상기 피처 모델들을 상기 예측 정확도에 따라 정렬하여 기 설정된 기준을 충족하는 적어도 하나의 우수 피처 모델을 결정하는 단계;
(e) 상기 우수 피처 추출부를 통해, 상기 적어도 하나의 우수 피처 모델의 해당 피처 집합에 포함된 피처들 중에서 복수의 우수 피처들을 결정하는 단계; 및
(f) 상기 모델 성능 개선부를 통해, 상기 (b) 내지 (e) 단계들을 반복적으로 수행하는 과정에서 각 반복마다 상기 복수의 우수 피처들만을 포함하도록 상기 피처 집합을 갱신하고 상기 (b) 단계에서는 상기 갱신된 피처 집합을 기초로 (n+1)차원의 피처 조합을 생성하는 단계를 포함하는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법.
제1항에 있어서, 상기 피처 집합을 정의하는 단계는
뇌파 신호에 관한 뇌파 발생 위치 및 뇌파 주파수 대역 간의 조합들을 상기 복수의 피처들로 정의하는 단계를 포함하는 것을 특징으로 하는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법.
제2항에 있어서, 상기 피처 집합을 정의하는 단계는
10-20 전극법(10-20 System)에 따른 두피 전극 위치를 상기 뇌파 발생 위치로 결정하고 상기 뇌파 신호의 주파수 성분에 따라 상기 뇌파 주파수 대역을 델타(delta), 세타(theta), 알파(alpha), 베타(beta) 및 감마(gamma)로 구분하여 결정하는 단계를 포함하는 것을 특징으로 하는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법.
제2항에 있어서, 상기 복수의 피처 조합들을 생성하는 단계는
상기 복수의 피처들 중 상기 n개의 피처들로 구성 가능한 모든 조합에 대응하여 상기 복수의 피처 조합들을 생성하는 단계를 포함하는 것을 특징으로 하는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법.
삭제
제1항에 있어서, 상기 우수 피처 모델을 결정하는 단계는
상기 예측 정확도가 높은 순서에 따라 상위 m(상기 m은 자연수)개의 피처 모델들을 상기 적어도 하나의 우수 피처 모델로서 결정하는 단계를 포함하는 것을 특징으로 하는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법.
제1항에 있어서, 상기 우수 피처를 결정하는 단계는
상기 해당 피처 집합의 각 피처들의 빈도 수를 카운팅(counting) 하고 상기 빈도 수가 높은 순서에 따라 상위 k(상기 k는 자연수)개의 피처들을 상기 복수의 우수 피처들로서 결정하는 단계를 포함하는 것을 특징으로 하는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법.
제1항에 있어서, 상기 (n+1)차원의 피처 조합을 생성하는 단계는
상기 우수 피처 모델의 예측 정확도와 이전 반복 단계의 예측 정확도 간의 차이가 기 설정된 기준값 이하인 경우에는 상기 반복을 종료하는 단계를 포함하는 것을 특징으로 하는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법.
제8항에 있어서, 상기 (n+1)차원의 피처 조합을 생성하는 단계는
상기 우수 피처 모델이 복수인 경우 해당 예측 정확도들의 평균 또는 최소값을 상기 이전 반복 단계의 예측 정확도와 비교하는 단계를 포함하는 것을 특징으로 하는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 방법.
삭제
삭제
삭제
삭제
뇌파 신호의 뇌파 발생 위치와 뇌파 주파수 대역의 쌍들을 복수의 피처들로 포함하는 피처 집합을 정의하는 피처 집합 정의부;
상기 피처 집합에 대해 n차원(상기 n은 자연수)의 피처들로 구성된 복수의 피처 조합들을 생성하는 피처 조합 생성부;
상기 복수의 피처 조합들에 대한 피처 모델들을 독립적으로 구축하고 상기 피처 모델들 각각이 소정의 데이터 세트에 관한 예측 결과로서 상기 피처 모델들의 예측 정확도(Accuracy)를 각각 산출하는 피처 모델 분석부;
상기 피처 모델들을 상기 예측 정확도에 따라 정렬하여 기 설정된 기준을 충족하는 적어도 하나의 우수 피처 모델을 결정하는 우수 피처 모델 결정부;
상기 적어도 하나의 우수 피처 모델의 해당 피처 집합에 포함된 피처들 중에서 복수의 우수 피처들을 결정하는 우수 피처 추출부; 및
상기 피처 조합을 생성하고 상기 피처 모델들의 예측 정확도에 따라 우수 피처 모델과 우수 피처를 결정하는 동작을 반복적으로 수행하는 과정에서 각 반복마다 상기 복수의 우수 피처들만을 포함하도록 상기 피처 집합을 갱신하고 상기 갱신된 피처 집합을 기초로 (n+1)차원의 피처 조합을 생성하는 모델 성능 개선부를 포함하는 유전자 알고리즘 기반의 단계적인 피처 선택을 이용한 기계학습 장치.