KR20230070085A - 뇌 네트워크를 이용한 알츠하이머병에 대한 진단정보 제공방법 - Google Patents

뇌 네트워크를 이용한 알츠하이머병에 대한 진단정보 제공방법 Download PDF

Info

Publication number
KR20230070085A
KR20230070085A KR1020210155359A KR20210155359A KR20230070085A KR 20230070085 A KR20230070085 A KR 20230070085A KR 1020210155359 A KR1020210155359 A KR 1020210155359A KR 20210155359 A KR20210155359 A KR 20210155359A KR 20230070085 A KR20230070085 A KR 20230070085A
Authority
KR
South Korea
Prior art keywords
disease
alzheimer
classification
graph
feature
Prior art date
Application number
KR1020210155359A
Other languages
English (en)
Inventor
권구락
Original Assignee
조선대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조선대학교산학협력단 filed Critical 조선대학교산학협력단
Priority to KR1020210155359A priority Critical patent/KR20230070085A/ko
Priority to US17/592,744 priority patent/US20230148955A1/en
Publication of KR20230070085A publication Critical patent/KR20230070085A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4842Monitoring progression or stage of a disease
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/05Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves 
    • A61B5/055Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves  involving electronic [EMR] or nuclear [NMR] magnetic resonance, e.g. magnetic resonance imaging
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4088Diagnosing of monitoring cognitive diseases, e.g. Alzheimer, prion diseases or dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B6/00Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
    • A61B6/02Arrangements for diagnosis sequentially in different planes; Stereoscopic radiation diagnosis
    • A61B6/03Computed tomography [CT]
    • A61B6/032Transmission computed tomography [CT]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B6/00Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
    • A61B6/02Arrangements for diagnosis sequentially in different planes; Stereoscopic radiation diagnosis
    • A61B6/03Computed tomography [CT]
    • A61B6/037Emission tomography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10104Positron emission tomography [PET]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10108Single photon emission computed tomography [SPECT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20072Graph-based image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Neurology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Data Mining & Analysis (AREA)
  • Psychiatry (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physiology (AREA)
  • Psychology (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Neurosurgery (AREA)
  • Mathematical Physics (AREA)
  • Developmental Disabilities (AREA)
  • Child & Adolescent Psychology (AREA)
  • Evolutionary Computation (AREA)
  • Hospice & Palliative Care (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Optics & Photonics (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)

Abstract

본 발명은 뇌 네트워크를 이용한 알츠하이머병에 대한 진단정보 제공방법에 관한 것이다.

Description

뇌 네트워크를 이용한 알츠하이머병에 대한 진단정보 제공방법 {Providing method of diagnostic information on Alzheimer's disease using brain network}
본 발명은 뇌 네트워크를 이용하여 알츠하이머병에 대한 진단정보를 제공하는 방법에 관한 것이다.
치매의 주요 원인인 알츠하이머병(Alzheimer's disease, AD)은 진행성 신경퇴행성 질환으로, 감지하기 어려운 알츠하이머병의 신경병리학적 진행은 새로운 정보를 기억하고 학습하는 데 어려움을 겪는 진행성 인지장애가 나타나기 수년 전부터 시작된다. 현재 진행을 늦추거나 완치할 수 있는 치료법이 없어, 알츠하이머병의 초기 개입에 더 많은 연구가 집중되고 있으며, 초기 단계에서의 정확한 질병 진단은 큰 의미를 갖는다.
최근 신경 영상 기술의 이용으로 알츠하이머병의 조기 및 정확한 검출에서 유망한 결과를 얻을 수 있으며, 질병의 진행 및 조기 발견에 대한 연구는 뇌파 검사(EEG), 기능적 자기공명영상(fMRI), 단일-광자 방사형 컴퓨터 단층촬영(SPECT) 및 양전자 방출 단층촬영(PET) 등 다양한 영상 모델을 이용하여 수행된다.
마찬가지로 구조적 자기공명영상(MRI)은 알츠하이머병 연구에 가장 일반적으로 사용되는 영상 시스템이다. MRI에서 추출한 특징은 일반적으로 회백질 부피이며, 신경퇴화 연구에 중요한 바이오마커로 측정되고, 해마 백질 경로의 변화는 알츠하이머병에서 종종 관찰된다. 여러 연구에 따르면 광범위하게 분포된 기능적, 구조적 연결 쌍의 변화가 알츠하이머병과 경도인지장애(mild cognitive impairment, MCI)에서 만연한 것으로 나타났다. 또한, 최근 연구에서 휴식 상태 기능적 자기공명영상(rs-fMRI)이 알츠하이머병의 진행 조사에 널리 사용되고 있다. 이 영상 시스템은 뇌의 다양한 영역에서 혈액 산소 농도 의존(blood oxygenation level-dependent, BOLD) 지표에서 나타나는 충동적 가변성을 평가한다. BOLD의 비정상적인 국소 자발적 변동, 기능적 연결성 및 기능적 뇌 네트워크의 변화를 기반으로 여러 연구가 수행된다. 이러한 연구는 디폴트 모드 네트워크(default mode network), 체운동 네트워크(somatomotor network), 배측주의 네트워크(dorsal attention network), 변연계 네트워크(limbic network) 및 전두엽 제어 네트워크(frontoparietal control network)와 같은 다양한 네트워크에서 수행된다. 따라서 그래프 이론 기반 인간 뇌 기능 연결체의 네트워크 분석은 네트워크 구조에 대한 더 나은 통찰력을 제공하여 알츠하이머병에 감염된 뇌에서 기능 연결 조직의 비정상적인 패턴을 드러낸다.
그래프 이론은 복잡한 네트워크를 연구하기 위한 수학적 접근법으로, 네트워크는 가장자리로 상호 연결된 꼭짓점으로 구성된다. 본 발명에서 꼭짓점은 뇌 영역이다. 그래프 이론은 다양한 신경퇴행성 질환의 신경 변화와 관련된 해부학적으로 국소화된 하위 네트워크를 식별하기 위한 도구로 널리 사용된다. fMRI 이미지에서 그래프는 구성된 네트워크에서 서로 다른 노드의 인과관계 또는 상관관계를 나타낸다. 그러나 그래프로 구축된 뇌 네트워크는 비-유클리드적 특성을 가져 뇌 네트워크 분석에 기계 학습 기술을 적용하는 것은 어려움이 있다. 상기 문제를 극복하기 위해 본 발명에서는 그래프를 벡터 또는 벡터 세트로 변환하기 위해 그래프 임베딩을 사용하였다. 임베딩은 그래프 토폴로지, 꼭짓점 관계 및 기타 관련 그래프 정보를 캡처한다. 본 발명에서는 node2vec 그래프 임베딩 기법을 사용하여 뇌 네트워크 그래프의 꼭짓점과 가장자리를 특징 벡터로 변환하였으며, 이 모델을 이용하여 fMRI 데이터의 뇌 네트워크를 분석하고, AD, MCI 및 건강한 대조군(healthy control, HC)으로 분류하였다.
최근 연구에 따르면 뇌 기능 연결 장애는 경도인지장애 뿐만 아니라 알츠하이머병에도 발생하는 초기 증상이다. 본 발명은 이러한 손상을 연구하기 위해 뇌를 그래프 기반 네트워크로 모델링한다. 본 발명은 다양한 분류 기법을 사용하여 AD, MCI 및 HC 대상을 구별하기 위해 fMR 이미지의 특징 기반 그래프 이론을 사용하는 새로운 진단 방법을 제시한다. 이러한 기술에는 LSVM (Linear Support Vector Machine) 및 RELM (Regularized Extreme Learning Machine)이 포함된다. 본 발명은 피어슨 상관관계(Pearson’s correlation) 기반 기능 연결을 사용하여 뇌 네트워크를 구성하였으며, 알츠하이머병 신경영상 연구(ADNI) 데이터 세트를 사용하여 뇌 네트워크의 분류 성능을 비교하였다. Node2vec 그래프 임베딩 방식을 사용하여 그래프 특징을 특징 벡터로 변환하였다. 실험 결과, LASSO 특성 선택 방법을 사용한 SVM이 다른 분류 기법에 비해 분류 정확도가 우수하였다.
1. 한국공개특허 제2021-0067592호 2. 한국공개특허 제2021-0082617호
본 발명은 fMRI 특징 기반 그래프 이론을 사용하여 정상인으로부터 알츠하이머병 또는 경도인지장애 분류를 위한 진단정보 제공방법을 제공하는 것을 목적으로 한다.
본 발명은 1) 특징(feature)을 추출하는 단계; 2) 그래프 이론을 이용하여 뇌 네트워크를 구축하는 단계; 3) node2vec 그래프 임베딩을 사용하여 그래프를 특징 벡터로 변환 단계; 4) 특징을 선택하는 단계; 5) 알츠하이머병의 진행 단계를 분류하는 단계; 및 6) 분류 결과를 평가하는 단계;를 포함하는 알츠하이머병의 진행 단계 분류를 위한 진단정보 제공방법을 제공한다.
본 발명의 일 구현예에 따르면, 상기 특징은 뇌파 검사(EEG), 기능적 자기공명영상(fMRI), 단일-광자 방사형 컴퓨터 단층촬영(SPECT) 및 양전자 방출 단층촬영(PET)으로 이루어진 군에서 선택된 하나로부터 추출된 것이다.
본 발명의 다른 구현예에 따르면, 상기 그래프 임베딩은 샘플링(sampling), 스킵-그램(skip-grapm) 및 임베딩 계산(computing embedding)을 포함하는 것이다.
본 발명의 또 다른 구현예에 따르면, 상기 선택은 서포트 벡터 머신-재귀적 특징 제거(SVM-RFE), 최소 절대 수축 및 선택 연산자(LASSO), 적응 구조 학습을 통한 특징 선택(FSASL), 로컬학습 및 클러스터링 기반 특징 선택(LLCFS) 및 쌍별 상관 기반 특징 선택 (CFS)로 이루어진 군에서 선택된 것이다.
본 발명의 일 구현예에 따르면, 상기 평가는 정확도(accuracy, ACC), 민감도(sensitivity, SEN) 및 특이도(specificity, SPE)로 이루어진 군에서 선택된 하나 이상으로 검증하는 것이다.
본 발명의 다른 구현예에 따르면, 상기 분류는 정규화된 극 학습 머신(regularized extreme learning machine, RELM) 및 선형 서포트 벡터 머신(Linear support vector machine, LSVM)으로 이루어진 군에서 선택된 하나 이상을 이용하는 것이다.
본 발명의 또 다른 구현예에 따르면, 상기 알츠하이머병의 진행 단계는 건강한 대조군(healthy control), 경도 인지장애(mild cognitive impairment) 및 알츠하이머병으로 이루어진 군에서 선택된 하나인 것이다.
본 발명에 따른 알츠하이머병 또는 경도인지장애 분류를 위한 진단정보 제공방법은 환자의 상태를 파악하는 조기 진단이 가능한 최적의 진단 수단을 제공하는 효과가 있다.
도 1은 본 발명에 따른 진단 시스템의 블록도를 나타낸 것이다.
도 2는 node2vec 알고리즘의 노드 선택 그림을 나타낸 것이다.
도 3은 LASSO 특징 선택을 사용하여 감소된 데이터 세트에서 RELM 분류 방법을 이용한 HC 대 AD의 평균 정확도 및 표준 편차를 그래프로 나타낸 것이다.
도 4는 Node2vec의 보행 길이의 다양한 매개변수 값이 (A) AD 대 HC, (B) HC 대 MCI, (C) AD 대 MCI 성능에 미치는 영향을 그래프로 나타낸 것이다.
도 5는 특징 선택 방법에 따른 RELM 분류기를 사용한 AD 대 HC에 대한 10겹 교차 검증 이진 평균 분류 성능을 나타낸 것이다.
도 6은 특징 선택 방법에 따른 RELM 분류기를 사용한 HC 대 MCI에 대한 10겹 교차 검증 이진 평균 분류 성능을 나타낸 것이다.
도 7은 특징 선택 방법에 따른 RELM 분류기를 사용한 MCI 대 AD에 대한 10겹 교차 검증 이진 평균 분류 성능을 나타낸 것이다.
도 8은 특징 선택 방법에 따른 LSVM 분류기를 사용한 AD 대 HC에 대한 10겹 교차 검증 이진 평균 분류 성능을 나타낸 것이다.
도 9는 특징 선택 방법에 따른 LSVM 분류기를 사용한 HC 대 MCI에 대한 10겹 교차 검증 이진 평균 분류 성능을 나타낸 것이다.
도 10은 특징 선택 방법에 따른 LSVM 분류기를 사용한 MCI 대 AD에 대한 10겹 교차 검증 이진 평균 분류 성능을 나타낸 것이다.
도 11은 rs-fMRI를 이용한 최신 방법과 이진 분류 AD 대 HC의 성능 비교 데이터를 나타낸 것이다.
도 12는 rs-fMRI를 이용한 최신 방법과 이진 분류 MCI 대 HC의 성능 비교 데이터를 나타낸 것이다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하기로 한다. 이들 실시예는 단지 본 발명을 예시하기 위한 것이므로, 본 발명의 범위가 이들 실시예에 제한되는 것으로 해석되지 않는다.
< 실시예 1> fMRI Dataset
본 발명은 알츠하이머병 신경영상 연구(ADNI) 데이터베이스 1의 데이터 세트를 사용했다. ADNI 데이터베이스는 2004년에 시작되었으며, 데이터베이스는 55~90세 범위의 대상으로 구성된다. ADNI의 목표는 다양한 바이오마커를 사용하여 질병의 진행을 연구하는 것이며, 여기에는 다양한 질병 상태의 경과에 따른 뇌의 구조와 기능에 대한 임상적 측정과 평가가 포함된다.
모든 참가자들은 다른 센터에서 3.0-Telsa Philips Achieva 스캐너를 사용하여 스캔되었다. 모든 참가자에 대해 동일한 스캔 프로토콜을 따랐으며, 설정된 파라미터는 반복 시간(TR) 대 에코 시간(TE)의 비율이다. 즉, TR/TE = 3000/30 ms, 140 부피, 복셀 두께 3.3 mm, 획득 매트릭스 크기 = 64×64, 48 슬라이스, 플립 각도 = 80°이다. 마찬가지로, MPRAGE sense2 시퀀스(획득 유형 3D, 자기장 강도 = 3 Tesla, 플립 각도 = 9.0도, 픽셀 간격 X = 1.0547000169754028 mm, 픽셀 간격 Y = 1.0547000169754028 mm, 슬라이스 두께 = 1.2000000476837158 mm, 에코 시간(TE) = 2.859 ms, 반전 시간(TI) = 0.0 ms, 반복 시간(TR) = 6.6764 ms, 가중치 T1)를 사용하여 3D T1 가중치 영상을 수집하였다. 하기 표 1에 표기된 대로 대상을 선정하였다.
Number of subjects Mean (SD)
HC (n = 31) MCI (n = 31) AD (n = 31)
Age (years) 73.9±5.4 74.5±5.0 72.7±7.0
Global CDR 0.04±0.13 0.5±0.18 0.95±0.30
MMSE 28.9±1.65 27.5±2.02 20.87±3.6
< 실시예 2> Subjects
ADNI2 코호트에서 93명의 피험자를 선택하였다. ADNI2의 목적은 뇌 영상 및 기타 바이오마커를 사용하여 MCI와 초기 AD의 진행상황을 측정하는 방법을 조사하는 것이다. ADNI는 특정 포함 기준에 따라 특정 그룹의 참가자를 선택하고 분류한다. 기준은 https://www.nia.nih.gov/alzheimers/clinical-trials/alzheimers-diseaseneuroimaging-initiative-2-adni2에 정의되어 있다. MRI 데이터와 fMRI 데이터의 가용성에 따라 대상을 선택하였다. 따라서 본 발명에서는 ADNI2 코호트에서 사용 가능한 모든 데이터 중 상기 표 1에 표시된 것과 같은 인구 통계학적 상태를 갖는 대상을 선택하였다.
1. HC 피험자 31명 : 남성 14명, 여성 17명; 연령±SD = 73.9±5.4세, 최소 정신 상태 추정(MMSE) 점수 = 28.9±1.65, 범위 = 24-30.
2. MCI 피험자 31명 : 남자 17명, 여자 14명; 연령±SD = 74.5±5.0, MMSE 점수 27.5±2.02, 범위 = 22-30.
3. AD 피험자 31명 : 남성 13명, 여성 18명; 연령±SD = 72.7±7.0, MMSE = 20.87±3.6, 범위 = 14-26.
< 실시예 3> Data Preprocessing
rs-fMRI 데이터 전처리를 위해 SPM8을 이용한 통계적 파라미터 맵핑 플랫폼 및 DPARSF3을 이용하여 rs-fMRI에 종속된 데이터 처리를 사용하였다. 처음 스캐너에서 얻은 모든 이미지는 DICOM (Digital Imaging and Communications in Medicine) 형식이며, 이 이미지를 NIfTI(neuroimaging informatics technology initiative) 파일 형식으로 변환하였다. 각 참가자를 스캔하는 동안 신호 표준화 및 참가자의 노이즈 적응은 각 참가자에 대한 처음 10개 시점을 폐기하여 수행하였다. 다음으로, 하기 단계를 통해 전처리 작업을 수행하였다.
슬라이스 타이밍 보정을 위해 마지막 슬라이스를 참조 슬라이스로 참조하였다. 머리 움직임 보정을 위해 머리 움직임 매개변수 6개, 이전 시점의 머리 움직임 매개변수 6개 및 해당 제곱 항목 12개를 포함하는 Friston 24-파라미터 모델을 재배열에 사용하였다. 마찬가지로 재배열 후 개별 구조 영상(T1-weighted MPRAGE)을 평균 기능 영상에 등록하였다. 원래 위치에 대한 rs-fMRI의 표준화는 DARTEL(diffeomorphic anatomical registration through exponentiated lie algebra)로 수행하였다(리샘플링 복셀 크기 = 3 mm × 3 mm × 3 mm). 평활화(smoothing)를 위해 6 mm 반전치폭(FWHM) 가우스 커널 공간 평활화를 사용하였다. 다음으로, 각 복셀의 시계열에 대해 선형 추세 배제와 (0.01Hz < f < 0.08Hz) 범위의 시간 대역 통과 필터링을 수행하였다. 마지막으로 뇌척수 신호 뿐만 아니라 백질 신호와 6개의 머리 움직임 매개변수를 회귀하여 방해 신호의 영향을 감소시켰다.
본 발명은 도 1과 같이 하기 4가지 주요 기능 단계로 구성된다.
1. 그래프 이론을 이용한 뇌 네트워크 구축
2. node2vec 그래프 임베딩을 사용하여 그래프를 특징 벡터로 변환
3. 특징 감소
4. 정규화된 극 학습 머신(regularized extreme learning machine, RELM)과 선형 서포트 벡터 머신(Linear support vector machine, LSVM)을 이용한 분류 수행
< 실시예 4> Construction of Brain Networks
fMR 이미지에서 네트워크를 구성하기 위해 먼저 데이터 전처리 섹션(실시예 3)에 설명된 대로 raw fMR 데이터를 전처리했다. 다음으로, 자동화된 해부학적 라벨링(automated anatomical labeling, AAL) 아틀라스를 사용하여 뇌 관심 영역(ROI)을 식별했다. 전체 이미지는 각 반구의 116개 영역으로 분할하였다. 다음으로, 각 ROI 내의 복셀 전반에 걸쳐 시계열을 평균화하여 각 피험자에 대한 각 ROI의 평균 시계열을 계산하였다. 각 피험자에 대해 130행, 116열의 행렬을 얻었다. 행렬에서 모든 행은 주어진 ROI에 맞는 시계열을 나타내며, 각 열에는 특정 시점의 전체 영역 정보가 저장된다. 각 뇌 영역의 평균 시계열은 해당 영역 내 시계열을 평균화하여 각 개인에 대해 구했다. L i = (l i (1), l i (2), … , l i (n)) 및 L j = (l j (1), l j (2), … , l j (n))가 뇌 영역 i와 j의 두 n 길이 시계열일 때, 이들 사이의 피어슨 상관관계(Pearson’s correlation, PC)는 하기 식 1과 같이 계산할 수 있다.
Figure pat00001
여기서 cov(L i , L j )는 변수 L i L j 의 공분산이며, σL i σL j 는 변수 L i L j 의 표준편차이다. 이 연산은 뇌의 다른 영역 간의 관계를 정의하고 기능적 연결 네트워크와 일치하는 116×116 상관 행렬을 생성한다.
< 실시예 5> Graph-Embedding
그래프는 한 쌍의 노드를 연결하는 유한한 꼭짓점 집합과 가장자리 집합으로 구성된 복잡한 데이터 구조이다. 그래프에서 널리 사용되는 패턴 인식 알고리즘을 조작할 수 있는 솔루션 중 하나는 그래프를 벡터 공간에 삽입하는 것이다. 실제로 그래프 임베딩은 통계적 패턴 인식과 그래프 마이닝 사이의 가교 역할을 한다. 본 발명에서는 그래프 임베딩 도구로 node2vec 알고리즘을 사용하였다. node2vec 알고리즘은 이웃 보존 목표를 최적화하여 그래프에서 노드의 벡터 표현을 학습하는 것을 목표로 한다. 이는 이전 노드 임베딩 알고리즘 Deepwalk를 확장하고 최신 단어 임베딩 알고리즘 word2vec에서 영감을 받았다.
word2vec에서 말뭉치라고도 하는 문장 세트가 주어지면 모델은 본문에 있는 각 단어의 맥락을 분석하여 단어 임베딩을 학습한다. word2vec은 하나의 은닉층이 있는 신경망을 사용하여 단어를 임베딩 벡터로 변환하며, 이 신경망을 Skip-gram이라고 한다. 이 네트워크는 문장에서 이웃 단어를 예측하도록 훈련되었으며, 입력 시 단어를 받아 문장 내 주변 단어를 높은 확률로 예측할 수 있도록 최적화되었다.
node2vec은 그래프에서 노드의 이웃을 훈련하고 예측하기 위해 동일한 임베딩 접근 방식을 적용한다. 그러나 단어는 노드로 대체되고 말뭉치 대신 노드 백이 사용된다. 샘플링은 그래프에서 이 노드 백을 생성하는 데 사용된다. 일반적으로 그래프 임베딩은 3단계로 구성된다.
1) Sampling
그래프는 랜덤 워크(random walk)로 샘플링된다. 랜덤 워크는 샘플링을 통해 이웃 노드의 백을 생성하며, 노드 백은 네트워크의 각 노드에 대한 맥락 모음 역할을 한다. 딥 워크(deep walk)와 관련된 node2vec의 혁신은 네트워크에서 유연한 편향 랜덤 워크를 사용하는 것이다. 딥 워크에서 랜덤 워크는 연결된 노드를 통해 균일한 무작위 샘플링으로 얻어지는 반면, node2vec은 네트워크 탐색을 위한 두 가지 다른 전략, 즉 깊이 우선 탐색(depth-first search, DFS)과 너비 우선 탐색(breadth-first search, BFS)을 결합한다. 노드 v의 현재 랜덤 워크 위치, 노드 t와 인접 노드 x1, x2 및 x3의 이전 단계에서 횡단된 위치에 대해 다음 노드 x의 샘플링은 도 2와 같이 정적 가장자리 가중치 wvx를 사용하여 가장자리 (t, v)에서 비정규화된 전이 확률 πvx를 평가하여 결정된다. 비정규화된 전이 확률은 πvx = αpq(t,x)·wvx인 두 개의 매개변수 p와 q에 의해 정의된 탐색 편향 α를 기반으로 추정된다.
Figure pat00002
여기서 dtx는 노드 t와 x 사이의 최단 경로 거리를 나타낸다.
매개변수 p는 랜덤 워크 동안 노드 t를 다시 샘플링할 가능성을 결정하며, p 값이 높을 때 노드의 재논의 가능성은 낮다. q는 로컬 노드와 글로벌 노드 간에 차이를 허용하며, q > 1이면 랜덤 워크는 노드 v 주변의 노드를 샘플링할 가능성이 높다.
2) Training Skip-Gram
랜덤 워크에서 생성된 노드 백은 skip-gram 네트워크에 공급된다. 각 노드는 원-핫 벡터로 표현되며 이웃 노드를 예측할 확률을 최대화한다. 원-핫 벡터는 텍스트 말뭉치에서 사용되는 고유 단어 집합의 크기와 동일한 크기를 갖는다. 각 노드에 대해 하나의 차원만 1과 같고 나머지는 0이다. 벡터에 하나가 있는 차원의 위치는 개별 노드를 정의한다.
3) Computing Embedding
네트워크의 은닉층의 출력은 그래프의 임베딩으로 간주한다.
< 실시예 6> Feature Reduction Techniques
1) Support Vector Machine-Recursive Feature Elimination (SVM-RFE)
서포트 벡터 머신-재귀적 특징 제거(SVM-RFE)는 래퍼 모델을 기반으로 하는 다변수 특징 축소 알고리즘이다. 이 방법은 재귀적이며, RFE의 각 반복에서 LSVM 모델이 학습된다. 이 방법은 전체 특징 집합에 대한 모델을 구성하고 각 특징의 중요도 점수를 계산하는 것으로 시작한다. 가장 덜 중요한 특징이 제거되고 모델이 재구성되며 중요도 점수가 다시 계산된다. 이 재귀 절차는 모든 특징이 제거될 때까지 계속된다. 그런 다음 제거 순서에 따라 특징의 순위가 지정된다. SVM-RFE 절차에 대한 자세한 설명은 이전 논문(Guyon et al., 2002)에 나와 있다. 본 발명은 SVM-RFE를 적용한 후 교차 검증된 정확도를 최대한 활용하는 가장 중요한 훈련 특징을 유지하여 분류기를 훈련시킨다.
2) Least Absolute Shrinkage and Selection Operator (LASSO)
최소 절대 수축 및 선택 연산자(LASSO)는 중요하지 않은 특징을 제거하는 데 사용되는 강력한 방법이다. 이 방법의 두 가지 주요 작업은 정규화 및 특징 선택이다. 이 방법은 모델 매개변수의 절대값 합계에 제약 조건을 두어 일반 최소 자승 회귀(ordinary least square regression, OLS)를 사용하여 모델의 잔차 제곱합을 최소화한다. LASSO는 다음 함수를 최소화하여 모델 계수 β를 계산한다.
Figure pat00003
여기서 xi는 그래프에 포함된 특성 입력 데이터, 관측값 j에서 k 값의 벡터, n은 관측값 수를 의미한다. yi는 관찰 i에서의 응답이며, α는 음이 아닌 사용자 정의 정규화 매개변수이다. 이 매개변수는 패널티의 강도를 제어한다. α가 충분히 크면 계수가 강제로 0이 되어 관련 특징이 거의 생성되지 않는다. α가 0에 접근하면 모델은 더 관련성이 높은 특징을 가진 OLS가 된다.
3) Features Selection With Adaptive Structure Learning (FSASL)
적응 구조 학습을 통한 특징 선택(FSASL)은 데이터 매니폴드 학습 및 특징 선택을 수행하는 비지도 방법이다. 이 방법은 먼저 데이터의 적응 구조를 활용하여 글로벌 학습과 로컬 학습을 구성한다. 다음으로 L2 ,1-norm regularizer와 통합하여 중요한 특징을 선택한다. 이 방법은 희소 재구성 계수를 활용하여 글로벌 학습을 위한 데이터의 글로벌 구조를 추출한다. 희소 표현에서 각 데이터 샘플 xi는 다른 모든 샘플의 선형 조합과 최적의 희소 조합 가중치 행렬로 근사화될 수 있다.
로컬 학습의 경우 유클리드 거리 유도 확률적 이웃 행렬을 직접 학습한다.
Figure pat00004
여기서, α는 희소성과 재구성 오차의 균형을 맞추는 데 사용되며, β와 γ는 첫 번째 및 두 번째 그룹의 글로벌 및 로컬 구조 학습과 세 번째 그룹의 특징 선택 행렬의 희소성에 대한 정규화 매개변수이다. S는 관련 글로벌 특징의 탐색을 안내하는 데 사용되며, P는 데이터 샘플 xi의 로컬 이웃을 정의한다.
4) Local Learning and Clustering Based Feature Selection (LLCFS)
LLCFS는 클러스터링 기반 특징 선택 방법으로, 가중 특징 공간에서 k-최근접 이웃 그래프를 구성하여 선택된 특징으로 적응형 데이터 구조를 학습한다. 조인트 클러스터링 및 특징 가중치 학습은 다음 문제를 해결하여 수행된다.
Figure pat00005
여기서 z는 특징 가중치 벡터이고, Nxi는 z 가중치 특징을 기반으로 하는 xi의 k-최근접 이웃이다.
5) Pairwise Correlation Based Feature Selection (CFS)
CFS는 상관관계에 기반한 경험적 평가 함수에 따라 순위 속성을 기반으로 특징을 선택한다. 속성 벡터로 구성된 부분집합은 평가 함수에 의해 평가되며, 이는 클래스 레이블과 연관되지만 서로 간에는 자율적이다. CFS는 관련되지 않은 구조가 클래스와 낮은 일치를 나타내므로 절차에서 간과해야 한다. 또는 추가 특징은 일반적으로 하나 이상의 다른 특징과 큰 상관관계가 있으므로 연구해야 한다.
6) Classification
본 발명에서는 널리 사용되는 두 가지 기계학습 분류 알고리즘인 LSVM 및 RELM을 연구하였다. 결과적으로, RELM 분류기가 다른 분류기보다 요구되는 계산 시간과 정확도 값과 관련하여 성능이 우수하다는 것을 알 수 있다. 각 방법을 하기에 간략히 설명하였다.
Support Vector Machine Classifier
선형 서포트 벡터 머신(Linear support vector machine)은 기본적으로 분리 가능한 데이터와 분리 불가능한 데이터를 분류하는 감독 이진 분류기이다. 이러한 유형의 분류는 일반적으로 신경 영상 분야에서 사용되며, 지난 수십 년 동안 신경과학 분야에서 가장 우수한 기계학습 방법 중 하나로 고려되었다. 훈련기간 동안 서포트 벡터로부터 최적의 경계를 갖는 두 클래스를 분할하는 최적의 초평면을 발견한다. 분류기는 새로운 데이터 포인트를 테스트하기 위해 추정된 초평면을 기반으로 결정한다. 선형으로 분리 가능한 패턴의 경우 LSVM을 사용할 수 있다. 또는 LSVM은 패턴을 분리할 수 없는 복잡한 상황에서 향상된 성능을 보장할 수 없다. 이러한 상황에서 커널 트릭을 사용하여 LSVM을 확장한다. 선형 SVM의 입력 배열은 커널을 사용하여 공간 차원으로 표시된다. 선형 및 비선형 방사형 기본 함수(Radial Basis Function, RBF) 커널은 모두 SVM 커널을 사용하여 광범위하게 훈련된다.
Extreme Learning Machine
극 학습 기계(Extreme Learning Machine, ELM)는 단일 레이어 피드포워드 신경망이다. 이 신경망은 가중치를 설정하기 위해 Moore-Penrose 일반화 역함수를 사용하여 구현된다. 따라서 이 학습 알고리즘은 인공 은닉 노드를 조정하기 위해 반복적인 그래디언트 기반 역전파를 필요로 하지 않는다. 따라서 이 방법은 복잡성이 극도로 감소된 효과적인 솔루션으로 간주된다. L개의 은닉 노드와 g(x)를 활성화 함수로 하는 ELM은 다음과 같이 표현된다.
Figure pat00006
여기서 x는 입력 벡터이며, hi(x)는 은닉 노드 출력에서 출력 노드로의 입력이다. β= [β1, …, β2]T는 i번째 노드의 가중치 행렬이다. 입력 가중치 wi와 은닉층 바이어스 bi는 훈련 샘플이 획득되기 전에 무작위로 생성된다. 따라서 이러한 매개변수를 조정하기 위한 반복적인 역전파가 필요하지 않다. 주어진 N개의 훈련 샘플은
Figure pat00007
이다. ELM의 목적 함수는 다음과 같이 표현된다.
Figure pat00008
Figure pat00009
여기서 H는 은닉층 출력 행렬을 나타내고, T는 훈련 데이터 행렬의 출력 레이블을 나타낸다. 출력 가중치 행렬 β는 다음과 같이 계산된다.
Figure pat00010
여기서 H+는 행렬 H의 무어-펜로즈 유사역행렬(Moore-Penrose inverse)을 나타낸다. ELM 학습 접근 방식은 역전파를 필요로 하지 않기 때문에 빅데이터 및 신경 영상 특징의 이진 및 다중 클래스 분류에 가장 적합하다. 그러나 계산 시간의 감소는 출력의 오류 증가를 수반하며, 이는 궁극적으로 정확도를 감소시킨다. 따라서 일반화 성능을 개선하고 솔루션을 보다 강력하게 만들기 위해 정규화 항이 추가된다. 정규화된 ELM의 출력 가중치는 다음과 같이 표현할 수 있다.
Figure pat00011
< 실시예 7> Performance Evaluation
이진 및 다중 클래스 테스트를 포함한 각 특정 테스트에 대해 SVM 및 RELM 분류기를 사용하여 성능을 평가했다. 혼동 행렬은 이진 분류기의 성능을 하기 표 2와 같은 형태로 시각화하여 구성하였다. 분류기의 정확한 예측 개수는 행렬의 대각선에 위치한다. 이러한 구성 요소는 올바르게 식별된 컨트롤을 나타내는 참 양성(true positive, TP), 참 음성(true negative, TN)으로 나뉜다. 마찬가지로, 거짓 양성(false positive, FP) 및 거짓 음성(false negative, FN)은 잘못 분류된 피험자의 수를 나타낸다.
Accurate Class Predicted Class
C1 C2
C1 TP FN
C2 FP TN
분류기에 의해 정확하게 분류된 피험자의 비율은 정확도(accuracy, ACC)로 표현된다.
Figure pat00012
그러나 불균형 클래스 분포 정확도를 가진 데이터 세트의 경우 좋은 성능 메트릭이 될 수 있다. 따라서 두 가지 성능이 더 사용된다. 이러한 측정 기준을 민감도(sensitivity, SEN) 및 특이성(specificity, SPE)이 사용된다.
Figure pat00013
Figure pat00014
민감도(SEN)는 참 양성(TP) 비율을 측정하고, 특이성(SPE)은 참 음성(TN) 비율을 측정한다.
< 시험예 1> Demographic and Clinical Findings
AD 대 HC, AD 대 MCI 및 MCI 대 HC에서, 연령에서 유의미한 그룹 차이를 발견하지 못했다. 그러나 모든 그룹 조합에서 MMSE(P<0.01) 및 CDR(P<0.01)에서 유의미한 그룹 차이가 발견되었다. AD와 HC의 성별 비율은 모두 남성이 우세하며, AD는 54.83%, HC는 45.16%의 남성 우세를 보인다. 상기 표 1은 이러한 변수에 대한 자세한 설명과 분석을 보여준다.
< 시험예 2> Classification Results
제안된 알고리즘의 성능을 관찰하고, 이진 분류를 구성하는 각 테스트에 대해 RELM 분류기 및 LSVM 분류기와 비교했다. 이진 분류기에 의해 보여지는 성능은 상기 표 1에 제시된 바와 같이 혼동 행렬로 예상된다. 행렬의 대각선 요소에 있는 요소는 분류기에 의한 정확한 추정치를 지정한다. 이러한 요소는 참 양성(TP)과 참 음성(TN)으로 나뉘는데, 이는 적절하게 인식된 대조군을 나타낸다. 이에 따라, 잘못 분류된 모든 사항은 거짓 양성(FP) 및 거짓 음성(FN)으로 기호화될 수 있다. 본 발명은 10겹 교차 검증(CV)을 사용하여 데이터 세트에 대한 특징 선택 및 분류 알고리즘을 평가했다. 먼저, 피험자를 10개의 동일한 크기의 하위 집합으로 나누었다. 각 하위 집합은 피험자의 10%를 테스트 세트로 포함하고, 나머지 90%는 훈련 세트로 포함한다. 그런 다음 훈련 세트에 대해 특징 순위를 지정했다. 본 발명은 특징의 순위를 매기기 위해 다양한 알고리즘을 사용했다. 선형 SVM 및 RELM 분류기는 이러한 최상위 특징을 사용하여 훈련되었다. 각 훈련 및 테스트에 대해 10겹 교차 검증 동안 특징 선택 편향을 방지하기 위해 별도의 특징 선택을 수행했다. 본 발명은 k-top 가장 순위가 높은 특징을 사용하여 특정 특징에 대한 교차 검증된 평균 분류 정확도와 표준 편차를 계산했다. 여기서 k는 1 내지 50이다. LASSO 특징 선택 및 RELM 분류기에 대해 도 3과 같이 5회 반복 테스트를 반복하고 평균 정확도와 표준 편차를 표시했다.
마지막으로 도 5 내지 도 10에 나와 있는 것처럼 다양한 특징 선택 및 분류 방법에 대해 가장 높은 순위 특징의 평균 정확도와 표준 편차를 계산했으며, 각 표의 굵은 값은 정확도, 민감도 및 특이성의 최대값을 나타낸다. 정확도, 민감도 및 특이성의 최대값과 최소값은 도 3과 같이 가장 높은 순위의 특징에 대해 추정된 해당 값 중에서 계산된다.
도 5 내지 도 7은 다섯 가지 특징 선택과 함께 RELM 분류기를 사용한 이진 분류 결과를 보여준다. 특징 선택 방법을 통해 얻은 결과는 정확도, 민감도, 특이성 및 f-측정과 같은 성능 메트릭과 관련하여 비교된다. 도 5는 AD 대 HC 분류를 요약한 것이다. LASSO 특징 선택 방법은 87.72%의 가장 높은 평균 정확도, 90.93%의 평균 특이도 및 84.52%의 평균 민감도로 고려된 다른 모든 방법보다 뛰어나다. 또한, LASSO의 표준편차는 0.4로, 1보다 작다. 마찬가지로 RELM을 이용한 AD 대 MCI 및 NC 대 MCI의 분류 결과는 도 6 및 도 7에 나와 있다. 도 6에서 보는 바와 같이 가장 높은 평균 정확도는 MCI 분류에 대한 HC의 경우 96.11(±0.859)이고, AD 분류에 대한 MCI의 경우 93.86(±0.766)이다. 표준 편차는 두 평균 분류 모두에서 1보다 작다. 또한 F-score는 다른 특징 선택 방법과 비교하여 LASSO 특징 섹션 방법을 사용하는 세 가지 분류(AD에 대한 HC의 경우 0.883, MCI에 대한 HC의 경우 0.973, MCI에 대한 AD의 경우 0.968)에서 모두 높다. 1보다 작은 표준 편차 값은 추정된 정확도의 데이터 포인트가 평균에 가까운 경향이 있음을 나타낸다. 따라서 LASSO를 사용하면 덜 부풀려진 정확도를 얻을 수 있다. 마찬가지로 F-score가 높으면 분류의 정밀도가 다른 특징 선택 방법에 비해 높다는 것을 나타낸다.
마찬가지로, 특징 선택 방법이 다른 LSVM 분류기를 사용한 HC, MCI 및 AD 분류의 비교는 도 8 내지 도 10에 나와 있다. RELM과 유사하게 평균 정확도, 특이성, 민감도 및 F-score 측면에서 가장 높은 성능 결과는 세 가지 분류 테스트 모두에 대해 LASSO를 사용하여 얻었다. 도 8에 나타난 바와 같이, HC에 대한 AD에 대해 90.63%의 정확도, 94.315%의 특이도, 87.95%의 민감도 및 0.958의 F-score를 얻었다. 도 9에서 가장 높은 평균 정확도, 특이성, 민감도 및 F-score는 MCI 분류에 대한 HC에 대해 98.9, 99.68, 98.11 및 0.9856%로 획득되었다. 도 10은 MCI에 대한 AD의 분류 성능을 보여준다. 가장 높은 평균 정확도, 특이도, 민감도 및 F-score는 97.81, 97.62, 97.74 및 0.98%이다.
이러한 모든 결과로부터, LASSO를 특징 선택 방법으로 사용하는 것이 그래프 임베디드 데이터에 대해 RELM 및 LSVM 분류기를 사용하는 분류에 이상적임을 알 수 있다.
도 5 내지 도 7에서 HC에 대한 AD, MCI에 대한 HC 및 AD에 대한 MCI에 대한 LASSO 특징 선택을 사용하는 RELM 분류기의 가장 높은 분류 정확도는 87.723%(±0.468), 96.11%(±0.859) 및 93.86%(±0.766)이다. 마찬가지로, 도 8 내지 도 10에서 HC에 대한 AD, MCI에 대한 HC 및 AD에 대한 MCI에 대한 LASSO 특징 선택을 사용하는 RELM 분류기의 가장 높은 분류 정확도는 90.63%(±0.515), 98.91%(±0.456) 및 97.80%(± 0.9862)이다.
두 분류기 간의 성능 비교를 통해 SVM이 주어진 데이터 세트를 세 가지 이진 분류 모두에 대해 가장 높은 평균 정확도로 더 정확하게 분류할 수 있음을 알 수 있다. 그러나 MCI에 대한 분류 HC 및 AD에 대한 MCI의 작은 표준 편차는 분류 정확도 값이 LSVM에 비해 RELM에서 덜 부풀려짐을 시사한다.
은닉층 노드의 수는 RELM 분류기의 성능에 영향을 미친다. 본 발명에서는 1,000개의 은닉층이 정확도 측면에서 최고의 성능을 생성한다는 것을 발견했다. 마찬가지로 SVM의 경우 MATLAB 라이브러리에 대해 정의된 기본 매개변수를 설정한다. node2vec 그래프 임베딩에 대해 서로 다른 매개변수를 변경하여 분류를 수행했다. 도 4는 node2vec의 다양한 매개변수가 RELM 분류기의 성능에 미치는 영향을 보여준다. node2veve의 보행 길이를 10에서 100으로 변경했다. 모든 실험에서 보행 길이의 값이 증가하면 분류기의 성능이 저하된다. 이 실험을 위해 차원과 보행 수의 두 가지 다른 매개변수를 32와 200으로 고정했다. 마찬가지로 매개변수 p와 q를 지역화된 무작위 보행에 해당하도록 설정했다. p 값이 작고 q 값이 클수록 랜덤 워크는 고차 근접도로 쉽게 샘플링할 수 있다. 따라서 p와 q를 무작위로 선택하고 p = 0.1 및 q = 1.6으로 그래프 임베딩을 수행했다.
<DISCUSSION>
rs-fMRI를 기반으로 한 여러 연구가 HC 피험자의 AD 및 MCI 분류를 위해 수행되었다. 도 11, 12에 표시된 대로, 다른 특징 척도를 가진 다른 분류기를 조합한 이진 분류는 HC에 대한 AD의 경우 85~95%, HC에 대한 MCI에 대해 62.90~72.58%의 정확도를 보고했다. 이러한 연구는 ADNI2 코호트의 동일한 MCI 및 HC 피험자를 사용했다. 피험자의 수가 정확도에 직접적인 영향을 미친다는 것을 알 수 있으며, 피험자 수가 늘어날수록 정확도가 떨어진다. 이전 섹션에서 보고된 바와 같이 본 발명에서 얻은 AD 분류에 대한 최고 정확도는 LASSO와 LSVM의 조합을 사용하여 90.63%이다. MCI와 HC의 결과를 비교하면 현재 연구에서 얻은 결과가 모든 최신 방법을 능가한다. 그러나 각 작업은 서로 다른 데이터 세트, 전처리 파이프라인, 특징 측정 및 분류기를 사용하기 때문에 다른 연구와 성능을 직접 비교하는 것은 공정하지 않다. 대부분의 연구는 각 대상 클래스에서 30개 미만 또는 거의 동일한 대상을 사용했다. 각 피험자 클래스에서 30 미만 또는 거의 같은 수를 사용한 연구가 대다수이다. 데이터 세트 수가 적은 주된 이유는 ADNI2 코호트에서 fMRI 데이터를 사용할 수 있기 때문이다. 이 모든 연구는 분류를 수행하고 결론을 내렸다. 마찬가지로, 이전 연구와 거의 동일한 수의 피험자와 함께 ADNI2 코호트를 사용하여 연구를 수행했으며, 교차 검증도 이 데이터 세트를 사용하여 수행했다.
경도인지장애는 건강한 비-치매 단계와 치매 단계 사이의 과도기 단계이다. 이 단계는 일시적 기억 장애의 정도에 따라 초기 MCI(early MCI, EMCI)와 후기 MCI(late MCI, LMCI)로 더 나뉜다. MCI에서 AD로의 위험 전환은 EMCI보다 LMCI에서 더 높다. 본 발명은 MCI 그룹에 EMCI 피험자만 포함시켰다. MCI 변환 및 미변환은 CDR과 MMSE 점수에 따라 분류된다. CDR이 0.5에서 1로 변경되고 후속 방문에서 MMSE 점수가 26 미만인 MCI 피험자는 MCI 전환 기준을 충족한 것으로 간주된다. 본 발명에서 대부분의 피험자는 비전환 MCI를 충족한다. 3, 6, 12, 18개월 간격의 방문 기간 동안 CDR 점수 또는 MMSE 점수를 변경한 피험자는 극소수에 불과했다. 또한, MCI 피험자 중 아무도 AD 피험자 목록에 기록되지 않는다.
<CONCLUSION>
AD 및 MCI의 조기 진단은 예방 조치를 취하고 AD의 향후 진행을 지연시키는 데 중요한 역할을 한다는 것이 널리 받아들여지고 있다. 따라서 AD 진행의 여러 단계에 대한 정확한 분류 작업이 필수적이다. 본 발명은 기능적 자기 공명(fMR) 이미지의 그래프 기반 특징을 HC의 AD 및 MCI 분류에 사용할 수 있음을 입증하였다. 또한, 더 많은 수의 특징 표현으로 더 적은 수의 피험자에 대처하기 위해 다중 특징 선택 기술을 사용했다. 표준 알츠하이머병 신경영상 이니셔티브(Neuroimaging Initiative) 코호트에서 적절한 양의 특징을 추출하여 다른 모든 최근 연구와 비교하여 최대 분류 정확도를 제공하였다. 다양한 특징 섹션 방법 중 그래프 기반 특징의 LSVM 및 LASSO는 분류 정확도를 크게 향상시켰다.
이상의 설명은 본 발명을 예시적으로 설명한 것에 불과한 것으로, 본 발명에 속하는 기술분야에서 통상의 지식을 가지는 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 변형이 가능할 것이다. 따라서, 본 명세서에 개시된 실시예들은 본 발명을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 사상과 범위가 한정되는 것은 아니다. 본 발명의 보호범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 모든 기술은 본 발명의 권리범위에 포함하는 것으로 해석되어야 할 것이다.

Claims (7)

1) 특징(feature)을 추출하는 단계;
2) 그래프 이론을 이용하여 뇌 네트워크를 구축하는 단계;
3) node2vec 그래프 임베딩을 사용하여 그래프를 특징 벡터로 변환 단계;
4) 특징을 선택하는 단계;
5) 알츠하이머병의 진행 단계를 분류하는 단계; 및
6) 분류 결과를 평가하는 단계;를 포함하는 알츠하이머병의 진행 단계 분류를 위한 진단정보 제공방법
제1항에 있어서, 상기 특징은 뇌파 검사(EEG), 기능적 자기공명영상(fMRI), 단일-광자 방사형 컴퓨터 단층촬영(SPECT) 및 양전자 방출 단층촬영(PET)으로 이루어진 군에서 선택된 하나로부터 추출된 것인, 알츠하이머병의 진행 단계 분류를 위한 진단정보 제공방법
제1항에 있어서, 상기 그래프 임베딩은 샘플링(sampling), 스킵-그램(skip-grapm) 및 임베딩 계산(computing embedding)을 포함하는 것인, 알츠하이머병의 진행 단계 분류를 위한 진단정보 제공방법
제1항에 있어서, 상기 선택은 서포트 벡터 머신-재귀적 특징 제거(SVM-RFE), 최소 절대 수축 및 선택 연산자(LASSO), 적응 구조 학습을 통한 특징 선택(FSASL), 로컬학습 및 클러스터링 기반 특징 선택(LLCFS) 및 쌍별 상관 기반 특징 선택 (CFS)로 이루어진 군에서 선택된 것인, 알츠하이머병의 진행 단계 분류를 위한 진단정보 제공방법
제1항에 있어서, 상기 평가는 정확도(accuracy, ACC), 민감도(sensitivity, SEN) 및 특이도(specificity, SPE)로 이루어진 군에서 선택된 하나 이상으로 검증하는 것인, 알츠하이머병의 진행 단계 분류를 위한 진단정보 제공방법
제1항에 있어서, 상기 분류는 정규화된 극 학습 머신(regularized extreme learning machine, RELM) 및 선형 서포트 벡터 머신(Linear support vector machine, LSVM)으로 이루어진 군에서 선택된 하나 이상을 이용하는 것인, 알츠하이머병의 진행 단계 분류를 위한 진단정보 제공방법
제1항에 있어서, 상기 알츠하이머병의 진행 단계는 건강한 대조군(healthy control), 경도 인지장애(mild cognitive impairment) 및 알츠하이머병으로 이루어진 군에서 선택된 하나인 것인, 알츠하이머병의 진행 단계 분류를 위한 진단정보 제공방법
KR1020210155359A 2021-11-12 2021-11-12 뇌 네트워크를 이용한 알츠하이머병에 대한 진단정보 제공방법 KR20230070085A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210155359A KR20230070085A (ko) 2021-11-12 2021-11-12 뇌 네트워크를 이용한 알츠하이머병에 대한 진단정보 제공방법
US17/592,744 US20230148955A1 (en) 2021-11-12 2022-02-04 Method of providing diagnostic information on alzheimer's disease using brain network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210155359A KR20230070085A (ko) 2021-11-12 2021-11-12 뇌 네트워크를 이용한 알츠하이머병에 대한 진단정보 제공방법

Publications (1)

Publication Number Publication Date
KR20230070085A true KR20230070085A (ko) 2023-05-22

Family

ID=86324708

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210155359A KR20230070085A (ko) 2021-11-12 2021-11-12 뇌 네트워크를 이용한 알츠하이머병에 대한 진단정보 제공방법

Country Status (2)

Country Link
US (1) US20230148955A1 (ko)
KR (1) KR20230070085A (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230178200A1 (en) * 2021-12-03 2023-06-08 Digital Diagnostics Inc. Direct medical treatment predictions using artificial intelligence
CN116452593B (zh) * 2023-06-16 2023-09-05 武汉大学中南医院 血管性认知障碍的ai评估模型的构建方法、装置及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210067592A1 (en) 2019-09-03 2021-03-04 Cisco Technology, Inc. Path validation and performance assurance for distributed network endpoints
US20210082617A1 (en) 2019-09-16 2021-03-18 Utah State University Wireless power transfer with active field cancellation using multiple magnetic flux sinks

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210067592A1 (en) 2019-09-03 2021-03-04 Cisco Technology, Inc. Path validation and performance assurance for distributed network endpoints
US20210082617A1 (en) 2019-09-16 2021-03-18 Utah State University Wireless power transfer with active field cancellation using multiple magnetic flux sinks

Also Published As

Publication number Publication date
US20230148955A1 (en) 2023-05-18

Similar Documents

Publication Publication Date Title
Ghazal et al. Alzheimer disease detection empowered with transfer learning
Khojaste-Sarakhsi et al. Deep learning for Alzheimer's disease diagnosis: A survey
Ashtari-Majlan et al. A multi-stream convolutional neural network for classification of progressive MCI in Alzheimer’s disease using structural MRI images
Li et al. Novel effective connectivity inference using ultra-group constrained orthogonal forward regression and elastic multilayer perceptron classifier for MCI identification
Nigri et al. Explainable deep CNNs for MRI-based diagnosis of Alzheimer’s disease
Chaki et al. A deep learning based four-fold approach to classify brain MRI: BTSCNet
Jha et al. Alzheimer’s disease detection using sparse autoencoder, scale conjugate gradient and softmax output layer with fine tuning
US20230148955A1 (en) Method of providing diagnostic information on alzheimer&#39;s disease using brain network
Kumar et al. An approach for brain tumor detection using optimal feature selection and optimized deep belief network
Kanna et al. Computing Model for Alzheimer Prediction Using Support Vector Machine Classifier
Sathish et al. Exponential cuckoo search algorithm to radial basis neural network for automatic classification in MRI images
Hota et al. Review of intelligent techniques applied for classification and preprocessingof medical imagedata
Abbas et al. Enhanced Skin Disease Diagnosis through Convolutional Neural Networks and Data Augmentation Techniques
Carvalho et al. COVID-19 diagnosis in CT images using CNN to extract features and multiple classifiers
Taqi et al. Classification of Alzheimer disease based on normalized Hu moment Invariants and multiclassifier
Rallabandi et al. Machine Learning-Based Classification of Dementia Types: MRI Study
Basu Analyzing Alzheimer's disease progression from sequential magnetic resonance imaging scans using deep convolutional neural networks
Dufumier et al. Exploring the potential of representation and transfer learning for anatomical neuroimaging: application to psychiatry
Begum et al. Multiclass Diagnosis of Alzheimer’s Disease Analysis Using Machine Learning and Deep Learning Techniques
Liu et al. Context-endcoding for neural network based skull stripping in magnetic resonance imaging
Lu et al. Diagnosis of Alzheimer’s Disease with Extreme Learning Machine on Whole‐Brain Functional Connectivity
Vishal et al. A Novel Survey on Copious Machine Learning Algorithms for Brain Tumor Detection
Shantta Brain tumor diagnosis support system: A decision fusion framework
Vashishtha et al. Automatically detection of multi-class Alzheimer disease using deep Siamese convolutional neural network
Enns et al. Identifying autism spectrum disorder using brain networks: Challenges and insights