KR102572517B1 - 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치 - Google Patents

인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치 Download PDF

Info

Publication number
KR102572517B1
KR102572517B1 KR1020210108750A KR20210108750A KR102572517B1 KR 102572517 B1 KR102572517 B1 KR 102572517B1 KR 1020210108750 A KR1020210108750 A KR 1020210108750A KR 20210108750 A KR20210108750 A KR 20210108750A KR 102572517 B1 KR102572517 B1 KR 102572517B1
Authority
KR
South Korea
Prior art keywords
data
raman
component
eosinophils
eosinophil
Prior art date
Application number
KR1020210108750A
Other languages
English (en)
Other versions
KR20230027365A (ko
Inventor
김준기
주미연
조유숙
백찬기
이지향
Original Assignee
주식회사 아폴론
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아폴론 filed Critical 주식회사 아폴론
Priority to KR1020210108750A priority Critical patent/KR102572517B1/ko
Priority to US17/820,461 priority patent/US20230056999A1/en
Publication of KR20230027365A publication Critical patent/KR20230027365A/ko
Priority to KR1020230108876A priority patent/KR20230127947A/ko
Application granted granted Critical
Publication of KR102572517B1 publication Critical patent/KR102572517B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/314Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry with comparison of measurements at specific and non-specific wavelengths
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/12Pulmonary diseases

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치가 제공된다. 상기 방법은, 피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행하여 라만 데이터를 생성하는 단계, 상기 생성된 라만 데이터를 전처리하는 단계, 상기 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여하는 단계, 상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류하는 단계, 상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출하는 단계 및 상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단하는 단계를 포함한다.

Description

인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치{METHOD AND APPARATUS FOR PROCESSING RAMAN DATA OF EOSINOPHIL BASED ON ARTIFICIAL INTELLIGENCE}
본 발명은 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치에 관한 것이다.
일반적으로 천식은 스테로이드제, 류코트리엔조절제, 지속성흡입 베타2항진제, 테오필린 등으로 증상완화와 염증조절을 목표로 치료한다. 하지만, 이런 일반적인 천식 치료를 위한 약물들을 모두 사용했음에도 증상이 조절되지 않는 천식을 ‘중증 천식’이라 한다. 또한, 천식 악화가 자주 나타나거나, 경구용 스테로이드 복용을 중단할 경우 바로 숨이 차고 기침이나 가래가 나오는 등 치료제를 최대한으로 사용함에도 불구하고 증상이 조절되지 않는 환자들을 임상적으로 중증 천식 환자로 분류한다. 미국흉부학회(ATS)나 미국 혹은 유럽의 호흡기학회 가이드라인을 살펴보면, 약제를 사용함에도 불구하고 1년에 2회 이상 천식 악화가 나타날 경우 중증 천식으로 정의하기도 한다.
이렇듯 명확한 진단법이 없는 중증 천식은 현재 국내 천식환자의 약 10% 가량이 앓고 있으며, 중증 천식 환자들 사이에서도 증상 조절의 정도가 매우 다양하게 나타나기 때문에 한 마디로 정의하기가 쉽지 않다.
중증 천식의 일종인 호산구성 천식의 경우 높은 혈중 호산구 수치 (150cells/μL 이상)를 증상으로 나타내게 된다. 호산구는 세포질에 호산성 과립 (Granule)을 가지고 있는 과립구성 백혈구의 일종으로 알레르기 반응에 참여하는 주요 세포이며, 호산구의 세포질에 있는 작은 과립에는 페록시다아제, RNA 분해효소(RNase), DNA 분해효소(DNase), 지방분해효소, 플라스미노겐 등과 같은 여러 화학적 매개물질을 포함하고 있으며, 이 매개물질들은 호산구의 활성화에 따른 탈과립 과정에 의해 분비되고, 기생충과 주변 조직에 모두를 파괴하게 된다.
호산구성 천식을 위한 특이적인 혈액검사는 없으며, 혈액검사를 통해 호산구의 수치를 카운팅 하는 것이 일반적이다.
한편, 라만분석은 시료의 화학 종(단백질의 종류, 지질, RNA, DNA 등)을 검출하는데 유용한 측정 방법이다. 이는 유기 및 무기 분자는 고유의 라만 시프트 스펙트럼(Raman shift spectrum)을 가지고 있기 때문이다. 하지만 라만 스펙트럼 내에 너무 많은 호산구의 정보가 들어있어 라만 스펙트럼의 데이터 분류가 어려운 현실이다.
공개특허공보 제10-2018-0127939호, 2018.11.30.
본 발명이 해결하고자 하는 과제는 호산구성 천식의 정확한 진단을 위해 호산구를 라만장비로 측정 후 화학적인 광학적 특성을 비교하여 호산구의 상태가 정상인지 비정상인지 신속하게 분류하여 호산구성 관련 질병의 진단 근거를 제시할 수 있는 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치를 제공하는 것이다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 인공지능 기반 호산구의 라만 데이터 처리 방법은, 피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행하여 라만 데이터를 생성하는 단계, 상기 생성된 라만 데이터를 전처리하는 단계, 상기 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여하는 단계, 상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류하는 단계, 상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출하는 단계 및 상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단하는 단계를 포함한다.
본 발명에서, 상기 라만 데이터는, 상기 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터이며, 상기 각 포인트 별로 맵핑된 2차원 데이터는 서로 다른 라만 스펙트럼을 포함할 수 있다.
본 발명에서, 상기 가중치 부여 단계는, 상기 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환하는 단계, 상기 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출하는 단계 및 상기 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여하는 단계를 포함할 수 있다.
본 발명에서, 상기 분류 단계는, k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행하고, 상기 추출 단계는, 상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행하고, 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단하고, 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출할 수 있다.
본 발명에서, 상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터일 수 있다.
본 발명에서, 상기 판단 단계는, 인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단할 수 있다.
본 발명에서, 상기 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대한 제1 라만 데이터 처리 과정, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대한 제2 라만 데이터 처리 과정, 상기 제1 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 제2 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축될 수 있다.
상술한 과제를 해결하기 위한 본 발명의 다른 면에 따른 인공지능 기반 호산구의 라만 데이터 처리 장치는, 통신부, 인공지능 기반의 학습 모델을 이용한 호산구의 라만 데이터 처리를 위한 적어도 하나의 프로세스를 저장하고 있는 메모리 및 상기 프로세스에 따라 동작하는 프로세서를 포함하고, 상기 프로세서는, 상기 프로세스를 기반으로, 피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행하여 라만 데이터를 생성하고, 상기 생성된 라만 데이터를 전처리하고, 상기 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여하고, 상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류하고, 상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출하고, 상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단한다.
본 발명에서, 상기 라만 데이터는, 상기 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터이며, 상기 각 포인트 별로 맵핑된 2차원 데이터는 서로 다른 라만 스펙트럼을 포함할 수 있다.
본 발명에서, 상기 프로세서는, 상기 가중치 부여 시, 상기 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환하고, 상기 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출하고, 상기 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여할 수 있다.
본 발명에서, 상기 프로세서는, 상기 분류 시, k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행하고, 상기 추출 시, 상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행하고, 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단하고, 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출할 수 있다.
본 발명에서, 상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터일 수 있다.
본 발명에서, 상기 프로세서는, 상기 판단 시, 인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단할 수 있다.
본 발명에서, 상기 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대해 상기 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대해 상기 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축될 수 있다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.
본 발명에 따르면, 호산구의 혈액내 수치만 판단하는 기존의 호산구성 병증 진단법과 다르게 호산구의 화학적 특성 중 문제가 되는 과립의 화학적 특성만 추출하기 때문에 호산구 증가가 동반된 다양한 질병(호산구 증가증, 처그-스트라우스 신드롬)을 진단하는 것이 가능하다.
통계기반 머신러닝을 이용한 호산구의 라만 데이터 처리 알고리즘은 복잡한 라만 스펙트럼 데이터에서 구성성분 별 분류가 가능하도록 하여 호산구 간의 구성성분 별 비교가 가능하며, 호산구성 천식 진단이 가능하다.
본 발명의 호산구의 라만 데이터 처리 알고리즘을 이용한 과립 데이터 추출은 정상 호산구와 질병 호산구의 차이점이 무엇인지 정확히 비교할 수 있으며, 변화된 아미노산 및 지질의 구성을 유추할 수 있다. 또한 백그라운드, 세포벽과 핵의 데이터 포함으로 인한 비교 평균 오류가 감소할 수 있다.
본 발명의 호산구의 라만 데이터 처리 알고리즘은 호산구의 과립 데이터를 추출하는 알고리즘이기 때문에 호산구 뿐만 아니라 기타 다른 과립성 세포 관련 질환에도 적용 가능하다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 장치의 개략적인 블록도이다.
도 2는 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 방법의 순서도이다.
도 3은 본 발명에 따른 라만 데이터를 설명하기 위한 도면이다.
도 4는 본 발명에 따른 구성성분 별 가중치 부여를 설명하기 위한 도면이다.
도 5는 본 발명에 따른 구성 성분 별 군집분류 및 데이터 라벨링을 통한 데이터 추출을 설명하기 위한 도면이다.
도 6은 본 발명에 따른 피진단자의 호산구 특성을 통해 피진단자의 정상 여부를 판단하는 것을 설명하기 위한 도면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
공간적으로 상대적인 용어인 "아래(below)", "아래(beneath)", "하부(lower)", "위(above)", "상부(upper)" 등은 도면에 도시되어 있는 바와 같이 하나의 구성요소와 다른 구성요소들과의 상관관계를 용이하게 기술하기 위해 사용될 수 있다. 공간적으로 상대적인 용어는 도면에 도시되어 있는 방향에 더하여 사용시 또는 동작시 구성요소들의 서로 다른 방향을 포함하는 용어로 이해되어야 한다. 예를 들어, 도면에 도시되어 있는 구성요소를 뒤집을 경우, 다른 구성요소의 "아래(below)"또는 "아래(beneath)"로 기술된 구성요소는 다른 구성요소의 "위(above)"에 놓여질 수 있다. 따라서, 예시적인 용어인 "아래"는 아래와 위의 방향을 모두 포함할 수 있다. 구성요소는 다른 방향으로도 배향될 수 있으며, 이에 따라 공간적으로 상대적인 용어들은 배향에 따라 해석될 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.
설명에 앞서 본 명세서에서 사용하는 용어의 의미를 간략히 설명한다. 그렇지만 용어의 설명은 본 명세서의 이해를 돕기 위한 것이므로, 명시적으로 본 발명을 한정하는 사항으로 기재하지 않은 경우에 본 발명의 기술적 사상을 한정하는 의미로 사용하는 것이 아님을 주의해야 한다.
본 명세서에서 '장치'는 연산처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함된다. 예를 들어, 장치는 컴퓨터 및 이동 단말기 형태가 될 수 있다. 상기 컴퓨터는 클라이언트로부터 요청을 수신하여 정보처리를 수행하는 서버 형태가 될 수 있다. 또한, 컴퓨터에는 시퀀싱을 수행하는 시퀀싱 장치가 해당될 수 있다. 상기 이동 단말기는 휴대폰, 스마트 폰(smart phone), PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 노트북 PC, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등이 포함될 수 있다.
도 1은 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 장치의 개략적인 블록도이다.
도 2는 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 방법의 순서도이다.
도 3은 본 발명에 따른 라만 데이터를 설명하기 위한 도면이다.
도 4는 본 발명에 따른 구성성분 별 가중치 부여를 설명하기 위한 도면이다.
도 5는 본 발명에 따른 구성 성분 별 군집분류 및 데이터 라벨링을 통한 데이터 추출을 설명하기 위한 도면이다.
도 6은 본 발명에 따른 피진단자의 호산구 특성을 통해 피진단자의 정상 여부를 판단하는 것을 설명하기 위한 도면이다.
이하에서 도 1을 참조하여, 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 장치(10)(이하, 장치)에 대해서 설명하도록 한다.
본 발명에 따른 장치(10)는 피진단자의 혈액에서 분리된 호산구를 페트리 디쉬(petri dish)에 고정한 후, 라만 분석을 통해 핵, 세포질, 백그라운드(background) 등 다양한 구성성분이 포함된 라만 데이터를 획득할 수 있다.
장치(10)는 획득된 라만 데이터를 정규화(normalization) 등 전처리할 수 있다.
장치(10)는 전처리된 라만 데이터를 인공지능 기반 학습 모델을 이용하여 라만 데이터에 포함된 구성성분 별로 가중치를 부여하고, 이후 구성성분 별로 분류하여, 분류된 데이터를 라벨링함으로써, 호산구 중 과립의 데이터만 추출할 수 있다.
이때, 추출된 과립의 데이터는 전처리만 되어있는 데이터로서, 별도의 가공 및 손실이 없는 데이터이므로 호산구 별 화학적 특성 비교가 가능하다.
이러한 장치(10)는 연산처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함될 수 있다.
여기서, 장치(10)는 컴퓨터의 형태가 될 수 있다. 보다 상세하게는, 상기 컴퓨터는 연산처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함될 수 있다.
예를 들어, 컴퓨터는 데스크 탑 PC, 노트북(Note Book) 뿐만 아니라 스마트폰(Smart phone), 태블릿 PC, 셀룰러폰(Cellular phone), 피씨에스폰(PCS phone; Personal Communication Service phone), 동기식/비동기식 IMT-2000(International Mobile Telecommunication-2000)의 이동 단말기, 팜 PC(Palm Personal Computer), 개인용 디지털 보조기(PDA; Personal Digital Assistant) 등도 해당될 수 있다. 또한, 헤드마운트 디스플레이(Head Mounted Display; HMD) 장치가 컴퓨팅 기능을 포함하는 경우, HMD장치가 컴퓨터가 될 수 있다.
그리고, 장치(10)는 통신부(12), 메모리(14) 및 프로세서(16)를 포함할 수 있다. 프로세서(16)는 측정부(162), 전처리부(164), 분류부(166) 및 추출부(168)를 포함할 수 있다. 여기서, 장치(10)는 도 1에 도시된 구성요소보다 더 적은 수의 구성요소나 더 많은 구성요소를 포함할 수 있다.
통신부(12)는 장치(10)와 외부장치(미도시) 사이, 장치(10)와 외부서버(미도시) 사이 또는 장치(10)와 통신망(미도시) 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다.
여기서, 통신망(미도시)은 장치(10), 외부 장치(미도시) 및 외부 서버(미도시) 간의 다양한 정보를 송수신할 수 있다. 통신망(미도시)은 다양한 형태의 통신망이 이용될 수 있으며, 예컨대, WLAN(Wireless LAN), 와이파이(Wi-Fi), 와이브로(Wibro), 와이맥스(Wimax), HSDPA(High Speed Downlink Packet Access) 등의 무선 통신방식 또는 이더넷(Ethernet), xDSL(ADSL, VDSL), HFC(Hybrid Fiber Coax), FTTC(Fiber to The Curb), FTTH(Fiber To The Home) 등의 유선 통신방식이 이용될 수 있다.
한편, 통신망(미도시)은 상기에 제시된 통신방식에 한정되는 것은 아니며, 상술한 통신방식 이외에도 기타 널리 공지되었거나 향후 개발될 모든 형태의 통신 방식을 포함할 수 있다.
통신부(12)는 장치(10)를 하나 이상의 네트워크에 연결하는 하나 이상의 모듈을 포함할 수 있다.
메모리(14)는 장치(10)의 다양한 기능을 지원하는 데이터를 저장할 수 있다. 메모리(14)는 장치(10)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 장치(10)의 동작을 위한 적어도 하나의 프로세스, 인공지능 기반 학습 모델, 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 장치(10)의 기본적인 기능을 위하여 존재할 수 있다. 한편, 응용 프로그램은, 메모리(14)에 저장되고, 장치(10) 상에 설치되어, 프로세서(16)에 의하여 상기 장치(10)의 동작(또는 기능)을 수행하도록 구동될 수 있다.
프로세서(16)는 상기 응용 프로그램과 관련된 동작 외에도, 통상적으로 장치(10)의 전반적인 동작을 제어할 수 있다. 프로세서(16)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(14)에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.
또한, 프로세서(16)는 메모리(14)에 저장된 응용 프로그램을 구동하기 위하여, 도 1과 함께 살펴본 구성요소들 중 적어도 일부를 제어할 수 있다. 나아가, 프로세서(16)는 상기 응용 프로그램의 구동을 위하여, 장치(10)에 포함된 구성요소들 중 적어도 둘 이상을 서로 조합하여 동작 시킬 수 있다.
또한, 프로세서(16)에 포함된 측정부(162), 전처리부(164), 분류부(166) 및 추출부(168)는 상술한 바와 같이 각각의 기능을 수행할 수 있다.
측정부(162)는 피진단의 혈액에서 분리된 호산구에 대해 라만 분석을 수행할 수 있다. 측정부(162)는 라만 분석을 위한 라만 분광기일 수 있지만, 이에 제한되지 않는다. 실시예에 따라, 측정부(162)는 장치(10)와 개별 장치로 구성되어 통신모듈을 통해 데이터를 송수신할 수 있고, 또는 장치(10) 내에 포함되어 구성될 수 있다. 측정부(162)는 특정 파장의 레이저 광을 호산구에 입사했을 때 호산구의 구성성분 별로 상이한 에너지 변화량 등에 따라 특정 파장의 각 포인트 별로 상이하게 나타나는 라만 스펙트럼을 측정할 수 있다. 여기서, 특정 파장은 기 설정된 파장일 수 있다.
측정부(162)에 의한 측정에 따라 생성되는 라만 데이터는 전처리부(164)에서 정규화 등 전처리되게 된다.
분류부(166)는 전처리된 라만 데이터를 구성성분 별로 가중치를 부여해서 구성성분 별로 군집 분류를 수행할 수 있다.
추출부(168)는 구성성분 별로 분류된 데이터를 라벨링하고 라벨이 과립인 데이터만 추출할 수 있다.
상기에서는 프로세서(16)의 복수의 구성요소가 각각의 기능을 수행하는 것으로 설명하였지만, 이는 설명의 편의를 위해 기능 별로 구성요소를 구분해서 프로세서(16)의 동작을 설명한 것이다. 즉, 프로세서(16)가 상기의 모든 동작을 수행할 수 있으며, 다만 측정부(162)가 장치(10)와 개별 장치로 구성된 경우에만 프로세서(16)는 개별 장치인 측정부(162)로부터 라만 데이터를 제공받을할 수 있다.
이하에서는 도 2 내지 도 5를 참조하여, 프로세서(16)가 인공지능 기반으로 호산구의 라만 데이터를 처리하는 방법을 설명하도록 한다. 여기서, 프로세서(16)의 동작은 장치(10)에서 수행 가능할 수 있다.
도 2를 참조하면, 프로세서(16)는 피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행할 수 있다(S210). 프로세서(16)는 분석된 결과에 기초하여 라만 데이터를 생성할 수 있다(S220). 단계 S210에 대한 상세한 설명한 상술한 바와 중복되므로 생략하도록 한다.
본 발명에서 사용되는 라만 분석은 입사되는 레이저의 빛 알갱이의 비탄성 산란을 측정하는 분광 분석일 수 있지만, 이에 제한되는 것은 아니다.
단계 S210에서 라만 분석을 통해 획득되는 라만 데이터는, 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터일 수 있다.
도 3을 참조하면, 가로 길이가 X이고 세로 길이가 Y인 복수의 2차원 데이터가 파장(wavelength)의 진행 방향에 따라 나열되어 라만 데이터(라만 맵핑 데이터)를 생성할 수 있다.
도 3에 도시된 바와 같이, 파장의 각각의 포인트에 맵핑된 2차원 데이터는 이미지 내에 명확히 표현되는 구성성분이 상이할 수 있다. 이는 각 포인트에서 각각의 구성성분의 광학적 특성이 각각 상이하기 때문이다. 파장의 760-790cm-1의 포인트에 맵핑된 2차원 데이터는 구성성분 중 핵(nucleus)의 형태가 상대적으로 명확히 드러난 것을 알 수 있다.
그리고, 각 포인트 별로 맵핑된 2차원 데이터는 서로 다른 라만 스펙트럼을 포함할 수 있다. 상술한 바와 같이, 구성성분 별로 상이한 에너지 변화량 등에 따라 파장의 각 포인트 별로 상이한 라만 스펙트럼이 측정되는데, 이렇게 포인트 별로 측정된 라만 스펙트럼은 각 포인트 별로 맵핑된 2차원 데이터에 포함될 수 있다.
상기에서는 포인트 별로 맵핑된 2차원 데이터에 라만 스펙트럼이 포함되어 라만 데이터가 생성되는 것으로 설명하였지만, 이에 제한되지 않고, 실시예에 따라 파장의 각 포인트 별로 2차원 데이터와 라만 스펙트럼이 연계되어 맵핑되어 라만 데이터가 생성될 수 있다.
다시 도 2를 참조하면, 프로세서(16)는 상기 생성된 라만 데이터를 전처리할 수 있다(S230).
구체적으로, 프로세서(16)는 생성된 라만 데이터를 정규화할 수 있다. 데이터 정규화는 공지된 내용이므로 상세한 설명은 생략하도록 한다.
이하에서 설명하는 단계 S240 및 단계 S280은 기 구축된 인공 지능 기반의 학습 모델을 이용하여 수행될 수 있다. 학습 모델에 관한 설명은 후술하도록 한다.
그런 다음, 프로세서(16)는 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여할 수 있다(S240).
구체적으로, 프로세서(16)는 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환할 수 있다.
도 4를 참조하면, 파장의 각 포인트 별로 2차원 데이터로 형성되어 있던 라만 데이터는 각 포인트 별로 1차원 데이터로 변환된다.
이 후, 프로세서(16)는 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출할 수 있다. 여기서 대표 데이터는 각 구성성분의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 의미할 수 있다.
즉, 도 4를 참조하면, 포인트 별로 맵핑된 1차원 데이터 중에서 구성성분 중 핵의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 핵에 대한 대표 데이터로 추출하고, 세포막의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 세포막에 대한 대표 데이터로 추출하고, 과립의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 과립에 대한 대표 데이터로 추출하고, 백그라운드의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 백그라운드에 대한 대표 데이터로 추출할 수 있다.
이 후, 프로세서(16)는 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여할 수 있다.
즉, 도 4를 참조하면, 추출된 대표 데이터가 맵핑된 각각의 포인트에서 측정된 라만 스펙트럼을 각각의 대표 데이터에 가중치로 적용할 수 있다. 이와 같이 각 구성성분 별 패턴을 나타내는 대표 데이터에 가중치를 주어 증폭시킴으로써 이후 구성성분 별 분류의 정확도를 높일 수 있다.
다시 도 2를 참조하면, 프로세서(16)는 상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류할 수 있다(S250).
구체적으로, 프로세서(16)는 k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행할 수 있다. 즉, 각 구성성분 별로 중심점을 클러스터링될 수 있다. 여기서, 각 구성성분 별 중심점은 상기 가중치가 부여된 각각의 구성성분에 대한 대표 데이터에 기초하여 설정될 수 있지만, 이에 제한되는 것은 아니다.
도 5를 참조하면, 프로세서(16)는 백그라운드는 라벨 0으로, 표현하고, 세포막은 라벨 1로 표현하고, 과립은 라벨 2로 표현하고, 핵은 라벨3으로 표현하여 군집 분류를 수행할 수 있다.
다시 도 2를 참조하면, 프로세서(16)는 상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출할 수 있다(S280).
구체적으로, 프로세서(16)는 상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행할 수 있다(S260). 이후, 프로세서(16)는 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단할 수 있다(S270). 이후, 프로세서(16)는 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출할 수 있다.
단계 S250에서 군집 분류가 완료됨에 따라 생성되는 이미지 형태의 결과 데이터를 5에 도시된 바와 같이, 이미지의 픽셀 별로 데이터 라벨링을 수행할 수 있다. 이때 데이터 라벨링은 군집 분류 수행 시 부여된 라벨에 기초하여 수행될 수 있다.
이렇게 이미지에 대해 전체 데이터 라벨링이 완료되면, 프로세서(16)는 데이터의 라벨이 과립에 해당하는 라벨인지를 판단하고, 과립에 해당하는 라벨로 판단된 데이터만을 추출할 수 있다.
여기서, 상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터일 수 있다. 이렇게, 전처리만 되어있는 데이터를 최종적으로 추출하여 별도의 가공 및 손실이 없는 데이터를 활용함으로써 호산구 별 화학적 특성 비교가 가능한 것이다.
상기에서는, 단계 S280이 단계 S260 및 단계 S270을 포함하는 것으로 설명하였지만, 이에 제한되지 않고 단계 S260 내지 단계 S280은 개별 동작으로서 순차적으로 수행될 수 있다.
그리고 도 2에 도시되지는 않았지만, 구성성분이 과립인 데이터가 추출되면, 프로세서(16)는 상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단할 수 있다.
여기서, 특정 질병은 호산구성 천식일 수 있지만 이에 제한되지 않고, 호산구 증가가 동반되는 다양한 질병을 모두 포함할 수 있다.
이와 같이 호산구의 구성성분 중 과립에 대한 데이터만을 추출함으로써, 프로세서(16)는 호산구의 화학적 특성 중 문제가 되는 과립의 화학적 특성만을 가지고 피진단자가 상기 특정 질병에 대해 정상인지 비정상인지를 판단할 수 있다.
구체적으로 프로세서(16)는 인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단할 수 있다.
여기서, 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대한 제1 라만 데이터 처리 과정, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대한 제2 라만 데이터 처리 과정, 상기 제1 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 제2 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축될 수 있다.
즉, 학습 모델은 특정 질병에 대한 정상인의 다양한 데이터들과 특정 질병에 대한 환자의 다양한 데이터들을 비교하면서 학습을 수행함으로써, 정상인과 환자 간의 호산구 특성의 차이를 정확히 파악할 수 있게 된다. 도 6에 도시된 바와 같이, 정상인의 호산구로부터 추출된 과립 라만 데이터에 기초한 상기 정상인의 호산구 특성과, 환자의 호산구로부터 추출된 과립 라만 데이터에 기초한 상기 환자의 호산구 특성은 확실한 차이가 있다.
따라서, 학습 모델은 이러한 차이에 학습함에 따라 상기 피진단자의 호산구 특성이 정상 범위 내에 속하는지 비정상 범위 내에 속하는지를 판단하여, 비정상 범위 내에 속하는 것으로 판단한 경우, 상기 피진단자에게 상기 특정 질병이 발병했음을 예측할 수 있다.
상기에서는 피진단자의 혈액으로부터 호산구를 분리하여 호산구의 과립 데이터를 추출하는 것으로 설명하였지만, 이에 제한되지 않고 호산구 뿐만 아니라 기타 다른 과립성 세포에 대해서도 과립 데이터 추출 알고리즘을 적용하여 관련 질환을 예측할 수도 있다.
도 2는 단계 S110 내지 단계 S280을 순차적으로 실행하는 것으로 기재하고 있으나, 이는 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 도 2에 기재된 순서를 변경하여 실행하거나 단계 S110 내지 단계 S280 중 하나 이상의 단계를 병렬적으로 실행하는 것으로 다양하게 수정 및 변형하여 적용 가능할 것이므로, 도 2는 시계열적인 순서로 한정되는 것은 아니다.
이상에서 전술한 본 발명의 일 실시예에 따른 방법은, 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 매체에 저장될 수 있다. 여기서, 컴퓨터는 앞에서 설명한 장치(10)일 수 있다.
상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.
본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.
이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.
10: 장치
12: 통신부
14: 메모리
16: 프로세서
162: 측정부
164: 전처리부
166: 분류부
168: 추출부

Claims (15)

  1. 장치에 의해 수행되는 인공지능 기반 호산구의 라만 데이터 처리 방법에 있어서,
    피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행하여 라만 데이터를 생성하는 단계;
    상기 생성된 라만 데이터를 전처리하는 단계;
    상기 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여하는 단계;
    상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류하는 단계;
    상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출하는 단계; 및
    상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단하는 단계;를 포함하고,
    상기 라만 데이터는, 상기 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터이고,
    상기 각 포인트 별로 맵핑된 2차원 데이터는, 서로 다른 라만 스펙트럼을 포함하며,
    상기 가중치 부여 단계는,
    상기 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환하는 단계;
    상기 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출하는 단계; 및
    상기 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여하는 단계;를 포함하는, 방법.
  2. 삭제
  3. 삭제
  4. 제1 항에 있어서,
    상기 분류 단계는,
    k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행하고,
    상기 추출 단계는,
    상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행하고, 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단하고, 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출하는, 방법.
  5. 제4 항에 있어서,
    상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터인, 방법.
  6. 제1 항에 있어서,
    상기 판단 단계는,
    인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단하는, 방법.
  7. 제6 항에 있어서,
    상기 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대한 제1 라만 데이터 처리 과정, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대한 제2 라만 데이터 처리 과정, 상기 제1 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 제2 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축되는, 방법.
  8. 컴퓨터인 하드웨어와 결합되어, 제1 항, 제4 항 내지 제7 항 중 어느 한 항의 방법을 실행하기 위해 매체에 저장된 프로그램.
  9. 인공지능 기반 호산구의 라만 데이터 처리 장치에 있어서,
    통신부;
    인공지능 기반의 학습 모델을 이용한 호산구의 라만 데이터 처리를 위한 적어도 하나의 프로세스를 저장하고 있는 메모리; 및
    상기 프로세스에 따라 동작하는 프로세서;를 포함하고,
    상기 프로세서는, 피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행하여 라만 데이터를 생성하고, 상기 생성된 라만 데이터를 전처리하고, 상기 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여하고, 상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류하고, 상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출하고, 상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단하고,
    상기 라만 데이터는, 상기 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터이고,
    상기 각 포인트 별로 맵핑된 2차원 이미지는, 서로 다른 라만 스펙트럼을 포함하며,
    상기 프로세서는, 상기 가중치 부여 시, 상기 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환하고, 상기 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출하고, 상기 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여하는, 장치.
  10. 삭제
  11. 삭제
  12. 제9 항에 있어서,
    상기 프로세서는,
    상기 분류 시,
    k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행하고,
    상기 추출 시,
    상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행하고, 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단하고, 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출하는, 장치.
  13. 제12 항에 있어서,
    상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터인, 장치.
  14. 제9 항에 있어서,
    상기 프로세서는,
    상기 판단 시,
    인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단하는, 장치.
  15. 제14 항에 있어서,
    상기 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대해 상기 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대해 상기 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축되는, 장치.
KR1020210108750A 2021-08-18 2021-08-18 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치 KR102572517B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020210108750A KR102572517B1 (ko) 2021-08-18 2021-08-18 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치
US17/820,461 US20230056999A1 (en) 2021-08-18 2022-08-17 Method and device for processing raman data of eosinophils based on artificial intelligence
KR1020230108876A KR20230127947A (ko) 2021-08-18 2023-08-21 인공지능 기반 세포의 라만 데이터 처리 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210108750A KR102572517B1 (ko) 2021-08-18 2021-08-18 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020230108876A Division KR20230127947A (ko) 2021-08-18 2023-08-21 인공지능 기반 세포의 라만 데이터 처리 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20230027365A KR20230027365A (ko) 2023-02-28
KR102572517B1 true KR102572517B1 (ko) 2023-08-31

Family

ID=85326887

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020210108750A KR102572517B1 (ko) 2021-08-18 2021-08-18 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치
KR1020230108876A KR20230127947A (ko) 2021-08-18 2023-08-21 인공지능 기반 세포의 라만 데이터 처리 방법 및 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020230108876A KR20230127947A (ko) 2021-08-18 2023-08-21 인공지능 기반 세포의 라만 데이터 처리 방법 및 장치

Country Status (1)

Country Link
KR (2) KR102572517B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745210B (zh) 2014-01-28 2018-02-06 爱威科技股份有限公司 一种白细胞分类方法及装置
KR102067317B1 (ko) * 2013-03-15 2020-01-16 아이리스 인터내셔널 인크. 혈액 샘플에서의 입자 분석을 위한 동적 범위 확대 시스템 및 방법
JP2021526628A (ja) 2018-04-05 2021-10-07 イーエニエーエスセー テック − インスティチュート デ エンゲンハリア デ システマス エ コンピュータドレス テクノロジア エ シエンシアInesc Tec − Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciencia 試料からの成分の定量化値を予測する分光測光方法及び装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9025850B2 (en) * 2010-06-25 2015-05-05 Cireca Theranostics, Llc Method for analyzing biological specimens by spectral imaging
KR20160012114A (ko) * 2013-03-19 2016-02-02 시레카 테라노스틱스, 엘엘씨 스펙트럼 이미지화에 의해 생물학적 시료를 분석하기 위한 방법 및 시스템
BR112017008261A2 (pt) * 2014-10-24 2017-12-19 Univ Monash método e sistema para detecção de agentes de doença no sangue
US10859499B2 (en) 2017-05-22 2020-12-08 Samsung Electronics Co., Ltd. Apparatus and method for quantitative molecular sensing based on raman peak shift
KR102291105B1 (ko) * 2019-03-04 2021-08-23 주식회사 엑소퍼트 엑소좀에 의한 인공지능 기반의 액체생검을 이용한 암 진단 정보 제공 방법 및 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102067317B1 (ko) * 2013-03-15 2020-01-16 아이리스 인터내셔널 인크. 혈액 샘플에서의 입자 분석을 위한 동적 범위 확대 시스템 및 방법
CN103745210B (zh) 2014-01-28 2018-02-06 爱威科技股份有限公司 一种白细胞分类方法及装置
JP2021526628A (ja) 2018-04-05 2021-10-07 イーエニエーエスセー テック − インスティチュート デ エンゲンハリア デ システマス エ コンピュータドレス テクノロジア エ シエンシアInesc Tec − Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciencia 試料からの成分の定量化値を予測する分光測光方法及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Aleksandra Dorosz 외 8인. Eosinophils and Neutrophils-Molecular Differences Revealed by Spontaneous Raman, CARS and Fluorescence Microscopy. MDPI, Cells, Vol. 9, No. 9, pp. 1-15, 2020.09.07.*

Also Published As

Publication number Publication date
KR20230127947A (ko) 2023-09-01
KR20230027365A (ko) 2023-02-28

Similar Documents

Publication Publication Date Title
Aslan et al. Multi-classification deep CNN model for diagnosing COVID-19 using iterative neighborhood component analysis and iterative ReliefF feature selection techniques with X-ray images
US20230034559A1 (en) Automated prediction of clinical trial outcome
US11837329B2 (en) Method for classifying multi-granularity breast cancer genes based on double self-adaptive neighborhood radius
IL293011A (en) A computational platform for identifying therapeutic treatments for neurodevelopmental conditions
CN108320798A (zh) 病症结果生成方法与装置
Qi et al. High-precision intelligent cancer diagnosis method: 2D Raman figures combined with deep learning
Liang et al. Combining resampling and machine learning to improve sleep-wake detection of Fitbit wristbands
Khalili et al. Prognosis prediction in traumatic brain injury patients using machine learning algorithms
JP2023007370A (ja) ソート学習モデルの訓練方法、ソート方法、装置、デバイス及び媒体
US20140309122A1 (en) Knowledge-driven sparse learning approach to identifying interpretable high-order feature interactions for system output prediction
KR102572517B1 (ko) 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치
CN108388918A (zh) 具有结构保持特性的数据特征选择方法
US20230056999A1 (en) Method and device for processing raman data of eosinophils based on artificial intelligence
Divya et al. Detection of Parkinson disease using machine learning
Huang et al. A multi-label learning prediction model for heart failure in patients with atrial fibrillation based on expert knowledge of disease duration
Bhulakshmi et al. The prediction of diabetes in Pima Indian women mellitus based on xgboost ensemble modeling using data science
Hasan et al. Early stage autism spectrum disorder detection of adults and toddlers using machine learning models
Shampa et al. Machine Learning-based Diabetes Prediction: A Cross-Country Perspective
KR20230039227A (ko) 인공지능 기반 호산구 증가증 예측 방법 및 장치
Maddalena et al. A framework based on metabolic networks and biomedical images data to discriminate glioma grades
Fang et al. Rapid diagnosis of type II diabetes using fourier transform mid-infrared attenuated total reflection spectroscopy combined with support vector machine
Dharani et al. Parkinson’s disease identification using vocal features
Mouad et al. Machine Learning-Based Detection and Classification of Neurodevelopmental Disorders from Speech Patterns
CN116978106B (zh) 批处理混合对比学习的跨模态情绪异常检测方法和装置
Ge Selection of potential cancer biomarkers based on feature selection method

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
A107 Divisional application of patent