KR20230027365A - Method and apparatus for processing raman data of eosinophil based on artificial intelligence - Google Patents

Method and apparatus for processing raman data of eosinophil based on artificial intelligence Download PDF

Info

Publication number
KR20230027365A
KR20230027365A KR1020210108750A KR20210108750A KR20230027365A KR 20230027365 A KR20230027365 A KR 20230027365A KR 1020210108750 A KR1020210108750 A KR 1020210108750A KR 20210108750 A KR20210108750 A KR 20210108750A KR 20230027365 A KR20230027365 A KR 20230027365A
Authority
KR
South Korea
Prior art keywords
data
raman
eosinophil
component
eosinophils
Prior art date
Application number
KR1020210108750A
Other languages
Korean (ko)
Other versions
KR102572517B1 (en
Inventor
김준기
주미연
조유숙
백찬기
이지향
Original Assignee
주식회사 아폴론
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아폴론 filed Critical 주식회사 아폴론
Priority to KR1020210108750A priority Critical patent/KR102572517B1/en
Priority to US17/820,461 priority patent/US20230056999A1/en
Publication of KR20230027365A publication Critical patent/KR20230027365A/en
Priority to KR1020230108876A priority patent/KR20230127947A/en
Application granted granted Critical
Publication of KR102572517B1 publication Critical patent/KR102572517B1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/314Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry with comparison of measurements at specific and non-specific wavelengths
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/12Pulmonary diseases

Abstract

Provided are a method and apparatus for processing Raman data of an eosinophil based on the artificial intelligence (AI). The method comprises: a step of performing the Raman analysis using a specific wavelength for an eosinophil separated from the blood of a subject, and generating Raman data; a step of pre-processing the generated Raman data; a step of granting a weight value to each component of the pre-processed Raman data including the nucleus, cell membrane, granule, and background; a step of classifying the data for each component based on the result of granting the weight value; a step of extracting the data where the component is granule based on the classified results; and a step of determining whether a specific disease has occurred in the subject or not through the eosinophil characteristics of the subject based on the extracted data. Therefore, various diseases accompanying an increase in eosinophil can be diagnosed.

Description

인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치{METHOD AND APPARATUS FOR PROCESSING RAMAN DATA OF EOSINOPHIL BASED ON ARTIFICIAL INTELLIGENCE}Method and apparatus for processing Raman data of eosinophil based on artificial intelligence

본 발명은 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치에 관한 것이다. The present invention relates to an artificial intelligence-based method and apparatus for processing Raman data of eosinophils.

일반적으로 천식은 스테로이드제, 류코트리엔조절제, 지속성흡입 베타2항진제, 테오필린 등으로 증상완화와 염증조절을 목표로 치료한다. 하지만, 이런 일반적인 천식 치료를 위한 약물들을 모두 사용했음에도 증상이 조절되지 않는 천식을 ‘중증 천식’이라 한다. 또한, 천식 악화가 자주 나타나거나, 경구용 스테로이드 복용을 중단할 경우 바로 숨이 차고 기침이나 가래가 나오는 등 치료제를 최대한으로 사용함에도 불구하고 증상이 조절되지 않는 환자들을 임상적으로 중증 천식 환자로 분류한다. 미국흉부학회(ATS)나 미국 혹은 유럽의 호흡기학회 가이드라인을 살펴보면, 약제를 사용함에도 불구하고 1년에 2회 이상 천식 악화가 나타날 경우 중증 천식으로 정의하기도 한다. In general, asthma is treated with steroids, leukotriene regulators, long-acting inhaled beta 2 agonists, theophylline, etc., aimed at relieving symptoms and controlling inflammation. However, asthma whose symptoms are not controlled even after using all of these general asthma medications is called 'severe asthma'. In addition, patients with frequent asthma exacerbations, shortness of breath and coughing or phlegm coming out immediately after stopping oral steroid use, are clinically classified as severe asthma patients if their symptoms are not controlled despite maximal use of the treatment. do. If you look at the guidelines of the American Thoracic Society (ATS) or the Respiratory Society of the United States or Europe, severe asthma is defined if asthma exacerbations occur two or more times a year despite the use of medications.

이렇듯 명확한 진단법이 없는 중증 천식은 현재 국내 천식환자의 약 10% 가량이 앓고 있으며, 중증 천식 환자들 사이에서도 증상 조절의 정도가 매우 다양하게 나타나기 때문에 한 마디로 정의하기가 쉽지 않다. Severe asthma without a clear diagnosis method currently suffers from about 10% of domestic asthma patients, and it is not easy to define it in one word because the degree of symptom control is very diverse among patients with severe asthma.

중증 천식의 일종인 호산구성 천식의 경우 높은 혈중 호산구 수치 (150cells/μL 이상)를 증상으로 나타내게 된다. 호산구는 세포질에 호산성 과립 (Granule)을 가지고 있는 과립구성 백혈구의 일종으로 알레르기 반응에 참여하는 주요 세포이며, 호산구의 세포질에 있는 작은 과립에는 페록시다아제, RNA 분해효소(RNase), DNA 분해효소(DNase), 지방분해효소, 플라스미노겐 등과 같은 여러 화학적 매개물질을 포함하고 있으며, 이 매개물질들은 호산구의 활성화에 따른 탈과립 과정에 의해 분비되고, 기생충과 주변 조직에 모두를 파괴하게 된다. In the case of eosinophilic asthma, a type of severe asthma, a high blood eosinophil count (150 cells/μL or more) appears as a symptom. Eosinophil is a type of granulocytic leukocyte that has eosinophilic granules in the cytoplasm and is a major cell participating in allergic reactions. Small granules in the cytoplasm of eosinophils contain peroxidase, RNase, and DNA degradation It contains various chemical mediators such as enzyme (DNase), lipolytic enzyme, plasminogen, etc. These mediators are secreted by the degranulation process following the activation of eosinophils and destroy both parasites and surrounding tissues.

호산구성 천식을 위한 특이적인 혈액검사는 없으며, 혈액검사를 통해 호산구의 수치를 카운팅 하는 것이 일반적이다. There is no specific blood test for eosinophilic asthma, and it is common to count the level of eosinophils through a blood test.

한편, 라만분석은 시료의 화학 종(단백질의 종류, 지질, RNA, DNA 등)을 검출하는데 유용한 측정 방법이다. 이는 유기 및 무기 분자는 고유의 라만 시프트 스펙트럼(Raman shift spectrum)을 가지고 있기 때문이다. 하지만 라만 스펙트럼 내에 너무 많은 호산구의 정보가 들어있어 라만 스펙트럼의 데이터 분류가 어려운 현실이다.Meanwhile, Raman analysis is a useful measurement method for detecting chemical species (types of proteins, lipids, RNA, DNA, etc.) of a sample. This is because organic and inorganic molecules have a unique Raman shift spectrum. However, it is difficult to classify Raman spectrum data because too much eosinophil information is included in the Raman spectrum.

공개특허공보 제10-2018-0127939호, 2018.11.30.Publication No. 10-2018-0127939, 2018.11.30.

본 발명이 해결하고자 하는 과제는 호산구성 천식의 정확한 진단을 위해 호산구를 라만장비로 측정 후 화학적인 광학적 특성을 비교하여 호산구의 상태가 정상인지 비정상인지 신속하게 분류하여 호산구성 관련 질병의 진단 근거를 제시할 수 있는 인공지능 기반 호산구의 라만 데이터 처리 방법 및 장치를 제공하는 것이다.The problem to be solved by the present invention is to quickly classify whether the state of eosinophils is normal or abnormal by comparing chemical and optical properties after measuring eosinophils with Raman equipment for accurate diagnosis of eosinophilic asthma, thereby providing evidence for diagnosis of eosinophilic-related diseases. It is to provide an artificial intelligence-based Raman data processing method and device for eosinophils that can be presented.

본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The problems to be solved by the present invention are not limited to the problems mentioned above, and other problems not mentioned will be clearly understood by those skilled in the art from the description below.

상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 인공지능 기반 호산구의 라만 데이터 처리 방법은, 피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행하여 라만 데이터를 생성하는 단계, 상기 생성된 라만 데이터를 전처리하는 단계, 상기 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여하는 단계, 상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류하는 단계, 상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출하는 단계 및 상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단하는 단계를 포함한다.An artificial intelligence-based Raman data processing method of eosinophils according to an aspect of the present invention for solving the above problems includes generating Raman data by performing Raman analysis using a specific wavelength on eosinophils isolated from the blood of a diagnosed subject. , pre-processing the generated Raman data, assigning weights to the pre-processed Raman data for each component including nuclei, cell membranes, granules, and background, based on the result of assigning the weights, data for each component Classifying, based on the classification result, extracting data that the component is the granule, and determining whether a specific disease of the diagnosed subject has occurred through the eosinophil characteristics of the diagnosed subject based on the extracted data. It includes a judgment step.

본 발명에서, 상기 라만 데이터는, 상기 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터이며, 상기 각 포인트 별로 맵핑된 2차원 데이터는 서로 다른 라만 스펙트럼을 포함할 수 있다.In the present invention, the Raman data is data in which two-dimensional data mapped for each point of the specific wavelength is arranged in an order corresponding to the traveling direction of the specific wavelength, and the two-dimensional data mapped for each point is different Raman data. spectrum can be included.

본 발명에서, 상기 가중치 부여 단계는, 상기 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환하는 단계, 상기 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출하는 단계 및 상기 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여하는 단계를 포함할 수 있다.In the present invention, the weighting step includes arranging the two-dimensional data mapped for each point in a row and converting them into one-dimensional data, and extracting representative data for each of the components from the converted one-dimensional data. and assigning a Raman spectrum at a point corresponding to each of the extracted representative data as a weight to each of the extracted representative data.

본 발명에서, 상기 분류 단계는, k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행하고, 상기 추출 단계는, 상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행하고, 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단하고, 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출할 수 있다. In the present invention, the classification step performs cluster classification for each component using k-means clustering, and the extraction step performs data labeling by assigning different labels to each component, and labels the data. It is determined whether the labeled label corresponds to the granule, and based on the determined result, only data labeled with a label corresponding to the granule may be extracted from the labeled data.

본 발명에서, 상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터일 수 있다.In the present invention, the extracted data may be Raman data in which the constituents are the granules among the preprocessed Raman data.

본 발명에서, 상기 판단 단계는, 인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단할 수 있다.In the present invention, the determining step is to analyze the extracted data using an artificial intelligence-based learning model to determine whether the eosinophil characteristics of the diagnosed person are included in a normal range or an abnormal range, so that a specific disease is diagnosed. can determine if it has occurred.

본 발명에서, 상기 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대한 제1 라만 데이터 처리 과정, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대한 제2 라만 데이터 처리 과정, 상기 제1 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 제2 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축될 수 있다.In the present invention, the learning model, the first Raman data processing process for a plurality of eosinophils isolated from the blood of a plurality of patients with the specific disease, a plurality of eosinophils isolated from the blood of a plurality of normal people without the specific disease The second Raman data processing process for , the eosinophil characteristics of each of a plurality of patients obtained by performing the first Raman data processing process, and the eosinophil characteristics of each of a plurality of normal people obtained by performing the second Raman data processing process can be learned and built.

상술한 과제를 해결하기 위한 본 발명의 다른 면에 따른 인공지능 기반 호산구의 라만 데이터 처리 장치는, 통신부, 인공지능 기반의 학습 모델을 이용한 호산구의 라만 데이터 처리를 위한 적어도 하나의 프로세스를 저장하고 있는 메모리 및 상기 프로세스에 따라 동작하는 프로세서를 포함하고, 상기 프로세서는, 상기 프로세스를 기반으로, 피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행하여 라만 데이터를 생성하고, 상기 생성된 라만 데이터를 전처리하고, 상기 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여하고, 상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류하고, 상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출하고, 상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단한다.An artificial intelligence-based Raman data processing device for eosinophils according to another aspect of the present invention for solving the above problems is a communication unit, storing at least one process for eosinophil Raman data processing using an artificial intelligence-based learning model A memory and a processor operating according to the process, wherein the processor generates Raman data by performing Raman analysis using a specific wavelength on eosinophils isolated from the blood of the diagnosed subject based on the process, and generating the Raman data. The preprocessed Raman data is preprocessed, the preprocessed Raman data is weighted for each component including nuclei, cell membranes, granules, and background, and based on the weighted result, the data is classified for each component, and the Based on the classified result, data in which the component is the granules is extracted, and whether a specific disease of the diagnosed subject is determined through eosinophil characteristics of the diagnosed subject based on the extracted data.

본 발명에서, 상기 라만 데이터는, 상기 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터이며, 상기 각 포인트 별로 맵핑된 2차원 데이터는 서로 다른 라만 스펙트럼을 포함할 수 있다.In the present invention, the Raman data is data in which two-dimensional data mapped for each point of the specific wavelength is arranged in an order corresponding to the traveling direction of the specific wavelength, and the two-dimensional data mapped for each point is different Raman data. spectrum can be included.

본 발명에서, 상기 프로세서는, 상기 가중치 부여 시, 상기 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환하고, 상기 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출하고, 상기 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여할 수 있다.In the present invention, during the weighting, the processor arranges the two-dimensional data mapped for each point in a row and converts them into one-dimensional data, and among the converted one-dimensional data, representative data for each of the components. , and a Raman spectrum at a point corresponding to each of the extracted representative data may be assigned as a weight to each of the extracted representative data.

본 발명에서, 상기 프로세서는, 상기 분류 시, k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행하고, 상기 추출 시, 상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행하고, 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단하고, 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출할 수 있다.In the present invention, the processor performs cluster classification for each component using k-means clustering during the classification, and performs data labeling by assigning different labels to each component during the extraction, and It is possible to determine whether a label labeled on the label corresponds to the granule, and based on the determined result, only data labeled with a label corresponding to the granule may be extracted from among the labeled data.

본 발명에서, 상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터일 수 있다.In the present invention, the extracted data may be Raman data in which the constituents are the granules among the preprocessed Raman data.

본 발명에서, 상기 프로세서는, 상기 판단 시, 인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단할 수 있다.In the present invention, at the time of the determination, the processor analyzes the extracted data using an artificial intelligence-based learning model to determine whether the eosinophil characteristics of the diagnosed person are included in a normal range or an abnormal range, It can determine whether a particular disease has occurred.

본 발명에서, 상기 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대해 상기 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대해 상기 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축될 수 있다.In the present invention, the learning model, the eosinophil characteristics of each of a plurality of patients obtained by performing the Raman data processing process on a plurality of eosinophils isolated from the blood of a plurality of patients with the specific disease, and the specific disease The Raman data processing process may be performed on a plurality of eosinophils isolated from the blood of a plurality of normal persons without a blood sample, and the eosinophil characteristics of each of the plurality of normal persons may be learned and constructed.

이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.In addition to this, another method for implementing the present invention, another system, and a computer readable recording medium recording a computer program for executing the method may be further provided.

본 발명에 따르면, 호산구의 혈액내 수치만 판단하는 기존의 호산구성 병증 진단법과 다르게 호산구의 화학적 특성 중 문제가 되는 과립의 화학적 특성만 추출하기 때문에 호산구 증가가 동반된 다양한 질병(호산구 증가증, 처그-스트라우스 신드롬)을 진단하는 것이 가능하다.According to the present invention, unlike the existing eosinophilic disease diagnosis method that only determines the blood level of eosinophils, only the chemical properties of granules in question among the chemical properties of eosinophils are extracted, so various diseases accompanied by increased eosinophils (eosinophilia, Chug- Strauss Syndrome).

통계기반 머신러닝을 이용한 호산구의 라만 데이터 처리 알고리즘은 복잡한 라만 스펙트럼 데이터에서 구성성분 별 분류가 가능하도록 하여 호산구 간의 구성성분 별 비교가 가능하며, 호산구성 천식 진단이 가능하다.The Raman data processing algorithm of eosinophils using statistics-based machine learning enables classification by component in complex Raman spectral data, enabling comparison between eosinophils by component and diagnosis of eosinophilic asthma.

본 발명의 호산구의 라만 데이터 처리 알고리즘을 이용한 과립 데이터 추출은 정상 호산구와 질병 호산구의 차이점이 무엇인지 정확히 비교할 수 있으며, 변화된 아미노산 및 지질의 구성을 유추할 수 있다. 또한 백그라운드, 세포벽과 핵의 데이터 포함으로 인한 비교 평균 오류가 감소할 수 있다.Granular data extraction using the Raman data processing algorithm of eosinophils according to the present invention can accurately compare differences between normal eosinophils and diseased eosinophils and infer the composition of changed amino acids and lipids. In addition, comparison mean error due to background, inclusion of cell wall and nuclear data may be reduced.

본 발명의 호산구의 라만 데이터 처리 알고리즘은 호산구의 과립 데이터를 추출하는 알고리즘이기 때문에 호산구 뿐만 아니라 기타 다른 과립성 세포 관련 질환에도 적용 가능하다.Since the eosinophil Raman data processing algorithm of the present invention is an algorithm for extracting eosinophil granule data, it can be applied not only to eosinophils but also to other granular cell-related diseases.

본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the description below.

도 1은 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 장치의 개략적인 블록도이다.
도 2는 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 방법의 순서도이다.
도 3은 본 발명에 따른 라만 데이터를 설명하기 위한 도면이다.
도 4는 본 발명에 따른 구성성분 별 가중치 부여를 설명하기 위한 도면이다.
도 5는 본 발명에 따른 구성 성분 별 군집분류 및 데이터 라벨링을 통한 데이터 추출을 설명하기 위한 도면이다.
도 6은 본 발명에 따른 피진단자의 호산구 특성을 통해 피진단자의 정상 여부를 판단하는 것을 설명하기 위한 도면이다.
1 is a schematic block diagram of an apparatus for processing Raman data of an artificial intelligence-based eosinophil according to the present invention.
2 is a flowchart of a method for processing Raman data of an artificial intelligence-based eosinophil according to the present invention.
3 is a diagram for explaining Raman data according to the present invention.
4 is a diagram for explaining weighting for each component according to the present invention.
5 is a diagram for explaining data extraction through cluster classification and data labeling for each component according to the present invention.
6 is a diagram for explaining the determination of whether a diagnosed terminal is normal through eosinophil characteristics of the diagnosed terminal according to the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. Advantages and features of the present invention, and methods of achieving them, will become clear with reference to the detailed description of the following embodiments taken in conjunction with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but may be implemented in various different forms, only these embodiments are intended to complete the disclosure of the present invention, and are common in the art to which the present invention belongs. It is provided to fully inform the person skilled in the art of the scope of the invention, and the invention is only defined by the scope of the claims.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.Terminology used herein is for describing the embodiments and is not intended to limit the present invention. In this specification, singular forms also include plural forms unless specifically stated otherwise in a phrase. As used herein, "comprises" and/or "comprising" does not exclude the presence or addition of one or more other elements other than the recited elements. Like reference numerals throughout the specification refer to like elements, and “and/or” includes each and every combination of one or more of the recited elements. Although "first", "second", etc. are used to describe various components, these components are not limited by these terms, of course. These terms are only used to distinguish one component from another. Accordingly, it goes without saying that the first element mentioned below may also be the second element within the technical spirit of the present invention.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless otherwise defined, all terms (including technical and scientific terms) used in this specification may be used with meanings commonly understood by those skilled in the art to which the present invention belongs. In addition, terms defined in commonly used dictionaries are not interpreted ideally or excessively unless explicitly specifically defined.

공간적으로 상대적인 용어인 "아래(below)", "아래(beneath)", "하부(lower)", "위(above)", "상부(upper)" 등은 도면에 도시되어 있는 바와 같이 하나의 구성요소와 다른 구성요소들과의 상관관계를 용이하게 기술하기 위해 사용될 수 있다. 공간적으로 상대적인 용어는 도면에 도시되어 있는 방향에 더하여 사용시 또는 동작시 구성요소들의 서로 다른 방향을 포함하는 용어로 이해되어야 한다. 예를 들어, 도면에 도시되어 있는 구성요소를 뒤집을 경우, 다른 구성요소의 "아래(below)"또는 "아래(beneath)"로 기술된 구성요소는 다른 구성요소의 "위(above)"에 놓여질 수 있다. 따라서, 예시적인 용어인 "아래"는 아래와 위의 방향을 모두 포함할 수 있다. 구성요소는 다른 방향으로도 배향될 수 있으며, 이에 따라 공간적으로 상대적인 용어들은 배향에 따라 해석될 수 있다.The spatially relative terms "below", "beneath", "lower", "above", "upper", etc. It can be used to easily describe a component's correlation with other components. Spatially relative terms should be understood as including different orientations of elements in use or operation in addition to the orientations shown in the drawings. For example, if you flip a component that is shown in a drawing, a component described as "below" or "beneath" another component will be placed "above" the other component. can Thus, the exemplary term “below” may include directions of both below and above. Components may also be oriented in other orientations, and thus spatially relative terms may be interpreted according to orientation.

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

설명에 앞서 본 명세서에서 사용하는 용어의 의미를 간략히 설명한다. 그렇지만 용어의 설명은 본 명세서의 이해를 돕기 위한 것이므로, 명시적으로 본 발명을 한정하는 사항으로 기재하지 않은 경우에 본 발명의 기술적 사상을 한정하는 의미로 사용하는 것이 아님을 주의해야 한다.Prior to the description, the meaning of the terms used in this specification will be briefly described. However, it should be noted that the description of terms is intended to help the understanding of the present specification, and is not used in the sense of limiting the technical spirit of the present invention unless explicitly described as limiting the present invention.

본 명세서에서 '장치'는 연산처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함된다. 예를 들어, 장치는 컴퓨터 및 이동 단말기 형태가 될 수 있다. 상기 컴퓨터는 클라이언트로부터 요청을 수신하여 정보처리를 수행하는 서버 형태가 될 수 있다. 또한, 컴퓨터에는 시퀀싱을 수행하는 시퀀싱 장치가 해당될 수 있다. 상기 이동 단말기는 휴대폰, 스마트 폰(smart phone), PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 노트북 PC, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등이 포함될 수 있다.In this specification, 'device' includes all various devices capable of providing results to users by performing calculation processing. For example, the devices may be in the form of computers and mobile terminals. The computer may be in the form of a server receiving a request from a client and processing information. Also, a computer may correspond to a sequencing device that performs sequencing. The mobile terminal includes a mobile phone, a smart phone, a personal digital assistants (PDA), a portable multimedia player (PMP), a navigation device, a notebook PC, a slate PC, a tablet PC, and an ultrabook. ), a wearable device (eg, a watch type terminal (smartwatch), a glass type terminal (smart glass), a head mounted display (HMD)), and the like may be included.

도 1은 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 장치의 개략적인 블록도이다.1 is a schematic block diagram of an apparatus for processing Raman data of an artificial intelligence-based eosinophil according to the present invention.

도 2는 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 방법의 순서도이다.2 is a flowchart of a method for processing Raman data of an artificial intelligence-based eosinophil according to the present invention.

도 3은 본 발명에 따른 라만 데이터를 설명하기 위한 도면이다.3 is a diagram for explaining Raman data according to the present invention.

도 4는 본 발명에 따른 구성성분 별 가중치 부여를 설명하기 위한 도면이다.4 is a diagram for explaining weighting for each component according to the present invention.

도 5는 본 발명에 따른 구성 성분 별 군집분류 및 데이터 라벨링을 통한 데이터 추출을 설명하기 위한 도면이다.5 is a diagram for explaining data extraction through cluster classification and data labeling for each component according to the present invention.

도 6은 본 발명에 따른 피진단자의 호산구 특성을 통해 피진단자의 정상 여부를 판단하는 것을 설명하기 위한 도면이다.6 is a diagram for explaining the determination of whether a diagnosed terminal is normal through eosinophil characteristics of the diagnosed terminal according to the present invention.

이하에서 도 1을 참조하여, 본 발명에 따른 인공지능 기반 호산구의 라만 데이터 처리 장치(10)(이하, 장치)에 대해서 설명하도록 한다.Hereinafter, referring to FIG. 1 , an artificial intelligence-based eosinophil Raman data processing apparatus 10 (hereinafter, apparatus) according to the present invention will be described.

본 발명에 따른 장치(10)는 피진단자의 혈액에서 분리된 호산구를 페트리 디쉬(petri dish)에 고정한 후, 라만 분석을 통해 핵, 세포질, 백그라운드(background) 등 다양한 구성성분이 포함된 라만 데이터를 획득할 수 있다.The device 10 according to the present invention fixes eosinophils isolated from the blood of a subject to be diagnosed in a Petri dish, and then, through Raman analysis, Raman data including various components such as nucleus, cytoplasm, and background is obtained. can be obtained

장치(10)는 획득된 라만 데이터를 정규화(normalization) 등 전처리할 수 있다. The apparatus 10 may preprocess the obtained Raman data, such as normalization.

장치(10)는 전처리된 라만 데이터를 인공지능 기반 학습 모델을 이용하여 라만 데이터에 포함된 구성성분 별로 가중치를 부여하고, 이후 구성성분 별로 분류하여, 분류된 데이터를 라벨링함으로써, 호산구 중 과립의 데이터만 추출할 수 있다.The device 10 assigns weights to the preprocessed Raman data for each component included in the Raman data using an artificial intelligence-based learning model, and then classifies the preprocessed Raman data for each component and labels the classified data, thereby data of granules among eosinophils. can only be extracted.

이때, 추출된 과립의 데이터는 전처리만 되어있는 데이터로서, 별도의 가공 및 손실이 없는 데이터이므로 호산구 별 화학적 특성 비교가 가능하다.At this time, the data of the extracted granules is data that has only been preprocessed, and since it is data without separate processing and loss, it is possible to compare the chemical properties of each eosinophil.

이러한 장치(10)는 연산처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함될 수 있다. The device 10 may include all of various devices capable of providing results to users by performing calculation processing.

여기서, 장치(10)는 컴퓨터의 형태가 될 수 있다. 보다 상세하게는, 상기 컴퓨터는 연산처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함될 수 있다. Here, the device 10 may be in the form of a computer. More specifically, the computer may include all of various devices capable of providing results to users by performing calculation processing.

예를 들어, 컴퓨터는 데스크 탑 PC, 노트북(Note Book) 뿐만 아니라 스마트폰(Smart phone), 태블릿 PC, 셀룰러폰(Cellular phone), 피씨에스폰(PCS phone; Personal Communication Service phone), 동기식/비동기식 IMT-2000(International Mobile Telecommunication-2000)의 이동 단말기, 팜 PC(Palm Personal Computer), 개인용 디지털 보조기(PDA; Personal Digital Assistant) 등도 해당될 수 있다. 또한, 헤드마운트 디스플레이(Head Mounted Display; HMD) 장치가 컴퓨팅 기능을 포함하는 경우, HMD장치가 컴퓨터가 될 수 있다. For example, a computer includes not only a desktop PC and a notebook (Note Book) but also a smart phone, a tablet PC, a cellular phone, a PCS phone (Personal Communication Service phone), synchronous/asynchronous A mobile terminal of IMT-2000 (International Mobile Telecommunication-2000), a Palm Personal Computer (Palm PC), and a Personal Digital Assistant (PDA) may also be applicable. In addition, when a Head Mounted Display (HMD) device includes a computing function, the HMD device may become a computer.

그리고, 장치(10)는 통신부(12), 메모리(14) 및 프로세서(16)를 포함할 수 있다. 프로세서(16)는 측정부(162), 전처리부(164), 분류부(166) 및 추출부(168)를 포함할 수 있다. 여기서, 장치(10)는 도 1에 도시된 구성요소보다 더 적은 수의 구성요소나 더 많은 구성요소를 포함할 수 있다.Also, the device 10 may include a communication unit 12 , a memory 14 and a processor 16 . The processor 16 may include a measuring unit 162 , a pre-processing unit 164 , a classification unit 166 and an extraction unit 168 . Here, the device 10 may include fewer or more components than those shown in FIG. 1 .

통신부(12)는 장치(10)와 외부장치(미도시) 사이, 장치(10)와 외부서버(미도시) 사이 또는 장치(10)와 통신망(미도시) 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다.The communication unit 12 is one that enables wireless communication between the device 10 and an external device (not shown), between the device 10 and an external server (not shown), or between the device 10 and a communication network (not shown). It may contain more than one module.

여기서, 통신망(미도시)은 장치(10), 외부 장치(미도시) 및 외부 서버(미도시) 간의 다양한 정보를 송수신할 수 있다. 통신망(미도시)은 다양한 형태의 통신망이 이용될 수 있으며, 예컨대, WLAN(Wireless LAN), 와이파이(Wi-Fi), 와이브로(Wibro), 와이맥스(Wimax), HSDPA(High Speed Downlink Packet Access) 등의 무선 통신방식 또는 이더넷(Ethernet), xDSL(ADSL, VDSL), HFC(Hybrid Fiber Coax), FTTC(Fiber to The Curb), FTTH(Fiber To The Home) 등의 유선 통신방식이 이용될 수 있다.Here, a communication network (not shown) may transmit and receive various information between the device 10, an external device (not shown), and an external server (not shown). Various types of communication networks may be used as the communication network (not shown), for example, WLAN (Wireless LAN), Wi-Fi, Wibro, Wimax, HSDPA (High Speed Downlink Packet Access), etc. A wireless communication method or a wired communication method such as Ethernet, xDSL (ADSL, VDSL), HFC (Hybrid Fiber Coax), FTTC (Fiber to The Curb), FTTH (Fiber To The Home) may be used.

한편, 통신망(미도시)은 상기에 제시된 통신방식에 한정되는 것은 아니며, 상술한 통신방식 이외에도 기타 널리 공지되었거나 향후 개발될 모든 형태의 통신 방식을 포함할 수 있다.On the other hand, the communication network (not shown) is not limited to the communication methods presented above, and may include all other types of communication methods that are widely known or will be developed in the future in addition to the above-described communication methods.

통신부(12)는 장치(10)를 하나 이상의 네트워크에 연결하는 하나 이상의 모듈을 포함할 수 있다.Communication unit 12 may include one or more modules that connect device 10 to one or more networks.

메모리(14)는 장치(10)의 다양한 기능을 지원하는 데이터를 저장할 수 있다. 메모리(14)는 장치(10)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 장치(10)의 동작을 위한 적어도 하나의 프로세스, 인공지능 기반 학습 모델, 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 장치(10)의 기본적인 기능을 위하여 존재할 수 있다. 한편, 응용 프로그램은, 메모리(14)에 저장되고, 장치(10) 상에 설치되어, 프로세서(16)에 의하여 상기 장치(10)의 동작(또는 기능)을 수행하도록 구동될 수 있다.Memory 14 may store data supporting various functions of device 10 . The memory 14 stores a plurality of application programs (application programs or applications) running in the device 10, at least one process for operating the device 10, an artificial intelligence-based learning model, data, and instructions. can be saved At least some of these applications may exist for basic functions of the device 10 . Meanwhile, the application program may be stored in the memory 14, installed on the device 10, and driven by the processor 16 to perform an operation (or function) of the device 10.

프로세서(16)는 상기 응용 프로그램과 관련된 동작 외에도, 통상적으로 장치(10)의 전반적인 동작을 제어할 수 있다. 프로세서(16)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(14)에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.The processor 16 may control general operations of the device 10 in addition to operations related to the application program. The processor 16 may provide or process appropriate information or functions to a user by processing signals, data, information, etc. input or output through the components described above or by driving an application program stored in the memory 14.

또한, 프로세서(16)는 메모리(14)에 저장된 응용 프로그램을 구동하기 위하여, 도 1과 함께 살펴본 구성요소들 중 적어도 일부를 제어할 수 있다. 나아가, 프로세서(16)는 상기 응용 프로그램의 구동을 위하여, 장치(10)에 포함된 구성요소들 중 적어도 둘 이상을 서로 조합하여 동작 시킬 수 있다.In addition, the processor 16 may control at least some of the components discussed in conjunction with FIG. 1 in order to drive an application program stored in the memory 14 . Furthermore, the processor 16 may combine and operate at least two or more of the components included in the device 10 to drive the application program.

또한, 프로세서(16)에 포함된 측정부(162), 전처리부(164), 분류부(166) 및 추출부(168)는 상술한 바와 같이 각각의 기능을 수행할 수 있다. In addition, the measuring unit 162, the pre-processing unit 164, the classification unit 166, and the extraction unit 168 included in the processor 16 may perform respective functions as described above.

측정부(162)는 피진단의 혈액에서 분리된 호산구에 대해 라만 분석을 수행할 수 있다. 측정부(162)는 라만 분석을 위한 라만 분광기일 수 있지만, 이에 제한되지 않는다. 실시예에 따라, 측정부(162)는 장치(10)와 개별 장치로 구성되어 통신모듈을 통해 데이터를 송수신할 수 있고, 또는 장치(10) 내에 포함되어 구성될 수 있다. 측정부(162)는 특정 파장의 레이저 광을 호산구에 입사했을 때 호산구의 구성성분 별로 상이한 에너지 변화량 등에 따라 특정 파장의 각 포인트 별로 상이하게 나타나는 라만 스펙트럼을 측정할 수 있다. 여기서, 특정 파장은 기 설정된 파장일 수 있다.The measurement unit 162 may perform Raman analysis on eosinophils separated from the blood of the subject to be diagnosed. The measurement unit 162 may be a Raman spectrometer for Raman analysis, but is not limited thereto. Depending on the embodiment, the measurement unit 162 may be composed of the device 10 and a separate device to transmit and receive data through a communication module, or may be included in the device 10. The measurement unit 162 may measure a Raman spectrum that appears differently for each point of a specific wavelength according to a different energy change amount for each component of the eosinophil when laser light of a specific wavelength is incident on the eosinophil. Here, the specific wavelength may be a preset wavelength.

측정부(162)에 의한 측정에 따라 생성되는 라만 데이터는 전처리부(164)에서 정규화 등 전처리되게 된다.The Raman data generated according to the measurement by the measuring unit 162 is preprocessed such as normalization in the preprocessing unit 164 .

분류부(166)는 전처리된 라만 데이터를 구성성분 별로 가중치를 부여해서 구성성분 별로 군집 분류를 수행할 수 있다.The classifier 166 may perform cluster classification for each component by assigning weights to the preprocessed Raman data for each component.

추출부(168)는 구성성분 별로 분류된 데이터를 라벨링하고 라벨이 과립인 데이터만 추출할 수 있다.The extraction unit 168 may label data classified by component and extract only data having a granule label.

상기에서는 프로세서(16)의 복수의 구성요소가 각각의 기능을 수행하는 것으로 설명하였지만, 이는 설명의 편의를 위해 기능 별로 구성요소를 구분해서 프로세서(16)의 동작을 설명한 것이다. 즉, 프로세서(16)가 상기의 모든 동작을 수행할 수 있으며, 다만 측정부(162)가 장치(10)와 개별 장치로 구성된 경우에만 프로세서(16)는 개별 장치인 측정부(162)로부터 라만 데이터를 제공받을할 수 있다.Although a plurality of components of the processor 16 have been described as performing respective functions, the operation of the processor 16 has been described by classifying components according to functions for convenience of description. That is, the processor 16 can perform all of the above operations, but only when the measurement unit 162 is composed of the device 10 and an individual device, the processor 16 receives the Raman from the measurement unit 162, which is an individual device. data can be provided.

이하에서는 도 2 내지 도 5를 참조하여, 프로세서(16)가 인공지능 기반으로 호산구의 라만 데이터를 처리하는 방법을 설명하도록 한다. 여기서, 프로세서(16)의 동작은 장치(10)에서 수행 가능할 수 있다. Hereinafter, a method of processing Raman data of eosinophils by the processor 16 based on artificial intelligence will be described with reference to FIGS. 2 to 5 . Here, the operation of the processor 16 may be performed by the device 10 .

도 2를 참조하면, 프로세서(16)는 피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행할 수 있다(S210). 프로세서(16)는 분석된 결과에 기초하여 라만 데이터를 생성할 수 있다(S220). 단계 S210에 대한 상세한 설명한 상술한 바와 중복되므로 생략하도록 한다.Referring to FIG. 2 , the processor 16 may perform Raman analysis using a specific wavelength on eosinophils isolated from the blood of the person to be diagnosed (S210). The processor 16 may generate Raman data based on the analyzed result (S220). Since the detailed description of step S210 is duplicated with the above description, it will be omitted.

본 발명에서 사용되는 라만 분석은 입사되는 레이저의 빛 알갱이의 비탄성 산란을 측정하는 분광 분석일 수 있지만, 이에 제한되는 것은 아니다.Raman analysis used in the present invention may be a spectroscopic analysis for measuring inelastic scattering of light particles of an incident laser, but is not limited thereto.

단계 S210에서 라만 분석을 통해 획득되는 라만 데이터는, 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터일 수 있다.Raman data obtained through Raman analysis in step S210 may be data in which two-dimensional data mapped for each point of a specific wavelength is listed in an order corresponding to the direction of travel of the specific wavelength.

도 3을 참조하면, 가로 길이가 X이고 세로 길이가 Y인 복수의 2차원 데이터가 파장(wavelength)의 진행 방향에 따라 나열되어 라만 데이터(라만 맵핑 데이터)를 생성할 수 있다. Referring to FIG. 3 , Raman data (Raman mapping data) may be generated by listing a plurality of two-dimensional data having a horizontal length of X and a vertical length of Y in a direction of a wavelength.

도 3에 도시된 바와 같이, 파장의 각각의 포인트에 맵핑된 2차원 데이터는 이미지 내에 명확히 표현되는 구성성분이 상이할 수 있다. 이는 각 포인트에서 각각의 구성성분의 광학적 특성이 각각 상이하기 때문이다. 파장의 760-790cm-1의 포인트에 맵핑된 2차원 데이터는 구성성분 중 핵(nucleus)의 형태가 상대적으로 명확히 드러난 것을 알 수 있다.As shown in FIG. 3, the two-dimensional data mapped to each point of the wavelength may have different components that are clearly expressed in the image. This is because the optical characteristics of each component at each point are different. It can be seen that the two-dimensional data mapped to the point of 760 to 790 cm −1 of the wavelength clearly reveals the shape of the nucleus among the components.

그리고, 각 포인트 별로 맵핑된 2차원 데이터는 서로 다른 라만 스펙트럼을 포함할 수 있다. 상술한 바와 같이, 구성성분 별로 상이한 에너지 변화량 등에 따라 파장의 각 포인트 별로 상이한 라만 스펙트럼이 측정되는데, 이렇게 포인트 별로 측정된 라만 스펙트럼은 각 포인트 별로 맵핑된 2차원 데이터에 포함될 수 있다. Also, the 2D data mapped for each point may include different Raman spectra. As described above, a different Raman spectrum is measured for each point of a wavelength according to a different amount of energy change for each component, and the Raman spectrum measured for each point may be included in two-dimensional data mapped for each point.

상기에서는 포인트 별로 맵핑된 2차원 데이터에 라만 스펙트럼이 포함되어 라만 데이터가 생성되는 것으로 설명하였지만, 이에 제한되지 않고, 실시예에 따라 파장의 각 포인트 별로 2차원 데이터와 라만 스펙트럼이 연계되어 맵핑되어 라만 데이터가 생성될 수 있다.In the above, it has been described that Raman data is generated by including the Raman spectrum in the two-dimensional data mapped for each point, but is not limited thereto, and according to an embodiment, the two-dimensional data and the Raman spectrum are linked and mapped for each point of the wavelength to generate the Raman data. data can be created.

다시 도 2를 참조하면, 프로세서(16)는 상기 생성된 라만 데이터를 전처리할 수 있다(S230).Referring back to FIG. 2 , the processor 16 may pre-process the generated Raman data (S230).

구체적으로, 프로세서(16)는 생성된 라만 데이터를 정규화할 수 있다. 데이터 정규화는 공지된 내용이므로 상세한 설명은 생략하도록 한다.Specifically, the processor 16 may normalize the generated Raman data. Since data normalization is well-known content, a detailed description thereof will be omitted.

이하에서 설명하는 단계 S240 및 단계 S280은 기 구축된 인공 지능 기반의 학습 모델을 이용하여 수행될 수 있다. 학습 모델에 관한 설명은 후술하도록 한다.Steps S240 and S280 described below may be performed using a pre-constructed artificial intelligence-based learning model. A description of the learning model will be given later.

그런 다음, 프로세서(16)는 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여할 수 있다(S240).Then, the processor 16 may assign weights to the preprocessed Raman data for each component including nuclei, cell membranes, granules, and background (S240).

구체적으로, 프로세서(16)는 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환할 수 있다.Specifically, the processor 16 may arrange 2D data mapped for each point in a line, respectively, and convert the 2D data into 1D data.

도 4를 참조하면, 파장의 각 포인트 별로 2차원 데이터로 형성되어 있던 라만 데이터는 각 포인트 별로 1차원 데이터로 변환된다.Referring to FIG. 4 , Raman data formed as 2D data for each point of a wavelength is converted into 1D data for each point.

이 후, 프로세서(16)는 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출할 수 있다. 여기서 대표 데이터는 각 구성성분의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 의미할 수 있다. Thereafter, the processor 16 may extract representative data for each of the components from the converted 1-dimensional data. Here, the representative data may refer to data that best represents a pattern of optical characteristics of each component.

즉, 도 4를 참조하면, 포인트 별로 맵핑된 1차원 데이터 중에서 구성성분 중 핵의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 핵에 대한 대표 데이터로 추출하고, 세포막의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 세포막에 대한 대표 데이터로 추출하고, 과립의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 과립에 대한 대표 데이터로 추출하고, 백그라운드의 광학적 특성의 패턴을 가장 잘 나타내는 데이터를 백그라운드에 대한 대표 데이터로 추출할 수 있다.That is, referring to FIG. 4, among the 1-dimensional data mapped for each point, data that best represents the pattern of optical characteristics of the nucleus among components is extracted as representative data for the nucleus, and that best represents the pattern of optical characteristics of the cell membrane. The data are extracted as representative data for the cell membrane, the data that best represent the pattern of optical properties of the granule are extracted as the representative data for the granule, and the data that best represent the pattern of the optical property of the background are representative data for the background. can be extracted.

이 후, 프로세서(16)는 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여할 수 있다.Thereafter, the processor 16 may assign a Raman spectrum at a point corresponding to each of the extracted representative data as a weight to each of the extracted representative data.

즉, 도 4를 참조하면, 추출된 대표 데이터가 맵핑된 각각의 포인트에서 측정된 라만 스펙트럼을 각각의 대표 데이터에 가중치로 적용할 수 있다. 이와 같이 각 구성성분 별 패턴을 나타내는 대표 데이터에 가중치를 주어 증폭시킴으로써 이후 구성성분 별 분류의 정확도를 높일 수 있다.That is, referring to FIG. 4 , a Raman spectrum measured at each point to which the extracted representative data is mapped may be applied as a weight to each representative data. In this way, by amplifying representative data representing patterns for each component by giving a weight, it is possible to increase the accuracy of classification for each component thereafter.

다시 도 2를 참조하면, 프로세서(16)는 상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류할 수 있다(S250).Referring back to FIG. 2 , the processor 16 may classify data for each component based on a result of applying the weight (S250).

구체적으로, 프로세서(16)는 k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행할 수 있다. 즉, 각 구성성분 별로 중심점을 클러스터링될 수 있다. 여기서, 각 구성성분 별 중심점은 상기 가중치가 부여된 각각의 구성성분에 대한 대표 데이터에 기초하여 설정될 수 있지만, 이에 제한되는 것은 아니다.Specifically, the processor 16 may perform cluster classification for each component using k-means clustering. That is, the central point may be clustered for each component. Here, the center point for each component may be set based on the representative data for each component to which the weight is assigned, but is not limited thereto.

도 5를 참조하면, 프로세서(16)는 백그라운드는 라벨 0으로, 표현하고, 세포막은 라벨 1로 표현하고, 과립은 라벨 2로 표현하고, 핵은 라벨3으로 표현하여 군집 분류를 수행할 수 있다.Referring to FIG. 5 , the processor 16 may perform cluster classification by expressing background as label 0, cell membrane as label 1, granules as label 2, and nuclei as label 3. .

다시 도 2를 참조하면, 프로세서(16)는 상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출할 수 있다(S280).Referring back to FIG. 2 , the processor 16 may extract data indicating that the constituent is the granule based on the classified result (S280).

구체적으로, 프로세서(16)는 상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행할 수 있다(S260). 이후, 프로세서(16)는 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단할 수 있다(S270). 이후, 프로세서(16)는 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출할 수 있다.Specifically, the processor 16 may perform data labeling by assigning different labels to each component (S260). Thereafter, the processor 16 may determine whether a label labeled in the data corresponds to the granule (S270). Then, based on the determined result, the processor 16 may extract only data labeled with a label corresponding to the granule from among the labeled data.

단계 S250에서 군집 분류가 완료됨에 따라 생성되는 이미지 형태의 결과 데이터를 5에 도시된 바와 같이, 이미지의 픽셀 별로 데이터 라벨링을 수행할 수 있다. 이때 데이터 라벨링은 군집 분류 수행 시 부여된 라벨에 기초하여 수행될 수 있다.Data labeling may be performed for each pixel of the image, as shown in step 5, for the resulting data in the form of an image generated as the cluster classification is completed in step S250. In this case, data labeling may be performed based on a label assigned when performing cluster classification.

이렇게 이미지에 대해 전체 데이터 라벨링이 완료되면, 프로세서(16)는 데이터의 라벨이 과립에 해당하는 라벨인지를 판단하고, 과립에 해당하는 라벨로 판단된 데이터만을 추출할 수 있다.When all data labeling for the image is completed in this way, the processor 16 determines whether the label of the data corresponds to the granule, and extracts only the data determined to be the label corresponding to the granule.

여기서, 상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터일 수 있다. 이렇게, 전처리만 되어있는 데이터를 최종적으로 추출하여 별도의 가공 및 손실이 없는 데이터를 활용함으로써 호산구 별 화학적 특성 비교가 가능한 것이다.Here, the extracted data may be Raman data in which the component is the granule among the preprocessed Raman data. In this way, it is possible to compare the chemical properties of each eosinophil by finally extracting the data that has only been preprocessed and utilizing the data without separate processing and loss.

상기에서는, 단계 S280이 단계 S260 및 단계 S270을 포함하는 것으로 설명하였지만, 이에 제한되지 않고 단계 S260 내지 단계 S280은 개별 동작으로서 순차적으로 수행될 수 있다.In the above, step S280 has been described as including step S260 and step S270, but is not limited thereto and steps S260 to S280 may be sequentially performed as individual operations.

그리고 도 2에 도시되지는 않았지만, 구성성분이 과립인 데이터가 추출되면, 프로세서(16)는 상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단할 수 있다.And, although not shown in FIG. 2, if the data of granules as a component is extracted, the processor 16 determines whether the diagnosed subject has a specific disease through the eosinophil characteristics of the diagnosed subject based on the extracted data. can

여기서, 특정 질병은 호산구성 천식일 수 있지만 이에 제한되지 않고, 호산구 증가가 동반되는 다양한 질병을 모두 포함할 수 있다.Here, the specific disease may be eosinophilic asthma, but is not limited thereto, and may include all of various diseases accompanied by an increase in eosinophils.

이와 같이 호산구의 구성성분 중 과립에 대한 데이터만을 추출함으로써, 프로세서(16)는 호산구의 화학적 특성 중 문제가 되는 과립의 화학적 특성만을 가지고 피진단자가 상기 특정 질병에 대해 정상인지 비정상인지를 판단할 수 있다.By extracting only data on granules among components of eosinophils in this way, the processor 16 can determine whether the subject is normal or abnormal for the specific disease with only the chemical properties of the granules in question among the chemical properties of eosinophils. there is.

구체적으로 프로세서(16)는 인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단할 수 있다.Specifically, the processor 16 analyzes the extracted data using an artificial intelligence-based learning model, determines whether the eosinophil characteristics of the diagnosed person are included in a normal range or an abnormal range, and determines whether a specific disease has occurred. can judge

여기서, 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대한 제1 라만 데이터 처리 과정, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대한 제2 라만 데이터 처리 과정, 상기 제1 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 제2 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축될 수 있다.Here, the learning model is a first Raman data processing process for a plurality of eosinophils isolated from the blood of a plurality of patients with the specific disease, and a first Raman data processing process for the plurality of eosinophils isolated from the blood of a plurality of normal persons without the specific disease. 2 Raman data processing process, eosinophil characteristics of each of a plurality of patients obtained by performing the first Raman data processing process, and eosinophil characteristics of each of a plurality of normal persons obtained by performing the second Raman data processing process are learned and constructed It can be.

즉, 학습 모델은 특정 질병에 대한 정상인의 다양한 데이터들과 특정 질병에 대한 환자의 다양한 데이터들을 비교하면서 학습을 수행함으로써, 정상인과 환자 간의 호산구 특성의 차이를 정확히 파악할 수 있게 된다. 도 6에 도시된 바와 같이, 정상인의 호산구로부터 추출된 과립 라만 데이터에 기초한 상기 정상인의 호산구 특성과, 환자의 호산구로부터 추출된 과립 라만 데이터에 기초한 상기 환자의 호산구 특성은 확실한 차이가 있다.That is, the learning model can accurately grasp the difference in eosinophil characteristics between a normal person and a patient by performing learning while comparing various data of a normal person with respect to a specific disease and various data of a patient with a specific disease. As shown in FIG. 6 , there is a clear difference between the eosinophil characteristics of a normal person based on granule Raman data extracted from eosinophils of a normal person and the patient's eosinophil characteristics based on granule Raman data extracted from eosinophils of a patient.

따라서, 학습 모델은 이러한 차이에 학습함에 따라 상기 피진단자의 호산구 특성이 정상 범위 내에 속하는지 비정상 범위 내에 속하는지를 판단하여, 비정상 범위 내에 속하는 것으로 판단한 경우, 상기 피진단자에게 상기 특정 질병이 발병했음을 예측할 수 있다.Therefore, the learning model learns this difference and determines whether the eosinophil characteristics of the diagnosed subject fall within the normal range or the abnormal range, and when it is determined that the diagnosed subject falls within the abnormal range, it is predicted that the diagnosed subject has the specific disease. can

상기에서는 피진단자의 혈액으로부터 호산구를 분리하여 호산구의 과립 데이터를 추출하는 것으로 설명하였지만, 이에 제한되지 않고 호산구 뿐만 아니라 기타 다른 과립성 세포에 대해서도 과립 데이터 추출 알고리즘을 적용하여 관련 질환을 예측할 수도 있다.Although it has been described above that granule data of eosinophils is extracted by separating eosinophils from the blood of the diagnosed person, the granule data extraction algorithm may be applied not only to eosinophils but also to other granular cells to predict related diseases.

도 2는 단계 S110 내지 단계 S280을 순차적으로 실행하는 것으로 기재하고 있으나, 이는 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 도 2에 기재된 순서를 변경하여 실행하거나 단계 S110 내지 단계 S280 중 하나 이상의 단계를 병렬적으로 실행하는 것으로 다양하게 수정 및 변형하여 적용 가능할 것이므로, 도 2는 시계열적인 순서로 한정되는 것은 아니다.2 describes that steps S110 to S280 are sequentially executed, but this is merely an example of the technical idea of this embodiment, and those skilled in the art to which this embodiment belongs will Since it will be possible to change and execute the order described in FIG. 2 without departing from the essential characteristics or to perform various modifications and variations by executing one or more steps of steps S110 to S280 in parallel, FIG. 2 is shown in a time-series order. It is not limited.

이상에서 전술한 본 발명의 일 실시예에 따른 방법은, 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 매체에 저장될 수 있다. 여기서, 컴퓨터는 앞에서 설명한 장치(10)일 수 있다.The method according to an embodiment of the present invention described above may be implemented as a program (or application) to be executed in combination with a computer, which is hardware, and stored in a medium. Here, the computer may be the device 10 described above.

상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.The aforementioned program is C, C++, JAVA, machine language, etc. It may include a code coded in a computer language of. These codes may include functional codes related to functions defining necessary functions for executing the methods, and include control codes related to execution procedures necessary for the processor of the computer to execute the functions according to a predetermined procedure. can do. In addition, these codes may further include memory reference related codes for which location (address address) of the computer's internal or external memory should be referenced for additional information or media required for the computer's processor to execute the functions. there is. In addition, when the processor of the computer needs to communicate with any other remote computer or server in order to execute the functions, the code uses the communication module of the computer to determine how to communicate with any other remote computer or server. It may further include communication-related codes for whether to communicate, what kind of information or media to transmit/receive during communication, and the like.

본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.Steps of a method or algorithm described in connection with an embodiment of the present invention may be implemented directly in hardware, implemented in a software module executed by hardware, or implemented by a combination thereof. A software module may include random access memory (RAM), read only memory (ROM), erasable programmable ROM (EPROM), electrically erasable programmable ROM (EEPROM), flash memory, hard disk, removable disk, CD-ROM, or It may reside in any form of computer readable recording medium well known in the art to which the present invention pertains.

이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.Although the embodiments of the present invention have been described with reference to the accompanying drawings, those skilled in the art to which the present invention pertains can be implemented in other specific forms without changing the technical spirit or essential features of the present invention. you will be able to understand Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive.

10: 장치
12: 통신부
14: 메모리
16: 프로세서
162: 측정부
164: 전처리부
166: 분류부
168: 추출부
10: device
12: Communication department
14: memory
16: processor
162: measuring unit
164: pre-processing unit
166: classification unit
168: extraction unit

Claims (15)

장치에 의해 수행되는 인공지능 기반 호산구의 라만 데이터 처리 방법에 있어서,
피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행하여 라만 데이터를 생성하는 단계;
상기 생성된 라만 데이터를 전처리하는 단계;
상기 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여하는 단계;
상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류하는 단계;
상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출하는 단계; 및
상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단하는 단계;를 포함하는, 방법.
In the artificial intelligence-based Raman data processing method of eosinophils performed by the device,
Generating Raman data by performing Raman analysis using a specific wavelength on eosinophils isolated from the blood of a subject to be diagnosed;
pre-processing the generated Raman data;
assigning weights to the preprocessed Raman data for each component including nuclei, cell membranes, granules, and background;
classifying data for each component based on a result of applying the weight;
extracting data indicating that the constituent is the granule, based on the classified result; and
and determining whether a specific disease has occurred in the diagnosed subject based on the eosinophil characteristics of the diagnosed subject based on the extracted data.
제1 항에 있어서,
상기 라만 데이터는,
상기 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터이며,
상기 각 포인트 별로 맵핑된 2차원 데이터는 서로 다른 라만 스펙트럼을 포함하는, 방법.
According to claim 1,
The Raman data,
The two-dimensional data mapped for each point of the specific wavelength is data listed in an order corresponding to the traveling direction of the specific wavelength,
The two-dimensional data mapped for each point includes different Raman spectra.
제2 항에 있어서,
상기 가중치 부여 단계는,
상기 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환하는 단계;
상기 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출하는 단계; 및
상기 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여하는 단계;를 포함하는, 방법.
According to claim 2,
In the weighting step,
arranging the two-dimensional data mapped for each point in a row and converting them into one-dimensional data;
extracting representative data for each of the components from the converted one-dimensional data; and
And assigning a Raman spectrum at a point corresponding to each of the extracted representative data as a weight to each of the extracted representative data.
제3 항에 있어서,
상기 분류 단계는,
k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행하고,
상기 추출 단계는,
상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행하고, 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단하고, 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출하는, 방법.
According to claim 3,
The classification step is
Performing cluster classification for each component using k-means clustering;
The extraction step is
Data labeling is performed by assigning different labels to each component, and it is determined whether a label labeled in the data corresponds to the granule, and based on the determined result, among the labeled data, a label corresponding to the granule is determined. A method of extracting only labeled data with a label.
제4 항에 있어서,
상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터인, 방법.
According to claim 4,
Wherein the extracted data is Raman data in which the component is the granule among the preprocessed Raman data.
제1 항에 있어서,
상기 판단 단계는,
인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단하는, 방법.
According to claim 1,
The judgment step is
Analyzing the extracted data using an artificial intelligence-based learning model to determine whether a specific disease has occurred by determining whether the eosinophil characteristics of the diagnosed person are included in a normal range or an abnormal range. Method.
제6 항에 있어서,
상기 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대한 제1 라만 데이터 처리 과정, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대한 제2 라만 데이터 처리 과정, 상기 제1 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 제2 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축되는, 방법.
According to claim 6,
The learning model includes a first Raman data processing process for a plurality of eosinophils isolated from the blood of a plurality of patients with the specific disease, and a second process for processing the plurality of eosinophils isolated from the blood of a plurality of normal persons without the specific disease. Constructed by learning the Raman data processing process, the eosinophil characteristics of each of a plurality of patients obtained by performing the first Raman data processing process, and the eosinophil characteristics of each of a plurality of normal persons obtained by performing the second Raman data processing process , method.
컴퓨터인 하드웨어와 결합되어, 제1 항 내지 제7 항 중 어느 한 항의 방법을 실행하기 위해 매체에 저장된 프로그램.A program stored in a medium to execute the method of any one of claims 1 to 7 in combination with computer hardware. 인공지능 기반 호산구의 라만 데이터 처리 장치에 있어서,
통신부;
인공지능 기반의 학습 모델을 이용한 호산구의 라만 데이터 처리를 위한 적어도 하나의 프로세스를 저장하고 있는 메모리; 및
상기 프로세스에 따라 동작하는 프로세서;를 포함하고,
상기 프로세서는, 상기 프로세스를 기반으로,
피진단자의 혈액에서 분리된 호산구에 대해 특정 파장을 이용한 라만 분석을 수행하여 라만 데이터를 생성하고,
상기 생성된 라만 데이터를 전처리하고,
상기 전처리된 라만 데이터를 핵, 세포막, 과립 및 백그라운드를 포함하는 구성성분 별로 가중치를 부여하고,
상기 가중치를 부여한 결과에 기초하여, 상기 구성성분 별로 데이터를 분류하고,
상기 분류된 결과에 기초하여, 상기 구성성분이 상기 과립인 데이터를 추출하고,
상기 추출된 데이터에 기초한 상기 피진단자의 호산구 특성을 통해 상기 피진단자의 특정 질병의 발생 여부를 판단하는, 장치.
In the artificial intelligence-based Raman data processing device of eosinophils,
communications department;
a memory storing at least one process for processing Raman data of eosinophils using an artificial intelligence-based learning model; and
A processor operating according to the process; includes,
The processor, based on the process,
Raman data is generated by performing Raman analysis using a specific wavelength on eosinophils isolated from the blood of the diagnosed subject;
Preprocessing the generated Raman data,
The preprocessed Raman data is weighted for each component including nuclei, cell membranes, granules, and background;
Based on the result of applying the weight, classify the data for each component,
Based on the classified result, extracting data that the constituent is the granule,
An apparatus for determining whether a specific disease occurs in the diagnosed subject through eosinophil characteristics of the diagnosed subject based on the extracted data.
제9 항에 있어서,
상기 라만 데이터는,
상기 특정 파장의 각 포인트 별로 맵핑된 2차원 데이터가 상기 특정 파장의 진행 방향에 상응하는 순서로 나열된 데이터이며,
상기 각 포인트 별로 맵핑된 2차원 이미지는 서로 다른 라만 스펙트럼을 포함하는, 장치.
According to claim 9,
The Raman data,
The two-dimensional data mapped for each point of the specific wavelength is data listed in an order corresponding to the traveling direction of the specific wavelength,
The two-dimensional image mapped for each point includes a different Raman spectrum.
제10 항에 있어서,
상기 프로세서는,
상기 가중치 부여 시,
상기 각 포인트 별로 맵핑된 2차원 데이터를 각각 일렬로 나열하여 1차원 데이터로 변환하고,
상기 변환된 1차원 데이터 중에서 상기 구성성분 각각에 대한 대표 데이터를 추출하고,
상기 추출된 대표 데이터 각각에 대응하는 포인트에서의 라만 스펙트럼을 상기 추출된 대표 데이터 각각의 가중치로 부여하는, 장치.
According to claim 10,
the processor,
When the weighting is given,
The two-dimensional data mapped for each point are arranged in a row and converted into one-dimensional data;
Extracting representative data for each of the components from the converted one-dimensional data;
An apparatus for assigning a Raman spectrum at a point corresponding to each of the extracted representative data as a weight to each of the extracted representative data.
제11 항에 있어서,
상기 프로세서는,
상기 분류 시,
k-means clustering을 이용하여 상기 구성성분 별로 군집 분류를 수행하고,
상기 추출 시,
상기 구성성분 별로 서로 다른 라벨을 부여하여 데이터 라벨링을 수행하고, 데이터에 라벨링된 라벨이 상기 과립에 해당하는 라벨인지를 판단하고, 상기 판단된 결과에 기초하여, 라벨링된 데이터 중에서 상기 과립에 해당하는 라벨이 라벨링된 데이터만을 추출하는, 장치.
According to claim 11,
the processor,
In the above classification,
Performing cluster classification for each component using k-means clustering;
At the time of the extraction,
Data labeling is performed by assigning different labels to each component, and it is determined whether a label labeled in the data corresponds to the granule, and based on the determined result, among the labeled data, a label corresponding to the granule is determined. Apparatus, wherein the label extracts only the labeled data.
제12 항에 있어서,
상기 추출된 데이터는, 상기 전처리된 라만 데이터 중에서 상기 구성성분이 상기 과립인 라만 데이터인, 장치.
According to claim 12,
The extracted data is Raman data in which the component is the granule among the preprocessed Raman data.
제9 항에 있어서,
상기 프로세서는,
상기 판단 시,
인공지능 기반의 학습 모델을 이용하여 상기 추출된 데이터를 분석하여, 상기 피진단자의 상기 호산구 특성이 정상 범위에 포함되는지 비정상 범위에 포함되는지를 판단하여 특정 질병이 발생했는지를 판단하는, 장치.
According to claim 9,
the processor,
Upon the above judgment,
An apparatus for analyzing the extracted data using an artificial intelligence-based learning model to determine whether a specific disease has occurred by determining whether the eosinophil characteristics of the diagnosed person are included in a normal range or an abnormal range.
제14 항에 있어서,
상기 학습 모델은, 상기 특정 질병이 있는 복수의 환자의 혈액으로부터 분리된 복수의 호산구에 대해 상기 라만 데이터 처리 과정을 수행하여 획득된 복수의 환자 각각의 호산구 특성과, 상기 특정 질병이 없는 복수의 정상인의 혈액으로부터 분리된 복수의 호산구에 대해 상기 라만 데이터 처리 과정을 수행하여 획득된 복수의 정상인 각각의 호산구 특성을 학습하여 구축되는, 장치.
According to claim 14,
The learning model includes the eosinophil characteristics of each of a plurality of patients obtained by performing the Raman data processing process on a plurality of eosinophils isolated from the blood of a plurality of patients with the specific disease, and a plurality of normal persons without the specific disease. The device is constructed by learning the characteristics of each of the eosinophils of a plurality of normal people obtained by performing the Raman data processing process on a plurality of eosinophils isolated from the blood of.
KR1020210108750A 2021-08-18 2021-08-18 Method and apparatus for processing raman data of eosinophil based on artificial intelligence KR102572517B1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020210108750A KR102572517B1 (en) 2021-08-18 2021-08-18 Method and apparatus for processing raman data of eosinophil based on artificial intelligence
US17/820,461 US20230056999A1 (en) 2021-08-18 2022-08-17 Method and device for processing raman data of eosinophils based on artificial intelligence
KR1020230108876A KR20230127947A (en) 2021-08-18 2023-08-21 Method and device for processing Raman data of cell based on artificial intelligence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210108750A KR102572517B1 (en) 2021-08-18 2021-08-18 Method and apparatus for processing raman data of eosinophil based on artificial intelligence

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020230108876A Division KR20230127947A (en) 2021-08-18 2023-08-21 Method and device for processing Raman data of cell based on artificial intelligence

Publications (2)

Publication Number Publication Date
KR20230027365A true KR20230027365A (en) 2023-02-28
KR102572517B1 KR102572517B1 (en) 2023-08-31

Family

ID=85326887

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020210108750A KR102572517B1 (en) 2021-08-18 2021-08-18 Method and apparatus for processing raman data of eosinophil based on artificial intelligence
KR1020230108876A KR20230127947A (en) 2021-08-18 2023-08-21 Method and device for processing Raman data of cell based on artificial intelligence

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020230108876A KR20230127947A (en) 2021-08-18 2023-08-21 Method and device for processing Raman data of cell based on artificial intelligence

Country Status (1)

Country Link
KR (2) KR102572517B1 (en)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140043128A (en) * 2011-06-24 2014-04-08 시레카 테라노스틱스, 엘엘씨 Method for analyzing biological specimens by spectral imaging
CN103745210A (en) * 2014-01-28 2014-04-23 爱威科技股份有限公司 Method and device for classifying white blood cells
KR20160012114A (en) * 2013-03-19 2016-02-02 시레카 테라노스틱스, 엘엘씨 Method and system for analyzing biological specimens by spectral imaging
KR20170073648A (en) * 2014-10-24 2017-06-28 모나쉬 유니버시티 Method and system for detection of disease agents in blood
KR20180127939A (en) 2017-05-22 2018-11-30 삼성전자주식회사 Apparatus and method of quantitative molecular sensing based on Raman peak shift
KR102067317B1 (en) * 2013-03-15 2020-01-16 아이리스 인터내셔널 인크. Dynamic range extension systems and methods for particle analysis in blood samples
KR20200108938A (en) * 2019-03-04 2020-09-22 주식회사 엑소퍼트 Method and System of Providing Cancer Diagnosis Information Using Artificial Intelligence-Based Liquid Biopsy by Exosomes
JP2021526628A (en) * 2018-04-05 2021-10-07 イーエニエーエスセー テック − インスティチュート デ エンゲンハリア デ システマス エ コンピュータドレス テクノロジア エ シエンシアInesc Tec − Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciencia Spectrophotometric methods and equipment for predicting quantified values of components from samples

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140043128A (en) * 2011-06-24 2014-04-08 시레카 테라노스틱스, 엘엘씨 Method for analyzing biological specimens by spectral imaging
KR102067317B1 (en) * 2013-03-15 2020-01-16 아이리스 인터내셔널 인크. Dynamic range extension systems and methods for particle analysis in blood samples
KR20160012114A (en) * 2013-03-19 2016-02-02 시레카 테라노스틱스, 엘엘씨 Method and system for analyzing biological specimens by spectral imaging
CN103745210A (en) * 2014-01-28 2014-04-23 爱威科技股份有限公司 Method and device for classifying white blood cells
KR20170073648A (en) * 2014-10-24 2017-06-28 모나쉬 유니버시티 Method and system for detection of disease agents in blood
KR20180127939A (en) 2017-05-22 2018-11-30 삼성전자주식회사 Apparatus and method of quantitative molecular sensing based on Raman peak shift
JP2021526628A (en) * 2018-04-05 2021-10-07 イーエニエーエスセー テック − インスティチュート デ エンゲンハリア デ システマス エ コンピュータドレス テクノロジア エ シエンシアInesc Tec − Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciencia Spectrophotometric methods and equipment for predicting quantified values of components from samples
KR20200108938A (en) * 2019-03-04 2020-09-22 주식회사 엑소퍼트 Method and System of Providing Cancer Diagnosis Information Using Artificial Intelligence-Based Liquid Biopsy by Exosomes

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Aleksandra Dorosz 외 8인. Eosinophils and Neutrophils-Molecular Differences Revealed by Spontaneous Raman, CARS and Fluorescence Microscopy. MDPI, Cells, Vol. 9, No. 9, pp. 1-15, 2020.09.07.* *

Also Published As

Publication number Publication date
KR20230127947A (en) 2023-09-01
KR102572517B1 (en) 2023-08-31

Similar Documents

Publication Publication Date Title
Kiselev et al. scmap: projection of single-cell RNA-seq data across data sets
US11837329B2 (en) Method for classifying multi-granularity breast cancer genes based on double self-adaptive neighborhood radius
US20230034559A1 (en) Automated prediction of clinical trial outcome
Liang et al. Combining resampling and machine learning to improve sleep-wake detection of Fitbit wristbands
Aliman et al. Sentiment analysis using logistic regression
US20140309122A1 (en) Knowledge-driven sparse learning approach to identifying interpretable high-order feature interactions for system output prediction
KR102572517B1 (en) Method and apparatus for processing raman data of eosinophil based on artificial intelligence
Li et al. MSSort-DIAXMBD: A deep learning classification tool of the peptide precursors quantified by OpenSWATH
US20210158967A1 (en) Method of prediction of potential health risk
Long et al. A model population analysis method for variable selection based on mutual information
CN108388918A (en) Data characteristics selection method with structure retention performance
US20230056999A1 (en) Method and device for processing raman data of eosinophils based on artificial intelligence
Lai et al. LSA-ac4C: A hybrid neural network incorporating double-layer LSTM and self-attention mechanism for the prediction of N4-acetylcytidine sites in human mRNA
JP2023007370A (en) Method of training sorting leaning model, sorting method, apparatus, device, and medium
Bhulakshmi et al. The prediction of diabetes in pima indian women mellitus based on xgboost ensemble modeling using data science
KR20230039227A (en) Method and apparatus for predicting eosinophilia based on artificial intelligence
Huang et al. A multi-label learning prediction model for heart failure in patients with atrial fibrillation based on expert knowledge of disease duration
Divya et al. Detection of Parkinson Disease using Machine Learning
Kuksa et al. Fast protein homology and fold detection with sparse spatial sample kernels
Sztahó et al. Cross-lingual detection of dysphonic speech for Dutch and Hungarian datasets
Arango-Argoty et al. Pretrained transformers applied to clinical studies improve predictions of treatment efficacy and associated biomarkers
Alipourfard et al. Disaggregation via Gaussian regression for robust analysis of heterogeneous data
Liu et al. CVQVAE: A representation learning based method for multi-omics single cell data integration
CN116978106B (en) Cross-modal emotion anomaly detection method and device for batch processing mixed comparison learning
Sun et al. Enhancer recognition and prediction during spermatogenesis based on deep convolutional neural networks

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
A107 Divisional application of patent