KR102461582B1 - 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램 - Google Patents

인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램 Download PDF

Info

Publication number
KR102461582B1
KR102461582B1 KR1020200100490A KR20200100490A KR102461582B1 KR 102461582 B1 KR102461582 B1 KR 102461582B1 KR 1020200100490 A KR1020200100490 A KR 1020200100490A KR 20200100490 A KR20200100490 A KR 20200100490A KR 102461582 B1 KR102461582 B1 KR 102461582B1
Authority
KR
South Korea
Prior art keywords
data set
learning
neural network
training
input
Prior art date
Application number
KR1020200100490A
Other languages
English (en)
Other versions
KR20220020044A (ko
Inventor
정세리
이윤재
이누리
박민정
송원근
Original Assignee
한림대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한림대학교 산학협력단 filed Critical 한림대학교 산학협력단
Priority to KR1020200100490A priority Critical patent/KR102461582B1/ko
Publication of KR20220020044A publication Critical patent/KR20220020044A/ko
Application granted granted Critical
Publication of KR102461582B1 publication Critical patent/KR102461582B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/558Immunoassay; Biospecific binding assay; Materials therefor using diffusion or migration of antigen or antibody
    • G01N33/561Immunoelectrophoresis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/76Assays involving albumins other than in routine use for blocking surfaces or for anchoring haptens during immunisation
    • G01N2333/77Ovalbumin

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Cell Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Computational Linguistics (AREA)
  • Electrochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)

Abstract

전술한 과제를 해결하기 위한 본 개시의 일 실시예에서, 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은, 하나 이상의 프로세서에서 실행되는 경우, 상기 하나 이상의 프로세서로 하여금 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 이하의 동작들을 수행하도록 하며, 상기 동작들은: 복수의 학습 데이터로 구성된 학습 데이터 세트를 수신하는 동작, 학습 데이터 세트에 대한 전처리를 수행하여 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하는 동작, 상기 제 1 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 1 신경망 모델을 생성하는 동작, 상기 제 2 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 2 신경망 모델을 생성하는 동작 및 상기 제 1 신경망 모델 및 상기 제 2 신경망 모델을 통합하여 통합 모델을 생성하는 동작을 포함할 수 있다.

Description

인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램{COMPUTER PROGRAM FOR PROVIDING DIAGNOSTIC INFORMATION CORRESPONDING TO EXAMINATION INFORMATION USING ARTIFICIAL INTELLIGENCE}
본 개시는 인공지능을 활용하여 사용자에게 진단 정보를 제공하는 기술에 관한 것으로, 구체적으로, 인공 신경망을 활용하여 사용자의 혈액(또는 혈청)에 대한 전기 영동기법을 통해 획득된 검진 정보에 대응하는 질환 진단 정보를 제공하기 위함이다.
형질세포는 우리 몸에서 면역체계의 중요한 부분을 담당하며 바이러스와 같은 병원체를 공격하는 항제를 생성한다. 다발성 골수종은 형질세포가 비정상적으로 분화 및 증식되어 나타나는 혈액암이다. 이러한 비정상적인 형질세포를 골수종세포라고 부르며, 이는 종양을 만들고 뼈를 녹여 통증을 유발하거나 잘 부러지게 한다. 또한, 백혈구, 적혈구, 혈소판 수치를 감소시켜 빈혈, 감염 및 출혈의 위험도를 증가시킨다. 골수종세포는 또한 비정상 면역 단백(즉, M-단백)을 만들어 내어 혈액의 농도를 증가시킴에 따라 혈액과점도증후군을 초래하거나 신장에 손상을 주기도 한다.
단세포군감마글로불린병증은, 형질세포의 증식에 의해 단세포성 면역글로불린이 분되는 질환이다. 혈액 검사에서 감마 항체가 한 종류만(단세포성) 증가하는 상황을 의미할 수 있으며, M-단백이 혈청 혹은 소변에서 검출되지만, 다발성 골수종의 증상이 없고 자가면역 질환이나 감염과 연관되지 않은 경우이다. 이러한 단세포군감마글로불린병증은 다발성 골수종으로 진행될 수 있어 주의가 필요할 수 있다.
이러한, 다발성 골수종 및 단세포군감마글러불린병증을 진단하기 위해서는 혈청 단백 전기영동 기법 및 면역고정법 등을 통한 진단이 필수적이다. 구체적으로, 혈청 단백 전기영동 기법은, 혈청 또는 소변에 고농도로 존재하는 알부민과 여러 개별 단백질을 분리하여 특징적인 패턴과 개별 단백질의 농도 증감을 간접적으로 파악하게 해주는 검사 방법이다. 예컨대, 혈청 또는 소변에 대한 전기 영동을 통해 알부민, 알파 1 글로불린, 알파 2 글로불린, 베타 글로불린, 감마 글로불린 등 다섯 개의 주요 분획으로 분리된 그래프 이미지 데이터가 획득될 수 있으며, 해당 이미지에서 알부민 및 글로불린들의 패턴과 농도 증감에 기반하여 검사자(즉, 전문의)가 해당 사용자의 질환 여부를 판독할 수 있다.
다만, 검사자 개개인의 숙련도가 상이함에 따라 상이한 판독 결과를 가져오거나 또는 검사의 정확도가 다소 결여되는 등 판독의 표준화가 어려울 수 있다. 또한, 신증후군, 간경병증, 단백질 소실 장질환, 저감마글로불린혈등 등의 일부 질환에서도 알부민 또는 각 글로불린이 특이 패턴을 보여 진단에 이용될 수 있지만, 정확한 정량이나 진단 기준이 명확히 밝혀지지 않아 임상적 활용도가 높지 않은 편이다.
이에 따라, 인공 신경망을 활용하여 단백 전기영동 기법을 통해 획득된 그래프 이미지에 대응하여 형질세포골수종과 단세포감마들로불린병증에 관련한 표준화된 진단 정보를 제공하며, 추가적으로 상기 진단 정보 이외에 신장 질환, 간 질환, 저감마글로불린혈증, 감염 질환 및 염증 질환 등에 관련한 추가 진단 정보를 제공하기 위한 컴퓨터 프로그램에 대한 수요가 당 업계에 존재할 수 있다.
공개특허공보 제2003-0020208호(2003.03.08)
본 개시가 해결하고자 하는 과제는 상술한 문제점을 해결하기 위한 것으로서, 단백 전기영동 기법을 통해 획득된 검진 정보에 대응하여 형질세포골수종 및 단세포감마글로불린병증 등의 질환에 관련하여 표준화 및 신뢰성을 가진 진단 정보를 제공하는 것이다.
본 개시가 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 과제를 해결하기 위한 본 개시의 다양한 실시예에 따른 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은, 하나 이상의 프로세서에서 실행되는 경우, 상기 하나 이상의 프로세서로 하여금 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 이하의 동작들을 수행하도록 하며, 상기 동작들은: 복수의 학습 데이터로 구성된 학습 데이터 세트를 수신하는 동작, 학습 데이터 세트에 대한 전처리를 수행하여 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하는 동작, 상기 제 1 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 1 신경망 모델을 생성하는 동작, 상기 제 2 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 2 신경망 모델을 생성하는 동작 및 상기 제 1 신경망 모델 및 상기 제 2 신경망 모델을 통합하여 통합 모델을 생성하는 동작을 포함할 수 있다.
대안적인 실시예에서, 상기 학습 데이터 세트는, 복수의 사용자 각각의 혈청에 대응하는 혈청 단백 전기영동 기법 및 면역고정법 중 적어도 하나에 관련한 검진 정보들로 구성된 학습 입력 데이터 세트 및 상기 복수의 사용자 각각의 진단 정보들로 구성된 학습 출력 데이터 세트를 포함하며, 상기 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하는 동작은, 상기 학습 입력 데이터 세트에서 복수의 이미지 데이터를 식별하여 제 1 학습 입력 데이터 세트를 구축하고, 상기 복수의 이미지 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 1 학습 출력 데이터 세트를 구축하는 동작 및 상기 학습 입력 데이터 세트에서 복수의 수치(numeric) 데이터를 식별하여 제 1 학습 입력 데이터 세트를 구축하고, 상기 복수의 수치 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 2 학습 출력 데이터 세트를 구축하는 동작을 포함할 수 있다.
대안적인 실시예에서, 상기 이미지 데이터는, 단백질 함량 및 이동성에 관련한 2차원 그래프에 관한 이미지 데이터이며, 상기 이동성을 기준으로 하나 이상의 구획으로 분리된 알부민 및 하나 이상의 글로불린에 관련한 그래프 이미지 데이터를 포함하며, 상기 수치 데이터는, 상기 알부민 및 하나 이상의 글로불린 각각의 단백질 함량에 관한 수치 데이터를 포함할 수 있다.
대안적인 실시예에서, 상기 제 1 신경망 모델은, 이미지 데이터를 입력으로 하여 제 1 진단 정보를 출력하는 컨볼루션 뉴럴 네트워크(CNN, Convolutional Neural Networks)로 구성되며, 상기 컨볼루션 뉴럴 네트워크는, 상기 이미지 데이터의 피처와 하나 이상의 컨볼루션 필터 각각을 통한 컨볼루션 동작을 통해 샘플링 피처맵 세트를 생성하는 하나 이상의 컨볼루션 레이어(Convolution layer), 상기 샘플링 피처맵 세트에 대한 풀링 동작에 기초하여 풀링 피처맵 세트를 생성하는 하나 이상의 풀링 레이어(Pooling layer)를 포함할 수 있다.
대안적인 실시예에서, 상기 컨볼루션 뉴럴 네트워크는, 제 1 학습 입력 데이터가 입력되는 경우, 상기 제 1 학습 입력 데이터에 대응하는 제 1 학습 출력 데이터에 관련한 분류를 수행하도록 상기 하나 이상의 컨볼루션 필터를 조정함으로써 학습될 수 있다.
대안적인 실시예에서, 상기 제 2 신경망 모델은, 수치 데이터를 입력으로 하여 제 2 진단 정보를 출력하는 다층 퍼셉트론(MLP, Multi-Layer Perceptron)으로 구성되며, 상기 다층 퍼셉트론은, 입력 레이어, 하나 이상의 히든 레이어 및 출력 레이어 중 적어도 하나를 포함하며, 상기 입력 레이어는 하나 이상의 입력 노드를 포함하며, 상기 하나 이상의 히든 레이어는 각각 하나 이상의 히든 노드를 포함하고, 상기 출력 레이어는 하나 이상의 출력 노드를 포함하고, 각 레이어에 포함된 각각의 노드는 다른 레이어의 하나 이상의 노드와 링크를 통해 각각 연결되며, 상기 각각의 링크는 가중치가 설정될 수 있다.
대안적인 실시예에서, 상기 다층 퍼셉트론은, 상기 입력 레이어에 제 2 학습 입력 데이터가 입력되는 경우, 상기 하나 이상의 히든 레이어를 거쳐 상기 출력 레이어를 통해 학습 결과 데이터를 출력하도록 하며, 출력된 상기 학습 결과 데이터와 제 2 학습 출력 데이터를 비교하여 오차를 도출하고, 도출된 오차에 기초하여 각 링크의 가중치를 업데이트함으로써 학습될 수 있다.
대안적인 실시예에서, 상기 통합 모델은, 상기 제 1 신경망 모델과 상기 제 2 신경망 모델의 출력의 앙상블을 통해 통합되며, 사용자의 검진 정보를 입력으로 하여 통합 진단 정보를 생성하고, 상기 통합 진단 정보는, 단세포군감마글로불린병증 및 형질세포골수종 중 적어도 하나에 관련한 제 1 진단 정보 및 신장 질환, 간 질환, 저감마글로불린혈증, 감염 질환 및 염증 질환에 관련한 제 2 진단 정보 중 적어도 하나를 포함할 수 있다.
대안적인 실시예에서, 상기 통합 모델에 사용자의 입력 정보를 입력으로 처리하여 통합 진단 정보를 생성하는 동작을 더 포함할 수 있다.
본 개시의 다른 실시예에 따르면, 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 방법이 개시된다. 상기 방법은, 상기 프로세서가 복수의 학습 데이터로 구성된 학습 데이터 세트를 수신하는 단계, 상기 프로세서가 상기 학습 데이터 세트에 대한 전처리를 수행하여 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하는 단계, 상기 프로세서가 상기 제 1 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 1 신경망 모델을 생성하는 단계, 상기 프로세서가 상기 제 2 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 2 신경망 모델을 생성하는 단계 및 상기 프로세서가 상기 제 1 신경망 모델 및 상기 제 2 신경망 모델을 통합하여 통합 모델을 생성하는 단계를 포함할 수 있다.
본 개시의 또 다른 실시예에 따르면, 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨팅 장치가 개시된다, 상기 컴퓨팅 장치는 하나 이상의 코어를 포함하는 프로세서, 상기 프로세서에서 실행가능한 프로그램 코드들을 저장하는 메모리 및 사용자 단말 및 외부 서버와 데이터를 송수신하는 네트워크부를 포함하고, 상기 프로세서는, 복수의 학습 데이터로 구성된 학습 데이터 세트를 수신하고, 상기 학습 데이터 세트에 대한 전처리를 수행하여 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하고, 상기 제 1 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 1 신경망 모델을 생성하고, 상기 제 2 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 2 신경망 모델을 생성하고, 그리고 상기 제 1 신경망 모델 및 상기 제 2 신경망 모델을 통합하여 통합 모델을 생성할 수 있다.
본 개시의 다양한 실시예에 따라, 혈질세포공수종 및 단세포감마글로불린병증 진단에 있어, 인공 신경망을 활용하여 진단적 민감도를 향상시키고, 판독의 표준화를 제시할 수 있다. 또한, 진단에 걸리는 소요 시간을 감소시킬 수 있으며, 신질환, 간질환, 감염 질환 및 염증 질환 등 추가적인 진단 정보를 제공할 수 있다.
본 개시의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
다양한 양상들이 이제 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 구체적인 세부사항들 없이 실시될 수 있음은 명백할 것이다.
도 1은 본 개시의 일 실시예와 관련된 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨팅 장치의 다양한 양태가 구현될 수 있는 시스템을 나타낸 개념도를 도시한다.
도 2는 본 개시의 일 실시예와 관련한 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨팅 장치의 블록 구성도를 도시한다.
도 3은 본 개시의 일 실시예와 관련한 혈청 단백 전기영동 및 면역고정법을 통해 획득된 이미지 데이터에 대한 예시도를 도시한다.
도 4는 본 개시의 일 실시예와 관련한 제 1 신경망 모델의 학습 과정을 설명하기 위한 예시도를 도시한다.
도 5는 본 개시의 일 실시예와 관련한 제 2 신경망 모델의 학습 과정을 설명하기 위한 예시도를 도시한다.
도 6은 본 개시의 일 실시예와 관련한 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하는 방법을 예시적으로 도시한 순서도이다.
다양한 실시예들이 이제 도면을 참조하여 설명된다. 본 명세서에서, 다양한 설명들이 본 개시의 이해를 제공하기 위해서 제시된다. 그러나, 이러한 실시예들은 이러한 구체적인 설명 없이도 실행될 수 있음이 명백하다.
본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭한다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정(procedure), 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있다. 일 컴포넌트는 하나의 컴퓨터 내에 로컬화 될 수 있다. 일 컴포넌트는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터의 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통해 전송되는 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하는 것으로 이해되어야 한다. 다만, "포함한다" 및/또는 "포함하는"이라는 용어는, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시 적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있다. 다만, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다.
제시된 실시예들에 대한 설명은 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 개시를 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이다. 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 개시는 여기에 제시된 실시예들로 한정되는 것이 아니다. 본 개시는 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.
본 명세서에서, 컴퓨터는 적어도 하나의 프로세서를 포함하는 모든 종류의 하드웨어 장치를 의미하는 것이고, 실시 예에 따라 해당 하드웨어 장치에서 동작하는 소프트웨어적 구성도 포괄하는 의미로서 이해될 수 있다. 예를 들어, 컴퓨터는 스마트폰, 태블릿 PC, 데스크톱, 노트북 및 각 장치에서 구동되는 사용자 클라이언트 및 애플리케이션을 모두 포함하는 의미로서 이해될 수 있으며, 또한 이에 제한되는 것은 아니다.
이하, 첨부된 도면을 참조하여 본 개시의 실시예를 상세하게 설명한다.
본 명세서에서 설명되는 각 단계들은 컴퓨터에 의하여 수행되는 것으로 설명되나, 각 단계의 주체는 이에 제한되는 것은 아니며, 실시 예에 따라 각 단계들의 적어도 일부가 서로 다른 장치에서 수행될 수도 있다.
도 1은 본 개시의 일 실시예와 관련된 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨팅 장치의 다양한 양태가 구현될 수 있는 시스템을 나타낸 개념도를 도시한다.
본 개시의 실시예들에 따른 시스템 컴퓨팅 장치(100), 사용자 단말(10), 외부 서버(20) 및 네트워크를 포함할 수 있다. 도 1에서 도시되는 컴포넌트들은 예시적인 것으로서, 추가적인 컴포넌트들이 존재하거나 또는 도 1에서 도시되는 컴포넌트들 중 일부는 생략될 수 있다. 본 개시의 실시예들에 따른 컴퓨팅 장치(100), 사용자 단말(10) 및 외부 서버(20)는 네트워크를 통해, 본 개시의 일 실시예들에 따른 시스템을 위한 데이터를 상호 송수신할 수 있다.
본 개시의 실시예들에 따른 네트워크는 공중전화 교환망(PSTN: Public Switched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다.
또한, 여기서 제시되는 네트워크는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다.
본 개시의 실시예들에 따른 네트워크는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN: Personal Area Network), 근거리 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 상기 네트워크는 공지의 월드와이드웹(WWW: World Wide Web)일 수 있으며, 적외선(IrDA: Infrared Data Association) 또는 블루투스(Bluetooth)와 같이 단거리 통신에 이용되는 무선 전송 기술을 이용할 수도 있다. 본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.
본 개시의 일 실시예에 따르면, 사용자 단말(10)은 컴퓨팅 장치(100)에 엑세스하여 자신의 다발성 골수종 또는 단세포군감마글로불린병증 등에 대한 진단 정보를 획득하고자 하는 사용자와 관련된 단말일 수 있다. 또한, 사용자 단말(10)은 검진 결과를 사용자(예컨대, 검진자)에게 제공하는 검사자(예컨대, 전문의)와 관련한 단말일 수 있다. 사용자 단말(10)이 검진자에게 검진 결과를 제공하는 검사자에 관련한 단말인 경우, 컴퓨팅 장치(100)로부터 수신한 진단 정보는 검사자의 검진 결과 판독을 위한 의료 보조 단말로 활용될 수 있다. 이러한 사용자 단말(10)은 디스플레이를 구비하고 있어서, 사용자의 입력을 수신하고, 사용자에게 임의의 형태의 출력을 제공할 수 있다.
사용자 단말(10)은 컴퓨팅 장치(100)와 통신을 위한 메커니즘을 갖는 시스템에서의 임의의 형태의 엔티티(들)를 의미할 수 있다. 예를 들어, 이러한 사용자 단말(10)은 PC(personal computer), 노트북(note book), 모바일 단말기(mobile terminal), 스마트 폰(smart phone), 태블릿 PC(tablet pc) 및 웨어러블 디바이스(wearable device) 등을 포함할 수 있으며, 유/무선 네트워크에 접속할 수 있는 모든 종류의 단말을 포함할 수 있다. 또한, 사용자 단말(10)은 에이전트, API(Application Programming Interface) 및 플러그-인(Plug-in) 중 적어도 하나에 의해 구현되는 임의의 서버를 포함할 수도 있다. 또한, 사용자 단말(10)은 애플리케이션 소스 및/또는 클라이언트 애플리케이션을 포함할 수 있다.
도 1에서 사용자 단말(10) 및 컴퓨팅 장치(100)가 별도의 엔티티로서 분리되어 표현되었지만, 본 개시내용의 다양한 구현 양태에 따라서 사용자 단말(10)이 컴퓨팅 장치(100) 내에 포함되어 사용자의 검진 정보에 대응하는 진단 정보 제공 기능이 통합되어 수행될 수도 있다.
본 개시의 일 실시예에 따르면, 외부 서버(20)는 전자건강기록 및 전자의료 기록에 대한 정보 등을 포함하는 검진 정보를 저장하는 병원 서버 또는 정부 서버일 수 있다. 검진 정보는 예를 들어, 혈청 단백 전기영동 기법 또는 면역고정법에 관련한 검진 정보 및 다발성 골수종, 단세포군감마글로불린병증, 신증후군, 간경변증, 단백질 소실 장질환, 저감마글로불린형증 등의 질환에 관련한 진단 정보를 포함할 수 있다. 외부 서버(20)에 저장된 정보들은 본 개시에서의 신경망을 학습시키기 위한 학습 데이터, 검증 데이터 및 테스트 데이터로 활용될 수 있다. 즉, 외부 서버(20)는 본 개시의 딥러닝 모델을 학습시키기 위한 데이터 세트를 저장하고 있는 서버일 수 있다.
외부 서버(20)는 디지털 기기로서, 랩탑 컴퓨터, 노트북 컴퓨터, 데스크톱 컴퓨터, 웹 패드, 이동 전화기와 같이 프로세서를 탑재하고 메모리를 구비한 연산 능력을 갖춘 디지털 기기일 수 있다. 외부 서버(20)는 서비스를 처리하는 웹 서버일 수 있다. 전술한 서버의 종류는 예시일 뿐이며 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 사용자의 검진 정보에 대응하는 진단 정보를 제공할 수 있다. 일 실시예에서, 검진 정보는, 사용자(또는, 검진자)의 혈청 또는 소변에 대한 전기 영동 기법 또는 면역고정법을 통해 획득되는 정보들을 포함할 수 있다. 예컨대, 검진 정보는, 특정 사용자의 혈청에 대한 단백 전기 영동 기법을 통해 획득되는 그래프 이미지 데이터 또는, 개별 단백(즉, 알부민 및 복수의 글로불린)의 농도 증감 등에 관련한 수치화 정보를 포함할 수 있다. 또한, 진단 정보는, 사용자의 혈청을 통해 획득되는 정보들(예컨대, 그래프 이미지 데이터, 또는 개별 단백의 수치 데이터 등)에 기반하여 검사자가 판독한 진단 결과에 대한 정보를 포함할 수 있다.
일반적으로, 다발성 골수종 또는 단세포군감마글로불린병증을 진단하기 위해서는, 혈청 단백 전기영동 기법 또는 면역고정법을 통해 사용자의 혈청에 존재하는 알부민과 여러 개별 단백질을 분리하고, 특징적인 패턴과 개별 단백질의 농도 증감에 기반한 검사자의 판독 과정을 거칠 수 있다. 예를 들어, 혈청 단백 전기영동을 통해 알부민, 알파 1 글로불린, 알파 2 글로불린, 베타 글로불린 및 감마 글로불린으로 분리될 수 있다. 예컨대, 감마 글로불린의 단백 농도가 알부민의 단백 농도 보다 높은 경우, 검사자는 해당 사용자가 다발성 골수종에 관련한 질환을 가진것으로 판독할 수 있다. 또한, 예를 들어, 알부민 및 감마 글로불린의 단백 농도가 일반적인 정상 수치보다 낮으며, 알파 2 글로불린의 단백 농도가 일반적인 정상 수치보다 높은 경우, 검사자는 해당 사용자에 신증후군에 관련한 질환을 가진것으로 판독할 수 있다. 전술한 진단 정보를 생성 및 판독하는 과정에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다. 즉, 검사자는 각 단백 그룹의 패턴에 기반하여 진단을 위한 판독을 수행할 수 있다.
전기영동이란 전하를 띤 물질, 즉 하전입자들에 직류 전압을 가해주어 정의 입자는 음극으로 부의 입자는 양극으로 이동시키는 것을 의미할 수 있다. 이 경우, 이동하는 하전입자 사이에서 이동속도가 다른 성분은 점차 분리되어짐에 따라 알부민 또는 개별 단백질로 분리되어 질 수 있다. 이러한 혈청 단백 전기영동 기법은, 알부민 및 개별 단백질들에 관련한 그래프의 패턴 또는 증감에 기반하여 검사자가 판독하는 것으로, 구체적인 표준화가 어려움에 따라, 검사자(또는 판독자)의 숙련도가 검사의 정확도에 미치는 영향이 높은 검사일 수 있다.
본 개시의 컴퓨팅 장치(100)는 복수의 학습 검진 정보 및 복수의 학습 진단 정보로 구성된 학습 데이터 세트에 기초하여 하나 이상의 네트워크 함수로 구성된 신경망 모델을 학습시킴으로써, 검진 정보에 대응하는 진단 정보를 출력하기 위한 신경망 모델을 생성할 수 있다. 즉, 본 개시의 신경망 모델은 혈청 단백 전기영동 기법 또는 면역고정법을 통해 획득된 이미지 데이터 및 알부민과 개별 단백질들의 농도에 관련한 수치적 데이터에 대응하는 진단 정보를 제공할 수 있다. 이 경우, 진단 정보는, 다발성 골수종, 단세포군감마글로불린병증, 신장 질환, 간 질환, 저감마글로불린혈등, 감염 질환 및 염증 질환에 관련한 정보를 포함할 수 있다.
즉, 컴퓨팅 장치(100)는 혈청 단백 전기영동 및 면역고정법을 통한 진단에 있어, 인공 신경망을 활용함으로써 진단적 민감도를 향상시킬 수 있으며, 판독의 표준화를 제시할 수 있다. 또한, 컴퓨팅 장치(100)는 진단에 걸리는 소요 시간을 감소시킬 수 있으며, 혈청 단백 전기영동 및 면역고정법을 통해 획득된 데이터와 다른 기타 질환들 간의 상관관계를 분석하여 유미의한 진단 정보를 제공할 수 있다.
일 실시예에서, 컴퓨팅 장치(100)는 단말 또는 서버일 수 있으며, 임의의 형태의 장치는 모두 포함할 수 있다. 컴퓨팅 장치(100)는 디지털 기기로서, 랩탑 컴퓨터, 노트북 컴퓨터, 데스크톱 컴퓨터, 웹 패드, 이동 전화기와 같이 프로세서를 탑재하고 메모리를 구비한 연산 능력을 갖춘 디지털 기기일 수 있다. 컴퓨팅 장치(100)는 서비스를 처리하는 웹 서버일 수 있다. 전술한 서버의 종류는 예시일 뿐이며 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 클라우드 컴퓨팅 서비스를 제공하는 서버일 수 있다. 보다 구체적으로, 컴퓨팅 장치(100)는 인터넷 기반 컴퓨팅의 일종으로 정보를 사용자의 컴퓨터가 아닌 인터넷에 연결된 다른 컴퓨터로 처리하는 클라우드 컴퓨팅 서비스를 제공하는 서버일 수 있다. 상기 클라우드 컴퓨팅 서비스는 인터넷 상에 자료를 저장해 두고, 사용자가 필요한 자료나 프로그램을 자신의 컴퓨터에 설치하지 않고도 인터넷 접속을 통해 언제 어디서나 이용할 수 있는 서비스일 수 있으며, 인터넷 상에 저장된 자료들을 간단한 조작 및 클릭으로 쉽게 공유하고 전달할 수 있다. 또한, 클라우드 컴퓨팅 서비스는 인터넷 상의 서버에 단순히 자료를 저장하는 것뿐만 아니라, 별도로 프로그램을 설치하지 않아도 웹에서 제공하는 응용프로그램의 기능을 이용하여 원하는 작업을 수행할 수 있으며, 여러 사람이 동시에 문서를 공유하면서 작업을 진행할 수 있는 서비스일 수 있다. 또한, 클라우드 컴퓨팅 서비스는 IaaS(Infrastructure as a Service), PaaS(Platform as a Service), SaaS(Software as a Service), 가상 머신 기반 클라우드 서버 및 컨테이너 기반 클라우드 서버 중 적어도 하나의 형태로 구현될 수 있다. 즉, 본 개시의 컴퓨팅 장치(100)는 상술한 클라우드 컴퓨팅 서비스 중 적어도 하나의 형태로 구현될 수 있다. 전술한 클라우드 컴퓨팅 서비스의 구체적인 기재는 예시일 뿐, 본 개시의 클라우드 컴퓨팅 환경을 구축하는 임의의 플랫폼을 포함할 수도 있다.
이하에서는, 도 2를 참조하여 컴퓨팅 장치(100)가 학습 데이터 세트에 기반하여 신경망 모델을 생성하는 방법 및 신경망을 활용하여 검진 정보에 대응하는 진단 정보를 제공하는 방법에 대하여 보다 구체적으로 후술하도록 한다.
도 2는 본 개시의 일 실시예와 관련한 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨팅 장치의 블록 구성도를 도시한다.
도 2에 도시된 바와 같이, 컴퓨팅 장치(100)는 네트워크부(110), 메모리(120) 및 프로세서(130)를 포함할 수 있다. 전술한 컴퓨팅 장치(100)에 포함된 컴포넌트들은 예시적인 것으로 본 개시내용의 권리범위가 전술한 컴포넌트들로 제한되지 않는다. 즉, 본 개시내용의 실시예들에 대한 구현 양태에 따라서 추가적인 컴포넌트들이 포함되거나 또는 전술한 컴포넌트들 중 일부가 생략될 수 있다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 사용자 단말(10) 및 외부 서버(20)와 데이터를 송수신하는 네트워크부(110)를 포함할 수 있다. 네트워크부(110)는 본 개시의 일 실시예에 따른 사용자의 검진 정보에 기반하여 진단 정보를 제공하는 방법을 수행하기 위한 데이터 등 및 신경망 모델을 학습시키기 위한 학습 데이터 세트 등을 다른 컴퓨팅 장치, 서버 등과 송수신할 수 있다. 즉, 네트워크부(110)는 컴퓨팅 장치(100)와 사용자 단말(10) 및 외부 서버(20) 간의 통신 기능을 제공할 수 있다. 예를 들어, 네트워크부(110)는 단백 전기영동 기법을 통해 획득된 이미지 데이터를 수신할 수 있다. 다른 예를 들어, 네트워크부(110)는 외부 서버(20)로부터 신경망 모델의 학습을 위한 학습 데이터 세트를 수신할 수 있다. 추가적으로, 네트워크부(110)는 컴퓨팅 장치(100)로 프로시저를 호출하는 방식으로 컴퓨팅 장치(100)와 사용자 단말(10) 및 외부 서버(20) 간의 정보 전달을 허용할 수 있다.
본 개시의 일 실시예에 따른 네트워크부(110)는 공중전화 교환망(PSTN: Public Switched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다.
또한, 본 명세서에서 제시되는 네트워크부(110)는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다.
본 개시에서 네트워크부(110)는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN: Personal Area Network), 근거리 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 상기 네트워크는 공지의 월드와이드웹(WWW: World Wide Web)일 수 있으며, 적외선(IrDA: Infrared Data Association) 또는 블루투스(Bluetooth)와 같이 단거리 통신에 이용되는 무선 전송 기술을 이용할 수도 있다. 본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.
본 개시의 일 실시예에 따르면, 메모리(120)는 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하는 방법을 수행하기 위한 컴퓨터 프로그램을 저장할 수 있으며, 저장된 컴퓨터 프로그램은 프로세서(130)에 의하여 판독되어 구동될 수 있다. 또한, 메모리(120)는 프로세서(130)가 생성하거나 결정한 임의의 형태의 정보 및 네트워크부(110)가 수신한 임의의 형태의 정보를 저장할 수 있다. 또한, 메모리(120)는 사용자의 검진 및 진단에 관련한 정보들을 저장할 수 있다. 예를 들어, 메모리(120)는 입/출력되는 데이터들(예를 들어, 혈청 단백 전기영동 기법을 통해 획득한 사용자의 검진 정보, 신경망 학습을 위한 학습 데이터, 사용자의 검진 정보에 대응하는 진단 정보 등)을 임시 또는 영구 저장할 수도 있다.
본 개시의 일 실시예에 따르면, 메모리(120)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 컴퓨팅 장치(100)는 인터넷(internet) 상에서 상기 메모리(120)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다. 전술한 메모리에 대한 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 하나 이상의 코어로 구성될 수 있으며, 컴퓨팅 장치의 중앙 처리 장치(CPU: central processing unit), 범용 그래픽 처리 장치 (GPGPU: general purpose graphics processing unit), 텐서 처리 장치(TPU: tensor processing unit) 등의 데이터 분석, 딥러닝을 위한 프로세서를 포함할 수 있다.
프로세서(130)는 메모리(120)에 저장된 컴퓨터 프로그램을 판독하여 본 개시의 일 실시예에 따른 기계 학습을 위한 데이터 처리를 수행할 수 있다. 본 개시의 일 실시예에 따라 프로세서(130)는 신경망의 학습을 위한 연산을 수행할 수 있다. 프로세서(130)는 딥러닝(DL: deep learning)에서 학습을 위한 입력 데이터의 처리, 입력 데이터에서의 피처 추출, 오차 계산, 역전파(backpropagation)를 이용한 신경망의 가중치 업데이트 등의 신경망의 학습을 위한 계산을 수행할 수 있다.
또한, 프로세서(130)의 CPU, GPGPU, 및 TPU 중 적어도 하나가 네트워크 함수의 학습을 처리할 수 있다. 예를 들어, CPU 와 GPGPU가 함께 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에서 복수의 컴퓨팅 장치의 프로세서를 함께 사용하여 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에 따른 서버에서 수행되는 컴퓨터 프로그램은 CPU, GPGPU 또는 TPU 실행가능 프로그램일 수 있다.
본 명세서에서 네트워크 함수는 인공 신경망, 뉴럴 네트워크와 상호 교환 가능하게 사용될 수 있다. 본 명세서에서 네트워크 함수는 하나 이상의 뉴럴 네트워크를 포함할 수도 있으며, 이 경우 네트워크 함수의 출력은 하나 이상의 뉴럴 네트워크의 출력의 앙상블(ensemble)일 수 있다.
프로세서(130)는 메모리(120)에 저장된 컴퓨터 프로그램을 판독하여 본 개시의 일 실시예에 따른 신경망 모델을 제공할 수 있다. 본 개시의 일 실시예에 따라, 프로세서(130)는 사용자의 검진 정보에 대응하는 진단 정보를 생성하기 위한 계산을 수행할 수 있다. 본 개시의 일 실시예에 따라 프로세서(130)는 신경망 모델을 학습시키기 위한 계산을 수행할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 통상적으로 컴퓨팅 장치(100)의 전반적인 동작을 처리할 수 있다. 프로세서(130)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(120)에 저장된 응용 프로그램들을 구동함으로써, 사용자 단말(10)에게 적정한 정보 또는, 기능을 제공하거나 처리할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 네트워크부(110)를 통해 복수의 학습 데이터로 구성된 학습 데이터 세트를 수신할 수 있다. 본 개시의 일 실시예에 따른 학습 데이터 세트 수신은, 메모리(120)에 저장된 학습 데이터 세트를 수신하거나, 또는 로딩(loading)하는 것일 수 있다. 학습 데이터 세트의 수신은, 유/무선 통신 수단에 기초하여 다른 저장 매체, 다른 컴퓨팅 장치, 동일한 컴퓨팅 장치 내의 별도 처리 모듈로부터 생체 신호를 수신하거나 또는 로딩하는 것일 수 있다.
학습 데이터 세트는 복수의 사용자 각각의 혈청에 대응하는 혈청 단백 전기영동 기법 및 면역 고정법 중 적어도 하나에 관련한 검진 정보들로 구성된 학습 입력 데이터 세트 및 복수의 사용자 각각의 진단 정보들로 구성된 학습 출력 데이터 세트를 포함할 수 있다. 이러한 학습 데이터 세트는 외부 서버(20)로부터 수신되는 정보일 수 있다. 여기서, 외부 서버(20)는 병원 서버 및 정부 서버 중 적어도 하나의 서버일 수 있으며, 각각의 서버의 전자건강기록, 전자의료기록 및 건강 검진 DB 중 적어도 하나로부터 복수의 사용자 각각의 진료 데이터를 수신할 수 있다. 프로세서(130)는 외부 서버(20)로부터 수신한 복수의 사용자 각각의 진료 데이터에 기초하여 복수의 학습 데이터를 포함하는 학습 데이터 세트를 구축할 수 있다. 학습 데이터 세트는, 신경망의 입력에 관련한 학습 입력 데이터 세트 및 출력과 비교되는 학습 출력 데이터 세트를 포함할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 학습 데이터 세트에 대한 전처리를 수행하여 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성할 수 있다. 프로세서(130)가 수행하는 학습 데이터 세트에 대한 전처리는, 학습 데이터 세트의 구성에 관련한 검진 데이터를 하나 이상의 신경망 모델 각각의 입력에 대응되는 입력 데이터로 가공하기 위한 전처리를 의미할 수 있다.
구체적으로, 프로세서(130)는 학습 입력 데이터 세트에서 이미지에 관련한 데이터를 식별하여 제 1 학습 데이터 세트를 구축할 수 있다. 프로세서(130)는 학습 입력 데이터 세트에서 복수의 이미지 데이터를 식별하여 제 1 학습 입력 데이터 세트를 구축하고, 복수의 이미지 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 1 학습 출력 데이터 세트를 구축할 수 있다. 예를 들어, 프로세서(130)는 A 사용자의 진료 데이터에서 혈청 단백 전기영동 기법을 통해 획득한 제 1 그래프 이미지 데이터를 제 1 학습 입력 데이터로 하고, 해당 A 사용자가 다발성 골수종이라는 검진 결과에 관련한 제 1 진단 정보를 제 1 학습 출력 데이터로 구축할 수 있다. 다른 예를 들어, 프로세서(130)는 B 사용자의 진료 데이터에서 혈청 단백 전기영동 기법을 통해 획득한 제 2 그래프 이미지 데이터를 제 2 학습 입력 데이터로 하고, 해당 B 사용자가 신증후군이라는 검진 결과에 관련한 제 2 진단 정보를 제 2 학습 출력 데이터로 구축할 수 있다. 전술한 각 사용자의 진단 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 제 1 학습 데이터 세트 구축에 대상이 되는 이미지 데이터는 담백질 함량 및 이동성에 관련한 2차원 그래프에 관한 이미지 데이터일 수 있다. 이 경우, 이미지 데이터는 이동성을 기준으로 하나 이상의 구획으로 분리된 알부민 및 글로불린에 관련한 그래프 이미지 데이터를 포함할 수 있다. 일반적으로, 간에서 생성되는 알부민은 혈 중 단백의 약 50~60%를 차지할 수 있으며, 글로불린은, 알부민 이외의 단백을 언급하는 총칭일 수 있다. 예를 들어, 글로불린은, 알파 1 글로불린, 알파 2 글로불린, 베타 글로불린 및 감마 글로불린을 포함할 수 있다. 이러한 단백 그룹들은 상이한 이동성을 가짐에 따라 전기영동 기법에 의해 하나 이상의 분획들로 나뉘고 특징적인 패턴을 형성할 수 있다. 예를 들어, 그래프 이미지 데이터는 이동성에 따른 단백질 함량에 관련한 그래프를 포함할 수 있으며, 해당 그래프 이미지 데이터는 이동성에 기반하여 알부민, 알파 1 글로불린, 알파 2 글로불린, 베타 글로불린 및 감마 글로불린 각각은 5개의 분획으로 구분될 수 있다.
구체적인 예를 들어, 도 3을 참조하면, 사용자의 혈청 또는 소변에 대한 전기영동을 통해 각 단백들은 동적으로 이동할 수 있으며, 각 단백 그룹들의 상이한 이동성에 대응하여 하나 이상의 분획들로 구분될 수 있다. 즉, 도 3의 (a)에 도시된 바와 같이, 각 단백들은 이동도에 따라 각각 알부민, 알파 1 글로불린, 알파 2 글로불린, 베타 글로불린 및 감마 글로불린으로 분획될 수 있다. 또한, 해당 이동도에 기반하여 도 3의 (b)에 도시된 바와 같은 그래프 이미지 데이터(200)가 생성될 수 있다. 이 경우, 그래프 이미지 데이터(200)의 세로축은 단백질 함량에 관련한 것일 수 있으며, 가로축은 각 단백의 이동도에 관련한 것일 수 있다. 이들 패턴들의 변화는 다양한 다른 질환들과 밀접한 연관이 있다.
즉, 본 개시에서 제 1 학습 입력 데이터 구축의 대상이 되는 그래프 이미지 데이터는 담백질 함량 및 이동성에 관련한 2차원 그래프이며, 각 단백 그룹에 대응하여 하나 이상의 분획된 이미지 데이터일 수 있다.
추가적인 실시예에서, 프로세서(130)는 제 1 학습 입력 데이터 세트에 대한 이미지 전처리를 수행할 수 있다. 구체적으로, 프로세서(130)는 제 1 학습 입력 데이터 세트를 구성하는 이미지 데이터에 대한 이미지 전처리를 수행할 수 있다. 이미지 전처리는, 예를 들어, 신경망의 입력에 관련한 그래프 이미지에 대한 보정을 수행하는 것을 의미하는 것으로, 그래프 이미지의 선명도 증가, 대비 전환 등 학습 데이터의 품질을 향상시키는 것을 의미할 수 있다. 즉, 프로세서(130)는 사용자의 검진 정보 중 이미지 데이터에 해당하는 제 1 학습 입력 데이터 세트에 대한 이미지 전처리를 수행하여 해당 학습 데이터를 통해 학습되는 제 1 신경망 모델의 출력 정확도를 향상시킬 수 있다. 따라서, 신경망 모델의 학습 효율 향상을 도모할 수 있다.
또한, 프로세서(130)는 학습 입력 데이터 세트에서 복수의 수치 데이터를 식별하여 제 2 학습 데이터 세트를 구축할 수 있다. 프로세서(130)는 학습 입력 데이터 세트에서 복수의 수치 데이터를 식별하여 제 2 학습 입력 데이터 세트를 구축하고, 복수의 수치 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 2 학습 출력 데이터 세트를 구축할 수 있다. 수치 데이터는, 알부민 및 하나 이상의 글로불린 각각의 단백질 함량에 관한 수치 데이터를 포함할 수 있다. 예를 들어, 수치 데이터는, 알부민, 알파 1 글로불린, 알파 2 글로불린, 베타 글로불린 및 감마 글로불린 각각의 단백질 함량에 대한 정보가 52%, 8%, 10.9%, 14% 및 15.1%라는 정보를 포함할 수 있다. 전술한 수치 데이터에 대한 구체적인 수치적 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
예를 들어, 프로세서(130)는 C 사용자의 진료 데이터에서 혈청 단백 전기영동 기법을 통해 획득한 제 1 수치 데이터를 제 1 학습 입력 데이터로 하고, 해당 C 사용자가 감염 질환이라는 검진 결과에 관련한 제 1 진단 정보를 제 1 학습 출력 데이터로 구축할 수 있다. 다른 예를 들어, 프로세서(130)는 D 사용자의 진료 데이터에서 혈청 단백 전기영동 기법을 통해 획득한 제 2 수치 데이터를 제 2 학습 입력 데이터로 하고, 해당 D 사용자가 간질환이라는 검진 결과에 관련한 제 2 진단 정보를 제 2 학습 출력 데이터로 구축할 수 있다. 전술한 각 사용자의 진단 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 제 1 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 1 신경망 모델을 생성할 수 있다.
제 1 신경망 모델은 이미지 데이터에 대응하는 분류를 수행하기 위한 신경망 모델일 수 있다. 제 1 신경망 모델은 이미지 데이터에 대응하여 스코어를 산출하고, 해당 스코어에 기초하여 이미지 데이터에 대한 분류를 수행할 수 있다. 여기서 분류는, 해당 이미지 데이터를 복수의 진단명(예컨대, 다발성 골수종, 단세포군감마글로불린병증, 신 질환, 간 질환, 감염 질환, 또는 염증 질환 등) 중 적어도 하나로 분류하는 것을 의미할 수 있다.
예컨대, 제 1 신경망 모델은 입력에 관련한 이미지 데이터와 특정 진단 정보 간의 매칭 유사도가 높은 경우, 높은 매칭 스코어를 산출하고, 매칭 유사도가 낮은 경우, 낮은 매칭 스코어를 산출하도록 학습된 신경망 모델일 수 있다.
제 1 신경망 모델은 이미지 데이터를 입력으로 하여 제 1 진단 정보를 출력하는 컨볼루션 뉴럴 네트워크로 구성될 수 있다. 컨볼루션 뉴럴 네트워크는 이미지 데이터의 피처와 하나 이상의 컨볼루션 필터 각각을 통한 컨볼루션 동작을 통해 샘플링 피처맵 세트를 생성하는 하나 이상의 컨볼루션 레이어를 포함할 수 있다. 또한, 컨볼루션 뉴럴 네트워크는 샘플링 피처맵 세트에 대한 풀링 동작에 기초하여 풀링 피처맵 세트를 생성하는 하나 이상의 풀링 레이어를 포함할 수 있다.
도 4를 참조하여 자세히 설명하면, 컨볼루션 뉴럴 네트워크(300)는 컨볼루션 레이어를 통해 이미지 데이터(310)의 피처와 하나 이상의 컨볼루션 필터 각각의 컨볼루션 동작을 통해 샘플링 피처맵 세트(320)를 생성할 수 있다. 하나 이상의 컨볼루션 필터는, 이미지 피처와의 컨볼루션을 수행하기 위한 하나 이상의 필터(또는, 커널(kermel))를 의미할 수 있다. 예를 들어, 이미지 피처와 제 1 컨볼루션 필터와의 컨볼루션 수행 결과 제 1 샘플링 피처맵이 생성될 수 있으며, 이미지 피처와 제 2 컨볼루션 필터와의 컨볼루션 수행 결과 제 2 샘플링 피처맵이 생성될 수 있다. 이 경우, 제 1 샘플링 피처맵 및 제 2 샘플링 피처맵은 샘플링 피처맵 세트(320)를 구성할 수 있다. 전술한 컨볼루션 필터 및 샘플링 피처맵에 대한 구체적인 기재는 예시일 분, 본 개시는 이에 제한되지 않는다.
즉, 샘플링 피처맵 세트(320)에 포함된 샘플링 피처맵의 수(즉, 피처맵의 채널 수)는 이미지 피처와 컨볼루션을 수행하는 하나 이상의 컨볼루션 필터의 수에 대응될 수 있다. 예컨대, 이미지 데이터의 피터와 컨볼루션 동작을 수행하는 컨볼루션 필터의 수가 10개인 경우, 10개의 샘플링 피처맵이 생성되어 샘플링 피처맵 세트를 형성할 수 있다.
또한, 컨볼루션 뉴럴 네트워크(300)는 풀링 레이어를 통해 샘플링 피처맵 세트(320)에 대한 풀링 동작을 수행하여 풀링 피처맵 세트(330)를 생성할 수 있다. 제 1 신경망 모델에 포함된 풀링 레이어에서 수행되는 풀링 동작은, Max 풀링 또는 Average 풀링 기반의 풀링 동작을 포함할 수 있다. 예를 들어, 제 1 신경망 모델의 풀링 레이어가 Max 풀링을 통해 구성되는 경우, 특정 커널 사이즈에 포함된 레코드들 중 최대값의 레코드만을 피처로 추출하여 풀링 피처맵 세트를 생성할 수 있다. 구체적으로, 제 1 피처맵에 stride 2를 적용하여 Max 풀링의 2x2커널을 적용하는 경우, 제 1 피처맵에서 해당 커널 사이즈에 대응하는 4개의 레코드 중 최대값인 하나의 피처만을 추출하여 풀링 피처맵 세트(330)를 생성할 수 있다. 이에 따라, 전체 데이터의 사이즈가 줄어들 수 있어 연산을 위한 컴퓨팅 리소스가 최소화될 수 있다. 또한, 데이터의 크기를 줄이면서 소실이 발생하기 때문에 오비피팅을 방지할 수 있다. 또한, 컨볼루션 뉴럴 네트워크(300)는 풀링 레이어를 거쳐 생성된 풀링 피처맵 세트(330)를 풀리 커넥티드 레이어로 처리하여 복수의 매칭 스코어를 출력할 수 있다. 프로세서(130)는 제 1 신경망 모델의 출력에 관련한 매칭 스코어에 기초하여 진단 정보를 생성할 수 있다.
또한, 프로세서(130)는 컨볼루션 뉴럴 네트워크(300)의 출력에 관련한 매칭 스코어에 기초하여 분류를 수행하여 예측 진단 정보를 생성하고, 생성된 예측 진단 정보와 학습 출력 데이터를 비교하여 오차를 도출하고, 해당 오차에 기반하여 컨볼루션 뉴럴 네트워크(300)를 학습시킬 수 있다. 즉, 제 1 신경망 모델을 구성하는 컨볼루션 뉴럴 네트워크는 제 1 학습 입력 데이터가 입력되는 경우, 제 1 학습 입력 데이터에 대응하는 제 1 학습 출력 데이터에 관련한 분류를 수행하도록 하나 이상의 컨볼루션 필터를 조정함으로써, 학습될 수 있다.
도 4를 참조하여 전술한 제 1 신경망 모델을 구성하는 각 레이어들의 동작 방법 및 레이어 각각의 수에 대한 구체적인 기재들은 예시일 뿐, 본 개의 제 1 신경망 모델에 포함된 각 레이어들은 복수 개로 존재할 수 있으며, 각 레이어에서의 채널의 크기 및 개수가 전술한 기재로 제한되지 않음이 당 업계의 통상의 기술자에게 명백할 것이다.
즉, 컨볼루션 뉴럴 네트워크로 구성된 하나 이상의 네트워크 함수를 포함하는 제 1 신경망 모델은 전술한 과정을 거쳐 제 1 학습 데이터 세트를 통해 학습됨에 따라, 사용자의 검진 정보에 관련한 이미지 데이터를 입력으로 하여, 해당 이미지 데이터에 대응하는 진단 정보를 출력할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 제 2 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 2 신경망 모델을 생성할 수 있다. 제 2 신경망 모델은 수치 데이터를 입력으로 하여 제 2 진단 정보를 출력하는 다층 퍼셉트론으로 구성될 수 있다.
다층 퍼셉트론은 입력 레이어, 하나 이상의 히든 레이어 및 출력 레이어 중 적어도 하나를 포함할 수 있다. 입력 레이어는 하나 이상의 입력 노드를 포함하며, 하나 이상의 히든 레이어는 각각 하나 이상의 히든 노드를 포함하고, 출력 레이어는 하나 이상의 출력 노드를 포함하고, 각 레이어에 포함된 각각의 노드는 다른 레이어의 하나 이상의 노드와 링크를 통해 각각 연결되며, 각각의 링크는 가중치가 설정될 수 있다.
다츨 퍼셉트론은 입력 레이어에 제 2 학습 입력 데이터가 입력되는 경우, 하나 이상의 히든 레이어를 거쳐 출력 레이어를 통해 학습 결과 데이터를 출력하도록 하며, 출력된 학습 결과 데이터와 제 2 학습 출력 데이터를 비교하여 오차를 도출하고, 도출된 오차에 기초하여 각 링크의 가중치를 업데이트함으로써 학습될 수 있다.
보다 구체적으로, 도 5를 참조하면, 다층 퍼셉트론(400)의 입력 레이어(420)에 포함된 입력 노드에 입력된 항목 값 각각(즉, 제 2 학습 입력 데이터를 구성하는 수치 데이터(410)에 포함된 항목 값 각각)에 대해, 입력 노드와 연결된 링크에 설정된 가중치로 연산하여 히든 레이어로 전파할 수 있다. 예를 들어, 제 1 히든 레이어(430)에 제 1 히든 노드는 제 1 입력 노드에 전달된 값과 제 1 가중치를 연산한 값, 제 2 입력 노드에 전달된 값과 제 2 가중치를 연산한 값, 제 3 입력 노드에 전달된 값과 제 3 가중치를 연산한 값, 제 4 입력 노드에 전달된 값과 제 4 가중치를 연산한 값을 전달받을 수 있다. 예를 들어, 제 1 히든 레이어(430)에 포함된 제 1 히든 노드는 제 1 입력 노드에 전달된 값과 제 1 가중치를 곱한 값, 제 2 입력 노드에 전달된 값과 제 2 가중치를 곱한 값, 제 3 입력 노드에 전달된 값과 제 3 가중치를 곱한 값, 제 4 입력 노드에 전달된 값과 제 4 가중치를 곱한 값의 합을 전달받을 수 있다. 즉, 각 레이어에 포함된 각각의 노드에는 곱 또는 합성 곱에 관련한 연산이 수행될 수 있다.
수치 데이터는 다층 퍼셉트론의 입력 레이어(420)에서 제 1 히든 레이어(430), 제 2 히든 레이어(440)를 통해 출력 레이어(450)로 전파될 수 있다. 여기서는 히든 레이어가 두개의 층(즉, 제 1 히든 레이어 및 제 2 히든 레이어)로 구성됨을 예시적으로 설명하나, 이는 예시적인 것으로, 본 개시에서의 히든 레이어는 2개 이상의 층을 통해 형성될 수도 있다. 출력 레이어(450)에 포함된 출력 노드에서의 출력 값인, 진단 예측 정보(즉, 출력)와 제 2 학습 출력 데이터(즉, 정답)의 오차에 기초하여 각 레이어의 연결 가중치가 조정될 수 있다. 프로세서(130)는 출력 레이어(450)로부터 하나 이상의 히든 레이어(예를 들면, 제 2 히든 레이어 다음 제 1 히든 레이어 순으로)를 거쳐 입력 레이어로 오차를 전파하면서, 각 링크에 설정된 가중치들을 업데이트할 수 있다.
즉, 다층 퍼셉트론(400)으로 구성된 하나 이상의 네트워크 함수를 포함하는 제 2 신경망 모델은 전술한 과정을 거쳐 제 2 학습 데이터 세트를 통해 학습됨에 따라, 사용자의 검진 정보에 관려한 수치 데이터를 입력으로 하여 해당 수치 데이터에 대응하는 진단 정보를 출력할 수 있다.
예를 들어, 프로세서(130)는 제 2 신경망 모델에 포함된 입력 노드 각각에 수치 데이터에 포함된 항목들의 항목 값 각각을 입력할 수 있다. 구체적인 예를 들어, 프로세서(130)는 검진 대상의 수치 데이터 중 알부민, 알파 1 글로불린, 알파 2 글로불린, 베타 글로불린 및 감마 글로불린 각각의 단백 수치에 관련한 항목 값을 입력 레이어의 하나 이상의 입력 노드 각각에 입력할 수 있다. 프로세서(130)는 입력 레이어에 입력된 값을 가중치를 통해 연산하여 하나 이상의 히든 노드를 통하여 출력 레이어에 포함된 출력 노드로 전파할 수 있다. 프로세서(130)는 출력 노드의 출력 값인 제 2 진단 정보를 네트워크부(110)를 통해 전송하거나, 메모리(120)에 저장하거나, 또는 표시수단(예를 들어, 디스플레이)에 전달할 수 있다. 전술한 제 2 진단 정보 생성 방법에 관한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 학습 데이터 세트에 기반하여 학습 데이터 서브 세트를 생성할 수 있다. 프로세서(130)에 의해 생성되는 학습 데이터 서트 세트는 신경망의 학습 효율 및 정확도를 향상시키기 위해 추가적으로 확보되는 학습 데이터를 의미할 수 있다.
본 개시에서 신경망 모델의 학습의 대상이 되는 학습 데이터 세트는 복수의 사용자 각각의 혈청 단백 정기영동 및 면역고정법에 기반하여 획득되는 실제 진료 데이터로서 신경망 학습에 충분한 정보로 임의로 늘릴 수 없으며, 개인정보 보호 등의 이유로 원활한 확보가 어려울 수 있다. 신경망을 학습시키기 위한 학습 데이터 세트가 충분하게 확보되지 않은 경우, 학습된 신경망 모델의 정확도가 다소 낮아지거나 또는, 신경망의 학습 자체가 불가능할 수 있다. 또한, 특정 사용자의 검진 정보(예컨대, 이미지 데이터 및 수치 데이터)를 임의로 변형하여 추가적인 학습 데이터를 확보하고자 하는 경우, 임의적인 변형에 따라 데이터 자체가 유효하지 않게되거나, 또는 신경망의 학습 과정에서 원하는 않는 출력을 산출할 수 있다.
이에 따라, 본 개시의 프로세서(130)는 학습 데이터 세트에 포함된 복수의 사용자 각각의 진료 데이터에 기반하여 학습 데이터 세트에 대한 증강(agmentation)을 수행할 수 있다.
자세히 설명하면, 프로세서(130)는 제 1 학습 입력 데이터 세트를 구성하는 하나 이상의 이미지 데이터 각각에서 적어도 하나의 분획을 식별하고, 각 이미지 데이터에서 식별된 적어도 하나의 분획을 서로 스위칭함으로써, 추가적인 학습 입력 서브 데이터를 생성할 수 있다.
본 개시의 이미지 데이터는 사용자의 혈청에 대한 단백 전기영동 기법을 통해 획득되는 그래프 이미지 데이터이며, 해당 그래프 이미지 데이터는 각 단백 그룹들이 상이한 이동성에 대응하여 하나 이상의 분획으로 구분될 수 있다. 이 경우, 프로세서(130)는 각 사용자에 대응하는 그래프 이미지 데이터에서 서로 동일한 분획을 스위칭하여 학습 서브 데이터 세트를 생성할 수 있다.
구체적인 예를 들어, 제 1 사용자의 제 1 이미지 데이터와 제 2 사용자의 제 2 이미지 데이터 각각은 5개의 분획으로 구분된 그래프 이미지 데이터일 수 있다. 즉, 각 그래프 이미지 데이터에서, 제 1 분획은 알부민에 관련한 패턴 정보를 포함하며, 제 2 분획은 알파 1 글로불린에 관련한 패턴 정보를 포함하고, 제 3 분획은 알파 2 글로불린에 관련한 패턴 정보를 포함하고, 제 4 분획은 베타 글로불린에 관련한 패턴 정보를 포함하고, 그리고 제 5 분획은 감마 글로불린에 관련한 패턴 정보를 포함할 수 있다. 이 경우, 프로세서(130)는 제 1 이미지 데이터 및 제 2 이미지 데이터 각각에서 동일한 분획(예컨대, 감마 글로불린에 관련한 패턴을 나타내는 제 5 분획)을 식별하고, 식별된 분획을 서로 스위칭하여 학습 서브 입력 데이터를 생성할 수 있다. 즉, 제 1 이미지 데이터와 제 2 이미지 데이터 각각의 일부를 서로 교환하여 제 1 학습 제 1 서브 입력 데이터 및 제 1 학습 제 2 서브 입력 데이터가 생성될 수 있다.
일 실시예에서, 프로세서(130)는 서로 교환된 구획을 제외한 영역에 대한 변형을 수행할 수 있다. 예컨대, 제 1 이미지 데이터의 제 5 분획이 제 2 이미지 데이터의 제 5 분획으로 스위칭되는 경우, 스위칭 이후의 제 5 분획의 증감량에 대응하여 제 1 분획 내지 제 4 분획에 대한 변형을 수행할 수 있다. 예를 들어, 스위칭 이 후, 제 5 분획의 감마 글로불린의 단백 농도가 증가(예컨대, 4%)된 경우, 프로세서(130)는 제 1 분획 내지 4 분획 각각에 단백 농도가 감소(예컨대, 각 분획에 대응하여 1%씩 감소)되도록 그래프 이미지에 대한 변형을 수행할 수 있다. 전술한 구획 및 변형에 관련한 구체적인 수치적 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
또한, 프로세서(130)는 제 1 학습 제 1 서브 입력 데이터 및 제 1 학습 제 2 서브 입력 데이터 각각에 대한 사용자의 피드백 정보를 수신하여, 제 1 학습 제 1 서브 입력 데이터 및 제 1 학습 제 1 서브 입력 데이터 각각에 대응하는 제 1 학습 제 1 서브 출력 데이터 및 제 1 학습 제 2 서브 출력 데이터를 생성할 수 있다. 사용자의 피드백 정보는, 학습 서브 입력 데이터에 대한 전문의의 질환 진단에 관련한 피드백 정보일 수 있다. 예를 들어, 제 1 학습 제 1 서브 입력 데이터에 관련한 피드백 정보에 대응하여 제 1 학습 제 1 서브 출력 데이터는 '다발성 골수종'이라는 진단 정보를 포함하여 생성될 수 있으며, 제 1 학습 제 1 서브 입력 데이터에 관련한 피드백 정보에 대응하여 제 1 학습 제 2 서브 출력 데이터는 '감염 질환'이라는 진단 정보를 포함하여 생성될 수 있다. 또한, 프로세서(130)는 제 1 학습 제 1 서브 입력 데이터에 제 1 학습 제 1 서브 출력 데이터를 매칭하여 라벨링함으로써, 제 1 학습 제 1 서브 데이터를 생성하고, 제 1 학습 제 2 서브 입력 데이터에 제 1 학습 제 2 서브 출력 데이터를 매칭하여 라벨링함으로써, 제 1 학습 제 2 서브 데이터를 생성할 수 있다. 이 경우, 프로세서(130)에 의해 생성된 제 1 학습 제 1 서브 데이터 및 제 1 학습 제 2 서브 데이터는 제 1 학습 서브 데이터를 구성할 수 있다. 전술한 학습 서브 입력 데이터 및 학습 출력 데이터에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
추가적인 실시예에서, 프로세서(130)는 제 1 학습 데이터 서브 세트에 기반하여 제 2 학습 데이터 서브 세트를 생성할 수 있다. 구체적으로, 프로세서(130)는 제 1 학습 입력 서브 데이터에 기반하여 제 2 학습 입력 서브 데이터를 생성하고, 제 1 학습 출력 서브 데이터에 기반하여 제 2 학습 출력 서브 데이터를 생성할 수 있다. 예를 들어, 프로세서(130)는 제 1 학습 입력 서브 데이터를 구성하는 이미지 데이터를 통해 각 개별 단백의 단백 함량을 식별하여 수치화함으로써, 제 2 학습 입력 서브 데이터를 생성할 수 있다. 또한, 프로세서(130)는 제 1 학습 입력 서브 데이터에 대응하는 제 1 학습 출력 서브 데이터(즉, 라벨)을 식별하고, 제 1 학습 출력 서브 데이터에 기반하여 제 2 학습 출력 서브 데이터를 생성하여 제 2 학습 입력 서브 데이터에 매칭하여 라벨링함으로써, 제 2 학습 서브 데이터를 생성할 수 있다.
즉, 프로세서(130)는 학습 데이터를 구성하는 복수의 이미지 각각에서 동일한 분획(예컨대, 동일한 피처 영역)을 스위칭하여 학습 데이터 서브 세트를 생성할 수 있다. 다시 말해, 학습 데이터 서브 세트는, 각 이미지 데이터들의 일부 영역을 단순히 상이한 값으로 변형(예컨대, 특정 데이터에 일부 노이즈를 부가하는 등의 인위적인 변형)하는 것이 아닌, 이미지 내 동일한 분획에 해당하는 데이터 값의 교환(즉, 연관성을 가지는 데이터 값들의 교환)을 통해 이루어지는 것이므로, 신경망 학습에 적절한 학습 데이터일 수 있다. 따라서, 증가된 학습 서브 데이터 세트를 통해 신경망 학습의 효율성을 높일 수 있으며, 학습된 신경망의 출력 정확도 향상을 도모할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 제 1 신경망 모델 및 제 2 신경망 모델을 통합하여 통합 모델을 생성할 수 있다.
통합 모델은, 제 1 신경망 모델과 제 2 신경망 모델 간의 출력의 앙상블을 통해 통합된 모델일 수 있다. 또한, 통합 모델은 사용자의 의료 진단 정보를 입력으로 통합 진단 정보를 생성할 수 있다. 통합 진단 정보는 단세포군감마글로불린병증 및 형질세포골수종 중 적어도 하나에 관련한 제 1 진단 정보 및 신장 질환, 간 질환, 저감마글로불린혈증, 감염 상태 및 염증 상태에 관련한 제 2 진단 정보 중 적어도 하나를 포함할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 통합 모델에 사용자의 검진 정보를 입력으로 하여 통합 진단 정보를 생성할 수 있다. 구체적인 예를 들어, A 사용자와 관련한 제 1 이미지 데이터를 제 1 신경망 모델의 입력으로 하여 해당 사용자가 단세포군감마글로불린병증에 관련한 질환에 해당한다는 제 1 진단 정보가 출력되고, 해당 사용자와 관련한 제 1 수치 데이터를 제 2 신경망 모델의 입력으로 하여 해당 사용자가 신증후군에 관련한 질환에 해당한다는 제 2 진단 정보가 출력된 경우, 프로세서(130)는 각 모델의 출력의 앙상블을 통해 해당 사용자가 단세포군감마글로불린병증 및 신증후군의 질환에 해당한다는 통합 진단 정보를 생성할 수 있다. 다른 예를 들어, B 사용자에 관련한 제 2 이미지 데이터를 제 1 신경망 모델의 입력으로 하여 해당 사용자에 관련한 질환이 없다는 제 1 검진 정보가 출력되고, 해당 사용자와 관련한 제 2 수치 데이터를 제 2 신경망 모델의 입력으로 하여 해당 사용자가 단백질 소실 장질환에 관련한 질환에 해당한다는 제 2 진단 정보가 출력된 경우, 프로세서(130)는 각 모델의 출력의 앙상블을 통해 해당 사용자가 단백질 소실 장 질환에 해당한다는 통합 진단 정보를 생성할 수 있다. 전술한 각 진단 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
이 경우, 통합 모델의 출력에 해당하는 통합 진단 정보는 전술한 바와 같이, 복수 개의 모델 각각의 출력의 앙상블 임에 따라 진단 정보에 관련한 출력의 정확도가 향상될 수 있다. 또한, 일반적으로, 신증후군, 간경병증, 단백질 소실 장질환, 저감마글로불린혈등 등의 일부 질환에서도 알부민 또는 각 글로불린이 특이 패턴을 보여 진단에 이용될 수 있지만, 정확한 정량이나 진단 기준이 명확히 밝혀지지 않아 임상적 활용도가 높지 않은 편이다. 본 개시의 컴퓨팅 장치(100)는 제 2 신경망 모델을 통해 상술한 기타 질환들에 관련한 제 2 진단 정보를 출력할 수 있음에 따라, 혈청 단백 전기영동 및 면역고정법을 통해 획득된 데이터와 다른 기타 질환들 간의 상관관계를 분석하여 유미의한 진단 정보를 제공할 수 있다.
도 6은 본 개시의 일 실시예와 관련한 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하는 방법을 예시적으로 도시한 순서도이다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 복수의 학습 데이터로 구성된 학습 데이터 세트를 수신할 수 있다(510).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 학습 데이터 세트에 대한 전처리를 수행하여 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성할 수 있다(520).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 제 1 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 1 신경망 모델을 생성할 수 있다(530).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 제 2 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 2 신경망 모델을 생성할 수 있다(540).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 제 1 신경망 모델 및 제 2 신경망 모델을 통합하여 통합 모델을 생성할 수 있다(550).
전술한 도 6에 도시된 단계들은 필요에 의해 순서가 변경될 수 있으며, 적어도 하나 이상의 단계가 생략 또는 추가될 수 있다. 즉, 전술한 단계는 본 개시의 일 실시예에 불과할 뿐, 본 개시의 권리 범위는 이에 제한되지 않는다.
본 명세서에 걸쳐, 연산 모델, 신경망, 네트워크 함수, 뉴럴 네트워크(neural network)는 동일한 의미로 사용될 수 있다. 신경망은 일반적으로 “노드”라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 “노드”들은 “뉴런(neuron)”들로 지칭될 수도 있다. 신경망은 적어도 하나 이상의 노드들을 포함하여 구성된다. 신경망들을 구성하는 노드(또는 뉴런)들은 하나 이상의“링크”에 의해 상호 연결될 수 있다.
신경망 내에서, 링크를 통해 연결된 하나 이상의 노드들은 상대적으로 입력 노드 및 출력 노드의 관계를 형성할 수 있다. 입력 노드 및 출력 노드의 개념은 상대적인 것으로서, 하나의 노드에 대하여 출력 노드 관계에 있는 임의의 노드는 다른 노드와의 관계에서 입력 노드 관계에 있을 수 있으며, 그 역도 성립할 수 있다. 상술한 바와 같이, 입력 노드 대 출력 노드 관계는 링크를 중심으로 생성될 수 있다. 하나의 입력 노드에 하나 이상의 출력 노드가 링크를 통해 연결될 수 있으며, 그 역도 성립할 수 있다.
하나의 링크를 통해 연결된 입력 노드 및 출력 노드 관계에서, 출력 노드는 입력 노드에 입력된 데이터에 기초하여 그 값이 결정될 수 있다. 여기서 입력 노드와 출력 노드를 상호 연결하는 노드는 가중치(weight)를 가질 수 있다. 가중치는 가변적일 수 있으며, 신경망이 원하는 기능을 수행하기 위해, 사용자 또는 알고리즘에 의해 가변될 수 있다. 예를 들어, 하나의 출력 노드에 하나 이상의 입력 노드가 각각의 링크에 의해 상호 연결된 경우, 출력 노드는 상기 출력 노드와 연결된 입력 노드들에 입력된 값들 및 각각의 입력 노드들에 대응하는 링크에 설정된 가중치에 기초하여 출력 노드 값을 결정할 수 있다.
상술한 바와 같이, 신경망은 하나 이상의 노드들이 하나 이상의 링크를 통해 상호 연결되어 신경망 내에서 입력 노드 및 출력 노드 관계를 형성한다. 신경망 내에서 노드들과 링크들의 개수 및 노드들과 링크들 사이의 연관관계, 링크들 각각에 부여된 가중치의 값에 따라, 신경망의 특성이 결정될 수 있다. 예를 들어, 동일한 개수의 노드 및 링크들이 존재하고, 링크들 사이의 가중치 값이 상이한 두 신경망이 존재하는 경우, 두 개의 신경망들은 서로 상이한 것으로 인식될 수 있다.
신경망은 하나 이상의 노드들을 포함하여 구성될 수 있다. 신경망을 구성하는 노드들 중 일부는, 최초 입력 노드로부터의 거리들에 기초하여, 하나의 레이어(layer)를 구성할 수 있다, 예를 들어, 최초 입력 노드로부터 거리가 n인 노드들의 집합은, n 레이어를 구성할 수 있다. 최초 입력 노드로부터 거리는, 최초 입력 노드로부터 해당 노드까지 도달하기 위해 거쳐야 하는 링크들의 최소 개수에 의해 정의될 수 있다. 그러나, 이러한 레이어의 정의는 설명을 위한 임의적인 것으로서, 신경망 내에서 레이어의 차수는 상술한 것과 상이한 방법으로 정의될 수 있다. 예를 들어, 노드들의 레이어는 최종 출력 노드로부터 거리에 의해 정의될 수도 있다.
최초 입력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서 링크를 거치지 않고 데이터가 직접 입력되는 하나 이상의 노드들을 의미할 수 있다. 또는, 신경망 네트워크 내에서, 링크를 기준으로 한 노드 간의 관계에 있어서, 링크로 연결된 다른 입력 노드들 가지지 않는 노드들을 의미할 수 있다. 이와 유사하게, 최종 출력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서, 출력 노드를 가지지 않는 하나 이상의 노드들을 의미할 수 있다. 또한, 히든 노드는 최초 입력 노드 및 최후 출력 노드가 아닌 신경망을 구성하는 노드들을 의미할 수 있다. 본 개시의 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수와 동일할 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하다가 다시 증가하는 형태의 신경망일 수 있다. 또한, 본 개시의 다른 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수 보다 적을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하는 형태의 신경망일 수 있다. 또한, 본 개시의 또 다른 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수보다 많을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 증가하는 형태의 신경망일 수 있다. 본 개시의 또 다른 일 실시예에 따른 신경망은 상술한 신경망들의 조합된 형태의 신경망일 수 있다.
딥 뉴럴 네트워크(DNN: deep neural network, 심층신경망)는 입력레이어와 출력 레이어 외에 복수의 히든 레이어를 포함하는 신경망을 의미할 수 있다. 딥 뉴럴 네트워크를 이용하면 데이터의 잠재적인 구조(latent structures)를 파악할 수 있다. 즉, 사진, 글, 비디오, 음성, 음악의 잠재적인 구조(예를 들어, 어떤 물체가 사진에 있는지, 글의 내용과 감정이 무엇인지, 음성의 내용과 감정이 무엇인지 등)를 파악할 수 있다. 딥 뉴럴 네트워크는 컨볼루션 뉴럴 네트워크(CNN: convolutional neural network), 리커런트 뉴럴 네트워크(RNN: recurrent neural network), 오토 인코더(auto encoder), GAN(Generative Adversarial Networks), 제한 볼츠만 머신(RBM: restricted boltzmann machine), 심층 신뢰 네트워크(DBN: deep belief network), Q 네트워크, U 네트워크, 샴 네트워크 등을 포함할 수 있다. 전술한 딥 뉴럴 네트워크의 기재는 예시일 뿐이며 본 개시는 이에 제한되지 않는다.
뉴럴 네트워크는 교사 학습(supervised learning), 비교사 학습(unsupervised learning), 및 반교사학습(semi supervised learning) 중 적어도 하나의 방식으로 학습될 수 있다. 뉴럴 네트워크의 학습은 출력의 오류를 최소화하기 위한 것이다. 뉴럴 네트워크의 학습에서 반복적으로 학습 데이터를 뉴럴 네트워크에 입력시키고 학습 데이터에 대한 뉴럴 네트워크의 출력과 타겟의 에러를 계산하고, 에러를 줄이기 위한 방향으로 뉴럴 네트워크의 에러를 뉴럴 네트워크의 출력 레이어에서부터 입력 레이어 방향으로 역전파(backpropagation)하여 뉴럴 네트워크의 각 노드의 가중치를 업데이트 하는 과정이다. 교사 학습의 경우 각각의 학습 데이터에 정답이 라벨링되어있는 학습 데이터를 사용하며(즉, 라벨링된 학습 데이터), 비교사 학습의 경우는 각각의 학습 데이터에 정답이 라벨링되어 있지 않을 수 있다. 즉, 예를 들어 데이터 분류에 관한 교사 학습의 경우의 학습 데이터는 학습 데이터 각각에 카테고리가 라벨링 된 데이터 일 수 있다. 라벨링된 학습 데이터가 뉴럴 네트워크에 입력되고, 뉴럴 네트워크의 출력(카테고리)과 학습 데이터의 라벨이 비교함으로써 오류(error)가 계산될 수 있다. 다른 예로, 데이터 분류에 관한 비교사 학습의 경우 입력인 학습 데이터가 뉴럴 네트워크 출력과 비교됨으로써 오류가 계산될 수 있다. 계산된 오류는 뉴럴 네트워크에서 역방향(즉, 출력 레이어에서 입력 레이어 방향)으로 역전파 되며, 역전파에 따라 뉴럴 네트워크의 각 레이어의 각 노드들의 연결 가중치가 업데이트 될 수 있다. 업데이트 되는 각 노드의 연결 가중치는 학습률(learning rate)에 따라 변화량이 결정될 수 있다. 입력 데이터에 대한 뉴럴 네트워크의 계산과 에러의 역전파는 학습 사이클(epoch)을 구성할 수 있다. 학습률은 뉴럴 네트워크의 학습 사이클의 반복 횟수에 따라 상이하게 적용될 수 있다. 예를 들어, 뉴럴 네트워크의 학습 초기에는 높은 학습률을 사용하여 뉴럴 네트워크가 빠르게 일정 수준의 성능을 확보하도록 하여 효율성을 높이고, 학습 후기에는 낮은 학습률을 사용하여 정확도를 높일 수 있다.
뉴럴 네트워크의 학습에서 일반적으로 학습 데이터는 실제 데이터(즉, 학습된 뉴럴 네트워크를 이용하여 처리하고자 하는 데이터)의 부분집합일 수 있으며, 따라서, 학습 데이터에 대한 오류는 감소하나 실제 데이터에 대해서는 오류가 증가하는 학습 사이클이 존재할 수 있다. 과적합(overfitting)은 이와 같이 학습 데이터에 과하게 학습하여 실제 데이터에 대한 오류가 증가하는 현상이다. 예를 들어, 노란색 고양이를 보여 고양이를 학습한 뉴럴 네트워크가 노란색 이외의 고양이를 보고는 고양이임을 인식하지 못하는 현상이 과적합의 일종일 수 있다. 과적합은 머신러닝 알고리즘의 오류를 증가시키는 원인으로 작용할 수 있다. 이러한 과적합을 막기 위하여 다양한 최적화 방법이 사용될 수 있다. 과적합을 막기 위해서는 학습 데이터를 증가시키거나, 레귤라이제이션(regularization), 학습의 과정에서 네트워크의 노드 일부를 생략하는 드롭아웃(dropout) 등의 방법이 적용될 수 있다.
본 개시의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 개시가 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.
본 개시의 구성 요소들은 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 애플리케이션)으로 구현되어 매체에 저장될 수 있다. 본 개시의 구성 요소들은 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있으며, 이와 유사하게, 실시 예는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다.
본 개시의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 개시의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 개시의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 또한, 여기서 제시되는 다양한 저장 매체는 정보를 저장하기 위한 하나 이상의 장치 및/또는 다른 기계-판독가능한 매체를 포함한다. 용어 "기계-판독가능 매체"는 명령(들) 및/또는 데이터를 저장, 보유, 및/또는 전달할 수 있는 무선 채널 및 다양한 다른 매체를 포함하지만, 이들로 제한되는 것은 아니다.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 개시의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.
제시된 실시예들에 대한 설명은 임의의 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 개시를 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 개시는 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.

Claims (11)

  1. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로, 상기 컴퓨터 프로그램은 하나 이상의 프로세서에서 실행되는 경우, 상기 하나 이상의 프로세서로 하여금 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 이하의 동작들을 수행하도록 하며, 상기 동작들은:
    복수의 학습 데이터로 구성된 학습 데이터 세트를 수신하는 동작;
    학습 데이터 세트에 대한 전처리를 수행하여 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하는 동작;
    상기 제 1 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 1 신경망 모델을 생성하는 동작;
    상기 제 2 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 2 신경망 모델을 생성하는 동작; 및
    상기 제 1 신경망 모델 및 상기 제 2 신경망 모델을 통합하여 통합 모델을 생성하는 동작;
    을 포함하며,
    상기 학습 데이터 세트는,
    복수의 사용자 각각의 혈청에 대응하는 혈청 단백 전기영동 기법 및 면역고정법 중 적어도 하나에 관련한 검진 정보들로 구성된 학습 입력 데이터 세트 및 상기 복수의 사용자 각각의 진단 정보들로 구성된 학습 출력 데이터 세트를 포함하며,
    상기 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하는 동작은,
    상기 학습 입력 데이터 세트에서 복수의 이미지 데이터를 식별하여 제 1 학습 입력 데이터 세트를 구축하고, 상기 복수의 이미지 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 1 학습 출력 데이터 세트를 구축하는 동작; 및
    상기 학습 입력 데이터 세트에서 복수의 수치(numeric) 데이터를 식별하여 제 2 학습 입력 데이터 세트를 구축하고, 상기 복수의 수치 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 2 학습 출력 데이터 세트를 구축하는 동작;
    을 포함하고,
    상기 통합 모델은,
    상기 제 1 신경망 모델과 상기 제 2 신경망 모델의 출력의 앙상블을 통해 통합되며,
    사용자의 검진 정보를 입력으로 하여 통합 진단 정보를 생성하고,
    상기 통합 진단 정보는,
    단세포군감마글로불린병증 및 형질세포골수종 중 적어도 하나에 관련한 제 1 진단 정보 및 신장 질환, 간 질환, 저감마글로불린혈증, 감염 질환 및 염증 질환에 관련한 제 2 진단 정보 중 적어도 하나를 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 이미지 데이터는,
    단백질 함량 및 이동성에 관련한 2차원 그래프에 관한 이미지 데이터이며, 상기 이동성을 기준으로 하나 이상의 구획으로 분리된 알부민 및 하나 이상의 글로불린에 관련한 그래프 이미지 데이터를 포함하며,
    상기 수치 데이터는,
    상기 알부민 및 하나 이상의 글로불린 각각의 단백질 함량에 관한 수치 데이터를 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  4. 제 1 항에 있어서,
    상기 제 1 신경망 모델은, 이미지 데이터를 입력으로 하여 제 1 진단 정보를 출력하는 컨볼루션 뉴럴 네트워크(CNN, Convolutional Neural Networks)로 구성되며,
    상기 컨볼루션 뉴럴 네트워크는,
    상기 이미지 데이터의 피처와 하나 이상의 컨볼루션 필터 각각을 통한 컨볼루션 동작을 통해 샘플링 피처맵 세트를 생성하는 하나 이상의 컨볼루션 레이어(Convolution layer), 상기 샘플링 피처맵 세트에 대한 풀링 동작에 기초하여 풀링 피처맵 세트를 생성하는 하나 이상의 풀링 레이어(Pooling layer)를 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  5. 제 4 항에 있어서,
    상기 컨볼루션 뉴럴 네트워크는,
    제 1 학습 입력 데이터가 입력되는 경우, 상기 제 1 학습 입력 데이터에 대응하는 제 1 학습 출력 데이터에 관련한 분류를 수행하도록 상기 하나 이상의 컨볼루션 필터를 조정함으로써 학습되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  6. 제 1 항에 있어서,
    상기 제 2 신경망 모델은, 수치 데이터를 입력으로 하여 제 2 진단 정보를 출력하는 다층 퍼셉트론(MLP, Multi-Layer Perceptron)으로 구성되며,
    상기 다층 퍼셉트론은, 입력 레이어, 하나 이상의 히든 레이어 및 출력 레이어 중 적어도 하나를 포함하며, 상기 입력 레이어는 하나 이상의 입력 노드를 포함하며, 상기 하나 이상의 히든 레이어는 각각 하나 이상의 히든 노드를 포함하고, 상기 출력 레이어는 하나 이상의 출력 노드를 포함하고, 각 레이어에 포함된 각각의 노드는 다른 레이어의 하나 이상의 노드와 링크를 통해 각각 연결되며, 상기 각각의 링크는 가중치가 설정되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  7. 제 6 항에 있어서,
    상기 다층 퍼셉트론은,
    상기 입력 레이어에 제 2 학습 입력 데이터가 입력되는 경우, 상기 하나 이상의 히든 레이어를 거쳐 상기 출력 레이어를 통해 학습 결과 데이터를 출력하도록 하며, 출력된 상기 학습 결과 데이터와 제 2 학습 출력 데이터를 비교하여 오차를 도출하고, 도출된 오차에 기초하여 각 링크의 가중치를 업데이트함으로써 학습되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  8. 삭제
  9. 제 1 항에 있어서,
    상기 통합 모델에 사용자의 입력 정보를 입력으로 처리하여 통합 진단 정보를 생성하는 동작;
    을 더 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  10. 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 방법으로,
    상기 프로세서가 복수의 학습 데이터로 구성된 학습 데이터 세트를 수신하는 단계;
    상기 프로세서가 상기 학습 데이터 세트에 대한 전처리를 수행하여 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하는 단계;
    상기 프로세서가 상기 제 1 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 1 신경망 모델을 생성하는 단계;
    상기 프로세서가 상기 제 2 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 2 신경망 모델을 생성하는 단계; 및
    상기 프로세서가 상기 제 1 신경망 모델 및 상기 제 2 신경망 모델을 통합하여 통합 모델을 생성하는 단계;
    를 포함하며,
    상기 학습 데이터 세트는,
    복수의 사용자 각각의 혈청에 대응하는 혈청 단백 전기영동 기법 및 면역고정법 중 적어도 하나에 관련한 검진 정보들로 구성된 학습 입력 데이터 세트 및 상기 복수의 사용자 각각의 진단 정보들로 구성된 학습 출력 데이터 세트를 포함하며,
    상기 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하는 단계는,
    상기 학습 입력 데이터 세트에서 복수의 이미지 데이터를 식별하여 제 1 학습 입력 데이터 세트를 구축하고, 상기 복수의 이미지 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 1 학습 출력 데이터 세트를 구축하는 단계; 및
    상기 학습 입력 데이터 세트에서 복수의 수치(numeric) 데이터를 식별하여 제 2 학습 입력 데이터 세트를 구축하고, 상기 복수의 수치 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 2 학습 출력 데이터 세트를 구축하는 단계;
    를 포함하고,
    상기 통합 모델은,
    상기 제 1 신경망 모델과 상기 제 2 신경망 모델의 출력의 앙상블을 통해 통합되며,
    사용자의 검진 정보를 입력으로 하여 통합 진단 정보를 생성하고,
    상기 통합 진단 정보는,
    단세포군감마글로불린병증 및 형질세포골수종 중 적어도 하나에 관련한 제 1 진단 정보 및 신장 질환, 간 질환, 저감마글로불린혈증, 감염 질환 및 염증 질환에 관련한 제 2 진단 정보 중 적어도 하나를 포함하는,
    컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 방법.
  11. 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨팅 장치로서,
    하나 이상의 코어를 포함하는 프로세서;
    상기 프로세서에서 실행가능한 프로그램 코드들을 저장하는 메모리; 및
    사용자 단말 및 외부 서버와 데이터를 송수신하는 네트워크부;
    를 포함하고,
    상기 프로세서는,
    복수의 학습 데이터로 구성된 학습 데이터 세트를 수신하고, 상기 학습 데이터 세트에 대한 전처리를 수행하여 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하고, 상기 제 1 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 1 신경망 모델을 생성하고, 상기 제 2 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 제 2 신경망 모델을 생성하고, 그리고 상기 제 1 신경망 모델 및 상기 제 2 신경망 모델을 통합하여 통합 모델을 생성하며,
    상기 학습 데이터 세트는,
    복수의 사용자 각각의 혈청에 대응하는 혈청 단백 전기영동 기법 및 면역고정법 중 적어도 하나에 관련한 검진 정보들로 구성된 학습 입력 데이터 세트 및 상기 복수의 사용자 각각의 진단 정보들로 구성된 학습 출력 데이터 세트를 포함하며,
    상기 제 1 학습 데이터 세트 및 제 2 학습 데이터 세트를 생성하는 것은, 상기 학습 입력 데이터 세트에서 복수의 이미지 데이터를 식별하여 제 1 학습 입력 데이터 세트를 구축하고, 상기 복수의 이미지 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 1 학습 출력 데이터 세트를 구축하는 것 및 상기 학습 입력 데이터 세트에서 복수의 수치(numeric) 데이터를 식별하여 제 2 학습 입력 데이터 세트를 구축하고, 상기 복수의 수치 데이터 각각에 대응하는 복수의 학습 출력 데이터에 기반하여 제 2 학습 출력 데이터 세트를 구축하는 것을 포함하고,
    상기 통합 모델은,
    상기 제 1 신경망 모델과 상기 제 2 신경망 모델의 출력의 앙상블을 통해 통합되며,
    사용자의 검진 정보를 입력으로 하여 통합 진단 정보를 생성하고,
    상기 통합 진단 정보는,
    단세포군감마글로불린병증 및 형질세포골수종 중 적어도 하나에 관련한 제 1 진단 정보 및 신장 질환, 간 질환, 저감마글로불린혈증, 감염 질환 및 염증 질환에 관련한 제 2 진단 정보 중 적어도 하나를 포함하는,
    인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨팅 장치.
KR1020200100490A 2020-08-11 2020-08-11 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램 KR102461582B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200100490A KR102461582B1 (ko) 2020-08-11 2020-08-11 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200100490A KR102461582B1 (ko) 2020-08-11 2020-08-11 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램

Publications (2)

Publication Number Publication Date
KR20220020044A KR20220020044A (ko) 2022-02-18
KR102461582B1 true KR102461582B1 (ko) 2022-10-31

Family

ID=80495202

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200100490A KR102461582B1 (ko) 2020-08-11 2020-08-11 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR102461582B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101857624B1 (ko) * 2017-08-21 2018-05-14 동국대학교 산학협력단 임상 정보를 반영한 의료 진단 방법 및 이를 이용하는 장치
KR102044094B1 (ko) * 2018-05-03 2019-11-12 한동대학교 산학협력단 딥 러닝 기반 유전체 발현량 해석을 통한 암 또는 정상 판별 방법 및 그 장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100465123B1 (ko) 2001-09-03 2005-01-13 (주)프로테옴텍 과알부민 함유시료로부터 타 단백질의 전기영동 패턴정밀분석 방법
US9984201B2 (en) * 2015-01-18 2018-05-29 Youhealth Biotech, Limited Method and system for determining cancer status

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101857624B1 (ko) * 2017-08-21 2018-05-14 동국대학교 산학협력단 임상 정보를 반영한 의료 진단 방법 및 이를 이용하는 장치
KR102044094B1 (ko) * 2018-05-03 2019-11-12 한동대학교 산학협력단 딥 러닝 기반 유전체 발현량 해석을 통한 암 또는 정상 판별 방법 및 그 장치

Also Published As

Publication number Publication date
KR20220020044A (ko) 2022-02-18

Similar Documents

Publication Publication Date Title
Gokulnath et al. An optimized feature selection based on genetic approach and support vector machine for heart disease
Reddy et al. Predicting hospital readmission for lupus patients: an RNN-LSTM-based deep-learning methodology
Jerlin Rubini et al. Efficient classification of chronic kidney disease by using multi‐kernel support vector machine and fruit fly optimization algorithm
CN112364880B (zh) 基于图神经网络的组学数据处理方法、装置、设备及介质
Gorban et al. How deep should be the depth of convolutional neural networks: a backyard dog case study
Liu et al. Learning the dynamic treatment regimes from medical registry data through deep Q-network
Gaspar et al. An optimized Kernel Extreme Learning Machine for the classification of the autism spectrum disorder by using gaze tracking images
Rajliwall et al. Cardiovascular risk prediction based on XGBoost
Rajliwall et al. Chronic disease risk monitoring based on an innovative predictive modelling framework
Pinto et al. Data mining to predict early stage chronic kidney disease
Nikolentzos et al. Synthetic electronic health records generated with variational graph autoencoders
WO2024120504A1 (zh) 一种数据处理方法及相关设备
Rajalakshmi et al. A novel deep learning model for diabetes melliuts prediction in IoT-based healthcare environment with effective feature selection mechanism
Sampath et al. Ensemble Nonlinear Machine Learning Model for Chronic Kidney Diseases Prediction
KR102461582B1 (ko) 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램
KR102334666B1 (ko) 얼굴 이미지 생성 방법
Omankwu et al. Hybrid deep learning model for heart disease prediction using recurrent neural network (RNN)
Pradeepa et al. Modelling of IDBN with LSNN based optimal feature selection for the prediction of CKD using real time data
Varshavardhini et al. An Efficient Feature Subset Selection with Fuzzy Wavelet Neural Network for Data Mining in Big Data Environment.
Aishwarya et al. Prediction of disease using machine learning and deep learning
Yadav et al. Genetic algorithm and Naïve Bayes-based (GANB) diabetes mellitus prediction system
Li et al. Introduction to artificial intelligence and deep learning with a case study in analyzing electronic health records for drug development
El-Bashbishy et al. Pediatric diabetes prediction using deep learning
KR102304340B1 (ko) 시각정보 기반 참조 검색 기술을 이용한 인공지능 판독 보조방법
Subashini et al. Multimodal deep learning for chronic kidney disease prediction: leveraging feature selection algorithms and ensemble models

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant