KR20170011389A - 질병 위험도 예측 방법 및 이를 수행하는 장치 - Google Patents

질병 위험도 예측 방법 및 이를 수행하는 장치 Download PDF

Info

Publication number
KR20170011389A
KR20170011389A KR1020150103951A KR20150103951A KR20170011389A KR 20170011389 A KR20170011389 A KR 20170011389A KR 1020150103951 A KR1020150103951 A KR 1020150103951A KR 20150103951 A KR20150103951 A KR 20150103951A KR 20170011389 A KR20170011389 A KR 20170011389A
Authority
KR
South Korea
Prior art keywords
disease
mutation
mutations
risk
user
Prior art date
Application number
KR1020150103951A
Other languages
English (en)
Other versions
KR102508971B1 (ko
Inventor
조용래
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020150103951A priority Critical patent/KR102508971B1/ko
Priority to CN201680050358.2A priority patent/CN107924719B/zh
Priority to US15/746,524 priority patent/US20180218115A1/en
Priority to PCT/KR2016/007501 priority patent/WO2017014469A1/ko
Publication of KR20170011389A publication Critical patent/KR20170011389A/ko
Application granted granted Critical
Publication of KR102508971B1 publication Critical patent/KR102508971B1/ko

Links

Images

Classifications

    • G06F19/3431
    • G06F19/18
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

질병 위험도 예측 방법 및 이를 수행하는 장치가 개시된다. 여기서, 질병 위험도 예측 방법은 네트워크에 연결된 컴퓨터 기반의 질병 위험도 분석 장치가 질병 위험도를 예측하는 방법으로서, 질병과 연관된 하나 이상의 질병-변이를 선정하는 단계, 상기 하나 이상의 질병-변이를 이용하여 질병 위험도를 예측하는 단계, 상기 질병 위험도의 예측 결과를 상기 네트워크를 통해 사용자 단말로 제공하는 단계, 상기 사용자 단말로부터 사용자의 질병 발생 여부를 피드백받는 단계, 그리고 상기 피드백을 통해 실제로 발생한 질병을 확인하고, 상기 실제로 발생한 질병의 위험도 예측시 사용된 하나 이상의 질병-변이에 가중치를 설정하는 단계를 포함하고, 상기 선정하는 단계는, 상기 하나 이상의 질병-변이 중에서 상기 가중치가 상대적으로 높은 질병-변이를 우선적으로 선택한다.

Description

질병 위험도 예측 방법 및 이를 수행하는 장치{METHOD AND APPARATUS FOR PREDICTING THE DISEASE RISK}
본 발명은 질병 위험도 예측 방법 및 이를 수행하는 장치에 관한 것으로서, 유전체 기반의 질병 위험도를 예측하는 기술에 관한 것이다.
유전체 시퀀싱 기술의 발달로 개인 유전체 정보를 바탕으로 질병 예측을 해주는 PGS(Personal Genome Service)들이 많이 생겨나고 있다.
일반적으로 질병 발생 확률은 '질병 유병률(Average population disease risk) × 상대적 질병 발생 위험도(Relative Risk)' 형태로 계산된다.
그러나 이러한 기술은 현재 정확도 문제로 이슈화되고 있다. 질병 예측에 대한 결과들이 동일한 사람임에도 업체마다 결과가 상이한 것이다. 그 이유는 질병과 관련되어 있는 유전 변이를 어떻게 선정하느냐의 차이에 따라 결과가 달라지기 때문이다.
유전 정보에 기반한 질병 위험도 분석의 경우, 단일 유전자 이상으로 인해 질병이 발생한 경우는 결과가 명확하지만, 복합 유전자 이상으로 인해 질병이 발생하는 경우에는 PGS 회사마다 검사 결과가 다르다.
예를 들면, 2형 당뇨병과 연관되어 있다고 보고된 유전자 변이 리스트 중에서 어떤 변이를 선택하느냐에 따라 질병 위험도 분석에 큰 영향을 주고 있다.
Gene 변이 위험도 회사 A 회사 B 회사 C
TCF7L2 rs79031 34% O
SLC30A8 rs13266 37% O
EPO rs16176 57% O O O
FTO rs99396 58% O O
Total 45% 57.5% 50.6%
표 1은 2형 당뇨병과 연관되어 있다고 알려진 유전자 변이 리스트로서, 회사마다 다른 질병-변이 리스트를 선택함으로써 결과가 다르다. 인종별 상이한 질병들이 발생하므로 인종별 영향을 미치는 변이를 적절히 선택하는 것도 매우 중요하다.
이와 같이, 어떤 질병마다 어떤 변이를 선정하였는지 여부에 따라 결과가 회사마다 상이하다는 점은 질병 예측 서비스의 가장 큰 문제점으로 되고 있다.
또한, 질병-변이 선정 과정이 단순히 유전체 분야 퍼블릭(Public) DB 및 각 종 질병 DB로부터 위험하다고 알려진 정보 만으로는 질병 예측의 정확도를 높일 수 없다.
따라서, 본 발명이 이루고자 하는 기술적 과제는 유전 정보에 기반한 질병 위험도 예측에 사용되는 유전 변이(Genetic Variants)에 대해 사용자의 결과 피드백으로부터 가중치를 부여하여 결과의 정확도를 높일 수 있는 질병 위험도 예측 방법 및 이를 구현하는 장치를 제공하는 것이다.
본 발명의 하나의 특징에 따르면, 질병 위험도 예측 방법은 네트워크에 연결된 컴퓨터 기반의 질병 위험도 분석 장치가 질병 위험도를 예측하는 방법으로서, 질병과 연관된 질병-변이들을 선정하는 단계, 상기 질병-변이들을 이용하여 질병 위험도를 예측하는 단계, 상기 질병 위험도의 예측 결과를 상기 네트워크를 통해 사용자 단말로 제공하는 단계, 상기 사용자 단말로부터 사용자의 질병 발생 여부를 피드백 받는 단계, 그리고 상기 피드백을 통해 실제로 발생한 질병을 확인하고, 상기 실제로 발생한 질병의 위험도 예측시 사용된 하나 이상의 질병-변이에 가중치를 설정하는 단계를 포함하고,
상기 선정하는 단계는,
상기 질병-변이들 중에서 상기 가중치가 상대적으로 높은 질병-변이를 우선적으로 선택한다.
상기 제공하는 단계 및 상기 피드백받는 단계는,
모바일 서비스를 통해 구현될 수 있다.
상기 선정하는 단계는,
최초 선정시, 질병과 연관된 유전자 및 변이를 조사하는 단계, 조사된 질병-변이들에 의학적 근거 레벨 및 기본 가중치를 각각 부여하는 단계, 상기 의학적 근거 레벨을 고려하여 질병 위험도 예측시 사용할 질병-변이들을 최종 선정하는 단계, 그리고 최종 선정한 질병-변이들을 토대로 상품을 생성하는 단계를 포함하고,
상기 예측하는 단계는,
상기 상품에 포함된 질병-변이들을 이용하여 위험도를 예측할 수 있다.
상기 조사하는 단계는,
질병과 관련된 유전자 및 변이 정보가 저장된 다수의 해외 사이트 및 데이터베이스로부터 질병과 관련된 유전자 및 변이를 조사하고, 질병과 인종간의 연관성 연구 논문을 조사하며, 전문가 리뷰 정보를 수집하고,
상기 의학적 근거 레벨은,
수집한 정보를 토대로 샘플수, 동물실험 증명, 통계적 유의성, 논문에 보고된 건수, 영향력 지수가 높은 학회에 보고되었는지 여부 및 다른 데이터베이스에 보고된 근거 레벨을 고려하여 부여될 수 있다.
상기 상품을 생성하는 단계는,
질병과 연관된 서로 다른 질병-변이들의 조합을 포함하고, 상기 조합 별로 상품 고유 ID 및 상품 버전 정보를 포함하는 상품 식별 정보가 매칭되며, 상기 질병-변이들마다 상기 의학적 근거 레벨, 상기 가중치, 변이 발견 횟수, 상품 제공 횟수, 질병 발생 여부 및 최종 연관성 스코어가 포함된 상품을 생성하며,
상기 최종 연관성 스코어는 상기 질병 위험도 예측시 사용할 질병-변이들을 선정하는데 사용되는 정보일 수 있다.
상기 최종 연관성 스코어는,
의학적 근거레벨 상관계수, 가중치의 상관계수, 상기 의학적 근거 레벨, 상기 가중치를 이용하여 계산될 수 있다.
상기 피드백받는 단계는,
사용자에게 실제로 발생한 질병과 관련된 상기 상품 식별 정보, 질병명, 질병-변이 ID 및 질병 발생 여부가 포함된 사용자 피드백 정보를 수신하고,
상기 선정하는 단계는,
최초 선정이 아닌 경우, 상기 사용자 피드백 정보를 통해 확인된 상기 실제로 발생한 질병과 관련된 질병-변이들에 가중치를 증가시키고, 상기 가중치를 토대로 질병 위험도 예측시 사용할 질병-변이를 재선정할 수 있다.
상기 가중치는,
상기 질병 발생 여부 및 상기 변이 발견 횟수를 이용하여 계산될 수 있다.
상기 질병 위험도를 예측하는 단계는,
최초 선정 또는 재선정한 질병과 연관된 유전자 및 질병-변이들을 사용자 유전자 정보와 매칭하여 사용자 변이 ID 리스트를 생성하는 단계, 질병이 복합질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것이 아니라면, 상기 질병과 관련없는 변이로 판단하여 제외시키는 단계, 상기 질병이 복합질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것이라면, 상기 상품에 포함된 질병-변이들을 토대로 질병 위험도를 예측하는 단계, 상기 질병이 희귀질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것이라면, 질병 위험도를 고위험도로 분류하는 단계, 상기 질병이 희귀질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것은 아니지만, 상기 질병-변이들이 단백질 구조에 영향을 주거나 기능을 상실하게 하는 것이면, 해당 질병을 고위험군으로 분류하는 단계, 그리고 상기 질병이 희귀질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것이 아니거나 또는 상기 질병-변이들이 단백질 구조에 영향을 주거나 기능을 상실하게 하는 것이 아니라면, 상기 질병과 관련없는 변이로 판단하여 제외시키는 단계를 포함할 수 있다.
상기 사용자 단말로 제공하는 단계는,
상품 버전 ID, 질병명, 변이 ID 및 질병 위험도가 포함된 결과 리포트를 스마트폰 어플리케이션을 통해 모바일 서비스로 제공할 수 있다.
본 발명의 다른 특징에 따르면, 질병 위험도 분석 장치는 네트워크에 연결된 컴퓨터 기반의 질병 위험도 분석 장치로서, 의학적 근거 레벨을 설정하기 위한 기준 정보 테이블 및 질병 위험도 예측시 사용할 질병-변이 정보가 수록된 질병-변이 테이블을 저장하는 질병-변이 선정 DB, 상기 기준 정보 테이블을 이용하여 질병과 연관된 질병-변이들을 선정하고, 선정된 질병-변이 정보를 상기 질병-변이 테이블에 수록하는 질병-변이 선정부, 상기 질병-변이 테이블에 수록된 질병-변이들을 이용하여 질병 위험도를 예측하는 질병 위험도 예측부, 상기 질병 위험도 예측부의 질병 위험도 예측 결과를 상기 네트워크를 통해 사용자 단말로 제공하는 사용자 제공부, 상기 사용자 단말로부터 사용자의 질병 발생 여부를 피드백받는 사용자 피드백부, 그리고 상기 피드백을 통해 실제로 발생한 질병을 확인하고, 상기 실제로 발생한 질병의 위험도 예측시 사용된 하나 이상의 질병-변이에 가중치를 설정하는 가중치 설정부를 포함하고,
상기 질병-변이 선정부는,
상기 질병-변이 테이블에 포함된 질병-변이들 중에서 상기 가중치가 상대적으로 높은 질병-변이를 우선적으로 선택한다.
상기 기준 정보 테이블은,
질병-변이 연관성 연구에서 사용된 샘플 수, 질병-변이 연관성 연구가 동물실험 등을 통해 그 유전적 기능이 연구된 경우를 나타내는 동물실험 증명, 질병-변이 연관성 연구 결과의 통계적 유의성 및 질병-변이 연관성 정보를 담고 있는 타 질병 DB에서의 정보들이 있는 경우를 나타내는 타 질병 관련 DB에 보고된 근거 레벨을 토대로 설정된 질병-변이 간의 연관성이 어느 정도 되는지에 대한 강도를 나타내는 척도인 의학적 근거 레벨을 포함하고,
상기 질병-변이 선정부는,
질병과 관련된 유전자 및 변이 정보가 저장된 다수의 해외 사이트 및 데이터베이스로부터 질병과 관련된 유전자 및 변이를 조사하고, 질병과 인종간의 연관성 연구 논문을 조사하며, 전문가 리뷰 정보를 수집하고, 수집한 정보 및 상기 의학적 근거 레벨을 토대로 질병과 연관된 질병-변이들을 선정할 수 있다.
상기 질병-변이 테이블은,
서로 다른 질병-변이들의 조합으로 구성되는 상품의 ID 및 버전 정보, 질병명, 질병과 연관된 질병-변이들의 ID, 각 질병-변이들의 의학적 근거 레벨, 상기 각 질병-변이들의 가중치, 상기 상품을 이용한 사람 중에 실제 해당 질병-변이가 발견된 횟수, 상품 제공 횟수, 상기 질병이 실제로 발생한 사람 수 및 상기 의학적 근거 레벨과 상기 가중치를 이용하여 계산된 최종 연관성 스코어를 저장하고,
상기 질병-변이 선정부는,
상기 최종 연관성 스코어가 높은 순서대로 질병-변이들을 선정할 수 있다.
상기 사용자 피드백부는,
사용자에게 실제로 발생한 질병과 관련된 상기 상품의 ID 및 버전 정보, 상기 질병명, 상기 질병-변이들의 ID 및 질병 발생 여부가 포함된 사용자 피드백 정보를 수신하고,
상기 가중치 설정부는,
상기 사용자 피드백 정보를 통해 확인된 상기 실제로 발생한 질병과 관련된 질병-변이들에 가중치를 증가시킬 수 있다.
상기 가중치 설정부는,
상기 질병 발생 여부 및 상기 변이 발견 횟수를 이용하여 계산된 가중치를 상기 질병-변이들에 설정할 수 있다.
본 발명의 실시예에 따르면, 질병 위험도 예측에 대한 사용자 만족도를 피드백받는 종래와 달리 실제로 질병이 발생하였는지 여부를 피드-받음으로써, 질병 발생과 연관된 초기 사용되었던 질병-변이에 가중치를 두고 가중치가 높은 질병-변이를 우선적으로 질병 위험도 예측시 사용한다. 그러면, 유전 정보에 기반한 질병 위험도 예측에 사용되는 유전 변이 선택에 있어 가중치를 활용함으로써 질병 발생 결과가 축적되는 양이 많아질수록 질병 위험도 예측의 정확성이 높아진다.
도 1은 본 발명의 실시예에 따른 질병 위험도 분석 장치의 구성을 나타낸 블록도이다.
도 2는 본 발명의 실시예에 따른 질병 위험도 예측 방법을 나타낸 순서도이다.
도 3은 본 발명의 실시예에 따른 질병-변이 선정 과정을 나타낸 순서도이다.
도 4는 도 3의 S203 단계를 상세히 나타낸 순서도이다.
도 5는 본 발명의 실시예에 따른 질병-변이 선정을 위한 기준 정보 테이블의 구성을 나타낸다.
도 6은 본 발명의 실시예에 따른 질병-변이 테이블의 구성을 나타낸다.
도 7은 본 발명의 실시예에 따른 질병 위험도 예측 과정을 나타낸 순서도이다.
도 8은 본 발명의 실시예에 따른 질병 위험도 예측 결과를 사용자에게 제공하는 예시도이다.
도 9는 본 발명의 실시예에 따른 사용자 피드백을 나타낸 예시도이다.
도 10은 본 발명의 실시예에 따른 사용자 피드백 과정을 나타낸 순서도이다.
도 11은 사용자 피드맥 데이터 포맷을 나타낸다.
도 12는 본 발명의 실시예에 따른 질병-변이 테이블의 업데이트 예시도이다.
도 13은 본 발명의 다른 실시예에 따른 질병 위험도 분석 장치의 개략적인 도면이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
또한, 명세서에 기재된 "…부", "…모듈" 의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
이하, 도면을 참조로 하여 본 발명의 실시예에 따른 질병 위험도 분석 장치 및 그 방법에 대하여 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 질병 위험도 분석 장치의 구성을 나타낸 블록도이고, 도 2는 본 발명의 실시예에 따른 질병 위험도 예측 방법을 나타낸 순서도이다.
도 1을 참조하면, 질병 위험도 분석 장치(100)는 질병-변이 선정부(110), 질병-변이 선정 DB(120), 질병 위험도 예측부(130), 사용자 제공부(140), 사용자 피드백부(150) 및 가중치 설정부(160)를 포함한다.
도 2를 참조하면, 질병-변이 선정부(110)가 질병과 연관된 질병-변이들을 선정한다(S101). 그리고 질병-변이 선정 DB(120)에 선정한 질병-변이들을 저장한다. 이하, 질병과 연관된 변이는 '질병-변이'로 통칭하여 기재한다.
질병-변이 선정부(110)는 다양한 의학적 근거 자료 및 변이 가중치 등을 고려하여 질병과 연관된 질병-변이를 선정하는데, 선정 과정은 도 3을 참고하여 후술한다.
다음, 질병 위험도 예측부(130)는 S101 단계에서 선정한 질병-변이들을 토대로 질병 위험도를 예측한다(S103). 선정된 질병-변이를 이용하여 질병 특성에 따라 서로 다른 질병 위험도 예측 절차를 수행한다.
다음, 사용자 제공부(140)는 S103 단계에서 예측한 질병 위험도 예측 결과를 모바일 서비스 형태로 사용자 단말(미도시)로 제공한다(S105). 여기서, 모바일 서비스는 모바일 웹 형태 또는 스마트 폰 어플리케이션 형태로 구현될 수 있다.
다음, 사용자 피드백부(150)는 모바일 서비스를 통해 사용자의 질병 발생 유무를 사용자 단말(미도시)로부터 피드백받는다(S107).
다음, 가중치 설정부(160)는 S107 단계에서 피드백받은 실제로 질병이 발생한 사용자에게 제공한 질병 위험도 예측시 사용한 질병-변이들에 가중치를 부여한다(S109). 그러면, 이후 질병-변이들 선정시 가중치가 할당된 질병-변이들이 우선적으로 선정되어 질병 위험도 예측에 활용된다.
예를 들면, 당뇨병의 원인 유전자 변이로 A, B, C, D, E, F라는 변이가 존재한다고 가정하면, 환자 1번은 당뇨병의 원인 변이로 A, C, D, 환자 2번은 당뇨병의 원인 변이로 B, E, F, 환자 3번은 당뇨병의 원인 변이로 A, D, F일 수 있다.
이처럼, 환자마다 당뇨병 원인 변이는 다양한데 어떤 변이 조합이 될지 알 수 없으며, 인종마다 변이 조합 패턴의 차이가 상이하다.
본 발명의 실시예에 따른 질병 위험도 분석 장치(100)는 초기 한국인 대상으로 당뇨병 원인 변이로, 변이 A, B, D, F를 선정하고 질병 위험 예측 서비스를 실시하면서 사용자 피드백을 통해 실제 질병 발생시 선정된 A, B, D, F에 가중치를 부여하여 타 C, E 변이보다 국내에서는 우선적으로 질병 예측에 활용한다. 이러면 인종별, 개인별 차이가 있었던 질병 위험도 예측 결과에 대해 정확도를 높일 수 있다.
도 3은 본 발명의 실시예에 따른 질병-변이 선정 과정을 나타낸 순서도로서, 도 1의 질병-변이 선정부(110)의 동작을 나타내며, 도 2에서 S101 단계를 상세히 나타낸 것이다.
도 3을 참조하면, 질병-변이를 선정하는 과정은 크게 2가지로 구분되는데, 질병과 연관된 새로운 변이를 선정하는 과정(S1)과 질병과 연관된 변이 중 가중치와 의학적 근거 레벨 등을 고려하여 재선정하는 과정(S3)을 포함한다.
먼저, 질병-변이 선정부(110)는 질병-변이 선정이 최초인지를 판단한다(S201). 즉, S1에 해당하는지 또는 S2에 해당하는지 판단하는 단계라고 할 수 있다.
질병-변이 선정부(110)는 질병-변이를 선정하는 처음의 과정(S1)으로 판단되면, 일단 질병에 연관된 유전자 및 변이를 다양한 조건에 의해 조사한다(S203). 여기서, S203 단계는 도 4를 참고하여 후술한다.
질병-변이 선정부(110)는 S203 단계에서 조사된 질병-변이에 의학적 근거 레벨을 부여한다(S205). 이때, 도 5의 기준 정보 테이블(200)을 토대로 질병-변이들에 의학적 근거 레벨을 부여한다. 예를 들면, 조사된 질병-변이의 샘플수가 500 이상이고, 동물실험이 증명되며, 통계적 유의성이 있고, 논문에 보고된 건수가 3회, IF가 높은 학회에 보고되고, 질병 연관성이 있으면, 이러한 해당 조건을 기준 정보 테이블(200)과 비교하여 의학적 근거 레벨을 4로 할당하는 것이다.
다음, 질병-변이 선정부(110)는 의학적 근거 레벨이 부여된 질병-변이들에 기본 가중치, 예를 들면 1을 할당한다(S207).
다음, 질병-변이 선정부(110)는 최종 선정한 질병-변이들을 질병-변이 선정 DB(120)에 저장(S209)하고, 상품을 생성한다(S211). 이처럼, 생성된 상품은 도 6과 같이 질병-변이 테이블(300)로 생성된다.
이때, 질병-변이 선정 DB(120)는 도 5의 기준 정보 테이블(200) 및 도 6의 질병-변이 테이블(300)을 저장한다.
한편, 질병-변이 선정부(110)는 S201 단계에서 최초가 아니라면, 즉, 질병-변이를 재선정하는 과정(S3)으로 판단되면, 질병 발생과 연관된 변이를 조사한다(S213). 즉, 도 2의 S107 단계에서 사용자 피드백을 통해 실제 발생한 질병의 위험도 예측시 사용된 질병-변이들을 확인한다.
질병-변이 선정부(110)는 S213 단계에서 조사된 질병-변이 중 가중치가 높은 질병-변이들 중에서 의학적 근거 레벨 등을 고려하여 질병 위험도 예측에 사용할 질병-변이들을 재선정한다(S215).
질병-변이 선정부(110)는 S215 단계에서 재선정한 질병-변이들을 질병-변이 선정 DB(120)에 저장(S217)하고, 상품을 업데이트한다(S219). 이처럼, 업데이트된 상품은 도 6과 같이 질병-변이 테이블(300)에 갱신된다.
도 4는 도 3의 S203 단계를 상세히 나타낸 순서도이다.
도 4를 참조하면, 질병-변이 선정부(110)는 질병과 관련된 유전자 및 변이 정보가 저장된 해외 사이트 및 데이터베이스를 통해 질병과 관련된 유전자 및 변이 정보를 조사한다(S301).
여기서, 질병-변이 선정부(110)는 질병과 유전자 간의 연관성을 전문가들이 리뷰한 GeneReview 사이트(http://www.ncbi.nlm.nih.gov/books/), 멘델리안 법칙을 따르는 희귀 질환 정보를 모아놓은 OMIM(http://www.ncbi.nlm.nih.gov/omim), Pubmed Site(http://pubmed.com), 전세계적으로 유전자 검사 기관이 수행하고 있는 검사항목 정보를 담고 있는 GTR(Genetic Testing Reistry)(http://www.ncbi.nlm.nih.gov/gtr/)를 포함할 수 있다.
다음, 질병-변이 선정부(110)는 질병과 인종 간의 연관성 연구 논문을 조사한다(S303).
다음, 질병-변이 선정부(110)는 S301 단계, S303 단계를 통해 수집된 정보들을 토대로 전문가 리뷰(S305) 등을 통해 질병-변이 선정을 결정한다(S307).
여기서, S301 단계, S303 단계, S305 단계를 위해서는 키보드 등 입력 장치와, 입력 장치를 통해 입력 및 저장하고 출력하기 위한 프로그램이 내장된 컴퓨터, 모니터를 통해 운용자가 조사한 각종 정보를 입력받을 수 있다. 또는 프로그램을 통해 네트워크에 게시된 각종 정보를 수집하고 전문가들을 통해 감수 과정을 거칠 수 있다.
도 5는 본 발명의 실시예에 따른 질병-변이 선정을 위한 기준 정보 테이블의 구성을 나타낸다.
도 5를 참조하면, 질병-변이 선정부(110)는 기준 정보 테이블(200)에 저장된 기준 정보에 기초하여 도 3 및 도 4에서 수집된 질병-변이들에 의학적 근거 레벨을 부여한다.
여기서, 기준 정보 테이블(200)은 복수의 항목으로 구성되는데, 이러한 복수의 항목은 의학적 근거 레벨(201), 샘플수(203), 동물실험 증명(205), 통계적 유의성(207), 논문에 보고된 건수(209), IF(impact factor, 영향력 지수)가 높은 학회에 보고된 여부(211) 및 타 질병 관련 DB에 보고된 근거 레벨(213)을 포함한다.
의학적 근거 레벨(201)은 질병의 위험도 단계를 나타내는 정보가 아니다. 의학적 근거 레벨(201)은 질병-변이 간의 연관성이 어느 정도 되는지에 대한 강도를 나타내는 척도이다. 의학적 근거 레벨(201)은 질병과 연관된 변이를 최종 선정할 때 참고 자료로 이용된다.
샘플수(203)는 질병-변이 연관성 연구에서 사용된 샘플 수로서, 예를 들면,질병 A 걸린 사람 100명, 질병 A 안 걸린 사람 150명이면 샘플 수는 250명이 수록된다.
동물실험 증명(205)은 질병-변이 연관성 연구가 동물실험 등을 통해 그 유전적 기능이 연구된 경우를 나타낸다.
통계적 유의성(207)은 질병-변이 연관성 연구에서 통계적인 차이가 있었는 지 여부를 나타낸다. 예를 들면, GWAS(Genome-wide Association Study) 연구에서는 P-value에서 유의한 차이가 있었는지, 또는 Linkage Analysis에서 LOD 값이 유의한 차이가 있는지 여부를 말한다.
질병 DB에 보고된 근거 레벨(213)은 질병-변이 연관성 정보를 담고 있는 타 DB에서의 정보들이 있는 경우를 나타낸다.
예를 들면, ClinVar()DB에서 연관성이 있는지 정도에 따라 연관성 있음 또는 없음으로 표기된다.
도 6은 본 발명의 실시예에 따른 질병-변이 테이블의 구성을 나타낸다.
도 6을 참조하면, 질병-변이 테이블(300)은 질병 위험도 예측에 활용하기 위해 도 2의 S101 단계, 도 3의 S209 단계, S211 단계, S217 단계에서 선정한 질병-변이 정보를 저장한다.
질병-변이 테이블(300)은 복수의 항목으로 구성되는데, 복수의 항목은 상품 ID(301), 상품 버전(303), 상품 버전 ID(305), 질병명(307), 변이 ID(309), 의학적 근거 레벨(311), 가중치(313), 변이 발견 횟수(315), 상품 제공 횟수(317), 질병 발생 여부(319) 및 최종 연관성 스코어(321)를 포함한다.
상품 ID(301)는 상품 고유 ID를 저장한다. 상품 ID(301)는 일반이 대상, 질병 종류 등으로 구분될 수 있으며, 사용된 질병-변이들의 조합으로 구성된다.
상품 버전(303)은 상품의 버전 정보를 저장한다.
상품 버전 ID(305)는 상품 버전을 나타내는 고유 ID를 저장한다. 여기서, 상품 ID와 상품 버전이 합쳐져 상품 버전 별로 고유 ID가 부여된다.
질병명(307)은 질병 위험도 예측 대상인 질병 정보가 수록된다. 예를 들면, 1종 당뇨병 과 같이 질병명 또는 1종 당뇨병을 의미하는 질병코드가 수록된다.
변이 ID(309)는 질병명(307)에 수록된 질병과 연관된 변이(Variant)의 고유 ID가 수록된다. 여기서, 변이는 개인의 유전 서열(Genome Sequence)이 표준 인간 유전서열(Human Genome Reference)과 비교하여 다른 서열을 말하며, 개인의 특성 및 질병 등과 관련 있는 서열을 말한다.
변이 ID는 2가지 형태로 표기되는데, 한가지 형태는 염색체 번호(염색체 내 변이 위치)로 표기될 수 있다. 다른 형태는 rsID 즉, dbSNP(The Single Nucleotide Polymorphism Database) DB의 ID로 표기될 수 있다. 여기서, dbSNP는 미국국립생물센터에서 제공하는 변이 DB이다. SNP(single nucleotide polymorphism)는 dbSNP(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi)를 통하여 그 목록이 공유되고 있다.
의학적 근거 레벨(311)은 질병명(307)에 수록된 질병과 변이 ID(309)에 수록된 변이 간의 연관성에 대한 의학적 근거 레벨 정보를 수록하며, 도 5의 의학적 근거 레벨(201)에 수록된 정보를 토대로 설정된다. 예를 들면, 변이 ID 'rs79031'이 기준 정보 테이블(200)에 기초할 때, 샘플수가 1000 이상이고, 동물실험이 증명되며, 통계적 유의성이 있고, 논문에 보고된 건수가 2회 이상이며, IF가 높은 학회에 보고되고 질병 DB에 보고된 근거 레벨에 따라 질병 연관성이 있으면, 의학적 근거 레벨은 '5'로 설정된다.
가중치(313)는 질병-변이 관계에 대한 가중치 정보를 나타낸다.
변이 발견 횟수(315)는 해당 상품 버전을 이용한 사람 중에 실제 해당 변이가 발견된 횟수를 나타낸다.
상품 제공횟수(317)는 해당 상품 버전을 이용한 사람 수를 나타낸다.
질병 발생여부(319)는 실제 질병이 발생한 사람 수를 나타낸다.
최종 연관성 스코어(321)는 최종 연관성 Score를 나타낸다. 최종 연관성 스코어를 기준으로 위험도 예측 시 사용할 질병-변이가 선정된다.
질병-변이 선정부(110)는 의학적 근거 레벨과 가중치를 고려하여 최종 연관성 스코어를 계산한다.
Figure pat00001
여기서,
Figure pat00002
는 의학적 근거 레벨의 상관 계수이고,
Figure pat00003
는 가중치의 상관계수이며, X는 의학적 근거레벨 값이고, Y는 가중치 값을 나타낸다.
이때, 의학적 근거레벨 상관계수, 가중치의 상관계수는 상수 값으로 의학적 근거 레벨과 가중치 간의 Logistic Regression 통계 분석으로 나온 상관계수 값을 말한다
X는 질병-변이 테이블(200)의 311 항목에 수록된 값이고, Y는 질병-변이 테이블(200)의 313 항목에 수록된 값이다.
예를 들면,
Figure pat00004
가 1이고,
Figure pat00005
가 2의 상관계수 상수 값을 가질 때, 질병-변이 테이블(200)에 따르면, 변이 rs79031에 대한 의학적 근거 레벨은 5이고, 가중치는 1.2439이다. 따라서, 변이 rs79031에 대한 최종 연관성 스코어 값은
Figure pat00006
으로 계산된다.
질병-변이 선정부(110)는 질병-변이 테이블(200)의 의학적 근거레벨, 가중치 등을 고려한 최종 연관성 스코어 값(321)이 높은 순으로 차기 상품 버전(0.1, 0.2)(303)을 위한 질병-변이 선정 과정에 참고한다.
예를 들면, PGS1001 상품 0.1 버전에서 사용한 변이 5개 중 최종 연관성 스코어가 높은 "rs79031","rs99396"을 우선적으로 상품 0.2 때 포함한다. 따라서, 질병-변이 테이블(200)에서 0.2 버전은 0.1 버전에서 사용된 기존 변이(P1)와 0.2 버전에만 사용된 새로운 변이(P3)를 포함한다.
도 7은 본 발명의 실시예에 따른 질병 위험도 예측 과정을 나타낸 순서도로서, 도 1의 질병 위험도 예측부(130)의 동작을 나타내고, 도 2의 S103 단계를 세부적으로 나타낸 것이다.
도 7을 참조하면, 질병 위험도 예측부(130)는 질병과 연관된 유전자 영역에서 발견된 사용자 변이 ID들이 수록된 사용자 변이 ID 리스트를 생성한다(S401). 질병 위험도 예측부(130)는 질병-변이 선정부(110)가 선정한 질병과 연관된 유전자 및 질병-변이들을 사용자 유전자 정보와 매칭하여 사용자 변이 ID 리스트를 생성한다. 사용자 변이 ID는 앞서 설명한 것처럼, 염색체 위치 또는 rsID로 구성된다.
질병 위험도 예측부(130)는 예측 대상 질병이 희귀질환인지 또는 복합질환인지를 판단한다(S403).
복합질환, 즉 유전적, 환경적 요인 등 복합적 요인으로 발생하는 질환으로 판단되면, 사용자 변이 ID 리스트에 포함된 사용자 변이가 질병-변이 테이블(300)에 저장된 변이인지를 판단한다(S405). 이때, 저장된 변이가 아니라면, 질병과 관련없는 정상적인 변이로 판단하여 해당 사용자 변이는 위험도 예측에서 제외시킨다(S407).
반면, 저장된 변이라면, 질병-변이 테이블(300)에서 일치된 변이 ID를 이용하여 질병 위험도 예측을 계산한다(S409). 그리고 계산한 결과를 포함하는 결과 리포트를 사용자에게 제공한다(S411).
여기서, 질병 위험도 예측 계산에 Post-test Probability 방법, OR Ratio를 이용한 계산, Relative Risk를 이용한 계산 방법 등이 사용될 수 있으나, 이에 국한되는 것은 아니고 다양한 질병 위험도 예측 방법이 사용될 수 있다.
질병 위험도 예측부(130)는 S403 단계에서 희귀질환으로 판단되면, 사용자 변이 ID 리스트에 포함된 사용자 변이가 질병-변이 테이블(300)에 저장된 변이인지를 판단한다(S413). 저장된 변이라면, 질병 위험도 예측부(130)는 사용자 변이 ID는 질병을 유발하는 요소이므로 질병에 대한 고위험군으로 분류한다(S415). 그리고 분류 결과를 포함하는 결과 리포트를 사용자에게 제공한다(S411).
질병 위험도 예측부(130)는 S413 단계에서 질병-변이 테이블(300)에 저장된 변이가 아니라면, 아직 알려지지 않은 변이, 즉, 개인에 특이적으로 발견된 변이일 수 있으므로 변이 빈도가 희귀한지를 판단한다(S417).
여기서, 변이 빈도 확인은 1000 Genome DB(http://www.1000genomes.org/), ExAC DB(http://exac.broadinstitute.org/) 등을 활용한다. 변이 빈도가 희귀질환 유병률 등을 고려해 0.05 또는 0.01 미만 또는 그 이하일 때 희귀하다고 정의한다.
질병 위험도 예측부(130)는 S417 단계에서 변이 빈도가 희귀하다고 판단되면, 사용자 변이 ID가 단백질 구조에 변형을 주는지(Protein Altering), 기능을 상실하게 만드는지(Loss of function)를 판단한다(S419).
S419 단계에서 단백질 구조에 영향을 주거나 기능을 상실하게 하면, 해당 질병을 고위험군으로 분류(S415)하고 그 결과 리포트를 사용자에게 제공한다(S411).
반면, S417 단계에서 변이 빈도가 희귀한 것은 아니거나 또는 S419 단계에서 단백질 구조에 영향을 주거나 기능을 상실하게 하는 것이 아니라면, 해당 변이는 제외시킨다(S421).
한편, S401 단계~ S421 단계는 질병-변이 테이블(300)에서 상품에 포함되는 질병들에 대해 각각 수행될 수 있다.
질병 위험도 예측부(130)는 질병이 희귀질환인 경우 해당하는 사용자 변이 ID가 질병-변이 테이블(300)에 있거나 또는 변이 빈도가 희귀하고, 해당하는 변이가 단백질 구조에 영향을 주거나 기능을 상실하게 하면, 고위험군으로 분류한다. 그리고 질병이 복합질환인 경우 상대적 위험도로 분류하고, 희귀질환의 경우 고위험군/저위험군 등으로 분류하고 해당 분류 결과가 포함된 결과 리포트를 제공한다(S411). 결과 리포트는 도 8과 같이 구현될 수 있다.
도 8은 본 발명의 실시예에 따른 질병 위험도 예측 결과를 사용자에게 제공하는 예시도로서, 도 1의 사용자 제공부(140)의 동작을 나타내고, 도 2의 S105 단계를 나타낸 것이다.
도 8을 참조하면, 사용자 제공부(140)는 질병 위험도 예측부(130)로부터 분석 결과를 전달받아 사용자 단말(미도시)로 제공한다. 이때, 사용자 제공부(140)는 사용자 단말(미도시)에 설치 및 실행되는 앱, 예를 들면 육아 수첩 앱을 통해 결과 리포트를 제공할 수 있다. 이때, 사용자 제공부(140)는 상품 버전 ID, 질병명, 변이 ID 및 질병 위험도가 포함된 결과 리포트를 제공할 수 있다.
사용자 제공부(140)는 사용자 질병 위험도 예측 결과에 따라 산모 수첩 또는 육아 수첩 앱 등에서 해당 질병에 대한 모바일 케어 서비스를 모바일로 제공하면서 향후, 질병 발병 여부를 수집한다. 실예로 사용자 제공부(140)는 분석 서비스에서"1형 당뇨병 고위험군"으로 분석 결과가 나왔다면, 해당 정보를 모바일로 전송한다. 그리고"1형 당뇨병"에 대한 "원인", "치료법", "주의점", "예상증상" 등 다양한 케어 서비스 정보를 제공한다.
도 9는 본 발명의 실시예에 따른 사용자 피드백을 나타낸 예시도이고, 도 10은 본 발명의 실시예에 따른 사용자 피드백 과정을 나타낸 순서도이며, 도 11은 사용자 피드백 데이터 포맷을 나타내며, 도 12는 본 발명의 실시예에 따른 질병-변이 테이블의 업데이트 예시도이다.
도 9 및 도 10은 사용자 피드백부(150)의 동작을 나타내고, 도 2에서 S107 단계를 세부적으로 나타낸 것이다.
도 9를 참조하면, 사용자는 실제로 질병이 발병하면, 질병 발생 여부를 사용자 단말(미도시)를 통해 사용자 피드백부(150)로 전송한다. 이때, 질병 발생 여부는 상품 버전 ID, 질병명, 변이 ID, 질병 발생 여부가 포함된다. 사용자는 모바일 케어 서비스를 받으며 실제 질병이 발생했는지 여부를 체크한다. 질병 발생 여부는 사용자 단말(미도시)에서 직접 질병을 선택하거나, 관련 설문조사 등을 통해 질병 발생 여부를 추정하여 발생 여부를 판단할 수 있다. 실제 질병 발생 여부가 판단되면, 상품 버전 ID와 질병명, 변이 ID, 발생여부 등을 사용자 피드백부(150)로 전송한다.
도 10을 참조하면, 사용자 피드백부(150)는 사용자 단말(미도시)로부터 실제 발생한 질병과 관련된 상품 ID, 증상명(질병명), 질병 발생 여부 등 사용자 피드백 정보를 수집한다(S501).
이때, 수집되는 정보는 도 11과 같은 데이터 포맷일 수 있다.
도 11을 참조하면, 사용자 피드백 정보(400)는 상품 버전 ID(401), 질병명(403), 변이 ID(405) 및 질병 발생 여부(407)를 포함한다. 여기서, 상품 버전 ID(401), 질병명(403), 변이 ID(405) 및 질병 발생 여부(407)는 사용자에게 제공된 질병 위험도 예측 리포트 중에서 실제로 발생한 질병과 관련된 상품 정보(401), 발병한 질병 정보(403), 발병한 질병의 위험도 예측에 사용된 변이 정보(405)가 포함된다.
다시, 도 10을 참조하면, 사용자 피드백부(150)는 S501 단계에서 수집한 사용자 피드백 정보를 토대로 획득(S503)한 질병-변이에 대한 질병 발생 여부를 상품 버전 ID(401), 질병명(403), 변이 ID(405)에 해당하는 질병-변이 테이블(300)의 질병 발생 여부 항목(319)에 기록한다(S505). 그리고 가중치 설정부(160)는 기록된 정보를 바탕으로 가중치를 계산하여 질병-변이 테이블(300)의 가중치 항목(313)에 반영한다(S507). 즉, 가중치 설정부(160)는 사용자로부터 받은 정보를 바탕으로 질병-변이 테이블(300)에서 해당 질병-변이에 대해 가중치를 부여한다. 질병-변이 테이블(300)에서 사용자로부터 받은 정보의 상품 버전 ID(401), 질병명(403), 변이 ID(405)가 일치하는 항목에 대해 질병 발생 여부(319)의 값을 증가시킨다. 질병 발생 여부(319)는 사용자 피드백 정보가 수신된 사용자 수만큼 증가된다. 그리고 계산된 가중치를 가중치(313)에 업데이트한다.
여기서, 가중치는 다음 수학식 2를 통해 산출된다.
Figure pat00007
여기서, 질병 발생 여부는 질병-변이 테이블(300)의 질병 발생여부(319)에 수록된 실제 질병이 발생한 사람 수를 나타낸다. 그리고 변이 발견 횟수는 질병-변이 테이블(300)의 변이 발견 횟수(315)에 수록된 해당 상품 버전을 이용한 사람 중에 실제 해당 변이가 발견된 횟수를 나타낸다.
도 12를 참조하면, '변이 ID = rs79031', '변이 ID = rs16176'에 대해 수학식 2를 적용하면, 각각 가중치는 1.2682, 1.2143으로 업데이트된다.
한편, 도 13은 본 발명의 다른 실시예에 따른 질병 위험도 분석 장치의 개략적인 도면이다.
도 13을 참고하면, 질병 위험도 분석 장치(500)는 프로세서(510), 메모리(530), 적어도 하나의 저장장치(550), 입출력(input/output, I/O) 인터페이스(570) 및 네트워크 인터페이스(590)를 포함한다.
프로세서(510)는 중앙처리 유닛(CPU)이나 기타 칩셋, 마이크로프로세서 등으로 구현될 수 있으며, 메모리(530)는 동적 랜덤 액세스 메모리(DRAM), 램버스 DRAM(RDRAM), 동기식 DRAM(SDRAM), 정적 RAM(SRAM) 등의 RAM과 같은 매체로 구현될 수 있다.
저장 장치(550)는 하드디스크(hard disk), CD-ROM(compact disk read only memory), CD-RW(CD rewritable), DVD-ROM(digital video disk ROM), DVD-RAM, DVD-RW 디스크, 블루레이(blue-ray) 디스크 등의 광학디스크, 플래시메모리, 다양한 형태의 RAM과 같은 영구 또는 휘발성 저장장치로 구현될 수 있다.
또한, I/O 인터페이스(570)는 프로세서(510) 및/또는 메모리(530)가 저장 장치(550)에 접근할 수 있도록 하며, 네트워크 인터페이스(590)는 프로세서(510) 및/또는 메모리(530)가 네트워크(미도시)에 접근할 수 있도록 한다.
이 경우, 프로세서(510)는 질병-변이 선정부(110), 질병 위험도 예측부(130), 사용자 제공부(140), 사용자 피드백부(150) 및 가중치 설정부(160)의 기능의 적어도 일부 기능을 구현하기 위한 프로그램 명령을 메모리(530)에 로드하고, 질병-변이 선정 DB(120)의 기능을 저장 장치(550)에 위치시켜서, 도 1을 참고로 하여 설명한 동작이 수행되도록 제어할 수 있다.
또한, 메모리(530) 또는 저장장치(550)는 프로세서(510)와 연동하여 질병-변이 선정부(110), 질병 위험도 예측부(130), 사용자 제공부(140), 사용자 피드백부(150) 및 가중치 설정부(160)의 기능이 수행되도록 할 수 있다.
도 13에 도시한 프로세서(510), 메모리(530), 적어도 하나의 저장장치(550), 입출력(I/O) 인터페이스(570) 및 네트워크 인터페이스(590)는 하나의 컴퓨터에 구현될 수도 있으며 또는 복수의 컴퓨터에 분산되어 구현될 수도 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (15)

  1. 네트워크에 연결된 컴퓨터 기반의 질병 위험도 분석 장치가 질병 위험도를 예측하는 방법으로서,
    질병과 연관된 질병-변이들을 선정하는 단계,
    상기 질병-변이들을 이용하여 질병 위험도를 예측하는 단계,
    상기 질병 위험도의 예측 결과를 상기 네트워크를 통해 사용자 단말로 제공하는 단계,
    상기 사용자 단말로부터 사용자의 질병 발생 여부를 피드백 받는 단계, 그리고
    상기 피드백을 통해 실제로 발생한 질병을 확인하고, 상기 실제로 발생한 질병의 위험도 예측시 사용된 하나 이상의 질병-변이에 가중치를 설정하는 단계를 포함하고,
    상기 선정하는 단계는,
    상기 질병-변이들 중에서 상기 가중치가 상대적으로 높은 질병-변이를 우선적으로 선택하는 질병 위험도 예측 방법.
  2. 제1항에 있어서,
    상기 제공하는 단계 및 상기 피드백받는 단계는,
    모바일 서비스를 통해 구현되는 질병 위험도 예측 방법.
  3. 제1항에 있어서,
    상기 선정하는 단계는,
    최초 선정시, 질병과 연관된 유전자 및 변이를 조사하는 단계,
    조사된 질병-변이들에 의학적 근거 레벨 및 기본 가중치를 각각 부여하는 단계,
    상기 의학적 근거 레벨을 고려하여 질병 위험도 예측시 사용할 질병-변이들을 최종 선정하는 단계, 그리고
    최종 선정한 질병-변이들을 토대로 상품을 생성하는 단계를 포함하고,
    상기 예측하는 단계는,
    상기 상품에 포함된 질병-변이들을 이용하여 위험도를 예측하는 질병 위험도 예측 방법.
  4. 제3항에 있어서,
    상기 조사하는 단계는,
    질병과 관련된 유전자 및 변이 정보가 저장된 다수의 해외 사이트 및 데이터베이스로부터 질병과 관련된 유전자 및 변이를 조사하고, 질병과 인종간의 연관성 연구 논문을 조사하며, 전문가 리뷰 정보를 수집하고,
    상기 의학적 근거 레벨은,
    수집한 정보를 토대로 샘플수, 동물실험 증명, 통계적 유의성, 논문에 보고된 건수, 영향력 지수가 높은 학회에 보고되었는지 여부 및 다른 데이터베이스에 보고된 근거 레벨을 고려하여 부여되는 질병 위험도 예측 방법.
  5. 제4항에 있어서,
    상기 상품을 생성하는 단계는,
    질병과 연관된 서로 다른 질병-변이들의 조합을 포함하고, 상기 조합 별로 상품 고유 ID 및 상품 버전 정보를 포함하는 상품 식별 정보가 매칭되며, 상기 질병-변이들마다 상기 의학적 근거 레벨, 상기 가중치, 변이 발견 횟수, 상품 제공 횟수, 질병 발생 여부 및 최종 연관성 스코어가 포함된 상품을 생성하며,
    상기 최종 연관성 스코어는 상기 질병 위험도 예측시 사용할 질병-변이들을 선정하는데 사용되는 정보인 질병 위험도 예측 방법.
  6. 제5항에 있어서,
    상기 최종 연관성 스코어는,
    의학적 근거레벨 상관계수, 가중치의 상관계수, 상기 의학적 근거 레벨, 상기 가중치를 이용하여 계산되는 질병 위험도 예측 방법.
  7. 제5항에 있어서,
    상기 피드백받는 단계는,
    사용자에게 실제로 발생한 질병과 관련된 상기 상품 식별 정보, 질병명, 질병-변이 ID 및 질병 발생 여부가 포함된 사용자 피드백 정보를 수신하고,
    상기 선정하는 단계는,
    최초 선정이 아닌 경우, 상기 사용자 피드백 정보를 통해 확인된 상기 실제로 발생한 질병과 관련된 질병-변이들에 가중치를 증가시키고, 상기 가중치를 토대로 질병 위험도 예측시 사용할 질병-변이를 재선정하는 질병 위험도 예측 방법.
  8. 제7항에 있어서,
    상기 가중치는,
    상기 질병 발생 여부 및 상기 변이 발견 횟수를 이용하여 계산되는 질병 위험도 예측 방법.
  9. 제7항에 있어서,
    상기 질병 위험도를 예측하는 단계는,
    최초 선정 또는 재선정한 질병과 연관된 유전자 및 질병-변이들을 사용자 유전자 정보와 매칭하여 사용자 변이 ID 리스트를 생성하는 단계,
    질병이 복합질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것이 아니라면, 상기 질병과 관련없는 변이로 판단하여 제외시키는 단계,
    상기 질병이 복합질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것이라면, 상기 상품에 포함된 질병-변이들을 토대로 질병 위험도를 예측하는 단계,
    상기 질병이 희귀질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것이라면, 질병 위험도를 고위험도로 분류하는 단계,
    상기 질병이 희귀질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것은 아니지만, 상기 질병-변이들이 단백질 구조에 영향을 주거나 기능을 상실하게 하는 것이면, 해당 질병을 고위험군으로 분류하는 단계, 그리고
    상기 질병이 희귀질환이고, 상기 사용자 변이 ID 리스트에 포함된 질병-변이들이 상기 상품에 포함된 것이 아니거나 또는 상기 질병-변이들이 단백질 구조에 영향을 주거나 기능을 상실하게 하는 것이 아니라면, 상기 질병과 관련없는 변이로 판단하여 제외시키는 단계
    를 포함하는 질병 위험도 예측 방법.
  10. 제9항에 있어서,
    상기 사용자 단말로 제공하는 단계는,
    상품 버전 ID, 질병명, 변이 ID 및 질병 위험도가 포함된 결과 리포트를 스마트폰 어플리케이션을 통해 모바일 서비스로 제공하는 질병 위험도 예측 방법.
  11. 네트워크에 연결된 컴퓨터 기반의 질병 위험도 분석 장치로서,
    의학적 근거 레벨을 설정하기 위한 기준 정보 테이블 및 질병 위험도 예측시 사용할 질병-변이 정보가 수록된 질병-변이 테이블을 저장하는 질병-변이 선정 DB,
    상기 기준 정보 테이블을 이용하여 질병과 연관된 질병-변이들을 선정하고, 선정된 질병-변이 정보를 상기 질병-변이 테이블에 수록하는 질병-변이 선정부,
    상기 질병-변이 테이블에 수록된 질병-변이들을 이용하여 질병 위험도를 예측하는 질병 위험도 예측부,
    상기 질병 위험도 예측부의 질병 위험도 예측 결과를 상기 네트워크를 통해 사용자 단말로 제공하는 사용자 제공부,
    상기 사용자 단말로부터 사용자의 질병 발생 여부를 피드백받는 사용자 피드백부, 그리고
    상기 피드백을 통해 실제로 발생한 질병을 확인하고, 상기 실제로 발생한 질병의 위험도 예측시 사용된 하나 이상의 질병-변이에 가중치를 설정하는 가중치 설정부를 포함하고,
    상기 질병-변이 선정부는,
    상기 질병-변이 테이블에 포함된 질병-변이들 중에서 상기 가중치가 상대적으로 높은 질병-변이를 우선적으로 선택하는 질병 위험도 분석 장치.
  12. 제11항에 있어서,
    상기 기준 정보 테이블은,
    질병-변이 연관성 연구에서 사용된 샘플 수, 질병-변이 연관성 연구가 동물실험 등을 통해 그 유전적 기능이 연구된 경우를 나타내는 동물실험 증명, 질병-변이 연관성 연구 결과의 통계적 유의성 및 질병-변이 연관성 정보를 담고 있는 타 질병 DB에서의 정보들이 있는 경우를 나타내는 타 질병 관련 DB에 보고된 근거 레벨을 토대로 설정된 질병-변이 간의 연관성이 어느 정도 되는지에 대한 강도를 나타내는 척도인 의학적 근거 레벨을 포함하고,
    상기 질병-변이 선정부는,
    질병과 관련된 유전자 및 변이 정보가 저장된 다수의 해외 사이트 및 데이터베이스로부터 질병과 관련된 유전자 및 변이를 조사하고, 질병과 인종간의 연관성 연구 논문을 조사하며, 전문가 리뷰 정보를 수집하고, 수집한 정보 및 상기 의학적 근거 레벨을 토대로 질병과 연관된 질병-변이들을 선정하는 질병 위험도 분석 장치.
  13. 제12항에 있어서,
    상기 질병-변이 테이블은,
    서로 다른 질병-변이들의 조합으로 구성되는 상품의 ID 및 버전 정보, 질병명, 질병과 연관된 질병-변이들의 ID, 각 질병-변이들의 의학적 근거 레벨, 상기 각 질병-변이들의 가중치, 상기 상품을 이용한 사람 중에 실제 해당 질병-변이가 발견된 횟수, 상품 제공 횟수, 상기 질병이 실제로 발생한 사람 수 및 상기 의학적 근거 레벨과 상기 가중치를 이용하여 계산된 최종 연관성 스코어를 저장하고,
    상기 질병-변이 선정부는,
    상기 최종 연관성 스코어가 높은 순서대로 질병-변이들을 선정하는 질병 위험도 분석 장치.
  14. 제13항에 있어서,
    상기 사용자 피드백부는,
    사용자에게 실제로 발생한 질병과 관련된 상기 상품의 ID 및 버전 정보, 상기 질병명, 상기 질병-변이들의 ID 및 질병 발생 여부가 포함된 사용자 피드백 정보를 수신하고,
    상기 가중치 설정부는,
    상기 사용자 피드백 정보를 통해 확인된 상기 실제로 발생한 질병과 관련된 질병-변이들에 가중치를 증가시키는 질병 위험도 분석 장치.
  15. 제14항에 있어서,
    상기 가중치 설정부는,
    상기 질병 발생 여부 및 상기 변이 발견 횟수를 이용하여 계산된 가중치를 상기 질병-변이들에 설정하는 질병 위험도 분석 장치.
KR1020150103951A 2015-07-22 2015-07-22 질병 위험도 예측 방법 및 이를 수행하는 장치 KR102508971B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020150103951A KR102508971B1 (ko) 2015-07-22 2015-07-22 질병 위험도 예측 방법 및 이를 수행하는 장치
CN201680050358.2A CN107924719B (zh) 2015-07-22 2016-07-11 疾病风险预测方法以及执行该方法的装置
US15/746,524 US20180218115A1 (en) 2015-07-22 2016-07-11 Disease risk prediction method, and device for performing same
PCT/KR2016/007501 WO2017014469A1 (ko) 2015-07-22 2016-07-11 질병 위험도 예측 방법 및 이를 수행하는 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150103951A KR102508971B1 (ko) 2015-07-22 2015-07-22 질병 위험도 예측 방법 및 이를 수행하는 장치

Publications (2)

Publication Number Publication Date
KR20170011389A true KR20170011389A (ko) 2017-02-02
KR102508971B1 KR102508971B1 (ko) 2023-03-09

Family

ID=57834223

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150103951A KR102508971B1 (ko) 2015-07-22 2015-07-22 질병 위험도 예측 방법 및 이를 수행하는 장치

Country Status (4)

Country Link
US (1) US20180218115A1 (ko)
KR (1) KR102508971B1 (ko)
CN (1) CN107924719B (ko)
WO (1) WO2017014469A1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101839572B1 (ko) * 2017-11-21 2018-03-16 연세대학교 산학협력단 질병 관련 유전자 관계 분석 장치 및 방법
WO2020111378A1 (ko) * 2018-11-29 2020-06-04 가천대학교 산학협력단 질환 진단 보조를 위한 데이터 분석 방법 및 시스템
KR102632584B1 (ko) * 2023-11-01 2024-02-01 김재진 증강현실을 이용하여 반려동물의 미용 디자이너를 매칭하는 서비스를 제공하는 장치, 시스템, 방법 및 프로그램
KR102637089B1 (ko) * 2023-10-11 2024-02-15 김재진 반려동물을 관리하는 서비스를 제공하는 장치, 시스템, 방법 및 프로그램
KR102643686B1 (ko) * 2023-10-18 2024-03-05 주식회사 쓰리빌리언 증상 재구성을 통한 환자의 질병 진단 시스템

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112349411B (zh) * 2020-12-03 2021-07-23 郑州大学第一附属医院 基于大数据的icu病人抢救风险预测方法与系统
CN113807941B (zh) * 2020-12-29 2024-03-05 京东科技控股股份有限公司 风险检测方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080113307A (ko) 2007-01-17 2008-12-30 삼성전자주식회사 모바일 건강관리 서비스를 위한 질환 유무 판별 프레임 웍제공 시스템 및 방법
KR20090105921A (ko) * 2006-11-30 2009-10-07 네이비제닉스 인크. 유전자 분석 시스템 및 방법
KR20140103611A (ko) * 2013-02-18 2014-08-27 (주)지노첵 질병 관련 유전체 분석 서비스 시스템 및 그 방법
KR20150078236A (ko) * 2013-12-30 2015-07-08 주식회사 케이티 개인 건강관리 방법 및 시스템

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9828637B2 (en) * 2010-04-18 2017-11-28 Wake Forest University Health Sciences Methods of predicting predisposition to or risk of kidney disease
KR101325736B1 (ko) * 2010-10-27 2013-11-08 삼성에스디에스 주식회사 바이오 마커 추출 장치 및 방법
US9940434B2 (en) * 2012-09-27 2018-04-10 The Children's Mercy Hospital System for genome analysis and genetic disease diagnosis
US20140278133A1 (en) * 2013-03-15 2014-09-18 Advanced Throughput, Inc. Systems and methods for disease associated human genomic variant analysis and reporting
US20150066378A1 (en) * 2013-08-27 2015-03-05 Tute Genomics Identifying Possible Disease-Causing Genetic Variants by Machine Learning Classification
TW201516725A (zh) * 2013-10-18 2015-05-01 Tci Gene Inc 單一核苷酸多型性疾病發生率預測系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090105921A (ko) * 2006-11-30 2009-10-07 네이비제닉스 인크. 유전자 분석 시스템 및 방법
KR20080113307A (ko) 2007-01-17 2008-12-30 삼성전자주식회사 모바일 건강관리 서비스를 위한 질환 유무 판별 프레임 웍제공 시스템 및 방법
KR20140103611A (ko) * 2013-02-18 2014-08-27 (주)지노첵 질병 관련 유전체 분석 서비스 시스템 및 그 방법
KR20150078236A (ko) * 2013-12-30 2015-07-08 주식회사 케이티 개인 건강관리 방법 및 시스템

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101839572B1 (ko) * 2017-11-21 2018-03-16 연세대학교 산학협력단 질병 관련 유전자 관계 분석 장치 및 방법
WO2020111378A1 (ko) * 2018-11-29 2020-06-04 가천대학교 산학협력단 질환 진단 보조를 위한 데이터 분석 방법 및 시스템
KR20200064453A (ko) * 2018-11-29 2020-06-08 가천대학교 산학협력단 질환 진단 보조를 위한 데이터 분석 방법 및 시스템
KR102637089B1 (ko) * 2023-10-11 2024-02-15 김재진 반려동물을 관리하는 서비스를 제공하는 장치, 시스템, 방법 및 프로그램
KR102643686B1 (ko) * 2023-10-18 2024-03-05 주식회사 쓰리빌리언 증상 재구성을 통한 환자의 질병 진단 시스템
KR102632584B1 (ko) * 2023-11-01 2024-02-01 김재진 증강현실을 이용하여 반려동물의 미용 디자이너를 매칭하는 서비스를 제공하는 장치, 시스템, 방법 및 프로그램

Also Published As

Publication number Publication date
CN107924719B (zh) 2022-10-04
KR102508971B1 (ko) 2023-03-09
WO2017014469A1 (ko) 2017-01-26
US20180218115A1 (en) 2018-08-02
CN107924719A (zh) 2018-04-17

Similar Documents

Publication Publication Date Title
Uffelmann et al. Genome-wide association studies
Riggs et al. Technical standards for the interpretation and reporting of constitutional copy-number variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics (ACMG) and the Clinical Genome Resource (ClinGen)
KR102508971B1 (ko) 질병 위험도 예측 방법 및 이를 수행하는 장치
Sloan-Heggen et al. Comprehensive genetic testing in the clinical evaluation of 1119 patients with hearing loss
JP7343453B2 (ja) 配列に基づいた遺伝子検査の解釈および報告のための方法およびシステム
Denny et al. Systematic comparison of phenome-wide association study of electronic medical record data and genome-wide association study data
Capriotti et al. Predicting the insurgence of human genetic diseases associated to single point protein mutations with support vector machines and evolutionary information
Abraham et al. Performance and robustness of penalized and unpenalized methods for genetic prediction of complex human disease
KR101693504B1 (ko) 개인 전장 유전체의 유전변이정보를 이용한 질병원인 발굴 시스템
KR101693510B1 (ko) 개인 전장 유전체의 유전변이정보를 이용한 유전형 분석 시스템 및 방법
JP2007034700A (ja) 予測プログラムおよび予測装置
JP2020537795A (ja) 遺伝子及びゲノムの検査並びに分析におけるバリアント解釈の、監査可能な継続的な最適化のための分子エビデンスプラットフォーム
CN113272912A (zh) 使用似然比范式的用于表型驱动临床基因组的方法和装置
Favalli et al. Machine learning-based reclassification of germline variants of unknown significance: The RENOVO algorithm
US10665347B2 (en) Methods for predicting prognosis
KR20170093511A (ko) 추정 자손의 유전질환 발병 위험성을 예측하는 방법 및 시스템
KR102042824B1 (ko) 류마티스관절염 예후 예측용 snp 마커 세트
Soomro et al. Comparative genetic analysis of psoriatic arthritis and psoriasis for the discovery of genetic risk factors and risk prediction modeling
KR101693717B1 (ko) 개인 전장 유전체의 유전변이정보를 이용한 생리활성변이 분석 시스템
Reddi et al. Laboratory perspectives in the development of polygenic risk scores for disease: A points to consider statement of the American College of Medical Genetics and Genomics (ACMG)
O’Neill et al. Genetic susceptibility to severe childhood asthma and rhinovirus-C maintained by balancing selection in humans for 150 000 years
Alyousfi et al. Gene-specific metrics to facilitate identification of disease genes for molecular diagnosis in patient genomes: a systematic review
Gail et al. Probability of detecting disease-associated single nucleotide polymorphisms in case-control genome-wide association studies
Athar et al. Prevalence of the factor V Leiden mutation Arg534Gln in Western region of Saudi Arabia: functional alteration and association study with different populations
US20240029827A1 (en) Method for determining the pathogenicity/benignity of a genomic variant in connection with a given disease

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant