KR101483284B1 - 질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치 - Google Patents

질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치 Download PDF

Info

Publication number
KR101483284B1
KR101483284B1 KR20130011376A KR20130011376A KR101483284B1 KR 101483284 B1 KR101483284 B1 KR 101483284B1 KR 20130011376 A KR20130011376 A KR 20130011376A KR 20130011376 A KR20130011376 A KR 20130011376A KR 101483284 B1 KR101483284 B1 KR 101483284B1
Authority
KR
South Korea
Prior art keywords
snp
disease
filtering
combination
error rate
Prior art date
Application number
KR20130011376A
Other languages
English (en)
Other versions
KR20140098561A (ko
Inventor
이관수
강지용
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR20130011376A priority Critical patent/KR101483284B1/ko
Publication of KR20140098561A publication Critical patent/KR20140098561A/ko
Application granted granted Critical
Publication of KR101483284B1 publication Critical patent/KR101483284B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

분석 대상 질병에 관련된 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 기초로 사용자의 질병 발생 위험도를 예측하는 질병 발생 위험도 예측 장치로서, 질환군과 대조군의 전장유전체분석 정보를 기초로 추출한 SNP들의 질병 연관도를 저장하는 전장유전체분석 기반 질병 연관도 데이터베이스, 그리고 상기 질병 연관도 데이터베이스에서 가져온 분석 대상 질병 관련 SNP 데이터를 필터링 순서에 따라 단계적으로 필터링하고, 각 단계의 필터링으로 생성된 SNP 후보 조합들의 오류율을 기초로 다음 단계의 필터링을 진행하며, SNP 후보 조합들 중에서 오류율이 가장 낮은 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 SNP 조합 추출부를 포함한다.

Description

질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치{METHOD FOR EXTRACTING SINGLE NUCLEOTIDE POLYMORPHISM COMBINATION RELATED TO A DISEASE, METOHD AND APPARATUS FOR PREDICTING A DISEASE USING THE SAME}
본 발명은 질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치에 관한 것이다.
단일염기다형성(single nucleotide polymorphism, SNP)은 유전적 염기서열이 개인 간의 차이를 보이는 유전 변이의 일종으로, 단일의 염기가 다른 염기서열을 나타내며, 인구집단 내에서 1%이상의 빈도로 2개의 대립 염기서열(bi-allelic) 변이가 발생하는 위치이다.
최근 전장유전체분석(genome-wide association study)과 차세대서열분석(next-generation sequencing) 등의 유전체 분석 기술의 발달로 인간 유전체 변이형, 특히 SNP 정보를 분석할 수 있는 기술이 개발되었다.
최근 연구들에서 각각의 SNP는 일반적으로 낮은 질병 연관성을 나타내고 있지만, SNP의 특정 조합은 높은 질병 연관성을 나타낼 수 있음이 밝혀지고 있다. 질병 발생을 예측할 수 있는 최적의 SNP 조합을 발굴하기 위하여 베이즈 요인, 로지스틱 회귀분석, 은닉 마르코브 모델, 서포트 벡터 머신, 랜덤 포레스트 기계학습기 등이 최근 연구들에서 사용되고 있다.
당뇨는 혈액 내의 혈당량을 일정하게 유지시키는 호르몬인 인슐린의 비정상적인 작용에 의해 고혈당이 지속되어 대사 이상을 나타내는 질환이다. 당뇨의 유형은 인슐린 의존적인 제 1형 당뇨와 인슐린 비의존적인 제 2형 당뇨가 있다. 제 2형 당뇨는 β세포의 기능장애에 의한 인슐린 결핍 및 인슐린의 양은 정상적이나, 세포가 인슐린을 효과적으로 이용하지 못하는 인슐린 저항성으로 인해 발병된다. 그런데 제 2형 당뇨는 장년층에서 주로 발명하나, 최근 식습관의 변화 등으로 인하여 청년층에서도 발병률이 높아지고 있다.
제 2형 당뇨는 전 세계적으로 가장 흔한 복합 질환 중에 하나이며, 대사증후군뿐 아니라 심장질환, 안구질환, 심혈계관질환, 수족질환 등 다양한 합병증을 보유하고 있기 때문에 위험한 질환이다. 제 2형 당뇨는 부분적으로 유전되며 특정 감염에 의해 촉발되는 제 1형 당뇨와는 달리 유전적 요인과 생활방식과 같은 환경적 요인에 의해 점차적으로 발생하기 때문에 대표적인 흔한 복합 질병으로 알려져 있다.
유전적 변이와 제 2형 당뇨를 연관 지으려는 많은 연관성 연구가 진행되고 있으며, 그 결과 특정 몇몇 SNP가 인슐린 분비, 인슐린 감수성 등과 같은 제 2형 당뇨와 직접적으로 연관된 기능에 영향을 미친다는 연구가 발표되었다. 최근에 제 2형 당뇨와 연관 있는 SNP 조합을 발굴하기 위하여 서포트 벡터 머신 알고리즘을 활용한 연구가 발표되었으나, 소수의 모집단과 소수의 SNP에 기반하여 최적의 SNP 조합을 발굴하는데 제약이 있다.
최근 스마트폰의 기술 발전과 보급률 확대로 인하여 모바일 기반의 서비스가 다양하게 개발, 적용되고 있으며, 특히 헬스케어 분야에서도 다양한 모바일 어플리케이션이 개발되고 있다. 그러나 개인의 유전자형에 따라 개인의 특정 질병에 대한 발생 위험도를 예측해주고 이를 모바일 기반의 서비스로 언제 어디서나 이용 가능하게 하는 서비스가 없는 실정이다.
본 발명이 해결하고자 하는 과제는 각종 필터링을 통해 특정 질병 발생 위험도 예측이 가능한 단일염기다형성(single nucleotide polymorphism, SNP) 후보 조합들을 추출하고, 랜덤 포레스트 기계학습기를 이용하여 SNP 후보 조합들 중에서 에서 질병 관련성이 높은 SNP 조합을 추출하며, 질병 관련 SNP 조합과 개인의 SNP를 비교하여 개인의 질병 발생 위험도를 예측하는 방법 및 장치를 제공하는 것이다.
본 발명의 한 실시예에 따른 분석 대상 질병에 관련된 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 기초로 사용자의 질병 발생 위험도를 예측하는 질병 발생 위험도 예측 장치로서, 질환군과 대조군의 전장유전체분석 정보를 기초로 추출한 SNP들의 질병 연관도를 저장하는 전장유전체분석 기반 질병 연관도 데이터베이스, 그리고 상기 질병 연관도 데이터베이스에서 가져온 분석 대상 질병 관련 SNP 데이터를 필터링 순서에 따라 단계적으로 필터링하고, 각 단계의 필터링으로 생성된 SNP 후보 조합들의 오류율을 기초로 다음 단계의 필터링을 진행하며, SNP 후보 조합들 중에서 오류율이 가장 낮은 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 SNP 조합 추출부를 포함한다.
상기 질병 발생 위험도 예측 장치는 상기 사용자의 유전체정보를 기초로 상기 질병 관련 SNP 조합에 해당하는 개인 SNP 정보를 추출하는 개인유전체 데이터 처리부, 그리고 상기 질병 관련 SNP 조합으로 랜덤 포레스트 기계학습기를 훈련하고, 훈련된 랜덤 포레스트 기계학습기를 이용하여, 상기 개인 SNP 정보의 질병 발생 위험도를 계산하는 질병 발생 위험도 예측부를 더 포함할 수 있다.
상기 SNP 조합 추출부는 분석 대상 질병 관련 SNP 데이터를 필터링하여 SNP 후보 조합을 생성하고, SNP 후보 조합의 오류율을 계산하는 복수의 필터링부, 그리고 상기 복수의 필터링부를 제어하여 상기 분석 대상 질병 관련 SNP 데이터의 필터링을 단계적으로 수행하고, 각 필터링부의 필터링으로 생성된 SNP 후보 조합들 중에서 오류율이 가장 낮은 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 제어부를 포함하고, 상기 오류율은 랜덤 포레스트기계학습기를 이용하여 계산될 수 있다.
상기 복수의 필터링부는 본페로니 필터링부, p값 순위 필터링부, p값 범위 필터링부 중 적어도 둘 이상을 포함하고, 상기 본페로니 필터링부, 상기 p값 순위 필터링부, 상기 p값 범위 필터링부는 필터링으로 생성되는 SNP 후보 조합의 SNP 개수 범위를 기초로 필터링 순서가 결정될 수 있다.
상기 제어부는 상기 복수의 필터링부 중 제1필터링부로부터 상기 분석 대상 질병 관련 SNP 데이터를 필터링하여 생성한 제1 SNP 후보 조합들의 오류율을 수신하고, 상기 제1 SNP 후보 조합들 중에서, SNP 개수가 가장 많은 SNP 후보 조합의 오류율이 가장 낮은지 판단하여 상기 제1필터링부의 다음 단계인 제2필터링부로 상기 분석 대상 질병 관련 SNP 데이터의 필터링을 요청할지 결정할 수 있다.
상기 제어부는 상기 제1 SNP 후보 조합들 중에서, SNP 개수가 가장 많은 SNP 후보 조합의 오류율이 가장 낮은 경우, 상기 제2필터링부로 상기 분석 대상 질병 관련 SNP 데이터의 필터링을 요청할 수 있다.
상기 제어부는 상기 제1 SNP 후보 조합들 중에서, SNP 개수가 가장 많은 SNP 후보 조합보다 오류율이 낮은 최저 SNP 후보 조합이 있는 경우, 상기 최저 SNP 후보 조합을 질병 관련 SNP 조합으로 추출할 수 있다.
본 발명의 다른 실시예에 따른 질병 발생 위험도 예측 장치가 분석 대상 질병에 관련된 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 추출하는 방법으로서, 분석 대상 질병 관련 전장유전체분석 데이터를 입력받는 단계, 상기 분석 대상 질병 관련 전장유전체분석 데이터를 제1단계 필터링하여 제1 SNP 후보 조합들을 생성하는 단계, 상기 제1 SNP 후보 조합들의 오류율을 분석하여, SNP 후보 조합에 포함된 SNP 개수가 증가할수록 오류율이 낮아지는지 판단하는 단계, 그리고 상기 제1 SNP 후보 조합들 중에서, SNP 개수를 가장 많이 포함한 SNP 후보 조합보다 오류율이 낮은 최저 SNP 후보 조합이 있는 경우, 최저 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 단계를 포함하고, 상기 오류율은 랜덤 포레스트기계학습기를 이용하여 계산된다.
상기 SNP 조합 추출 방법은 상기 제1 SNP 후보 조합들 중에서, SNP 개수를 가장 많이 포함한 SNP 후보 조합의 오류율이 가장 낮은 경우, 상기 분석 대상 질병 관련 전장유전체분석 데이터를 제2단계 필터링하여 제2 SNP 후보 조합들을 생성하는 단계, 상기 제2 SNP 후보 조합들의 오류율을 분석하여, SNP 개수가 증가할수록 오류율이 낮아지는지 판단하는 단계, 그리고 상기 제2 SNP 후보 조합들 중에서 SNP 개수를 가장 많이 포함한 SNP 후보 조합보다 오류율이 낮은 최저 SNP 후보 조합이 있는 경우, 최저 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 단계를 포함할 수 있다.
상기 제1단계 필터링은 본페로니 필터링이고, 상기 제2단계 필터링은 p값 순위 필터링일 수 있다.
상기 제1단계 필터링은 p값 순위 필터링이고, 상기 제2단계 필터링은 p값 범위 필터링일 수 있다.
본 발명의 또 다른 실시예에 따른 질병 발생 위험도 예측 장치가 분석 대상 질병에 관련된 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 기초로 사용자의 질병 발생 위험도를 예측하는 방법으로서, 사용자의 질병 발생 위험도 예측을 요청받는 단계, 상기 사용자의 유전체정보에서 분석 대상 질병 관련 SNP 조합에 해당하는 개인 SNP 정보를 추출하는 단계, 그리고 랜덤 포레스트 기계학습기를 이용하여, 상기 개인 SNP 정보에 해당하는 상기 사용자의 질병 발생 위험도를 계산하는 단계를 포함한다.
상기 질병 발생 위험도 예측 방법은 전장유전체분석 정보에 포함된 분석 대상 질병 관련 SNP 데이터를 복수 단계로 필터링하여 질병 연관성을 나타내는 상기 분석 대상 질병 관련 SNP 조합을 생성하는 단계를 더 포함할 수 있다.
상기 사용자의 질병 발생 위험도를 계산하는 단계는 상기 분석 대상 관련 SNP 조합으로 훈련된 랜덤 포레스트 기계학습기를 이용할 수 있다.
본 발명의 실시예에 따르면 연관불평형 필터링, 본페로니 필터링, p값 기반 필터링 등의 필터링을 통해 추출한 최적의 SNP 후보 조합들을 랜덤 포레스트 기계학습기로 입력하므로, 계산 복잡도(computational complexity)를 낮추면서도 정확하게 질병 연관성이 높은 SNP 조합을 찾을 수 있다. 따라서, 본 발명의 실시예에 따르면 질병 연관성이 높은 SNP 조합을 기초로 질병 발생 위험도를 정확하게 예측할 수 있다. 본 발명의 실시예에 따르면 특정 질병 연관 전장유전체분석 데이터를 기반으로 하므로, 특정 질병의 발생 위험도 예측에 필요한 최적의 SNP 조합을 추출할 수 있다. 또한, 본 발명의 실시예에 따르면 스마트폰과 같은 모바일 플랫폼을 이용하여, 개인이 위치와 시간에 구애받지 않고 자신의 유전체 정보와 임상 정보를 기초로 즉시 제 2형 당뇨와 같은 특정 질병의 발생 위험도를 확인할 수 있다.
도 1은 본 발명의 한 실시예에 따른 질병 발생 위험도 예측 장치의 블록도이다.
도 2는 본 발명의 한 실시예에 따른 질병 관련 단일염기다형성 조합 추출부의 블록도이다.
도 3은 본 발명의 한 실시예에 따른 필터링부의 블록도이다.
도 4는 본 발명의 한 실시예에 따른 p값 순위 필터링의 오류율을 나타내는 그래프이다.
도 5는 본 발명의 한 실시예에 따른 단일염기다형성 조합 추출부의 질병 관련 SNP 조합 추출 방법의 흐름도이다.
도 6은 본 발명의 한 실시예에 따른 질병 발생 위험도 예측 방법의 흐름도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
도 1은 본 발명의 한 실시예에 따른 질병 발생 위험도 예측 장치의 블록도이다.
도 1을 참고하면, 질병 발생 위험도 예측 장치(100)는 질병 발생 위험도 예측이 가능한 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 추출한다. 질병 발생 위험도 예측 장치(100)는 SNP 조합과 사용자의 유전체정보를 기초로 사용자의 질병 발생 위험도를 예측한다. 질병 발생 위험도 예측 장치(100)는 사용자 단말(10)에게 사용자의 질병 발생 위험도를 제공할 수 있다. 분석 대상 질병은 다양할 수 있으며, 제 2형 당뇨를 예를 들어 설명한다.
질병 발생 위험도 예측 장치(100)는 전장유전체분석(Genome-Wide Association Study, GWAS) 기반 질병 연관도 데이터베이스(200), 질병 관련 단일염기다형성 조합 추출부(300), 개인유전체정보 데이터베이스(400), 개인유전체 데이터 처리부(500), 그리고 질병 발생 위험도 예측부(600)를 포함한다.
전장유전체분석 기반 질병 연관도 데이터베이스("앞으로 질병 연관도 데이터베이스"라고 한다)(200)는 질환군과 대조군의 전장유전체분석 정보를 저장한다. 예를 들면, 질병 연관도 데이터베이스(200)는 WTCCC(Wellcome Trust Case Control Consortium) 전장유전체분석 데이터베이스로부터 분석 대상 질병, 예를 들면 제 2형 당뇨를 앓고 있는 복수의 환자와 복수의 건강한 대조군의 전장유전체분석 정보를 수집한다. 질병 연관도 데이터베이스(200)는 수집한 전장유전체분석 정보 중에서 결손값이 크거나 대립 유전자 빈도가 낮아 분석이 어려운 SNP를 제외한 SNP들의 질병 연관도를 추출한다. 예를 들면, 질병 연관도 데이터베이스(200)는 코크란-아미티지 경향 검사(Cochran-Armitage trend test statistics)를 이용하여 SNP들의 질병 연관도를 추출한다.
질병 관련 단일염기다형성 조합 추출부(앞으로 "SNP 조합 추출부"라고 한다)(300)는 질병 연관도 데이터베이스(200)에서 분석 대상 질병 관련 전장유전체분석 데이터, 즉, 분석 대상 질병 관련 SNP 데이터를 가져온다. SNP 조합 추출부(300)는 전장유전체분석 데이터를 단계적으로 필터링하여 분석 대상 질병 연관성이 높은 SNP 조합을 추출한다. SNP 조합 추출부(300)는 연관 불평형 필터링(linkage disequilibrium pruning), 본페로니(Boneferroni) 필터링, p값 순위(p-value rank) 필터링, p값 범위(p-value range) 필터링을 단계적으로 적용하여 분석 대상 질병 연관성이 높은 SNP 조합을 생성한다. 이때, SNP 조합 추출부(300)는 최적의 SNP 조합을 찾을 때까지, SNP 후보 조합(SNP candidate set)에 포함되는 SNP 개수를 늘리면서 필터링을 단계적으로 진행한다.
SNP 조합 추출부(300)는 필터링으로 생성된 SNP 후보 조합군을 이용하여 랜덤 포레스트(Random Forests) 기계학습기를 훈련시킨다. 이때, SNP 조합 추출부(300)는 랜덤 포레스트기계학습기의 변수 선택을 이용하여 SNP 후보 조합이군 중에서 오류율이 가장 낮은 SNP 조합을 추출한다.
개인유전체정보 데이터베이스(400)는 사용자들의 개인유전체정보를 저장한다. 예를 들면, 개인유전체정보는 전장유전체분석 등을 통하여 수집된 다양한 SNP들에 대한 고유식별자, 유전체 내의 위치, 사용자 각각의 유전자형을 포함한다.
개인유전체 데이터 처리부(500)는 개인유전체정보 데이터베이스(400)에 저장된 개인유전체정보 중에서 분석 대상 질병 예측에 필요한 개인 SNP 정보를 추출한다. 개인유전체 데이터 처리부(500)는 질병 발생 위험도 예측부(600)의 요청에 따라, 사용자의 개인유전체정보 중 분석 대상 질병 진단에 최적화된 분석 대상 질병 관련 SNP 조합에 포함되는 개인 SNP 정보를 추출한다. 개인유전체 데이터 처리부(500)는 개인 SNP 정보를 포함하는 개인 정보를 생성한다. 개인 정보는 질병 발생 위험도 예측부(300)로 제공된다. 여기서, 개인 정보는 임상정보를 더 포함할 수 있다.
질병 발생 위험도 예측부(600)는 SNP 조합 추출부(300)에서 분석 대상 질병에 관계된 SNP 조합을 추출한다. 질병 발생 위험도 예측부(600)는 추출한 SNP 조합에 포함되어 있는 각 SNP 들의 유전자형을 질병군과 대조군으로 구분한다. 질병 발생 위험도 예측부(600)는 질병군과 대조군을 랜덤 포레스트 기계학습기에 적용하여 질병 발생 위험도 예측을 위한 훈련을 수행한다. 질병 발생 위험도 예측부(600)는 개인유전체 데이터 처리부(500)로부터 입력받은 개인 SNP 정보를 질병 발생 위험도 예측을 위한 랜덤 포레스트 기계학습기에 적용하여 개인의 질병 발생 위험도를 예측한다. 질병 발생 위험도 예측부(600)는 사용자 단말(10)에게 질병 발생 위험도를 제공할 수 있다.
기존의 랜덤 포레스트 기계학습기 기반 전장유전체분석 기술은 모든 SNP를 고려하거나, 임의의 p값 임계값으로 필터링한 SNP를 이용하여 SNP 후보 조합을 추출한다. 그런데, 모든 SNP를 이용하는 경우, 가장 정확하지만 계산 복잡도가 증가하여 효율성이 떨어진다. 또한, 임의의 p값 임계값를 적용하여 필터링한 SNP를 이용하는 경우, 최적의 SNP 조합이 아니므로 분석 대상 질병 예측의 정확성이 떨어진다.
반면, 질병 발생 위험도 예측 장치(100)는 연관 불평형 필터링, 본페로니 필터링, p값 순위 필터링, p값 범위 필터링을 단계적으로 적용하여 SNP 후보 조합에 포함된 SNP 개수를 늘리면서, 오류율이 가장 낮은 SNP 조합을 추출한다. 따라서, 질병 발생 위험도 예측 장치(100)는 분석 대상 질병 연관성이 높은 SNP 조합을 효율적이고 정확하게 찾을 수 있다.
도 2는 본 발명의 한 실시예에 따른 질병 관련 단일염기다형성 조합 추출부의 블록도이다.
도 2를 참고하면, SNP 조합 추출부(300)는 전장유전체분석 데이터 입력부(310), 제어부(330), 그리고 복수의 필터링부(350, 360, 370)를 포함한다. 복수의 필터링부(350-370)는 다양한 필터링 방법의 필터링부로 구성될 수 있으며, 예를 들면, 본페로니 필터링, p값 순위 필터링, p값 범위 필터링을 수행할 수 있다.
전장유전체분석 데이터 입력부(310)는 질병 연관도 데이터베이스(200)로부터 분석 대상 질병 관련 전장유전체분석 데이터, 즉, 분석 대상 질병 관련 SNP 데이터를 입력받는다. 전장유전체분석 데이터 입력부(310)는 분석 대상 질병 관련 SNP 데이터를 연관 불평형 필터링하여 복수의 필터링부(350, 360, 370)로 전달할 수 있다.
제어부(330)는 필터링부(350-370)를 제어하여, 분석 대상 질병 관련 전장유전체분석 데이터의 필터링을 단계적으로 수행한다. 제어부(330)는 각 필터링부(350-370)의 임계값(threshold)을 포함하는 필터링 제어 정보를 제어할 수 있다.
제어부(330)는 SNP 후보 조합에 포함된 SNP 개수와 오류율의 관계를 기초로, SNP 개수를 늘리면서 오류율이 가장 낮은 SNP 조합을 단계적으로 찾는다. 즉, 제어부(330)는 어느 필터링부로부터 수신한 필터링 결과를 기초로 다음 단계의 필터링을 수행할지 판단한다. 필터링 결과는 각 필터링부가 생성한 SNP 후보 조합들에 대한 오류율을 포함한다.
제어부(330)는 어느 필터링부의 필터링 결과에서 SNP 개수가 증가할수록 오류율이 낮아지면, SNP 개수가 더 많은 다음 단계의 필터링부로 SNP 후보 조합들에 대한 오류율을 요청한다. 제어부(330)는 어느 필터링부의 필터링 결과에서, SNP 개수가 증가할 때, 오류율이 낮아지다가 증가하는 경우, 가장 낮은 오류율을 보이는 SNP 후보 조합을 질병 연관성이 높은 SNP 조합으로 결정한다.
필터링부(350-370) 각각은 지정된 필터링 방법으로 분석 대상 질병 관련 전장유전체분석 데이터를 필터링하여 SNP 후보 조합들을 생성한다. 필터링부(350-370) 각각은 SNP 후보 조합들의 오류율을 계산한다. 필터링부(350-370) 각각은 랜덤 포레스트 기계학습기의 변수 선택을 활용하여 SNP 후보 조합들의 오류율을 계산할 수 있다.
필터링부(350-370) 각각은 SNP 후보 조합에 포함된 SNP 개수의 범위가 다르다. 따라서, 필터링부(350-370) 각각은 SNP 후보 조합에 포함된 SNP 개수의 범위를 기초로 필터링 순서가 결정된다.
도 3은 본 발명의 한 실시예에 따른 필터링부의 블록도이고, 도 4는 본 발명의 한 실시예에 따른 p값 순위 필터링의 오류율을 나타내는 그래프이다.
도 3을 참고하면, 복수의 필터링부(350-370)는 다양한 필터링 방법의 필터링부로 구성될 수 있으며, 예를 들면, 본페로니 필터링부(350), p값 순위 필터링부(360), p값 범위 필터링부(370)를 포함할 수 있다.
본페로니 필터링부(350)는 제어부(330)의 요청에 따라, 분석 대상 질병 관련 전장유전체분석 데이터를 본페로니 필터링하여 SNP 후보 조합들(r, 2r, 5r, 10r), 즉 SNP 후보 조합군을 생성한다. 본페로니 필터링부(350)는 표 1과 같이, 일정 개수의 SNP가 포함된 SNP 후보 조합들을 생성한다. 여기서, r은 0.05를 전체 SNP의 개수로 나누어서 계산된 본페로니 보정 p값 임계값(corrected p-value threshold) 이내의 SNP 개수를 의미한다.
본페로니 필터링부(350)는 본페로니 필터링하여 생성한 SNP 후보 조합들의 오류율을 측정한다. SNP 조합 추출부(300)는 랜덤 포레스트 기계학습기의 변수 선택을 활용하여 각 SNP 후보 조합군의 오류율을 측정할 수 있다. 예를 들면, 본페로니 필터링부(350)는 표 1과 같이, 각 SNP 후보 조합의 오류율을 측정한다. 여기에서 SNP 개수는 본페로니 필터링을 거친 SNP의 개수를 의미하며, 선정된 SNP 조합 내의 SNP 개수는 본페로니 필터링을 통하여 선정된 SNP 중에서 추출된 가장 낮은 오류율을 지니는 최적의 SNP 조합 내의 SNP 개수를 의미한다. 본페로니 필터링을 적용할 때에 r에서 10r으로 커질수록 SNP 조합을 선정할 때에 고려할 수 있는 SNP의 개수도 많아진다.
Figure 112013009574913-pat00001
본페로니 필터링부(350)는 각 SNP 후보 조합의 오류율을 제어부(330)로 전달한다. 제어부(330)는 SNP 개수가 가장 많은 SNP 후보 조합(10r)의 오류율이 가장 낮으므로, 다음 단계의 필터링을 수행한다.
p값 순위 필터링부(360)는 제어부(330)의 요청에 따라, 분석 대상 질병 관련 전장유전체분석 데이터를 p값 순위 필터링하여 SNP 후보 조합들을 생성한다. p값 순위 필터링부(360)는 SNP를 p값 순위에 따라서 1위에서부터 임계 순위, 예를 들면 500위까지 누적하면서 500개의 SNP 후보 조합을 생성한다.
도 3을 참고하면, p값 순위 필터링부(360)는 생성한 SNP 후보 조합들의 오류율을 측정한다. SNP 조합 추출부(300)는 랜덤 포레스트 기계학습기의 변수 선택을 활용하여 각 SNP 후보 조합군의 오류율을 측정할 수 있다.
p값 순위 필터링부(360)는 각 SNP 후보 조합의 오류율을 제어부(330)로 전달한다. 제어부(330)는 500위까지 누적한 SNP 후보 조합의 오류율이 가장 낮으므로, 다음 단계의 필터링을 수행한다.
p값 범위 필터링부(370)는 제어부(330)의 요청에 따라, 분석 대상 질병 관련 전장유전체분석 데이터를 p값 범위 필터링하여 SNP 후보 조합들을 생성한다. p값 범위 필터링부(370)는 p값을 확장해 가면서 SNP 후보 조합들을 생성한다. 예를 들면, p값 범위 필터링부(370)는 표 2와 같이 p값을 0.01, 0.05, 0.1, 0.2, ···, 1.0 의 순서대로 확장해가면서 SNP 후보 조합들을 생성한다.
p값 범위 필터링부(370)는 생성한 SNP 후보 조합들의 오류율을 측정한다. SNP 조합 추출부(300)는 랜덤 포레스트 기계학습기의 변수 선택을 활용하여 각 SNP 후보 조합군의 오류율을 측정할 수 있다.
Figure 112013009574913-pat00002
p값 범위 필터링부(370)는 각 SNP 후보 조합의 오류율을 제어부(330)로 전달한다. 제어부(330)는 최소 오류율을 보이는 범위(<0.6)의 SNP 후보 조합을 질병 관련 SNP 조합으로 결정한다.
도 5는 본 발명의 한 실시예에 따른 단일염기다형성 조합 추출부의 질병 관련 SNP 조합 추출 방법의 흐름도이다.
도 5를 참고하면, SNP 조합 추출부(300)는 복수 단계의 필터링을 순차적으로 진행한다. 여기서, SNP 조합 추출부(300)는 최대 3단계의 필터링을 순차적으로 진행하는 것으로 가정한다.
SNP 조합 추출부(300)는 분석 대상 질병 관련 전장유전체분석 데이터를 입력받는다(S110).
SNP 조합 추출부(300)는 분석 대상 질병 관련 전장유전체분석 데이터를 제1단계 필터링하여 제1 SNP 후보 조합들을 생성한다(S120). 제1단계 필터링은 본페로니 필터링일 수 있다.
SNP 조합 추출부(300)는 랜덤 포레스트기계학습기를 이용하여 제1단계 필터링으로 생성된 제1 SNP 후보 조합들의 오류율을 계산한다(S122).
SNP 조합 추출부(300)는 제1 SNP 후보 조합들의 오류율을 분석하여, SNP 개수가 증가할수록 오류율이 낮아지는지 판단한다(S130).
SNP 개수를 가장 많이 포함한 SNP 후보 조합의 오류율이 최저가 아닌 경우, SNP 조합 추출부(300)는 오류율이 가장 낮은 SNP 후보 조합을 분석 대상 질병 관련 SNP 조합으로 추출한다(S132). 즉, SNP 조합 추출부(300)는 제1 SNP 후보 조합 중에 최저 오류율이 있으므로, 더 이상 다음 단계의 필터링을 수행하지 않고 SNP 조합 추출을 완료한다.
SNP 개수를 가장 많이 포함한 SNP 후보 조합의 오류율이 최저인 경우, SNP 조합 추출부(300)는 분석 대상 질병 관련 전장유전체분석 데이터를 제2단계 필터링하여 제2 SNP 후보 조합들을 생성한다(S140). 제2단계 필터링은 p값 순위 필터링일 수 있다. p값 순위 필터링은 SNP를 p값 순위에 따라서 1위에서부터 임계 순위까지 누적하면서 SNP 후보 조합들을 생성한다.
SNP 조합 추출부(300)는 랜덤 포레스트기계학습기를 이용하여 제2단계 필터링으로 생성된 제2 SNP 후보 조합들의 오류율을 계산한다(S142).
SNP 조합 추출부(300)는 제2 SNP 후보 조합들의 오류율을 분석하여, SNP 개수가 증가할수록 오류율이 낮아지는지 판단한다(S150).
SNP 개수를 가장 많이 포함한 SNP 후보 조합의 오류율이 최저가 아닌 경우, SNP 조합 추출부(300)는 오류율이 가장 낮은 SNP 후보 조합을 분석 대상 질병 관련 SNP 조합으로 추출한다(S152). 즉, 마지막 SNP 순위를 포함하는 SNP 후보 조합의 오류율이 가장 낮지 않은 경우, SNP 조합 추출부(300)는 오류율이 가장 낮은 SNP 후보 조합을 분석 대상 질병 관련 SNP 조합으로 추출한다.
SNP 개수를 가장 많이 포함한 SNP 후보 조합의 오류율이 최저인 경우, SNP 조합 추출부(300)는 분석 대상 질병 관련 전장유전체분석 데이터를 제3단계 필터링하여 제3 SNP 후보 조합들을 생성한다(S160). 제3단계 필터링은 p값 범위 필터링일 수 있다. p값 범위 필터링은 p값을 확장해 가면서 SNP 후보 조합들을 생성한다. SNP 개수가 증가할수록 오류율이 낮아지므로, SNP 조합 추출부(300)는 SNP 개수 더 많이 포함하는 제3단계의 필터링 결과를 확인한다.
SNP 조합 추출부(300)는 랜덤 포레스트기계학습기를 이용하여 제3단계 필터링으로 생성된 제3 SNP 후보 조합들의 오류율을 계산한다(S162).
SNP 조합 추출부(300)는 제3 SNP 후보 조합들의 오류율을 분석하여, 오류율이 가장 낮은 SNP 후보 조합을 분석 대상 질병 관련 SNP 조합으로 추출한다(S170).
SNP 조합 추출부(300)가 제 2형 당뇨 관련 SNP 조합을 추출하는 경우, SNP 조합 추출부(300)는 본페로니 필터링, p값 순위 필터링, p값 범위 필터링을 거치면서, 표 2에서 오류율이 최저인 SNP 후보 조합을 찾는다. p값 범위 필터링 결과, 오류율이 최저인 SNP 후보 조합(<0.6)이 제 2형 당뇨 관련 SNP 조합으로 결정되며, 제 2형 당뇨 관련 SNP 조합은 도 3과 같이 101개의 SNP로 구성된다.
Figure 112013009574913-pat00003
이와 같이, SNP 조합 추출부(300)는 복수 필터링 단계를 거치면서 SNP 후보 조합에 포함된 SNP 개수를 점차 늘린다. 그리고, SNP 조합 추출부(300)는 오류율이 최저인 SNP 후보 조합을 발견할 때까지 필터링을 순차적으로 진행한다.
도 6은 본 발명의 한 실시예에 따른 질병 발생 위험도 예측 방법의 흐름도이다.
도 6을 참고하면, 질병 발생 위험도 예측부(600)는 사용자의 질병 발생 위험도 예측을 요청받는다(S210).
질병 발생 위험도 예측부(600)는 SNP 조합 추출부(300)에서 분석 대상 질병 관련 SNP 조합을 가져온다(S220).
질병 발생 위험도 예측부(600)는 분석 대상 질병 관련 SNP 조합을 기초로 랜덤 포레스트 기계학습기를 훈련한다(S230). 질병 발생 위험도 예측부(600)는 분석 대상 질병 관련 SNP 조합에 포함되어 있는 각 SNP 들의 유전자형을 질병군과 대조군으로 구분한다. 질병 발생 위험도 예측부(600)는 질병군과 대조군을 랜덤 포레스트 기계학습기에 적용하여 질병 발생 위험도 예측을 위한 훈련을 수행한다.
질병 발생 위험도 예측부(600)는 사용자의 유전체정보에서 분석 대상 질병 관련 SNP 조합에 해당하는 개인 SNP 정보를 추출한다(S240).질병 발생 위험도 예측부(600)는 훈련된 랜덤 포레스트 기계학습기를 이용하여, 개인 SNP 정보에 해당하는 사용자의 질병 발생 위험도를 계산한다(S250).
질병 발생 위험도 예측부(600)는 사용자의 질병 발생 위험도를 출력한다(S260). 질병 발생 위험도 예측부(600)는 사용자 단말(10)에게 사용자의 질병 발생 위험도를 제공할 수 있다.
이와 같이 본 발명의 실시예에 따르면 각종 필터링을 통해 추출한 최적의 SNP 후보 조합들을 랜덤 포레스트 기계학습기로 입력하므로, 시스템 복잡도를 낮추면서도 정확하게 질병 연관성이 높은 SNP 조합을 찾을 수 있다. 따라서, 본 발명의 실시예에 따르면 질병 연관성이 높은 SNP 조합을 기초로 질병 발생 위험도를 정확하게 예측할 수 있다. 본 발명의 실시예에 따르면 특정 질병 연관 전장유전체분석 데이터를 기반으로 하므로, 특정 질병의 발생 위험도 예측에 필요한 최적의 SNP 조합을 추출할 수 있다. 또한, 본 발명의 실시예에 따르면 스마트폰과 같은 모바일 플랫폼을 이용하여, 개인이 위치와 시간에 구애받지 않고 자신의 유전체 정보와 임상 정보를 기초로 즉시 제 2형 당뇨와 같은 특정 질병의 발생 위험도를 확인할 수 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (14)

  1. 분석 대상 질병에 관련된 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 기초로 사용자의 질병 발생 위험도를 예측하는 질병 발생 위험도 예측 장치로서,
    질환군과 대조군의 전장유전체분석 정보를 기초로 추출한 SNP들의 질병 연관도를 저장하는 전장유전체분석 기반 질병 연관도 데이터베이스,
    상기 질병 연관도 데이터베이스에서 가져온 분석 대상 질병 관련 SNP 데이터를 필터링 순서에 따라 단계적으로 필터링하고, 각 단계의 필터링으로 생성된 SNP 후보 조합들의 오류율을 기초로 다음 단계의 필터링을 진행하며, SNP 후보 조합들 중에서 오류율이 가장 낮은 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 SNP 조합 추출부,
    상기 사용자의 유전체정보를 기초로 상기 질병 관련 SNP 조합에 해당하는 개인 SNP 정보를 추출하는 개인유전체 데이터 처리부, 그리고
    상기 질병 관련 SNP 조합으로 랜덤 포레스트 기계학습기를 훈련하고, 훈련된 랜덤 포레스트 기계학습기를 이용하여, 상기 개인 SNP 정보의 질병 발생 위험도를 계산하는 질병 발생 위험도 예측부
    를 포함하고,
    상기 SNP 조합 추출부는
    분석 대상 질병 관련 SNP 데이터를 필터링하여 SNP 후보 조합을 생성하고, SNP 후보 조합의 오류율을 계산하는 복수의 필터링부, 그리고
    상기 복수의 필터링부를 제어하여 상기 분석 대상 질병 관련 SNP 데이터의 필터링을 단계적으로 수행하고, 각 필터링부의 필터링으로 생성된 SNP 후보 조합들 중에서 오류율이 가장 낮은 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 제어부를 포함하고,
    상기 오류율은 랜덤 포레스트기계학습기를 이용하여 계산되는 질병 발생 위험도 예측 장치.
  2. 삭제
  3. 삭제
  4. 제1항에서,
    상기 복수의 필터링부는 본페로니 필터링부, p값 순위 필터링부, p값 범위 필터링부 중 적어도 둘 이상을 포함하고,
    상기 본페로니 필터링부, 상기 p값 순위 필터링부, 상기 p값 범위 필터링부는 필터링으로 생성되는 SNP 후보 조합의 SNP 개수 범위를 기초로 필터링 순서가 결정되는 질병 발생 위험도 예측 장치.
  5. 제1항에서,
    상기 제어부는
    상기 복수의 필터링부 중 제1필터링부로부터 상기 분석 대상 질병 관련 SNP 데이터를 필터링하여 생성한 제1 SNP 후보 조합들의 오류율을 수신하고, 상기 제1 SNP 후보 조합들 중에서, SNP 개수가 가장 많은 SNP 후보 조합의 오류율이 가장 낮은지 판단하여 상기 제1필터링부의 다음 단계인 제2필터링부로 상기 분석 대상 질병 관련 SNP 데이터의 필터링을 요청할지 결정하는 질병 발생 위험도 예측 장치.
  6. 제5항에서,
    상기 제어부는
    상기 제1 SNP 후보 조합들 중에서, SNP 개수가 가장 많은 SNP 후보 조합의 오류율이 가장 낮은 경우, 상기 제2필터링부로 상기 분석 대상 질병 관련 SNP 데이터의 필터링을 요청하는 질병 발생 위험도 예측 장치.
  7. 제5항에서,
    상기 제어부는
    상기 제1 SNP 후보 조합들 중에서, SNP 개수가 가장 많은 SNP 후보 조합보다 오류율이 낮은 최저 SNP 후보 조합이 있는 경우, 상기 최저 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 질병 발생 위험도 예측 장치.
  8. 질병 발생 위험도 예측 장치가 분석 대상 질병에 관련된 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 추출하는 방법으로서,
    분석 대상 질병 관련 전장유전체분석 데이터를 입력받는 단계,
    상기 분석 대상 질병 관련 전장유전체분석 데이터를 제1단계 필터링하여 제1 SNP 후보 조합들을 생성하는 단계,
    상기 제1 SNP 후보 조합들의 오류율을 분석하여, SNP 후보 조합에 포함된 SNP 개수가 증가할수록 오류율이 낮아지는지 판단하는 단계, 그리고
    상기 제1 SNP 후보 조합들 중에서, SNP 개수를 가장 많이 포함한 SNP 후보 조합보다 오류율이 낮은 최저 SNP 후보 조합이 있는 경우, 최저 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 단계를 포함하고,
    상기 오류율은 랜덤 포레스트기계학습기를 이용하여 계산되는 SNP 조합 추출하는 방법.
  9. 제8항에서,
    상기 제1 SNP 후보 조합들 중에서, SNP 개수를 가장 많이 포함한 SNP 후보 조합의 오류율이 가장 낮은 경우, 상기 분석 대상 질병 관련 전장유전체분석 데이터를 제2단계 필터링하여 제2 SNP 후보 조합들을 생성하는 단계,
    상기 제2 SNP 후보 조합들의 오류율을 분석하여, SNP 개수가 증가할수록 오류율이 낮아지는지 판단하는 단계, 그리고
    상기 제2 SNP 후보 조합들 중에서 SNP 개수를 가장 많이 포함한 SNP 후보 조합보다 오류율이 낮은 최저 SNP 후보 조합이 있는 경우, 최저 SNP 후보 조합을 질병 관련 SNP 조합으로 추출하는 단계
    를 더 포함하는 SNP 조합 추출 방법.
  10. 제9항에서,
    상기 제1단계 필터링은 본페로니 필터링이고, 상기 제2단계 필터링은 p값 순위 필터링인 SNP 조합 추출 방법.
  11. 제9항에서,
    상기 제1단계 필터링은 p값 순위 필터링이고, 상기 제2단계 필터링은 p값 범위 필터링인 SNP 조합 추출 방법.
  12. 질병 발생 위험도 예측 장치가 분석 대상 질병에 관련된 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 기초로 사용자의 질병 발생 위험도를 예측하는 방법으로서,
    사용자의 질병 발생 위험도 예측을 요청받는 단계,
    상기 사용자의 유전체정보에서 분석 대상 질병 관련 SNP 조합에 해당하는 개인 SNP 정보를 추출하는 단계, 그리고
    랜덤 포레스트 기계학습기를 이용하여, 상기 개인 SNP 정보에 해당하는 상기 사용자의 질병 발생 위험도를 계산하는 단계
    를 포함하는 질병 발생 위험도 예측 방법.
  13. 제12항에서,
    전장유전체분석 정보에 포함된 분석 대상 질병 관련 SNP 데이터를 복수 단계로 필터링하여 질병 연관성을 나타내는 상기 분석 대상 질병 관련 SNP 조합을 생성하는 단계
    를 더 포함하는 질병 발생 위험도 예측 방법.
  14. 제13항에서,
    상기 사용자의 질병 발생 위험도를 계산하는 단계는
    상기 분석 대상 관련 SNP 조합으로 훈련된 랜덤 포레스트 기계학습기를 이용하는 질병 발생 위험도 예측 방법.
KR20130011376A 2013-01-31 2013-01-31 질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치 KR101483284B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20130011376A KR101483284B1 (ko) 2013-01-31 2013-01-31 질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20130011376A KR101483284B1 (ko) 2013-01-31 2013-01-31 질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치

Publications (2)

Publication Number Publication Date
KR20140098561A KR20140098561A (ko) 2014-08-08
KR101483284B1 true KR101483284B1 (ko) 2015-01-15

Family

ID=51745327

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20130011376A KR101483284B1 (ko) 2013-01-31 2013-01-31 질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치

Country Status (1)

Country Link
KR (1) KR101483284B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017204482A3 (ko) * 2016-05-27 2018-01-18 ㈜메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101864986B1 (ko) * 2017-02-27 2018-06-05 한국과학기술원 유전체 정보 기반 질병 예측 방법 및 장치
KR102217060B1 (ko) * 2019-01-30 2021-02-18 (주)메디젠휴먼케어 개인별 단일염기 다형성 분석 및 관리 장치
KR102102848B1 (ko) * 2019-06-12 2020-04-22 주식회사 프로카젠 전립선암 위험점수 산출기, 상기 산출기의 동작 방법
KR102184316B1 (ko) * 2019-10-25 2020-12-01 박선민 개인별 단일염기 다형성 정보에 따른 질병예측 프로그램 및 맞춤형 영양정보 제공방법
KR102344631B1 (ko) * 2021-01-06 2021-12-29 한국 한의학 연구원 냉증 유전연관 이상지질혈증 위험도 측정 방법 및 장치
CN112950351B (zh) * 2021-02-07 2024-04-26 北京淇瑀信息科技有限公司 用户策略生成方法、装置及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110057188A (ko) * 2008-08-27 2011-05-31 하. 룬트벡 아크티에 셀스카브 바이오마커 프로파일 측정 시스템 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110057188A (ko) * 2008-08-27 2011-05-31 하. 룬트벡 아크티에 셀스카브 바이오마커 프로파일 측정 시스템 및 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017204482A3 (ko) * 2016-05-27 2018-01-18 ㈜메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치

Also Published As

Publication number Publication date
KR20140098561A (ko) 2014-08-08

Similar Documents

Publication Publication Date Title
KR101483284B1 (ko) 질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치
Azaiez et al. Genomic landscape and mutational signatures of deafness-associated genes
Sugden et al. Localization of adaptive variants in human genomes using averaged one-dependence estimation
Blencowe et al. Network modeling of single-cell omics data: challenges, opportunities, and progresses
US20160283679A1 (en) Identifying And Ranking Individual-Level Risk Factors Using Personalized Predictive Models
Greene et al. A fast association test for identifying pathogenic variants involved in rare diseases
Golan et al. Effective genetic-risk prediction using mixed models
KR101828052B1 (ko) 유전자의 복제수 변이(cnv)를 분석하는 방법 및 장치
US20180150608A1 (en) Device and method for diagnosing cardiovascular disease using genome information and health medical checkup data
Strobl et al. Improving patient prostate cancer risk assessment: Moving from static, globally-applied to dynamic, practice-specific risk calculators
US20200258639A1 (en) Medical device and computer-implemented method of predicting risk, occurrence or progression of adverse health conditions in test subjects in subpopulations arbitrarily selected from a total population
KR20140107714A (ko) 건강 관리 시스템 및 그것의 건강 정보 제공 방법
KR20170047037A (ko) 임상 및 바이오 정보 통합 질병 예후예측 시스템 및 방법
Tang et al. Molecular diagnostics of cardiovascular diseases in sudden unexplained death
CN113272912A (zh) 使用似然比范式的用于表型驱动临床基因组的方法和装置
WO2020210487A1 (en) Systems and methods for nutrigenomics and nutrigenetic analysis
KR102042824B1 (ko) 류마티스관절염 예후 예측용 snp 마커 세트
KR20180062917A (ko) 유전체 정보와 건강검진데이터를 이용한 심혈관질환 진단 장치 및 그 방법
JP2019512347A5 (ko)
Alyousfi et al. Gene-specific metrics to facilitate identification of disease genes for molecular diagnosis in patient genomes: a systematic review
US10438687B1 (en) Dynamic evaluation of polygenic models based on genetic loci for which input is received
US20210104296A1 (en) Prediction of phenotypes using recommender systems
KR20220046415A (ko) 빅데이터를 이용한 비만 위험도 정보 제공 방법 및 그 장치
KR20220075700A (ko) gPRS를 이용한 제2형 당뇨질환 예측 시스템
KR20210062291A (ko) 건강 컨설팅 서비스를 제공하는 서버, 방법 및 컴퓨터 프로그램

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190107

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20200106

Year of fee payment: 6