KR102640503B1

KR102640503B1 - 체질별 고혈압 위험성 예측 방법 및 시스템

Info

Publication number: KR102640503B1
Application number: KR1020210082545A
Authority: KR
Inventors: 반효정; 진희정; 이시우; 백영화
Original assignee: 한국 한의학 연구원
Priority date: 2021-06-24
Filing date: 2021-06-24
Publication date: 2024-02-27
Also published as: KR20230000291A

Abstract

체질별 고혈압 위험성 예측 방법 및 시스템이 개시된다. 본 발명의 일실시예에 따른, 체질별 고혈압 위험성 예측 방법은, 검사자의 고혈압 SNP(single nucleotide polymorphism)에 관한 유전자형(genotype)을 확인하는 단계; 상기 유전자형에 따라, 상기 검사자에게 할당하는 PRS(Polygenic Risk Score)를 계산하는 단계; 및 상기 계산된 PRS에 기초하여, 상기 검사자에 대한 체질별 고혈압 위험도를 예측하는 단계를 포함할 수 있다.

Description

체질별 고혈압 위험성 예측 방법 및 시스템{METHOD AND SYSTEM FOR PREDICTING THE RISK OF HYPERTENSION BY CONSTITUTION}

본 발명은 체질이 진단되고 난 뒤 개인이 가진 고혈압에 대한 유전적 위험도를 체질에 따라 달리 해석해주는, 체질별 고혈압 위험성 예측 방법 및 시스템에 관한 것이다.

본 발명의 배경이 되는 기술은 다음의 문헌에 개시되어 있다.
1) 공개특허공보 제10-2021-0058467호(2021.05.24.) "질병 카테고리에 대한 통합 위험도 계산 및 시각화 장치 및 방법"
2) 공개특허공보 제10-2013-0082661호(2013.07.22.) "체질지식정보 제공 시스템 및 방법과, 체질별 그래프 생성장치"
고혈압은, 성인에서 수축기 혈압이 140mmHg 이상이거나 이완기 혈압이 90mmHg 이상일 때를 말한다.

고혈압은, 당뇨병 등 다른 대부분의 만성질환과 마찬가지로 환자 스스로 자신의 질병과 신체 상태를 꾸준히 관리하여야 하는 질병으로, 초기부터 관리를 하는 것이 바람직하다.

고혈압의 유전율은, 35~40에서 80%까지 나타난다는 연구들이 있어, 유전적 원인이 큰 질환이다.

이 때문에 의료 업계에서는, 소비자직접의뢰(DTC)를 통해 고혈압의 유전적 위험성을 검사하고 있다.

지금까지 고혈압에 대한 유전적 위험성은, 인구집단 전체에서의 위험도를 계산해서, 각 개인이 가지는 유전적위험도를 알려주는 것에 제한되어 왔다.

이에 따라, 체질에 근거하여 유전적 고혈압 위험성을 예측하는 새로운 모델이 절실히 요구되고 있는 실정이다.

본 발명의 실시예는, 체질을 진단하고, 진단된 체질에 따라, 개인이 가진 고혈압에 대한 유전적 위험도를 해석해주는, 체질별 고혈압 위험성 예측 방법 및 시스템을 제공하는 것을 목적으로 한다.

본 발명의 일실시예에 따른, 체질별 고혈압 위험성 예측 방법은, 검사자의 고혈압 SNP(single nucleotide polymorphism)에 관한 유전자형(genotype)을 확인하는 단계; 상기 유전자형에 따라, 상기 검사자에게 할당하는 PRS(Polygenic Risk Score)를 계산하는 단계; 및 상기 계산된 PRS에 기초하여, 상기 검사자에 대한 체질별 고혈압 위험도를 예측하는 단계를 포함할 수 있다.

또한, 본 발명의 실시예에 따른, 체질별 고혈압 위험성 예측 시스템은, 검사자의 고혈압 SNP(single nucleotide polymorphism)에 관한 유전자형(genotype)을 확인하는 확인부; 상기 유전자형에 따라, 상기 검사자에게 할당하는 PRS(Polygenic Risk Score)를 계산하는 계산부; 및 상기 계산된 PRS에 기초하여, 상기 검사자에 대한 체질별 고혈압 위험도를 예측하는 예측부를 포함하여 구성할 수 있다.

본 발명의 일실시예에 따르면, 체질을 진단하고, 진단된 체질에 따라, 개인이 가진 고혈압에 대한 유전적 위험도를 해석해주는, 체질별 고혈압 위험성 예측 방법 및 시스템을 제공 할 수 있다.

도 1은 본 발명의 일실시예에 따른 체질별 고혈압 위험성 예측 시스템의 구성을 도시한 블록도이다.
도 2는 본 발명의 일실시예에 따른 체질별 고혈압 위험성 예측 방법을 설명하기 위한 도이다.
도 3은 체질별 고혈압 위험도 forest plot를 설명하기 위한 도이다.
도 4는 본 발명의 일실시예에 따른, 체질별 고혈압 위험성 예측 방법을 도시한 흐름도이다.

이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 그러나, 실시예들에는 다양한 변경이 가해질 수 있어서 특허출원의 권리 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 실시예들에 대한 모든 변경, 균등물 내지 대체물이 권리 범위에 포함되는 것으로 이해되어야 한다.

실시예에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 안된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

도 1은 본 발명의 일실시예에 따른 체질별 고혈압 위험성 예측 시스템의 구성을 도시한 블록도이다.

도 1을 참조하면, 본 발명의 일실시예에 따른, 체질별 고혈압 위험성 예측 시스템(100)은 확인부(110), 계산부(120), 및 예측부(130)를 포함하여 구성할 수 있다. 실시예에 따라, 체질별 고혈압 위험성 예측 시스템(100)은 식별부(140)를 선택적으로 추가하여 포함할 수 있다.

확인부(110)는 검사자의 고혈압 SNP(single nucleotide polymorphism)에 관한 유전자형(genotype)을 확인한다. 즉, 확인부(110)는 검사자에서 고혈압 유발과 관계되는 SNP를 찾아, 해당 SNP의 유전 타입을 확인하는 역할을 할 수 있다.

여기서, SNP는 개인의 DNA 염기 서열에서 발생할 수 있는 작은 유전적 변화 또는 변이를 지칭 할 수 있다. SNP는 염색체의 단일부위에서 여러 가지 DNA 염기들 중의 하나에 나타나는 일반적인 돌연변이로서, 인간의 게놈(genome)에는 약 3백만 개의 SNP가 존재 할 수 있다. SNP는 그 빈도가 높고 안정하며 유전체 전체에 분포되어 있고, 이에 의하여 개인의 유전적 다양성이 발생 할 수 있다.

유전자형은 세포, 생체의 외부로 드러나는 성질을 결정하는 유전자(gene)의 유전적 구성을 의미 할 수 있다. 유전자형은, 환경적 요소(environmental factor), 후성적 요소(epigenetic factor)와 더불어 표현형(phenotype)을 결정하는 요인이 될 수 있다.

계산부(120)는 상기 유전자형에 따라, 상기 검사자에게 할당하는 PRS(Polygenic Risk Score)를 계산한다. 즉, 계산부(120)는 확인된 유전자형을 고려하여 검사자가 고혈압에 노출될 위험을, 수치적으로 연산하는 역할을 할 수 있다.

여기서, PRS는 질환 발생과 관련되는 유전성향을 수치로 표현한 것으로, 일반적으로 PRS 값이 높게 연산되면, 질환 발생 가능성이 높다고 판정 할 수 있다.

PRS의 계산에 있어, 계산부(120)는 유의성에 기반하여 일부의 유전자를 식별하고, 식별된 일부의 유전자를 대상으로 유전적 효과에 의거한 PRS를 계산할 수 있다.

이를 위해, 체질별 고혈압 위험성 예측 시스템(100)은 식별부(140)를 추가하여 구성할 수 있다.

식별부(140)는 복수의 집단의 LD 데이터(Linkage Disequilibrium data)를 사용하여 분석하는 fastBAT에 의해, 상기 복수의 집단 모두에서 유의성(有意性)이 유지되는 n개(상기 n은 5이상의 자연수)의 유전자를 식별할 수 있다. 즉, 식별부(140)는 검사자가 포함되는 범주(성별, 연령, 거주지, 인종 등)의 사람 그룹으로부터 공통적으로 보여지는 유의성의 복수의 유전자를 식별하는 역할을 할 수 있다.

여기서, LD 데이터는 서로 다른 좌위(loci)에 존재하는 서로 다른 유전자형들의 빈도가, 두 좌위가 서로 독립적이고 연관되어 있지 않다는 가정에서 빈도와 비교했을 때 통계적으로 유의하게 높거나 낮은 빈도를 나타내는 데이터를 지칭할 수 있다.

또한, fastBAT은 유전자 또는 집합 기반의 연관성을 분석하는 기법을 지칭 할 수 있다.

또한, 유의성은 어떠한 뜻이나 의미가 있는 성질을 지칭할 수 있다.

일실시예에서, 상기 식별부(140)는, 상기 n개의 유전자로서, 'TROVE2, 'GLRX2', 'AARS', 'DDX19B', 및 'HTRA4'를 적어도 포함하여 식별 할 수 있다.

식별부(140)에 의한 상기 n개의 유전자 식별 이후, 계산부(120)는, Mixed linear model을 이용하여, 상기 고혈압 SNP 각각에 대한 유전적 효과(genetic effect)를 계산할 수 있다. 계산부(120)는 학습을 통해 고혈압 SNP가 가지고 있는 유전적 효과를 연산 할 수 있다.

Mixed linear model은 선형 혼합 모형으로서, 연속형 변수인 Outcome의 값이 여러 번 측정(반복) 측정이 되었을 때, 반복측정을 고려하여 측정된 시점간 또는 그룹간 또는 그룹의 변화량 간의 차이를 보고자 할 때 시행하는 러닝 모델일 수 있다.

유전적 효과는 생명현상에 대한 가지각색의 영향 중에서 그 효과가 유전자에까지 미치는 영향 정도를 수치적으로 환산하는 것을 지칭 할 수 있다.

또한, 계산부(120)는 상기 식별된 n개의 유전자 내에 속해 있는 SNP의 유전적 효과를 합산하여 상기 PRS를 계산 할 수 있다. 즉, 계산부(120)는 고혈압 SNP이면서, 식별부(140)에 의해 유의성이 유지되는 것으로 식별된 유전자에 한해, 구해진 유전적 효과를 합하여 PRS로서 계산 할 수 있다.

예측부(130)는 상기 계산된 PRS에 기초하여, 상기 검사자에 대한 체질별 고혈압 위험도를 예측한다. 즉, 예측부(130)는 수치적으로 환산된 위험 점수를 통해, 검사자의 체질에 해당되는 위험도를 추정하여 알리는 역할을 할 수 있다.

위험도를 예측하는 데에 있어, 예측부(130)는, 상기 검사자의 체질 특성을 입력받아, 상기 검사자가 포함된 집단특성분포를 결정할 수 있다. 즉, 예측부(130)는 검사자의 체질 특성을 획득하여, 검사자가 속하게 되는 집단특성분포를 정할 수 있다.

또한, 예측부(130)는 상기 결정된 집단특성분포에서, 상기 PRS의 점유 위치를 인지하여, 상기 검사자의 체질별 고혈압 위험도를 예측 할 수 있다. 즉, 예측부(130)는 정해진 집단특성분포 내에서 검사자에게 부여된 PRS가 어느 위치인지를 파악하여, 검사자의 체질별 고혈압 위험도를 추정할 수 있다.

아래의 도 3에서는, Odds Ratio 분포를 이용하여, 체질 특성 '소음인'이고 PRS가 2.8로 계산된 검사자에 대해, 전체 집단의 위험도에서는 하위 분포에 속해 있지만 소음인 집단의 위험도에서는 고 위험군에 속하는, 검사자의 체질별 고혈압 위험도를 예측하는 것이 예시되고 있다.

고혈압에 대한 유전적 위험성은, 인구집단 전체에서의 위험도를 계산해서 각 개인이 가지는 유전적 위험도를 알려주는 것이었다.

개인의 고혈압 유전적 위험도를 측정할 때 지금까지는, 인구집단 내에서 고혈압군과 아닌 군들 사이에서 차이가 나는 개별 SNP의 위험도를 구하고, 개인이 위험도 높은 SNP을 가지고 있을 때 고혈압 위험도가 높다고 판단하였다.

종래의 위험도 측정은, 단 몇 개의 SNP의 유무로 고혈압 유전 위험도를 판단하기에, 많은 단점을 내재하고 있다.

본 발명의 체질별 고혈압 위험성 예측 시스템(100)은, 개별 SNP의 위험도로 측정하는 것이 아닌, 고혈압 연관 유전자 내 모든 SNP들의 유전적 영향성을 계산하여 고혈압 유전 스코어를 구하여 판단 할 수 있다.

도 2는 본 발명의 일실시예에 따른 체질별 고혈압 위험성 예측 방법을 설명하기 위한 도이다.

단계 210에서, 체질별 고혈압 위험성 예측 시스템(100)은, Genotype을 입력받는다.

체질별 고혈압 위험성 예측 시스템(100)은, 체질 값이 있는 3개의 인구 집단에서 공통적으로 존재하는, 유의한 고혈압 연관 SNP을 구할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은, 고혈압 유전 스코어를 구하기 전, 집단 내에서 재현되는 유의 유전자를 선정하기 위해, 3개의 한국인 집단에서 유전자 기반 전장 유전체 연관 분석을 수행 할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은, 3개의 집단(Cohort1, Cohort2, Cohort3)에서 5개의 유의한 유전자(TROVE2, GLRX2, AARS, DDX19B, HTRA4)를 선정하고, 5개의 유전자 내 존재하는 모든 SNP의 effect 값을 이용 할 수 있다.

표 1에는 3개의 집단(Cohort1, Cohort2, Cohort3)에서 선정되는 5개의 유의한 유전자를 예시하여 나열한다.

표 1에서는 고혈압의 위험도 계산을 위해 사용된 유전자 마커를 예시 할 수 있다.

표 1에 예시된 유전자 마커는, 집단 3개의 replication 분석을 통해 최종 선정된 유전자 마커이며 PRS 계산을 위해 유전자 영역에 포함된 모든 SNP들을 genetic effect 식에 포함시킬 수 있다. 표 1에는 가장 영향력이 높은 한 개의 SNP 만을 표기한다.

집단 1(Cohort1)은 2007년부터 2012년까지 19개의 한방병원에서 체질 약물 반응이 좋고 전문가에게 체질진단이 확인된 대상 집단일 수 있다. 집단 1(Cohort1)은 2000명에 대한, 유전체 전체 유전자형 데이터(PMRA Asian SNP chip)를 포함 할 수 있다. 집단 1(Cohort1)은 참여 연구자의 질병력, 약물력을 고려하여 고혈압 집단과 아닌 집단으로 나눌 수 있다.

집단 2(Cohort2)는 한국의 두 지역 안산과 안성에서 2009년부터 2012년까지 Korean Genome and Epidemiology Study(KoGES) 사업과 협력하여 모집한 지역코호트로서, 체질 설문 내용과 질병력, 약물력 등의 임상정보 수집을 하여 고혈압 환자의 암의 병력, 성별 불일치, 가계관련성, 낮은 유전형 비율 (<95 %), 오염된 샘플을 배제한 대상 집단 일 있다.

집단 3(Cohort3)은 2017년부터 현재까지 진행되고 있는 대전시민코호트 중 2000명으로, 이들 2000명 모두 PMRA chip 데이터 생산을 수행하였으며, 체질 설문 내용과 질병력, 약물력을 모두 포함하고 있는 대상 집단 일 수 있다.

집단 1, 2, 3에서 고혈압 환자수는, 각각 534명, 1752명, 140명이다.

고혈압 SNP의 선별 방법에 있어, 체질별 고혈압 위험성 예측 시스템(100)은, 고혈압 유전 스코어를 구하기 전 집단 내에서 재현되는 유의 유전자를 선정하기 위해, 3개의 한국인 집단에서 유전자 기반 전장 유전체 분석을 수행할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은, 유전자 기반 전장 유전체 분석을 위하여 3개의 집단을 대상으로 GWAS의 summary statistics data와 개별 수준의 유전자형이 있는 참조 샘플의 LD 데이터를 사용하여 분석하는 fastBAT 방법을 이용 할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은, 전체 2만여 개의 유전자를 대상으로 양쪽 50kb 거리에 있는 모든 SNP들을 세트로 구성 할 수 있다. 각 집단별로 유의한 유전자의 경우에는 천 여개로 구성되어 있으며, 3집단 모두에서 유의성이 유지되는 유전자는 표 1과 같이 5개의 유전자를 선정 할 수 있다.

단계 220에서, 체질별 고혈압 위험성 예측 시스템(100)은 PRS 계산 및 고혈압 위험도를 계산한다.

체질별 고혈압 위험성 예측 시스템(100)은, SNP를 활용하여 개개인의 PRS(Polygenic Risk Score)를 계산 할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은 Mixed linear model 을 이용하여 SNP들의 genetic effect 를 구하고, 각 개인이 가지고 있는 5개의 유전자 내 속해 있는 SNP effect 들의 합을 이용하여 PRS를 구할 수 있다.

개인의 PRS 는 고혈압 집단의 effect 분포에서 내가 속한 PRS의 정도를 파악할 수 있어, 상대적인 위험도를 구할 수 있다.

SNP을 활용한 개개인의 PRS(Polygenic Risk Score) 계산에 있어, 체질별 고혈압 위험성 예측 시스템(100)은 Mixed linear model을 이용하여 SNP들의 genetic effect를 구하고, 각 개인이 가지고 있는 5개의 유전자내 속해 있는 모든 SNP들의 effect의 합을 이용하여 PRS를 구할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은 개인의 PRS을 이용하여 고혈압 집단의 effect 분포에서 내가 속한 PRS의 정도를 파악할 수 있고, 상대적인 위험도를 구할 수 있다.

계산에 사용된 프로그램은 gcta tool을 이용하였으며 PRS는 gcta에서 나온 각각의 SNP들의 값을 이용해 plink 내 Polygenic Score를 구하는 방법으로 이용될 수 있다.

단계 230에서 체질별 고혈압 위험성 예측 시스템(100)은 체질값을 입력 받는다.

체질값이 입력되면(단계 230의 YES 방향), 체질별 고혈압 위험성 예측 시스템(100)은 단계 240에서 입력된 체질에 해당하는 결과를 제공하고 종료한다.

반면, 체질값이 입력되지 않으면(단계 230의 N 방향), 체질별 고혈압 위험성 예측 시스템(100)은 단계 250에서, 사용자가 일반인인지를 판단한다.

사용자가 일반인이면(단계 250의 YES 방향), 체질별 고혈압 위험성 예측 시스템(100)은 단계 260에서 전체 인구집단에서의 결과를 제공하고 종료한다.

반면, 사용자가 일반인이 아니면(단계 250의 NO 방향), 체질별 고혈압 위험성 예측 시스템(100)은 단계 270에서 전체 태음, 소음, 소양의 모든 결과를 제공하고 종료한다.

단계 240~270에서의 체질별 고혈압 위험성 예측 시스템(100)은, 체질진단 값이 입력으로 들어오면, 결과에 해당 체질에 대한 값을 제공하고, 체질 진단이 되어 있지 않은 경우에는 결과 화면이 일반인이 보는 경우라면 전체에 해당하는 결과를 제공하며, 의료진이 보는 경우라면, 전체, 태음, 소음, 소양의 값을 모두 제공 할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은, 체질별 고혈압집단과 정상인에서의 PRS 차이를 분석할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은, 같은 한국인에서도 체질에 따라 고혈압의 위험도가 달라질 수 있음을 분석하고 실제 체질 간의 위험도 차이가 유의하다는 분석 결과를 얻을 수 있다.

체질별 고혈압 집단과 정상인에서의 PRS 차이 분석에 있어, 체질별 고혈압 위험성 예측 시스템(100)은, 같은 한국인에서도 체질에 따라 고혈압의 위험도가 달라질 수 있음을 분석하고, 실제 체질 간의 위험도 차이가 유의하다는 분석 결과를 얻을 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은, 각 집단에서 고혈압의 PRS 분포를 알 수 있으며 개인이 속해 있는 PRS 가 상위 % 구간인지 알 수 있다.

이를 통해, 체질별 고혈압 위험성 예측 시스템(100)은, 나의 고혈압 유전 위험도를 구하고, 체질 집단을 알았을 때 체질별 고혈압 위험에 따른 올바른 관리 방법을 제공해 줄 수 있다.

도 3은 체질별 고혈압 위험도 forest plot를 설명하기 위한 도이다.

도 3에서는 체질별 고혈압 위험도 판단을 위한 Odds Ratio 분포도를 예시한다.

도 3을 참조하면, 만약 검사자가 소음인이고 2.8의 위험도를 가지고 있을 때, 체질별 고혈압 위험성 예측 시스템(100)은, 전체 집단의 위험도에서는 하위 분포에 속해 있지만 소음인 집단의 위험도에서는 고 위험군에 속한 것으로 판단할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)은, 검사자가 포함된 집단 특성에 따라 위험도가 달라질 수 있음을 확인할 수 있고, 집단별 위험도를 측정하여 고혈압 질환자의 맞춤형 치료 및 관리를 적용 할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)에 의해서는, 각 집단에서의 고혈압의 PRS 분포를 알 수 있었으며, 개인이 속해 있는 PRS가 상위 % 구간 인지를 알 수 있다.

체질별 고혈압 위험성 예측 시스템(100)에 의해서는, 나의 고혈압 유전 위험도를 구하고 체질 집단을 알았을 때 체질별 고혈압 위험에 따른 올바른 관리 방법을 제공해줄 수 있다.

이하, 도 4에서는 본 발명의 실시예들에 따른 체질별 고혈압 위험성 예측 시스템(100)의 작업 흐름을 상세히 설명한다.

도 4는 본 발명의 일실시예에 따른, 체질별 고혈압 위험성 예측 방법을 도시한 흐름도이다.

본 실시예에 따른 체질별 고혈압 위험성 예측 방법은 체질별 고혈압 위험성 예측 시스템(100)에 의해 수행될 수 있다.

우선, 체질별 고혈압 위험성 예측 시스템(100)은 검사자의 고혈압 SNP(single nucleotide polymorphism)에 관한 유전자형(genotype)을 확인한다(410). 단계(410)는 검사자에서 고혈압 유발과 관계되는 SNP를 찾아, 해당 SNP의 유전 타입을 확인하는 과정일 수 있다.

또한, 체질별 고혈압 위험성 예측 시스템(100)은 상기 유전자형에 따라, 상기 검사자에게 할당하는 PRS(Polygenic Risk Score)를 계산한다(420). 단계(420)는 확인된 유전자형을 고려하여 검사자가 고혈압에 노출될 위험을, 수치적으로 연산하는 과정일 수 있다.

PRS의 계산에 있어, 체질별 고혈압 위험성 예측 시스템(100)은 유의성에 기반하여 일부의 유전자를 식별하고, 식별된 일부의 유전자를 대상으로 유전적 효과에 의거한 PRS를 계산할 수 있다.

이를 위해, 체질별 고혈압 위험성 예측 시스템(100)은 복수의 집단의 LD 데이터(Linkage Disequilibrium data)를 사용하여 분석하는 fastBAT에 의해, 상기 복수의 집단 모두에서 유의성(有意性)이 유지되는 n개(상기 n은 5이상의 자연수)의 유전자를 식별할 수 있다. 즉, 체질별 고혈압 위험성 예측 시스템(100)은 검사자가 포함되는 범주(성별, 연령, 거주지, 인종 등)의 사람 그룹으로부터 공통적으로 보여지는 유의성의 복수의 유전자를 식별 할 수 있다.

일실시예에서, 상기 체질별 고혈압 위험성 예측 시스템(100)은, 상기 n개의 유전자로서, 'TROVE2, 'GLRX2', 'AARS', 'DDX19B', 및 'HTRA4'를 적어도 포함하여 식별 할 수 있다.

체질별 고혈압 위험성 예측 시스템(100)에 의한 상기 n개의 유전자 식별 이후, 체질별 고혈압 위험성 예측 시스템(100)은, Mixed linear model을 이용하여, 상기 고혈압 SNP 각각에 대한 유전적 효과(genetic effect)를 계산할 수 있다. 체질별 고혈압 위험성 예측 시스템(100)은 학습을 통해 고혈압 SNP가 가지고 있는 유전적 효과를 연산 할 수 있다.

또한, 체질별 고혈압 위험성 예측 시스템(100)은 상기 식별된 n개의 유전자 내에 속해 있는 SNP의 유전적 효과를 합산하여 상기 PRS를 계산 할 수 있다. 즉, 체질별 고혈압 위험성 예측 시스템(100)은 고혈압 SNP이면서, 체질별 고혈압 위험성 예측 시스템(100)에 의해 유의성이 유지되는 것으로 식별된 유전자에 한해, 구해진 유전적 효과를 합하여 PRS로서 계산 할 수 있다.

계속해서, 체질별 고혈압 위험성 예측 시스템(100)은 상기 계산된 PRS에 기초하여, 상기 검사자에 대한 체질별 고혈압 위험도를 예측한다(430). 단계(430)은 수치적으로 환산된 위험 점수를 통해, 검사자의 체질에 해당되는 위험도를 추정하여 알리는 과정일 수 있다.

위험도를 예측하는 데에 있어, 체질별 고혈압 위험성 예측 시스템(100)은, 상기 검사자의 체질 특성을 입력받아, 상기 검사자가 포함된 집단특성분포를 결정할 수 있다. 즉, 체질별 고혈압 위험성 예측 시스템(100)은 검사자의 체질 특성을 획득하여, 검사자가 속하게 되는 집단특성분포를 정할 수 있다.

또한, 체질별 고혈압 위험성 예측 시스템(100)은 상기 결정된 집단특성분포에서, 상기 PRS의 점유 위치를 인지하여, 상기 검사자의 체질별 고혈압 위험도를 예측 할 수 있다. 즉, 체질별 고혈압 위험성 예측 시스템(100)은 정해진 집단특성분포 내에서 검사자에게 부여된 PRS가 어느 위치인지를 파악하여, 검사자의 체질별 고혈압 위험도를 추정할 수 있다.

도 3에서는, Odds Ratio 분포를 이용하여, 체질 특성 '소음인'이고 PRS가 2.8로 계산된 검사자에 대해, 전체 집단의 위험도에서는 하위 분포에 속해 있지만 소음인 집단의 위험도에서는 고 위험군에 속하는, 검사자의 체질별 고혈압 위험도를 예측하는 것이 예시되고 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.

100 : 체질별 고혈압 위험성 예측 시스템
110 : 확인부 120 : 계산부
120 : 예측부 140 : 식별부

Claims

체질별 고혈압 위험성 예측 시스템에 의해 구현되는, 체질별 고혈압 위험성 예측 방법에 있어서,
상기 체질별 고혈압 위험성 예측 시스템의 확인부에서, 검사자의 고혈압 SNP(single nucleotide polymorphism)에 관한 유전자형(genotype)을 확인하는 단계;
상기 체질별 고혈압 위험성 예측 시스템의 식별부에서, 복수의 집단의 LD 데이터(Linkage Disequilibrium data)를 사용하여 분석하는 fastBAT에 의해, 상기 복수의 집단 모두에서 유의성(有意性)이 유지되는 n개(상기 n은 5이상의 자연수)의 유전자를 식별하는 단계;
상기 체질별 고혈압 위험성 예측 시스템의 계산부에서, Mixed linear model을 이용하여, 상기 고혈압 SNP 각각에 대한 유전적 효과(genetic effect)를 계산하는 단계; 및,
상기 계산부에서, 상기 식별된 n개의 유전자 내에 속해 있는 SNP의 유전적 효과를 합산하여, 상기 유전자형에 따라 상기 검사자에게 할당하는 PRS(Polygenic Risk Score)를 계산하는 단계; 및
상기 체질별 고혈압 위험성 예측 시스템의 예측부에서, 상기 계산된 PRS에 기초하여, 상기 검사자에 대한 체질별 고혈압 위험도를 예측하는 단계
를 포함하고,
상기 체질별 고혈압 위험도를 예측하는 단계는,
상기 검사자의 체질 특성을 입력받아, 상기 검사자가 포함된 집단특성분포를 결정하는 단계; 및
상기 결정된 집단특성분포에서, 상기 PRS의 점유 위치를 인지하여, 상기 검사자의 체질별 고혈압 위험도를 예측하는 단계
를 포함하는 체질별 고혈압 위험성 예측 방법.
삭제
삭제
삭제
삭제
검사자의 고혈압 SNP(single nucleotide polymorphism)에 관한 유전자형(genotype)을 확인하는 확인부;
복수의 집단의 LD 데이터(Linkage Disequilibrium data)를 사용하여 분석하는 fastBAT에 의해, 상기 복수의 집단 모두에서 유의성(有意性)이 유지되는 n개(상기 n은 5이상의 자연수)의 유전자를 식별하는 식별부;
Mixed linear model을 이용하여, 상기 고혈압 SNP 각각에 대한 유전적 효과(genetic effect)를 계산하고, 상기 식별된 n개의 유전자 내에 속해 있는 SNP의 유전적 효과를 합산하여, 상기 유전자형에 따라 상기 검사자에게 할당하는 PRS(Polygenic Risk Score)를 계산하는 계산부; 및
상기 계산된 PRS에 기초하여, 상기 검사자에 대한 체질별 고혈압 위험도를 예측하는 예측부
를 포함하고,
상기 예측부는,
상기 검사자의 체질 특성을 입력받아, 상기 검사자가 포함된 집단특성분포를 결정하고, 상기 결정된 집단특성분포에서, 상기 PRS의 점유 위치를 인지하여, 상기 검사자의 체질별 고혈압 위험도를 예측하는
체질별 고혈압 위험성 예측 시스템.
삭제
삭제
삭제
삭제
제1항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록매체.