KR101546069B1

KR101546069B1 - 대사증후군 예측용 ｓｎｐ 마커 및 이의 용도

Info

Publication number: KR101546069B1
Application number: KR1020150100061A
Authority: KR
Inventors: 차성원; 박아연; 유현주; 김종열
Original assignee: 한국 한의학 연구원
Priority date: 2015-07-14
Filing date: 2015-07-14
Publication date: 2015-08-21
Also published as: KR20150090874A

Abstract

본 발명은 사상체질 특이적 대사증후군 예측 또는 진단용 SNP(single nucleotide polymorphism) 마커에 관한 것으로, 보다 자세하게는 태음인, 소양인, 소음인 특이적 대사증후군 예측 또는 진단용 SNP 마커, 상기 마커를 검출할 수 있는 제제를 포함하는 조성물, 상기 조성물을 포함하는 키트 또는 마이크로어레이, 상기 마커를 이용한 사상체질 특이적 대사증후군 예측 또는 진단을 위한 정보의 제공 방법 및 사상체질 특이적 대사증후군 예측 또는 진단용 SNP를 선별하는 방법에 관한 것이다.

Description

대사증후군 예측용 ＳＮＰ 마커 및 이의 용도{SNP markers for metabolic syndrome and use thereof}

본 발명은 사상체질 특이적 대사증후군 예측 또는 진단용 SNP (single nucleotide polymorphism) 마커에 관한 것으로, 보다 자세하게는 태음인, 소양인, 소음인 특이적 대사증후군 예측 또는 진단용 SNP 마커, 상기 마커를 검출할 수 있는 제제를 포함하는 조성물, 상기 조성물을 포함하는 키트 또는 마이크로어레이, 상기 마커를 이용한 사상체질 특이적 대사증후군 예측 또는 진단을 위한 정보의 제공 방법 및 사상체질 특이적 대사증후군 예측 또는 진단용 SNP를 선별하는 방법에 관한 것이다.

대사증후군은 복부 비만, 고혈압, 고중성지방혈증, 저고밀도(HDL)콜레스테롤혈증 및 고혈당증의 다섯 가지 위험 요인 중 3가지 이상을 지니고 있는 상태를 일컫는다. 현대인의 건강을 위협하는 당뇨병 및 관상동맥질환과 같은 심혈관질환은 대사증후군과 밀접하게 연관되어 있고, 대사증후군의 유병률은 23.7%에 이르는 것으로 알려져 있다.

한편, 사상체질에서는 사람을 태양인, 태음인, 소양인, 소음인의 네 가지 체질로 분류하는데, 이 네 가지 체질은 약에 대한 반응성이 다를 뿐만 아니라 외모, 체형, 성격, 장부기능, 식생활 등에서도 차이를 나타내는 것으로 알려져 있다. 이와 더불어 대사증후군을 비롯한 다양한 심혈관대사질환에 대한 발병률 또한 체질 그룹 간에 서로 달라서, 그 수가 매우 적은 태양인을 제외하고 나머지 세 체질에 대해서 비교했을 때, 대체로 소음인, 소양인, 태음인 순으로 발병률이 높아지는 것으로 알려져 있다.

이와 같은 체질별 질환 감수성의 차이는 식생활 및 활동량의 차이에서 기인하는 것으로 여겨진다. 즉, 대체로 태음인은 식욕이 높아 많이 먹지만 활동량이 적은 반면, 소음인은 활동량은 적어도 적게 먹으며, 소양인은 높은 식욕에 많이 먹더라도 활동량 또한 높아서, 위에서 언급한 것과 같이 질환 발병률이 체질별로 상이한 것으로 여겨지고 있다.

이외에도 체질별 유전적 차이도 질환 발병률 차이에 작용할 것으로 보이며, 이는 사상체질은 선천적으로 정해지면 일생 동안 체질이 변하지 않는 것으로 받아들여지고 있을 뿐만 아니라, 인구 내 체질 비율이 태음인:소양인:소음인=5:3:2로서 사상체질 이론이 주장이 된 후 100년이 넘는 기간 동안 거의 변하지 않고 있기 때문이다. 쌍둥이 및 가계를 대상으로 이루어진 체질의 유전율 연구에서도 체질별로 유전적 소양이 50% 안팎에 이르는 것으로 밝혀졌다.

따라서, 모태에서 결정된 체질은 일생 동안 변하지 않는다고 보기 때문에 체질 형성과 유전적인 차이는 서로 연관성이 클 것으로 여겨진다. 개인별 유전적 차이가 심혈관대사질환 발병에 영향을 주는 것으로 최근의 집단 유전학 연구를 통해서 계속 밝혀지고 있는 것과 마찬가지로 체질간 유전적 차이가 질환 차이에 영향을 줄 것으로 예상된다.

따라서, 개인 맞춤의학적 견지에서 황인, 백인, 흑인 간의 체형, 외모, 식생활, 유전적 성향에 따른 인종적인 차이를 인정하고, 유전적 질병 감수성 규명을 인종별로 분리하여 집단 연구를 수행하는 것과 마찬가지로, 체질별 유전적 소양이 다르다면 한 인종 내에서도 체질 집단별 연관성 분석을 수행하는 것이 질병의 유전적 감수성을 밝히는데 더 효과적일 것이다.

최근에 이루어진 전장유전체연구(GWAS, genome-wide association study)를 통해서 체질량지수, 허리-엉덩이 둘레비, 혈압(blood pressure), 지질 수치(triglyceride, cholesterol level), 공복 혈당 등과 같은 비만 및 복부 비만, 고혈압, 고지혈증, 당뇨병 관련 표현형에 대해 연관성이 있는 다수의 SNP(단일염기다형성, single nucleotide polymorphism)들이 밝혀졌으며, 다수의 후속 집단 연구를 통해서 연관성에 대한 재현성이 보장된 SNP들이 대상 표현형별로 발표 되고 있다. 그러나, 아직 대사증후군 관련 사상체질별 집단 연구는 1개의 SNP를 대상으로 한 연구 외에는 수행된바 없으며, 사상체질의 유전성을 이용하여 사상체질과 뚜렷하게 연관된 대사증후군을 예측할 수 있는 유전자를 밝히거나 유전적 지표를 찾지 못하였다.

이러한 배경하에, 본 발명자들은 대사증후군의 발병률을 효과적으로 예측할 수 있는 표지자를 찾기 위하여, 대사증후군 및 이와 관련된 주요 위험 인자인 복부 비만, 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증 및 고혈당증을 대상으로 GWAS SNP 연구를 수행하였으며, 이에 사상체질별로 대사증후군 발병의 유전적 위험도를 예측하는 연관 SNP 세트를 규명하여 본 발명을 완성하였다.

본 발명의 하나의 목적은 사상체질 특이적 대사증후군 예측 또는 진단용 SNP (single nucleotide polymorphism) 마커를 제공하는 것이다.

본 발명의 또 하나의 목적은 상기 사상체질 특이적 대사증후군 예측 또는 진단용 SNP 마커를 검출할 수 있는 프로브 또는 증폭할 수 있는 제제를 포함하는, 사상체질 특이적 대사증후군 예측 또는 진단용 조성물을 제공하는 것이다.

본 발명의 또 하나의 목적은 상기 사상체질 특이적 대사증후군 예측 또는 진단용 조성물을 포함하는 사상체질 특이적 대사증후군 예측 또는 진단용 키트 또는 마이크로어레이를 제공하는 것이다.

본 발명의 또 하나의 목적은 상기 SNP 마커의 다형성 부위를 결정하는 단계를 포함하는, 사상체질 특이적 대사증후군 예측 또는 진단을 위한 정보의 제공 방법을 제공하는 것이다.

본 발명의 또 하나의 목적은 사상체질 특이적 대사증후군 예측 또는 진단용 SNP 마커를 선별하는 방법을 제공하는 것이다.

본 발명은 상기의 과제를 해결하기 위한 하나의 구현예로서, 사상체질 특이적 대사증후군 예측 또는 진단용 단일염기다형성인 SNP (single nucleotide polymorphism) 마커를 제공한다.

상기 마커는 바람직하게는 서열번호 1 내지 51로 구성된 폴리뉴클레오티드들에 있어서, SNP 위치인 각 서열의 101번째 염기를 포함하고, 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드로부터 선택된 하나 이상의 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드를 포함하는, 사상체질 특이적 대사증후군 예측 또는 진단용 마커일 수 있다.

본 발명에서 사용되는 용어, "다형성(polymorphism)"이란 하나의 유전자 좌위(locus)에 두 가지 이상의 대립 유전자(allele)가 존재하는 경우를 말하며 다형성 부위 중에서, 사람에 따라 단일 염기만이 다른 것을 단일 염기 다형성(single nucleotide polymorphism, SNP)이라 한다. 바람직한 다형성 마커는 선택된 집단에서 1% 이상, 더욱 바람직하게는 5% 또는 10% 이상의 발생 빈도를 나타내는 두 가지 이상의 대립 유전자를 가진다.

본 발명에서 사용되는 용어, "대립 유전자"는 상동 염색체의 동일한 유전자 좌위에 존재하는 한 유전자의 여러 타입을 말한다. 대립 유전자는 다형성을 나타내는데 사용되기도 하며, 예컨대, SNP는 두 종류의 대립 인자(biallele)를 갖는다.

본 발명에서 사용되는 용어, "rs_id"란 1998년부터 SNP 정보를 축적하기 시작한 NCBI가 초기에 등록되는 모든 SNP에 대하여 부여한 독립된 표지자인 rs-ID를 의미한다. 본 발명에서는 rs13130484와 같은 형태로 기재하였다. 이와 같은 표에 기재된 rs_id는 본 발명의 다형성 마커인 SNP 마커를 의미한다. 당업자라면 상기 rs_id를 이용하여 SNP의 위치 및 서열을 용이하게 확인할 수 있을 것이다. NCBI의 dbSNP (The Single Nucleotide Polymorphism Database) 번호인 rs_id에 해당하는 구체적인 서열은 시간이 지남에 따라 약간 변경될 수 있다. 본 발명의 범위가 상기 변경된 서열에도 미치는 것은 당업자에게 자명할 것이다.

상기 "서열번호 1 내지 51"은 다형성 부위를 포함하는 다형성 서열(polymorphic sequence)이다. 다형성 서열이란 폴리뉴클레오티드 서열 중에 SNP를 포함하는 다형성 부위(polymorphic site)를 포함하는 서열을 의미한다. 상기 폴리뉴클레오티드 서열은 DNA 또는 RNA가 될 수 있다.

본 발명의 SNP 마커는 표 2에 표시된 마커로서, 개체의 SNP 마커의 다형성 부위가 효과 대립 유전자(effect allele)로 표시된 대립 유전자일 경우, 대사증후군 위험성이 높아 대사증후군 발병 또는 위험이 높은 개체로 판단할 수 있는 것이다. 본 발명에서 "효과 대립 유전자"는 "위험 대립 유전자"와 혼용될 수 있다.

본 발명에서 사용되는 용어, "사상체질"이란 사상의학에 의해 사람의 체질을 태양인, 소양인, 태음인 및 소음인의 네 가지로 분류한 것을 의미하는 것으로 체질은 선천적이며 일생에 걸쳐 변하지 않아 생물학적으로 유전적인 특성을 가진 것으로 볼 수 있다. 체질별로 질환 발병률이 차이가 있어서, 사상체질 특이적 질환 마커를 제공할 수 있다면, 보다 정확한 질환의 예측 또는 진단이 이루어 질 수 있을 것으로 기대되고 있어 본 발명자들에 의해 최초로 사상체질별로 특이적인 대사증후군 예측 또는 진단용 SNP 마커를 제공한 것이다. 본 발명의 목적상, 대사증후군은 한국인에 있어서 그 빈도가 매우 낮은 태양인을 제외하고 태음인, 소양인 및 소음인에 특이적인 SNP 마커를 제공한다.

본 발명에서 사용되는 용어, "대사증후군"은 심혈관대사질환을 예측하는 표현형 표지자로 이용할 수 있으며, 대사증후군에 의해 복부 비만, 고혈압, 저고밀도콜레스테롤혈증, 고중성지방증 또는 고혈당증 등의 발병률이 높아질 수 있다. 본 발명에서 제공하는 SNP 마커는 복부 비만, 고혈압, 저고밀도콜레스테롤혈증, 고중성지방증 또는 고혈당증의 표현형을 나타내는 대사증후군의 위험도를 정확히 예측할 수 있으며, 나아가 심혈관대사질환의 위험도 여부를 판단할 수 있도록 할 수 있다.

본 발명에서 사용되는 용어, "예측 또는 진단"은 질병 발생의 예측 및 질병 발생 위험도를 결정하거나 도출시키는데 사용되는 모든 유형의 분석을 포함하며, 바람직하게는 대사증후군인지 여부를 판단하여 진단을 하거나 발병 위험을 예측하는 것일 수 있다.

바람직하게 상기 SNP 마커는 태음인 특이적 대사증후군 예측 또는 진단용 SNP 마커로서, 상기 서열번호 1 내지 17로 구성된 폴리뉴클레오티드들 중, 서열번호 1로 기재되는 rs13130484에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 2로 기재되는 rs1424233에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 3으로 기재되는 rs17782313에 있어서, 101번째 염기가 T 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 4로 기재되는 rs6235에 있어서, 101번째 염기가 G 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 5로 기재되는 rs1294421에 있어서, 101번째 염기가 T 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 6으로 기재되는 rs2605100에 있어서, 101번째 염기가 G 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 7로 기재되는 rs17249754에 있어서, 101번째 염기가 G 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 8로 기재되는 rs1133323에 있어서, 101번째 염기가 G 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 9로 기재되는 rs6589566에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 10으로 기재되는 rs6544366에 있어서, 101번째 염기가 T 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 11로 기재되는 rs10402271에 있어서, 101번째 염기가 T 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 12로 기재되는 rs3846663에 있어서, 101번째 염기가 T 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 13으로 기재되는 rs2156552에 있어서, 101번째 염기가 A 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 14로 기재되는 rs6586891에 있어서, 101번째 염기가 C 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 15로 기재되는 rs5215에 있어서, 101번째 염기가 T 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 16으로 기재되는 rs163171에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 및 서열번호 17로 기재되는 rs7593730에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드로 이루어진 군에서 선택된 하나 이상의 폴리뉴클레오티드일 수 있다.

더 바람직하게는 2개 이상, 더욱 바람직하게는 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 가장 바람직하게는 17개 모두의 SNP 마커 세트일 수 있다. 상기 마커는 각 SNP 마커의 101번째 염기가 표 3의 효과 대립 유전자 염기인 경우에는 태음인 특이적 대사증후군의 위험이 높은 것으로 판단할 수 있으며, 효과 대립 유전자 염기가 아닌 경우에는 태음인 특이적 대사증후군 위험이 낮은 것으로 판단할 수 있고, 개체의 SNP 마커의 수가 많을수록 정확도가 높아질 수 있다.

또한 바람직하게 상기 SNP 마커는 소음인 특이적 대사증후군 예측 또는 진단용 SNP 마커로서, 상기 서열번호 18 내지 32로 구성된 폴리뉴클레오티드 중, 서열번호 18로 기재된 rs8050136에 있어서, 101번째 염기가 C 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 19로 기재된 rs4712652에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 20으로 기재된 rs1294421에 있어서, 101번째 염기가 T 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 21로 기재된 rs6005975에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 22로 기재된 rs17249754에 있어서, 101번째 염기가 G 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 23으로 기재된 rs4409766에 있어서, 101번째 염기가 T 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 24로 기재된 rs17367504에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 25로 기재된 rs1716685에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 26으로 기재된 rs4149270에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 27로 기재된 rs10889353에 있어서, 101번째 염기가 A 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 28로 기재된 rs6589566에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 29로 기재된 rs17315646에 있어서, 101번째 염기가 C 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 30으로 기재된 rs5215에 있어서, 101번째 염기가 T 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 31로 기재된 rs163171에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 및 서열번호 32로 기재된 rs7927129에 있어서, 101번째 염기가 T 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드로 이루어진 군에서 선택된 하나 이상의 폴리뉴클레오티드일 수 있다.

더 바람직하게는 2개 이상, 더욱 바람직하게는 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 가장 바람직하게는 15개 모두의 SNP 마커 세트일 수 있다. 상기 마커는 각 SNP 마커의 101번째 염기가 표 3의 효과 대립 유전자 염기인 경우에는 소음인 특이적 대사증후군의 위험이 높은 것으로 판단할 수 있으며, 효과 대립 유전자 염기가 아닌 경우에는 소음인 특이적 대사증후군 위험이 낮은 것으로 판단할 수 있으며, 개체의 SNP 마커의 수가 많을수록 정확도가 높아질 수 있다.

또한, 바람직하게 상기 SNP 마커는 소양인 특이적 대사증후군 예측 또는 진단용 SNP 마커로서, 상기 서열번호 33 내지 51로 구성된 폴리뉴클레오티드 중, 서열번호 33으로 기재된 rs13130484에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 34로 기재된 rs1424233에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 35로 기재된 rs7561317에 있어서, 101번째 염기가 G 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 36으로 기재된 rs2605100에 있어서, 101번째 염기가 G 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 37로 기재된 rs4149270에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 38로 기재된 rs6589566에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 39로 기재된 rs4420638에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 40으로 기재된 rs261332에 있어서, 101번째 염기가 G 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 41로 기재된 rs1566732에 있어서, 101번째 염기가 A 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 42로 기재된 rs6129647에 있어서, 101번째 염기가 T 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 43으로 기재된 rs10903129에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 44로 기재된 rs1436955에 있어서, 101번째 염기가 G 또는 A인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 45로 기재된 rs7754840에 있어서, 101번째 염기가 G 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 46으로 기재된 rs7767391에 있어서, 101번째 염기가 T 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 47로 기재된 rs6475606에 있어서, 101번째 염기가 T 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 48로 기재된 rs4402960에 있어서, 101번째 염기가 G 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 49로 기재된 rs864745에 있어서, 101번째 염기가 A 또는 G인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 서열번호 50으로 기재된 rs5215에 있어서, 101번째 염기가 T 또는 C인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드; 및 서열번호 51로 기재된 rs163171에 있어서, 101번째 염기가 C 또는 T인 101번째 염기를 포함하는 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드로 이루어진 군에서 선택된 하나 이상의 폴리뉴클레오티드일 수 있다.

더 바람직하게는 2개 이상, 더욱 바람직하게는 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상, 가장 바람직하게는 19개 모두의 SNP 마커 세트일 수 있다. 상기 마커는 각 SNP 마커의 101번째 염기가 표 3의 효과 대립 유전자 염기인 경우에는 소양인 특이적 대사증후군의 위험이 높은 것으로 판단할 수 있으며, 효과 대립 유전자 염기가 아닌 경우에는 소양인 특이적 대사증후군 위험이 낮은 것으로 판단할 수 있으며, 개체의 SNP 마커의 수가 많을수록 정확도가 높아질 수 있다.

본 발명에서 대사증후군은 복부 비만, 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증, 및 고혈당증의 5가지 위험 인자 중, 3가지 이상의 위험 인자와 관련된 표현형을 나타내는 경우를 의미한다. 복부 비만은 허리 둘레가 남성은 90 cm 이상, 여성은 85 cm 이상인 상태를 의미하며, 고혈압은 수축기 혈압(systolic blood pressure)이 130 mmHg 이상이거나 이완기혈압(diastolic blood pressure)이 85 mmHg 이상이거나 혈압약을 복용하는 상태를 의미하고, 고중성지방혈증은 중성지방(triglyceride)이 150 mg/dL 이상인 상태를 의미하며, 저고밀도콜레스테롤혈증은 고밀도콜레스테롤(HDL cholesterol) 수준이 남성의 경우 40 mg/dL 미만, 여성의 경우는 50 mg/dL 미만인 경우를 의미하고, 고혈당증은 공복기 혈당(fasting blood glucose이 110 mg/dL 이상이거나 혈당 조절약물을 복용하는 상태를 의미한다.

본 발명자들은 상기 SNP가 사상체질 특이적 대사증후군 예측 또는 진단용 마커임을 다음과 같은 입증을 통하여 확인하였다. 구체적으로 사상체질 한약에 대해 반응을 보고 체질을 확정한 사람을 대상으로 대사증후군의 5가지 위험 인자인 복부 비만, 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증, 또는 고혈당증과 관련된 표현형에 대하여 반복 재현성이 확립된 SNP들을 확보한 후, 연관 통계 분석 결과, 연관성이 있는 SNP 74개를 선별하고(표 2), 체질별로 대사증후군 표현형과 연관성이 있는 특이적 SNP를 선별하였다(표 3). 체질별 특이성 부여는 다음과 같이 수행하였다. 예를 들어, 태음인에서 대사증후군 표현형에 연관성이 있는 SNP 세트를 대상으로 다른 체질인 소양인, 소음인에서 통계 분석을 했을 때, 대사증후군 및 이의 5 가지 위험인자인 복부 비만, 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증, 고혈당증에 대해 현저한 연관성이 나타나지 않는 경우에 태음인 특이적인 SNP 세트라고 명명할 수 있다. 상기 SNP의 GRS(genetic risk score)를 측정하여(표 4), 사상체질별 대사증후군에 유의성을 갖는 SNP를 규명하였으며, 이와 같은 SNP는 본 발명자들에 의해 최초로 규명된 것이다.

본 발명의 또 다른 구현예로서, 상기 사상체질별 대사증후군 예측 또는 진단용 마커를 검출할 수 있는 프로브 또는 증폭할 수 있는 제제를 포함하는, 사상체질 특이적 대사증후군 예측 또는 진단용 조성물을 제공한다.

본 발명에서 사용되는 용어, "사상체질별 대사증후군 예측 또는 진단용 마커를 검출할 수 있는 프로브"는 상기와 같은 유전자의 다형성 부위와 특이적으로 혼성화 반응을 통해 확인하여 특이적 사상체질 및 대사증후군을 예측 또는 진단할 수 있는 조성물을 의미하며, 이와 같은 유전자 분석의 구체적 방법은 특별한 제한이 없으며, 이 발명이 속하는 기술분야에 알려진 모든 유전자 검출 방법에 의하는 것일 수 있다.

본 발명에서 사용되는 용어, "사상체질별 대사증후군 예측 또는 진단용 마커를 증폭할 수 있는 제제"란 상기와 같은 유전자의 다형성 부위를 증폭을 통해 확인하여 특이적 사상체질 및 대사증후군을 예측 또는 진단할 수 있는 조성물을 의미하며, 바람직하게는 상기 사상체질별 대사증후군 예측 또는 진단용 마커의 폴리뉴클레오티드를 특이적으로 증폭할 수 있는 프라이머를 의미한다.

상기 다형성 마커 증폭에 사용되는 프라이머는, 적절한 버퍼 중의 적절한 조건(예를 들면, 4개의 다른 뉴클레오시드 트리포스페이트 및 DNA, RNA 폴리머라제 또는 역전사 효소와 같은 중합제) 및 적당한 온도 하에서 주형-지시 DNA 합성의 시작점으로서 작용할 수 있는 단일가닥 올리고뉴클레오티드를 말한다. 상기 프라이머의 적절한 길이는 사용 목적에 따라 달라질 수 있으나, 통상 15 내지 30 뉴클레오티드이다. 짧은 프라이머 분자는 일반적으로 주형과 안정한 혼성체를 형성하기 위해서는 더 낮은 온도를 필요로 한다. 프라이머 서열은 주형과 완전하게 상보적일 필요는 없으나, 주형과 혼성화 할 정도로 충분히 상보적이어야 한다.

본 발명에서 사용되는 용어, "프라이머"는 짧은 자유 3' 말단 수산화기(free 3' hydroxyl group)를 가지는 염기 서열로 상보적인 템플레이트(template)와 염기쌍(base pair)을 형성할 수 있고 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응(즉, DNA 폴리머라아제 또는 역전사 효소)을 위한 시약 및 상이한 4가지 뉴클레오사이드 트리포스페이트의 존재하에서 DNA 합성을 개시할 수 있다. PCR 증폭을 실시하여 원하는 생성물의 생성 여부를 통해 사상체질 특이적 대사증후군을 예측할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당업계에 공지된 것을 기초로 변형할 수 있다.

본 발명의 프로브 또는 프라이머는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비-제한적인 예로는 메틸화, "캡화", 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다.

또 다른 일 구현예로서, 본 발명은 상기 사상체질 특이적 대사증후군 예측 또는 진단용 조성물을 포함하는 사상체질 특이적 대사증후군 예측 또는 진단용 키트를 제공한다.

상기 키트는 RT-PCR 키트 또는 DNA 분석용(예, DNA 칩) 키트일 수 있다.

본 발명의 키트는 사상체질 특이적 대사증후군 예측 또는 진단용 마커인 SNP 마커를 증폭을 통해 확인하거나, SNP 마커의 발현 수준을 mRNA의 발현 수준을 확인함으로써 사상체질 특이적 대사증후군을 예측 또는 진단할 수 있다. 구체적인 일례로서, 본 발명에서 사상체질 특이적 대사증후군 예측 또는 진단용 마커의 mRNA 발현 수준을 측정하기 위한 키트는 RT-PCR을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. RT-PCR 키트는, 사상체질 특이적 대사증후군 예측 또는 진단용 마커의 유전자에 대한 특이적인 각각의 프라이머 쌍 외에도 RT-PCR 키트는 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사 효소와 같은 효소, DNase, RNAse 억제제, DEPC-수(DEPC-water), 멸균수 등을 포함할 수 있다. 또한 정량 대조군으로 사용되는 유전자에 특이적인 프라이머 쌍을 포함할 수 있다. 또한 바람직하게는, 본 발명의 키트는 DNA 칩을 수행하기 위해 필요한 필수 요소를 포함하는 사상체질 특이적 대사증후군 예측 또는 진단용 키트일 수 있다. DNA 칩 키트는, 일반적으로 편평한 고체 지지판, 전형적으로는 현미경용 슬라이드보다 크지않은 유리 표면에 핵산 종을 격자형 배열(gridded array)로 부착한 것으로, 칩 표면에 핵산이 일정하게 배열되어, DNA 칩 상의 핵산과 칩 표면에 처리된 용액 내에 포함된 상보적인 핵산 간에 다중 혼성화(hybridization) 반응이 일어나 대량 병렬 분석이 가능하도록 하는 도구이다.

또 다른 일 구현예로서, 본 발명은 상기 사상체질 특이적 대사증후군 예측 또는 진단용 마커의 폴리뉴클레오티드를 포함하는 사상체질 특이적 대사증후군 예측 또는 진단용 마이크로어레이를 제공한다.

상기 마이크로어레이는 DNA 또는 RNA 폴리뉴클레오티드를 포함하는 것일 수 있다. 상기 마이크로어레이는 프로브 폴리뉴클레오티드에 본 발명의 폴리뉴클레오티드를 포함하는 것을 제외하고는 통상적인 마이크로어레이로 이루어진다.

프로브 폴리뉴클레오티드를 기판상에 고정화하여 마이크로어레이를 제조하는 방법은 당업계에 잘 알려져 있다. 상기 프로브 폴리뉴클레오티드는 혼성화할 수 있는 폴리뉴클레오티드를 의미하는 것으로, 핵산의 상보성 가닥에 서열 특이적으로 결합할 수 있는 올리고뉴클레오티드를 의미한다. 본 발명의 프로브는 대립 유전자 특이적 프로브로서, 같은 종의 두 구성원으로부터 유래한 핵산 단편 중에 다형성 부위가 존재하여, 한 구성원으로부터 유래한 DNA 단편에는 혼성화하나, 다른 구성원으로부터 유래한 단편에는 혼성화하지 않는다. 이 경우 혼성화 조건은 대립 유전자간의 혼성화 강도에 있어서 유의한 차이를 보여, 대립 유전자 중 하나에만 혼성화 하도록 충분히 엄격해야 한다. 이렇게 함으로써 다른 대립 유전자 형태 간에 좋은 혼성화 차이를 유발할 수 있다. 본 발명의 상기 프로브는 대립 유전자를 검출하여 사상체질 특이적 대사증후군 예측 또는 진단 방법 등에 사용될 수 있다. 상기 예측 또는 진단 방법에는 서던 블롯트 등과 같은 핵산의 혼성화에 근거한 검출방법들이 포함되며, DNA 칩을 이용한 방법에서 DNA 칩의 기판에 미리 결합된 형태로 제공될 수도 있다. 상기 혼성화란 엄격한 조건, 예를 들면 1M 이하의 염 농도 및 25 ℃ 이상의 온도 하에서 보통 수행될 수 있다. 예를 들면, 5x SSPE (750 mM NaCl, 50 mM Na Phosphate, 5 mM EDTA, pH 7.4) 및 2530 ℃의 조건이 대립 유전자 특이적 프로브 혼성화에 적합할 수 있다.

본 발명의 사상체질 특이적 대사증후군 예측 또는 진단과 연관된 프로브 폴리뉴클레오티드의 기판상에 고정화하는 과정도 또한 이러한 종래 기술을 사용하여 용이하게 제조할 수 있다. 또한, 마이크로어레이 상에서의 핵산의 혼성화 및 혼성화 결과의 검출은 당업계에 잘 알려져 있다. 상기 검출은 예를 들면, 핵산 시료를 형광 물질 예를 들면 Cy3 및 Cy5와 같은 물질을 포함하는 검출가능한 신호를 발생시킬 수 있는 표지 물질로 표지한 다음, 마이크로어레이 상에 혼성화하고 상기 표지 물질로부터 발생하는 신호를 검출함으로써 혼성화 결과를 검출할 수 있다.

또 다른 일 구현예로서, 본 발명은 (a) 분리된 시료의 DNA로부터 상기 SNP 마커의 다형성 부위를 증폭하거나 프로브와 혼성화하는 단계; 및 (b) 상기 (a) 단계의 증폭된 또는 혼성화된 다형성 부위의 염기를 결정하는 단계를 포함하는, 사상체질 특이적 대사증후군 예측 또는 진단을 위한 정보의 제공 방법을 제공한다.

상기 분리된 시료의 DNA는 개체로부터 분리된 시료로부터 수득할 수 있다.

본 발명의 용어, "개체"란 사상체질 특이적 대사증후군 예측 또는 진단을 하기 위한 피험자로서, 상기 사상체질 특이적 대사증후군은 태음인, 소양인 또는 소음인 특이적 대사증후군 여부를 판단할 수 있다. 상기 검체에서 머리카락, 뇨, 혈액, 각종 체액, 분리된 조직, 분리된 세포 또는 타액과 같은 시료 등으로부터 DNA를 수득할 수 있으나, 이에 제한되는 것은 아니다.

상기 (a) 단계의 DNA로부터 상기 SNP 마커의 다형성 부위를 증폭하거나 프로브와 혼성화하는 단계는 당업자에게 알려진 어떠한 방법이든 사용 가능하다. 예를 들면, 표적 핵산을 PCR을 통하여 증폭하고 이를 정제하여 얻을 수 있다. 그 외 리가제 연쇄 반응(LCR)(Wu 및 Wallace, Genomics 4, 560(1989), Landegren 등, Science 241, 1077(1988)), 전사증폭(transcription amplification)(Kwoh 등, Proc. Natl.Acad. Sci. USA 86, 1173(1989)) 및 자가유지 서열 복제(Guatelli 등, Proc. Natl. Acad. Sci. USA 87, 1874(1990)) 및 핵산에 근거한 서열 증폭(NASBA)이 사용될 수 있다.

상기 방법 중 (b)단계의 다형성 부위의 염기를 결정하는 것은 서열 분석, 마이크로어레이(microarray)에 의한 혼성화, 대립 유전자 특이적인 PCR (allele specific PCR), 다이나믹 대립 유전자 혼성화 기법(dynamic allele-specifichybridization, DASH), PCR 연장 분석, PCR-SSCP, PCR-RFLP 분석 또는 TaqMan 기법, SNPlex 플랫폼(Applied Biosystems), 질량 분석법(예를 들면, Sequenom의 MassARRAY 시스템), 미니-시퀀싱(mini-sequencing) 방법, Bio-Plex 시스템(BioRad), CEQ and SNPstream 시스템(Beckman), Molecular Inversion Probe 어레이 기술(예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies(예를 들면, Illumina GoldenGate 및 Infinium 분석법)를 포함하나, 이에 한정되지 않는다. 상기 방법들 또는 본 발명이 속하는 기술분야의 당업자에게 이용 가능한 다른 방법에 의해, 마이크로새틀라이트, SNP 또는 다른 종류의 다형성 마커를 포함한, 다형성 마커에서의 하나 이상의 대립 유전자가 확인될 수 있다. 이와 같은 다형성 부위의 염기를 결정하는 것은 바람직하게는 SNP 칩을 통해 수행할 수 있다.

본 발명에서 사용되는 용어, "SNP 칩"은 수십만 개의 SNP의 각 염기를 한번에 확인할 수 있는 DNA 마이크로어레이의 하나를 의미한다.

TaqMan 방법은 (1) 원하는 DNA 단편을 증폭할 수 있도록 프라이머 및 TaqMan 탐침을 설계 및 제작하는 단계; (2) 서로 다른 대립 유전자의 탐침을 FAM 염료 및 VIC 염료로 표지(Applied Biosystems)하는 단계; (3) 상기 DNA를 주형으로 하고, 상기의 프라이머 및 탐침을 이용하여 PCR을 수행하는 단계; (4) 상기의 PCR 반응이 완성된 후, TaqMan 분석 플레이트를 핵산 분석기로 분석 및 확인하는 단계; 및 (5) 상기 분석결과로부터 단계 (1)의 폴리뉴클레오티들의 유전자형을 결정하는 단계를 포함한다.

상기에서, 시퀀싱 분석은 염기서열 결정을 위한 통상적인 방법을 사용할 수 있으며, 자동화된 유전자분석기를 이용하여 수행될 수 있다. 또한, 대립 유전자 특이적 PCR은 SNP가 위치하는 염기를 3' 말단으로 하여 고안한 프라이머를 포함한 프라이머 세트로 상기 SNP가 위치하는 DNA 단편을 증폭하는 PCR 방법을 의미한다. 상기 방법의 원리는, 예를 들어, 특정 염기가 A에서 G로 치환된 경우, 상기 A를 3' 말단염기로 포함하는 프라이머 및 적당한 크기의 DNA 단편을 증폭할 수 있는 반대 방향 프라이머를 고안하여 PCR 반응을 수행할 경우, 상기 SNP 위치의 염기가 A인 경우에는 증폭반응이 정상적으로 수행되어 원하는 위치의 밴드가 관찰되고, 상기 염기가 G로 치환된 경우에는 프라이머는 주형 DNA에 상보결합할수 있으나, 3' 말단 쪽이 상보결합을 하지 못함으로써 증폭반응이 제대로 수행되지 않는 점을 이용한 것이다. DASH는 통상적인 방법으로 수행될 수 있고, 바람직하게는 프린스 등에 의한 방법에 의하여 수행될 수 있다.

한편, PCR 연장 분석은 먼저 단일염기 다형성이 위치하는 염기를 포함하는 DNA 단편을 프라이머 쌍으로 증폭을 한 다음, 반응에 첨가된 모든 뉴클레오티드를 탈인산화시킴으로써 불활성화시키고, 여기에 SNP 특이적 연장 프라이머, dNTP 혼합물, 디디옥시뉴클레오티드, 반응 완충액 및 DNA 중합효소를 첨가하여 프라이머 연장반응을 수행함으로써 이루어진다. 이때, 연장 프라이머는 SNP가 위치하는 염기의 5' 방향의 바로 인접한 염기를 3' 말단으로 삼으며, dNTP 혼합물에는 디디옥시뉴클레오티드와 동일한 염기를 갖는 핵산이 제외되고, 상기 디디옥시뉴클레오티드는 SNP를 나타내는 염기 종류 중 하나에서 선택된다. 예를 들어, A에서 G로의 치환이 있는 경우, dGTP, dCTP 및 TTP 혼합물과 ddATP를 반응에 첨가할 경우, 상기 치환이 일어난 염기에서 프라이머는 DNA 중합효소에 의하여 연장되고, 몇 염기가 지난 후 A 염기가 최초로 나타나는 위치에서 ddATP에 의하여 프라이머 연장반응이 종결된다. 만일 상기 치환이 일어나지 않았다면, 그 위치에서 연장반응이 종결되므로, 상기 연장된 프라이머의 길이를 비교함으로써 SNP를 나타내는 염기 종류를 판별할 수 있게 된다.

이때, 검출방법으로는 연장 프라이머 또는 디디옥시뉴클레오티드를 형광 표지한 경우에는 일반적인 염기서열 결정에 사용되는 유전자 분석기(예를 들어, ABI사의 Model 3700 등)를 사용하여 형광을 검출함으로써 상기 SNP을 검출할 수 있으며, 무-표지된 연장 프라이머 및 디디옥시뉴클레오티드를 사용할 경우에는 MALDI-TOF (matrix assisted laser desorption ionization-time of flight) 기법을 이용하여 분자량을 측정함으로써 상기 SNP를 검출할 수 있다.

바람직하게, 상기 (b) 단계에서 결정된 염기서열 중, 서열번호 1로 기재된 rs13130484에 있어서, 101번째 염기가 T인 경우; 서열번호 2로 기재된 rs1424233에 있어서, 101번째 염기가 G인 경우; 서열번호 3으로 기재된 rs17782313에 있어서, 101번째 염기가 C인 경우; 서열번호 4로 기재된 rs6235에 있어서, 101번째 염기가 G인 경우; 서열번호 5로 기재된 rs1294421에 있어서, 101번째 염기가 T인 경우; 서열번호 6으로 기재된 rs2605100에 있어서, 101번째 염기가 G인 경우; 서열번호 7로 기재된 rs17249754에 있어서, 101번째 염기가 G인 경우; 서열번호 8로 기재된 rs1133323에 있어서, 101번째 염기가 G인 경우; 서열번호 9로 기재된 rs6589566에 있어서, 101번째 염기가 G인 경우; 서열번호 10으로 기재된 rs6544366에 있어서, 101번째 염기가 T인 경우; 서열번호 11로 기재된 rs10402271에 있어서, 101번째 염기가 G인 경우; 서열번호 12로 기재된 rs3846663에 있어서, 101번째 염기가 T인 경우; 서열번호 13으로 기재된 rs2156552에 있어서, 101번째 염기가 T인 경우; 서열번호 14로 기재된 rs6586891에 있어서, 101번째 염기가 C인 경우; 서열번호 15로 기재된 rs5215에 있어서, 101번째 염기가 C인 경우; 서열번호 16으로 기재된 rs163171에 있어서, 101번째 염기가 C인 경우; 및 서열번호 17로 기재된 rs7593730에 있어서, 101번째 염기가 T인 경우, 사상체질 중 태음인 특이적 대사증후군 비만으로 판단할 수 있다. 상기 다형성 부위는 위험 대립 유전자로 판단하며, 상기 대립 유전자의 빈도가 높을수록 태음인 특이적 대사증후군 위험이 높다고 판단할 수 있다. 보다 바람직하게는 서열번호 1 내지 17 중 다형성 부위 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상이 위험 대립 유전자인 경우, 가장 바람직하게는 17개 모두 위험 대립 유전자일수록 태음인 특이적 대사증후군 위험이 높다고 판단할 수 있다. 상기 101번째 염기가 표 3의 효과 대립 유전자의 염기가 아닌 경우 이는 대사증후군 위험이 낮다고 판단할 수 있다.

바람직하게는, 상기 (b) 단계에서 결정된 염기서열 중, 서열번호 18로 기재된 rs8050136에 있어서, 101번째 염기가 C인 경우; 서열번호 19로 기재된 rs4712652에 있어서, 101번째 염기가 A인 경우; 서열번호 20으로 기재된 rs1294421에 있어서, 101번째 염기가 T인 경우; 서열번호 21로 기재된 rs6005975에 있어서, 101번째 염기가 C인 경우; 서열번호 22로 기재된 rs17249754에 있어서, 101번째 염기가 A인 경우; 서열번호 23으로 기재된 rs4409766에 있어서, 101번째 염기가 T인 경우; 서열번호 24로 기재된 rs17367504에 있어서, 101번째 염기가 G인 경우; 서열번호 25로 기재된 rs1716685에 있어서, 101번째 염기가 T인 경우; 서열번호 26으로 기재된 rs4149270에 있어서, 101번째 염기가 C인 경우; 서열번호 27로 기재된 rs10889353에 있어서, 101번째 염기가 A인 경우; 서열번호 28로 기재된 rs6589566에 있어서, 101번째 염기가 G인 경우; 서열번호 29로 기재된 rs17315646에 있어서, 101번째 염기가 C인 경우; 서열번호 30으로 기재된 rs5215에 있어서, 101번째 염기가 C인 경우; 서열번호 31로 기재된 rs163171에 있어서, 101번째 염기가 C인 경우; 또는 서열번호 32로 기재된 rs7927129에 있어서, 101번째 염기가 T인 경우, 사상체질 중 소음인 특이적 대사증후군으로 판단할 수 있다. 상기 다형성 부위는 위험 대립 유전자로 판단하며, 상기 대립 유전자의 빈도가 높을수록 소음인 특이적 대사증후군 위험이 높다고 판단할 수 있다. 보다 바람직하게는 서열번호 18 내지 32 중 다형성 부위 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상이 위험 대립 유전자인 경우, 가장 바람직하게는 15개 모두 위험 대립 유전자일수록 소음인 특이적 대사증후군 위험이 높다고 판단할 수 있다. 상기 101번째 염기가 표 3의 효과 대립 유전자의 염기가 아닌 경우 이는 대사증후군 위험이 낮다고 판단할 수 있다.

바람직하게는, 상기 (b) 단계에서 결정된 염기서열 중, 서열번호 33으로 기재된 rs13130484에 있어서, 101번째 염기가 T인 경우; 서열번호 34로 기재된 rs1424233에 있어서, 101번째 염기가 A인 경우; 서열번호 35로 기재된 rs7561317에 있어서, 101번째 염기가 G인 경우; 서열번호 36로 기재된 rs2605100에 있어서, 101번째 염기가 A인 경우; 서열번호 37로 기재된 rs4149270에 있어서, 101번째 염기가 T인 경우; 서열번호 38로 기재된 rs6589566에 있어서, 101번째 염기가 G인 경우; 서열번호 39로 기재된 rs4420638에 있어서, 101번째 염기가 G인 경우; 서열번호 40으로 기재된 rs261332에 있어서, 101번째 염기가 G인 경우; 서열번호 41로 기재된 rs1566732에 있어서, 101번째 염기가 A인 경우; 서열번호 42로 기재된 rs6129647에 있어서, 101번째 염기가 C인 경우; 서열번호 43으로 기재된 rs10903129에 있어서, 101번째 염기가 G인 경우; 서열번호 44로 기재된 rs1436955에 있어서, 101번째 염기가 A인 경우; 서열번호 45로 기재된 rs7754840에 있어서, 101번째 염기가 C인 경우; 서열번호 46으로 기재된 rs7767391에 있어서, 101번째 염기가 T인 경우; 서열번호 47로 기재된 rs6475606에 있어서, 101번째 염기가 T인 경우; 서열번호 48로 기재된 rs4402960에 있어서, 101번째 염기가 T인 경우; 서열번호 49로 기재된 rs864745에 있어서, 101번째 염기가 A인 경우; 서열번호 50으로 기재된 rs5215에 있어서, 101번째 염기가 C인 경우; 또는 서열번호 51로 기재된 rs163171에 있어서, 101번째 염기가 C인 경우, 사상체질 중 소양인 특이적 대사증후군으로 판단할 수 있다. 상기 다형성 부위는 위험 대립 유전자로 판단하며, 상기 대립 유전자의 빈도가 높을수록 소양인 특이적 대사증후군 위험이 높다고 판단할 수 있다. 보다 바람직하게는 서열번호 18 내지 28 중 다형성 부위 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상이 위험 대립 유전자인 경우, 가장 바람직하게는 19개 모두 위험 대립 유전자일수록 대사증후군 위험이 높다고 판단할 수 있다. 상기 101번째 염기가 표 3의 효과 대립 유전자의 염기가 아닌 경우 이는 대사증후군 위험이 낮다고 판단할 수 있다.

또 다른 일 구현예로서, 본 발명은 사상체질 특이적 대사증후군 예측 또는 진단용 SNP를 선별하는 방법을 제공하는 것이다.

상기 방법은 구체적으로, (a) 복부 비만, 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증, 또는 고혈당증의 표현형과 연관성이 있는 SNP를 선별하는 단계; (b) 상기 (a) 단계의 선별된 SNP 중 다중 회귀 분석(multiple regression analysis)을 이용하여 대사증후군 표현형과 연관성이 있는 SNP를 선별하는 단계; (c) 상기 (b) 단계에서 선별된 SNP 중 다중 회귀 분석을 이용하여 대사증후군 표현형에 대해서 체질별 연관성이 있는 SNP를 선별하는 단계; 및 (d) 상기 (c) 단계에서 선별된 SNP의 GRS(genetic risk score)를 계산하여 이를 독립 변수로 다중 회귀 분석을 수행하여 체질별 특이 SNP를 선별하는 단계를 포함하는, 사상체질 특이적 대사증후군 예측 또는 진단용 SNP 선별 방법일 수 있다.

상기 (a) 단계의 복부 비만, 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증, 또는 고혈당증의 표현형의 비제한적인 예로, 체질량 지수, 허리 둘레, 허리-엉덩이 둘레비 등의 비만 표현형; 고밀도콜레스테롤, 저밀도콜레스테롤, 중성지방 등의 지질 표현형; 수축기 혈압, 이완기 혈압, 고혈압 등의 혈압 표현형; 공복 혈당, 2형 당뇨병 등의 당뇨 표현형일 수 있다.

상기 (b) 단계의 대사증후군 표현형이란 상기 복부 비만, 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증, 또는 고혈당증 중 3가지 이상의 표현형을 나타해는 것을 의미한다. 본 발명의 일 실시 예에 따르면 상기 (a) 및 (b) 단계를 수행하여 74개의 SNP 세트를 선별하였다(표 2).

상기 (c) 단계는 이에 제한되지는 않으나, 바람직하게는 대사증후군의 상기 5가지 표현형에 대한 연관성이 P＜0.05인 SNP들을 선별할 수 있으며, 선별된 SNP의 대사증후군의에 대한 연관성을 분석하여 연관성의 방향이 개별인자의 경우과 다르게 나온 SNP를 제외할 수 있다.

상기 (d) 단계의 GRS 계산은 이에 제한되지는 않으나, 그 예로 비위험 대립 유전자만 두 개 가지는 경우 0, 헤테로(hetero)는 1, 위험 대립 유전만 두 개 가지는 경우 2로 유전형 점수로 계산하여 선별된 SNP의 유전형 점수를 모두 계산하는 simple count method 및 각 SNP의 대사증후군에 대한 다중 회귀 분석의 베타 계수를 유전형 점수에 곱한 값을 모두 더하고, 유전형 점수에 베타 계수를 곱한 최대 총 점수로 나눈 다음 최대 위험 대립 유전자 수를 곱하는 방법(weighted count method)으로 정해진 GRS일 수 있다. 이렇게 구해진 GRS를 독립변수로 하여 대사증후군 및 관련 표현형에 대해서 회귀 분석을 수행해서 체질별 특이성이 보장되는 최대의 체질 특이 SNP를 선별할 수 있다. 본 발명의 일 실시 예에서는 태음인의 경우 17개, 소음인의 경우 15개, 소양인의 경우 19개를 선별하였다(표 3).

본 발명의 선별 방법은 대사증후군에 대한 유전적 위험도 예측을 전체 집단에서 하지 않고, 체질별로 하여 보다 특이성을 나타내는 SNP를 선별할 수 있는 장점이 있다.

본 발명의 SNP 마커는 사상체질 특이적 대사증후군을 예측 또는 진단하는 특이적 SNP 마커로서, 위험도 예측이 보다 정확하여 객관적인 진단 및 위험도 예측을 할 수 있을 것이다.

도 1은 본 발명의 SNP를 선별하기 위한 방법의 순서도를 간략하게 나타낸 것이다.
도 2는 본 발명의 대사증후군의 세부 표현형 분포를 체질별로 나타낸 것이다.

이하, 실시예를 통하여 본 발명을 보다 상세히 설명한다. 다만, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것에 불과하므로 본 발명의 범위가 이들 실시예에 의해 한정되는 것으로 해석되어서는 아니된다.

실시예 1: 연구 대상자 선별 및 대사증후군 관련 표현형 기준 설정

(1) 연구 대상자 선별

연구 대상자는 2006부터 2012년까지 22개의 한방 의료원을 대상으로 수집된 3,117명의 사람들로, 한의사가 사상체질 한약에 대한 반응을 보고 체질을 확정한 사람을 대상으로 하였다. 체질 확진자는 사상체질 처방에 대해서 기본적으로 60첩(보통 한달 섭취하는 양)을 먹었을 때에 체질에 대한 호전 반응이 뚜렷하면서 부작용이 없는 사람을 선별하였다(다만, 본 발명은 한약 복용을 통한 체질 확진자에 국한되지 않으며, 최근에 개발된 체질진단툴(SCAT: Sasang Constitutional Analysis Tool)을 통해서 체질이 판별될 때에도 적용 가능). 연구 대상자는 연구에 서면 동의하였고, 기관의 연구윤리심의를 거쳤다.

연구 대상자의 임상적인 특징을 살펴보면, 하기 표 1에 나타낸 바와 같이, 소음인(SE)에 비해서 소양인(SY)이, 소양인에 비해서는 태음인(TE)이 체질량 지수, 허리 둘레, 혈압, 지질 수준, 혈당 수준 및 대사증후군 유병률이 높은 경향을 보였다. 이는 체질별로 지니는 특성에 부합하는 결과, 즉 태음인은 에너지 저장 기능이 강해서 식욕 및 섭취량이 높은 성향이 있으며 정적인 성향이 있는 것으로 알려져 있고, 소양인은 소화 기능이 강해서 식욕이 발달했지만 활동성이 높은 성향을 가지고 있으며, 소음인은 정적이고 소화 기능이 약해서 식욕과 섭취량이 낮은 성향이 있다고 알려진 각 특성에 부합하는 결과이다.

하기 표 1에서 임상 특성값들은 평균±표준편차, 또는 %로 나타내었다.

(2) 대사증후군 및 세부 표현형 기준 설정

대사증후군은 복부 비만(비만 포함), 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증 및 고혈당증의 5가지 위험 인자에 대한 NCEP ATP Ⅲ (National Cholesterol Education Program Adult Treatment Panel Ⅲ)의 가이드 라인에서 복부 비만 기준을 한국인에 맞게 수정한 것을 바탕으로, 5가지 위험 인자 중에 3가지 이상의 위험 인자를 가질 때로 설정하였다.

복부 비만은 허리 둘레가 남성은 90 cm 이상, 여성은 85 cm 이상인 상태이며, 고혈압은 수축기 혈압(systolic blood pressure)이 130 mmHg 이상이거나 이완기혈압(diastolic blood pressure)이 85 mmHg 이상이거나 혈압약을 복용하는 상태이며, 고중성지방혈증은 중성지방(triglyceride)이 150 mg/dL 이상일 때이고, 저고밀도콜레스테롤혈증은 고밀도콜레스테롤(HDL cholesterol) 수준이 남성의 경우 40 mg/dL 미만, 여성의 경우는 50 mg/dL 미만인 경우이며, 고혈당증은 공복기 혈당(fasting blood glucose이 110 mg/dL 이상이거나 혈당조절약물을 복용하는 상태를 말한다.

실시예 2: SNP 대립 유전형 결정

심혈관대사질환의 위험 인자이기도 한 대사증후군의 상기 5 가지 위험 인자인 복부 비만(비만 포함), 고혈압, 고중성지방혈증, 저고밀도콜레스테롤형증 및 고혈당증과 관련된 표현형인 체질량 지수, 허리 둘레, 허리-엉덩이 둘레비 등의 비만 표현형; 고밀도콜레스테롤, 저밀도콜레스테롤, 중성지방 등의 지질 표현형; 수축기 혈압, 이완기 혈압, 고혈압 등의 혈압 표현형; 공복 혈당, 2형 당뇨병 등의 당뇨 표현형 등에 대해서 기존에 반복 재현성이 전장유전체분석(GWAS: genome-wide association study)을 통해서 확립된 SNP들을 확보하였다. 이중 아시아인에서 대립 유전형 빈도(minor allele frequency)가 5% 미만인 것과 LD (linkage disequilibrium) 분석에서 동일 유전 위치(locus)에서 서로 강한 linkage (r²≥0.8)가 있는 SNP은 한 개만 선택하고 나머지는 제외하였다.

총 3,117명의 연구 대상자 중, Affymetrix Genome-Wide Human SNP array 5.0(Affymetrix Santa Clara, CA, USA)으로 대립 유전형이 결정된 954명에 대하여, 보고된 SNP 중에서 Affymetrix에 없는 것들은 되도록 Affymetrix에 존재하는 SNP으로 대체(proxy SNP: r²＞0.6)하여 수행하였다.

상기에 따라 954명에 대하여 수집된 총 74개의 SNP(표 2)를 대상으로, 나머지 2,163명의 SNP 대립 유전형을 결정하였다. 이때 사용한 genotyping 기법은 UOP (unlabeled oligonucleotide probe)를 통해서 결정하는 방법으로서, SNP 위치에서 상보 결합을 하는 DNA 가닥은 LightCycler 480이라는 real-time PCR 기기에서 온도를 서서히 높일 때, SNP 위치에서 상보 결합이 되지 않는 DNA 가닥에 비해 DNA 가닥 분리(melting)가 상대적으로 높은 온도에서 이루어지는 현상을 이용한 것이다. 결과적으로 UOP genotyping을 통한 melting 패턴은 major homozygote, heterozygote, minor homozygote에 따라 3가지 형태를 나타내게 되며, 이에 따라 SNP 대립 유전형을 결정할 수 있다.

실시예 3: 통계적 연관성 분석

연관성 분석은 다중 로지스틱 회귀 분석으로 수행하였으며, 보정 변수는 성별, 나이, 평소 음식 섭취량(범주형), 평소 활동량(범주형), 만성 질환 유무를 사용하였다. 연구 대상자 중에 690명은 고혈압, 고지혈증, 당뇨병 중 하나 이상의 질병력을 가지고 있어서 대사증후군 연관 분석에 영향을 줄 수 있기 때문에, 이들 질병력 유무를 보정 변수로 넣었다.

유전적 위험도(GRS: genetic risk score)는 대사증후군에 대한 효과 크기를 weight로 반영하여 계산하는 방법(weighted count method)으로 측정하였다. 우선 개인이 갖는 각 SNP에 대한 유전형 점수는 nonrisk allele만 두 개 가지면 0, hetero는 1, risk allele(표 3에서의 effect allele)만 두 개 가지는 경우는 2로 계산하였다. 10개의 SNP 세트가 선별되었다고 가정했을 때, weighted count method는 각 체질별로 얻어진 각 SNP의 대사증후군에 대한 다중 회귀 분석의 베타 계수를 유전형 점수에 곱해서 10개의 SNP의 대립 유전형 점수를 더하고, 대립유전형 점수에 베타 계수를 곱했을 때 최대로 나올 수 있는 점수로 나눈 다음 최대 risk allele 수인 20을 곱해서 구하는 방법이다. 이러한 방법으로 체질별로 고유하게 얻어진 각 SNP별 weight 값이 반영된 체질별 GRS를 구할 수 있고, 이렇게 구해진 GRS를 독립 변수로 하여 대사증후군 및 관련 표현형에 대해서 로지스틱 회귀 분석을 상기에서 기술한 것과 동일하게 수행하였다. 통계적인 유의성은 대사증후군의 다섯 가지 세부 표현형에 대한 개별 SNP의 연관분석의 경우는 P＜0.05로 하였고, SNP 세트를 대상으로 하는 경우에는 전체 집단 대상 분석에서는 P＜0.005로, 사분위 하위그룹별 비교 분석에 대해서는 P＜0.05로 하였다.

실시예 4: 체질별 대사증후군 및 이와 관련된 5가지 위험 인자와의 연관 SNP 세트 선별 과정

총 3,117명의 연구 대상자에서 74개 SNP의 대립 유전형을 모두 결정한 후에 하디-와인베르그 평형에서 벗어나지 않는 SNP들을 대상으로 대사증후군 및 이와 관련된 5가지 위험 인자에 대해서 체질별로 연관성 분석을 수행하였다. 우선 대사증후군의 상기 5가지 위험 인자에 연관성(P＜0.05)이 있는 SNP들을 체질별로 선별한 후에, 선별된 SNP의 대사증후군에 대한 연관성을 분석하여 연관성의 방향이 개별 위험 인자의 경우와 다르게 나온 SNP(예: 개별 위험 인자에서는 OR＞1이나, 대사증후군에 대해서는 OR＜1인 경우)를 제외하였다. 그 결과, 유전적 위험도(GRS: genetic risk score)를 계산하는 분석을 위하여 태음인의 경우는 17개, 소음인의 경우는 15개, 소음인의 경우는 19개의 SNP이 최종 선별되었다. 하기 표 3은 대사증후군 표현형에 대하여 체질별로 특화된 연관성을 지닌 SNP를 선정한 것을 나타낸 것이며, 상기 일련의 연구 진행은 도 1에 나타내었다.

실시예 5: 체질별 대사증후군 SNP 세트 GRS의 연관 분석

(1) 대사증후군에 대한 체질별 GRS 분석

각 체질 집단을 GRS에 따라서 네 개의 서브그룹(quartile: 최하위 그룹, 중하위 그룹, 중상위 그룹, 최상위 그룹)으로 나눈 다음, 가장 GRS가 낮은 최하위 그룹(the lowest quartile)을 기준으로 나머지 세개의 그룹의 대사증후군에 대한 OR 값을 구하였다.

태음인의 GRS의 범위는 4.15~26.04이며 중간값은 14.30이고, 소음인의 GRS의 범위는 11.51~27.17이며 중간값은 20.44이고, 소양인의 GRS의 범위는 7.68~30.25이며 중간값은 18.03이었다. 최하위 그룹 대비 각 서브그룹별 GRS의 OR값은 세 체질 모두 GRS값이 커질수록 OR값이 증가하는 경향을 보였다(표 4). 따라서 최대 OR값을 보이는 최하위 그룹 대비 최상위 그룹(the highest quartile)의 비교로부터, 태음인은 2.80배(P=4.78×10^-8), 소음인은 2.37배(P=1.87×10^-2), 소양인 2.77배(P=4.67×10^-5) 대사증후군 발병 위험성이 커지는 것을 확인하였다. 다만, 소음인의 경우는 상기 표 1의 임상 특성에서도 가장 낮은 대사증후군 유병률 및 관련 표현형 값을 가진 것과 같이 대사증후군에 대한 유전적 위험도가 최상위 그룹에서만 현저히 나타났다.

GRS에 따라서 서브그룹으로 나누지 않고 GRS 자체를 연속 수로 놓고 체질별 대사증후군의 유전적 위험도를 계산해보면, GRS가 1 증가할 때 태음인은 1.14배(P=1.24×10^-9), 소음인은 1.18배(P=1.20×10^-3), 소양인은 1.16배(P=1.30×10^-8) 대사증후군의 발병 위험도가 높아지는 것으로 나타났다(표 4).

(2) 대사증후군의 5가지 위험 인자에 대한 체질별 GRS 분포 경향 분석

대사증후군에 체질별 GRS의 분포가 관련된 5개의 위험 인자인 복부 비만, 고중성지방혈증, 저고밀도콜레스테롤혈증, 고혈압 및 고혈당증에 대해서 어떤 차이점이 있는지 세부 표현형 분석을 수행하였다(도 2).

분석 결과, 예상대로 모든 체질 그룹에서 GRS 최하위 그룹 대비 분석이 최상위 그룹으로 갈수록 대사증후군의 5개 위험 인자의 연관성도 강해지는 경향이 나타났으나, 체질별로 연관성이 강한 위험 인자의 종류에 차이가 있었다. 구체적으로 태음인의 경우, 최하위 그룹 vs. 중하위 그룹에서는 저고밀도콜레스테롤혈증만 GRS와 연관성이 있고, 중상위 그룹에서는 고중성지방혈증과 저고밀도콜레스테롤혈증은 강하게, 복부 비만은 약하게 연관성이 있었으며, 최상위 그룹에서는 중위 그룹에서의 연관 위험 인자에 덧붙여 고혈압은 강하게, 고혈당증은 약하게 연관성이 나타났다. 따라서 태음인에서의 대사증후군의 주요 위험 인자는 고중성지방혈증과 저고밀도콜레스테롤혈증이라고 볼 수 있다.

소음인의 경우는, 흥미롭게도 고혈당증이 최하위 그룹 vs. 중하위 그룹에서 최상위 그룹까지 강한 연관성을 보였다. 이와 함께 최상위 그룹에서 추가로 고중성지방혈증은 강하게, 복부 비만은 약하게 연관성을 보였다. 따라서 소음인에서는 고혈당증과 고중성지방혈증을 대사증후군의 주요 위험인자로 볼 수 있다.

마지막으로 소양인에서는, 최하위 그룹 vs. 중하위 그룹에서는 복부 비만과 저고밀도콜레스테롤혈증이 약하게 연관되어 있다가 중상위 그룹에서는 이와 함께 고혈당증의 연관성이 강해지고, 최상위 그룹에서는 고중성지방혈증의 연관성이 강해지는 것을 확인하였다. 따라서 소양인에서는 대사증후군의 주요 위험 인자가 복부 비만, 저고밀도콜레스테롤혈증 및 고혈당증이라고 볼 수 있다.

상기 실시예들을 종합하여 볼 때, 본 발명으로부터 기존의 여러 GWAS 연구를 통하여 대사증후군 관련 형질에 대해 연관성이 확립된 SNP들을 대상으로 체질별로 특화된 대사증후군의 유전적 위험도(GRS) 예측 SNP 셋트를 구성할 수 있었으며, GRS가 높으면 높을수록 대사증후군의 유병률 또한 증가함을 확인할 수 있었다.

이와 함께, 체질별로 대사증후군에 영향을 주는 5가지의 위험 요소군이 서로 차이가 나는 것을 확인하여, 태음인 대사증후군의 위험 요소는 고중성지방혈증과 저고밀도콜레스테롤혈증이고, 소음인의 경우는 고혈당증과 고중성지방혈증, 소양인에서는 복부 비만, 저고밀도콜레스테롤혈증 및 고혈당증이 주요 대사증후군 위험 요소로 작용함을 최초로 규명하였다. 따라서, 체질별 맞춤의 심혈관대사질환 예방을 위해서 선제적인 체질 진단에 이어 개인의 GRS가 어느 서브그룹(quartile)에 속하는지 판단하는 것이 중요함을 밝혔다.

본 발명은 기존 연구와 비교하여, 대사증후군에 GRS 측정을 위한 SNP 선별 시에, 대사증후군 유병률에만 국한하지 않고 대사증후군의 5가지 위험 요인별로 연관성이 있는 SNP을 선별함으로써 대사증후군 연관 SNP의 스펙트럼을 확장하였다는 점, 및 대사증후군에 대한 유전적 위험도 예측을 위해 사용된 개별 SNP의 신뢰도가 높다는 점에서 매우 가치있는 발명이며, 이들 SNP는 이미 여러 인구 집단에서 심혈관대사질환 표현형과 관련하여 연관성이 반복 재현되어왔기 때문에 그만큼 false positive의 포함 가능성이 적다고 할 수 있다.

본 발명에 사용된 전략적인 방법론은 사상체질 전문가의 체질 진단뿐만 아니라, 객관적 체질 진단 툴(SCAT)과 연동하여 사용하게 되면 약물 효과를 배제하고도 일정 수준 이상의 체질 판별이 이루어질 수 있기 때문에 활용도가 매우 높으며, 이를 통해 좀 더 많은 체질별 인구 집단을 대상으로 더욱 신뢰도가 증가된 대사증후군 SNP 세트를 구성할 수 있을 것으로 기대된다.

<110> Korea Institute of Oriental Medicine <120> SNP markers for metabolic syndrome and use thereof <130> PA130915/KR <160> 51 <170> KopatentIn 2.0 <210> 1 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 1 ttttggtgca cattgtggta gaagaattca tagatctgca ttcactgctt ccatcatttg 60 gcagctttct tcagtcaggg gagtatttac ccagtcatgg yagaggcaat gcagtgctct 120 gttcactgat tttctgattt ggaaacaagt tttcttgggc aggaaaagga tgcttcagag 180 gacatgatac tttagagaag c 201 <210> 2 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R=A or G <400> 2 gtaccgtgaa aaatggattt gattccattt ttattctcca agtttgacca tagtaactca 60 agatagggac agccagcgag ggtaggagcg acaggaataa rggtttgagc tcaacatgca 120 gtggaatctt gtaacaattg cagcttttat gcagcactat tcaatagaaa aataacatga 180 ggcatacata acaattgtgt a 201 <210> 3 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y=T or C <400> 3 tctacctacc atgttcttgg aagcaggaaa accagaatat atgtgagcat ctttaatgac 60 tacaacatta tagaagttta aagcaggaga gattgtatcc ygatggaaat gacaagaaaa 120 gcttcagggg gaaggtgaca tttaagttgg aatattattg aggagtatca ttttagcatc 180 tgggattgag gtagctttgt g 201 <210> 4 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> S= G or C <400> 4 gagttggagg agggagcccc ttcccaggcc atgctgcgac tcctgcaaag tgctttcagt 60 aaaaactcac cgccaaagca atcaccaaag aagtccccaa stgcaaagct caacatccct 120 tatgaaaact tctacgaagc cctggaaaag ctgaacaaac cttcccagct taaagactct 180 gaagacagtc tgtataatga c 201 <210> 5 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> K= T or G <400> 5 ctgagagtta accgagttag gagccacagc ctttacagaa aagatggatg aaagctggag 60 atgaacctga catacataag gtaccaggac tgaatcctat kcatttgaca gatgcaaaca 120 gtcttcatcc aggctctgct ggaaggcaac cagtggaggc ttacctggct ccagtgcagg 180 gctcagcagc aaacctggac c 201 <210> 6 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= G or A <400> 6 tgcagacttc caggagtgaa ataacagaaa acaaccagtg actcaccgtg acactggaaa 60 tggctgtgaa gaacgcagaa tgctgagagc caactgtcca rtggatgaac atgagaaaga 120 actaagacaa cccctcgatt tcctaaatat gccaaaggaa agcctccctt ggggaatggc 180 tgatgcttgg aatatagatg g 201 <210> 7 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= G or A <400> 7 tccatcagaa ttttttctca gtcatatatg atccacggac atatctctaa cttcctgtca 60 tgttcctctt tcaattccaa gaccttctta aattactcca rctctttcca gggtcctcaa 120 gtctgctcca agaccttgct tccttgattg ccactgcaag ctaccaccac ttccatcccc 180 tttctcttgg tttcctcaga c 201 <210> 8 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= G or A <400> 8 tttaaaagtg gtcactgaga tagtcttgag gatgtgctat gcagtagcca agccctctta 60 cggtgtgttc ctctcttagt gcccctttcc tttcctacct rttcttccct tgcagtggtg 120 tattagcctt ggacattaaa acatttgctt tgtaaatttg gaggcattct gattaaacag 180 ctgagtaaaa caaatcctgc t 201 <210> 9 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= A or G <400> 9 gtggaaggtc ccagaaattt tatttcccat gcactttttc ccaggaagct actggagaag 60 atgctctaac aaaataaggg agaaaaacaa gaaagaagac rtggaatata gaaaaccaga 120 agagggccag gtgcggtggc tcacgcctgt aatcccagca ctttgggaag cccaggcagg 180 cagatcacga ggtcaggagt t 201 <210> 10 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> K= T or G <400> 10 atggcagata ttctcaactt ggccaagaca atgcagcccc tgctgtgccc ttcttctgag 60 ccacacagac ccagtgaagg actgggtgtt gcaaagggca ktttcccatt tcctgggctt 120 ggccttatac ctggacaagg aaaggagtca ccttgtcata tggtgtcagt agatgtagag 180 tgccctgctc ccacatctgc c 201 <210> 11 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> K= T or G <400> 11 ggtttagaac aagcaggcac aagaattcca tagagacaca ctgtgatgga ggttgtcata 60 tctgcacagt ccattcattg gaggtgtggg gatcagtagc ktgggtcaag tagtttgtat 120 ctatctagct gtcccataca gagatggtcc catacaggag gaggtgagat aaagctgata 180 ccttgatcaa ctccagtaag a 201 <210> 12 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= T or C <400> 12 atattatgtt agctatggta ttatgcactg tcaggtgtgg ctgtcaagtc ttggaaagtt 60 agtgcttcca gtggagtcta gttctattct gatgccatta yagttgccct gtttttagtt 120 gatttagtaa gaaattggtc atgattttaa gggtgaatct tgttgtgtct ctccctggct 180 acagatgcta ggtgttcaag g 201 <210> 13 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> W= A or T <400> 13 cttggggagg acaactctga tctgttttct gaggctggac gcaacatgaa ggaggtctta 60 gaacatttta accaattaaa gagctgaaag gagaagtcag wtacaatggc aagcagctac 120 ctgggtgata acgaaatcca cgcacaatca agatattcca ccttcgtagc agggatgtct 180 ggaggggctg cagagtcccc c 201 <210> 14 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> M= C or A <400> 14 cacagaagga cattctgtaa aatgatgatc ctggatcctt aaaacatgtc agtatcatga 60 aagacaaaaa gaggctggga taccagatta aagaagccta maatatcatg acaactaaat 120 gcagtgcatg atccttgatt ggatcttgat ctaaacatat atatacatat atatgacatt 180 attgatacaa ctggagaaat t 201 <210> 15 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> N= T or C <400> 15 ttgcgcaggg gcccgcgggc tgaggcgagg gtcagagctt ccagtaggct gtggtcctca 60 tcaagctggc gggccgtgca gagtggtgtg ggcactttga nggtgttgcc aaacttggag 120 tagtccacag agtaacgtcc gtcctcctca gctacaatgg gcacaaagcg ctggccccac 180 aggatctcat cggccaggta g 201 <210> 16 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 16 tttgatttgc caggagcaga atttctgggt tggaatcggg aacatttaga ggagcttctc 60 agtagagttg tacagagtgg aaatgagtcg gcaggctgca yggggggttc cagtcacagc 120 acagagggtg tgtgttttcg gtgcctgccc tcctgagctc caagtgtccc acgcctgccc 180 gtcagtcctc atgtctacct g 201 <210> 17 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 17 tggatgtttt tttagacatc tgttgtccat gctaacacgc aacaaagctc tgtggataca 60 cacacaggca tgtacatgca caaactctct ctctctcata yagtttcagc aggtcataaa 120 tgagaaccca gctacaatga aatgatacag cttttactga tggatattta agttttttcc 180 ttcaattttg ctattgtcaa c 201 <210> 18 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> M= C or A <400> 18 atcactttaa actcggtatt tgatttcctt ttccctggga cctgtgacag tgccagcttc 60 atagcctagt ctaggcatgc cagttgccca ctgtggcaat maatatctga gcctgtggtt 120 tttgccttag gtaaactgta gagatggact catggaatgc ttggaaaatt tttcagttta 180 tgataatgtg taaatgtcga g 201 <210> 19 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= A or G <400> 19 gtctttcttc agtatccctg cttggacagt ggttttgccc ccattgtgca caacactttt 60 ccaaaaagcc tttcaacatt aattatggct ggagctgact rctttcctca gaccatcatg 120 cttctcctaa tacaataaat gtttctcttg ctgggcaggt ggatgattgg attgatgaat 180 ggatgcatag ggatgggcag g 201 <210> 20 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> K= T or G <400> 20 ctgagagtta accgagttag gagccacagc ctttacagaa aagatggatg aaagctggag 60 atgaacctga catacataag gtaccaggac tgaatcctat kcatttgaca gatgcaaaca 120 gtcttcatcc aggctctgct ggaaggcaac cagtggaggc ttacctggct ccagtgcagg 180 gctcagcagc aaacctggac c 201 <210> 21 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 21 tgggcgacag agctgtctca aaagaaagaa aaggaaggga aagaaggaag gaaataggga 60 accatagcct gaatataaaa catctgcttt atctgtcagg ycttttccta cctggaagac 120 taagagactc tcaaggcctt ggaggaaaaa tattccaagc atctaccctt caaaattacc 180 taatcatgag tggagaggga c 201 <210> 22 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= G or A <400> 22 tccatcagaa ttttttctca gtcatatatg atccacggac atatctctaa cttcctgtca 60 tgttcctctt tcaattccaa gaccttctta aattactcca rctctttcca gggtcctcaa 120 gtctgctcca agaccttgct tccttgattg ccactgcaag ctaccaccac ttccatcccc 180 tttctcttgg tttcctcaga c 201 <210> 23 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= T or C <400> 23 cttggcttta cattacaaca gcccctgcct tcaaggcaac cacaactccc attgagtctg 60 ttttctaaat gtctcacaaa tcctttgttt ctttttttct yggctacttc tgtgtttcag 120 gccatcctca ttccttgctt agagtactgc tgtgtcatcc taaccaatct ctctgcctca 180 ttccccactc tagtccacct g 201 <210> 24 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= A or G <400> 24 aagttccctc aaagaataca gtgtgagaat caacattttt aacccattga agagtgtgtc 60 taaaatacct tgacactgtg gagggacttt tacaggcaac rgagaagttg cagatcagat 120 gacccactct gccttctcct tcctgccccc tccggctgct tttttctgcc gggttaaagg 180 gcagcccagc ctcagggctg a 201 <210> 25 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 25 tatgtttaag cctaaaggtc tgttgaggta acagttttag aacgattgcc acaatcccac 60 agagaaaaaa caagtgaagg tcggtgaaag ctgcaggttc yaaattacag aatcaagaac 120 agtatttctt gacattcatc acatttaagt aataaaagac attacctcaa caacaggtgt 180 attttcctgg agctcagctg t 201 <210> 26 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 26 cccaagtccc ctctatgtct gagagctgag gctggctgtc aaagaggaac taaggatgcc 60 agggactttc tgcttaggac ccctctcatc acttctccaa ygctggtatc atgaacccca 120 ttctacagat gatgtccact agattaagaa tggcatgtga ggccaagttt ccacctgaga 180 gtcagtttta ttcagaagag a 201 <210> 27 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> M= A or C <400> 27 atgcccctat attccaatcc tgactactct attttttggt ttgtgggatc tcagagaagt 60 tacctaacta ctctgagcct gagccacctt atctgttaaa mccttaaatg agatgagtgc 120 aaagtgccca ataaaatgcc cagcacacag taaacccata aatgttaatt ctcttatcct 180 cttgcctaaa ccaaggttaa c 201 <210> 28 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= A or G <400> 28 gtggaaggtc ccagaaattt tatttcccat gcactttttc ccaggaagct actggagaag 60 atgctctaac aaaataaggg agaaaaacaa gaaagaagac rtggaatata gaaaaccaga 120 agagggccag gtgcggtggc tcacgcctgt aatcccagca ctttgggaag cccaggcagg 180 cagatcacga ggtcaggagt t 201 <210> 29 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> S= C or G <400> 29 tctacctatt ctgaaagaga ggcttaaaac taaagtcctg gttagttgag gatcagatgt 60 gtcatacttt tctcagaggg gaggggacgg tcactttgct staagtttgg gccatgaggt 120 ccacactgag cctacatggg gtagggggaa accgtgaagt gtgcagtgac ctgagggtgc 180 cagatcaccc cgagccgttg t 201 <210> 30 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> N= T or C <400> 30 ttgcgcaggg gcccgcgggc tgaggcgagg gtcagagctt ccagtaggct gtggtcctca 60 tcaagctggc gggccgtgca gagtggtgtg ggcactttga nggtgttgcc aaacttggag 120 tagtccacag agtaacgtcc gtcctcctca gctacaatgg gcacaaagcg ctggccccac 180 aggatctcat cggccaggta g 201 <210> 31 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 31 tttgatttgc caggagcaga atttctgggt tggaatcggg aacatttaga ggagcttctc 60 agtagagttg tacagagtgg aaatgagtcg gcaggctgca yggggggttc cagtcacagc 120 acagagggtg tgtgttttcg gtgcctgccc tcctgagctc caagtgtccc acgcctgccc 180 gtcagtcctc atgtctacct g 201 <210> 32 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> K= T or G <400> 32 aggtggtgag gctataggtg ttagatgtgg caggatgcaa gccagggcct gctgccttta 60 aagagccaca gcagagacac catcccagtc ccaagagctg ktctaaggaa gtggttgtca 120 tctgcggtgc cccccagggg acatatggca atgtctggag atatttttgg ctatcatgac 180 tatgggagaa ttactaatat c 201 <210> 33 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 33 ttttggtgca cattgtggta gaagaattca tagatctgca ttcactgctt ccatcatttg 60 gcagctttct tcagtcaggg gagtatttac ccagtcatgg yagaggcaat gcagtgctct 120 gttcactgat tttctgattt ggaaacaagt tttcttgggc aggaaaagga tgcttcagag 180 gacatgatac tttagagaag c 201 <210> 34 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= A or G <400> 34 gtaccgtgaa aaatggattt gattccattt ttattctcca agtttgacca tagtaactca 60 agatagggac agccagcgag ggtaggagcg acaggaataa rggtttgagc tcaacatgca 120 gtggaatctt gtaacaattg cagcttttat gcagcactat tcaatagaaa aataacatga 180 ggcatacata acaattgtgt a 201 <210> 35 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= G or A <400> 35 gctcactgtg gacacttccc agccccttcc cagaggtgag gtctcctgct agcactggct 60 tagaagatgt aggcagagat gacaagtgac acttcctgtc rtctgcctac aagttcccaa 120 agatcctccc ctttcttgct ctgttttcac ctccagaata agcgtgaatg agccctggaa 180 gatgcacggt ctggacagat g 201 <210> 36 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= G or A <400> 36 tgcagacttc caggagtgaa ataacagaaa acaaccagtg actcaccgtg acactggaaa 60 tggctgtgaa gaacgcagaa tgctgagagc caactgtcca rtggatgaac atgagaaaga 120 actaagacaa cccctcgatt tcctaaatat gccaaaggaa agcctccctt ggggaatggc 180 tgatgcttgg aatatagatg g 201 <210> 37 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 37 cccaagtccc ctctatgtct gagagctgag gctggctgtc aaagaggaac taaggatgcc 60 agggactttc tgcttaggac ccctctcatc acttctccaa ygctggtatc atgaacccca 120 ttctacagat gatgtccact agattaagaa tggcatgtga ggccaagttt ccacctgaga 180 gtcagtttta ttcagaagag a 201 <210> 38 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= A or G <400> 38 gtggaaggtc ccagaaattt tatttcccat gcactttttc ccaggaagct actggagaag 60 atgctctaac aaaataaggg agaaaaacaa gaaagaagac rtggaatata gaaaaccaga 120 agagggccag gtgcggtggc tcacgcctgt aatcccagca ctttgggaag cccaggcagg 180 cagatcacga ggtcaggagt t 201 <210> 39 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= A or G <400> 39 gaggtgaagt tacttgtata aggtcacaca gccaggaagt agagaactgg aactagattg 60 aaccctcagc ctagcaatgt cactatgcta cacttttcct rgtgtggtct acccgagatg 120 aggggctgag gttttttttt gtttttgttt ctgttttgag gcagactcac tctctccccc 180 aggatggagt acagtggtgc g 201 <210> 40 <211> 199 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= G or A <400> 40 tattatgtga gatatcaata tttccttcat tagaaattaa aactgagaaa tctttaaaat 60 ctgctaacac tttttaaaat gataataaac ccttgcatrt taacacatat aatgtaattt 120 tatgaaaaat aacttgtatt ttccaaataa gttttaaatg gagaagagtg acattgtttt 180 acaaagaaat gttgcaaat 199 <210> 41 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> M= A or C <400> 41 ttcatcatac ccacccagat ttttagccct gtgtgtgcat acctgttgga aacaaagacc 60 acatttccca gctcccatgg agctagatgt tgcaatgtga mtaagttttg ctcaacgaag 120 catgagcaga ggtactgggt gacttctagg aagtgtcctt taagggtggg gcacaacctt 180 ctgcccttcc tccttcttat a 201 <210> 42 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= T or C <400> 42 ggcccttctc aataggttac tatttatagg aacatacaca gagttgctgt acccagacat 60 gtgagcccca gtgatgagat ttctggtcca gtggaaacat ytgaaagtcg ttacttaaaa 120 tgttaccaag acagccacag gcaggctctg tatgtgccct cagtcaacaa aatcttcccc 180 accctcctct aagactctaa g 201 <210> 43 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= A or G <400> 43 ttgccattac tgagaggaca ggaaagctgg gattgagatg gatggctact agcagagcca 60 gtaaaatatt ccacagactc atttctgtag tgaggaccaa rtgaactaaa tggccattag 120 tctgcctagg gaaaaggtca ggtactaagg attgatggcc agctggtggt aattgtgtgg 180 gctccagaaa atgatctaga t 201 <210> 44 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= G or A <400> 44 cggaagtaca cttgggggtt gtcaccttgc cagcatgagg gaacacatca tcacagcaca 60 ggtatgcact gcgttaatga tggaaagctt ccttctcatc rtacacaagc ttcaggtctt 120 ccatttgggg ggcaatgtag agcagagatt acttgcacat gaggacataa aattgccccc 180 accccaaatg atcaggactt g 201 <210> 45 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> S= G or C <400> 45 tgtccagatt tgagagtgag caaaatacac cagatatacc accaaaattg aaaaaaaaat 60 caactgcttg ctgttgggga agaagtagta atgttggaaa sgttgacttg atagaggatt 120 ttgtaagatg agtgaaaaag atctaaaagg acagtgatgt ctctgttatt gactgaggta 180 tccttggtct ctagaatagt g 201 <210> 46 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> N= T or C <400> 46 agaatgtaaa tttcttcctt ccctacccca gaatgtagat gcatgtcctc atttaatttt 60 agtcattctt ggcgaatgtg ataattaggg taaagtgcaa ngagatttgc aaattggatg 120 gtgaattcac taaatgtaac agctgatcag ggcttctctt ctcagtgtca ctttattaag 180 gtcttcggat atactgatat a 201 <210> 47 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= T or C <400> 47 tccccatctg gcacccaatc ttttacagtg ttatgaaaaa tagggaaaat gtagaaagga 60 agaacatggc acccaatcct taatggacac tcagtgaaag ytggctatca tcatcatttt 120 tggggttgtt gtgttctaca aatgtatttt cccaggagtt ttttttactc tgtctcctct 180 ttccttcata tacccccagc c 201 <210> 48 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> K= G or T <400> 48 tggaaccctg gaattccaag attcccagtc ttggaatcta acagctctat ggagttttgg 60 ccctgcctgg ggagcagtaa ggtaggatgg acagtagatt kaagatactg attgtgtttg 120 caaacatgcc ccagataagg aatggtcaaa gcagattcct tttttttttt ttttttttga 180 gacggagtct tgctctgtcg c 201 <210> 49 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> R= A or G <400> 49 tatgctgtga atgagtttca cattgccacc agatattcac agctgtaaag ttctttctgc 60 gttaaaacat tgaacatttc ctacaaccat tcaaaacatt rtaacagttc aaattatatt 120 tgagcatcac ttatatggct cttacggaac ttatgtaaag ttcttgaagt cagtgatttt 180 aagaaattgt gcttggaata t 201 <210> 50 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> N= T or C <400> 50 ttgcgcaggg gcccgcgggc tgaggcgagg gtcagagctt ccagtaggct gtggtcctca 60 tcaagctggc gggccgtgca gagtggtgtg ggcactttga nggtgttgcc aaacttggag 120 tagtccacag agtaacgtcc gtcctcctca gctacaatgg gcacaaagcg ctggccccac 180 aggatctcat cggccaggta g 201 <210> 51 <211> 201 <212> DNA <213> Homo sapiens <220> <221> variation <222> (101) <223> Y= C or T <400> 51 tttgatttgc caggagcaga atttctgggt tggaatcggg aacatttaga ggagcttctc 60 agtagagttg tacagagtgg aaatgagtcg gcaggctgca yggggggttc cagtcacagc 120 acagagggtg tgtgttttcg gtgcctgccc tcctgagctc caagtgtccc acgcctgccc 180 gtcagtcctc atgtctacct g 201

Claims

서열번호 18 내지 32의 염기서열로 구성되는 폴리뉴클레오티드 또는 이의 상보적인 폴리뉴클레오티드 세트를 포함하며,
상기 염기서열은 101 번째 염기를 SNP로서 포함하고,
상기 서열번호 18의 101번째 염기는 C이고, 서열번호 19의 101번째 염기는 A이고, 서열번호 20의 101번째 염기는 T이고, 서열번호 21의 101번째 염기는 C이고, 서열번호 22의 101번째 염기는 A이고, 서열번호 23의 101번째 염기는 T이고, 서열번호 24의 101번째 염기는 G이고, 서열번호 25의 101번째 염기는 T이고, 서열번호 26의 101번째 염기는 C이고, 서열번호 27의 101번째 염기는 A이고, 서열번호 28의 101번째 염기는 G이고, 서열번호 29의 101번째 염기는 C이고, 서열번호 30의 101번째 염기는 C이고, 서열번호 31의 101번째 염기는 C이고, 서열번호 32의 101번째 염기는 T인, 사상체질 중 소음인 특이적 대사증후군 예측 또는 진단용 마이크로 어레이.
제1항에 있어서, 상기 대사증후군은 복부 비만, 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증, 또는 고혈당증을 위험 인자로 하는 것인 마이크로어레이.
제1항에 있어서, 상기 예측 또는 진단은 대사증후군을 진단하거나 위험을 예측하는 것인 마이크로어레이.
서열번호 18 내지 32의 염기서열로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드 세트를 검출할 수 있는 프로브 또는 특이적으로 증폭할 수 있는 프라이머를 포함하고,
상기 서열번호 18의 101번째 염기는 C이고, 서열번호 19의 101번째 염기는 A이고, 서열번호 20의 101번째 염기는 T이고, 서열번호 21의 101번째 염기는 C이고, 서열번호 22의 101번째 염기는 A이고, 서열번호 23의 101번째 염기는 T이고, 서열번호 24의 101번째 염기는 G이고, 서열번호 25의 101번째 염기는 T이고, 서열번호 26의 101번째 염기는 C이고, 서열번호 27의 101번째 염기는 A이고, 서열번호 28의 101번째 염기는 G이고, 서열번호 29의 101번째 염기는 C이고, 서열번호 30의 101번째 염기는 C이고, 서열번호 31의 101번째 염기는 C이고, 서열번호 32의 101번째 염기는 T인, 사상체질 중 소음인 특이적 대사증후군 예측 또는 진단용 조성물.
제4항의 조성물을 포함하는 사상체질 중 소음인 특이적 대사증후군 예측 또는 진단용 키트.
제5항에 있어서, 상기 키트는 RT-PCR 키트 또는 DNA 칩 키트인 것인, 키트.
(a) 분리된 시료의 DNA로부터 서열번호 18 내지 32의 염기서열로 구성되는 폴리뉴클레오티드, 또는 이의 상보적인 폴리뉴클레오티드 세트의 다형성 부위인 101번째 염기서열을 증폭하거나 프로브와 혼성화하는 단계; 및
(b) 상기 (a) 단계의 증폭된 또는 혼성화된 다형성 부위의 염기를 결정하는 단계; 및
(c) 상기 (b) 단계에서 결정된 염기서열 중,
서열번호 18로 기재된 rs8050136에 있어서, 101번째 염기가 C인 경우;
서열번호 19로 기재된 rs4712652에 있어서, 101번째 염기가 A인 경우;
서열번호 20으로 기재된 rs1294421에 있어서, 101번째 염기가 T인 경우;
서열번호 21로 기재된 rs6005975에 있어서, 101번째 염기가 C인 경우;
서열번호 22로 기재된 rs17249754에 있어서, 101번째 염기가 A인 경우;
서열번호 23으로 기재된 rs4409766에 있어서, 101번째 염기가 T인 경우;
서열번호 24로 기재된 rs17367504에 있어서, 101번째 염기가 G인 경우;
서열번호 25로 기재된 rs1716685에 있어서, 101번째 염기가 T인 경우;
서열번호 26으로 기재된 rs4149270에 있어서, 101번째 염기가 C인 경우;
서열번호 27로 기재된 rs10889353에 있어서, 101번째 염기가 A인 경우;
서열번호 28로 기재된 rs6589566에 있어서, 101번째 염기가 G인 경우;
서열번호 29로 기재된 rs17315646에 있어서, 101번째 염기가 C인 경우;
서열번호 30으로 기재된 rs5215에 있어서, 101번째 염기가 C인 경우;
서열번호 31로 기재된 rs163171에 있어서, 101번째 염기가 C인 경우; 및
서열번호 32로 기재된 rs7927129에 있어서, 101번째 염기가 T인 경우, 사상체질 중 소음인 특이적 대사증후군으로 판단하는 단계를 포함하는, 사상체질 중 소음인 특이적 대사증후군 예측 또는 진단을 위한 정보의 제공 방법.
제7항에 있어서, 상기 (b) 단계의 염기 결정은 서열 분석, 마이크로어레이에 의한 혼성화, 대립 유전자 특이적인 PCR (allele specific PCR), 다이나믹 대립 유전자 혼성화 기법(dynamic allele-specific hybridization, DASH), PCR 연장 분석, PCR-SSCP (PCR-single strand conformation polymorphism), PCR-RFLP (PCR-restriction fragment length polymorphism) 및 TagMan 기법으로 이루어진 군에서 선택된 하나 이상의 방법에 의해 수행되는 것인 방법.
(a) 복부 비만, 고혈압, 고중성지방혈증, 저고밀도콜레스테롤혈증, 또는 고혈당증의 표현형과 연관성이 있는 SNP를 선별하는 단계;
(b) 상기 (a) 단계의 선별된 SNP 중 다중 회귀 분석(multiple regression analysis)을 이용하여 대사증후군 표현형과 연관성이 있는 SNP를 선별하는 단계;
(c) 상기 (b) 단계에서 선별된 SNP 중 다중 회귀 분석을 이용하여 대사증후군 표현형에 대해서 사상체질 중 소음인과 연관성이 있는 SNP를 선별하는 단계; 및
(d) 상기 (c) 단계에서 선별된 SNP의 GRS(genetic risk score)를 계산하여 이를 독립변수로 다중 회귀 분석을 수행하여 사상체질 중 소음인 특이적 SNP를 선별하는 단계를 포함하는, 사상체질 중 소음인 특이적 대사증후군 예측 또는 진단용 SNP 선별 방법.