KR20150092937A - 한국인의 고혈압 예측용 snp 마커 - Google Patents

한국인의 고혈압 예측용 snp 마커 Download PDF

Info

Publication number
KR20150092937A
KR20150092937A KR1020140013577A KR20140013577A KR20150092937A KR 20150092937 A KR20150092937 A KR 20150092937A KR 1020140013577 A KR1020140013577 A KR 1020140013577A KR 20140013577 A KR20140013577 A KR 20140013577A KR 20150092937 A KR20150092937 A KR 20150092937A
Authority
KR
South Korea
Prior art keywords
hypertension
base
snp
seq
polynucleotides
Prior art date
Application number
KR1020140013577A
Other languages
English (en)
Inventor
박지완
Original Assignee
한림대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한림대학교 산학협력단 filed Critical 한림대학교 산학협력단
Priority to KR1020140013577A priority Critical patent/KR20150092937A/ko
Publication of KR20150092937A publication Critical patent/KR20150092937A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

고혈압의 유전적 위험인자는 나이 또는 성별 특이적일 수 있으며, 다면 발현적 효과를 나타낼 가능성이 있다. 본 발명은 고혈압 및 관련 질병의 발병 요인을 밝힘에 있어서 혼란변수와 나이-성별 층화의 영향을 고려하여 유전적 및 비유전적 인자의 위험성을 측정하려는 것이다. 한국의 두 지역을 기반으로 하는 코호트로부터 얻어진 2,886 고혈압 환자 및 3,440 정상 대조군의 352,228 개 유전자형 세트 + 백팔십만 개의 추정 SNP가 분석되었고, 선택된 유전자 변이들은 건강검진자 코호트 (665 환자 및 1,285 정상인 대조군)에서 재평가되었다. 세 개의 유전 모델 하에서 잠재적 공변수의 혼란 효과를 보정한 후 나이 및 성별로 층화한 열두 개의 군에서 전장 유전체 연관성 분석이 수행되었다. 비유전적 요인 분석에서 나이, 교외지역 거주, 체질량지수, 고혈압 가족병력, 남성, 최근 음주상태 및 최근 흡연상태가 고혈압과 밀접한 연관성을 보였다 (P=4×10-151 to 0.011). 다섯 개의 유전자 변이, rs11066280 (C12orf51), rs12229654와 rs3782889 (MYL2 ), rs2072134 (OAS3), rs2093395 (TREML2) 및 rs17249754 (ATP2B1)는 주로 남성에서 고혈압과 관련이 있는 것으로 밝혀졌고 (공동분석에서 P=4.76×10-14 to 4.46×10-7); 세 개의 SNP (rs11066280, rs12229654 및 rs3782889)는 독립적인 군에서 본페로니 다중가설 보정 후에도 현저한 연관성을 보였다. 이 중 세 개의 유전자 변이 rs12229654, rs17249754 및 rs11066280은 고지혈증, 당뇨와 같은 대사성 질환과도 밀접한 연관성을 보였다 (각각 P=0.00071 to 0.0097).

Description

한국인의 고혈압 예측용 SNP 마커 {SNP Markers for hypertension in Korean}
본 발명은 한국인의 고혈압 예측용 SNP 마커에 관한 것으로서, 좀 더 자세하게는 한국의 두 지역을 기반으로 하는 코호트로부터 얻어진 2,886 고혈압 환자 및 3,440 정상 대조군의 352,228 개 유전자형 세트 + 백팔십만 개의 추정 SNP를 분석하였고, 선택된 유전자 변이들은 건강검진자 코호트 (665 환자 및 1,285 정상인 대조군)에서 검증되었으며, 이 결과 얻어진 여섯 개의 유전자 변이를 한국인의 고혈압 예측용 마커로 이용할 수 있다.
세계적으로 고혈압은 심혈관계 질환을 포함하여 다양한 질병의 주요 위험인자이다 (Carretero et al. 2000). 지난 수년간 전장 게놈 연관성 연구 (genome-wide association studies; GWASs)를 통해 고혈압과 관련된 여러 개의 단일염기다형성 (SNP, single nucleotide polymorphisms)을 밝혀내었다. Global BPgen 콘소시움 (Global Blood Pressure Genetic consortium)이 총 여덟 개의 혈압 관련 SNP를 보고한 반면, CHARGE (Aging Research in Genome Epidemiology) 콘소시움은 고혈압과 관련된 단 하나의 유전자 즉 ATP2B1 (ATPase,Ca++ transporting, plasma membrane 1)만이 고혈압과 관련이 있다고 보고하였다 (Newton-Chehet al. 2009; Levyet al. 2009).
이 SNP들 중 어떤 것은 동아시아인에게서 검증되었는데 (Honget al. 2010;Takeuchiet al. 2010;Liuet al. 2011; Xi et al. 2013), 최근 혈압에 관련된 여덟 개의 전장 게놈 연관성 연구 메타분석은 네 개의 유전자 (CASZ1, FGF5, CNNM2 - NT5C2ATP2B1)에 위치한 SNP들과 고혈압과 관련된 CAPZA1, FIGN, ENPEP, NPR3PTPN11 (near C12orf51)과 가까운 곳에 위치하는 다섯 개의 아시아인-특이적 SNP들을 발견하였다 (Kato et al. 2011). 그러나, 이 연구들에서는 수축기 혈압 또는 확장기 혈압에 관한 GWAS에 의해 확인된 SNP들이 고혈압과도 관련되어 있는지를 평가하였다. 민족적, 환경적 차이 같은 혼란 변수의 효과는 GWAS에서 복합적인 질병에 대한 민감성 SNP를 찾는데 상당한 장애가 될 수 있다 (Pirinen et al. 2012). 나이나 성별과 같은 요인의 매칭과 층화분석은 인구 구조에 따른 혼동을 감소시킬 수 있다. 또한 이러한 혼란 변수들의 효과는 로직 회귀분석에서 공변량을 통제하여 좀 더 통제할 수 있다 (Xing et al. 2010; McNamee et al. 2005).
다면발현성 유전자 (pleiotropic gene)는 유전자 산물의 다른 분자적 기능들을 통하여 다양한 표현형에 영향을 미치는 유전자를 말한다. 약 17%의 유전자와 5%의 SNP들이 게놈-전장 연관성 연구에서 다면발현성을 보이며, 아마도 구조적으로 유해할 것으로 예측된다 (Sivakumaran et al. 2011). 두 개의 이전 연구는 혈압 및 혈액학적 특징에 대한 염색체 부위 12q24.12의 효과 및 12q24.12 부위의 관상동맥질환 및 지질 수준에 관한 다면발현성 효과를 제시하였다 (Kato et al. 2011; Huang et al. 2011). 형질 전장 연관성 연구 (phenome-wide association study)는 GALNT2 유전자의 SNP 하나가 고혈압, 혈청 칼슘 수준 및 관상동맥질환과 관련이 있음을 보였다 (Pendergrass et al. 2013).
1) Adzhubei IA, Schmidt S, Peshkin L et al(2010)A method and server for predicting damaging missense mutations. Nat Methods7:248-249. 2) Baik I, Cho NH, Kim SH, Han B-G, Shin C (2011) Genome-wide association studies identify genetic loci related to alcohol consumption in Korean men. Am J Clin Nutr 93:809-816. 3) Carretero OA, Oparil S(2000)Essential Hypertension: Part I: Definition and etiology.Circulation101:329-335. 4) Chatterjee N, Wheeler B, Sampson J, Hartge P, Chanock SJ, Park J-H(2013) Projecting theperformance of risk prediction based on polygenicanalyses of genome-wide association studies. Nat Genet45:400-405. 5) Cho YS, Go MJ, Kim YJ et al (2009) A large-scale genome-wide association study of Asian populations uncovers genetic factors influencing eight quantitative traits. Nat Genet41:527-534. 6) Committee for Establishing Treatment Instruction for Hyperlipidemia(2000). Guidelines for diagnosis and treatment of hyperlipidemia. Seoul: Korean Society of Lipidology and Atherosclerosis. 7) Glorioso N, Herrera VL, Bagamasbad P, Filigheddu F, Troffa C, Argiolas G, Bulla E, Decano JL, Ruiz-Opazo N(2007)Association of ATP1A1 and dear single-nucleotide polymorphism haplotypes with essential hypertension: sex-specific and haplotype specific effects. Circ Res100:1522-1529. 8) Hashiguchi M, Kobori H, RitprajakP, Kamimura Y, Kozono H, Azuma M(2008) Triggering receptor expressed on myeloid cell-like transcript 2 (TLT-2) is a counter-receptor for B7-H3 and enhances T cell responses.Proc Natl Acad Sci U S A. 105:10495-500. 9) Hong KW, Jin HS, Lim JE, Kim S, Go MJ, Oh B(2010) Recapitulation of two genome wide association studies on blood pressure and essential hypertension in the Korean population. J Hum Genet55:336-341. 10) Hong KW, Go MJ, Jin HS, Lim JE, Lee JY, Han BG, Hwang SY, Lee SH, Park HK, Cho YS, Oh B(2010)Genetic variations in ATP2B1, CSK, ARSG and CSMD1 loci are related to blood pressure and/or hypertension in two Korean cohorts. J Hum Hypertens24:367-372. 11) Huang J, Johnson AD, O'Donnell CJ (2011) PRIMe: a method for characterization and evaluation of pleiotropic regions from multiple genome-wide association studies. Bioinformatics27:1201-1206. 12) Janssens AC, van Duijn CM(2008) Genome-based prediction of common diseases: advances and prospects. Hum Mol Genet17:R166-173. 13) Kabaeva ZT, Perrot A, WolterB, Dietz R, Cardim N, Correia JM, Schulte HD, Aldashev AA, Mirrakhimov MM, Osterziel KJ (2002) Systematic analysis of the regulatory and essential myosin light chain genes: genetic variants and mutations in hypertrophic cardiomyopathy. Eur J Hum Genet 10:741-748. 14) Kato N, Takeuchi F, Tabara Y et al(2011) Meta-analysis of genome-wide association studies identifies common variants associated with blood pressure variation in East Asians. Nat Genet43:531-538. 15) Kim YJ, Go MJ, Hu C et al(2011)Large-scale genome-wideassociation studies in East Asians identify new genetic loci influencing metabolic traits. Nat Genet43:990-995. 16) Kobayashi Y, Hirawa N, Tabara Y et al (2012) Mice lacking hypertension candidate gene ATP2B1 in vascular smooth muscle cells show significant blood pressure elevation. Hypertension59:854-860. 17) Kraft P, de Andrade M(2003) Group 6: Pleiotropy and multivariate analysis. Genet Epidemiol25:S50-S56. 18) Kumar P, Henikoff S, Ng PC(2009) Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nat Protoc4:1073-1081. 19) Levy D, Ehret GB, Rice Ket al (2009) Genome-wide association study of blood pressure and hypertension. Nat Genet41:677-687. 20) Li N, Wang H, Yang J, Zhou L, Hong J, Guo Y, Luo W, Chang J(2009) Genetic variation of NEDD4L is associated with essential hypertension in female Kazakh general population: a case-control study. BMC Med Genet10:130. 21) Liu C, Li H, Qi Q, Lu L, Gan W, Loos RJ, Lin X(2011) Common variants in or near FGF5, CYP17A1 and MTHFR genes are associated with blood pressure and hypertension in Chinese Hans. J Hypertens29:70-75. 22) McNamee R(2005)Regression modelling and other methods to control confounding. Occup Environ Med62:500-506. 23) Newton-Cheh C, Johnson T, Gateva Vet al (2009) Genome-wide association study identifies eight loci associated with blood pressure. Nat Genet41:666-676. 24) Pendergrass SA, Brown-Gentry K, Dudek S, et al (2013) Phenome-wide association study (PheWAS) for detection of pleiotropy within the Population Architecture using Genomics and Epidemiology (PAGE) Network. PLoS Genet 9:e1003087. 25) Pirinen M, Donnelly P, Spencer CCA (2012) Including known covariates can reduce power to detect genetic effects in case-control studies. Nat Genet44:848-51. 26) PruimRJ, Welch RP, Sanna S, Teslovich TM, Chines PS, Gliedt TP, Boehnke M, Abecasis GR, Willer CJ(2010) LocusZoom: regional visualization of genome-wide association scan results. Bioinformatics26:2336-2337. 27) RenS, Yu H, Zhang H, Liu Y, Huang Y, Ma L, Wei L, Wu H, Chen X (2011) Polymorphisms of interferon-inducible genes OAS associated with interferon-α treatment response in chronic HBV infection. Antiviral Res 89:232-237. 28) Sandberg K, Ji H(2012)Sex differences in primary hypertension. Biol Sex Differ3:7. 29) Shaun Purcell, Benjamin Neale, Kathe Todd-Brown, Lori Thomas, Manuel A. R. Ferreira, David Bender, Julian Maller, Pamela Sklar, Paul I. W. de Bakker, Mark J. Daly, Pak C. Sham(2007)PLINK: a tool set for whole-genome association and population-based linkage analyses. Am J Hum Genet81:559-575. 30) Sivakumaran S, Agakov F, Theodoratou E, Prendergast JG, Zgaga L, Manolio T, Rudan I, McKeigue P, Wilson JF, Campbell H(2011) Abundant pleiotropy in human complex diseases and Traits. AmJ HumGenet89:607-618. Szklo M, Nieto FJ(2000)Epidemiology: beyond the basics. 2nded. Gaithersburg, MD, Aspen,pp 150-161. 31) Takeuchi F, Isono M, Katsuya T et al(2010)Blood Pressure and Hypertension Are Associated With 7 Loci in the Japanese Population. Circulation121:2302-2309. 32) World Health Organization(1999)Definition, Diagnosis and Classification of Diabetes Mellitus and itsComplications.Report of a WHO Consultation. Geneva:World Health Organization. 33) Xi B, Shen Y, Zhao X, et al (2013) Association of common variants in/near six genes (ATP2B1, CSK, MTHFR, CYP17A1, STK39 and FGF5) with blood pressure/hypertension risk in Chinese children. J Hum Hypertens doi:10.1038. 34) Xing G, Xing C(2010) Adjusting for covariates in Logistic regression models. Genet Epidemiol34:769-772. 35) Xu Z, Taylor JA(2009) SNPinfo: integrating GWAS and candidate gene information into functional SNP selection for genetic association studies. Nucleic Acids Res37:W600-W605.
본 발명은 다양한 병인학 구조를 세심하게 분석하여 고혈압에 대한 유전적 및 비유전적 위험인자를 밝혀내는 것을 목적으로 한다.
또한, 본 발명은 한국인의 고혈압 예측용 마커를 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위하여 범주형 변수로서의 고혈압에 대한 GWAS와 그 검증 연구가 세 개의 지역사회에 기반한 한국인 코호트들을 독립적으로, 또 합쳐서 수행되었다. 본 발명자들은 생물정보학적 (인실리코) 방법으로 각 SNP의 생물학적 기능을 규명하였다. 추가로, 본 발명자들은 대사 이상에 대한 고혈압 연관 SNP들의 다면발현성 효과를 분석하였다.
고혈압의 유전적 위험인자는 나이 또는 성별 특이성이 있으며, 다면 발현적 효과를 나타낸다. 본 발명은 고혈압 및 관련 질병의 발병에서 혼란변수와 나이-성별 층화를 고려하여 유전적 및 비유전적 인자의 위험성을 측정하려는 것이다. 한국의 두 지역을 기반으로 하는 코호트로부터 얻어진 2,886 고혈압 환자 및 3,440 정상 대조군의 352,228 개 유전자형 세트 + 유전자좌(linkage disequilibirum) 분석으로 추정한 1백8십만 개의 SNP가 분석되었고, 선택된 유전자 변이들은 건강검진 코호트 (665 환자 및 1,285 정상인 대조군)에서 재평가되었다. 세 개의 유전 모델 하에서 잠재적 공변수에 대해 조정한 후 나이 및 성별로 계층화한 열두 개의 군에서 전장 게놈 연관성 분석이 수행되었다. 분석 결과 나이, 교외지역 거주, 체질량지수, 고혈압 가족병력, 남성, 최근 음주상태 및 최근 흡연상태가 고혈압과 밀접하게 관련되어 있었다 (P=4×10-151 to 0.011). 다섯 개의 유전 변이들 즉, rs11066280 (C12orf51), rs12229654와 rs3782889 (MYL2 ), rs2072134 (OAS3), rs2093395 (TREML2)이, 독립된 인구집단에서 특히 남성들의 고혈압 위험과 관련이 있음이 재현되었고, rs17249754 (ATP2B1)는 여성에서 주로 고혈압과 관련이 있는 것으로 밝혀졌다 (통합분석에서 P=4.76×10-14 to 4.46×10-7). 특히 세 개의 SNP (rs11066280, rs12229654 및 rs3782889)는 검증분석에서 본페로니 (Bonferroni) 보정 후에도 현저한 통계적 유의성을 보였다. 세 개의 유전자 변이 rs12229654, rs17249754 및 rs11066280은 고혈압뿐 아니라 고지혈증, 당뇨와 같은 대사성 질환과도 밀접한 연관성을 보였다 (각각 P=0.00071 to 0.0097).
전통적인 위험인자들은 세 부류의 한국인 시험군 내에서 고혈압 위험도를 일관되게 증가시켰다. 교외 지역 거주자들의 높은 발병 위험도는 도시와 교외 지역 간의 생활방식 및 사회경제적 요인의 차이점들을 반영하는 것으로 보인다. 많은 고혈압 환자들이 흡연을 중단하기 때문에 환자-대조군 연구에서 나타난 최근 흡연의 보호효과는 원인-결과의 시간적 연관성에 반하는 잘못된 추정의 전형적인 예이다 (Szklo et al. 2000). 이는 안산-안성 코호트에서 얻은 4년 동안의 추적 데이타를 이용한 생존율 분석에서 위험인자로 밝혀졌다.
아시아 혈압관련 메타 분석에서 확인된 총 10 개의 SNP들도 아시아인의 고혈압과 관련이 있다 (Kato et al. 2011). 반면, 한국인을 대상으로 한 연구에서는 혈압 GWAS에서 선택된 열 개의 SNP들 중 rs17249754 (ATP2B1)만이 고혈압과 관련이 있었다 (Hong et al. 2010).
고혈압에 대한 GWAS에서 본 발명자들은 적어도 하나의 나이 및 성별 하위그룹에서 고혈압과 어느 정도 또는 현저한 관련이 있는 15개의 유전자 내 또는 근처에 위치하는 21개의 SNP들을 밝혔다. 또한 독립적인 연구에서 검증된 다섯 개 유전자 내 또는 근처의 여섯 개 SNP들 중 세 개의 SNP가 본페로니 보정 후에도 통계적으로 유의한 연관성을 보였다. 그렇지만, 나이와 성별 차이를 고려하지 않고 수행된 연속변수(즉 SBP)에 대한 GWAS에서는 SNP rs17249754 (ATP2B1)만이 SBP와 관련이 있었다 (Cho et al. 2009).
혼란 변수를 고려한 경우, 일군의 SNP들 (즉, rs12229654, rs3782889 및 rs11066280)은 다중 공변량 및 개별 매칭 후 그 통계적 연관성이 더 약화되었다. 이들 SNP들은 최소한의 공변량만 보정한 종래 연구에서 자주 보고되었던 SNP들이다. 반면, 다른 SNP 군은 보정 또는 매칭 후 통계적 유의성이 높아졌다 (즉, rs17154350 및 rs17249754). 이 SNP들은 혼란 변수를 고려하지 않은 종래 연구에서는 거의 보고되지 않았다. 이 분석 결과는 체질량지수 또는 알콜 섭취량과 같은 매개요인과 관련된 유전적 변수들이 비유전적 인자의 효과를 통제하면 통계적 유의성이 사라지는 복합 유전학에서 주요 패러다임의 하나의 예를 보여주는 반면, 특별한 하위그룹 환자에게만 영향을 미치는 유전적 변수들은 요인들을 계층화한 후 좀 더 뚜렷한 연관성을 보인다는 점을 시사한다 (Janssens at al. 2008).
Sandberg와 Ji는 인종과 민족에 관계없이 여성보다 남성이 높은 혈압을 가짐을 밝혀 고혈압에서 성별에 따른 차이를 보고하였다 (Sandberg at al. 2012). 후보 유전자 연구 결과, 고혈압과 남성-특이적 ATP1A 유전자 변이 및 여성-특이적 NEDD4L 유전자 변이의 연관성이 보고되었다 (Glorioso et al. 2007; Li et al. 2009). 그러나, 이전의 GWAS에서는 나이-성별 층화를 수행하지 않았던 반면 본 발명은 고혈압과 남성-특이적 유전자 변이를 발견하고 그 결과를 독립된 인구집단을 대상으로 하여 재현하였다. 이 SNP들과 고혈압 및 대사성 질환 간의 연관성은 환자 수가 더 적은 남성군에서 오히려 더 두드러졌다.
rs11066280 및 rs12229654 SNP를 제외하고, 네 개의 반복 재현된 SNP의 기능은 인실리코 예측으로 입증하였다. 유전자 ATP2B1으로 암호화된 단백질은 세포내 칼슘 항상성과 혈관 평활근 수축을 바꿈으로써 인종과 상관없이 혈압을 조절하는 보존적 기능을 가지는 것으로 보인다 (Levy et al. 2009; Kato et al. 2011; Kobayashi et al. 2012). 또 다른 유전자 MYL2는 rs12229654 (56 kb~5') 심장 미오신 베타 중쇄와 관련이 있고 비대심장 근육병증 (hypertrophic cardiomyopathy)에 관련된 조절 경쇄를 암호화한다 (Kabaeva et al. 2002). 유럽인을 대상으로 한 GWAS는 rs12229654로부터 각각 593 kb 및 470 kb인 두 개의 SNP rs653178 (ATXN2) 및 rs3184504 (SH2B3, missense)를 보고하였으나, 이 SNP들은 서로 연관 불균형 (linkage disequilibrium; LD)을 나타내지 않았다 (Newton-Cheh et al. 2009;Levy et al. 2009). Treml2 (TREML2 유전자에 의해 암호화됨)는 염증에 관한 T 세포 반응을 증강시킨다 (Hashiguchi et al. 2002). 인간 OAS3는 세포의 단백질 합성 저해와 바이러스 감염 저항에 중요한 역할을 수행한다 (Ren et al. 2008).
대사성 형질에 관한 아시아인을 대상으로 한 GWAS에서 두 개의 SNP rs12229654와 rs11066280은 HDL 콜레스테롤 및/또는 간 효소 수치 수준과 관련이 있었다 (Kim et al. 2011). 세 개의 SNP rs12229654, rs11066280 및 rs2072134는 나이와 흡연 여부만 공변수로 사용했을 때 한국 남성에서 음주와 강하게 관련되어 있었다 (Baik et al. 2011). 본 발명자들은 이 SNP들이 음주 및/또는 체질량지수와 강하게 관련되어 있음을 발견하였다. 고혈압과 이 SNP들 간의 연관성에 대한 증거는 음주에 대한 보정 후 감소하였지만 여전히 현저하다. 이 데이타들은 이 유전변이들이 고혈압과 알콜대사 모두에 영향을 미침을 말해준다; 그러나, 이러한 효과를 나타내는 기저의 메카니즘은 알려져 있지 않다. 아시아인 메타분석에서 확인된 SNP들은 유전적 차이가 적은 한국인에서보다 통계적 연관성과 다중발현성이 낮았다. 이는 메타 분석이 유전적으로 이질적인 중국 한족, 일본인, 한국인 및 말레이인을 통합분석하였기 때문에 민족-특이적 유전자 변이를 탐지할 수 없었음을 의미한다.
대사성 질환에서 표현형질의 이질성은 복합적인 특징들 기저의 공통유전자를 발견하는데 있어 통계적 검정력을 감소시킬 수 있다. 본 발명자들은 건강검진 코호트 (HEXA) 데이타에서 이용 가능한 공변량 숫자의 제한 때문에 다른 보정변수 (adjustment)의 효과를 평가할 수 없었다.
상기 목적을 달성하기 위한 하나의 양태로서, 본 발명은 고혈압 위험 예측 또는 진단용 단일염기다형성인 SNP(single nucleotide polymorphism) 마커를 제공한다.
바람직하게는 서열번호 1 내지 6으로 구성된 폴리뉴클레오타이드들에 있어서, SNP 위치인 각 서열의 501번째 염기를 포함하고, 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오타이드로부터 선택된 하나 이상의 폴리뉴클레오타이드, 또는 이의 상보적인 폴리뉴클레오타이드를 포함하는, 고혈압 위험 예측 또는 진단용 SNP(single nucleotide polymorphism) 마커일 수 있다.
본 발명에서 용어, "다형성(polymorphism)"이란 하나의 유전자 좌위(locus)에 두 가지 이상의 대립유전자(allele)가 존재하는 경우를 말하며 다형성 부위 중에서, 사람에 따라 단일 염기만이 다른 것을 단일염기 다형성(single nucleotide polymorphism, SNP)이라 한다. 바람직한 다형성 마커는 선택된 집단에서 1% 이상, 더욱 바람직하게는 5% 또는 10% 이상의 발생빈도를 나타내는 두 가지 이상의 대립유전자를 가진다.
본 발명에서 용어, "대립유전자(allele)"는 상동염색체의 동일한 유전자좌위에 존재하는 한 유전자의 여러 타입을 말하며 에컨대, SNP는 두 종류의 대립인자(biallele)를 갖는다. 대립유전자 빈도는 특정 인구집단 내 유전적 다형성을 나타내는데 사용된다.
본 발명에서 용어, "rs_id"란 1998년부터 SNP 정보를 축적하기 시작한 NCBI가 초기에 등록되는 모든 SNP에 대하여 부여한 독립된 표지자인 rs-ID를 의미한다. 본 발명에서는 rs2093395와 같은 형태로 기재하였다. 이와 같은 표에 기재된 rs_id는 본 발명의 다형성 마커인 SNP 마커를 의미한다. 당업자라면 상기 rs_id를 이용하여 SNP의 위치 및 서열을 용이하게 확인할 수 있다. NCBI의 dbSNP(The Single Nucleotide Polymorphism Database) 번호인 rs_id에 해당하는 구체적인 서열은 시간이 지남에 따라 약간 변경될 수 있다. 본 발명의 범위가 상기 변경된 서열에도 미치는 것은 당업자에게 자명할 것이다.
상기 "서열번호 1 내지 6"은 다형성 부위를 포함하는 다형성 서열(polymorphic sequence)이다. 다형성 서열이란 폴리뉴클레오타이드 서열 중에 SNP를 포함하는 다형성 부위(polymorphic site)를 포함하는 서열을 의미한다. 상기 폴리뉴클레오타이드 서열은 DNA 또는 RNA가 될 수 있다.
본 발명의 SNP 마커는 표 2에 표시된 마커로서, 개체의 SNP 마커의 다형성 부위가 효과 대립유전자(effect allele)로 표시된 대립유전자일 경우, 고혈압 발병 또는 위험이 높은 개체로 판단할 수 있는 것이다. 본 발명에서 "효과 대립유전자"는 "위험 대립유전자"와 혼용될 수 있다.
본 발명에서 용어, "예측 또는 진단"은 질병 발생의 예측 및 질병 발생위험도를 결정하거나 도출시키는데 사용되는 모든 유형의 분석을 포함하며, 바람직하게는 고혈압인지 여부를 판단하여 진단을 하거나 발병 위험을 예측하는 것일 수 있다.
바람직하게 상기 SNP 마커는 서열번호 1 내지 서열번호 6으로 이루어진 군에서 선택된 하나 이상의 폴리뉴클레오타이드 또는 이의 상보적인 폴리뉴클레오타이드일 수 있다. 더 바람직하게는 2개 이상, 더욱 바람직하게는 3개 이상, 4개 이상, 5개 이상, 가장 바람직하게는 6개 모두의 SNP 마커 세트일 수 있다. 상기 마커는 각 SNP 마커의 501번째 염기가 표 2의 효과 대립 유전자 염기인 경우에는 고혈압 위험이 높은 것으로 판단할 수 있으며, 효과 대립 유전자 염기가 아닌 경우에는 고혈압 위험이 낮은 것으로 판단할 수 있으며, 개체의 SNP 마커의 수가 많을수록 정확도가 높아질 수 있다.
바람직하게 상기 SNP 마커는 서열번호 1로 기재되는 rs2093395에 있어서, 501번째 염기가 C 또는 G인, 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오타이드, 또는 이의 상보적인 폴리뉴클레오타이드;
서열번호 2로 기재되는 rs17249754에 있어서, 501번째 염기가 A 또는 G인, 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오타이드, 또는 이의 상보적인 폴리뉴클레오타이드;
서열번호 3으로 기재되는 rs12229654에 있어서, 501번째 염기가 G 또는 T인, 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오타이드, 또는 이의 상보적인 폴리뉴클레오타이드;
서열번호 4로 기재되는 rs3782889에 있어서, 501번째 염기가 C 또는 T인, 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오타이드, 또는 이의 상보적인 폴리뉴클레오타이드;
서열번호 5로 기재되는 rs11066280에 있어서, 501번째 염기가 A 또는 T인, 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오타이드, 또는 이의 상보적인 폴리뉴클레오타이드; 또는
서열번호 6으로 기재되는 rs2072134에 있어서, 501번째 염기가 G 또는 A인, 5 내지 100개의 연속적인 염기로 구성되는 폴리뉴클레오타이드, 또는 이의 상보적인 폴리뉴클레오타이드로 이루어진 군에서 선택된 하나 이상의 폴리뉴클레오타이드일 수 있다. 더 바람직하게는 2개 이상, 더욱 바람직하게는 3개 이상, 4개 이상, 5개 이상, 가장 바람직하게는 6개 모두의 SNP 마커 세트일 수 있다.
상기 마커는 각 SNP 마커의 501번째 염기가 표 2의 효과 대립 유전자 염기인 경우에는 고혈압의 위험이 높은 것으로 판단할 수 있으며, 효과 대립 유전자 염기가 아닌 경우에는 고혈압 위험이 낮은 것으로 판단할 수 있으며, 개체의 SNP 마커의 수가 많을수록 정확도가 높아질 수 있다.
또 하나의 양태로서, 본 발명은 상기 고혈압 위험 예측 또는 진단용 마커를 검출할 수 있는 프로브 또는 증폭할 수 있는 제제를 포함하는, 고혈압 예측 또는 진단용 조성물을 제공한다.
본 발명에서 용어, "고혈압 예측 또는 진단용 마커를 검출할 수 있는 프로브"는 상기와 같은 유전자의 다형성 부위와 특이적으로 혼성화 반응을 통해 확인하여 고혈압을 예측 또는 진단할 수 있는 조성물을 의미하며, 이와 같은 유전자 분석의 구체적 방법은 특별한 제한이 없으며, 이 발명이 속하는 기술분야에 알려진 모든 유전자 검출 방법에 의하는 것일 수 있다.
본 발명에서 용어, "고혈압 예측 또는 진단용 마커를 증폭할 수 있는 제제"란 상기와 같은 유전자의 다형성 부위를 증폭을 통해 확인하여 고혈압을 예측 또는 진단할 수 있는 조성물을 의미하며, 바람직하게는 상기 고혈압 예측 또는 진단용 마커의 폴리뉴클레오타이드를 특이적으로 증폭할 수 있는 프라이머를 의미한다.
상기 다형성 마커 증폭에 사용되는 프라이머는, 적절한 완충액 중의 적절한 조건(예를 들면, 4개의 다른 뉴클레오사이드 트리포스페이트 및 DNA, RNA 폴리머라제 또는 역전사 효소와 같은 중합제) 및 적당한 온도 하에서 주형-지시 DNA 합성의 시작점으로서 작용할 수 있는 단일가닥 올리고뉴클레오타이드를 말한다. 상기 프라이머의 적절한 길이는 사용 목적에 따라 달라질 수 있으나, 통상 15 내지 30 뉴클레오타이드이다. 짧은 프라이머 분자는 일반적으로 주형과 안정한 혼성체를 형성하기 위해서는 더 낮은 온도를 필요로 한다. 프라이머 서열은 주형과 완전하게 상보적일 필요는 없으나, 주형과 혼성화할 정도로 충분히 상보적이어야 한다.
본 발명에서 용어, "프라이머"는 짧은 자유 3' 말단 수산화기(free 3' hydroxyl group)를 가지는 염기 서열로 상보적인 주형과 염기쌍을 형성할 수 있고 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응(즉, DNA 폴리머레이즈 또는 역전사효소)을 위한 시약 및 상이한 네 가지 뉴클레오사이드 트리포스페이트의 존재하에서 DNA 합성을 개시할 수 있다. PCR 증폭을 실시하여 원하는 생성물의 생성 여부를 통해 고혈압을 예측할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당업계에 공지된 것을 기초로 변형할 수 있다.
본 발명의 프로브 또는 프라이머는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비-제한적인 예로는 메틸화, "캡핑", 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다.
또 하나의 양태로서, 본 발명은 상기 고혈압 예측 또는 진단용 조성물을 포함하는 고혈압 예측 또는 진단용 키트를 제공한다.
상기 키트는 RT-PCR 키트 또는 DNA 분석용 (예, DNA 칩) 키트일 수 있다. 본 발명의 키트는 고혈압 예측 또는 진단용 마커인 SNP 마커를 증폭을 통해 확인하거나, SNP 마커의 발현 수준을 mRNA의 발현 수준을 확인함으로써 고혈압을 예측 또는 진단할 수 있다.
구체적인 일례로서, 본 발명에서 고혈압 예측 또는 진단용 마커의 mRNA 발현 수준을 측정하기 위한 키트는 RT-PCR을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. RT-PCR 키트는, 고혈압 예측 또는 진단용 마커의 유전자에 대한 특이적인 각각의 프라이머 쌍 외에도 RT-PCR 키트는 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사효소와 같은 효소, DNase, RNAse 억제제, DEPC-수(DEPC-water), 멸균수 등을 포함할 수 있다. 또한 정량 대조군으로 사용되는 유전자에 특이적인 프라이머 쌍을 포함할 수 있다. 또한 바람직하게는, 본 발명의 키트는 DNA 칩을 수행하기 위해 필요한 필수 요소를 포함하는 고혈압 예측 또는 진단용 키트일 수 있다. DNA 칩 키트는, 일반적으로 편평한 고체 지지판, 전형적으로는 현미경용 슬라이드보다 크지않은 유리 표면에 핵산 종을 격자형 배열(gridded array)로 부착한 것으로, 칩 표면에 핵산이 일정하게 배열되어, DNA 칩 상의 핵산과 칩 표면에 처리된 용액 내에 포함된 상보적인 핵산 간에 다중 혼성화 반응이 일어나 대량 병렬 분석이 가능하도록 하는 도구이다.
또 하나의 양태로서, 본 발명은 상기 고혈압 예측 또는 진단용 마커의 폴리뉴클레오타이드를 포함하는 고혈압 예측 또는 진단용 마이크로어레이를 제공한다.
상기 마이크로어레이는 DNA 또는 RNA 폴리뉴클레오타이드를 포함하는 것일 수 있다. 상기 마이크로어레이는 프로브 폴리뉴클레오타이드에 본 발명의 폴리뉴클레오타이드를 포함하는 것을 제외하고는 통상적인 마이크로어레이로 이루어진다. 프로브 폴리뉴클레오타이드를 기판상에 고정화하여 마이크로어레이를 제조하는 방법은 당업계에 잘 알려져 있다. 상기 프로브 폴리뉴클레오타이드는 혼성화할 수 있는 폴리뉴클레오타이드를 의미하는 것으로, 핵산의 상보성 가닥에 서열 특이적으로 결합할 수 있는 올리고뉴클레오티드를 의미한다. 본 발명의 프로브는 대립유전자 특이적 프로브로서, 같은 종의 두 구성원으로부터 유래한 핵산 단편 중에 다형성 부위가 존재하여, 한 구성원으로부터 유래한 DNA 단편에는 혼성화하나, 다른 구성원으로부터 유래한 단편에는 혼성화하지 않는다. 이 경우 혼성화 조건은 대립유전자 간의 혼성화 강도에 있어서 유의한 차이를 보여, 대립유전자 중 하나에만 혼성화하도록 충분히 엄격해야 한다. 이렇게 함으로써 다른 대립유전자 형태 간에 좋은 혼성화 차이를 유발할 수 있다. 본 발명의 상기 프로브는 대립유전자를 검출하여 고혈압 예측 또는 진단 방법 등에 사용될 수 있다.
상기 예측 또는 진단 방법에는 서던 블랏팅 등과 같은 핵산의 혼성화에 근거한 검출방법들이 포함되며, DNA 칩을 이용한 방법에서 DNA 칩의 기판에 미리 결합된 형태로 제공될 수도 있다. 상기 혼성화란 엄격한 조건, 예를 들면 1M 이하의 염 농도 및 25 ℃ 이상의 온도 하에서 보통 수행될 수 있다. 예를 들면, 5x SSPE(750 mM NaCl, 50 mM Na Phosphate, 5 mM EDTA, pH 7.4) 및 2530 ℃의 조건이 대립유전자 특이적 프로브 혼성화에 적합할 수 있다.
본 발명의 고혈압 예측 또는 진단과 연관된 프로브 폴리뉴클레오타이드를 기판상에 고정화하는 과정도 또한 이러한 종래 기술을 사용하여 용이하게 제조할 수 있다. 또한, 마이크로어레이 상에서의 핵산의 혼성화 및 혼성화 결과의 검출은 당업계에 잘 알려져 있다. 상기 검출은 예를 들면, 핵산 시료를 형광 물질 예를 들면 Cy3 및 Cy5와 같은 물질을 포함하는 검출가능한 신호를 발생시킬 수 있는 표지 물질로 표지한 다음, 마이크로어레이 상에 혼성화하고 상기 표지 물질로부터 발생하는 신호를 검출함으로써 혼성화 결과를 검출할 수 있다.
또 하나의 양태로서, 본 발명은 (a) 분리된 시료의 DNA로부터 상기 SNP 마커의 다형성 부위를 증폭하거나 프로브와 혼성화하는 단계; 및 (b) 상기 (a) 단계의 증폭된 또는 혼성화된 다형성 부위의 염기를 결정하는 단계를 포함하는, 고혈압 예측 또는 진단을 위한 정보의 제공 방법을 제공한다.
상기 분리된 시료의 DNA는 개체로부터 분리된 시료로부터 수득할 수 있다.
본 발명의 용어, "개체"란 고혈압 예측 또는 진단을 하기 위한 피험자를 말한다. 상기 검체에서 머리카락, 뇨, 혈액, 각종 체액, 분리된 조직, 분리된 세포 또는 타액과 같은 시료 등으로부터 DNA를 얻을 수 있으나, 이에 제한되는 것은 아니다.
상기 (a) 단계의 DNA로부터 상기 SNP 마커의 다형성 부위를 증폭하거나 프로브와 혼성화하는 단계는 당업자에게 알려진 어떠한 방법이든 사용 가능하다. 예를 들면, 표적 핵산을 PCR을 통하여 증폭하고 이를 정제하여 얻을 수 있다. 그 외 라이게이즈 연쇄 반응(Wu 및 Wallace, Genomics 4, 560(1989), Landegren 등, Science 241, 1077(1988)), 전사증폭(transcription amplification)(Kwoh 등, Proc. Natl.Acad. Sci. USA 86, 1173(1989)) 및 자가유지 서열 복제(Guatelli 등, Proc. Natl. Acad. Sci. USA 87, 1874(1990)) 및 핵산에 근거한 서열 증폭(NASBA)이 사용될 수 있다.
상기 방법 중 (b)단계의 다형성 부위의 염기를 결정하는 것은 서열 분석, 마이크로어레이(microarray)에 의한 혼성화, 대립유전자 특이적인 PCR(allele specific PCR), 다이나믹 대립유전자 혼성화(dynamic allele specific hybridization), PCR 연장 분석, PCR-SSCP, PCR-RFLP 분석 또는 TaqMan 기법, SNPlex 플랫폼(Applied Biosystems), 질량 분석법(예를 들면, Sequenom의 MassARRAY 시스템), 미니-서열결정(mini-sequencing) 방법, Bio-Plex 시스템(BioRad), CEQ and SNPstream 시스템(Beckman), Molecular Inversion Probe 어레이 기술(예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies(예를 들면, Illumina GoldenGate 및 Infinium 분석법)를 포함하나, 이에 한정되지 않는다. 상기 방법들 또는 본 발명이 속하는 기술분야의 당업자에게 이용 가능한 다른 방법에 의해, 마이크로새틀라이트, SNP 또는 다른 종류의 다형성 마커를 포함한, 다형성 마커에서의 하나 이상의 대립유전자가 확인될 수 있다. 이와 같은 다형성 부위의 염기를 결정하는 것은 바람직하게는 SNP 칩을 통해 수행할 수 있다.
본 발명에서 용어, "SNP 칩"은 수십만 개의 SNP의 각 염기를 한번에 확인할 수 있는 DNA 마이크로어레이의 하나를 의미한다.
TaqMan 방법은 (1) 원하는 DNA 단편을 증폭할 수 있도록 프라이머 및 TaqMan 탐침을 설계 및 제작하는 단계; (2) 서로 다른 대립유전자의 탐침을 FAM 염료 및 VIC 염료로 표지(Applied Biosystems)하는 단계; (3) 상기 DNA를 주형으로 하고, 상기의 프라이머 및 탐침을 이용하여 PCR을 수행하는 단계; (4) 상기의 PCR 반응이 완성된 후, TaqMan 분석 플레이트를 핵산 분석기로 분석 및 확인하는 단계; 및 (5) 상기 분석결과로부터 단계 (1)의 폴리뉴클레오티들의 유전자형을 결정하는 단계를 포함한다.
상기에서, 서열결정 분석은 염기서열 결정을 위한 통상적인 방법을 사용할 수 있으며, 자동화된 유전자분석기를 이용하여 수행될 수 있다. 또한, 대립유전자 특이적 PCR은 SNP가 위치하는 염기를 3' 말단으로 하여 고안한 프라이머를 포함한 프라이머 세트로 상기 SNP가 위치하는 DNA 단편을 증폭하는 PCR 방법을 의미한다. 상기 방법의 원리는, 예를 들어, 특정 염기가 A에서 G로 치환된 경우, 상기 A를 3' 말단염기로 포함하는 프라이머 및 적당한 크기의 DNA 단편을 증폭할 수 있는 반대 방향 프라이머를 고안하여 PCR 반응을 수행할 경우, 상기 SNP 위치의 염기가 A인 경우에는 증폭반응이 정상적으로 수행되어 원하는 위치의 밴드가 관찰되고, 상기 염기가 G로 치환된 경우에는 프라이머는 주형 DNA에 상보결합할 수 있으나, 3' 말단 쪽이 상보결합을 하지 못함으로써 증폭 반응이 제대로 수행되지 않는 점을 이용한 것이다. DASH는 통상적인 방법으로 수행될 수 있고, 바람직하게는 프린스 등에 의한 방법에 의하여 수행될 수 있다.
한편, PCR 연장 분석은 먼저 단일염기 다형성이 위치하는 염기를 포함하는 DNA 단편을 프라이머 쌍으로 증폭을 한 다음, 반응에 첨가된 모든 뉴클레오타이드를 탈인산화시킴으로써 불활성화시키고, 여기에 SNP 특이적 연장 프라이머, dNTP 혼합물, 다이디옥시뉴클레오타이드, 반응 완충액 및 DNA 중합효소를 첨가하여 프라이머 연장반응을 수행함으로써 이루어진다. 이때, 연장 프라이머는 SNP가 위치하는 염기의 5' 방향의 바로 인접한 염기를 3' 말단으로 삼으며, dNTP 혼합물에는 다이디옥시뉴클레오타이드와 동일한 염기를 갖는 핵산이 제외되고, 상기 다이디옥시뉴클레오타이드는 SNP를 나타내는 염기 종류 중 하나에서 선택된다. 예를 들어, A에서 G로의 치환이 있는 경우, dGTP, dCTP 및 TTP 혼합물과 ddATP를 반응에 첨가할 경우, 상기 치환이 일어난 염기에서 프라이머는 DNA 중합효소에 의하여 연장되고, 몇 염기가 지난 후 A 염기가 최초로 나타나는 위치에서 ddATP에 의하여 프라이머 연장반응이 종결된다. 만일 상기 치환이 일어나지 않았다면, 그 위치에서 연장반응이 종결되므로, 상기 연장된 프라이머의 길이를 비교함으로써 SNP를 나타내는 염기 종류를 판별할 수 있게 된다.
이때, 검출방법으로는 연장 프라이머 또는 다이디옥시뉴클레오타이드를 형광 표지한 경우에는 일반적인 염기서열 결정에 사용되는 유전자 분석기(예를 들어, ABI사의 Model 3700 등)를 사용하여 형광을 검출함으로써 상기 SNP를 검출할 수 있으며, 무-표지된 연장 프라이머 및 다이디옥시뉴클레오타이드를 사용할 경우에는 MALDI-TOF(matrix assisted laser desorption ionization-time of flight) 기법을 이용하여 분자량을 측정함으로써 상기 SNP를 검출할 수 있다.
바람직하게, 상기 (b) 단계에서 결정된 염기서열 중, 서열번호 1로 기재되는 rs2093395에 있어서, 501번째 염기가 C인 경우;
서열번호 2로 기재되는 rs17249754에 있어서, 501번째 염기가 A인 경우;
서열번호 3으로 기재되는 rs12229654에 있어서, 501번째 염기가 G인 경우;
서열번호 4로 기재되는 rs3782889에 있어서, 501번째 염기가 C인 경우;
서열번호 5로 기재되는 rs11066280에 있어서, 501번째 염기가 T인 경우; 또는
서열번호 6으로 기재되는 rs2072134에 있어서, 501번째 염기가 A인 경우, 고혈압으로 판단할 수 있다. 상기 다형성 부위는 위험 대립유전자로 판단하며, 상기 대립유전자의 빈도가 높을수록 고혈압 위험이 높다고 판단할 수 있다. 좀 더 바람직하게는 서열번호 1 내지 6 중 다형성 부위 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상이 위험 대립유전자인 경우, 가장 바람직하게는 6개 모두 위험 대립유전자일수록 고혈압 위험이 높다고 판단할 수 있다.
또 하나의 양태로서, 본 발명은 서열번호 2, 3 및 5로 구성된 폴리뉴클레오타이드들에서, SNP (single nucleotide polymorphism) 위치인 각 서열의 501번째 염기를 포함하고, 5 내지 100 개의 연속적인 염기로 구성되는 폴리뉴클레오타이드로부터 선택된 하나 이상의 폴리뉴클레오타이드 또는 이의 상보적인 폴리뉴클레오타이드가 고지혈증, 당뇨를 포함하는 대사성 질환 위험성 마커임을 특징으로 하는, 한국인 고혈압 위험 예측 또는 진단용 SNP (single nucleotide polymorphism) 마커를 제공한다.
또 하나의 양태로서, 본 발명은 서열번호 1 및 서열번호 3 내지 6으로 구성된 폴리뉴클레오타이드들에서, SNP (single nucleotide polymorphism) 위치인 각 서열의 501번째 염기를 포함하고, 5 내지 100 개의 연속적인 염기로 구성되는 폴리뉴클레오타이드로부터 선택된 하나 이상의 폴리뉴클레오타이드 또는 이의 상보적인 폴리뉴클레오타이드를 포함하는, 한국인 남성 중 고혈압 위험 예측 또는 진단용 SNP (single nucleotide polymorphism) 마커를 제공한다.
본 발명에 따르면 여섯 개의 SNP를 한국인에서 고혈압 위험을 예측하는 마커로서 이용할 수 있다.
또한, 본 발명에 따르면 이들 여섯 개 SNP 중 다섯 개의 유전자 변이, rs11066280 (C12orf51), rs12229654와 rs3782889 (MYL2 ), rs2072134 (OAS3), rs2093395 (TREML2) 및 rs17249754 (ATP2B1)는 한국인 남성의 고혈압 위험 예측 마커로 이용할 수 있다.
또한, 본 발명에 따르면 이들 여섯 개 SNP 중 세 개의 유전자 변이 rs12229654, rs17249754 및 rs11066280은 고지혈증, 당뇨와 같은 대사성 질환 위험 예측 마커로도 이용할 수 있다.
도 1은 디스커버리 연구 (KARE) 및 재현 연구 (HEXA)에서 고혈압과 연관된 C12orf51 유전자 변이의 위치 플롯이다. 세 개의 컬럼은 KARE (a), HEXA (b) 및 조합 (c)의 위치 도면이다. 상부 도면: SNP 기능, SNP 쌍 (pairwise) 연관 불균형 (linkage disequilibrium; LD) 및 1-Mb 윈도우 내에 위치한 유전자들. 리드 SNP는 보라색 및 회색으로 표시되어 있고, 이는 유의하지 않은 연관 불균형을 나타낸다. 하부 도면: 탑 SNP로부터 500 kb보다 크거나 500 kb보다 작은 구역의 귀속 SNP들 (회색)을 포함하는 모든 SNP들의 나이/성별-특이적-log10 P값.
도 2는 additive 모델 하에서 나이, 성별 및 체질량지수에 대해 보정한 후의 고혈압 맨하탄 플롯이다. 나이-성별 군: Both는 남성과 여성을 통합한 것; All은 모든 연령대의 군; 40은 39세-49세; 50은 50세-59세; 60은 60세-70세를 말함.
도 3은 재현실험에서 SNP들의 위치 도면이다. 위쪽 도면 (KARE 데이타 + 1백8십만 추정 SNPs): SNP 기능, 쌍 (pairwise) 연관 불균형 (linkage disequilibrium; LD) 및 1-Mb 윈도우 내에 위치한 유전자들. 리드 SNP는 보라색 및 회색으로 표시되어 있고, 이는 유의하지 않은 연관 불균형 (LD)을 나타낸다. 하부 도면: 탑 SNP로부터 500 kb보다 크거나 500 kb보다 작은 구역의 모든 SNP들의 나이/성별-특이적-log10 P값.
도 4는 KARE 데이타에서 여섯 개의 재현 SNPs의 클러스터 도면이다.
아래에서는 구체적인 실시예를 들어 본 발명의 구성을 좀 더 자세히 설명한다. 그러나, 본 발명의 범위가 실시예의 기재에만 한정되는 것이 아님은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 자명하다.
연구 대상 및 유전자형 규명
KARE (Korea Association Resource project) 참여자들은 두 개의 코호트 즉, 안성 교외지역과 안산 시내지역에서 모집하였다. 이 코호트는 서로 관련 없는 39세부터 70세 사이의 개인들로 구성되었다. 개시단계에서 10,004명의 참여자들에 대해 Affymetrix Genome-wide Human SNP array 5.0 (Affymetrix Inc., Santa Clara, CA, USA)으로 유전자형을 검사하였다. 유전자형의 품질관리시험을 통과한 총 352,228 개의 SNP와 8,842 명을 대상으로 천팔백만 개 SNP들을 추정한 이후 분석에 이용하였다. 이 프로토콜에 대한 자세한 정보는 다른 논문에서 찾을 수 있다 (Cho et al. 2009). 건강검진 코호트 (The Health Examinee cohort; HEXA) 참여자들은 Affymetrix SNP array 6.0을 이용하여 지노타입핑하였고, 이 분석은 40~69세의 3,703명을 포함하였다 (Kim et al. 2011). 이 연구는 지역 연구 윤리위원회 승인을 받았고, 모든 참여자들에게 서면동의를 받았다.
전장 유전체에 대한 고혈압 환자-대조군 연구
고혈압 환자는 140/90 mmHg와 같거나 높은 수축기 혈압/확장기 혈압을 갖는 개인 및 고혈압 병력 또는 만성 항고혈압 치료 또는 복약 경험이 있는 개인을 포함하였다. 대조군은 수축기 혈압 120 mmHg 및 확장기 혈압 80 mmHg 미만이며, 고혈압 병력이 없고, 항고혈압 치료 또는 약물복용 경험이 없는 건강한 개인들을 선정하였다. 수축기 혈압과 확장기 혈압은 수은 혈압계로 앉은 상태에서 세 번 측정하여 평균값으로 계산하였다.
본 발명자들은 연구대상을 2,886 환자군과 3,440 대조군으로, 나이와 성별에 따라 12개의 하위 서브그룹으로 층화하였다: 총합 (T), 39~49세 (T40), 50~59세 (T50), 60~70세 (T60), 남성 (M), 39~49세 남성 (M40), 50~59세 남성 (M50), 60~70세 남성 (M60), 여성 (F), 39~49세 여성 (F40), 50~59세 여성 (F50), 60~70세 여성 (F60). 심층분석을 위하여, 1,788 시험구와 1,788 대조구는 개별적으로 나이와 성별을 맞추었다. 매치된 데이타는 12개의 서브그룹으로 나뉘어 유전적 변이에 나이, 성별 특이적 효과가 있는지를 평가하기 위하여 같은 방법으로 분석하였다. 그러므로, 본 발명자들은 분석에 있어서 나이와 성별을 조정할 필요가 없었다. Stata v. 11.2 (Stata Corp., TX, USA)를 이용한 다중 로지스틱 회귀분석 (multiple logistic regression; MLR)에서 고혈압과 관련하여 일곱 가지 비유전적 인자를 시험하였다. 두 가지 다른 모델 하에서 MLR 분석을 수행하였다: 모델 Ⅰ은 나이, 성별 및 체질량지수 (Body Mass Index; BMI)를 공변수로 포함하였고, 종래 전장 게놈 연관성 연구(Genomewide Association Study; GWAS)에 가장 일반적으로 사용되던 모델을 대표한다. 모델 Ⅱ는 고혈압에 밀접하게 관련된 여섯 개의 부가적 공변량 (covariate)을 통제하였다 (표 1). MLR 분석에서 나이와 성별은 나이-성별 특이적 하위그룹 (예컨대, 30~49세 남성)에 대해서는 통제하지 않았다. 각 MLR 분석은 PLINK v1.07 (http://pngu.mgh.harvard. edu/~purcell/plink/)(Shaun at al. 2007)을 이용하여 부가적 모델, 우성 모델 및 열성 모델 하에서 수행하였다. 웹 브라우저 'Genetic Power Calculator' (http://pngu.mgh.harvard.edu/~purcell/gpc/cc2.html)를 이용하여 각 유전자형에 대하여 표본 크기에 대한 통계적 검정력 (statistical power)을 계산하였다. 본 발명자들은 가장 중요한 SNP들 위주로 1 Mb 윈도우의 유전자 플롯뿐만 아니라 12개의 나이/성별-특이적 맨하탄 플롯을 그리기 위해 R v2.14.2 (http://www.r-project.org)와 Python v2.6.5 (http://www.python.org)를 이용하였다. 측부 (flanking) SNPs의 쌍 연관 불균형 (pairwise linkage disequilibrium)과 함수를 나타내기 위하여 LocusZoom v1.1 (http://csg.sph.umich.edu/locuszoom)을 이용하여 좀 더 부분적인 시각화를 수행하였다 (Pruim et al. 2010). 유전자형 클러스터 도표는 시각적으로 조사하였다.
하위그룹 분석에서 1×10-5 미만의 P 값을 갖는 SNP들에 대해 복제분석을 수행하였다. 본 발명자들은 665 환자와 1,285개의 매치되지 않는 대조군과 나이 및 성별에 개별적으로 매치시킨 522 환자 및 대조군 쌍을 분석하였다. HEXA 데이타에서는 일곱 개의 공변량 (covariates) 중 몇 개가 이용 가능하지 않기 때문에 HEXA 데이타와 조합 데이타는 나이, 성별 및 체질량지수만 통제하였다. 비록 디스커버리 데이타에서 관찰된 연관 신호가 진짜 양성이더라도, 연구 대상이 작은 복제 연구에서는 발견되지 않을 수 있다 (Chatterjee et al. 2013). 그리하여 우리는 복제 연구에서 P 값이 0.05 미만이고 연관 증거가 디스커버리 데이타보다 통합 데이타에서 좀 더 현저하게 되는 경우 SNP 데이타를 결과표에 제시하였다. 뿐만 아니라, 우리는 우리 데이타와 아시안 메타-분석에 보고된 일곱 가지 유전자 변이의 분석결과를 비교하였다.
본 발명자들은 고혈압의 주요 모듈레이터인 체질량지수에 관하여 모델 매치 분석을 수행하였다. 먼저, 체질량지수를 정상 체중 (25 ㎏/㎡ 미만), 과체중 (25~30 ㎏/㎡) 그리고 비만 (30 ㎏/㎡ 초과)과 같이 세 개의 범주로 나누고, 건강한 대조군을 세 개의 체질량지수 범주에 근거하여 1:1 비율로 1,266, 1,000 및 86 고혈압 환자에 매치시켰다.
대사성 질환과의 관련
본 발명자들은 고지혈증 (hyperlipidemia; HL), 제2형 당뇨병 (type 2 diabetes mellitus; T2DM) 및 대사증후군 (metabolic syndrome; MS)과 같은 대사성 질환에 대하여 나이, 성별 및 체질량지수를 보정한 다변량 분석을 수행하여 본 발명 또는 아시아 메타분석에서 밝혀진 12 개의 SNP들의 다면 발현성 효과 (pleiotropic effects)를 평가하였다 (Kraft et al. 2003). 대상들은 이들 질환 병력이 있거나 치료 또는 약물복용 경력이 있는 경우로 분류하였다 (즉, 222 HL, 619 T2DM, 및 3,145 MS). 공복 혈장 혈당값이 126 ㎎/㎗와 같거나 높은 경우 (7.0 mmol), 또는 임의 혈장 혈당 (casual plasma glucose) 값이 200 ㎎/㎗와 같거나 높은 경우, 또는 포도당 75 g을 구강 섭취한 다음 두 시간 후 혈장 혈당값이 200 ㎎/㎗와 같거나 높은 경우 제2형 당뇨병으로 진단하였다 (WHO, 1999). 고지혈증은 한국 지질 동맥경화 학회의 가이드라인에 따라 (즉, 콜레스테롤이 230 ㎎/㎗와 같거나 높은 경우, LDL 콜레스테롤이 150 ㎎/㎗와 같거나 높은 경우, HDL 콜레스테롤이 40 ㎎/㎗보다 낮은 경우, 그리고/또는 트리글리세라이드가 200 ㎎/㎗와 같거나 높은 경우) 진단하였다. 시험대상자들은 다음의 위험인자들 중 세 개 또는 그 이상을 나타내는 경우 대사증후군으로 분류하였다: 체질량지수 (BMI) ≥30, 트리글리세라이드 ≥150 ㎎/㎗, HDL ≥40 (50) ㎎/㎗인 남성 (여성), 고혈압 (수축기 혈압 ≥130, 확장기 혈압 ≥85, 또는 고혈압 치료를 받은 병력) 또는 제2형 당뇨병 (공복 혈당 ≥110 ㎎/㎗ 또는 당뇨병 치료를 받은 병력). 3,053 일반 대조구는 이러한 대사성 질환으로 진단받거나, 치료받거나 또는 약물 처치를 받아본 적이 없는 정상혈압을 포함한다.
가상실험에 의한 기능 분석 ( In Silico Functional Analyses )
SNP들은 비동의 SNP (nonsynonymous SNPs; nsSNP), 종결코돈, 전사인자 결합부위 (transcription factor binding sites; TFBS), 접합 조절인자 (splicing regulator) 또는 SNP Function Prediction (FuncPred, http://snpinfo.niehs.nih.gov)(Xu et al. 9 2009)을 이용하여 대리 SNP들과의 연관 불균형 (linkage disequilibrium; LD) 관계에 바탕을 둔 예측 miRNA 결합부위를 포함하여 생물학적 특성을 평가하였다. 평가는 HapMap-JPT 데이타에서와 같이, 0.8과 같거나 큰 LD 블록으로 좁혀졌다. 또한, 본 발명자들은 단백질 기능에 미치는 아미노산 치환의 영향을 예측하는 툴 SIFT (http://sift.jcvi.org) 및 PolyPhen-2 (http://genetics.bwh.harvard.edu/pph2)(Adzhubei et al. 2010; Kumar et al. 2009)를 이용하여 nsSNPs의 기능적 영향을 평가하였다.
결과
전장게놈 연관성 연구의 비유전적 인자 공변수로 적용, 매칭 및 계층화에서, 나이와 성별 매칭은 고혈압에 대한 유전적 효과에 현저하게 영향을 미치지 않았다 (각각 비매칭 분석 및 매칭 분석에 대한 표 1 및 표 2에 개시됨). HEXA 결과는 비매칭 분석 및 매칭 분석 모두에서 KARE의 결과와 유사하였다 (매칭 데이타는 나타내지 않음). 나이는 고혈압과 강한 연관관계를 나타내었다 (오즈비 OR=1.11;P=4.0×10-151). 고혈압은 남성에게서 좀더 빈번하게 발생하였다 (OR=1.89, P=4.7×10-11). 안성 농촌지역 거주, 체질량지수 증가점수, 최근 음주상태 및 고혈압 가족병력은 고혈압에 걸릴 위험과 각각 86%, 25%, 33% 관련이 있었으며, 위험을 2.62배 증가시킨다. 다중회귀분석 (MLR)은 고혈압에 대한 최근 흡연의 보호효과를 보여준다 (OR=0.73).
디스커버리 연구에서, 본 발명자들은 적어도 하나의 나이-성별 군에서 어느 정도의 연관성 (P<1×10-6)을 보이는 15개 유전자 내 또는 근처에 위치한 21개 SNP를 찾아내었다. 서로 강한 LD에 있는 다섯 개의 SNP를 제외시킨 후, 가장 현저한 결과를 나타내는 하위그룹에서 환자군과 대조군의 하디-와인버그 평형 (Hardy-Weinberg Equilibrium; HWE) P 값, MAF (minor allele frequencies) 및 유전자형 빈도를 16 개의 SNP에 대하여 계산하였다 (표 5). 세 개의 구분되는 위치 (rs1660832, rs12229654 및 rs11066280)는 남성 군에서 본페로니-수정 컷오프 (P<1.42×10-7)를 만족시킨다. 그러나, LOC339902 유전자의 ~3kb 다운스트림에 위치한 rs1660832는 HEXA 연구에서 재현되지 않았다.
혼란변수와 통계량의 편중 상황에서는 다른 타입의 SNP들이 있다 (표 6). 예컨대, 남성에 대한 매칭 분석 (P=4.76×10-10)에서 rs11066280 (12번 염색체의 오픈 리딩 프레임 51, C12orf51)의 통계학적 유의미도는 나이 및 성별 매치 데이타에서 아홉 개의 공변량 (covariate) (P=4.03×10-5)을 적용한 후 약화되었다. C12orf51의 유전적 변이와 고혈압 간의 남성-특이적 연관성은 체질량지수 매칭 이후에도 유의하였다 (표 7). 그러나, SNP rs17249754 (P=2.11×10-5)는 공변수를 매치한 여성에서 좀더 유의해진 것으로 나타났다 (P=4.73×10-7). 알코올 섭취와 밀접하게 연관된 네 개의 SNP (즉, rs12229654, rs3782889, rs11066280, and rs2072134)의 P-값은 음주 상태를 공변수로 통제한 후 증가하는 것으로 보이나 (표 7, 8), SNP의 전체적인 효과 크기 (effect size)는 변하지 않았다 (표 6). 나이, 성별 및 체질량지수를 공변수로 통제한 부가적 모델 하에서 생성된 12개의 나이/성별-특이적 맨하탄 플롯 셋트는 12번 염색체 내의 한 위치가 남성만의 그룹에서 전장 유전체 수준에서 유의성을 획득하였음을 보여준다 (도 2).
고혈압과 연관된 다섯 유전변이의 연관성은 반복 재현 (replicate)되었으며, 다섯 개의 SNP의 남성-특이적 연관성은 HEXA 연구에서 증명되었다 (표 2). 도 1과 도 3은 KARE와 HEXA에서 나타난 이들 SNP들의 성별 특이적 연관성을 보여준다. 두 개의 독립 데이타 셋트에서 rs12229654, rs3782889 {둘 다MYL2 (myosin light chain 2 regulatory cardiac slow) 내에 있음} 및 rs11066280 (C12orf51) 들이 고혈압과의 연관성에서 매우 유사한 나이-성별 특이적 패턴을 보여준다. 이들 세 개의 SNP들은 본페로니-다중가설 검정 후에도 연관성을 보였다 (P<3.13×10-3). 특히, 두 개의 유전자 변이, rs2093395 (TREML2; triggering receptor expressed on myeloid cells-like 2) 및 rs2072134 (OAS3; 2',5'-oligoadenylate synthetase 3)는 50~59세 남성 군에서 가장 강력한 고혈압 연관성을 보여준다. 비록 그 유의성 수준이 첫 발견 (즉, 각각 P=6.88×10-6 및 1.49×10-6)과 반복 재현 단계 (각각 P=0.015 및 0.011)에서 그렇게 높은 유의수준을 보이지는 못하였지만, 두 단계에서 그들의 영향력 즉 OR 값은 유사하였다 (표 2). 아시아인 메타분석에서 보고된 여덟 개의 SNP들은 아마도 본 연구의 시료 크기가 상대적으로 작기 때문에 한국인에서의 결과와 일관되기는 하지만 유의성이 덜한 결과를 얻었다 (표 8). 가장 작은 군 (즉, 50~59세 남성 군)은 대립유전자 빈도 0.2, 0.8의 D', 1:1 환자-대조군 비율, 타입 Ⅰ 오차비율 1.4×10-7 및 고혈압 유병률 59% (노인 인구에서)와 같은 질병예상률을 이용하여 1.5/2.0 (이형접합체/동형접합체)를 초과하는 유전자형 교차비 (OR)를 탐지하기 위하여 80%보다 큰 검정력 (power)에 도달하기에 적합하다.
대사성 질환과의 관련
두 개의 SNP, rs17249754와 rs12229654는 각각 고지혈증 (OR=0.73, P=0.005) 및 제2형 당뇨병 (OR=0.6, P=0.004)과도 관련이 있다. 이 SNP들과 rs11066280은 대사 증후군 (OR=0.76 ~ 0.85, P=0.021 ~ 0.0007)과 다면 발현성 관련성을 보여주었다 (표 3). 그러나, 아시아인 메타분석에서 확인된 유전자 변이들 중 어느 것도 이들 질병에 영향이 있다는 증거는 없었다 (데이타 제시하지 않음). 종합적으로, 고혈압-특이적 서브그룹에서 다면 발현성 효과가 일관되게 관찰되었다. 각 질병에 대한 환자군 빈도와 대조군 빈도는 표 9에 나타내었다. 본 발명자들은 나이-성별 서브그룹으로부터 얻어진 각 SNP의 결과들이 표 2 및 표 3의 질병들과 가장 유의미하게 연관되어 있음을 밝혔다.
인실리코에서 기능적 성격규명
SNP rs2093395는 유전자 접합 (splicing) 조절 및/또는 miRNA 결합 부위에 위치하는 rs3088370 (r2>0.94) 및 rs7754539 (r2>0.94)와 강한 연관 불균형 (linkage disequilibrium; LD)에 있다. rs3747742 12 변이 (r 2 >0.89)는 세린을 글라이신으로 치환시키는 nsSNP이다. 그러나, SIFT 및 PolyPhen-2는 단백질 기능에 대한 효과를 각각 내성 (tolerated)과 양성 (benign)으로 예측하였다. SNP rs17249754는 TFBS에 존재하는 rs12579302 (r2>0.97)와 강한 LD에 있다. 이 부위는 전사를 조절하는 것으로 보이는데, 다시 말하면 유전자 발현의 크기와 시기에 영향을 주는 것으로 보인다. SNP rs2072134는 직접적으로 miRNA 결합부위 내에 위치한다. 결론적으로, SNP rs3782889는 유전자 접합에 관련된 rs2301610 (r2>0.98)과 높은 LD 내에 있다. rs11066280 및 rs12229654 두 SNP의 기능은 아직 알려져 있지 않다.
Figure pat00001
Figure pat00002
Figure pat00003
Figure pat00004
Figure pat00005
Figure pat00006
Figure pat00007
Figure pat00008
Figure pat00009
Figure pat00010
Figure pat00011
<110> Industry Academic Cooperation Foundation, Hallym University <120> SNP Markers for hypertension in Korean <130> hallymU-ParkJW-hypertensionSNP <160> 6 <170> KopatentIn 2.0 <210> 1 <211> 1001 <212> DNA <213> Homo sapiens <220> <221> variation <222> (501) <223> S=C or G <400> 1 gtcttaggaa ctcctcccag gatagcctga gtctccttat ggcctctatt gcagcctgac 60 ttctccttct gcctgtgaaa ggaaaataaa tctcagaacc ccaaaatcac taagccaggg 120 gaaaaatcaa gctgggaact acagcaggca aactggcctc gcattttatt cctaaataag 180 atagctacaa agattaaaaa actatgtacc tccctcacaa tttgcccaca agacaattct 240 ttgtgggcct tgagatcttt accctaaaac agttctgttg attttcaccc tggcaatgta 300 aactgctagc tggtcttcac aggtgcagga aagaaagtta tccctctgct tgcctaggac 360 aaatgcgtat ctgattgctt ctctgcccta ttgtttatgt aaaaatgcag attcactgag 420 ccagactaaa ttgtgtgttc agtgaaagac tgatagagga cttaaaagaa tgcaaccttt 480 tgtctcttat ctatctacga sttggaagcc gcctttccca ctgccccgtc cacacaaacc 540 ctggaccaaa tgcacattgg tccagaccga gtcgatatac atcttacata taattattga 600 tgcctcacgt ctccctaaca tgtataaaaa caagctgtgc cccaaccacc ttgggcacat 660 gtcttcaggg ctcctgagac tattataggc atgtccttaa ccttggcaaa gtagactttc 720 tgaattgatt gaggcctctc tctgatattt tggattcaca tgccccatcc tgcttcctgc 780 tcttctcttc cccagatgtt ggtcccagag cgctttaaac ctccagtgct aatctgcagc 840 tgactctgtg cccaggaacc caacctgcag caccacggtt tatagttttt cttttctttg 900 ttgtttatta actgtcaatc gcctgtgaca attgattttc tatagttcat ctaaggacaa 960 ttatttttaa atgtgtttga ttagtgtcat ctttcatcaa a 1001 <210> 2 <211> 1001 <212> DNA <213> Homo Sapiens <220> <221> variation <222> (501) <223> R=A or G <400> 2 tttcacacac tcttgacctt cattctaaga ctttgatctg tattctctac ctgctattca 60 agcggagggc cacaaggtaa acttatcatc ccttggaatt gttctatttt caaaatttgc 120 tctccagtga acaacttatc tcactttatt tctcttcact tctactgagt cttgtgtaaa 180 cattctgacc ttcaagttca aaggtagtca agatcctttc tgatcaacac ttgcctccct 240 aaaaatgctt acttctcaat ggtcagcgac tccagttttg ctcttatgtc tcacttgctc 300 tttatcctcc taccacccat ctggttaatt agctacccct gaatagacat accatctggc 360 tgagcaatgt tggtaaaagt ttaaaaactg agttcttagt tccatcagaa ttttttctca 420 gtcatatatg atccacggac atatctctaa cttcctgtca tgttcctctt tcaattccaa 480 gaccttctta aattactcca rctctttcca gggtcctcaa gtctgctcca agaccttgct 540 tccttgattg ccactgcaag ctaccaccac ttccatcccc tttctcttgg tttcctcaga 600 ctagccaata ttcagataca ttctactaca taaaagacca tttttctcca cccacctccc 660 tgccacaaaa aacaaacaaa caaaaacaaa aaaaacaaaa aacatgtctc tcctggattt 720 tgataaccca tcaggctatt ctttttctcc ccctcctttt atcccacttt ttaaaaagat 780 ctattcacaa tgcttcctcc taatggccca ctctcacctt gaccctgaca aactgaatcc 840 attcttctgt ccacacacta ctaagatggc tctctatgaa gagccatctt ctattaatgc 900 ttctattagc catcatctat taatgatctc aggcttttta tcagtcctca tcctcctctt 960 aattctgtgt cacttgacag tactgttccc tcctgtccat t 1001 <210> 3 <211> 1001 <212> DNA <213> Homo sapiens <220> <221> variation <222> (501) <223> K=G or T <400> 3 ttcatataca agtgtccaaa agagataaat ccatagaaac agaaagtaga cagtagatta 60 gaggttacca gaagctggga ggaaggaggg aggggaggaa ttatcgctta atgggtaagg 120 cttccagtcc gcagttgatt aacacatatg ttctatgtta catgtattat atactatatt 180 cttacaataa agtaagttag agaaaagaaa atgttattaa gaaaattata aggatgagaa 240 aatatattta ccgcgcatta aatggaagtg gatcatcata aaggtcttca tcctcatggt 300 cttcatgttg agtgggtgga ggaataagag gggttggtct tatctcacgg gtgtcagaga 360 tggaagaaaa tccatgtgta agtggaccca ggcagttcaa acccatgttt gaacagtcaa 420 ctgtacaagg aaactttaaa acatgttgtg atgtccccca catcccaata ctgttttgga 480 gaaaggtact tgcatttgca ktatggaaat tatttgtatt atttcaaaca tttggagcat 540 ctgcttgcct ggtaccctat gcataattga atattttctc aatggttgga agagtgttct 600 ggacagaggg aacagcaagt gcaaaggctc agaggcaggg tgggcttggc ttctactagg 660 aattttctgt ccttgagtgg tggggccaca ggatgggagg ccagatgtga agctggatag 720 gtaggcagga cccagtcatg aagaggctta tgggtcattt gaagagtttc aacttgacct 780 tcaaggcaat gggaagtcat tgagaggatt taaactggga gatgacatgc tacagcattt 840 ttaaaaaggc cttcttttag agtcaacaaa atgagatatt attagccaca gtggctaggg 900 aaattgcttt ttaaaaaaac cccgcaggca cgatttttag cttgacagta ttttgcagac 960 attctggagt gggttttttt tttttttaat tcattatgct g 1001 <210> 4 <211> 1001 <212> DNA <213> Homo sapiens <220> <221> variation <222> (501) <223> Y=C or T <400> 4 acatgtaagc cctgtgttcc gtttcaggag cggaccctga ggaaaccatt ctcaacgcat 60 tcaaagtgtt tgaccctgaa ggcaaagggg tgctgaaggc tgattagtga gtggggtctg 120 tgggggagga agggggttcc ctgcttgccc cctgtccccc ctacacacac acaactgaca 180 ccaacacctg ctttcctttc tctgcagcgt tcgggaaatg ctgaccacgc aggcggagag 240 gttttccaag gaggaggtaa tggggtcctt caagcactcc ctctaaccca gctcctgggt 300 tctccttctg gggggctccg tctcccctct cgtctaaagc acccctgacc ccacactgac 360 agagaaccag ctatcgtctt ctgaggcctg gcctcatttc attctctgcc accctatgag 420 gtagggactg gcataactgc cattttacag ataggcaaac tgagacccag ggaagtaaag 480 tcactcatct aaaataacaa yaatcacacc tgtaatccca gcactttggg aggccaaggc 540 aggaggatca cttgagacca ggagtttgag accagcctag ccaacatgag gaaaccctgt 600 ctctactaaa aatacaaaaa ttagctgggc atggtggtgg acgcctgtat tcccagccac 660 tcaggaggct gacgcatggc acgagaatcg cttgaacccg ggaggcagag gttgcaatga 720 gccaagatca tgccactgca ctccagtctg ggcaacagag caagactctg tctcaaaaat 780 aaaataaaat aacaacacta atagtaaatg ccaggaccta gattcaaacc taggtctgcg 840 tgactgcagg ttctgccttg ctcacgatgc atagagacct gcttagagca tgacattatt 900 atggcgtgaa gggccgccac atactgtcat gtgagttgtg cactgaacaa ttcttctaaa 960 tgtcagtttc ataaaagtca tcagactgtg tatttgttgc a 1001 <210> 5 <211> 1001 <212> DNA <213> Homo sapiens <220> <221> variation <222> (501) <223> W=A or T <400> 5 aggtcaggag ttcgagactt gcctggccaa catggcaaaa ccttgtctct actaaaaata 60 caaaaattag cccggcatgg tggtgtatgc ctgtaatccc agctacttgg gaggctgagg 120 caggaaaatt gcctcaaccc gggaggtgga ggttgcagtg agctgagatg gagccactgc 180 actctagcct gggcaacaga gagagaccct gtctcaaaat aaaaaataaa aagatttttt 240 atatatatat atatatatgt gaatacaccc acacaaacac aaatctaata gccacaaaaa 300 cattcttagc tatctatttc tcctgatacc atggagcctg tataacatgg aaagaatgaa 360 acaagttatt cactactacc agtcataaat gtttatcacc catacacata ctagttgctg 420 agaaatcaga ccataaattt aaaaagcaat taaaaaaaaa aatctagcag gccagagagg 480 ttctttcctt tgaaaaccat wcttctgtgg aaatagctga caaattcacg caatacattt 540 ataaacattt taggaaaacc aacatcacag atattttaac taatcctact ctttctaatc 600 ctaaaaataa actacataaa tgacatatat gtataaattt tggttctgtg aacttggatt 660 agtctttaag aaacaaagag cataggcacg gcatagtggc tcacgcctgt aatctcagca 720 ctttgggaag ccaaggcagg cagatcactt gaggtcagga gttcgagacc agcctggcca 780 acatggtgaa accctgtctc tactaaaaat acaaaaatta gccaggcatg gtggcgcgtg 840 cctgtaatcc cagcaactcg ggaggcagag gcaggagaat cgtttgaatc cgggaggcag 900 aggctgcagt gggctgagat cgcgccactg cactccagcc tgggcgacag agcaagactc 960 ggtctcgggg gaaaaaaaag aaaagaaaga aacaaagagc a 1001 <210> 6 <211> 1001 <212> DNA <213> Homo sapiens <220> <221> variation <222> (501) <223> Y=C or T <400> 6 agatggggga cagggatgga ggctgtcaat atggcacagg tattagaagc cctgtcctct 60 gtcccttcac ctactctagt ctctgtaggc tgagccaaag acggcagaga acaggttcta 120 ggtgaatcag aggagcttcc cttggttgct cacctctctc caagaatgac aataatgagg 180 gaaggctctt cccatcccat tcaatctagc attcctagca ggtaagtttt aacagtggtt 240 tgtggagagt caggctgtct aaggcactcc tgtggagcag agaagggatg ttcagtggct 300 tcctttcttt gtttcctgtt ccttcctctg agatagaccc actccctcat ccacgcaaca 360 gatggccagg atgcatctgc tggggactcc gccccctggc acttggcacc cattcaatca 420 tacatgtctc agactcctct gcagccagag gtctggctgt aatttagatt ctgctaagaa 480 agggaggtgg gatccgtctt yccgcagctc tggcagctgg ccatccctga tggatgtttg 540 tggttgcagg aatctaacct aggtctcgac tccagttttg tccatgtggg gcagtgatgg 600 caggggtagt ggtggcatta gcagtagcag tggctgctct ctggcctctg attcggctac 660 agtggtctaa tattgaaacc aatagtccag tggtggcctc tgccttctgc tcctccagcc 720 tttccagtga tttagataaa atccctttct gcctaagatt cctagagtgc tttctgtttt 780 ctgggctgaa ccttgactag tgtggacact gttgttggac ttgaggtcag gagagcctcc 840 tggatggacc tggtgggcct tgctctagag ggcagagaga aacaggctga gcacggttgt 900 ttggccactg gctcagttta ggctgtgggg atgcagaatc tcagcatgtt aggagagaaa 960 acagggaccc aataaaaatt caggaaggca aactgagcca c 1001

Claims (10)

  1. 서열번호 1 내지 6으로 구성된 폴리뉴클레오타이드들에서, SNP (single nucleotide polymorphism) 위치인 각 서열의 501번째 염기를 포함하고, 5 내지 100 개의 연속적인 염기로 구성되는 폴리뉴클레오타이드로부터 선택된 하나 이상의 폴리뉴클레오타이드 또는 이의 상보적인 폴리뉴클레오타이드를 포함하는, 한국인 고혈압 위험 예측 또는 진단용 SNP (single nucleotide polymorphism) 마커.
  2. 청구항 1에 있어서,
    서열번호 2, 3 및 5로 구성된 폴리뉴클레오타이드들에서, SNP (single nucleotide polymorphism) 위치인 각 서열의 501번째 염기를 포함하고, 5 내지 100 개의 연속적인 염기로 구성되는 폴리뉴클레오타이드로부터 선택된 하나 이상의 폴리뉴클레오타이드 또는 이의 상보적인 폴리뉴클레오타이드는 고지혈증, 당뇨를 포함하는 대사성 질환 위험성 마커임을 특징으로 하는, 한국인 고혈압 위험 예측 또는 진단용 SNP (single nucleotide polymorphism) 마커.
  3. 서열번호 1 및 서열번호 3 내지 6으로 구성된 폴리뉴클레오타이드들에서, SNP (single nucleotide polymorphism) 위치인 각 서열의 501번째 염기를 포함하고, 5 내지 100 개의 연속적인 염기로 구성되는 폴리뉴클레오타이드로부터 선택된 하나 이상의 폴리뉴클레오타이드 또는 이의 상보적인 폴리뉴클레오타이드를 포함하는, 한국인 남성 중 고혈압 위험 예측 또는 진단용 SNP (single nucleotide polymorphism) 마커.
  4. 청구항 1의 한국인 고혈압 위험 예측 또는 진단용 SNP (single nucleotide polymorphism) 마커를 검출할 수 있는 프로브 또는 증폭할 수 있는 제제를 포함하는, 한국인 고혈압 위험 예측 또는 진단용 조성물.
  5. 청구항 4의 조성물을 포함하는 한국인 고혈압 위험 예측 또는 진단용 킷트.
  6. 청구항 5에 있어서,
    상기 킷트는 RT-PCR 킷트 또는 DNA 칩 킷트임을 특징으로 하는, 한국인 고혈압 위험 예측 또는 진단용 킷트.
  7. 서열번호 1 및 서열번호 3 내지 6으로 구성된 폴리뉴클레오타이드들에서, SNP (single nucleotide polymorphism) 위치인 각 서열의 501번째 염기를 포함하고, 5 내지 100 개의 연속적인 염기로 구성되는 폴리뉴클레오타이드로부터 선택된 하나 이상의 폴리뉴클레오타이드 또는 이의 상보적인 폴리뉴클레오타이드를 포함하는, 한국인 남성 중 고혈압 위험 예측 또는 진단용 마이크로 어레이.
  8. a) 분리된 시료의 DNA로부터 청구항 1의 SNP 마커의 다형성 부위를 증폭하거나 프로브와 혼성화하는 단계; 및
    b) 상기 a) 단계의 증폭된 또는 혼성화된 다형성 부위의 염기를 결정하는 단계를 포함하는, 한국인 고혈압 위험 예측 또는 진단을 위한 정보 제공방법.
  9. 청구항 8에 있어서,
    서열번호 1로 기재되는 rs2093395에 있어서, 501번째 염기가 C인 경우;
    서열번호 2로 기재되는 rs17249754에 있어서, 501번째 염기가 A인 경우;
    서열번호 3으로 기재되는 rs12229654에 있어서, 501번째 염기가 G인 경우;
    서열번호 4로 기재되는 rs3782889에 있어서, 501번째 염기가 C인 경우;
    서열번호 5로 기재되는 rs11066280에 있어서, 501번째 염기가 T인 경우; 또는
    서열번호 6으로 기재되는 rs2072134에 있어서, 501번째 염기가 A인 경우, 고혈압으로 판단하는 것인 방법.
  10. 청구항 8에 있어서,
    상기 b) 단계의 염기 결정은 서열 분석, 마이크로어레이에 의한 혼성화, 대립유전자 특이적인 PCR (allele specific PCR), 다이나믹 대립유전자 혼성화 (dynamic allele-specific hybridization), PCR 연장 분석, PCR-SSCP (PCR-single strand conformation polymorphism) 및 TaqMan 방법으로 이루어진 군에서 선택된 하나 이상의 방법에 의해 수행됨을 특징으로 하는 방법.
KR1020140013577A 2014-02-06 2014-02-06 한국인의 고혈압 예측용 snp 마커 KR20150092937A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140013577A KR20150092937A (ko) 2014-02-06 2014-02-06 한국인의 고혈압 예측용 snp 마커

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140013577A KR20150092937A (ko) 2014-02-06 2014-02-06 한국인의 고혈압 예측용 snp 마커

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020150133644A Division KR101617612B1 (ko) 2015-09-22 2015-09-22 한국인의 고혈압 예측용 snp 마커

Publications (1)

Publication Number Publication Date
KR20150092937A true KR20150092937A (ko) 2015-08-17

Family

ID=54057053

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140013577A KR20150092937A (ko) 2014-02-06 2014-02-06 한국인의 고혈압 예측용 snp 마커

Country Status (1)

Country Link
KR (1) KR20150092937A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020013432A1 (ko) * 2018-07-13 2020-01-16 (주)메디젠휴먼케어 단일염기다형성을 이용한 대사 표현형 예측 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020013432A1 (ko) * 2018-07-13 2020-01-16 (주)메디젠휴먼케어 단일염기다형성을 이용한 대사 표현형 예측 방법

Similar Documents

Publication Publication Date Title
KR101546058B1 (ko) 대사증후군 예측용 snp 마커 및 이의 용도
JP2007526764A (ja) アルツハイマー病の発症年齢に関連するapoe遺伝子マーカー
JP2007527241A (ja) 上皮細胞成長因子受容体遺伝子プロモーターにおける多型
KR101536213B1 (ko) 복부비만 예측용 snp 마커 및 이의 용도
CN108753945B (zh) 与中国儿童肥胖和/或高三酰甘油血症相关的snp位点及其应用
KR101532308B1 (ko) 복부비만 예측용 snp 마커 및 이의 용도
KR102543907B1 (ko) 치주질환 위험도 평가용 유전자 마커
KR101617612B1 (ko) 한국인의 고혈압 예측용 snp 마커
US10731219B1 (en) Method for preventing progression to metabolic syndrome
KR20150092937A (ko) 한국인의 고혈압 예측용 snp 마커
JP2007510404A (ja) アルツハイマー病の発症年齢に関連するntrk1遺伝子マーカー
US20140045717A1 (en) Single Nucleotide Polymorphism Biomarkers for Diagnosing Autism
WO2015168252A1 (en) Mitochondrial dna copy number as a predictor of frailty, cardiovascular disease, diabetes, and all-cause mortality
US8236497B2 (en) Methods of diagnosing cardiovascular disease
JP2006296270A (ja) Prkaa2遺伝子多型による2型糖尿病発症素因の検出方法
KR101092580B1 (ko) 위암 감수성 예측용 vcan 다형성 마커 및 이를 이용한위암 감수성 예측 방법
JP2007514417A (ja) アルツハイマー病の進行に関連するntrk1遺伝子マーカー
KR102443042B1 (ko) 직접경구용 항응고제 투여시의 출혈 부작용 예측용 snp 마커 및 이의 용도
KR101167945B1 (ko) Atg16l1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
KR101543774B1 (ko) 복부비만 예측용 snp 마커 및 이의 용도
US20080194419A1 (en) Genetic Association of Polymorphisms in the Atf6-Alpha Gene with Insulin Resistance Phenotypes
KR101167942B1 (ko) Alg12 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
KR101061540B1 (ko) 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는마이크로어레이 및 진단키트, 이를 이용한 검출 방법
KR101167940B1 (ko) Fmn2 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
KR101167934B1 (ko) Ticam1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
E902 Notification of reason for refusal
E601 Decision to refuse application