KR20100114721A - Method of providing the information of single nucleotide polymorphism associated with blood pressure - Google Patents

Method of providing the information of single nucleotide polymorphism associated with blood pressure Download PDF

Info

Publication number
KR20100114721A
KR20100114721A KR1020090033240A KR20090033240A KR20100114721A KR 20100114721 A KR20100114721 A KR 20100114721A KR 1020090033240 A KR1020090033240 A KR 1020090033240A KR 20090033240 A KR20090033240 A KR 20090033240A KR 20100114721 A KR20100114721 A KR 20100114721A
Authority
KR
South Korea
Prior art keywords
analysis
blood pressure
snps
snp
association
Prior art date
Application number
KR1020090033240A
Other languages
Korean (ko)
Other versions
KR101120420B1 (en
Inventor
고민진
김영진
김형래
이종영
조윤신
한복기
Original Assignee
대한민국(관리부서 질병관리본부장)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국(관리부서 질병관리본부장) filed Critical 대한민국(관리부서 질병관리본부장)
Priority to KR1020090033240A priority Critical patent/KR101120420B1/en
Publication of KR20100114721A publication Critical patent/KR20100114721A/en
Application granted granted Critical
Publication of KR101120420B1 publication Critical patent/KR101120420B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

PURPOSE: A method for providing SNP related to blood pressure is provided to diagnose or predict obesity, diabetes, heart disease, hypertension, dyslipidemia and osteoporosis. CONSTITUTION: A single nucleotide polymorphism(SNP) marker comprises rs17249754 and is related to blood pressure. The SNP marker is used for diagnosing or predicting artery scleroma, hypertension, cardiac disease, obesity or diabetes. A kit for diagnosing or predicting artery scleroma, hypertension, cardiac disease, obesity or diabetes contains SNP rs17249754.

Description

혈압과 연관된 단일염기다형성 정보를 제공하는 방법{Method of providing the information of single nucleotide polymorphism associated with blood pressure}Method of providing the information of single nucleotide polymorphism associated with blood pressure

본 발명은 혈압과 연관된 단일염기다형성 정보를 제공하는 방법에 관한 것이다.The present invention relates to a method for providing monobasic polymorphism information associated with blood pressure.

2003년 인간유전체사업 (Human genome project)의 완료에 따라 인간 유전체에 대한 정보가 급속히 증가되고 있으며 이를 이용하여 질병의 유전적 요인을 규명하기 위한 질병유전체 연구 분야에 대한 관심과 중요도가 증대되고 있다.With the completion of the Human Genome project in 2003, information on the human genome has been increasing rapidly, and the interest and importance in the field of disease genome research for identifying genetic factors of diseases are increasing.

최근 식생활 및 생활환경의 변화에 따라 당뇨, 심혈관 질환 등 생활습관질환자가 급격히 증가하고 있으나 환경적인 요인의 통제를 통한 이들 질병 억제에는 한계가 존재하므로 이를 극복하기 위해 보다 근본적인 유전적인 요인들에 대한 이해가 요구되고 있다.Recently, lifestyle diseases such as diabetes and cardiovascular diseases are rapidly increasing due to changes in diet and living environment, but there are limitations in suppressing these diseases through the control of environmental factors. Is required.

최근 단일염기다형성 (SNP, single nucleotide polymorphism) 칩을 이용한 타이핑(typing) 기술의 개발로 인간 유전체에 존재하는 대량의 유전형질을 빠른 속도로 분석 가능하게 되었으며 이를 이용한 대규모 유전형질 질병 관련성 연구가 현 실화되었다. The recent development of typing technology using single nucleotide polymorphism (SNP) chips has enabled the rapid analysis of large amounts of genotypes present in the human genome, and the study of large-scale genotype disease-related studies using them. It became.

미국의 Framingham Heart Study 등 역학코호트를 이용한 질병유전체 연구가 국제적으로 경쟁이 치열하므로 국내에서도 단기간 내의 집중적인 투자와 연구를 통하여 역학코호트를 이용한 유전형질 정보를 확보할 필요성이 대두되고 있다. As disease genome research using epidemiological cohorts, such as the Framingham Heart Study in the United States, is highly competitive internationally, there is a need to obtain genetic information using epidemiological cohorts through short-term intensive investment and research in Korea.

질병관리본부 국립보건연구원 유전체센터는 유전체역학조사사업을 통하여 2001년부터 안성 (농촌)과 안산 (중소도시) 지역에 거주하는 40세~69세의 남녀로 구성된 10,038명을 선정하여 기초조사를 실시하고 2년마다 추적조사를 수행하고 있다. 안성, 안산 역학코호트로부터 수집되는 광범위하고 정밀한 역학정보들과 DNA 등을 비롯한 유전자원들은 질병관련 유전적, 환경적 위험요인 발굴이라는 역학코호트를 이용한 질병유전체 연구의 목적 달성을 위해 긴요히 사용될 것이다.The Genome Center, National Institute for Disease Control and Prevention, conducted a genome epidemiological research project in 2001 to select 10,038 men and women aged 40 to 69 who live in Anseong (rural) and Ansan (small and medium cities). Every two years, we follow up. Genetic resources, including DNA and extensive and accurate epidemiological information collected from Anseong and Ansan epidemiological cohorts, will be used to achieve disease genome research using epidemiological cohorts to identify genetic and environmental risk factors related to disease.

본 발명자들은 전체 유전체 연관 연구(genome-wide association study)를 통하여 맥박; 혈압; 허리-엉덩이 비율; 골강도와 연관된 신규 SNP를 발견하여 본 발명을 완성하였다.The inventors have conducted pulses through a genome-wide association study; Blood pressure; Waist-hip ratio; New SNPs associated with bone strength have been discovered to complete the present invention.

본 발명의 목적은 혈압(blood pressure)과 연관되어 있는 단일염기다형성 마커를 제공하는 것이다. It is an object of the present invention to provide a monobasic polymorphic marker that is associated with blood pressure.

또한, 본 발명의 다른 목적은 상기 단일염기다형성을 포함하는 심혈관 질환 진단 또는 예측용 키트를 제공하는 것이다. In addition, another object of the present invention is to provide a kit for diagnosing or predicting a cardiovascular disease including the single nucleotide polymorphism.

또한, 본 발명의 또 다른 목적은 혈압(blood pressure)과 연관된 단일염기다형성 정보를 제공하는 방법을 제공하는 것이다. It is still another object of the present invention to provide a method for providing monobasic polymorphism information associated with blood pressure.

상기 목적을 달성하기 위해, 본 발명자들은 역학 코호트 지역주민을 대상으로 대규모 유전체 분석사업(KARE, Korean Association Resource)을 착수하였다. 본 발명자들은 안성, 안산 지역사회 코호트 전체(10,038명) 유전체 시료들에 대해 선정된 Affymetrix 사의 고밀도 SNP 칩을 이용하여 전장 유전체 분석을 수행하였다. In order to achieve the above object, the present inventors launched a large-scale genome analysis project (KARE, Korean Association Resource) for the residents of the epidemiological cohort. We performed full-length genome analysis using Affymetrix's high-density SNP chip selected for the entire Anho, Ansan community cohort (10,038) genome samples.

본 발명의 일 양태에 따라, 본 발명은 단일염기다형성 rs17249754로 구성된, 혈압(blood pressure)과 연관되어 있음을 특징으로 하는 단일염기다형성 마커를 제공한다. 상기 단일염기다형성 마커를 이용하여 동맥경화증, 고혈압, 심장병, 비만 또는 당뇨병을 진단 또는 예측할 수 있다.According to one aspect of the invention, the invention provides a monobasic polymorphic marker, characterized in that it is associated with blood pressure, consisting of a monobasic polymorphism rs17249754. The single nucleotide polymorphism marker can be used to diagnose or predict atherosclerosis, hypertension, heart disease, obesity or diabetes.

또한, 본 발명의 다른 양태에 따라, 본 발명은 단일염기다형성 rs17249754을 포함하는, 동맥경화증, 고혈압, 심장병, 비만 또는 당뇨병 진단 또는 예측용 키트를 제공한다. In addition, according to another aspect of the present invention, the present invention provides a kit for diagnosing or predicting atherosclerosis, hypertension, heart disease, obesity or diabetes, comprising a monobasic polymorphism rs17249754.

또한, 본 발명의 다른 양태에 따라, 본 발명은 개체로부터 수득한 DNA에서 단일염기다형성 rs17249754을 확인하여 혈압(blood pressure)과 연관된 단일염기다형성 정보를 제공하는 방법을 제공한다. 상기 혈압과 연관된 단일염기다형성 정보를 이용하여 동맥경화증, 고혈압, 심장병, 비만 또는 당뇨병을 진단 또는 예측할 수있다. In addition, according to another aspect of the present invention, the present invention provides a method for identifying monobasic polymorphism rs17249754 in DNA obtained from an individual to provide monobasic polymorphism information associated with blood pressure. The monobasic polymorphism information associated with the blood pressure can be used to diagnose or predict atherosclerosis, hypertension, heart disease, obesity or diabetes.

동맥경화증; 고혈압; 심장병; 비만; 당뇨병과 혈압의 밀접한 상관관계는 이미 보고되어 있으며 당업계에서 자명하다 (Eur Heart J. 2007 Jun;28(12):1462-536 참조).Atherosclerosis; High blood pressure; heart disease; obesity; Tight correlations between diabetes and blood pressure have already been reported and are apparent in the art (see Eur Heart J. 2007 Jun; 28 (12): 1462-536).

이하, 본 발명을 상세히 설명한다. Hereinafter, the present invention will be described in detail.

본 발명자들은 생리의학적으로 중요한 양적 형질(quantitative trait)에 영향을 미치는 유전 인자를 동정하기 위하여, 한국에서 모집된 지역사회기반 코호트(population-based cohort)로부터 8,842개 샘플에서 전체 유전체 연관 연구(genome-wide association study)를 수행하였다. 여기서, 양적형질(quantitative trait)이란 특정형질에 관여하는 많은 유전자 각각의 작용을 말하며, 이들 유전자의 상호작용과 유전자와 환경의 상호작용에 의한 변이를 나타내는 형질을 의미한다. To identify genetic factors affecting physiologically important quantitative traits, we performed a full genome association study in 8,842 samples from a population-based cohort recruited in Korea. A wide association study was conducted. Here, quantitative trait refers to the action of each of a number of genes involved in a particular trait, and refers to a trait that represents a variation by the interaction of these genes and the interaction of the gene and the environment.

키(height)와 체질량지수(body mass index)의 경우, 검출된 대부분의 변이체가 유럽인들 샘플에서 보고된 것들과 일치되었다. In the case of height and body mass index, most of the variants detected were consistent with those reported in European samples.

조사된 다른 형질의 경우, 7,861개의 독립적인 한국인 샘플에서 유력한 GWAS(전체 유전체 연관 연구, Genome-Wide Association Study) 신호의 검 증(replication)을 통하여 아래 표 1에 나타낸 6개 SNP의 신규 유전자좌(loci)를 동정하였다.For other traits investigated, new loci of the six SNPs shown in Table 1 below are shown through replication of the predominant GWAS (Genome-Wide Association Study) signals in 7,861 independent Korean samples. ) Was identified.

6개의 신규 SNP의 위치 및 관련유전자Location and related genes of six new SNPs 순서order rsrs 번호 number 대립인자Allele 염색체 위치Chromosome location SNP 위치SNP location 관련유전자Related Genes 관련유전자 IDRelated Gene ID 비고Remarks 1One rs17249754rs17249754 A/GA / G 12q21.3312q21.33 8858471788584717 ATP2B1ATP2B1 490490 -- 22 rs12731740rs12731740 C/TC / T 1q32.31q32.3 206091443206091443 C1orf132C1orf132 100128537100128537 인트론 2Intron 2 33 rs12110693rs12110693 A/GA / G 6q22.316q22.31 122199969122199969 GJA1GJA1 26972697 -- 44 rs7776725rs7776725 C/TC / T 7q31.317q31.31 120820357120820357 FAM3CFAM3C 1044710447 인트론 1Intron 1 55 rs1721400rs1721400 C/TC / T 7p14.17p14.1 3802731038027310 SFRP4SFRP4 64246424 -- 66 rs2074356rs2074356 C/TC / T 12q24.1312q24.13 111129784111129784 C12orf51 (FLJ30092)C12orf51 (FLJ30092) 283450283450 인트론 45Intron 45

* (Genomic build: 36.3, dbSNP build 129 기준)* (Genomic build: 36.3, based on dbSNP build 129)

상기 표에서 rs란 reference sequence의 약자이며, 뒤의 숫자는 NCBI dbSNP라는 데이터베이스에서 제공하는 각각의 단일염기다형성을 구분짓는 고유번호(accession number)이다.In the above table, rs is an abbreviation of the reference sequence, and the following number is an accession number that distinguishes each single base polymorphism provided by a database called NCBI dbSNP.

맥박(pulse rate)의 경우, 전체 유전체 의미에 도달한 신호는 염색체 1q32 (rs12731740, p=2.9x10-9) 및 6q22 (rs12110693, p=1.6x10-9)에 맵핑되었으며, 후자는 GJA1의 코딩 서열에서 ~400kb 위치에 있다. When the pulse (pulse rate), have been mapped to the signal reaching the entire dielectric means chromosome 1q32 (rs12731740, p = 2.9x10 -9 ) and 6q22 (rs12110693, p = 1.6x10 -9 ), the latter is the coding sequence of GJA1 At ~ 400kb.

심장수축기 혈압(systolic blood pressure)의 경우, 대부분의 유력한 연관성은 염색체 12q21 및 ATP2B1 유전자 근처의 변이체(rs17249754, p=1.3x10-7)에 관계되었다. In the case of systolic blood pressure, most potent associations were related to variants near chromosome 12q21 and ATP2B1 genes (rs17249754, p = 1.3 × 10 −7 ).

허리-엉덩이 비(waist-hip ratio)의 경우, 염색체 12q24 (rs2074356, p=7.8x10-12) 상의 변이체가 신뢰할만한 연관성을 나타냈다. For the waist-hip ratio, variants on chromosome 12q24 (rs2074356, p = 7.8 × 10 −12 ) showed a reliable association.

또한, 다수의 부위에서 골강도(bone density)에 영향을 미치는 2개의 유전자좌(loci)를 동정하였다. 염색체 7q31에서, FAM3C 유전자 내의 rs7776725가 요골(radius)(p=1.0x10-11), 경골(tibia)(p=1.6x10-6) 및 종골(heel) (p=1.9x10-10)에서 골강도와 연관되었다. 염색체 7p14에서, SFRP4 프리즐드(frizzled) 단백질 유전자 가까이에 맵핑된 rs1721400은 동일하게 세 부위에서 일관된 연관성을 나타냈다(각각 p=2.2x10-3, p=1.4x10-7, p=6x10-4). In addition, two loci affecting bone density at multiple sites were identified. On chromosome 7q31, FAM3C Rs7776725 in the gene was associated with bone strength in the radius (p = 1.0 × 10 −11 ), tibia (p = 1.6 × 10 −6 ) and heel (p = 1.9 × 10 −10 ). On chromosome 7p14, SFRP4 Peurijeul DE (frizzled) showed a consistent association in the three areas that are close to the same as the rs1721400 gene mapping (respectively p = 2.2x10 -3, p = 1.4x10 -7, p = 6x10 -4).

고효율 유전자형분석(genotyping) 기술의 혁신적인 발전으로, 전체 유전체 연관(GWA, genome wide association) 연구는 DNA 서열 변이와 증가하는 질환 및 생의학적으로 중요한 형질과의 관계를 드러냈다. 현재까지, 대부분의 연구들은 유럽인 기원의 샘플에 초점을 두어, 동일한 유전자좌(loci)가 아시아인의 형질 연관성에 기여하는지는 불분명하였다. Innovative advances in high-efficiency genotyping technology have led to genome wide association (GWA) studies revealing the relationship between DNA sequence variation and increasing disease and biomedical traits. To date, most studies have focused on samples of European origin, and it is not clear whether the same loci contributes to Asian genetic relationships.

한국인 유전체 분석사업(KARE, Korea Association Resource)은 2007년에 시작되어 안성(n=5018) 및 안산(n=5020) 지역사회 기반 코호트의 10038명의 참여자들(연령: 40세 ~ 69세) 중에서 대규모 GWA 분석을 착수하였다. 2001년에 한국인 유전체 역학조사사업(KoGES, Korean Genome Epidemiology Study)의 일환으로 수행된 이들 코호트는 260개 형질 이상의 광범위한 표현형 데이터를 제공하지만, 본 발명에서는 생의학적으로 중요한 6개의 양적 형질, 즉 "체질량지수, 허리-엉덩이 비율, 키, 맥박, 혈압, 골강도"의 분석에 초점을 두었다. The Korean Association of Genome Analysis (KARE), launched in 2007, is the largest of the 10038 participants (age: 40-69) in the Anseong (n = 5018) and Ansan (n = 5020) community-based cohorts. GWA analysis was undertaken. These cohorts, conducted in 2001 as part of the Korean Genome Epidemiology Study (KoGES), provide extensive phenotypic data of more than 260 traits, but in the present invention six biomedical quantitative traits, "body mass" Index, waist-hip ratio, height, pulse rate, blood pressure, bone strength ".

전체 10038명의 참여자로부터 10004명의 DNA를 얻어, 이들 모두를 Affymetrix Genome-Wide Human SNP array 5.0(Affymetrix Inc., 미국)로 지노타이핑(genotyping)하였다. 지노타이핑은 마할라노비스 거리를 이용한 베이지안 로버스트 선형 모델링(Bayesian Robust Linear Modeling using Mahalanobis Distance, BRLMM) 알고리즘 및 표준 QC 과정을 이용하여 수행하였다. 순차적으로 HWE p-value<10-6인 38,364개 마커, 95% 이하의 유전자형 call rate를 가진 17,926개, MAF<0.01의 92,050개를 버리고, 다음 분석을 위하여 352,228개 SNP를 남겼다. 20개의 이중 샘플에서 유전자형 일치율이 99.7%를 넘었다. 낮은 call rate(<96%, n=401), 샘플 오염 (n=11), 성 비일관성 (n=41), 유전형질유사도 (n=608) 및 중증질환 (n=101)을 나타낸 샘플들을 제거한 후, 8,842명의 GWA 지노타입을 연관성 분석에 포함시켰다. 또한, 관련 형질에 영향을 미칠 수 있는 약물을 섭취한 사람들은 형질-특이적 분석에서 추가로 제거하였다. 10004 DNA were obtained from a total of 10038 participants, all of which were genotyped with Affymetrix Genome-Wide Human SNP array 5.0 (Affymetrix Inc., USA). Genotyping was performed using a Bayesian Robust Linear Modeling using Mahalanobis Distance (BRLMM) algorithm and standard QC procedures. Sequentially, 38,364 markers with HWE p-value <10 −6 , 17,926 with genotype call rates below 95%, 92,050 with MAF <0.01 were discarded and 352,228 SNPs were left for subsequent analysis. The genotype match rate was greater than 99.7% in 20 double samples. Samples showing low call rate (<96%, n = 401), sample contamination (n = 11), sex inconsistency (n = 41), genotyping similarity (n = 608) and severe disease (n = 101) After removal, 8,842 GWA genotypes were included in the association analysis. In addition, those who consumed drugs that could affect related traits were further removed from the trait-specific assay.

안성과 안산 코호트간 SNP의 MAF 플롯은 두 코호트에서 매우 유사한 SNP의 MAF를 가짐을 나타낸다(도 2-A). The MAF plot of the AnNP and Ansan cohort SNPs shows that the MAFs of SNPs are very similar in both cohorts (FIG. 2-A).

안성과 안산 코호트에서 지노타입 빈도의 비교를 위한 2-d.f. 로지스틱 회귀함수(logistic regression statistics)의 Q-Q(Quantile-Quantile) 분석을 통하여 이들 KARE 연구 집단의 유전적 동질성(homogeneity)을 확인하였다(도 2-B). 또한, 다차원척도(Multidimensional scaling, MDS) 분석 및 주성분분석(principal component analysis)을 통하여 상기 사실을 재확인하였으며, 안성-안산 코호트의 특징은 햅맵(HapMap)의 JPT(일본인)/CHB(중국인) 구성의 특징과 유사함을 증명하였다. 2-d.f. For comparison of genotype frequencies in Ansan and Ansan cohorts. Quantitative-Quantile (Q-Q) analysis of logistic regression statistics confirmed the genetic homogeneity of these KARE study populations (Figure 2-B). In addition, the above facts were reaffirmed through multidimensional scaling (MDS) analysis and principal component analysis, and the characteristics of the Anseong-Ansan cohort were based on the JPT (Japanese) / CHB (Chinese) configuration of HapMap. Similar to the features.

공통 변이체의 범위를 증가시키고 추가 연관성 신호를 포착하기 위하여, 참고로 HapMap의 JPT/CHB component를 사용한 IMPUTE를 통하여 SNP 결측치 예측(imputation)을 수행하였다. SNP 결측치 예측 후 SNPTEST 프로그램(http://www.stats.ox.ac.uk/~marchini/software/gwas/snptest.html)을 이용하여 양적 형질 연관성 분석을 위해 총 2156535개 SNP를 분석할 수 있었다. In order to increase the range of common variants and capture additional correlation signals, SNP missing value prediction was performed through IMPUTE using a JPT / CHB component of HapMap. After predicting SNP missing values, a total of 2156535 SNPs were analyzed for quantitative trait correlation using the SNPTEST program (http://www.stats.ox.ac.uk/~marchini/software/gwas/snptest.html). .

단계 1 전체 유전체 연관성 스캔에서, PLINK (http://pngu.mgh.harvard.edu/~purcell/plink/) 및 SAS 프로그램(버전 9.1; SAS institute Inc., 미국)을 이용하여 연령 및 성별을 조정한 후 추이검정(trend test)을 통하여 6개 형질, 즉 체질량지수(BMI); 허리-엉덩이 비율(WHR); 키; 맥박; 심장수축기 혈압(SBP) 및 심장이완기 혈압(DBP); 및 요골 및 경골에서 측정된 골강도에 대한 연관성의 단일 마커 검사(single marker test)를 수행하였다. 전술한 두 코호트의 유전적 동질성 및 전체적 집단 층화(population stratification)의 제한된 증거에도 불구하고, 안성과 안산 간 형질 분포의 차이(특히, WHR 및 SBP) 때문에 모집 지역을 조정하였다. 추이검정을 위한 Q-Q 플롯은 대부분의 형질의 경우 관측된 P값(p-value)의 분포가 극단 꼬리에서만 예상된 P 값에서 벗어났음을 보여준다(도 3). 키에 대한 Q-Q 플롯은 예외적으로 보다 현저한 편차를 보였으나, 이 패턴은 이 표현형의 GWA 데이터의 다른 대규모 분석에서 관찰되었으며, 이 분석에 의하여 드러난 성인의 키에 대한 상당히 많은 수의 참된 신호를 보여준다(도 3). Step 1 In the full genome association scan, adjust age and gender using PLINK (http://pngu.mgh.harvard.edu/~purcell/plink/) and SAS program (version 9.1; SAS institute Inc., USA) Six traits, body mass index (BMI); Waist-hip ratio (WHR); key; pulse; Systolic blood pressure (SBP) and diastolic blood pressure (DBP); And a single marker test of association with bone strength measured in the radial and tibia. Despite limited evidence of genetic homogeneity and overall population stratification of the two cohorts described above, the recruitment area was adjusted because of differences in trait distribution between Ansan and Ansan (in particular, WHR and SBP). The Q-Q plot for the trend test shows that the distribution of observed p-values for most traits deviates from the expected P values only at the extreme tails (FIG. 3). The QQ plots for heights were exceptionally more pronounced, but this pattern was observed in other large-scale analyzes of the GWA data of this phenotype, showing a fairly large number of true signs of adult height revealed by this analysis ( 3).

추이검정을 통한 전체 유전체(genome-wide) 스캔 결과는 도 5에 나타내었다. 검증을 위하여(즉, 안성과 안산에서 P값<1.0x10-5과 p<0.01을 통합) 임의의 단계 1 역치를 통과한 선택된 형질에 대한 총 22개의 독립된 신호(pairwise linkage disequilibrium statistic r2<0.5, MAF=0.05)를 확인하였다(표 2). 아래 표 2는 GWA 데이터 집단과 검증 집단에서 SNP와 양적 형질간의 연관성(22개의 SNP)을 나타낸 것이다. The results of the genome-wide scan through the trend test are shown in FIG. 5. A total of 22 independent signals (pairwise linkage disequilibrium statistic r 2 <0.5) for selected traits that passed any stage 1 threshold for validation (i.e., combining P values <1.0x10 -5 and p <0.01 in Ansan and Ansan). , MAF = 0.05) was confirmed (Table 2). Table 2 below shows the association (22 SNPs) between SNPs and quantitative traits in the GWA data and validation populations.

Figure 112009023064299-PAT00001
Figure 112009023064299-PAT00001

이들 SNP의 클러스터 플롯의 시각 검사를 통하여 SNP-특이적 지노타이핑 또는 대립인자-판독 인공산물이 없음을 확인하였다(데이터 나타내지 않음). Visual inspection of cluster plots of these SNPs confirmed the absence of SNP-specific genotyping or allele-read artifacts (data not shown).

단계 2 검증 분석에서, 5개의 다른 지역으로부터 Health 2 코호트에 모집된 7861명의 한국인 피검자의 독립 집단에서 이들 22개의 SNP 중 19개를 지노타이핑할 수 있었다. In a Phase 2 validation analysis, 19 out of these 22 SNPs were genotyped in an independent population of 7861 Korean subjects recruited to the Health 2 cohort from five different regions.

TaqMan 또는 Golden Gate 분석을 통하여 지노타이핑을 수행하였다. 평균 지노타이핑 성공률은 99.3%(TaqMan) 및 99.9%(Golden Gate)이었으며, 98.9% call rate 보다 더 낮은 분석은 없었다. 샘플 중 1% 및 2.5%의 샘플의 중복 지노타이핑은 TaqMan과 Golden Gate에서 각각 100% 및 99.8% 일치율을 보였으며, 이는 두 방법 모두 높은 지노타이핑 재현가능성을 나타낸다. 연령, 성별 및 모집지역의 조절 후 추이검정(추가 모델)을 이용하여 연관 분석을 수행하였다. Genotyping was performed through TaqMan or Golden Gate analysis. The average genotyping success rate was 99.3% (TaqMan) and 99.9% (Golden Gate), and no analysis was lower than the 98.9% call rate. Duplicate genotyping of 1% and 2.5% of the samples showed 100% and 99.8% match rates in TaqMan and Golden Gate, respectively, indicating high genotyping reproducibility for both methods. Association analysis was performed using a trend test (additional model) after adjustment of age, gender and recruitment area.

골강도를 제외한 모든 형질에서, Health2 검증 샘플은 동등한 표현형 측정을 직접 제공하였고, KARE GWA 및 Health2 검증데이터의 메타 분석은 R 프로그램(v2.7.1)을 사용하여 수행하였다. BMI, WHR, 키, 혈압 또는 맥박의 검증에서 얻은 15개의 SNP 중 9개는 Health2에서 검증을 위한 일관된 증거를 보여주었다 (p<0.05). 9개 모든 SNP의 경우, 연관성의 결합된 증거는 유력하였다 (p<2x10-7).For all traits except bone strength, Health2 validation samples directly provided equivalent phenotypic measurements, and meta-analysis of KARE GWA and Health2 validation data was performed using the R program (v2.7.1). Nine of the 15 SNPs obtained from verification of BMI, WHR, height, blood pressure or pulse rate showed consistent evidence for verification in Health2 (p <0.05). For all nine SNPs, the combined evidence of association was strong (p <2 × 10 −7 ).

요골 또는 경골에서의 골강도 측정에 관한 KARE GWA 연구에서 연관성에 대한 증거를 보여주는 4개의 SNP의 경우, Health2에서의 골강도의 측정은 종골(발꿈치뼈)에 제한되었기 때문에 동등한 메타 분석은 불가능하였다. 그러나, 관련된 4개의 SNP 중 2개(rs7776725, rs1721400)의 경우, KARE GWA에서 골강도와 강하게 연관된 2개 모두(p<2x10-7), 종골 골강도 측정은 일관된 연관성을 나타냈다 (p<0.05). For the four SNPs showing evidence of association in the KARE GWA study of bone strength measurements in the radial or tibia, an equivalent meta-analysis was not possible because the measurement of bone strength in Health2 was limited to the calcaneus (heel bone). However, for two of the four related SNPs (rs7776725, rs1721400), the calcaneal bone strength measurements were consistently correlated (p <0.05) in both KARE GWA and strongly associated with bone strength (p <2 × 10 −7 ).

또한, 검증의 증거를 나타내는 11개의 SNP의 경우, 선형 회귀 모델(linear regression model) 내에서 우도비율검정(likelihood ratio test)을 수행하여 성별(gender)과의 상호작용의 증거를 찾았다. 한 개의 SNP만이 이러한 상호작용의 근소한 증거를 발생시켰지만(rs17249754, 성별: p=3.9x10-3), 검증 샘플에서는 확인되지 않았다. In addition, for 11 SNPs showing evidence of verification, likelihood ratio tests were performed in a linear regression model to find evidence of interaction with gender. Only one SNP generated slight evidence of this interaction (rs17249754, gender: p = 3.9 × 10 −3 ) but was not identified in the validation sample.

체지방지수(BMI); 허리-엉덩이 비율(WHR); 키; 혈압; 맥박; 골강도에 대한 연관분석 결과는 아래와 같다.Retention water (BMI); Waist-hip ratio (WHR); key; Blood pressure; pulse; The correlation analysis results for bone strength are as follows.

가. 체지방지수(end. Stay water ( BMIBMI ))

BMI의 KARE GWA 분석에서, 2개의 SNP가 1단계 역치를 통과하였다. 이들 중, rs17178527은 검증되지 않았다. rs9939609에서 검증된 사실은(p=1.5x10-7, GWA 분석에서 0.335±0.07(kg/m2)의 효과 크기) FTO(체지방 및 비만 연관) 유전자에서 잘 보고된 신호와 일치하였다(표 2). 또한, KARE GWA 데이터는 MC4R (rs17782313, p=1.9x10-4) 및 CTNNBL1 (rs6067731, p=0.02)유전자 근처에서 이미 보고된 BMI 신호의 확증적인 사실을 제공하였다(데이터 나타내지 않음). In BMI's KARE GWA analysis, two SNPs passed the stage 1 threshold. Of these, rs17178527 has not been verified. The facts validated in rs9939609 (p = 1.5x10 -7 , effect size of 0.335 ± 0.07 (kg / m 2 ) in GWA analysis) were consistent with well-reported signals from the FTO (associated body fat and obesity) genes (Table 2). . In addition, the KARE GWA data is MC4R (rs17782313, p = 1.9x10 -4 ) and CTNNBL1 (rs6067731, p = 0.02) provided corroborating facts of already reported BMI signals near the gene (data not shown).

나. 허리-엉덩이 비율(I. Waist-hip ratio ( WHRWHR ))

GWA 분석에 기초하여, 1단계 역치를 통과한 2개의 신호를 검증을 위하여 선택하였다. 이들 중, 염색체 13q21.33에 위치해있는 rs17089410는 검증되지 않았다. 대조적으로, C12orf51 전사체의 45번째 인트론의 염색체 12q24.13에 위치한 rs2074356는 결합된 p값 7.8x10-12 및 -0.007±0.001의 효과 크기를 만드는 강력한 증거의 검증을 나타냈다(표 2, 도 6). C12orf51의 예측된 전사체의 기능은 아직 밝혀지지 않았다. 최대 연관성의 구간은 PTPN11을 포함한 잠재적 관심대상의 다른 유전자들을 포함한다. PTPN11에 의해 코딩된 단백질은 세포성장, 분화, 세포분열주기 및 암 형질전환을 포함한 다양한 세포과정에 관여하는 신호전달 분자로 알려진 단백질 티로신 포스파타제(PTP, protein tyrosine phosphatase) 패밀리의 멤버이다. Based on the GWA analysis, two signals that passed the one-step threshold were selected for verification. Of these, rs17089410 located on chromosome 13q21.33 has not been validated. In contrast, rs2074356, located on chromosome 12q24.13 the 45th intron of the C12orf51 transfer member exhibited a strong evidence of the verification to create the effect size of the associated p-value 7.8x10 -12, and -0.007 ± 0.001 (Table 2, Fig. 6) . The predicted transcript function of C12orf51 is not yet known. The interval of maximal association includes other genes of potential interest, including PTPN11 . Proteins encoded by PTPN11 are members of the protein tyrosine phosphatase (PTP) family known as signaling molecules involved in various cellular processes, including cell growth, differentiation, cell division cycle and cancer transformation.

다. 키All. key

서유럽인 샘플에서 키의 변이에 기여하는 것으로 확인된 몇 개의 서열 변이체들을 GWA 분석에서 관찰하였다(표 2). 이들 중, HMGA1, PLAG1, ZBTB38EFEMP1 근처 또는 그 내부에 있는 SNP가 2단계 데이터 세트에서 검증되었다(전체 combined p값<10-7) (표 2). 결측 예측된 SNP의 분석은 유럽인 혈통 샘플에서 관찰된 첫 번째 신호의 추가 확증 사실을 제공하였다(HMGA2 , CABLES1 , C1orf19 및 히스톤계 1 유전자들 근처에 위치한 것들을 포함)(데이터 나타내지 않음)Several sequence variants that were found to contribute to key variations in Western European samples were observed in GWA analysis (Table 2). Among them, HMGA1 , PLAG1 , ZBTB38 and EFEMP1 SNPs near or within were validated in the two-stage data set (total combined p-value <10 −7 ) (Table 2). Analysis of missing predicted SNPs provided further confirmation of the first signal observed in European lineage samples (including those located near HMGA2 , CABLES1 , C1orf19 and histone family 1 genes) (data not shown).

라. 혈압la. Blood pressure

혈압 표현형(심장수축기 및 심장이완기)의 검증를 위해 선택된 2개의 SNP 중, rs17249754만이 확인되었다. 연관성의 증거는 심장이완기 혈압(combined p=3.0x10-6, GWA 분석에서 -0.882±0.181(mmHg)의 효과 크기) 보다는 심장수축기 혈압(combined p=1.3x10-7, GWA 분석에서 -1.309±0.266(mmHg) 효과크기, 표 2, 도 6)에서 더 강했다. 가장 유력한 지역 후보 유전자는 ATP2B1 (ATPase, Ca++ transporting, plasma membrane 1)인데, 이것의 생성물은 반응주기에서 아스파틸 포스페이트(aspartyl phosphate) 중간체의 형성을 특징으로 하는 P형 일차 이온수송 ATPase 패밀리에 속한다. 이 효소들은 진핵세포에서 매우 큰 농도의 기울기에 대해서 이가 칼슘 이온을 제거하며, 세포내 칼슘 항성성유지에 중요한 역할을 하는 것으로 알려져 있다. ATP2B4의 쥐과 상동유전자의 복사체가 없는 마우스는 ATP2B1의 쥐과 상동유전자의 일 복사체(one copy)의 배경에서만 혈관 표현형(혈관수축 상실)을 나타내는 것으로 보고되었으며, 이는 ATP2B1이 위상성 수축(phasic contraction)의 조절자 유전자좌로서의 역할을 할 수 있다는 것을 제시하고 있으므로, 본 발명자들은 GWA 데이터 세트에서 ATP2B1ATP2B4의 변이체간의 유전자-유전자 상호작용의 증거를 찾았다. 그 결과, ATP21 rs10506974와 ATP2B4의 rs6594013 및 rs12035521이 상호작용함을 발견하였다(각각의 p 값: p=5.8x10-3, p=4.0x10-3)Of the two SNPs selected for the validation of the blood pressure phenotype (cardiac contractile and cardiac diastolic), only rs17249754 was identified. Evidence of the association was -1.309 ± 0.266 in diastolic blood pressure (combined p = 1.3x10 -7 , GWA analysis) rather than cardiac diastolic blood pressure (combined p = 3.0x10 -6 , magnitude of effect of -0.882 ± 0.181 (mmHg) in GWA analysis). (mmHg) effect size, Table 2, Figure 6) was stronger. The most likely local candidate gene is ATP2B1 (ATPase, Ca ++ transporting, plasma membrane 1), whose product is in the P-type primary ion transport ATPase family, characterized by the formation of aspartyl phosphate intermediates in the reaction cycle. Belong. These enzymes are known to play a key role in the maintenance of intracellular calcium starbursts by removing bivalent calcium ions for very large gradients in eukaryotic cells. Mice without a murine homolog of ATP2B4 have been reported to exhibit a vascular phenotype (loss of vasoconstriction) on the background of one copy of the murine homolog of ATP2B1 , indicating that ATP2B1 is responsible for phasic contraction. As it suggests that it can serve as a regulator locus, we have found evidence of gene-gene interactions between variants of ATP2B1 and ATP2B4 in the GWA data set . As a result, Rs10506974 of ATP21 and rs6594013 and rs12035521 of ATP2B4 were found to interact (p values: p = 5.8x10 -3 , p = 4.0x10 -3, respectively ).

마. 맥박hemp. pulse

GWA 분석에 기초하여, 3개의 SNP가 1단계 역치를 통과하였고 검증을 위하여 선택되었다. 이들 중, 2개의 SNP(rs12731740 및 rs12110693)가 2단계 분석에서 방향 일관성 p<0.05에 이르렀다(표 2, 도 6). 이들 신호 중, rs12731740 (p = 2.9x10-9, GWA 분석에서 0.993±0.195(BPM)의 효과크기)은 보체활성화 수용체(RCA, the receptors of complement activation) 유전자 클러스터에 가까운 염색체 1q32.2에 위치한다. 세 유전자 CD46 , C1orf132, 및 CD34가 이 신호 가까이에 위치한다. CD46 이 코딩하는 단백질은 숙주 세포에서 보체 활성화를 보호하는 보조인자로 작용하는 제1형 막 당단백질이다. C1orf132 는 기능이 알려지지 않은 가상의 단백질(hypothetical protein)을 코딩하며, CD34가 코딩하는 단백질은 초기 조혈작용(hematopoiesis)에 관여하고 줄기세포를 골수 세포외 매트릭스 및/또는 기질세포에 부착시키는 것에 관여하는 것으로 알려져 있다. 따라서, 맥박의 변이에 대한 기능적 연결관계는 현 단계에서 아직 명백하지 않은 상태이다. Based on the GWA analysis, three SNPs passed the stage 1 threshold and were selected for verification. Of these, two SNPs (rs12731740 and rs12110693) reached directional coherence p <0.05 in two-step analysis (Table 2, FIG. 6). Of these signals, rs12731740 (p = 2.9x10 -9 , effect size of 0.993 ± 0.195 (BPM) in GWA analysis) is located on chromosome 1q32.2 close to the receptors of complement activation gene cluster (RCA). . Three genes CD46 , C1orf132 , and CD34 are located near this signal. The protein encoded by CD46 is a type 1 membrane glycoprotein that acts as a cofactor to protect complement activation in host cells. C1orf132 encodes a hypothetical protein of unknown function, and the protein encoded by CD34 is involved in early hematopoiesis and in attaching stem cells to the bone marrow extracellular matrix and / or stromal cells. It is known. Thus, the functional link to pulse variation is not yet clear at this stage.

맥박의 두 번째 검증 신호인, rs12110693는 염색체 6q22.31에 위치한다 (p=1.6x10-9, GWA 분석에서 0.573±0.118(BPM)의 효과크기). 상기 SNP에 가까이 위치한 유일한 후보 전사체는 기능이 알려지지 않은 LOC644502이다. rs12110693에서 ~400kb 떨어져 위치한 GJA1 (gap junction protein, alpha 1, 43 kD) 유전자가 보다 잠재적 관련성이 있다. KARE GWA 스캔에서, GJA1의 ~7kb 업스트림(upstream)에 위치한 GJA1가 코딩하는 단백질은 심장의 동시수축에서 기능하는 것으로 잘 알려져 있으며, 심장 간극연접(gap junction)의 주요 구성이다. 최근, 근육-특이적 마이크로RNA가 GJA1를 표적화함으로써 심장 부정맥 유발성 포텐셜을 조절하는 것으로 보고되었다. 또한, GJA1발현 세포의 혼합에 의하여 경색 후 부정맥(post-infarct arrhythmia)이 방지되고, GJA1의 발현 변화에 의하여 스트렙토조토신(streptozotocin) 유도된 당뇨병 레트 심장에서의 심장 박동 방해가 방지된다는 것이 보고되었으며, 이는 심장 박동 유지에 있어서 GJA1의 중요성을 나타낸다. The second verification signal of the pulse, rs12110693, is located on chromosome 6q22.31 (p = 1.6 × 10 −9 , effect size of 0.573 ± 0.118 (BPM) in GWA analysis). The only candidate transcript close to the SNP is LOC644502, whose function is unknown. The GJA1 (gap junction protein, alpha 1, 43 kD) gene, located ~ 400kb away from rs12110693 , is more potentially relevant. In KARE GWA scan, a protein that is encoded in the GJA1 ~ 7kb upstream (upstream) of GJA1 are well-known to function in the simultaneous contraction of the heart, is a major component of cardiac gap junction (gap junction). Recently, muscle-specific microRNAs have been reported to regulate cardiac arrhythmia inducing potential by targeting GJA1 . In addition, it has been reported that post-infarct arrhythmia is prevented by the mixing of GJA1 expressing cells, and heartbeat obstruction is prevented in streptozotocin-induced diabetic rat heart by altered expression of GJA1 . This indicates the importance of GJA1 in maintaining heart rate.

바. bar. 골강도Bone strength

요골(radius) 또는 경골(tibia)에서의 골강도의 KARE GWA 스캔을 통하여 양쪽 모두에서 신호를 나타낸 rs7776725와 함께 1단계 역치를 통과한 5개의 SNP를 검출하였다. 이들 중 2개의 경우, 2단계 샘플에서의 종골(발꿈치뼈, calcaneal) 골강도 측정은 연관성의 방향-일관적 증거를 나타냈다(p<0.05) (표 2, 도 6).KARE GWA scans of bone strength in the radial or tibia detected five SNPs that passed the one-step threshold with rs7776725, which signaled both. In two of these, calcaneal bone strength measurements in the two-stage samples showed direction-consistent evidence of association (p <0.05) (Table 2, Figure 6).

rs7776725는 요골(p=1.0x10-11, KARE에서 0.222±0.033의 효과크기), 및 경골(p=1.6x10-6, KARE에서 0.155±0.032), 및 발뒤꿈치(heel) (p=1.9x10-10, -0.228±0.036 in Health 2)에서 골강도와의 연관성에 대한 가장 강한 증거를 나타냈다. 상기 SNP는 FAM3C(family with sequence similarity 3, member C)의 첫번째 인트론 내의 염색체 7q31.31에 위치한다(표 3). 아래 표 3은 단계 1(GWA)와 단계 2 샘플에서 골강도 관련 형질과의 연관성의 강한 증거를 보여주는 SNP를 나타낸다. rs7776725 is the radius (p = 1.0x10 -11 , effect size of 0.222 ± 0.033 in KARE), and tibia (p = 1.6x10 -6 , 0.155 ± 0.032 in KARE), and heel (p = 1.9x10 − 10 , -0.228 ± 0.036 in Health 2) showed the strongest evidence of association with bone strength. The SNP is located on chromosome 7q31.31 in the first intron of FAM3C (family with sequence similarity 3, member C) (Table 3). Table 3 below shows SNPs showing strong evidence of association with bone strength-related traits in stage 1 (GWA) and stage 2 samples.

Figure 112009023064299-PAT00002
Figure 112009023064299-PAT00002

예측되는 조골세포 단백질로 이미 알려진 FAM3C는 상피세포에서 상피가 중간엽 이행(mesenchymal transition), 종양형성 및 전이(metastasis)에 필요한 신규 사이토카인을 코딩한다. FAM3C , already known as the predicted osteoblast protein, encodes a novel cytokine required for epithelial mesenchymal transition, tumorigenesis and metastasis in epithelial cells.

골강도(bone mineral density)에 대한 두 번째 관심 유전자좌는 염색체 7p14.1 상의 rs1721400을 중심으로 한다. 상기 SNP는 경골(p=1.4x10-7, KARE에서 -0.149±0.028의 효과크기), 요골(p=2.2x10-3, KARE에서 -0.088±0.029) 및 종골(p=6.0x10-4, Health2에서 -0.11±0.032)에서 연관성의 방향일관적 증거가 있다. 아주 가까이 근접해 있는 세 유전자, TXNDC3, SFRP4, EPDR1 중에서, 명백한 후보자는 SFRP4 (secreted frizzled-related protein 4)이다. SFRP 패밀리의 상기 맴버는 프리즐드 단백질(frizzled protein)의 후보 Wnt-결합 부위에 상동성이 있는 시스테인-풍부 도메인(cystein-rich domain)을 포함한다. Wnt 신호전달의 가용성 조절자 역할을 하는 SFRP는 골 형성 및 흡수(resorption)에 관여하는 것으로 잘 알려져 있다. 노화-촉진된 마우스 P6 (SAMP6)에서의 피크 골강도의 QTL 분리 분석은 마우스 ortholog Sfrp4가 SAMP6의 낮은 골강도에 관여한다는 것을 제시하였다. 또한, 트랜스제닉 마우스에서 조골세포-표적화된 Sfrp4의 과발현은 골강도의 감소와 연관되었다. The second locus of interest for bone mineral density is centered on rs1721400 on chromosome 7p14.1. The SNP is tibial (p = 1.4x10 -7 , -0.149 ± 0.028 effect size in KARE), radial (p = 2.2x10 -3 , -0.088 ± 0.029 in KARE) and calcaneus (p = 6.0x10 -4 , Health2 There is direction evidence of association at -0.11 ± 0.032). Of the three genes in close proximity, TXNDC3 , SFRP4 and EPDR1 , the obvious candidate is SFRP4 (secreted frizzled-related protein 4). Said member of the SFRP family includes a cystein-rich domain homologous to the candidate Wnt-binding site of the frizzled protein. SFRP, which acts as a soluble modulator of Wnt signaling, is well known to be involved in bone formation and resorption. QTL separation analysis of peak bone strength in aging-promoted mouse P6 (SAMP6) suggested that mouse ortholog Sfrp4 is involved in low bone strength of SAMP6. In addition, overexpression of osteoblast-targeted Sfrp4 in transgenic mice was associated with a decrease in bone strength.

KARE 프로젝트는 광범위한 양적 형질(quantitative trait)과 제2형당뇨병(T2DM), 이상지질혈증(dyslipidemia), 고혈압(hypertension), 비만(obesity), 및 골다공증(osteoporosis)을 포함한 주요 생의학 관련 생활습관질환에 영향을 미치는 유전 인자를 확인하기 위해서 설계되었다. 본 발명에서, 유전 변이체와 WHR, 골강도, 혈압, 맥박, 키, 및 BMI를 포함한 양적 형질과의 많은 강한 연관성을 성공적으로 확인한 대규모 GWA 및 검증분석(replication analyse)의 결과를 개시하였다. The KARE project covers a wide range of quantitative traits and major biomedical lifestyle-related diseases, including type 2 diabetes (T2DM), dyslipidemia, hypertension, obesity, and osteoporosis. Designed to identify genetic factors that affect In the present invention, the results of large-scale GWA and replication analyses that successfully confirm many strong associations between genetic variants and quantitative traits including WHR, bone strength, blood pressure, pulse, height, and BMI are disclosed.

본 연구는 상기 양적 형질을 표적으로 한 동아시아인 집단에서 수행된 첫 번째 고밀도 대규모 GWA 스캔이다. 예상한 바와 같이, 본 연구는 인종-특이적 감수성 유전자좌)를 반영할 수 있는 다수의 신규 연관성을 밝혔을 뿐만 아니라, 유럽인 형통의 집단에서 이전에 보고된 많은 연관성을 검증하였다. This study is the first high-density large-scale GWA scan performed in East Asian populations that target the quantitative traits. As expected, this study not only revealed a number of new associations that could reflect race-specific susceptibility loci), but also validated many of the previously reported associations in populations of European prosperity.

이전에 보고된 사실과 중복되는 것은 인체측정학 형질(특히, BMI 및 키)의 분석에서 가장 명백했는데, 이는 아마도 이들이 몇몇 대규모 GWA 메타 분석의 초점이 되어왔기 때문이다. 예를 들어, FTO에서의 BMI 연관성은 유럽인에서와 마찬가지로 한국인에서 명백했다. 성인 키에 영향을 미치는 HMGA2와 같은 다른 유전자좌에서, 효과크기 평가(한국인에서 0.27의 베타 vs 유럽인에서 0.48) 및 대립인자 빈도(T "키-성장" 대립인자, 한국인 74%, 유럽인 49%)의 명백한 인종적 차이가 있었다. Overlaps with previously reported facts were most apparent in the analysis of anthropometric traits (particularly BMI and stature), perhaps because they have been the focus of some large GWA meta-analysis. For example, the association of BMI in the FTO was evident in Koreans as well as in Europeans. In other loci, such as HMGA2 , which affect adult height, effect size assessment (0.27 beta in Korean vs 0.48 in European) and allele frequency (T "key-growth" allele, 74% in Korean, 49% in European) There was an obvious racial difference.

KARE 프로젝트에 의해 제공된 유전정보는 전술한 형질의 유전학 기반 관련 새로운 정보를 제공하는 것뿐만 아니라 대규모 세트의 동아시안 집단 기반 대조군으로부터 GWA 데이터를 제공함으로써 한국에 추가 환자군-대조군 (case-control) 연관 연구를 촉진할 수 있다. The genetic information provided by the KARE project provides additional case-control association studies in Korea by providing GWA data from a large set of East Asian population-based controls, as well as providing new information on the genetics of the aforementioned traits. Can promote.

상기한 바와 같이, 본 발명은 허리-엉덩이 비율, 맥박, 혈압, 또는 골강도와 연관된 유전자 단일염기다형성 마커를 제공한다. 상기 마커를 이용하여 비만, 당뇨병, 심장질환, 고혈압, 이상지질혈증 및 골다공증 등의 생활습관질환을 진단 또는 예측할 수 있다. 궁극적으로 상기 질병관련 유전정보를 이용하여 질병발생률을 낮추고 개인별 유전정보를 이용한 맞춤 및 예측의학을 실현할 수 있다. As noted above, the present invention provides genetic monobasic polymorphic markers associated with waist-hip ratio, pulse rate, blood pressure, or bone strength. The markers can be used to diagnose or predict lifestyle diseases such as obesity, diabetes, heart disease, hypertension, dyslipidemia and osteoporosis. Ultimately, the disease-related genetic information may be used to lower the incidence of disease and realize personalized and predictive medicine using individual genetic information.

이하, 본 발명의 구성요소와 기술적 특징을 다음의 실시예들을 통하여 보다 상세하게 설명하고자 한다. 그러나 하기 실시예들은 본 발명의 내용을 예시하는 것일 뿐 발명의 범위가 실시예에 의해 한정되는 것은 아니다. 본 발명에서 인용된 문헌은 본 발명의 명세서에 참조로서 통합된다.Hereinafter, the components and technical features of the present invention will be described in more detail with reference to the following examples. However, the following examples are merely to illustrate the content of the present invention is not limited to the scope of the invention. The documents cited in the present invention are incorporated herein by reference.

실시예Example

실시예Example 1:  One: 피검자군(Subjects)의Of Subjects 선정 selection

GWA 연구를 위한 피검자를 안성(농촌)과 안산(중소도시) 코호트에서 모집하였다. Korean Genome Epidemiology Study (KoGES)의 일환으로, 2001년에 시작되어, 초기 샘플은 40세~69세의 5,018명(안성)과 5,020명(안산)의 참가자를 포함하였다. 본 발명의 전반적인 연구 설계는 도 1과 같다.Subjects were recruited from the Anseong (Rural) and Ansan (Small and Medium City) cohorts for GWA study. As part of the Korean Genome Epidemiology Study (KoGES), which began in 2001, the initial sample included 5,018 (Anseong) and 5,020 (Ansan) participants aged 40 to 69 years. The overall study design of the present invention is shown in FIG.

두 코호트의 샘플링 기반은 대한민국의 수도인 서울에 인접한 경기도 지역에 있다. 두 코호트는 추적 전향 연구(longitudinal prospective study)를 할 수 있도록 설계되었고 동일한 조사 전략을 채택하였다. The sampling base of the two cohorts is located in Gyeonggi Province, adjacent to Seoul, the capital of South Korea. Both cohorts were designed for longitudinal prospective studies and adopted the same research strategy.

2008년에 완료하기로 계획된 3차 팔로우-업 스터디(가족 구성원 포함)와 함께 참가자들을 기준시점 이래 매 2년마다 조사하였다. 260개 이상의 형질이 안성과 안산 코호트 구성원들에 적용한 역학조사, 물리적 시험, 및 실험실 테스트를 통하여 광범위하게 조사되었다. Participants were surveyed every two years since baseline with a third follow-up study (including family members) planned to be completed in 2008. More than 260 traits have been extensively investigated through epidemiological studies, physical tests, and laboratory tests applied to Ansan and Ansan cohort members.

검증연구(replication study )의 피검자는 Health 2 study에 의하여 제공된 두번째 집단-기반 코호트 샘플에서 선택하였다. 본 연구는 한국의 원주, 평창, 강릉, 금산, 및 나주 지역 코호트의 피검자를 통합하며, 안성과 안산 코호트에 채용한 것들과 거의 동일한 양적 형질 측정에 대한 표준을 채용하였다. 이것의 주요한 예외적 사항은 골강도와 관련되는데, Health 2 코호트에서 골강도는 발꿈치뼈 치수와 관련된다(안성과 안산에서 요골과 종골과는 반대로). Health 2 코호트 내의 총 8,500명의 참가자 중에서, 연령(안성/안산, 40-69세)과 부수적 질환 및 약물치료에 대한 정보에 기초한 검증분석을 위해 7861명의 피검자를 선택하였다. Subjects in a replication study were selected from a second population-based cohort sample provided by the Health 2 study. This study integrates subjects from the cohorts of Wonju, Pyeongchang, Gangneung, Geumsan, and Naju regions of Korea, and adopts the same standard for quantitative trait measurement as those employed in Anseong and Ansan cohorts. The main exception to this is bone strength, which in the Health 2 cohort is related to heel bone dimensions (as opposed to radial and calcaneus in Anseong and Ansan). Of a total of 8,500 participants in the Health 2 cohort, 7861 subjects were selected for a validation analysis based on age (anxiety / ansan, 40-69 years old) and information on ancillary diseases and medications.

도 2는 안성과 안산 코호트의 피검자간의 유전적 배경의 비교를 나타낸다. A는 두 코호트의 대립인자 빈도의 차이를 테스트한 MAF 플롯이다. SNP 마커 quality control 후 남은 352,228개의 SNP의 MAF를 안성과 안산 코호트 간에 플롯팅하였다. B는 2-df 로지스틱 회귀 분석으로부터 얻은 검정 통계의 Quantile-Quantile(Q-Q) 플롯이다. 이 플롯은 안성과 안산 코호트의 피검자간 유전자형 빈도의 차를 조사한 것이다. 이 검정에서 지노타이핑 오류 및 낮은 세포 계수의 영향을 감소시키기 위해서, 지노타입 클러스터 플롯의 시각적 검사 후 저조한 클러스터링을 보인 SNP와 함께, 각 코호트에서 간과율(missing rate)>0.05, MAF<0.05, 및 HWE p<10-3인 SNP를 먼저 제외하였다. 그 다음, 0.01≤MAF≤0.05, SNP 간과율=0.01인 SNP를 다시 포함시켜 본 분석을 위한 311,917 SNP의 최종 데이터 세트를 만들었다. 연령 및 성별을 조절하면서 로지스틱 회귀분석을 수행하였다(2-d.f.). Q-Q 플롯에서, 어두운 부분이 95% 농도 띠이다. 측정된 게놈 컨트롤 팽창 인자(genomic control inflation factor)는 1.061이었다. 2 shows a comparison of genetic backgrounds between subjects in Ansan and Ansan cohorts. A is a MAF plot that tested the difference in allele frequencies of two cohorts. MAFs of the remaining 352,228 SNPs after SNP marker quality control were plotted between Ansan and Ansan cohort. B is a Quantile-Quantile (QQ) plot of the test statistics obtained from 2-df logistic regression analysis. This plot examined the differences in genotype frequencies between subjects in Ansan and Ansan cohorts. In order to reduce the effects of genotyping error and low cell count in this assay, each cohort had a missing rate> 0.05, MAF <0.05, and SNP with poor clustering after visual examination of the genotype cluster plot. SNPs with HWE p <10 −3 were excluded first. The final data set of 311,917 SNPs for this analysis was then included by re-incorporation of SNPs with 0.01 ≦ MAF ≦ 0.05 and SNP overpass = 0.01. Logistic regression analysis was performed with control of age and gender (2-df). In the QQ plot, the dark areas are 95% concentration bands. The genomic control inflation factor measured was 1.061.

실시예Example 2:  2: 지노타이핑Zino Typing (( GenotypingGenotyping ) 및 quality controlAnd quality control

안성과 안산 코호트 참여자로부터 추출한 말초혈액으로부터 Affymetrix Genome-Wide Human SNP array 5.0에서 지노타이핑한 대다수의 게놈 DNA를 분리하였다. 지노타이핑을 위한 DNA 샘플이 퇴화 등으로 부적합한 경우, 엡스타인-바 바이러스-불멸화 림프아구양 세포주(Epstein-Barr virus-immortalized lymphoblastoid cell lines, LCL)로 대체하였다. 낮은 농도의 DNA 샘플을 제조업자의 프로토콜(Qiagen Inc., 미국 캘리포니아 발렌시아)에 따라 지노타이핑 전에 증폭시켰다. 세 DNA 소스(source)에 대해서 지노타이핑을 동일하게 수행하였다. 10,004개 샘플 전체를 Affymetrix Genome-Wide Human SNP array 5.0 (Affymetrix, Inc., 미국 캘 리포니아 산타클라라)으로 게놈 DNA 500ng을 이용하여 지노타이핑하였다. BRLMM(Bayesian Robust Linear Modeling using Mahalanobis Distance) 지노타이핑 알고리즘을 500,568개 SNP를 지노타입 콜링(genotype calling)에 사용하였다. 높은 오류 지노타입 call rate(>4%, n=401), 높은 이형접합성(heterozygosity)(>30%, n=11), 성 비일관성(gender inconsistencies) (n=41)을 보인 샘플 및 어떤 종류의 암을 발생시킨 개체에서 얻은 샘플은 계산된 평균 페어와이즈 IBS(identity-by-state) 값이 한국인 형제 샘플의 1도 친척으로부터 평가한 것보다 더 높은 관련 또는 동일한 개체와의 연속 분석에서 배제하였다(>0.80, n=601). 지노타입으로 추측한 성별이 임상기록과 불일치한 샘플은 SNaPshot® Multiplex System (Applied Biosystems, 미국)을 사용하여 성별 확인을 재시험하였다. 이종접합성 및 IBS를 평가하는 방법은 공지되어 있다. 높은 오류 유전자 call rate (>5%), 낮은 MAF (<0.01), 및 하디바인베르크 평형(Hardy-Weinberg equilibrium)으로부터의 현저한 편차(p<1x10-6)를 가진 마커는 8842명 개체에서 조사된 총 352,228개의 마커를 남기고 배제하였다. The majority of genomic DNA genotyped on Affymetrix Genome-Wide Human SNP array 5.0 was isolated from peripheral blood extracted from Ansan and Ansan cohort participants. If the DNA sample for genotyping was inadequate for degeneration or the like, it was replaced with an Epstein-Barr virus-immortalized lymphoblastoid cell lines (LCL). Low concentration DNA samples were amplified prior to genotyping according to the manufacturer's protocol (Qiagen Inc., Valencia, CA, USA). Genotyping was performed identically for all three DNA sources. All 10,004 samples were genotyped using 500 ng of genomic DNA with Affymetrix Genome-Wide Human SNP array 5.0 (Affymetrix, Inc., Santa Clara, Calif.). A Bayesian Robust Linear Modeling using Mahalanobis Distance ( BRLMM) genotyping algorithm was used for genotype calling 500,568 SNPs. Samples and types with high error genotype call rate (> 4%, n = 401), high heterozygosity (> 30%, n = 11), gender inconsistencies (n = 41) Samples from individuals with cancer were excluded from subsequent analysis with related or identical individuals whose calculated mean pairwise identity-by-state (IBS) values were higher than those evaluated from first-degree relatives of Korean sibling samples. (> 0.80, n = 601). Samples whose gender was assumed to be genotype inconsistent with clinical records were retested for gender identification using the SNaPshot ® Multiplex System (Applied Biosystems, USA). Methods for evaluating heterojunction and IBS are known. High genetic fault call rate (> 5%), low MAF (<0.01), and with the Divine Berg equilibrium (Hardy-Weinberg equilibrium) with a significant difference markers (p <1x10 -6) from the 8,842 people surveyed from the object A total of 352,228 markers were left out.

검증연구에서 전체 7861명의 피검자의 지노타이핑은 GWA 스캔 조사에 기초하여 선택된 22개의 가장 강한 신호 중 19개에 대해서 가능했다. TaqManTM 반응을 사용한 대립인자 분리 분석에 의하여 12개의 SNP(rs17178527, rs2074356, rs17089410, rs6918981, rs17038182, rs10513137, rs13273123, rs17249754, rs12731740, rs12110693, rs7776725, 및 rs1721400)을 지노타이핑하였다. 7개의 SNP(rs9939609, rs600130, rs3791675, rs715987, rs11576175, rs9525667, 및 rs550677)를 384개의 복합 SNP 한 세트에서 GoldenGate 어세이에 의하여 지노타이핑하였다(Illumina Inc., 미국). 3개의 SNP (rs2079795, rs41464348, 및 rs6974574)의 경우, 어떤 플랫폼에서도 기능 분석을 설계할 수 없었다. quality control으로서 샘플의 약 1%-2.5%을 중복 지노타이핑하였다. 99% 이상의 중복실험에서의 일치 및 98% 이상의 지노타입 성공율을 만족한 SNP만을 연속되는 연관성 분석에 포함시켰다. In the validation study, genotyping of a total of 7861 subjects was possible for 19 of the 22 strongest signals selected based on the GWA scan survey. Allele separation analysis using the TaqMan reaction gave 12 SNPs (rs17178527, rs2074356, rs17089410, rs6918981, rs17038182, rs10513137, rs13273123, rs17249754, rs12731740, rs12110693, rs7776725, and rs1721400). Seven SNPs (rs9939609, rs600130, rs3791675, rs715987, rs11576175, rs9525667, and rs550677) were genotyped by GoldenGate assays in a set of 384 complex SNPs (Illumina Inc., USA). For three SNPs (rs2079795, rs41464348, and rs6974574), no functional analysis could be designed on any platform. About 1% -2.5% of the sample was duplicated genotyped as a quality control. Only SNPs that matched over 99% duplicates and met 98% genotype success rate were included in the subsequent association analysis.

실시예Example 3: 통계분석 3: Statistical Analysis

3-1. Identity-by-state (IBS) 분석3-1. Identity-by-state (IBS) analysis

근접한 연관균형(linkage equilibrium)에 있는 가지치기한 마커(44724개의 SNP)를 서브세트를 사용하여 개체간의 페어와이즈 IBS를 계산하였다. PLINK 소프트웨어 패키지(http://pngu.mgh.harvard.edu/purcell/plink/) 및 R 통계 패키지(http://r-project.org)를 사용하여 IBS 분석을 수행하였다. 각 개체간 쌍의 계산된 전체 게놈(genome-wide) 평균 IBS를 사용하여 1도 친척 또는 그 집단이 1도 친척에 밀접하게 연결된 더 먼 친척의 관계에 있을 것으로 추정되는 개체를 평가하였다. Pruned IBS between individuals was calculated using a subset of pruned markers (44724 SNPs) in close linkage equilibrium. IBS analysis was performed using the PLINK software package (http://pngu.mgh.harvard.edu/purcell/plink/) and the R statistical package (http://r-project.org). The calculated genome-wide mean IBS of the pair between each individual was used to assess individuals suspected of having a first degree relative or a group of relatives closer to the first degree relative.

3-2. 3-2. QuantileQuantile -- quantilequantile 플롯 Plot

각 양적 형질의 Quantile-quantile(Q-Q) 플롯을 구성하기 위하여 기대되는 p 값의 이론적 분포에 대하여 해당 SNP의 관찰된 p값의 분포를 플롯팅하였다. 모든 Q-Q 플롯에서 점선 내에 있는 농도 띠는 95% 점별 신뢰구간을 나타내며, 무작위 샘플링 및 영가설(null hypothesis) 하에서 p값의 2.5th 및 97.5th 백분위(centiles)을 계산함으로써 도출하였다. 게놈 컨트롤 팽창 인자(genomic control inflation factor) λ는 중앙값 χ2 통계를 0.456으로 나눠서 계산하였다. 본 팽창이 적당하고, MAF, 지노타입 빈도 차이에 대한 Q-Q, MDS 및 PCA의 플롯이 집단 구조가 KARE GWAS 샘플에 대해서 무시할 수 있다는 것을 제시하기 때문에, KARE GWAS 분석에서 게놈 컨트롤을 정정하지 않았다. The distribution of the observed p-values of the corresponding SNPs was plotted against the theoretical distribution of the p-values expected to construct a quantile-quantile (QQ) plot of each quantitative trait. Concentration bands within dotted lines in all QQ plots represent 95% point-by-point confidence intervals and are derived by calculating the 2.5 th and 97.5 th percentiles of the p value under random sampling and null hypothesis. The genomic control inflation factor λ was calculated by dividing the median χ 2 statistic by 0.456. The genomic control was not corrected in the KARE GWAS analysis because this expansion was adequate and the plots of QQ, MDS and PCA for MAF, genotype frequency differences suggested that the population structure could be ignored for KARE GWAS samples.

도 3은 6개의 양적 형질(체지방지수; 허리-엉덩이 비율; 키; 심장수축기 및 심장이완기 혈압; 맥박; 요골 및 경골에서 T 점수로 평가된 골강도)에 대한 Q-Q 플롯을 나타낸다. 각 형질에 대하여 관찰된 P값(y축)을 영분포(null distribution) 하에 기대된 P값과 비교하였다. 점선 사이의 영역은 95% 농도 띠를 나타낸다. FIG. 3 shows a Q-Q plot for six quantitative traits (preventive water; waist-hip ratio; height; cardiac contractile and diastolic blood pressure; pulse; bone strength as assessed by T scores in the radial and tibia). The observed P value (y-axis) for each trait was compared with the expected P value under null distribution. The area between the dashed lines represents a 95% concentration band.

3-3. 3-3. 다차원척도법Multidimensional Scaling (MDS, Multidimensional scaling) 및 주성분분석(PCT, principal component analysis)Multidimensional scaling (MDS) and principal component analysis (PCT)

집단 하부구조의 증거를 찾기 위해서, 모든 KARE 개체 및 HapMap 270 개체 중 44,724개의 SNP 마커를 이용하여 MDS 분석 및 PCA를 수행하였다(도 4). MDS 분석의 경우, 차원(dimension)은 PLINK (http://pngu.mgh.harvard.edu/purcell/plink/) 및 R (http://r-project.org)을 사 용하여 KARE 및 HapMap 그룹의 모든 개체 중에서 identity-by-descent (IBD) 페어와이즈(pairwise) 거리에 기초하여 계산하였다. 첫번째 차원값(dimension value)을 두번째 차원값에 대하여 플롯팅하였다. KARE, 일본인(JPT), 중국인(CHB), 요루반 (YRI), 및 코카시안인(CEU) 그룹의 개체를 첫번째 및 두번째 차원값에 의하여 각각 흑색점, 적색점, 청색점, 녹색점, 및 보라색점으로 플롯팅하였다. KARE 샘플들은 HapMap의 중국인(CHB)과 일본인(JPT) 구성과 클러스터를 이루었다. PCA의 경우, smartpca(EIGENSTRAT 소프트 패키지의 프로그램 모듈 중 하나)에 의하여 얻어진 첫 번째 두 고유벡터(eigenvector)에 기초하여 KARE 및 HapMap 샘플을 플롯팅하였다. KARE, 일본인(JPT), 중국인(CHB), 요루반 (YRI), 및 코카시안인(CEU) 그룹의 개체를 닫힌 청록색 사각형, 열린 핑크 사각형, 청색 별표, 다크 그린 십자가, 및 적색 십자가로 나타냈다. 또한, KARE 샘플들은 HapMap의 중국인(CHB)과 일본인(JPT) 구성과 클러스터를 이루었다.To find evidence of the population infrastructure, MDS analysis and PCA were performed using 44,724 SNP markers from all KARE and HapMap 270 individuals (FIG. 4). In the case of MDS analysis, the dimensions are defined in the KARE and HapMap groups using PLINK (http://pngu.mgh.harvard.edu/purcell/plink/) and R (http://r-project.org). Calculations were based on identity-by-descent (IBD) pairwise distances among all individuals. The first dimension value was plotted against the second dimension value. Individuals of the KARE, Japanese (JPT), Chinese (CHB), Yorban (YRI), and Caucasus (CEU) groups were black, red, blue, green, and Plot with purple dots. KARE samples were clustered with HapMap's Chinese (CHB) and Japanese (JPT) configurations. For PCA, KARE and HapMap samples were plotted based on the first two eigenvectors obtained by smartpca (one of the program modules of the EIGENSTRAT soft package). Individuals of the KARE, Japanese (JPT), Chinese (CHB), Yorban (YRI), and Caucasian (CEU) groups were represented by closed cyan squares, open pink squares, blue asterisks, dark green crosses, and red crosses. In addition, KARE samples were clustered with HapMap's Chinese (CHB) and Japanese (JPT) configurations.

3-4. 3-4. 지노타이핑Zino Typing 클러스터 플롯 Cluster plot

BRLMM 알고리즘을 이용하여 약 200-300개의 샘플의 배치(batch)에서 Affymetrix Genome-Wide Human SNP array 5.0에 대한 지노타입 콜(genotype call)을 결정하였다. 주어진 SNP의 클러스터 플롯을 만들 때, 전체 신호 정보를 프로세싱하여 통합된 요약 파일을 만들었다. 그 후, 요약 파일을 SST1.0 (SNP signal tool, AffymetrixTM)에 유사한 알고리즘에 의해 클러스터 플롯 포맷으로 번역하였 다.(데이터 나타내지 않음) The genotype call for Affymetrix Genome-Wide Human SNP array 5.0 was determined in a batch of about 200-300 samples using the BRLMM algorithm. When creating a cluster plot of a given SNP, the entire signal information was processed to create an integrated summary file. The summary file was then translated into cluster plot format by an algorithm similar to SST1.0 (SNP signal tool, Affymetrix ) (data not shown).

3-5. 연관분석3-5. Association analysis

PLINK (http://pngu.mgh.harvard.edu/~purcell/plink/) 및 SAS 프로그램(version 9.1; SAS institute Inc., Cary, NC, USA)을 사용하여 연관 분석을 수행하였다. 연령, 성별 및 모집지역을 조절한 후 추가 모델(1-d.f.)과의 선형 회귀 분석(linear regression analysis)에 의해 6개의 선택된 양적 형질의 연관성을 시험하였다. 대부분의 형질의 경우, KARE 연구 집단 내에서 원측정(raw measure)은 정상적으로 분포해 있었고 아무런 변환도 필요하지 않았다. 다만, 골강도는 예외였는데, SOS(speed of sound)의 각 측정을 분석 전에 T-점수로 변환하였다. 각 형질 분석의 경우, 잠재적인 형질 값을 변형할 수 있는 약물치료를 받는 피검자를 배제하였다. KARE GWA 및 검증연구 결과를 이종접합성 비교연구를 평가하는 데 사용되는 코크란의 Q 검정(Cochran's Q test)으로 고정된 효과를 추정하는 역분산 메타분석(inverse-variance meta analysis) 방법과 통합하였다. R 프로그램(version 2.7.1)을 사용하여 모든 메타 분석 계산을 수행하였다. Association analysis was performed using PLINK (http://pngu.mgh.harvard.edu/~purcell/plink/) and SAS program (version 9.1; SAS Institute Institute, Cary, NC, USA). After adjusting for age, sex and recruitment area, the association of six selected quantitative traits was tested by linear regression analysis with additional models (1-d.f.). For most traits, raw measures were normally distributed within the KARE study population and no conversion was required. However, except for bone strength, each measurement of speed of sound (SOS) was converted to a T-score before analysis. For each trait assay, subjects who received drug treatment that could modify the potential trait value were excluded. The results of the KARE GWA and validation studies were integrated with an inverse-variance meta analysis method that estimates fixed effects with Cochran's Q test, which is used to evaluate heterogeneous comparative studies. All meta-analysis calculations were performed using the R program (version 2.7.1).

도 5는 1-df 추이 검정에 의하여 6개의 양적형질과 GWA SNP 데이터의 연관성을 조사한 것이다. 추이 검정 p값을 x축의 염색체 위치에 따라 y 축에 -log10(p)로 플롯팅하였다. KARE 연구 집단에서 p<10-5인 SNP들이 안성 및 안산 두 코호트에 연관성(p<10-2)의 증거를 나타내는 경우 적색으로, 증거가 안성 또는 안산에 제한되는 경우 녹색으로 표시하였다. Figure 5 examines the association of GWA SNP data with six quantitative traits by the 1-df trend assay. Trend test p values were plotted on the y axis as -log 10 (p) according to the chromosomal location on the x axis. In the KARE study population, SNPs with p <10 −5 are marked red if they show evidence of association (p <10 −2 ) with both Anshn and Ansan cohorts, and green if the evidence is limited to Anshn or Ansan.

도 6은 본원발명의 양적형질과 강한 연관 증거를 나타내는 6개 SNP의 염색체 상의 신규 유전자좌(loci)를 나타낸다. 상단 패널에서, 추이 검정을 사용한 -log10(p-values)는 가장 강하게 연관된 신호의 측면에 게놈 영역 0.5Mb 에 분포한 SNP를 나타낸다. 흑색 점은 KARE 연구에서 타이핑한 SNP를 나타내고, 회색 점은 그 지노타입이 대치된 SNP를 나타내며, 각 유전자좌의 적색 다이아몬드는 전체 게놈 스캔에서 검출된 가장 강한 신호를 나타내고, 청색 다이아몬드는 검증연구결과를 나타내며, 녹색 다이아몬드는 KARE 및 검증의 통합 분석에서 얻은 결과를 나타낸다. 게놈 위치는 NCBI genome build 36 및 dbSNP build 128에 기초한다. 수직 점선으로 표시된 신호 경계는 가장 강한 신호를 플랭킹하고 있는 재조합 열점(hotspot)을 사용하여 선택하였다. 재조합 열점이 가장 강한 신호를 둘러싼 1 Mb 윈도우 내에 나타나지 않으면, 가장 강한 신호의 측면의 게놈 영역 100kb를 선택하였다. 중간 패널에서, Phase II HapMap으로부터 평가한 재조합율(cM per Mb)은 검은 수직선으로 나타냈다. 1 Mb 게놈 영역을 따라 나타낸 짧은 검은 수평선은 재조합 열점을 나타낸다. 적색 선은 가장 강한 신호로부터의 누적된 유전학적 거리(cM)를 나타낸다. 하단 패널에서 상부 트랙은 각각 엑손과 인트론을 나타내는 적색 상자와 녹색 선으로 공지된 유전자의 위치를 나타낸다. 신호 경계 내의 유전자들을 각 플롯의 상단 왼쪽 부분에 목록화하였다. 유전정보는 NCBI build 36에서 입수하였다. 하단 패널의 하부 트랙은 28종의 척추동물에서의 서열 보존을 나타낸다. 청색 상자는 높 이 보존된 영역을 나타낸다(UCSC hg18에서 얻은 phastCons 정보에 기초하여 서열 보존 점수≥0.6). 본 발명에서 설명하는 6개의 신호를 통하여 신호 경계 내에서 유전자를 기능적으로 동정하였다.Figure 6 shows a novel loci on the chromosome of six SNPs showing strong association evidence with the quantitative traits of the present invention. In the top panel, -log 10 (p-values) using the trend test shows the SNP distributed in the genomic region 0.5 Mb on the side of the most strongly associated signal. Black dots represent SNPs typed in the KARE study, gray dots represent SNPs whose genotypes have been substituted, red diamonds at each locus represent the strongest signal detected in the entire genome scan, and blue diamonds represent validation studies. Green diamonds represent the results obtained from the integrated analysis of KARE and validation. Genomic location is based on NCBI genome build 36 and dbSNP build 128. Signal boundaries, indicated by vertical dashed lines, were selected using recombinant hotspots flanking the strongest signal. If the recombinant hotspot did not appear within the 1 Mb window surrounding the strongest signal, 100 kb of genomic region flanking the strongest signal was selected. In the middle panel, the recombination rate (cM per Mb) evaluated from the Phase II HapMap is shown as black vertical lines. Short black horizontal lines along the 1 Mb genomic region indicate recombinant hotspots. The red line represents the accumulated genetic distance (cM) from the strongest signal. The top track in the bottom panel shows the location of genes known as red boxes and green lines representing exons and introns, respectively. The genes within the signal boundary are listed in the upper left portion of each plot. Genetic information was obtained from NCBI build 36. The bottom track of the bottom panel shows sequence conservation in 28 vertebrates. Blue boxes indicate areas that were highly conserved (sequence conservation score ≧ 0.6 based on phastCons information obtained from UCSC hg18). Through the six signals described in the present invention, genes were functionally identified within the signal boundary.

3-6. SNP 3-6. SNP 결측치Missing value 예측(imputation) Prediction

IMPUTE 프로그램을 이용하여 SNP 결측치 예측을 수행하였다. NCBI build 36 및 dbSNP build 126에 기초하여, 본 발명자들은 3.99 백만개 SNP(HapMap release 22)를 포함하는 기준 패널로서 HapMap에서 JPT 및 CHB 창설자로부터 90명의 개체를 사용하였다. MAF<0.01 및 SNP 간과율(missing rate)>0.05인 SNP를 제거한 후, 나머지 1.8 백만개의 결측치 예측된 SNP를 선택된 양적 형질과의 연관 분석을 위하여 직접 타이핑한 KARE SNP와 통합하였다. SNPTEST 프로그램으로 결측치 예측된 SNP의 연관분석을 수행하였다. SNP missing value predictions were performed using the IMPUTE program. Based on NCBI build 36 and dbSNP build 126, we used 90 individuals from JPT and CHB founders in HapMap as a reference panel containing 3.99 million SNPs (HapMap release 22). After removing SNPs with MAF <0.01 and SNP missing rate> 0.05, the remaining 1.8 million missing predicted SNPs were integrated with the directly typed KARE SNPs for association analysis with the selected quantitative trait. Association analysis of missing predicted SNPs was performed with the SNPTEST program.

실시예Example 4: 심혈관 질환 진단 또는 예측용 단일염기다형성  4: monobasic polymorphism for diagnosing or predicting cardiovascular disease 키트Kit

본 발명에서는 혈압(blood pressure)과 연관된 단일염기다형성 rs17249754을 포함하는, 심혈관 질환 진단 또는 예측용 키트를 제조하였다. 상기 실시예 2에 설명되어 있는 방법을 이용하여 심혈관 질환 발병 또는 발병 가능성을 진단 또는 예측하고자 하는 대상의 혈액으로부터 게놈 DNA를 분리하고, 형광 표지시켰다. 2X SSC로 상기 제조된 SNP 마커와 형광 표지된 게놈 DNA의 혼성화를 42℃에서 4시간 동안 수행하였다. 상기 대상이 본 발명에 따른 SNP 전부 또는 일부를 갖고 있는지 를 확인함으로써, 심혈관 질환의 발병 가능성 예측 및 심혈관 질환에 대한 감수성을 측정하였다.In the present invention, a kit for diagnosing or predicting a cardiovascular disease including a single nucleotide polymorphism rs17249754 associated with blood pressure was prepared. Genomic DNA was isolated and fluorescently labeled from blood of a subject to diagnose or predict cardiovascular disease onset or likelihood using the method described in Example 2 above. Hybridization of the SNP markers prepared above and fluorescently labeled genomic DNA with 2 × SSC was performed at 42 ° C. for 4 hours. By confirming whether the subject has all or part of the SNP according to the present invention, the predictability of the onset of cardiovascular disease and the sensitivity to cardiovascular disease were measured.

지금까지 예시적인 실시 태양을 참조하여 본 발명을 기술하여 왔지만, 본 발명의 속하는 기술 분야의 당업자는 본 발명의 범주를 벗어나지 않고서도 다양한 변화를 실시할 수 있으며 그의 요소들을 등가물로 대체할 수 있음을 알 수 있을 것이다. 또한, 본 발명의 본질적인 범주를 벗어나지 않고서도 많은 변형을 실시하여 특정 상황 및 재료를 본 발명의 교시내용에 채용할 수 있다. 따라서, 본 발명이 본 발명을 실시하는데 계획된 최상의 양식으로서 개시된 특정 실시 태양으로 국한되는 것이 아니며, 본 발명이 첨부된 특허청구의 범위에 속하는 모든 실시 태양을 포함하는 것으로 해석되어야 한다. While the present invention has been described with reference to exemplary embodiments, it will be understood by those skilled in the art that various changes may be made and equivalents may be substituted for elements thereof without departing from the scope of the invention. You will know. In addition, many modifications may be made to adapt a particular situation and material to the teachings of the invention without departing from the essential scope thereof. Accordingly, it is intended that the invention not be limited to the particular embodiment disclosed as the best mode contemplated for carrying out this invention, but that the invention be construed as including all embodiments falling within the scope of the appended claims.

도 1은 한국인 유전체 역학조사의 전반적인 연구 설계를 도시한 것이다. Figure 1 shows the overall study design of the Korean genome epidemiological investigation.

도 2는 안성과 안산 코호트의 피검자 간의 유전적 배경을 비교한 것이다. Figure 2 compares the genetic background between the Ansan and Ansan cohort subjects.

도 3은 6개의 양적 형질에 대한 Q-Q(Quantile-Quantile) 플롯을 도시한 것이다. (BMI, 체질량지수; WHR, 허리-엉덩이 비율; SBP, 수축기 혈압/ DBP, 이완기 혈압; BD-RT, 요골에서의 골강도, BD-TT, 경골에서의 골강도).FIG. 3 shows a Qant-Quantile (Q-Q) plot for six quantitative traits. (BMI, Body Mass Index; WHR, Waist to Hip Ratio; SBP, Systolic Blood Pressure / DBP, Diastolic Blood Pressure; BD-RT, Bone Strength in Radius, BD-TT, Bone Strength in Tibia).

도 4는 다차원척도법(MDS, Multidimensional scaling) 및 주성분분석(PCA, principal component analysis) 결과를 도시한 것이다.FIG. 4 illustrates the results of multidimensional scaling (MDS) and principal component analysis (PCA).

도 5는 6개의 양적 형질에 대한 전체 유전체 스캔(Genome-wide scan) 결과를 도시한 것이다. 5 shows the results of a genome-wide scan of six quantitative traits.

도 6은 강한 연관 증거를 보여주는 6개 SNP의 신규 유전자좌를 도시한 것이다. 6 depicts the novel loci of six SNPs showing strong association evidence.

Claims (5)

단일염기다형성 rs17249754로 구성된, 혈압(blood pressure)과 연관되어 있음을 특징으로 하는 단일염기다형성 마커.Monobasic polymorphism A monobasic polymorphic marker consisting of rs17249754, which is associated with blood pressure. 제1항에 있어서, The method of claim 1, 동맥경화증, 고혈압, 심장병, 비만 또는 당뇨병을 진단 또는 예측함을 특징으로 하는 단일염기다형성 마커.A single nucleotide polymorphism marker characterized by diagnosing or predicting atherosclerosis, hypertension, heart disease, obesity or diabetes. 단일염기다형성 rs17249754을 포함하는, 동맥경화증, 고혈압, 심장병, 비만 또는 당뇨병 진단 또는 예측용 키트.A kit for diagnosing or predicting atherosclerosis, high blood pressure, heart disease, obesity or diabetes, comprising monobasic polymorphism rs17249754. 개체로부터 수득한 DNA에서 단일염기다형성 rs17249754을 확인하여 혈압(blood pressure)과 연관된 단일염기다형성 정보를 제공하는 방법. A method for identifying monobasic polymorphism rs17249754 in DNA obtained from an individual to provide monobasic polymorphism information associated with blood pressure. 제4항에 있어서, The method of claim 4, wherein 동맥경화증, 고혈압, 심장병, 비만 또는 당뇨병을 진단 또는 예측함을 특징으로 하는, 혈압과 연관된 단일염기다형성 정보를 제공하는 방법.A method for providing monobasic polymorphism information associated with blood pressure, characterized by diagnosing or predicting atherosclerosis, hypertension, heart disease, obesity or diabetes.
KR1020090033240A 2009-04-16 2009-04-16 Method of providing the information of single nucleotide polymorphism associated with blood pressure KR101120420B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090033240A KR101120420B1 (en) 2009-04-16 2009-04-16 Method of providing the information of single nucleotide polymorphism associated with blood pressure

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090033240A KR101120420B1 (en) 2009-04-16 2009-04-16 Method of providing the information of single nucleotide polymorphism associated with blood pressure

Publications (2)

Publication Number Publication Date
KR20100114721A true KR20100114721A (en) 2010-10-26
KR101120420B1 KR101120420B1 (en) 2012-07-09

Family

ID=43133825

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090033240A KR101120420B1 (en) 2009-04-16 2009-04-16 Method of providing the information of single nucleotide polymorphism associated with blood pressure

Country Status (1)

Country Link
KR (1) KR101120420B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101382397B1 (en) * 2011-12-27 2014-04-09 대한민국 Method of providing the information of single nucleotide polymorphism associated with high density lipoprotein
KR101382399B1 (en) * 2011-12-27 2014-04-09 대한민국 Method of providing the information of single nucleotide polymorphism associated with liver enzymes

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101382397B1 (en) * 2011-12-27 2014-04-09 대한민국 Method of providing the information of single nucleotide polymorphism associated with high density lipoprotein
KR101382399B1 (en) * 2011-12-27 2014-04-09 대한민국 Method of providing the information of single nucleotide polymorphism associated with liver enzymes

Also Published As

Publication number Publication date
KR101120420B1 (en) 2012-07-09

Similar Documents

Publication Publication Date Title
Cho et al. A large-scale genome-wide association study of Asian populations uncovers genetic factors influencing eight quantitative traits
Kayser et al. Three genome-wide association studies and a linkage analysis identify HERC2 as a human iris color gene
Ponomarenko et al. Candidate genes for age at menarche are associated with endometriosis
Middleton et al. Gene expression analysis of peripheral blood leukocytes from discordant sib‐pairs with schizophrenia and bipolar disorder reveals points of convergence between genetic and functional genomic approaches
US7160683B2 (en) Method of testing for bronchial asthma
Zhang et al. Genetic implication of a novel thiamine transporter in human hypertension
Zheng et al. Insights into the genetics of osteoporosis from recent genome-wide association studies
Lei et al. Genome-wide association scan for stature in Chinese: evidence for ethnic specific loci
AU2007274720B2 (en) Method for prognosing osteoporosis phenotypes
KR101120420B1 (en) Method of providing the information of single nucleotide polymorphism associated with blood pressure
KR101110877B1 (en) Method of providing the information of single nucleotide polymorphism associated with waist-hip ratio
CN103525899A (en) Type 2 diabetes susceptibility genetic locus as well as detection method and kit thereof
Metrustry et al. Variants close to NTRK2 gene are associated with birth weight in female twins
JPWO2012017867A1 (en) Test method for mental illness, test kit for psychiatric disease, and evaluation method for therapeutic and / or prophylactic agent for mental illness
Hai et al. Bivariate genome-wide association study suggests that the DARC gene influences lean body mass and age at menarche
KR101102269B1 (en) Method of providing the information of single nucleotide polymorphism associated with bone density
KR101102270B1 (en) Method of providing the information of single nucleotide polymorphism associated with bone density
KR101120423B1 (en) Method of providing the information of single nucleotide polymorphism associated with pulse rate
CN103421798A (en) TECTA mutant gene related to autosomal dominant nonsyndromic deafness of Mongolian family
US20130096178A1 (en) Genetic markers for paget&#39;s disease
Urano et al. Identification of non-synonymous polymorphisms in the WDSOF1 gene as novel susceptibility markers for low bone mineral density in Japanese postmenopausal women
Wei et al. Genotype-phenotype relationship and follow-up analysis of a chinese cohort with osteogenesis imperfecta
Ding et al. Identification of linkage disequilibrium SNPs from a Kidney-yang deficiency syndrome pedigree
Mocci et al. Microsatellites and SNPs linkage analysis in a Sardinian genetic isolate confirms several essential hypertension loci previously identified in different populations
CN111041086B (en) SNP site susceptible to RPL13 gene congenital heart disease and application thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant