KR20230117871A - rs7779989 marker composition for diagnosing cerebral aneurysm and method of use thereof - Google Patents

rs7779989 marker composition for diagnosing cerebral aneurysm and method of use thereof Download PDF

Info

Publication number
KR20230117871A
KR20230117871A KR1020220014153A KR20220014153A KR20230117871A KR 20230117871 A KR20230117871 A KR 20230117871A KR 1020220014153 A KR1020220014153 A KR 1020220014153A KR 20220014153 A KR20220014153 A KR 20220014153A KR 20230117871 A KR20230117871 A KR 20230117871A
Authority
KR
South Korea
Prior art keywords
snp
cerebral aneurysm
diagnosing
composition
snps
Prior art date
Application number
KR1020220014153A
Other languages
Korean (ko)
Inventor
전진평
홍은표
김봉준
윤동혁
Original Assignee
한림대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한림대학교 산학협력단 filed Critical 한림대학교 산학협력단
Priority to KR1020220014153A priority Critical patent/KR20230117871A/en
Publication of KR20230117871A publication Critical patent/KR20230117871A/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

본 발명은 유전자형 교정 및 고처리량의 대체를 통해 업데이트된 IA GWAS를 구축하고 뇌동맥류 발병과 가장 유의한 관련성을 갖는 6종 SNP를 발굴하여 뇌동맥류 진단을 위한 SNP 마커로 제공한다. 본 발명의 SNP 마커는 높은 신뢰도를 갖는 뇌동맥류 진단 결과를 제공할 수 있으며, 뇌동맥류의 조기 진단을 통해 발병의 예방과 빠른 처치가 가능하게 할 수 있다.The present invention constructs an updated IA GWAS through genotype correction and high-throughput replacement, discovers six SNPs most significantly associated with the occurrence of cerebral aneurysm, and provides them as SNP markers for cerebral aneurysm diagnosis. The SNP marker of the present invention can provide highly reliable diagnostic results of cerebral aneurysms, and can enable prevention of onset and rapid treatment through early diagnosis of cerebral aneurysms.

Description

뇌동맥류 진단용 rs7779989 마커 조성물 및 이의 이용 {rs7779989 marker composition for diagnosing cerebral aneurysm and method of use thereof}rs7779989 marker composition for diagnosing cerebral aneurysm and its use

본 발명은 대한민국 보건복지부(과제번호: HR21C0198)와 한림연구기금의 지원을 받아 한국보건산업진흥원(KHIDI)을 통한 한국보건기술 R&D 사업의 지원으로 완성되었다.The present invention was completed with the support of the Korea Health Technology R&D project through the Korea Health Industry Development Institute (KHIDI) with the support of the Ministry of Health and Welfare of the Republic of Korea (Task number: HR21C0198) and the Hanlim Research Fund.

본 발명은 뇌동맥류 진단을 위한 바이오마커로서 rs7779989 SNP 마커 및 이를 포함하는 6종의 SNP를 발굴하여 개체의 뇌동맥류 발병가능성을 미리 진단할 수 있도록 상기 SNP의 용도를 제공하는 것이다. The present invention provides the use of the rs7779989 SNP marker and six SNPs including the rs7779989 marker as biomarkers for diagnosing cerebral aneurysm so as to diagnose the possibility of developing a cerebral aneurysm in advance in an individual.

개인 맞춤의학의 등장으로 유전자 분석 기술에 대한 관심이 높아지고 있다. 한편, 개인별 유전자의 단일염기다형성(Single Nucleotide Polymorphisms; SNPs)이란, DNA 염기서열에서 하나의 염기서열(A,T,G,C)의 차이를 보이는 유전적 변화 또는 변이를 의미하는 것으로, 단일 염기 다형현상은 각 개인마다 많은 변이를 보이는 부분이므로 DNA 지문 분석에 주로 이용된다. SNP는 개인의 현재 특정 질병을 진단하고 합병증의 발생을 예측하며 미래 질병의 발병 가능성을 예측하는 데 이용될 수 있다. 최근 생물정보학 분석의 발달로 많은 양의 임상 및 게놈 데이터를 처리하고 복잡한 표현형을 가진 질병을 연구할 수 있게 되었으며, 뇌혈관질환을 비롯한 복합질환에 대한 유전자 분석이 증가하고 있다.With the advent of personalized medicine, interest in genetic analysis technology is increasing. On the other hand, Single Nucleotide Polymorphisms (SNPs) of individual genes refer to genetic changes or mutations that show a difference in one nucleotide sequence (A, T, G, C) in a DNA nucleotide sequence. Polymorphism is a part that shows a lot of variation in each individual, so it is mainly used in DNA fingerprint analysis. SNPs can be used to diagnose an individual's current specific disease, predict the occurrence of complications, and predict the likelihood of developing future diseases. The recent development of bioinformatics analysis has made it possible to process large amounts of clinical and genomic data and study diseases with complex phenotypes, and genetic analysis for complex diseases including cerebrovascular diseases is increasing.

뇌동맥류(Intracranial aneurysm; IA)는 대뇌 혈관의 국소 풍선 팽창을 나타낸다. 혈관이 파열되지 않은 IA는 일반적으로 무증상이지만 파열되면 발작 후 1개월 이내에 최대 50%의 사망률을 나타낸다. 이에, IA 발병 가능성이 높거나 혈관 파열 가능성이 높은 환자의 특성을 확인하기 위해 많은 연구가 진행중에 있다. 2010년 이후로 해외에서는 IA와 관련된 인과적 변이를 확인하기 위한 IA의 유전적 연구 수행되었다. 기존의 국내 연구는 후향적 연구 설계에 대한 단순 임상적 요인 분석만을 수행하는 한계가 있었으나, 후보유전자의 SNP에 대한 단순 분석, 전장유전체연관분석(Genome-Wide Association Study; GWAS), 전체 게놈 연관(whole-genome association), 차세대 염기서열 분석(next-generation sequencing; NGS) 및 가능한 원인 변이의 기능으로 연구가 확대되고 있다. Intracranial aneurysm (IA) represents a focal balloon dilatation of a cerebral blood vessel. IA in which a vessel has not ruptured is usually asymptomatic, but if it ruptures, it has a mortality rate of up to 50% within 1 month after the attack. Accordingly, many studies are being conducted to identify the characteristics of patients with a high possibility of developing IA or a high possibility of vascular rupture. Since 2010, genetic studies of IA have been conducted abroad to identify causal variations related to IA. Existing domestic studies had limitations in performing only simple clinical factor analysis for retrospective study design, but simple analysis of candidate gene SNPs, Genome-Wide Association Study (GWAS), whole genome association ( Research is expanding into functions of whole-genome association, next-generation sequencing (NGS), and possible causal variants.

유전자 분석 결과는 인종에 따라 다를 수 있으며, 한국인에 대한 결과도 동북아 국가인 중국, 일본과 다를 수 있다. 예를들어, lysyl oxidase(LOX) 유전자에 위치한 rs3900446의 C 대립유전자는 한국인에서 IA 위험과 관련이 있는 것으로 알려져 있지만 일본 코호트 결과 IA와 LOX 유전자의 대립형질 또는 일배체형은 연관성이 없는 것으로 확인되었다. 따라서 질병과 관련된 SNP 발굴 연구에 있어 인종은 필수적으로 고려되어야 할 요인이다. Genetic analysis results may differ depending on race, and results for Koreans may also differ from those of China and Japan, which are Northeast Asian countries. For example, the C allele of rs3900446 located in the lysyl oxidase (LOX) gene is known to be associated with the risk of IA in Koreans, but a Japanese cohort confirmed no association between IA and the LOX gene allele or haplotype. Therefore, race is an essential factor to be considered in disease-related SNP discovery research.

2019년 1781명의 동북아시아인을 기반으로 한 게놈 참조 패널(A genome-reference panel)이 공개되었다. 백인(Caucasians) 기반의 1000개 게놈 프로젝트 컨소시엄의 참조 패널과 비교하여, 동북아 인구에 대한 강력한 전가 참조 패널(imputation reference panel)은 보다 개선된 결측값 대체 정확도(imputation accuracy)와 낮은 빈도의 변이를 나타내었다. A genome-reference panel based on 1781 Northeast Asians was published in 2019. Compared to the reference panel of the 1000 Genomes Project Consortium based on Caucasians, the robust imputation reference panel for Northeast Asian populations showed better imputation accuracy and lower frequency variants. was

본 발명자들은 이전의 IA GWAS에서 한국인의 결측값 대체(imputation)가 없는 문제를 해결하기 위해 업데이트된 GWAS를 수행하여 유전자형 교정 및 high-throughput imputation 후 IA 감수성 변이를 식별하여 IA와 유관한 총 6종의 SNP를 발굴하여 본 발명을 완성하였다. In order to solve the problem of no missing value imputation for Koreans in the previous IA GWAS, the present inventors performed an updated GWAS to identify IA susceptibility variants after genotype correction and high-throughput imputation, resulting in a total of 6 species related to IA. The present invention was completed by discovering SNPs of .

1. Yoo SK, Kim CU, Kim HL, Kim S, Shin JY, Kim N, et al. Nard: Whole-genome reference panel of 1779 northeast asians improves imputation accuracy of rare and low-frequency variants. Genome Med. 2019;11:641. Yoo SK, Kim CU, Kim HL, Kim S, Shin JY, Kim N, et al. Nard: Whole-genome reference panel of 1779 northeast asians improves imputation accuracy of rare and low-frequency variants. Genome Med. 2019;11:64 2. Genomes Project C, Auton A, Brooks LD, Durbin RM, Garrison EP, Kang HM, et al. A global reference for human genetic variation. Nature. 2015;526:68-742. Genomes Project C, Auton A, Brooks LD, Durbin RM, Garrison EP, Kang HM, et al. A global reference for human genetic variation. Nature. 2015;526:68-74

본 발명자들은 한국인을 대상으로 하는 첫번째 IA GWAS를 기반으로 뇌동맥류와 연관이 있는 단일염기다형성(Single Nucleotide Polymorphisms; SNPs) 후보군을 선정하고, 상기 GWAS 유전정보 데이터를 유전자형 교정 및 high-throughput imputation을 수행하여 업데이트된 GWAS 데이터를 기반으로 상기 SNP 후보군 중에서 최종적으로 한국인에서 뇌동맥류에 대하여 감수성을 갖는 SNP를 확보하여 본 발명을 완성하였다. Based on the first IA GWAS targeting Koreans, the present inventors selected single nucleotide polymorphisms (SNPs) candidates associated with cerebral aneurysms, and performed genotype correction and high-throughput imputation on the GWAS genetic information data. Based on the updated GWAS data, the present invention was completed by finally securing a SNP having susceptibility to cerebral aneurysms in Koreans among the SNP candidates.

이에, 본 발명이 이루고자 하는 기술적 과제는 뇌동맥류 진단을 위한 SNP 마커를 제공하고, 상기 SNP 마커를 검출할 수 있는 제제를 이용한 뇌동맥류 진단용 조성물 및 키트를 제공하는 것이다. Accordingly, a technical problem to be achieved by the present invention is to provide a SNP marker for diagnosing a cerebral aneurysm, and to provide a composition and kit for diagnosing a cerebral aneurysm using an agent capable of detecting the SNP marker.

또한, 본 발명은 개체의 생물학적 시료로부터 상기 SNP를 검출하여 뇌동맥류 진단을 위한 정보제공방법을 제공하고자 한다.In addition, the present invention is intended to provide an information providing method for diagnosing a cerebral aneurysm by detecting the SNP from a biological sample of an individual.

그러나 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당해 기술분야의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.However, the technical problem to be achieved by the present invention is not limited to the above-mentioned problems, and other problems not mentioned will be clearly understood by those skilled in the art from the description below.

상기 과제를 해결하기 위하여, 본 발명은 뇌동맥류를 진단하기 위한 rs7779989 SNP 마커를 제공한다. 상기 SNP는 서열번호 3에서 나타난 염기 서열에 포함되는 것일 수 있다.In order to solve the above problems, the present invention provides an rs7779989 SNP marker for diagnosing cerebral aneurysms. The SNP may be included in the nucleotide sequence shown in SEQ ID NO: 3.

또한, 본 발명은 뇌동맥류를 진단하기 위한 SNP 마커로서 rs3120004, rs1522095, rs12935558, rs3826442, 및 rs2440154에서 이루어진 군으로부터 선택된 어느 하나 이상의 SNP를 검출할 수 있는 제제를 더 포함할 수 있다. 일례로, 뇌동맥류를 진단하기 위한 SNP 마커로서 rs3120004, rs1522095, rs7779989, rs12935558, rs3826442 및 rs2440154을 모두 제공하는 것일 수 있다.In addition, the present invention may further include an agent capable of detecting any one or more SNPs selected from the group consisting of rs3120004, rs1522095, rs12935558, rs3826442, and rs2440154 as SNP markers for diagnosing cerebral aneurysm. For example, rs3120004, rs1522095, rs7779989, rs12935558, rs3826442, and rs2440154 may all be provided as SNP markers for diagnosing cerebral aneurysms.

또한, 본 발명은 상기 SNP 중에서 선택되는 1종 이상의 SNP를 검출할 수 있는 제제를 포함하는 뇌동맥류 진단용 조성물 및 진단용 키트를 제공한다.In addition, the present invention provides a composition for diagnosing cerebral aneurysms and a kit for diagnosing cerebral aneurysm, including an agent capable of detecting one or more SNPs selected from the above SNPs.

본 발명의 일 구현예로서, 상기 SNP 마커 조성물은 한국인 또는 아시아인을 대상으로 뇌동맥류를 진단하기 위한 것일 수 있다. As an embodiment of the present invention, the SNP marker composition may be used to diagnose cerebral aneurysms in Koreans or Asians.

본 발명의 다른 구현예로서, 상기 SNP를 검출할 수 있는 제제는 상기 SNP가 위치하는 유전체 영역에서, 상기 SNP를 포함하는 8-50개의 연속된 염기서열 또는 이와 상보적인 염기서열을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 프로브 또는 프라이머이거나, 상기 폴리뉴클레오티드를 증폭할 수 있도록 상기 유전체에서 SNP의 위치를 기준으로 ± 4~100의 연속된 염기서열과 상보적인 8-20bp 길이의 프라이머일 수 있다.In another embodiment of the present invention, the agent capable of detecting the SNP is a polynucleotide having 8-50 consecutive base sequences including the SNP or a base sequence complementary thereto in the genome region where the SNP is located. It may be a probe or primer that specifically binds, or a primer with a length of 8-20 bp that is complementary to a continuous nucleotide sequence of ± 4 to 100 based on the position of the SNP in the genome so as to amplify the polynucleotide.

본 발명의 또 다른 구현예로서, 상기 SNP를 검출할 수 있는 제제는 rs3120004 위치에서 티민(Thymine)을 검출할 수 있거나, rs1522095 위치에서 구아닌(Guanine)을 검출할 수 있거나, rs7779989 위치에서 구아닌을 검출할 수 있거나, rs12935558 위치에서 아데닌(Adenine)을 검출할 수 있거나, rs3826442 위치에서 티민을 검출할 수 있거나, rs2440154 위치에서 구아닌을 검출할 수 있는 것일 수 있다.As another embodiment of the present invention, the agent capable of detecting the SNP can detect thymine at position rs3120004, detect guanine at position rs1522095, or detect guanine at position rs7779989 can be detected at position rs12935558, adenine can be detected at position rs3826442, or guanine can be detected at position rs2440154.

또한, 본 발명은 하기 단계를 포함하는 뇌동맥류 진단방법 내지 진단을 위한 정보제공방법을 제공한다:In addition, the present invention provides a method for diagnosing a cerebral aneurysm or a method for providing information for diagnosis, which includes the following steps:

(1) 개체의 생물학적 시료를 준비하는 단계;(1) preparing a biological sample from the subject;

(2) 상기 생물학적 시료로부터 게놈(genomic) DNA를 얻는 단계;(2) obtaining genomic DNA from the biological sample;

(3) 상기 게놈 DNA에서 GenBank SNP database rs3120004, rs1522095, rs7779989, rs12935558, rs3826442, 및 rs2440154로 이루어진 군으로부터 선택되는 어느 하나 이상의 단일염기다형성 위치의 염기 타입을 검출하는 단계; 및(3) detecting a base type of one or more single nucleotide polymorphism positions selected from the group consisting of GenBank SNP database rs3120004, rs1522095, rs7779989, rs12935558, rs3826442, and rs2440154 in the genomic DNA; and

(4) 상기 검출한 염기 타입으로부터 개체의 뇌동맥류 발병 위험도 및/또는 발병 감수성을 결정하는 단계.(4) determining the risk and/or susceptibility of developing a cerebral aneurysm of the subject from the detected base type.

본 발명의 일 구현예로서, 상기 (1) 단계의 개체는 뇌동맥류 발병 가능성 예측이 요구되는 인간이라면 제한되지 아니하나, 바람직하게는 한국인 또는 아시아인일 수 있다. As one embodiment of the present invention, the subject in step (1) is not limited as long as it is a human for whom prediction of the possibility of developing a cerebral aneurysm is required, but may preferably be Korean or Asian.

본 발명의 다른 구현예로서, 상기 생물학적 시료는 개체로부터 분리되어 게놈 DNA를 포함하는 것이라면 제한되지 아니하나, 간이한 비침습적 진단을 위하여 바람직하게는 혈액일 수 있다. As another embodiment of the present invention, the biological sample is not limited as long as it is isolated from an individual and includes genomic DNA, but may be preferably blood for simple non-invasive diagnosis.

본 발명의 또 다른 구현예로서, 상기 (3) 단계의 염기 타입 검출은 시퀀싱(sequencing), 마이크로 어레이에 의한 혼성화(microarray hybridization), 대립유전자 특이적인 PCR(allele specific PCR), 다이나믹 대립유전자 혼성화 기법(dynamic allele-specific hybridization; DASH), 형광 융해 곡선 기법(Fluorescence Melting Curve Analysis; FMCA) 및 Taqman 기법으로 이루어진 군으로부터 선택되는 어느 한나 이상의 방법을 이용하여 수행될 수 있다. As another embodiment of the present invention, the base type detection in step (3) is performed by sequencing, microarray hybridization, allele specific PCR, and dynamic allele hybridization techniques. It may be performed using one or more methods selected from the group consisting of (dynamic allele-specific hybridization; DASH), fluorescence melting curve analysis (FMCA), and Taqman technique.

본 발명의 또 다른 구현예로서, 상기 진단방법 내지 정보제공방법은 (3) 단계에서 rs3120004 위치의 염기 타입이 티민으로 검출되거나, rs1522095 위치의 염기 타입이 구아닌으로 검출되거나, rs7779989 위치의 염기 타입이 구아닌으로 검출되거나, rs12935558 위치의 염기 타입이 아데닌으로 검출되거나, rs3826442 위치의 염기 타입이 티민으로 검출되거나, rs2440154 위치의 염기 타입이 구아닌으로 검출되는 경우, (4) 단계의 개체는 뇌동맥류 발병 위험도 및/또는 발병 감수성이 높은 것으로 판정할 수 있다. As another embodiment of the present invention, in step (3), the base type at position rs3120004 is detected as thymine, the base type at position rs1522095 is detected as guanine, or the base type at position rs7779989 is detected as thymine. When detected as guanine, when the base type at position rs12935558 is detected as adenine, when the base type at position rs3826442 is detected as thymine, or when the base type at position rs2440154 is detected as guanine, the subject in step (4) is at risk of developing a cerebral aneurysm And/or it can be determined that the disease susceptibility is high.

본 발명은 유전자형 교정 및 결측값 대체를 통해, 한국인을 대상으로 하는 업데이트된 IA GWAS 유전정보 데이터를 기반으로 뇌동맥류에 감수성을 갖는 SNP를 제공할 수 있다. 그 결과, 높은 신뢰도를 갖는 뇌동맥류 진단 결과를 제공할 수 있으며, 뇌동맥류의 조기 진단을 통해 발병의 예방과 빠른 처치가 가능하도록 하는 장점이 있다. The present invention can provide SNPs susceptible to cerebral aneurysms based on updated IA GWAS genetic information data targeting Koreans through genotype correction and missing value replacement. As a result, it is possible to provide a diagnosis result of a cerebral aneurysm with high reliability, and has an advantage of enabling prevention of onset and rapid treatment through early diagnosis of a cerebral aneurysm.

도 1은 Axiom™Genotyping Array에 의해 권장되는 유전자형 교정 프로토콜이다. Axiom™Analysis Suite v1.1.1, Applied Biosystems™ (APT) v1.18, 및 SNPolisher™module of R package v3.0. APT를 통해 실행되는 각 단계에 사용된 모든 명령은 적절한 QC 메트릭스를 생성하였다. 3단계 및 5단계의 샘플 필터링은 SNPolisher™module에 의해 구현되는 R script로 수행하였다.
도 2는 뇌동맥류에 대한 업데이트된 GWAS 구축을 위한 방법과 각 단계에서 도출된 결과를 요약한 모식도이다. 도 2에서 R 2은 imputation score를 의미하고, GCR은 genotype call rate의 약자이며, MAF은 소수 대립유전자 빈도(minor allele frequency)를 의미하고, HWE p는 Hardy-Weinberg equilibrium p-value를 의미한다.
도 3(A)는 1000 Genome(1KG) reference panel(Phase 3 version 5)에서 546명의 한국 성인과 2,504명의 피험자의 multi-dimensional scaled principal component(MDS PC)의 플롯이다. K는 1KG reference panel에서 2,504명의 피험자를 나타낸다(유럽인 수 = 503[빨간색 원], 히스패닉 또는 혼혈 미국인 = 347[주황색 원], 아프리카인 = 661[회색 원], 동아시아인 = 504[진녹색]). 빨간색 원은 패널 A에서 문자 "H"로 표시된 한국 성인의 영역을 나타낸다.
도 3(B)는 MDS PC에서 한국 성인 546명의 MDS PC 플롯이다. 한국 성인 546명 중 PC1과 PC2 사이의 유전적 가계 클러스터는 1KG 참조 패널의 504명의 동아시아인 대상과 비교할 때 546명의 성인의 우수한 분산을 나타낸다.
도 3(C)는 250명의 환자 및 296명의 대조군의 뇌동맥류에 대한 GWAS 맨해튼 플롯이다. X축과 Y축은 각각 염색체 수와 -log10으로 변환된 p값을 나타낸다. 빨간색 하위 라인은 게놈 전체의 유의성 임계값을 나타낸다(p = 5×10-8).
도 4는 본 발명의 rs3120004(1q31.2) SNP ± 500kb 영역의 지역 연관 플롯으로,삼각형 또는 역삼각형은 각각 양의 효과 크기와 음의 효과 크기를 나타내며, 각 색상은 pairwise LD을 나타내고, 보라색 위쪽 삼각형은 IA 형성과 가장 중요한 연관성을 나타낸다.
도 5는 본 발명의 rs1522095(4q12) SNP ± 500kb 영역의 지역 연관 플롯으로, 삼각형 또는 역삼각형은 각각 양의 효과 크기와 음의 효과 크기를 나타내며, 각 색상은 pairwise LD을 나타내고, 보라색 위쪽 삼각형은 IA 형성과 가장 중요한 연관성을 나타낸다.
도 6은 본 발명의 rs7779989(7p15.3) SNP ± 500kb 영역의 지역 연관 플롯으로,삼각형 또는 역삼각형은 각각 양의 효과 크기와 음의 효과 크기를 나타내며, 각 색상은 pairwise LD을 나타내고, 보라색 위쪽 삼각형은 IA 형성과 가장 중요한 연관성을 나타낸다.
도 7은 본 발명의 rs12935558(18q) SNP ± 500kb 영역의 지역 연관 플롯으로, 삼각형 또는 역삼각형은 각각 양의 효과 크기와 음의 효과 크기를 나타내며, 각 색상은 pairwise LD을 나타내고, 보라색 위쪽 삼각형은 IA 형성과 가장 중요한 연관성을 나타낸다.
도 8은 본 발명의 rs3826442(17p13.1) SNP ± 500kb 영역의 지역 연관 플롯으로, 삼각형 또는 역삼각형은 각각 양의 효과 크기와 음의 효과 크기를 나타내며, 각 색상은 pairwise LD을 나타내고, 보라색 위쪽 삼각형은 IA 형성과 가장 중요한 연관성을 나타낸다.
도 9는 본 발명의 rs2440154(17p11.2) SNP ± 500kb 영역의 지역 연관 플롯으로, 삼각형 또는 역삼각형은 각각 양의 효과 크기와 음의 효과 크기를 나타내며, 각 색상은 pairwise LD을 나타내고, 보라색 위쪽 삼각형은 IA 형성과 가장 중요한 연관성을 나타낸다.
Figure 1 is the genotyping protocol recommended by the Axiom™ Genotyping Array. Axiom™ Analysis Suite v1.1.1, Applied Biosystems™ (APT) v1.18, and SNPolisher™ module of R package v3.0. All commands used for each step executed through APT generated appropriate QC metrics. Sample filtering in steps 3 and 5 was performed with R script implemented by SNPolisher™ module.
Figure 2 is a schematic diagram summarizing the method for constructing the updated GWAS for cerebral aneurysms and the results derived from each step. In Figure 2, R 2 means imputation score, GCR is an abbreviation for genotype call rate, MAF means minor allele frequency, and HWE p means Hardy-Weinberg equilibrium p-value.
Figure 3(A) is a plot of the multi-dimensional scaled principal component (MDS PC) of 546 Korean adults and 2,504 subjects in the 1000 Genome (1KG) reference panel (Phase 3 version 5). K represents 2,504 subjects from the 1KG reference panel (number of Europeans = 503 [red circles], Hispanic or mixed-race Americans = 347 [orange circles], Africans = 661 [gray circles], East Asians = 504 [dark green]). Red circles indicate regions of Korean adults marked with the letter “H” in panel A.
Figure 3 (B) is a MDS PC plot of 546 Korean adults in MDS PC. Among 546 Korean adults, the genetic pedigree cluster between PC1 and PC2 indicates superior variance of 546 adults compared to 504 East Asian subjects in the 1KG reference panel.
3(C) is a GWAS Manhattan plot for cerebral aneurysms in 250 patients and 296 controls. The X-axis and Y-axis represent the number of chromosomes and the p-value converted to -log10, respectively. The red lower line represents the genome-wide significance threshold (p = 5×10 -8 ).
Figure 4 is a regional association plot of the rs3120004 (1q31.2) SNP ± 500 kb region of the present invention, a triangle or inverted triangle represents a positive effect size and a negative effect size, respectively, each color represents pairwise LD, and the upper purple Triangles represent the most significant associations with IA formation.
Figure 5 is a regional association plot of the rs1522095 (4q12) SNP ± 500 kb region of the present invention, triangles or inverted triangles represent positive and negative effect sizes, respectively, each color represents pairwise LD, and the purple upper triangle represents It represents the most important association with IA formation.
Figure 6 is a regional association plot of the rs7779989 (7p15.3) SNP ± 500 kb region of the present invention, triangles or inverted triangles represent positive and negative effect sizes, respectively, each color represents pairwise LD, and the upper purple Triangles represent the most significant associations with IA formation.
Figure 7 is a regional association plot of the rs12935558 (18q) SNP ± 500 kb region of the present invention, triangles or inverted triangles represent positive and negative effect sizes, respectively, each color represents pairwise LD, and the purple upper triangle represents It represents the most important association with IA formation.
8 is a regional association plot of the rs3826442 (17p13.1) SNP ± 500 kb region of the present invention, triangles or inverted triangles represent positive effect sizes and negative effect sizes, respectively, each color represents pairwise LD, and the upper purple Triangles represent the most significant associations with IA formation.
Figure 9 is a regional association plot of the rs2440154 (17p11.2) SNP ± 500 kb region of the present invention, triangles or inverted triangles represent positive and negative effect sizes, respectively, each color represents pairwise LD, and the upper purple Triangles represent the most significant associations with IA formation.

유럽, 일본, 중국과 달리 한국인을 대상으로 하는 뇌동맥류(IA)에 대한 유전적 연구는 부족한 실정이다. 본 발명자들은 한국인을 대상으로 하는 최초의 GWAS보다 유전자형 교정 및 대체를 통해 업데이트된 GWAS를 구축하고 이를 기반으로 뇌동맥류의 발병 가능성을 예측할 수 있는 최종 6종 SNP를 발굴하여 본 발명을 완성하였다. Unlike Europe, Japan, and China, genetic studies on cerebral aneurysm (IA) targeting Koreans are lacking. The present inventors completed the present invention by constructing an updated GWAS through genotype correction and replacement rather than the first GWAS targeting Koreans, and discovering the final six SNPs that can predict the onset of cerebral aneurysm based on this.

구체적으로, 본 발명자들은 250명의 IA 환자와 296명의 건강한 대조군의 유전정보 데이터를 이용하여 임상변수와 4가지 주요성분분석(PCA) 값으로 조정하고 SNP 및 유전자형 결측값의 고처리량 대체(high-throughput imputation)를 수행하였다. imputation R 2 score of ≥ 0.5의 총 73,33,746개 사이트 중에서 6,105,212개의 SNP가 분석되었으며, genome-wide significant threshold(p = 5×10-8)에 도달한 총 38개 SNP를 선별하였으며, pairwise LD(linkage disequilibrium)(r 2 < 0.8)에 의한 가지치기 기법(pruning) 수행 후 11개의 SNP가 일관되게 IA와 관련성을 나타냄을 확인하였다. 나아가 rs3120004, rs1851347, rs1522095, rs7779989, rs12935558, rs3826442, 및 rs2440154의 6개 표지된 SNP는 강하게 LD tower를 갖는 일배체형(haplotype) 구조를 형성하며, 특히 rs3120004는 LOC440704RGS18 유전자 사이에 1q31.2(OR = 2.34, 95% CI: 1.74-3.14; p = 1.4×10-8) 위치에서 크고 강하게 일배체형 구조를 형성함을 확인하였다. rs2440154 SNP는 IA 발병 위험 증가와 가장 높은 관련성을 나타내었으며, rs3826442(MYH13, 17p13.1)을 포함하는 영역은 약 70 cM/Mbp.의 높은 재조합 비율을 나타냄을 확인하였다. Specifically, the present inventors used the genetic information data of 250 IA patients and 296 healthy controls, adjusted clinical variables and four principal component analysis (PCA) values, and performed high-throughput replacement of SNPs and genotype missing values. imputation) was performed. Among a total of 73,33,746 sites with an imputation R 2 score of ≥ 0.5, 6,105,212 SNPs were analyzed, and a total of 38 SNPs that reached a genome-wide significant threshold ( p = 5 × 10 -8 ) were selected, and pairwise LD ( After performing pruning by linkage disequilibrium (r 2 < 0.8), it was confirmed that 11 SNPs consistently showed association with IA. Furthermore, the six labeled SNPs of rs3120004, rs1851347, rs1522095, rs7779989, rs12935558, rs3826442, and rs2440154 form a haplotype structure with a strong LD tower. In particular, rs3120004 has LOC440704 and R 1q31.2( OR = 2.34, 95% CI: 1.74-3.14; p = 1.4 × 10 -8) It was confirmed that a large and strong haplotype structure was formed at the position. The rs2440154 SNP showed the highest correlation with the increased risk of IA, and it was confirmed that the region including rs3826442 ( MYH13 , 17p13.1) showed a high recombination rate of about 70 cM/Mbp.

상기로부터, 본 발명자들은 고처리량 대체(high-throughput imputation) 접근법을 사용한 업데이트된 GWAS로부터 한국인에서 IA와 관련된 11개의 새로운 SNP를 도출하였으며, SNP 중에서 일배체형 구조를 구성하는 6종 SNP(rs3120004, rs1522095, rs7779989, rs12935558, rs3826442 및 rs2440154)를 IA 진단을 위한 최종 SNP 마커로 선정하였다. 상기 최종 SNP 마커 중에서 rs2440154(SLC47A1, 17p11.2)가 IA의 발생과 가장 강하게 관련된다.From the above, the present inventors derived 11 new SNPs related to IA in Koreans from the updated GWAS using a high-throughput imputation approach, and among the SNPs, 6 SNPs constituting the haplotype structure (rs3120004, rs1522095 , rs7779989, rs12935558, rs3826442 and rs2440154) were selected as the final SNP markers for diagnosis of IA. Among the final SNP markers, rs2440154 ( SLC47A1 , 17p11.2) is most strongly associated with the occurrence of IA.

이에, 본 발명은 상기 6종 SNP를 IA 진단을 위한 바이오마커로 제공한다. Accordingly, the present invention provides the six SNPs as biomarkers for diagnosing IA.

본 발명의 IA 진단용 바이오마커의 구체적인 정보는 하기 표 1에 나타내었다. Specific information of the biomarkers for diagnosis of IA of the present invention is shown in Table 1 below.

서열
번호
order
number
유전자gene 염색체chromosome SNPSNPs PositionPosition P-valueP-value SNP 염기서열 정보
(염기서열위치[] 표기)
SNP sequence information
(Location of base sequence [] notation)
1One LOC440704, RGS18LOC440704, RGS18 1q31.21q31.2 rs3120004rs3120004 191221672191221672 1.4E-081.4E-08 AAGTATTTGGTAAAATTCAGCAGTAAATTCACCAGGTCCTTGGCTATTCTTTGATGGGAGACATTTTATTCATAGTTCTATCTTGTTACTTAATATTGAT[C/T]GATTCAGGTTTTATATTTCTTCATGGTTCATTCTTGGTAGGTGGTATGTGTTTAGAAATTTATCCATTACCTCTAAGTTTTCAAATTTAGTGGTACATAGAAGTATTTGGTAAAATTCAGCAGTAAATTCACCAGGTCCTTGGCTATTCTTTGATGGGAGACATTTTATTCATAGTTCTATCTTGTTACTTAATATTGAT[C/T]GATTCAGGTTTTATATTTCTTCATGGTTCATTCTTGGTAGGTGGTATGTGTTTAGAAATTTATCCATTACCTCTAAGTTTTCAAATTTAGTGGTACATAG 22 LOC101928851, NONELOC101928851, NONE 4q124q12 rs1522095rs1522095 5922270359222703 2.6E-092.6E-09 TCCCTAAAAAGGGAGAAATTACAAACATTTTTTCCTAGAAATGGAGAGGACATAATATTTAATGCTATTCTGATGGCTTTGCATTGAAATTGGTCAAGCT[A/G]ACTAGGCTGAGATTATTTTCCAAAATTTTCTTTCAAGTTACAGTGGGACACAAGAGAAATTCTTGTGTGAGTTTTGGAGGGCAGAGGTGATACTCATACTTCCCTAAAAAGGGAGAAATTACAAACATTTTTTCCTAGAAATGGAGAGGACATAATATTTAATGCTATTCTGATGGCTTTGCATTGAAATTGGTCAAGCT[A/G]ACTAGGCTGAGATTATTTTCCAAAATTTTCTTTCAAGTTACAGTGGGACACAAGAAATTCTTGTGTGAGTTTTGGAGGGCAGAGGTGATACTCATACT 33 LINC01162, SP4LINC01162, SP4 7p15.37p15.3 rs7779989rs7779989 2126598421265984 4.6E-094.6E-09 TTCTGCTCTTTGAACCCATCTCTCCAGGTTGAAACCATCTTGGCAAAGTATTATCAGCCGGTGTCTTCGGCTAGATGGACCTTTCAAGCCCTCCTAAGGT[A/G]AGAAAATGTTATTTTTCCCTTTTATGTGTTGTGGTTCATTGGATAGTATTTGTCATCTTGTCACATAATAGGAATGACGTTCACAATGTTGAAATACGCCTTCTGCTCTTTGAACCCATCTCTCCAGGTTGAAACCATCTTGGCAAAGTATTATCAGCCGGTGTCTTCGGCTAGATGGACCTTTCAAGCCCTCCTAAGGT[A/G]AGAAAATGTTATTTTTCCCTTTTATGTGTTGTGGTTCATTGGATAGTATTTGTCATCTTGTCACATAATAGGAATGACGTTCACAATGTTGAAATACGCC 44 LOC101928880, ZNF469LOC101928880, ZNF469 16q24.216q24.2 rs12935558rs12935558 8833697888336978 2.6E-082.6E-08 CAAGGTAACAATTCACTTCATCCCATGTATCATTGCATAAGTTCTCCTGGGCCCCGTTGGCTGGGGACGTGGACACGTGTGATTTCTGCTCTGCACCCTC[G/A]CCAGCGCTGTTCTTTCCAGTGGGCCTTTCCAGCCGGGATCCTGCCCACTTCCTTGTGCCCAGCTTTCCAGAGCCCCTCAGCCCCTCCAAGGGCCCACCACAAGGTAACAATTCACTTCATCCCATGTATCATTGCATAAGTTCTCCTGGGCCCCGTTGGCTGGGGACGTGGACACGTGTGATTTCTGCTCTGCACCCTC[G/A]CCAGCGCTGTTCTTTCCAGTGGGCCTTTCCAGCCGGGATCCTGCCCACTTCCTTGTGCCCAGCTTTCCAGAGCCCCTCAGCCCCTCCAAGGGCCCACCA 55 MYH13MYH13 17p13.117p13.1 rs3826442rs3826442 1022770810227708 3.1E-093.1E-09 TTGATTGGCCTCTTTGAAAATGCTACAAAGAAAGGGTATCACCCTCTAAAAGCTTATTATCTACACCTAAGCCAAGAAATGGGTCATGCACACACATGCA[C/T]GCACATGTGCACACACTGCACACACACGTGTACATAAACTTAGATATCACCCATAAACACATTTTTTCTTTTTAGATGGAGTTTCTCTCTGTGGCCCAGGTTGATTGGCCTCTTTGAAAATGCTACAAAGAAAGGGTATCACCCTCTAAAAGCTTATTATCTACACCTAAGCCAAGAAATGGGTCATGCACACACATGCA[C/T]GCACATGTGCACACACTGCACACACACGTGTACATAAACTTAGATATCACCCATAAACACATTTTTTCTTTTTAGATGGAGTTTCTCTCTGTGGCCCAGG 66 SLC47A1SLC47A1 17p11.217p11.2 rs2440154rs2440154 1944498719444987 8.2E-108.2E-10 AGGCGTTCAGCAGGCCTGTAATGTTTCACCCTGAGAGTCCGGATCCCGCTGGGACTCCAAGTGGACGATCTCATCGCTACCTCCAGCTCCTCCTGTCTAC[A/G]GACTTCCTTGCTGGAATGTGTTCTTGTTGTTGAAGGCTGTATTCTCTCCAGTCCTCACTAGGAATCTTGGATAACAAGGGGGTTATCCCAGAAGGCAGCCAGGCGTTCAGCAGGCCTGTAATGTTTCACCCTGAGAGTCCGGATCCCGCTGGGACTCCAAGTGGACGATCTCATCGCTACCTCCAGCTCCTCCTGTCTAC[A/G]GACTTCCTTGCTGGAATGTGTTCTTGTTGTTGAAGGCTGTATTCTCTCCAGTCCTCACTAGGAATCTTGGATAACAAGGGGGTTATCCCAGAAGGCAGCC

IA 발병과 가장 강한 관련성을 나타낸 rs2440154 SNP는 SLC47A1 유전자 상에 위치하며, SLC47A1 유전자는 solute carrier family 47 member 1로 불리우며 담즙과 소변을 통한 유기 양이온의 ATP 유출에 관여하여 약물 반응 및 독성과 관련이 있는 것으로 알려져 있으나, 뇌혈관 질환의 발병과의 관련성에 대해서는 알려진 바가 없다. The rs2440154 SNP, which showed the strongest association with the onset of IA, is located on the SLC47A1 gene , which is called solute carrier family 47 member 1 and is involved in ATP efflux of organic cations through bile and urine, which is related to drug response and toxicity. However, the association with the onset of cerebrovascular disease has not been known.

한편, 일배체형(Haplotype) 분석은 SNP와 표현형과의 연관성을 보다 강하게 보장한다. 같은 블록 내의 유전자형은 함께 유전되는 경향이 있기 때문에 LD가 발생하는데 일배체형은 상대적으로 유전되는 인접 유전자좌들의 조합을 포함하여 LD 값이 높을 수록 질병 연관 가능성이 높음을 의미한다. 본 발명의 6종 SNP 마커는 모두 일배체형 구조를 나타내었으며, 그 중에서 rs3120004는 0.8 이상의 높은 LD로 크고 강한 일배체형 구조를 나타내었다. 또한, rs3826442는 이를 둘러싸고 있는 영역에서 높은 재조합률을 보여 다음 세대로의 유전 가능성을 시사한다. On the other hand, haplotype analysis ensures a stronger association between SNPs and phenotypes. Since genotypes within the same block tend to be inherited together, LD occurs. Haplotypes include a combination of adjacent loci that are relatively inherited, and the higher the LD value, the higher the possibility of disease association. All six SNP markers of the present invention showed a haplotype structure, and among them, rs3120004 showed a large and strong haplotype structure with a high LD of 0.8 or more. In addition, rs3826442 showed a high recombination rate in the region surrounding it, suggesting heritability to the next generation.

본 발명은 종래의 한국인 대상의 IA GWAS 결과에서 동북아 인구를 기반으로 한 대체(imputation)을 추가하여 통계적 검정력을 향상시켰으며, 1000명 이상의 뇌혈관 질환 환자를 통합한 유전자형 교정을 수행하여 결측값의 수를 감소시켰고, 본 발명의 6종 SNP는 pairwise LD 구축하에서 높은 확률로 다음 세대로 유전됨을 알 수 있다.The present invention improved statistical power by adding an imputation based on the Northeast Asian population to the conventional IA GWAS results of Korean subjects, and performed genotyping correction integrating more than 1000 cerebrovascular disease patients to eliminate missing values. The number was reduced, and it can be seen that the six SNPs of the present invention are inherited to the next generation with high probability under pairwise LD construction.

본 명세서에서 "다형성"이라는 용어는 군집 내에서 변하는 유전자의 서열에서의 배치를 지칭한다. 다형성은 상이한 "대립유전자"로 구성된다. 이러한 다형성의 배치는 유전자에서의 그의 위치 및 그에서 발견되는 상이한 아미노산 또는 염기에 의해 확인될 수 있다. 이러한 아미노산 변이는 2개의 상이한 대립유전자인, 2개의 가능한 변이체 염기, C 및 T의 결과이다. 유전자형은 2개의 다른 별개의 대립유전자로 구성되기 때문에, 여러 가능한 변이체 중 임의의 변이체가 어느 한 개체에서 관찰될 수 있다(예를 들어, 이 예에서, CC, CT 또는 TT). 개개의 다형성은 또한 당업자에게 공지되어 있고, 예를 들면, NCBI 웹사이트 상에서 이용가능한 뉴클레오타이드 염기 변이의 단일 뉴클레오타이드 다형성 데이터베이스(Single Nucleotide Polymorphism Database(dbSNP) of Nucleotide Sequence Variation)에서 사용되는 것인, 지정된 독특한 식별자("기준 SNP", "refSNP" 또는 "rs#")일 수 있다. The term "polymorphism" as used herein refers to the placement in sequence of genes that vary within a population. A polymorphism consists of different “alleles”. The placement of these polymorphisms can be identified by their position in the gene and the different amino acids or bases found therein. This amino acid variation is the result of two different alleles, two possible variant bases, C and T. Since the genotype consists of two distinct alleles, any one of several possible variants may be observed in any one individual (eg CC, CT or TT in this example). Individual polymorphisms are also known to those skilled in the art and are designated unique, such as those used in, for example, the Single Nucleotide Polymorphism Database (dbSNP) of Nucleotide Sequence Variation available on the NCBI website. It can be an identifier ("reference SNP", "refSNP" or "rs#").

본 명세서에서 "유전적 다형성(genetic polymorphism)"은 하나의 유전자 좌위(locus)에 두가지 이상의 대립 유전자(allele)가 존재하는 경우를 말하며, 인구집단에서 적어도 1% 이상의 빈도로 유전자 변이가 나타나는 경우를 말한다. DNA에 서 한 개의 뉴클레오타이드의 삽입, 소실, 또는 치환이 일어나는 것을 단일염기다형성(single nucleotide polymorphism, SNP) 이라고 한다.As used herein, "genetic polymorphism" refers to the case in which two or more alleles exist in one locus, and the case in which a genetic mutation occurs at a frequency of at least 1% or more in a population say The insertion, deletion, or substitution of a single nucleotide in DNA is called a single nucleotide polymorphism (SNP).

본 명세서에서 "단일염기다형성(single nucleotide polymorphism, SNP)"은 게놈에서 단일염기(A, T, C 또는 G)가 종의 멤버들 간 또는 한 개체(individual)의 쌍 염색체 간에 다른 경우에 발생하는 DNA 서열의 다양성을 의미한다. 예를 들어, 서로 다른 개체의 세 개의 DNA 단편들(예: AAGT[A/A]AG, AAGT[A/G]AG,AAGT[G/G]AG)처럼 단일염기에서 차이를 포함하는 경우, 두 개의 대립 유전자(C 또는 T)라고 부르며, 일반적으로 거의 모든 SNPs는 두 개의 대립 유전자를 가진다. 한 집단(population)내에서, SNP는 소수 대립인자 빈도(minor allele frequency, MAF; 특정 집단에서 발견되는 유전자위치(locus)에서 가장 낮은 대립인자 빈도)로 할당될 수 있다. 단일염기는 폴리뉴클레오타이드 서열에 변화(대체), 제거(결실) 또는 첨가(삽입)될 수 있다. SNP는 번역 프레임의 변화를 유발할 수 있다.As used herein, "single nucleotide polymorphism (SNP)" refers to a single nucleotide (A, T, C, or G) in the genome that occurs when members of a species or paired chromosomes of an individual differ. Diversity of DNA sequences. For example, if it contains a difference in a single base, such as three DNA fragments from different individuals (e.g., AAGT[A/A]AG, AAGT[A/G]AG, AAGT[G/G]AG), They are called two alleles (C or T), and generally almost all SNPs have two alleles. Within a population, a SNP can be assigned a minor allele frequency (MAF; the lowest allele frequency at a locus found in a particular population). A single base may be changed (replaced), removed (deleted), or added (inserted) to a polynucleotide sequence. SNPs can cause changes in the translational frame.

한편 본 명세서에서 유전자의 변이를 표기할 때 [염기일문자/염기일문자]는 좌측에 쓰인 염기일문자가 우측에 쓰인 염기일문자로 치환되는 것을 의미한다. On the other hand, when expressing the mutation of a gene in this specification, [base one letter/base one letter] means that the base one letter written on the left is replaced with the base one letter written on the right .

본 명세서에서 “폴리뉴클레오티드(polynucleotide)”또는 “핵산”은 단일-또는 이중-가닥의 형태로 된 데옥시리보뉴클레오티드(DNA) 또는 리보뉴클레오티드(RNA)를 말한다. 다른 제한이 없는한, 자연적으로 생성되는 뉴클레오티드와 비슷한 방법으로 핵산에 혼성화되는 자연적 뉴클레오티드의 공지된 아날로그도 포함된다. 일반적으로 DNA는 아데닌(adenine, A), 구아닌(guanine, G), 사이토신(cytosine, C), 티민(thymine, T) 등 네 가지 염기로 구성되어 있으며, RNA는 티민 대신 우라실(Uracil, U)을 가지고 있다. 핵산 이중 가닥에서 A는 T 또는 U, C는 G 염기와 수소결합을 이루는데, 이러한 염기의 관계를 '상보적(complementary)'이라고 한다. 한편, 본 명세서에서 '폴리뉴클레오티드'는 다른 언급이 없으면 본 발명의 SNP가 위치하는 유전체 영역에서 상기 SNP를 포함하는 8~100 개의 연속된 염기서열을 갖는 폴리뉴클레오티드를 의미한다. As used herein, “polynucleotide” or “nucleic acid” refers to deoxyribonucleotides (DNA) or ribonucleotides (RNA) in single- or double-stranded form. Unless otherwise limited, known analogs of natural nucleotides that hybridize to nucleic acids in a manner similar to naturally occurring nucleotides are also included. In general, DNA is composed of four bases: adenine (A), guanine (G), cytosine (C), and thymine (T), and RNA uses uracil (U) instead of thymine. ) has In a nucleic acid duplex, A forms a hydrogen bond with T or U, and C with G base, and the relationship between these bases is called 'complementary'. On the other hand, in the present specification, 'polynucleotide' means a polynucleotide having 8 to 100 consecutive nucleotide sequences including the SNP in the genome region where the SNP of the present invention is located, unless otherwise specified.

본 명세서에서 “게놈 DNA(genomic DNA: gDNA)”는 한 개체의 유전자의 총 염기서열로서, 거의 완전한 유전정보를 포함하고 있는 DNA를 의미한다.In the present specification, “genomic DNA (gDNA)” refers to DNA containing almost complete genetic information as a total nucleotide sequence of a gene of an individual.

한편, 뇌동맥류(Intracranial aneurysm: IA)란 뇌에 혈액을 공급하는 뇌동맥 일부가 약해져서 그 부분이 풍선이나 꽈리처럼 부풀어 오르는 질환을 의미한다. On the other hand, intracranial aneurysm (IA) refers to a disease in which a part of a cerebral artery supplying blood to the brain is weakened and the part swells like a balloon or a balloon.

본 명세서에서 “진단”은 질병 발생의 예측 및 발병 위험도(risk) 또는 발병 감수성(susceptibility)를 결정하거나 도출하는데 사용되는 모든 유형의 분석을 포함한다.As used herein, "diagnosis" includes any type of analysis used to predict the occurrence of a disease and to determine or derive a risk or susceptibility to develop a disease.

본 명세서에서 "개체"란 뇌동맥류의 발병 가능성 예측 등의 진단이 필요한 포유류라면 제한되지 아니하나, 특히 유전적 소인에 의해 뇌동맥류 발병이 우려되는 개체일 수 있다. In the present specification, the term "individual" is not limited to any mammal requiring diagnosis, such as predicting the possibility of developing a cerebral aneurysm, but may be an individual concerned about the occurrence of a cerebral aneurysm due to a genetic predisposition.

한편, 본 발명에서 염기 타입을 검출하는 단계는 당업계에 염기서열을 분석하고 결정하기 위하여 통상적으로 사용되는 것이라면 제한없이 사용할 수 있다. 보다 구체적으로는 시퀀싱(sequencing), 엑솜 시퀀싱(exome sequencing), 마이크로어레이에 의한 혼성화(microarray hybridization), 대립유전자 특이적인 PCR(allele specific PCR), 다이나믹 대립유전자 혼성화 기법(dynamic allele-specific hybridization, DASH), 형광 융해 곡선 기법(Fluorescence Melting Curve Analysis, FMCA) 및 Taqman 기법으로 이루어진 군으로부터 선택되는 어느 한 방법으로 수행할 수 있다.Meanwhile, the step of detecting the base type in the present invention can be used without limitation as long as it is commonly used in the art to analyze and determine base sequences. More specifically, sequencing, exome sequencing, microarray hybridization, allele specific PCR, dynamic allele-specific hybridization (DASH) ), fluorescence melting curve analysis (FMCA), and Taqman technique.

본 발명에서 "SNP를 검출할 수 있는 제제"란 상기 SNP가 위치하는 유전체 영역에서 상기 SNP를 포함하는 8~100개의 연속된 염기서열을 갖는 폴리뉴클레오티드를 특이적으로 증폭할 수 있는 프라이머 또는 상기 폴리뉴클레오티드와 특이적으로 결합할 수 있는 프로브를 의미한다. 상기 SNP를 포함하는 폴리뉴클레오티드 증폭에 사용되는 프라이머는, 적절한 버퍼 중의 적절한 조건(예를 들면, 4개의 다른 뉴클레오시드 트리포스페이트 및 DNA, RNA 폴리머라제 또는 역전사 효소와 같은 중합제) 및 적당한 온도 하에서 주형-지시 DNA 합성(template-directed DNA synthesis)의 시작점으로서 작용할 수 있는 단일가닥 올리고뉴클레오타이드가 될 수 있는데, 상기 프라이머의 적절한 길이는 사용 목적에 따라 달라질 수 있으나, 통상 15 내지 30 뉴클레오타이드이다. 짧은 프라이머 분자는 일반적으로 주형과 안정한 혼성체를 형성하기 위해서는 더 낮은 온도를 필요로 한다. 상기 프라이머 서열은 상기 SNP 영역의 폴리뉴클레오티드와 완전하게 상보적일 필요는 없으나, 상기 폴리뉴클레오티드와 혼성화할 정도로 충분히 상보적이어야 한다. In the present invention, "an agent capable of detecting a SNP" means a primer capable of specifically amplifying a polynucleotide having 8 to 100 consecutive base sequences including the SNP in the genome region where the SNP is located, or the polynucleotide It means a probe capable of specifically binding to a nucleotide. The primers used to amplify the polynucleotide containing the SNP are prepared in an appropriate buffer under appropriate conditions (eg, four different nucleoside triphosphates and a polymerizing agent such as DNA, RNA polymerase or reverse transcriptase) and at an appropriate temperature. It can be a single-stranded oligonucleotide that can serve as a starting point for template-directed DNA synthesis. The appropriate length of the primer may vary depending on the purpose of use, but is usually 15 to 30 nucleotides. Shorter primer molecules generally require lower temperatures to form stable hybrids with the template. The primer sequence need not be perfectly complementary to the polynucleotide of the SNP region, but must be sufficiently complementary to hybridize with the polynucleotide.

본 명세서에서 "프라이머"란, 짧은 자유 3' 말단 수산화기(free 3' hydroxyl group)를 가지는 염기 서열로 상보적인 주형(template)과 염기쌍(base pair)을 형성할 수 있고 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응(즉, DNA 폴리머레이즈 또는 역전사효소)을 위한 시약 및 상이한 4가지 뉴클레오사이드 트리포스페이트의 존재 하에서 DNA 합성을 개시할 수 있다. PCR 증폭을 실시하여 원하는 생성물의 생성 여부를 통해 아토피 피부염을 예측할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당업계에 공지된 것을 기초로 변형할 수 있다.In the present specification, "primer" is a base sequence having a short free 3' terminal hydroxyl group, which can form a base pair with a complementary template and is a starting point for template strand copying. refers to a short sequence that functions as A primer can initiate DNA synthesis in the presence of a reagent for polymerization (i.e., DNA polymerase or reverse transcriptase) and four different nucleoside triphosphates in an appropriate buffer and temperature. PCR amplification can be performed to predict atopic dermatitis through whether the desired product is produced. PCR conditions and lengths of sense and antisense primers can be modified based on those known in the art.

본 발명의 프라이머는 포스포르아미다이트(phosphoramidite) 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비-제한적인 예로는 메틸화, "캡화", 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다.
The primers of the present invention can be chemically synthesized using the phosphoramidite solid support method, or other well-known methods. Such nucleic acid sequences can also be modified using a number of means known in the art. Non-limiting examples of such modifications include methylation, "capping", substitution of one or more homologs of a natural nucleotide, and modifications between nucleotides, such as uncharged linkages such as methylphosphonates, phosphotriesters, phosphoroamidates, carbamates, etc.) or to charged linkages (eg phosphorothioates, phosphorodithioates, etc.).

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 이하 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
The present invention can apply various transformations and can have various embodiments. Hereinafter, specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, it should be understood that this is not intended to limit the present invention to specific embodiments, and includes all transformations, equivalents, and substitutes included in the spirit and scope of the present invention. In describing the present invention, if it is determined that a detailed description of related known technologies may obscure the gist of the present invention, the detailed description will be omitted.

[실험 방법][Experiment method]

1. 연구 대상 및 GWA 데이터 세트 1. Study subject and GWA data set

본 연구는 2019년 한국인을 대상으로 하는 첫번째 IA GWAS를 기반으로 한 생물정보학 데이터를 이용하였다(J Clin Med. 2019 Feb; 8(2): 275.). 보다 구체적으로 250명의 IA 환자와 296명의 건강한 대조군의 유전정보 데이터를 이용하였으며, 본 연구에서 분류한 IA 환자의 기준은 아래와 같다:This study used bioinformatics data based on the first IA GWAS for Koreans in 2019 (J Clin Med. 2019 Feb; 8(2): 275.). More specifically, the genetic information data of 250 IA patients and 296 healthy controls were used, and the criteria for IA patients classified in this study are as follows:

1) 낭상 뇌동맥류(saccular cerebral aneurysm); 1) saccular cerebral aneurysm;

2) 18세 이상의 성인 환자; 2) adult patients over 18 years of age;

3) 뇌에 다른 혈관 기형이 없음.3) No other vascular malformations in the brain.

Eagle v2.4 및 Minimac4 프로그램을 사용하여 각 개체별로 SNP의 사전 단계 유전자형을 분석하고, AxiomTH Asian Precision Medicine Research Array(APMRA)(Thermo Fisher Scientific, MA, USA)을 이용하여 유전자형이 지정된 512,575개의 SNP를 포함하는 250명의 환자 및 296명의 대조군에 대한 대량의 SNP 및 유전자형 결측값을 추정하였다.
Pre-stage genotyping of SNPs in each individual using Eagle v2.4 and Minimac4 programs, and 512,575 genotyped SNPs using Axiom TH Asian Precision Medicine Research Array (APMRA) (Thermo Fisher Scientific, MA, USA) Massive SNP and genotype missing values were estimated for 250 patients and 296 controls, including .

2. 유전자형 교정, high-throughput imputation, 및 quality control(QC)2. Genotyping, high-throughput imputation, and quality control (QC)

상기 방법 1에서 확보한 첫번째 GWAS는 무작위 대조연구 데이터가 아니므로, “Batch Allele Consistency(BAC)”기능을 통해 게놈 전체의 유전자형 데이터를 수정하였다. 각 개체의 유전자형 분석에 있어서 각각의 샘플을 별도로 처리함에 따라 발생하는 강도 변화로 데이터에 불규칙한 SNP가 포함될 수 있으며, BAC는 유전자형에서 불규칙한 SNP를 식별하고 제거하는데 사용될 수 있다. Since the first GWAS obtained in Method 1 is not randomized control study data, the genome-wide genotype data was corrected through the “Batch Allele Consistency (BAC)” function. In the genotyping of each individual, irregular SNPs may be included in the data due to intensity changes caused by separately processing each sample, and BAC may be used to identify and remove irregular SNPs from the genotype.

이에, 상기 방법 1에서 확보한 첫번째 유전자형 데이터를 Axiom™Analysis Suite v1.1.1, Applied Biosystems™ (APT) v1.18, 및 SNPolisher™R package v3.0 을 이용하여 교정하였다(도 1).Accordingly, the first genotype data obtained in Method 1 was corrected using Axiom™Analysis Suite v1.1.1, Applied Biosystems™ (APT) v1.18, and SNPolisher™R package v3.0 (FIG. 1).

이어서, NHLBI(National Institutes of Health(NIH) National Heart, Lung and Blood Institute)에서 지원하는 GenomeAsia 100K 프로젝트에서 제작한 Asian-specific reference panel(GRCh37hg19)을 적용하였다. Subsequently, the Asian-specific reference panel (GRCh37hg19) produced by the GenomeAsia 100K project supported by the National Institutes of Health (NIH) National Heart, Lung and Blood Institute (NHLBI) was applied.

또한, 높은 처리량(high-throughput)의 변이(variation)는 Michigan Imputation Server v1.5.7 (https://imputationserver.sph.umich.edu/index.html#!run/minimac4)으로 보충(imputation)하였다. In addition, high-throughput variation was supplemented with Michigan Imputation Server v1.5.7 ( https://imputationserver.sph.umich.edu/index.html#!run/minimac4 ).

본 연구는 기관생명윤리위원회(The Institutional Review Board and Ethics Committee)의 승인을 받아 수행하였다(No. 2016-3 및 2019-06-006).
This study was conducted with the approval of The Institutional Review Board and Ethics Committee (No. 2016-3 and 2019-06-006).

3. 통계 분석3. Statistical analysis

고처리량 GWAS(high-throughput GWAS)는 성별, 연령, 기저질환 및 4가지 주요성분분석(PCA) 값과 같은 변수를 조정한 후 수행하였다. 가법 유효 모델(the additive effective model)에서 상속 모델을 수립하고, 대규모 GWAS는 PLINK v1.9 program (https://www.cog-genomics.org/plink/)으로 수행되었다. 맨해튼 프롯 및 지역 관련 플롯은 R package v3.6.0 (https://cran.r-project.org/web/packages/qqman)의 “qqman”과 수정된 Python and R scripts (http://locuszoom.org/)의 LocusZoom v1.3로 제작하였다.
High-throughput GWAS (high-throughput GWAS) was performed after adjusting for variables such as gender, age, underlying disease, and four principal component analysis (PCA) values. An inheritance model was established from the additive effective model, and a large-scale GWAS was performed with the PLINK v1.9 program ( https://www.cog-genomics.org/plink/ ). Manhattan plots and region-related plots are from “qqman” in the R package v3.6.0 ( https://cran.r-project.org/web/packages/qqman ) and modified Python and R scripts ( http://locuszoom.org /) of LocusZoom v1.3 .

[실험 결과][Experiment result]

실험의 모식도와 결과의 요약은 도 2와 같다. A schematic diagram of the experiment and a summary of the results are shown in FIG. 2 .

첫번째 GWAS로 29개의 SNP를 확인하였으며, 이는 멘델 변이(Mendelian variants)에 의한 것일 수 있다. LD(Linkage Disequilibrium) tower의 결핍에도 불구하고 GBA, TCF24, OLFML2A, ARHGAP32, CD163L1, CUL4A, LOC102724084, 및 LRRC3의 8개 유전자위(loci)에서 80%의 충분한 통계적 검증력을 나타내었으며, 이전에 보고된 BOLLEDNRA 유전자위도 검증되었다. high-throughput imputation를 기반으로 업데이트된 GWAS는 총 7,333,746개 사이트 중 6,105,212개의 SNP를 제공하여 imputation R 2 score of ≥ 0.5를 나타내었으며, genotyping call rate of ≥ 95%, minor allele frequency(MAF) of ≥ 0.01, 및 Hardy-Weinberg equilibrium(HWE) p-value of ≥ 0.001의 QC 테스트를 통과하였다. The first GWAS identified 29 SNPs, which may be due to Mendelian variants. Despite the lack of Linkage Disequilibrium (LD) tower, 8 loci of GBA , TCF24 , OLFML2A , ARHGAP32 , CD163L1 , CUL4A , LOC102724084 , and LRRC3 showed sufficient statistical power of 80%, which was previously reported. BOLL and EDNRA loci were also validated. The updated GWAS based on high-throughput imputation provided 6,105,212 SNPs out of a total of 7,333,746 sites, showing an imputation R 2 score of ≥ 0.5, a genotyping call rate of ≥ 95%, and a minor allele frequency (MAF) of ≥ 0.01. , and Hardy-Weinberg equilibrium (HWE) p-value of ≥ 0.001 passed the QC test.

546명의 연구대상(250명의 IA 환자 및 296명의 대조군)의 PC1 및 PC2는 동아시아 인구(진한 녹색)에서 양호한 분산을 나타내었고(도 3A), 대상간의 이질성 없이 확대된 분포를 나타내었다(도 3B). 6M 마커 중에서 39개 SNP가 genome-wide significant threshold(p = 5×10-8)에 도달하였다(도 3C). PC1 and PC2 of 546 study subjects (250 IA patients and 296 controls) showed good variance in the East Asian population (dark green) (Fig. 3A) and showed an expanded distribution without heterogeneity between subjects (Fig. 3B) . Among the 6M markers, 39 SNPs reached the genome-wide significant threshold ( p = 5×10 -8 ) (Fig. 3C).

LD 쌍(r 2 < 0.8)에 의한 가지치기(pruning) 처리 이후에 MAF 및 HWE p-value(≥0.05)로 정의된 IA와 일관되게 관련된 11개의 SNP를 확인할 수 있었다(표 2). After pruning treatment by LD pairs ( r 2 <0.8), 11 SNPs consistently associated with IA, defined as MAF and HWE p-value (≥0.05), were identified (Table 2).

GeneGene FunctionFunction ChrChr SNPSNPs PositionPosition MM mm MAFMAF HWE pHWE p OROR L95L95 U95U95 PP LOC440704, RGS18LOC440704, RGS18 intergenicintergenic 1q31.21q31.2 rs3120004rs3120004 191221672191221672 CC TT 0.374/0.2180.374/0.218 0.865 0.865 2.34 2.34 1.74 1.74 3.14 3.14 1.4E-081.4E-08 LOC101928851, NONELOC101928851, NONE intergenicintergenic 4q124q12 rs1851347rs1851347 5922072659220726 AA GG 0.438/0.2790.438/0.279 0.564 0.564 2.26 2.26 1.70 1.70 3.01 3.01 1.9E-081.9E-08 LOC101928851, NONELOC101928851, NONE intergenicintergenic 4q124q12 rs1522095rs1522095 5922270359222703 AA GG 0.344/0.1880.344/0.188 0.848 0.848 2.66 2.66 1.93 1.93 3.66 3.66 2.6E-092.6E-09 LINC01162, SP4LINC01162, SP4 intergenicintergenic 7p15.37p15.3 rs7779989rs7779989 2126598421265984 AA GG 0.378/0.2210.378/0.221 0.065 0.065 2.49 2.49 1.83 1.83 3.37 3.37 4.6E-094.6E-09 IGSF9BIGSF9B intronicintronic 11q2511q25 rs191300rs191300 133800017133800017 TT CC 0.192/0.0740.192/0.074 1.000 1.000 3.14 3.14 2.08 2.08 4.72 4.72 4.4E-084.4E-08 C12orf5C12orf5 Near UTR-5Near UTR-5 12p13.3212p13.32 rs4766232rs4766232 44300184430018 AA GG 0.292/0.4510.292/0.451 0.196 0.196 0.44 0.44 0.33 0.33 0.59 0.59 1.1E-081.1E-08 LINC00433, LINC00440LINC00433, LINC00440 intergenicintergenic 13q31.213q31.2 rs1571056rs1571056 8930658989306589 TT CC 0.18/0.3230.18/0.323 0.425 0.425 0.42 0.42 0.31 0.31 0.57 0.57 3.7E-083.7E-08 ATP11AATP11A intronicintronic 13q3413q34 rs2297801rs2297801 113532224113532224 CC TT 0.48/0.3230.48/0.323 1.000 1.000 2.22 2.22 1.68 1.68 2.95 2.95 3.0E-083.0E-08 LOC101928880, ZNF469LOC101928880, ZNF469 intergenicintergenic 16q24.216q24.2 rs12935558rs12935558 8833697888336978 AA GG 0.34/0.1860.34/0.186 0.254 0.254 2.47 2.47 1.80 1.80 3.40 3.40 2.6E-082.6E-08 MYH13MYH13 intronicintronic 17p13.117p13.1 rs3826442rs3826442 1022770810227708 CC TT 0.242/0.4160.242/0.416 0.634 0.634 0.42 0.42 0.32 0.32 0.56 0.56 3.1E-093.1E-09 SLC47A1SLC47A1 intronicintronic 17p11.217p11.2 rs2440154rs2440154 1944498719444987 GG AA 0.282/0.1250.282/0.125 0.791 0.791 2.90 2.90 2.07 2.07 4.08 4.08 8.2E-108.2E-10

a M and m indicate major and minor allele types, respectively. Minor allele frequency (MAF) shows in case (left) and control (right).b Hardy-Weinberg equilibrium p-value (HWE p) was estimated under the control group composed of 296 subjects. a M and m indicate major and minor allele types, respectively. Minor allele frequency (MAF) shows in case (left) and control (right). b Hardy-Weinberg equilibrium p-value (HWE p) was estimated under the control group composed of 296 subjects.

c Odds ratio (OR), 95% confidence intervals (Cis: L95, lower level of 95% CI; U95, upper level of 95% CI), and p-value were estimated `by multivariate generalized linear model. c Odds ratio (OR), 95% confidence intervals (Cis: L95, lower level of 95% CI; U95, upper level of 95% CI), and p-values were estimated `by multivariate generalized linear model.

d One tagging SNP is presented, which shows a strong pairwise linkage disequilibrium (LD, r 2 > 0.8) in multiple SNPs.
d One tagging SNP is presented, which shows a strong pairwise linkage disequilibrium (LD, r 2 > 0.8) in multiple SNPs.

상기 11개 SNP 중에서 6개의 SNP가 LD tower를 갖는 일배체형(haplotype) 구조를 형성하였다(도 4, 도 5, 도 6, 도 7, 도 8 및 도 9). 표지된 rs3120004 SNP는 1q31.2 위치의 LOC440704 및 RGS18 유전자 사이에서 커다란 일배체형 구조를 형성하였다((odds ratio (OR) = 2.34, 95% confidence interval (CI): 1.74-3.14; p = 1.4×10-8). 그러나, 유전자간 SNP(LOC101928851, 4q12)인 rs1522095는 rs1851347 및 rs1996807 SNP로 완전한 LD를 나타내었다(OR = 2.28, 95% CI: 1.70-3.01; p = 1.9×10-8). 그러나, rs1522095는 rs1851347와 표지된 rs1522095와 함께 0.64의 LD(r 2) 쌍을 나타내는 단일 공통 SNP임을 확인하였다(OR = 2.66 95% CI: 1.93-3.66; p = 2.8×10-9). 상술한 4개의 SNP는 유전자 사막 영역(gene desert region)에 위치하였다.Among the 11 SNPs, 6 SNPs formed a haplotype structure with an LD tower (FIGS. 4, 5, 6, 7, 8 and 9). The labeled rs3120004 SNP formed a large haplotype structure between the LOC440704 and RGS18 genes at position 1q31.2 ((odds ratio (OR) = 2.34, 95% confidence interval (CI): 1.74-3.14; p = 1.4 × 10 However, rs1522095, an intergenic SNP ( LOC101928851 , 4q12), showed complete LD with rs1851347 and rs1996807 SNPs (OR = 2.28, 95% CI: 1.70-3.01; p = 1.9 × 10 -8 ). , confirming that rs1522095 is a single common SNP representing a LD( r 2 ) pair of 0.64 with rs1851347 and labeled rs1522095 (OR = 2.66 95% CI: 1.93-3.66; p = 2.8 × 10 -9 ). Dog SNPs were located in the gene desert region.

한편, rs2440154 SNP(SLC47A1, 17p11.2)는 IA 발생 위험 증가와 가장 유의한 관련성을 나타내었다((OR = 2.90, 95% CI: 2.07-4.08; p = 8.2×10-10). 추가로 7p15.3, 16q24.2 및 17p13.1의 3 영역도 IA 발생의 위험을 예측하는데 유의한 관련성을 나타내었다. 특히, rs3826442 SNP(MYH13, 17p13.1) 주변 영역은 약 70 centi-morgan(cM)/mega base-pair(Mbp)의 높은 재조합율을 나타내었다. On the other hand, the rs2440154 SNP ( SLC47A1 , 17p11.2) showed the most significant association with the increased risk of IA ((OR = 2.90, 95% CI: 2.07-4.08; p = 8.2 × 10 -10 ). In addition, 7p15 The three regions of .3, 16q24.2 and 17p13.1 also showed significant relevance in predicting the risk of IA occurrence.In particular, the region around rs3826442 SNP ( MYH13 , 17p13.1) was about 70 centi-morgan (cM) It showed high recombination rate of /mega base-pair (Mbp).

rs191300(IGSF9B, 11q25), rs4766232(C12orf5, 12p13.32), rs1571056(LINC00433-LINC00440, 13q31.2), 및 rs2297801(ATP11A, 13q34)의 다른 4개 SNP는 현재 GWAS에서 단일 분리된 SNP를 나타내었으며 표지된 SNP 주변에는 LD를 확인할 수 없었다.
rs191300 ( IGSF9B , 11q25), rs4766232 ( C12orf5 , 12p13.32), rs1571056 ( LINC00433-LINC00440 , 13q31.2), and the other four SNPs in rs2297801 ( ATP11A , 13q34) represented a single segregating SNP in the current GWAS and LD could not be confirmed around the labeled SNP.

이상으로 본 발명 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적 기술은 단지 바람직한 실시 양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.As above, specific parts of the present invention have been described in detail, and for those skilled in the art, it is clear that these specific descriptions are only preferred embodiments, and the scope of the present invention is not limited thereby. something to do. Accordingly, the substantial scope of the present invention will be defined by the appended claims and their equivalents.

<110> Industry Academic Cooperation Foundation Hallym University <120> rs7779989 marker composition for diagnosing cerebral aneurysm and method of use thereof <130> P214510 <160> 6 <170> KoPatentIn 3.0 <210> 1 <211> 201 <212> DNA <213> Homo sapiens <220> <221> allele <222> (101) <223> y = c or t <400> 1 aagtatttgg taaaattcag cagtaaattc accaggtcct tggctattct ttgatgggag 60 acattttatt catagttcta tcttgttact taatattgat ygattcaggt tttatatttc 120 ttcatggttc attcttggta ggtggtatgt gtttagaaat ttatccatta cctctaagtt 180 ttcaaattta gtggtacata g 201 <210> 2 <211> 201 <212> DNA <213> Homo sapiens <220> <221> allele <222> (101) <223> r = a or g <400> 2 tccctaaaaa gggagaaatt acaaacattt tttcctagaa atggagagga cataatattt 60 aatgctattc tgatggcttt gcattgaaat tggtcaagct ractaggctg agattatttt 120 ccaaaatttt ctttcaagtt acagtgggac acaagagaaa ttcttgtgtg agttttggag 180 ggcagaggtg atactcatac t 201 <210> 3 <211> 201 <212> DNA <213> Homo sapiens <220> <221> allele <222> (101) <223> r = a or g <400> 3 ttctgctctt tgaacccatc tctccaggtt gaaaccatct tggcaaagta ttatcagccg 60 gtgtcttcgg ctagatggac ctttcaagcc ctcctaaggt ragaaaatgt tatttttccc 120 ttttatgtgt tgtggttcat tggatagtat ttgtcatctt gtcacataat aggaatgacg 180 ttcacaatgt tgaaatacgc c 201 <210> 4 <211> 200 <212> DNA <213> Homo sapiens <220> <221> allele <222> (101) <223> r = a or g <400> 4 caaggtaaca attcacttca tcccatgtat cattgcataa gttctcctgg gccccgttgg 60 ctggggacgt ggacacgtgt gatttctgct ctgcaccctc rccagcgctg ttctttccag 120 tgggcctttc cagccgggat cctgcccact tccttgtgcc cagctttcca gagcccctca 180 gcccctccaa gggcccacca 200 <210> 5 <211> 201 <212> DNA <213> Homo sapiens <220> <221> allele <222> (101) <223> y = c or t <400> 5 ttgattggcc tctttgaaaa tgctacaaag aaagggtatc accctctaaa agcttattat 60 ctacacctaa gccaagaaat gggtcatgca cacacatgca ygcacatgtg cacacactgc 120 acacacacgt gtacataaac ttagatatca cccataaaca cattttttct ttttagatgg 180 agtttctctc tgtggcccag g 201 <210> 6 <211> 201 <212> DNA <213> Homo sapiens <220> <221> allele <222> (101) <223> r = a or g <400> 6 aagtatttgg taaaattcag cagtaaattc accaggtcct tggctattct ttgatgggag 60 acattttatt catagttcta tcttgttact taatattgat ygattcaggt tttatatttc 120 ttcatggttc attcttggta ggtggtatgt gtttagaaat ttatccatta cctctaagtt 180 ttcaaattta gtggtacata g 201 <110> Industry Academic Cooperation Foundation Hallym University <120> rs7779989 marker composition for diagnosing cerebral aneurysm and method of use <130> P214510 <160> 6 <170> KoPatentIn 3.0 <210> 1 <211> 201 <212> DNA <213> Homo sapiens <220> <221> <222> (101) <223> y = c or t <400> 1 aagtatttgg taaaattcag cagtaaattc accaggtcct tggctattct ttgatggggag 60 acattttatt catagttcta tcttgttact taatattgat ygattcaggt tttatatttc 120 ttcatggttc attcttggta ggtggtatgt gtttagaaat ttatccatta cctctaagtt 180 ttcaaattta gtggtacata g 201 <210> 2 <211> 201 <212> DNA <213> Homo sapiens <220> <221> <222> (101) <223> r = a or g <400> 2 tccctaaaaa gggagaaatt acaaacattt tttcctagaa atggagagga cataatattt 60 aatgctattc tgatggcttt gcattgaaat tggtcaagct ractaggctg agattatttt 120 ccaaaatttt ctttcaagtt acagtgggac acaagagaaa ttcttgtgg agttttggag 180 ggcagaggtg atactcatac t 201 <210> 3 <211> 201 <212> DNA <213> Homo sapiens <220> <221> <222> (101) <223> r = a or g <400> 3 ttctgctctt tgaacccatc tctccaggtt gaaaccatct tggcaaagta ttatcagccg 60 gtgtcttcgg ctagatggac ctttcaagcc ctcctaaggt ragaaaatgt tatttttccc 120 ttttatgtgt tgtggttcat tggatagtat ttgtcatctt gtcacataat aggaatgacg 180 ttcacaatgt tgaaatacgc c 201 <210> 4 <211> 200 <212> DNA <213> Homo sapiens <220> <221> <222> (101) <223> r = a or g <400> 4 caaggtaaca attcacttca tcccatgtat cattgcataa gttctcctgg gccccgttgg 60 ctggggacgt ggacacgtgt gatttctgct ctgcaccctc rccagcgctg ttctttccag 120 tgggcctttc cagccgggat cctgccccact tccttgtgcc cagctttcca gagcccctca 180 gcccctccaa gggcccacca 200 <210> 5 <211> 201 <212> DNA <213> Homo sapiens <220> <221> <222> (101) <223> y = c or t <400> 5 ttgattggcc tctttgaaaa tgctacaaag aaagggtatc accctctaaa agcttattat 60 ctacacctaa gccaagaaat gggtcatgca cacacatgca ygcacatgtg cacacactgc 120 acacacacgt gtacataaac ttagatatca cccataaaca cattttttct ttttagatgg 180 agtttctctc tgtggcccag g 201 <210> 6 <211> 201 <212> DNA <213> Homo sapiens <220> <221> <222> (101) <223> r = a or g <400> 6 aagtatttgg taaaattcag cagtaaattc accaggtcct tggctattct ttgatggggag 60 acattttatt catagttcta tcttgttact taatattgat ygattcaggt tttatatttc 120 ttcatggttc attcttggta ggtggtatgt gtttagaaat ttatccatta cctctaagtt 180 ttcaaattta gtggtacata g 201

Claims (10)

rs7779989 단일염기다형성(single nucleotide polymorphism; SNP)을 포함하는, 뇌동맥류 진단을 위한 SNP 마커 조성물.
A SNP marker composition for diagnosing cerebral aneurysm, including rs7779989 single nucleotide polymorphism (SNP).
rs7779989 단일염기다형성(single nucleotide polymorphism; SNP)을 검출할 수 있는 제제를 포함하는, 뇌동맥류 진단용 조성물.
A composition for diagnosing a cerebral aneurysm, comprising an agent capable of detecting rs7779989 single nucleotide polymorphism (SNP).
제2항에 있어서,
rs3120004, rs1522095, rs12935558, rs3826442, 및 rs2440154에서 이루어진 군으로부터 선택된 어느 하나 이상의 SNP를 검출할 수 있는 제제를 더 포함하는, 뇌동맥류 진단용 조성물.
According to claim 2,
rs3120004, rs1522095, rs12935558, rs3826442, and rs2440154 further comprising an agent capable of detecting any one or more SNPs selected from the group consisting of, a composition for diagnosing a cerebral aneurysm.
제2항에 있어서,
상기 SNP를 검출할 수 있는 제제는 상기 SNP가 위치하는 유전체 영역에서 상기 SNP를 포함하는 8~50개의 연속된 염기서열 또는 이와 상보적인 염기서열을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 프로브 또는 프라이머인 것을 특징으로 하는, 진단용 조성물.
According to claim 2,
The agent capable of detecting the SNP is a probe or primer that specifically binds to a polynucleotide having 8 to 50 consecutive base sequences including the SNP or a base sequence complementary thereto in the genomic region where the SNP is located. Characterized in that, the diagnostic composition.
제2항에 있어서,
상기 조성물은 한국인 또는 아시아인을 대상으로 뇌동맥류를 진단하기 위한 것인, 진단용 조성물.
According to claim 2,
The composition is for diagnosing cerebral aneurysms in Koreans or Asians, diagnostic composition.
제2항의 조성물을 포함하는, 뇌동맥류 진단용 키트.
A kit for diagnosing a cerebral aneurysm comprising the composition of claim 2.
하기 단계를 포함하는 뇌동맥류 진단을 위한 정보제공방법:
(1) 개체의 생물학적 시료를 준비하는 단계;
(2) 상기 생물학적 시료로부터 게놈(genomic) DNA를 얻는 단계;
(3) 상기 게놈 DNA에서 GenBank SNP database rs7779989 단일염기다형성(single nucleotide polymorphism; SNP) 위치의 염기 타입을 검출하는 단계; 및
(4) 상기 검출한 염기 타입으로부터 개체의 뇌동맥류 발병 위험도 또는 발병 감수성을 결정하는 단계.
Information provision method for diagnosing cerebral aneurysm comprising the following steps:
(1) preparing a biological sample from the subject;
(2) obtaining genomic DNA from the biological sample;
(3) detecting the base type of the GenBank SNP database rs7779989 single nucleotide polymorphism (SNP) position in the genomic DNA; and
(4) determining the risk or susceptibility of developing a cerebral aneurysm of an individual from the detected base type.
제7항에 있어서,
상기 (1) 단계의 개체는 한국인 또는 아시아인인 것을 특징으로 하는, 정보제공방법.
According to claim 7,
Characterized in that the individual in step (1) is Korean or Asian, information providing method.
제7항에 있어서,
상기 (3) 단계의 염기 타입 검출은 시퀀싱(sequencing), 마이크로 어레이에 의한 혼성화(microarray hybridization), 대립유전자 특이적인 PCR(allele specific PCR), 다이나믹 대립유전자 혼성화 기법(dynamic allele-specific hybridization; DASH), 형광 융해 곡선 기법(Fluorescence Melting Curve Analysis; FMCA)및 Taqman 기법으로 이루어진 군으로부터 선택되는 어느 한 방법으로 수행되는 것을 특징으로 하는, 정보제공방법.
According to claim 7,
Base type detection in step (3) is performed by sequencing, microarray hybridization, allele specific PCR, and dynamic allele-specific hybridization (DASH). , Fluorescence Melting Curve Analysis (FMCA) and Taqman technique, characterized in that carried out by any one method selected from the group consisting of, information providing method.
제7항에 있어서,
상기 (3) 단계에서 rs7779989 위치의 염기 타입이 구아닌(Guanine)으로 검출되는 경우,
상기 (4) 단계의 개체는 뇌동맥류 발병 위험도 또는 발병 감수성이 높은 것으로 판단하는 것을 특징으로 하는, 정보제공방법.
According to claim 7,
In step (3), when the base type at position rs7779989 is detected as Guanine,
Characterized in that the individual in step (4) is determined to have a high risk or susceptibility to the occurrence of a cerebral aneurysm, an information providing method.
KR1020220014153A 2022-02-03 2022-02-03 rs7779989 marker composition for diagnosing cerebral aneurysm and method of use thereof KR20230117871A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220014153A KR20230117871A (en) 2022-02-03 2022-02-03 rs7779989 marker composition for diagnosing cerebral aneurysm and method of use thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220014153A KR20230117871A (en) 2022-02-03 2022-02-03 rs7779989 marker composition for diagnosing cerebral aneurysm and method of use thereof

Publications (1)

Publication Number Publication Date
KR20230117871A true KR20230117871A (en) 2023-08-10

Family

ID=87560835

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220014153A KR20230117871A (en) 2022-02-03 2022-02-03 rs7779989 marker composition for diagnosing cerebral aneurysm and method of use thereof

Country Status (1)

Country Link
KR (1) KR20230117871A (en)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
1. Yoo SK, Kim CU, Kim HL, Kim S, Shin JY, Kim N, et al. Nard: Whole-genome reference panel of 1779 northeast asians improves imputation accuracy of rare and low-frequency variants. Genome Med. 2019;11:64
2. Genomes Project C, Auton A, Brooks LD, Durbin RM, Garrison EP, Kang HM, et al. A global reference for human genetic variation. Nature. 2015;526:68-74

Similar Documents

Publication Publication Date Title
KR102158717B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of CD163L1 gene
EP2025764A1 (en) Probe for detection of mutation in abl gene and use thereof
KR20230117874A (en) rs12935558 marker composition for diagnosing cerebral aneurysm and method of use thereof
KR20230117871A (en) rs7779989 marker composition for diagnosing cerebral aneurysm and method of use thereof
KR20230117876A (en) rs2440154 marker composition for diagnosing cerebral aneurysm and method of use thereof
KR20230117873A (en) rs1522095 marker composition for diagnosing cerebral aneurysm and method of use thereof
KR20230117875A (en) rs3826442 marker composition for diagnosing cerebral aneurysm and method of use thereof
KR20230117872A (en) rs3120004 marker composition for diagnosing cerebral aneurysm and method of use thereof
KR102158721B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of RNF144A gene
KR102158715B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of OLFML2A gene
KR102158713B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of GBA gene
KR101992952B1 (en) Composition, kit for predicting the risk of developing cardiovascular disease related to Cholesterol efflux capacity, and method using the same
KR101167945B1 (en) Polynucleotides derived from ATG16L1 gene comprising single nucleotide polymorphisms, microarrays and diagnostic kits comprising the same, and analytic methods for autism spectrum disorders using the same
KR102158718B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of CUL4A gene
KR102158725B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of MINK1 gene
KR102158716B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of ARHGAP32 gene
KR102158719B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of LOC102724084 gene
KR102158723B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of SPCS3 gene
KR102158724B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of LINGO2 gene
KR102158720B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of LRRC3 gene
KR102158722B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of FLJ45964 gene
KR102158714B1 (en) SNP marker for diagnosis of intracranial aneurysm comprising SNP of TCF24 gene
KR20230166278A (en) A model for predicting the prognosis of subarachnoid hemorrhage using multiple SNP markers
KR20230164963A (en) A marker for predicting the absolute risk of cognitive impairment after subarachnoid hemorrhage
KR20230164962A (en) A marker for predicting the prognosis of subarachnoid hemorrhage including the rs76507772 SNP, which has strong linkage disequilibrium with IRS2 gene mutation