KR102479605B1 - Composition for predicting a risk of developing gastric cancer and method using the same - Google Patents

Composition for predicting a risk of developing gastric cancer and method using the same Download PDF

Info

Publication number
KR102479605B1
KR102479605B1 KR1020220052542A KR20220052542A KR102479605B1 KR 102479605 B1 KR102479605 B1 KR 102479605B1 KR 1020220052542 A KR1020220052542 A KR 1020220052542A KR 20220052542 A KR20220052542 A KR 20220052542A KR 102479605 B1 KR102479605 B1 KR 102479605B1
Authority
KR
South Korea
Prior art keywords
risk
gastric cancer
nucleic acid
seq
predicting
Prior art date
Application number
KR1020220052542A
Other languages
Korean (ko)
Inventor
김호
이솔
김정오
김정은
윤상혁
박승환
차지희
박다현
지선하
Original Assignee
주식회사 바스젠바이오
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 바스젠바이오, 연세대학교 산학협력단 filed Critical 주식회사 바스젠바이오
Priority to KR1020220052542A priority Critical patent/KR102479605B1/en
Application granted granted Critical
Publication of KR102479605B1 publication Critical patent/KR102479605B1/en
Priority to PCT/KR2023/004524 priority patent/WO2023210997A1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

The present invention relates to: a composition, a microarray, and a kit for predicting the risk of developing gastric cancer through genetic analysis of single nucleotide polymorphisms (SNPs); and a method of predicting the risk of developing gastric cancer of an individual using the same. Accordingly, the risk of developing gastric cancer of an individual can be accurately and easily predicted. Thus, the present invention can help prevent the development of gastric cancer.

Description

위암 발병의 위험도를 예측하기 위한 조성물 및 이를 이용한 방법{Composition for predicting a risk of developing gastric cancer and method using the same}Composition for predicting a risk of developing gastric cancer and method using the same}

단일염기다형성(SNP)의 유전자 분석을 통하여 위암 발병의 위험도를 예측하기 위한 조성물 및 이를 이용한 방법에 관한 것이다.It relates to a composition for predicting the risk of gastric cancer through genetic analysis of a single nucleotide polymorphism (SNP) and a method using the same.

위암(gastric cancer)은 가장 흔한 암 중 하나이며 2018년에 783,000명이 사망한 것으로 추정된다. 과거 몇 년 동안, 위암의 발달 및 진행에 영향을 미치는 다중 유전적 또는 후생학적 변화를 설명하기 위한 많은 연구가 있어왔다. 진단 및 치료 기술의 발달은 위암에 대한 탁월한 장기 생존의 결과를 내었지만, 위암은 여전히 전 세계에서 암에 의한 사망에 있어서 그 빈도가 두 번째로 높은 원인이다.Gastric cancer is one of the most common cancers, with an estimated 783,000 deaths in 2018. In the past few years, many studies have been conducted to explain multiple genetic or epigenetic changes that influence the development and progression of gastric cancer. Although advances in diagnostic and treatment technologies have resulted in excellent long-term survival for gastric cancer, gastric cancer remains the second most frequent cause of death from cancer worldwide.

인간의 경우 약 1000 bp(base pair) 당 1회 빈도로 변이가 있는데 이것을 단일염기다형성(single nucleotide polymorphism: SNP)이라고 한다. 5% 다형을 보통의 다형성(common polymorphism)이라고 하며, 1% 내지 5% 다형을 드문 다형성(rare polymorphism)이라고 한다. 현재 인간의 전체 염기서열을 분석하기 위해 많은 실험 기법 등이 발달하였고, 그 중 전장 유전체 연관성 분석(genome-wide association study: GWAS) 현재까지 많은 질환 연구에 사용되고 있다. 후보 유전자 접근법 또는 전장 유전체 연관성 분석(GWAS)을 통해 위암과 관련된 SNP로 APE1(rs1760944), DNMT1(rs16999593), ERCC5(rs751402), GSTT1(null/presence), MDM2(rs2278744), PPARG(rs1801282), TLR4(rs4986790), IL-17F(rs763780), CASP8(rs3834129) 등이 보고되었다(Jie Tian et al., Cancer Biol. Med. (2019) 16:361-389). 하지만, 이러한 SNP에 대한 연구는 위암 유형 및 민족성과 관련하여 일관성 없는 결과를 나타냈으며, GWAS로부터 얻은 SNP의 효과 크기는 일반적으로 2.0 미만으로 낮다는 문제가 있다.In the case of humans, there is a mutation with a frequency of about once per 1000 bp (base pair), which is called a single nucleotide polymorphism (SNP). A 5% polymorphism is called a common polymorphism, and a 1% to 5% polymorphism is called a rare polymorphism. Currently, many experimental techniques have been developed to analyze the entire human nucleotide sequence, and among them, genome-wide association study (GWAS) has been used in many disease studies to date. APE1 (rs1760944), DNMT1 (rs16999593), ERCC5 (rs751402), GSTT1 (null/presence), MDM2 (rs2278744), PPARG (rs1801282), TLR4 (rs4986790), IL-17F (rs763780), CASP8 (rs3834129), etc. have been reported (Jie Tian et al., Cancer Biol. Med. (2019) 16:361-389). However, studies on these SNPs have shown inconsistent results with respect to gastric cancer type and ethnicity, and there is a problem that the effect size of SNPs obtained from GWAS is generally low, less than 2.0.

따라서, SNP 다형성을 이용하여 위암 발병 위험도를 보다 정확하게 예측하기 위한 SNP 바이오마커를 발굴하고, 이를 이용하여 위암의 위험도를 예측할 수 있는 방법을 개발할 필요가 있다.Therefore, it is necessary to discover SNP biomarkers for more accurately predicting the risk of developing gastric cancer using SNP polymorphisms, and to develop a method for predicting the risk of gastric cancer using the SNP biomarkers.

Jie Tian et al. Cancer Biol Med (2019) 16:361-389. Jie Tian et al. Cancer Biol Med (2019) 16:361-389.

위암 발병 위험도를 예측하기 위한 조성물을 제공한다.Provided is a composition for predicting the risk of developing gastric cancer.

위암 발병 위험도를 예측하기 위한 마이크로어레이를 제공한다.A microarray for predicting the risk of developing gastric cancer is provided.

위암 발병 위험도를 예측하기 위한 키트를 제공한다.A kit for predicting the risk of gastric cancer is provided.

위암 발병 위험도를 예측하기 위한 조성물을 이용하여 위암 발명 위험도를 예측하는 방법을 제공한다.Provided is a method for predicting the risk of gastric cancer using a composition for predicting the risk of gastric cancer.

일 양상은 서열번호 1 내지 서열번호 9로 이루어진 군으로부터 선택된 하나 이상의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드를 포함하는 위암 발병 위험도를 예측하기 위한 조성물을 제공한다.One aspect is identical to 5 to 100 contiguous nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-end in a polynucleotide consisting of one or more nucleic acid sequences selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 9, or Alternatively, a composition for predicting the risk of developing gastric cancer comprising a complementary polynucleotide is provided.

상기 조성물은 서열번호 10의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드를 더 포함할 수 있다.The composition may further include a polynucleotide identical to or complementary to 5 to 100 contiguous nucleic acid sequences including a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 10. there is.

상기 "다형성 부위(polymorphic site)"는 핵산 서열 중 단일염기다형성(single nucleotide polymorphism: SNP)을 나타내는 부위를 말한다. 개개의 다형성은 또한 당업자에게 공지되어 있고, 예를 들면, NCBI 웹사이트 상에서 이용가능한 뉴클레오티드 염기 변이의 단일염기다형성 데이터베이스(single nucleotide polymorphism database(dbSNP) of nucleotide sequence variation)에서 사용되는 것인, 지정된 독특한 식별자("기준 SNP", "refSNP" 또는 "rs#")이다.The "polymorphic site" refers to a site exhibiting a single nucleotide polymorphism (SNP) in a nucleic acid sequence. Individual polymorphisms are also known to those of skill in the art and are designated unique sequences, such as those used in, for example, the single nucleotide polymorphism database (dbSNP) of nucleotide sequence variation available on the NCBI website. identifier ("reference SNP", "refSNP" or "rs#").

상기 "단일염기다형성(single nucleotide polymorphism, SNP)"은 하나의 유전자 좌위(locus)에 두 가지 이상의 대립유전자(allele)가 존재하는 다형성 부위(polymorphic site) 중에서, 단일 염기만이 다른 것을 의미한다. 예를 들어, 서로 다른 개체의 세 개의 DNA 단편들(예: AAGT[A/A]AG, AAGT[A/G]AG, AAGT[G/G]AG)과 같이 단일염기에서 차이가 있을 때, 이를 두 개의 대립유전자(C 또는 T)라고 부르며 대다수의 SNP는 두 개의 대립유전자(allele)를 포함한다. 상기 "대립유전자(allele)"는 상동염색체의 동일한 유전자좌위에 존재하는 한 유전자의 여러 타입을 의미한다. 대립유전자는 다형성을 나타내는데 사용되기도 하며, 예를 들어, SNP는 두 종류의 대립인자(biallele)를 갖는다.The "single nucleotide polymorphism (SNP)" means that only a single base differs among polymorphic sites in which two or more alleles exist in one locus. For example, when there is a difference in a single base, such as three DNA fragments from different individuals (e.g. AAGT[A/A]AG, AAGT[A/G]AG, AAGT[G/G]AG), These are called two alleles (C or T), and the majority of SNPs contain two alleles. The "allele" refers to several types of a gene present at the same locus of a homologous chromosome. Alleles are also used to indicate polymorphism, for example, SNPs have two types of alleles.

상기 폴리뉴클레오티드는 서열번호 1 내지 서열번호 10으로 이루어진 군으로부터 선택된 하나 이상의 핵산 서열로 이루어진 폴리뉴클레오티드에서, 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개, 10개 내지 100개, 10개 내지 80개, 10개 내지 60개, 10개 내지 40개, 10개 내지 20개, 또는 5개 내지 25개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드일 수 있다.The polynucleotide is a polynucleotide consisting of one or more nucleic acid sequences selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 10, 5 to 100, 10 to It may be a polynucleotide identical to or complementary to 100, 10-80, 10-60, 10-40, 10-20, or 5-25 contiguous nucleic acid sequences.

상기 서열번호 1의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs377176971의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs377176971은 서열번호 1의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs377176971은 인간 4번째 염색체의 56865490번째 위치에 있는 SNP일 수 있다. 상기 rs377176971은 C 또는 T의 유전자형(genotype)을 가질 수 있다. rs377176971의 유전자형이 T인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 1, a polynucleotide identical to or complementary to 5 to 100 consecutive nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-terminus has the genotype of SNP ID rs377176971 It may be a polynucleotide for detection. The rs377176971 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide composed of the nucleic acid sequence of SEQ ID NO: 1. The rs377176971 may be a SNP located at position 56865490 of human 4th chromosome. The rs377176971 may have a C or T genotype. When the genotype of rs377176971 is T, it can be expected that the risk of developing gastric cancer increases.

상기 서열번호 2의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs78381605의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs78381605은 서열번호 2의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs78381605는 인간 4번째 염색체의 99477699번째 위치에 있는 SNP일 수 있다. 상기 rs78381605는 G 또는 A의 유전자형을 가질 수 있다. rs78381605의 유전자형이 A인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 2, a polynucleotide identical to or complementary to 5 to 100 contiguous nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-end has a genotype of SNP ID rs78381605 It may be a polynucleotide for detection. The rs78381605 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide composed of the nucleic acid sequence of SEQ ID NO: 2. The rs78381605 may be a SNP located at position 99477699 of human 4th chromosome. The rs78381605 may have a genotype of G or A. When the genotype of rs78381605 is A, it can be expected that the risk of developing gastric cancer increases.

상기 서열번호 3의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs145516817의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs145516817은 서열번호 3의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs145516817은 인간 4번째 염색체의 134816182번째 위치에 있는 SNP일 수 있다. 상기 rs145516817은 G, A 또는 T의 유전자형을 가질 수 있다. rs145516817의 유전자형이 T인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 3, a polynucleotide identical to or complementary to 5 to 100 consecutive nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-terminus has a genotype of SNP ID rs145516817 It may be a polynucleotide for detection. The rs145516817 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide composed of the nucleic acid sequence of SEQ ID NO: 3. The rs145516817 may be a SNP located at position 134816182 of human 4th chromosome. The rs145516817 may have a genotype of G, A or T. When the genotype of rs145516817 is T, it can be expected that the risk of developing gastric cancer increases.

상기 서열번호 4의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs114167943의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs114167943은 서열번호 4의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs114167943은 인간 7번째 염색체의 100609631번째 위치에 있는 SNP일 수 있다. 상기 rs114167943은 C 또는 T의 유전자형을 가질 수 있다. rs114167943의 유전자형이 T인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 4, a polynucleotide identical to or complementary to 5 to 100 contiguous nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-end has the genotype of SNP ID rs114167943 It may be a polynucleotide for detection. The rs114167943 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide composed of the nucleic acid sequence of SEQ ID NO: 4. The rs114167943 may be a SNP located at position 100609631 of human 7th chromosome. The rs114167943 may have a C or T genotype. When the genotype of rs114167943 is T, it can be expected that the risk of developing gastric cancer increases.

상기 서열번호 5의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs150274610의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs150274610은 서열번호 5의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs150274610은 인간 8번째 염색체의 52042955번째 위치에 있는 SNP일 수 있다. 상기 rs150274610은 C 또는 A의 유전자형을 가질 수 있다. rs150274610의 유전자형이 A인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 5, a polynucleotide identical to or complementary to 5 to 100 contiguous nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-end has the genotype of SNP ID rs150274610 It may be a polynucleotide for detection. The rs150274610 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide composed of the nucleic acid sequence of SEQ ID NO: 5. The rs150274610 may be a SNP located at position 52042955 of human 8th chromosome. The rs150274610 may have a C or A genotype. When the genotype of rs150274610 is A, it can be expected that the risk of developing gastric cancer increases.

상기 서열번호 6의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs10674898의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs10674898은 서열번호 6의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs10674898은 인간 8번째 염색체의 143780261번째 위치에 있는 SNP일 수 있다. 상기 rs10674898은 AAAA 또는 AA 유전자형을 가질 수 있다. rs10674898의 유전자형이 AA인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 6, a polynucleotide identical to or complementary to 5 to 100 consecutive nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-terminus has a genotype of SNP ID rs10674898 It may be a polynucleotide for detection. The rs10674898 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide composed of the nucleic acid sequence of SEQ ID NO: 6. The rs10674898 may be a SNP located at position 143780261 of human 8th chromosome. The rs10674898 may have an AAAA or AA genotype. When the genotype of rs10674898 is AA, it can be expected that the risk of developing gastric cancer increases.

상기 서열번호 7의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs143172300의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs143172300은 서열번호 7의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs143172300은 인간 9번째 염색체의 135545995번째 위치에 있는 SNP일 수 있다. 상기 rs143172300은 G, A 또는 C의 유전자형을 가질 수 있다. rs10674898의 유전자형이 A인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 7, a polynucleotide identical to or complementary to 5 to 100 consecutive nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-terminus has a genotype of SNP ID rs143172300 It may be a polynucleotide for detection. The rs143172300 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide composed of the nucleic acid sequence of SEQ ID NO: 7. The rs143172300 may be a SNP located at position 135545995 of human 9th chromosome. The rs143172300 may have a genotype of G, A or C. When the genotype of rs10674898 is A, it can be expected that the risk of developing gastric cancer increases.

상기 서열번호 8의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs373412232의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs373412232는 서열번호 8의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs373412232는 인간 10번째 염색체의 101120600번째 위치에 있는 SNP일 수 있다. 상기 rs373412232는 C 또는 T의 유전자형을 가질 수 있다. rs373412232의 유전자형이 T인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 8, a polynucleotide identical to or complementary to 5 to 100 contiguous nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-end has the genotype of SNP ID rs373412232 It may be a polynucleotide for detection. The rs373412232 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide composed of the nucleic acid sequence of SEQ ID NO: 8. The rs373412232 may be a SNP located at position 101120600 of human 10th chromosome. The rs373412232 may have a C or T genotype. When the genotype of rs373412232 is T, it can be expected that the risk of developing gastric cancer increases.

상기 서열번호 9의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs2470155의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs2470155는 서열번호 9의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs2470155는 인간 15번째 염색체의 51590753번째 위치에 있는 SNP일 수 있다. 상기 rs2470155는 G, C 또는 T의 유전자형을 가질 수 있다. rs2470155의 유전자형이 T인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 9, a polynucleotide identical to or complementary to 5 to 100 contiguous nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from its 5'-end has a genotype of SNP ID rs2470155 It may be a polynucleotide for detection. The rs2470155 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide composed of the nucleic acid sequence of SEQ ID NO: 9. The rs2470155 may be a SNP located at position 51590753 of human chromosome 15. The rs2470155 may have a genotype of G, C or T. When the genotype of rs2470155 is T, it can be expected that the risk of developing gastric cancer increases.

상기 서열번호 10의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 SNP ID rs760077의 유전자형을 검출하기 위한 폴리뉴클레오티드일 수 있다. 상기 rs760077은 서열번호 10의 핵산 서열로 구성된 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위일 수 있다. 상기 rs760077은 인간 1번째 염색체의 155178782번째 위치에 있는 SNP일 수 있다. 상기 rs760077은 T 또는 A의 유전자형을 가질 수 있다. rs760077의 유전자형이 A인 경우, 위암 발병 위험도가 높아질 것으로 예상될 수 있다.In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 10, a polynucleotide identical to or complementary to 5 to 100 consecutive nucleic acid sequences including a polymorphic site at the 51st nucleotide from its 5'-terminus has a genotype of SNP ID rs760077 It may be a polynucleotide for detection. The rs760077 may be a polymorphic site at the 51st nucleotide from the 5'-end of the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 10. The rs760077 may be a SNP located at position 155178782 of human 1st chromosome. The rs760077 may have a T or A genotype. When the genotype of rs760077 is A, it can be expected that the risk of developing gastric cancer increases.

상기 폴리뉴클레오티드는 서열번호 1 내지 서열번호 10으로 이루어진 군으로부터 선택된 하나 이상의 핵산 서열로 이루어진 폴리뉴클레오티드와 상동성 또는 동일성이 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 또는 약 99% 이상인 염기서열로 이루어질 수 있으나, 이에 제한되지 않는다.The polynucleotide has about 80% or more, about 90% or more, about 95% or more, about 96% or more, It may consist of about 97% or more, about 98% or about 99% or more of the nucleotide sequence, but is not limited thereto.

상기 조성물은 상기 폴리뉴클레오티드를 1종 이상, 2종 이상, 3종 이상, 4종 이상, 5종 이상, 6종 이상, 7종 이상, 8종 이상, 9종 이상 또는 10종을 포함할 수 있다. 상기 폴리뉴클레오티드 또는 이들의 조합을 포함하는 경우 위암 발병 위험도의 정확도를 높일 수 있다. 예를 들어, 서열번호 1에서 다형성 부위의 C 및 서열번호 7에서 다형성 부위의 G가 각각 T 및 A로 모두 변이되는 것일 수 있다.The composition may include at least one, at least two, at least three, at least four, at least five, at least six, at least seven, at least eight, at least nine, or at least ten polynucleotides. . When the polynucleotide or a combination thereof is included, the accuracy of the risk of gastric cancer can be increased. For example, C of the polymorphic site in SEQ ID NO: 1 and G of the polymorphic site in SEQ ID NO: 7 may be both mutated to T and A, respectively.

상기 5 내지 100개의 연속적인 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드는 위암 발병과 유의적 상관관계를 갖는 SNP를 검출하기 위한 프라이머 또는 프로브일 수 있다.Polynucleotides identical to or complementary to the 5 to 100 consecutive nucleic acid sequences may be primers or probes for detecting SNPs significantly correlated with the occurrence of gastric cancer.

용어 "프라이머(primer)"는 중합효소에 의한 뉴클레오티드의 중합반응에서, 개시점으로 작용할 수 있는 단일가닥의 폴리뉴클레오티드를 말한다. 예를 들면, 상기 프라이머는 적합한 온도 및 적합한 완충액 내에서 적합한 조건, 즉, 4종의 다른 뉴클레오시드 트리포스페이트 및 중합효소의 존재 하에서 주형-지시(template-directed) DNA 합성의 개시점으로 작용할 수 있는 단일가닥의 폴리뉴클레오티드일 수 있다. 프라이머의 적합한 길이는 다양한 인자, 예를 들어, 온도와 프라이머의 용도에 따라 달라질 수 있다. 예를 들어, 프라이머의 길이가 짧을수록, 낮은 어닐링(annealing) 온도에서 주형과 충분히 안정된 혼성화 복합체를 형성할 수 있다. 상기 프라이머의 길이는 약 5 내지 약 100 뉴클레오티드(이하, 'nt'라고 함), 약 10 내지 약 80 nt, 약 10 내지 약 60 nt, 약 10 내지 약 50 nt, 약 10 내지 약 40 nt, 약 10 내지 약 30 nt, 또는 약 10 내지 약 20 nt일 수 있다. 또한, 상기 프라이머는 상기 다형성 부위에 동일하거나 또는 상보적인 서열을 포함할 수 있다. 따라서, 상기 프라이머는 다형성 부위를 포함하는 DNA 서열에 혼성화하여 다형성 부위를 포함하는 DNA 단편을 증폭시킬 수 있다. 상기 프라이머는 대립형질을 검출하여 위암 발병 위험도를 예측하기 위한 키트, 마이크로어레이, 예측 방법 등에 사용될 수 있다.The term "primer" refers to a single-stranded polynucleotide that can act as an initiating point in a polymerization reaction of nucleotides by a polymerase. For example, the primers can act as starting points for template-directed DNA synthesis under suitable conditions, i.e., in the presence of four different nucleoside triphosphates and a polymerase, at a suitable temperature and in a suitable buffer. It may be a single-stranded polynucleotide. The suitable length of the primer may depend on various factors, such as temperature and use of the primer. For example, the shorter the length of the primer, the more stable the hybridization complex with the template can be formed at a low annealing temperature. The length of the primer is about 5 to about 100 nucleotides (hereinafter referred to as 'nt'), about 10 to about 80 nt, about 10 to about 60 nt, about 10 to about 50 nt, about 10 to about 40 nt, about 10 to about 30 nt, or about 10 to about 20 nt. In addition, the primer may include a sequence identical to or complementary to the polymorphic site. Accordingly, the primer can hybridize to a DNA sequence containing the polymorphic site to amplify a DNA fragment containing the polymorphic site. The primers can be used in kits, microarrays, predictive methods, etc. for predicting the risk of developing gastric cancer by detecting alleles.

용어 "프로브(probe)"는 표적 핵산에 특이적으로 결합할 수 있는 올리고뉴클레오티드를 말한다. 상기 프로브는 길이가 약 50 nt 내지 약 400 nt, 약 100 nt 내지 약 350 nt, 약 150 nt 내지 약 300 nt, 또는 약 200 nt 내지 약 250 nt일 수 있다. 또한, 상기 프로브는 상기 다형성 부위에 동일하거나 또는 상보적인 서열을 포함할 수 있다. 상기 프로브는 대립형질을 검출하여 위암 발병 위험도를 예측하기 위한 키트, 마이크로어레이, 예측 방법 등에 사용될 수 있다. 상기 프로브는 검출할 수 있도록 표지될 수 있으며, 예를 들면 방사선 동위원소, 형광 화합물, 바이오 발광 화합물, 화학 발광 화합물, 금속 킬레이트 또는 효소로 표지될 수 있다. 프로브를 표지하는 방법은 당해 분야에서 널리 알려진 기술이며, 통상적인 방법을 통해 수행할 수 있다.The term "probe" refers to an oligonucleotide capable of specifically binding to a target nucleic acid. The probe may be about 50 nt to about 400 nt, about 100 nt to about 350 nt, about 150 nt to about 300 nt, or about 200 nt to about 250 nt in length. In addition, the probe may include a sequence identical to or complementary to the polymorphic site. The probe may be used in kits, microarrays, prediction methods, etc. for predicting the risk of developing gastric cancer by detecting alleles. The probe may be detectably labeled, for example, with a radioactive isotope, a fluorescent compound, a bioluminescent compound, a chemiluminescent compound, a metal chelate, or an enzyme. A method of labeling a probe is a technique widely known in the art and can be performed through a conventional method.

상기 프로브 또는 프라이머는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비-제한적인 예로는 메틸화, 캡핑(capping), 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다.The probe or primer may be chemically synthesized using the phosphoramidite solid support method or other well-known methods. Such nucleic acid sequences can also be modified using a number of means known in the art. Non-limiting examples of such modifications include methylation, capping, substitution of one or more homologs of a natural nucleotide, and modifications between nucleotides, such as uncharged linkages (e.g., methyl phosphonates, phosphotriesters). , phosphoroamidates, carbamates, etc.) or to charged linkages (eg, phosphorothioates, phosphorodithioates, etc.).

상기 "위암(gastric cancer)"은 위에 생기는 암을 말한다. 상기 위암은 선암(adenocarcinoma), 위 림프종(lymphoma), 위 간질성 종양(gastrointestinal tumor), 육종(sarcoma), 및 신경내분비암(neuroendocrine tumor)으로 이루어진 군으로부터 선택될 수 있다.The "gastric cancer" refers to cancer occurring in the stomach. The gastric cancer may be selected from the group consisting of adenocarcinoma, gastric lymphoma, gastric stromal tumor, sarcoma, and neuroendocrine tumor.

상기 "발병(develop 또는 onset)"은 병의 시작을 말한다. 상기 발병은 복통이나 열감 등 환자 자신의 자각적 증상(증후)나 제3자, 특히 의사에 의해 발견된 타각적 증상(징후)으로 시작되는 경우에는 증상이 없이 각종 임상검사에 의해서 처음으로 병의 시작을 아는 경우도 포함한다. 병에 따라서는(특히 종양), 상당히 병이 진전된 후에 처음으로 발병을 알게 되는 경우도 포함한다.The "develop or onset" refers to the onset of a disease. When the onset begins with subjective symptoms (symptoms) of the patient, such as abdominal pain or heat sensation, or objective symptoms (signs) discovered by a third party, especially a doctor, the onset of the disease is first detected by various clinical tests without symptoms. Including the case of knowing For some diseases (especially tumors), this includes cases where the onset is first noticed after a significant advance in the disease.

상기 "위험(risk)"은 질병이나 해로움이 생길 우려가 있거나 그런 상태를 말한다. 상기 위험은 특정 다형성 대립유전자를 보유하지 않은 개체의 구성원에서의 질환 또는 상태의 발생 빈도에 비교하여, 특정 다형성 대립유전자를 보유한 개체에서의 질환 또는 상태의 발생 빈도가 통계적으로 높음을 나타낸다. 상기 위험도는 어떤 특정한 위험이 어떤 기간 내에 발생하는 비율로서, 위험발생률이라고도 한다.The "risk" refers to a state in which there is a risk of developing a disease or harm. The risk indicates a statistically high frequency of occurrence of the disease or condition in an individual carrying a particular polymorphic allele compared to the frequency of occurrence of the disease or condition in members of an individual not carrying the particular polymorphic allele. The risk is a rate at which a certain risk occurs within a certain period of time, and is also referred to as a risk occurrence rate.

상기 "예측(predict)"은 환자가 위암 발병할 가능성이 있는지를 판별하는 것을 말한다. 예측은 화학요법 또는 방사선 치료 등 치료법에 대해 선호적으로 또는 비선호적으로 반응하여 환자의 치료, 예를 들어 특정 치료제, 및/또는 원발성 종양의 수술로 제거, 및/또는 암 재발 없이 특정 시기 동안 화학요법으로 치료된 후 생존할 여부 및/또는 가능성과 관련된다. 상기 예측 방법은 임의의 환자에 대한 위암 발병 위험도가 높은 환자로서, 특별하고 적절한 관리를 통하여 발병 시기를 늦추거나 발병하지 않도록 하거나 또는 위암 발병 환자에 대한 가장 적절한 치료 방식을 선택함으로써 치료 여부를 결정하기 위해 사용될 수 있다.The "predict" refers to determining whether a patient is likely to develop gastric cancer. Predictive is that a patient responds favorably or unfavorably to treatment, such as chemotherapy or radiotherapy, to treatment, e.g., a specific therapeutic agent, and/or surgical removal of a primary tumor, and/or chemotherapy for a specific period of time without recurrence of the cancer. It is related to whether and/or likelihood to survive after being treated with therapy. The prediction method is a patient with a high risk of developing gastric cancer for any patient. Through special and appropriate management, the onset time is delayed or prevented, or the most appropriate treatment method for gastric cancer patients is selected to determine whether to treat. can be used for

다른 양상은 일 양상에 따른 조성물을 포함하는 마이크로어레이를 제공한다.Another aspect provides a microarray comprising a composition according to one aspect.

상기 일 양상에 따른 조성물은 전술한 바와 같다.The composition according to the above aspect is as described above.

용어 "마이크로어레이(microarray)"는 기판 표면의 구분된 영역에 상기 폴리뉴클레오티드가 높은 밀도로 고정화되어 있는 것을 말한다. 상기 마이크로어레이는, 상기 영역이 예를 들면 400개/㎠ 이상, 103개/㎠ 이상, 또는 104개/㎠ 이상의 밀도로 기판 상에 배열되어 있는 것일 수 있다.The term “microarray” refers to immobilization of the polynucleotides at high density in discrete regions of a substrate surface. In the microarray, the regions may be arranged on a substrate at a density of, for example, 400/cm 2 or more, 10 3 cells/cm 2 or more, or 10 4 cells/cm 2 or more.

상기 마이크로어레이에 고정된 폴리뉴클레오티드는 DNA 또는 RNA일 수 있다. 상기 폴리뉴클레오티드는 단일 가닥 또는 이중 가닥일 수 있다. 상기 폴리뉴클레오티드는 천연 뉴클레오티드, 천연 뉴클레오티드의 유사체, 천연 뉴클레오티드의 당, 염기 또는 인산 부위가 변형되어 있는 뉴클레오티드, PNA(peptide nucleic acid), 및 이들의 조합을 포함할 수 있다. 상기 폴리뉴클레오티드는 검출가능한 표지(예를 들면, Cy3 또는 Cy5 형광성 물질)가 그의 3'-말단, 중간, 또는 5'-말단에 부착된 것일 수 있다.The polynucleotide immobilized on the microarray may be DNA or RNA. The polynucleotide may be single-stranded or double-stranded. The polynucleotide may include natural nucleotides, analogs of natural nucleotides, nucleotides in which sugars, bases or phosphate sites of natural nucleotides are modified, peptide nucleic acids (PNAs), and combinations thereof. The polynucleotide may have a detectable label (eg, Cy3 or Cy5 fluorescent substance) attached to its 3'-end, middle, or 5'-end.

상기 마이크로어레이에 고정되는 폴리뉴클레오티드는 길이가 약 5 내지 약 100 nt, 약 10 내지 약 80 nt, 약 10 내지 약 60 nt, 약 10 내지 약 50 nt, 약 10 내지 약 40 nt, 약 10 내지 약 30 nt, 또는 약 10 내지 약 20 nt일 수 있다.The polynucleotide immobilized on the microarray may have a length of about 5 to about 100 nt, about 10 to about 80 nt, about 10 to about 60 nt, about 10 to about 50 nt, about 10 to about 40 nt, or about 10 to about 80 nt in length. 30 nt, or about 10 to about 20 nt.

다른 양상은 일 양상에 따른 조성물을 포함하는 키트를 제공한다.Another aspect provides a kit comprising a composition according to one aspect.

상기 일 양상에 따른 조성물은 전술한 바와 같다.The composition according to the above aspect is as described above.

상기 키트는 PCR 키트 또는 DNA 칩 키트일 수 있으나, 이에 제한되지 않는다.The kit may be a PCR kit or a DNA chip kit, but is not limited thereto.

상기 키트는 필요에 따라 다른 구성성분 조성물(예를 들면 dNTP, 중합효소 및 발색제 등) 또는 장치를 더 포함할 수 있다. 상기 키트는 PCR을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. 상기 PCR 키트는 상기 위암 발병 예측용 조성물 외에도 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사 효소와 같은 효소, DNase, RNAse 억제제, DEPC-수(DEPC-water), 멸균수 등을 포함할 수 있다. 또한 정량 대조군으로 사용되는 유전자에 특이적인 프라이머 쌍을 포함할 수 있다. The kit may further include other component compositions (eg, dNTPs, polymerases, colorants, etc.) or devices as needed. The kit may be a kit containing essential elements required to perform PCR. The PCR kit, in addition to the composition for predicting the onset of gastric cancer, includes a test tube or other appropriate container, a reaction buffer (with varying pH and magnesium concentration), deoxynucleotides (dNTPs), enzymes such as Taq-polymerase and reverse transcriptase, DNase, RNAse inhibitors, DEPC-water, sterile water, and the like. It may also include a primer pair specific to a gene used as a quantitative control.

상기 키트는 DNA 칩으로 이용하기 위해 필요한 필수 요소를 포함할 수 있다. DNA 칩 키트는, 일반적으로 편평한 고체 지지판, 전형적으로는 현미경용 슬라이드보다 크지 않은 유리 표면에 핵산 종을 격자형 배열(gridded array)로 부착한 것으로, 칩 표면에 핵산이 일정하게 배열되어, DNA 칩 상의 핵산과 칩 표면에 처리된 용액 내에 포함된 상보적인 핵산 간에 다중 혼성화(hybridization) 반응이 일어나 대량 병렬 분석이 가능하도록 하는 도구이다. DNA 칩 키트는 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드(oligonucleotide)가 부착되어 있는 기판, 및 형광표지 프로브를 제작하기 위한 시약, 제제, 효소 등을 포함할 수 있다. 또한 기판은 대조군 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드를 포함할 수 있다.The kit may include essential elements necessary for use as a DNA chip. A DNA chip kit is a DNA chip kit in which nucleic acid species are attached in a gridded array to a generally flat solid support plate, typically a glass surface no larger than a slide for a microscope, and nucleic acids are regularly arranged on the surface of the chip. It is a tool that enables mass-parallel analysis by multiple hybridization reactions between nucleic acids on the chip surface and complementary nucleic acids included in the solution treated on the surface of the chip. The DNA chip kit may include a substrate to which cDNA or oligonucleotides corresponding to genes or fragments thereof are attached, and reagents, reagents, enzymes, and the like for producing fluorescently labeled probes. In addition, the substrate may include a cDNA or oligonucleotide corresponding to a control gene or a fragment thereof.

다른 양상은 개체로부터 수득된 핵산 시료로부터 서열번호 1 내지 서열번호 9로 이루어진 군으로부터 선택된 하나 이상의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위의 유전자형을 검출하는 단계; 및 검출된 유전자형으로부터 개체의 위암 발병 위험도를 산출하는 단계를 포함하는 위암 발병 위험도를 예측하는 방법을 제공한다.Another aspect is a polynucleotide consisting of one or more nucleic acid sequences selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 9 from a nucleic acid sample obtained from an individual, detecting the genotype of a polymorphic site at the 51st nucleotide from its 5'-end; and calculating the risk of gastric cancer of the individual from the detected genotype.

상기 폴리뉴클레오티드, 다형성 부위, 유전저형, 검출, 위암, 발병, 위험도, 및 예측은 전술한 바와 같다.The polynucleotide, polymorphic site, genotype, detection, gastric cancer, incidence, risk, and prediction are as described above.

상기 방법은 개체로부터 수득된 핵산 시료로부터 서열번호 1 내지 서열번호 9로 이루어진 군으로부터 선택된 하나 이상의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위의 유전자형을 검출하는 단계를 포함한다.The method comprises the steps of detecting the genotype of a polymorphic site at the 51st nucleotide from the 5'-end of a polynucleotide consisting of one or more nucleic acid sequences selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 9 from a nucleic acid sample obtained from an individual. include

상기 방법은 서열번호 10의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위의 유전자형을 검출하는 단계; 및 검출된 유전자형으로부터 개체의 위암 발병 위험도를 산출하는 단계를 더 포함할 수 있다.The method includes the steps of detecting the genotype of a polymorphic site at the 51st nucleotide from the 5'-end of a polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 10; and calculating a risk of gastric cancer of the individual from the detected genotype.

상기 방법은 개체의 생물학적 시료로부터 핵산 시료를 수득하는 단계를 더 포함할 수 있다.The method may further include obtaining a nucleic acid sample from a biological sample of the subject.

상기 개체는 인간을 포함한 포유동물일 수 있다. 상기 개체는 80세 이상, 70세 이상, 60세 이상, 50세 이상, 또는 40세 이상의 인간일 수 있다.The subject may be a mammal including a human. The subject may be a human over 80 years old, over 70 years old, over 60 years old, over 50 years old, or over 40 years old.

상기 생물학적 시료는 위암 발병 위험도를 평가하고자 하는 상기 개체로부터 수득된 시료를 말한다. 상기 생물학적 시료는 예를 들면 조직, 소변, 점액, 타액, 눈물, 혈액, 혈장, 혈청, 객담, 척수액, 흉수, 유두 흡인물, 림프액, 기도액, 장액, 비뇨생식관액, 모유, 림프계 체액, 정액, 뇌척수액, 기관계내 체액, 복수, 낭성 종양 체액, 양수액 또는 이들의 조합일 수 있다. 상기 생물학적 시료로부터 핵산 시료를 수득하는 단계는 통상의 DNA 분리방법에 의하여 수행될 수 있다. 예를 들어, 표적 핵산을 중합효소 연쇄 반응(polymerase chain reaction: PCR), 리가제 연쇄 반응(ligase chain reaction: LCR), 전사 증폭(transcription amplification) 또는 실시간-핵산 서열 기초 증폭(real time-nucleic acid sequence based amplification: NASBA)을 통하여 증폭하고 이를 정제하여 얻을 수 있다. 또한, 분지형 DNA(bDNA) 프로브의 사용이 증폭을 대체할 수 있다.The biological sample refers to a sample obtained from the subject whose risk of developing gastric cancer is to be evaluated. The biological sample may be, for example, tissue, urine, mucus, saliva, tears, blood, plasma, serum, sputum, spinal fluid, pleural fluid, nipple aspirate, lymph fluid, airway fluid, serous fluid, genitourinary tract fluid, breast milk, lymphatic body fluid, semen. , cerebrospinal fluid, intraorgan system fluid, ascites, cystic tumor fluid, amniotic fluid, or combinations thereof. Obtaining a nucleic acid sample from the biological sample may be performed by a conventional DNA isolation method. For example, target nucleic acids can be synthesized by polymerase chain reaction (PCR), ligase chain reaction (LCR), transcription amplification or real time-nucleic acid sequence based amplification. It can be obtained by amplification and purification through sequence based amplification: NASBA). Also, the use of branched DNA (bDNA) probes can replace amplification.

상기 유전자형을 검출하는 단계는 서열번호 1 내지 9로 이루어진 군으로부터 선택되는 하나 이상의 핵산 서열로 이루어진 폴리뉴클레오티드에서 상기 다형성부위를 포함하는 5개 이상의 연속 핵산 서열과 동일하거나 또는 상보적인 핵산 서열을 포함하는 프라이머 또는 프로브를 사용하여 수행될 수 있다. 상기 유전자형을 검출하는 단계는 서열번호 10의 핵산 서열로 이루어진 폴리뉴클레오티드에서 상기 다형성부위를 포함하는 5개 이상의 연속 핵산 서열과 동일하거나 또는 상보적인 뉴클레오티드 서열을 포함하는 프라이머 또는 프로브를 사용하여 수행되는 단계를 더 포함할 수 있다.The step of detecting the genotype includes a nucleic acid sequence identical to or complementary to 5 or more contiguous nucleic acid sequences including the polymorphic site in a polynucleotide consisting of one or more nucleic acid sequences selected from the group consisting of SEQ ID NOs: 1 to 9. This can be done using primers or probes. The step of detecting the genotype is carried out using primers or probes containing nucleotide sequences identical to or complementary to 5 or more contiguous nucleic acid sequences containing the polymorphic site in the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 10. may further include.

상기 유전자형을 검출하는 단계는 서열번호 1 내지 서열번호 9로 이루어진 군으로부터 선택된 하나 이상의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 이상의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드가 고정된 마이크로어레이에 상기 핵산 시료를 혼성화하여 수행될 수 있다. 상기 유전자형을 검출하는 단계는 서열번호 10의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 이상의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드가 고정된 마이크로어레이에 상기 핵산 시료를 혼성화하여 수행되는 단계를 더 포함할 수 있다.The step of detecting the genotype is a polynucleotide consisting of one or more nucleic acid sequences selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 9, 5 or more contiguous nucleic acid sequences including a polymorphic site at the 51st nucleotide from the 5'-end thereof and This may be performed by hybridizing the nucleic acid sample to a microarray on which the same or complementary polynucleotides are immobilized. In the step of detecting the genotype, in the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 10, a polynucleotide identical to or complementary to 5 or more contiguous nucleic acid sequences including a polymorphic site at the 51st nucleotide from its 5'-terminus is fixed. A step of hybridizing the nucleic acid sample to the microarray may be further included.

상기 다형성 부위, 프라이머, 프로브, 및 마이크로어레이는 전술한 바와 같다.The polymorphic site, primers, probes, and microarrays are as described above.

상기 유전자형을 검출하는 단계는 중합효소 연쇄 반응(polymerase chain reaction: PCR), 분자 비이콘(molecular beacon), 프라이머 신장법(primer extension) 등으로 수행될 수 있다. 구체적으로, 상기 유전자형을 검출은 상기 프라이머 또는 프로브가 고정된 마이크로어레이에 상기 핵산 시료를 혼성화시키고, 혼성화 결과를 분석함으로써 수행될 수 있다. 이때, 마이크로어레이 상에서의 핵산의 혼성화 및 혼성화 결과의 검출은 당업계에 잘 알려져 있다. 상기 검출은 예를 들면, 핵산 시료를 형광 물질 예를 들면 Cy3 및 Cy5와 같은 물질을 포함하는 검출가능한 신호를 발생시킬 수 있는 표지 물질로 표지한 다음, 마이크로어레이 상에 혼성화하고 상기 표지 물질로부터 발생하는 신호를 검출함으로써 혼성화 결과를 검출할 수 있다.Detecting the genotype may be performed by polymerase chain reaction (PCR), molecular beacon, primer extension, or the like. Specifically, the detection of the genotype may be performed by hybridizing the nucleic acid sample to a microarray to which the primer or probe is immobilized, and analyzing the hybridization result. At this time, hybridization of nucleic acids on a microarray and detection of hybridization results are well known in the art. The detection is, for example, by labeling a nucleic acid sample with a labeling material capable of generating a detectable signal including a fluorescent material such as Cy3 and Cy5, followed by hybridization on a microarray and generation from the labeling material. The hybridization result can be detected by detecting a signal that

상기 방법은 검출된 유전자형으로부터 개체의 위암 발병 위험도를 산출하는 단계를 포함한다.The method includes calculating a risk of developing gastric cancer of the individual from the detected genotype.

상기 위암 발병 위험도를 산출하는 단계는 다형성 부위의 유전자형에 유전자형 점수를 부여하는 단계를 포함할 수 있다. 상기 유전자형 점수는 1 내지 3의 정수일 수 있다. 예를 들어, 서열번호 3의 폴리뉴클레오티드의 다형성 부위에 대하여 유전자형 GG, GT 및 GA에 각각 α1, α2 및 α3의 값을 부여할 수 있다. 상기 α1, α2 및 α3의 값은 1 내지 3의 정수일 수 있다. 예를 들어, 유전자형 GG의 점수는 1, 유전자형 GA의 점수는 2, 및 GT의 유전자형 점수는 3일 수 있다.Calculating the risk of developing gastric cancer may include assigning a genotype score to a genotype of a polymorphic region. The genotype score may be an integer of 1 to 3. For example, for the polymorphic site of the polynucleotide of SEQ ID NO: 3, genotypes GG, GT, and GA respectively α 1 , Values of α 2 and α 3 can be assigned. The α 1 , The values of α 2 and α 3 may be integers from 1 to 3. For example, the score of genotype GG can be 1, the score of genotype GA can be 2, and the score of genotype GT can be 3.

상기 위암 발병 위험도를 산출하는 단계는 하기 수학식 1에 의해 위암 발병 위험도를 산출하는 단계를 포함할 수 있다: Calculating the risk of gastric cancer may include calculating the risk of gastric cancer by Equation 1 below:

<수학식 1><Equation 1>

위암 발병 위험도 = b + ∑(유전자형 점수 × a)Risk of gastric cancer = b + ∑ (genotype score × a)

상기 수학식 1에서, 상기 유전자형 점수는 개체에서 분석된 폴리뉴클레오티드의 다형성 부위의 유전자형에 부여된 점수로서, 서열번호 1 내지 서열번호 9로 이루어진 군으로부터 선택된 하나 이상의 핵산 서열로 이루어진 폴리뉴클레오티드의 다형성의 유전자형에 따라 부여된 유전자형 점수일 수 있다. 상기 a는 -0.3 내지 0.5의 값이고, 및 상기 b는 -3.0 내지 3.0의 값일 수 있다.In Equation 1, the genotype score is a score assigned to the genotype of the polymorphic site of the polynucleotide analyzed in the individual, and is a polymorphism of the polynucleotide consisting of one or more nucleic acid sequences selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 9. It may be a genotype score assigned according to the genotype. The a may be a value of -0.3 to 0.5, and the b may be a value of -3.0 to 3.0.

상기 위암 발병 위험도를 산출 시, 서열번호 10의 핵산 서열로 이루어진 폴리뉴클레오티드의 다형성의 유전자형에 따라 부여된 유전자형 점수가 더 추가되어 산출될 수 있다.When calculating the risk of gastric cancer, the genotype score assigned according to the genotype of the polymorphism of the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 10 may be further calculated.

상기 수학식 1에서, 상기 유전자형 점수는 전술한 바와 동일하다.In Equation 1, the genotype score is the same as described above.

상기 a는 볼트-선형 혼합 회귀 모델(BOLT-linear mixed model)에서 위암군과 정상군의 유전자형을 분석하여 산출된 상수일 수 있다. 상기 정상군은 위암으로 진단되지 않은 대조군일 수 있다. 상기 a는 볼트-선형 혼합 회귀 모델에서 산출된 효과 크기(effect size) 값일 수 있다. 상기 a는 약 -0.3 내지 약 0.5, 약 -0.2 내지 약 0.5, 약 -0.1 내지 약 0.5, 약 0 내지 약 0.5, 약 0.1 내지 약 0.5, 약 0.2 내지 약 0.5, 약 0.3 내지 약 0.5, 약 0.4 내지 약 0.5, 약 -0.3 내지 약 0.4, 약 -0.3 내지 약 0.3, 약 -0.3 내지 약 0.2, 약 -0.3 내지 약 0.1, 약 -0.3 내지 약 0, 약 -0.3 내지 약 -0.1, 또는 약 -0.3 내지 약 -0.2의 값일 수 있다.The a may be a constant calculated by analyzing the genotypes of the gastric cancer group and the normal group in a BOLT-linear mixed model. The normal group may be a control group not diagnosed with gastric cancer. The a may be an effect size value calculated from a Volt-linear mixed regression model. a is about -0.3 to about 0.5, about -0.2 to about 0.5, about -0.1 to about 0.5, about 0 to about 0.5, about 0.1 to about 0.5, about 0.2 to about 0.5, about 0.3 to about 0.5, about 0.4 to about 0.5, about -0.3 to about 0.4, about -0.3 to about 0.3, about -0.3 to about 0.2, about -0.3 to about 0.1, about -0.3 to about 0, about -0.3 to about -0.1, or about - It can be a value from 0.3 to about -0.2.

상기 b는 볼트-선형 혼합 회귀 모델에서 위암군과 정상군 간의 유전자형을 분석하여 산출된 상수일 수 있다. 상기 b는 볼트-선형 혼합 회귀 모델에서 산출된 회귀계수( 또는 y 절편) 값일 수 있다. 상기 b는 약 -3.0 내지 약 3.0, 약 -3.0 내지 약 2.0, 약 -3.0 내지 약 1.0, 약 -3.0 내지 약 0, 약 -3.0 내지 약 -1.0, 약 -3.0 내지 약 -2.0, 약 -2.0 내지 약 3.0, 약 -1.0 내지 약 3.0, 약 0 내지 약 3.0, 약 1.0 내지 약 3.0, 또는 약 2.0 내지 약 3.0의 값일 수 있다.The b may be a constant calculated by analyzing genotypes between the gastric cancer group and the normal group in a bolt-linear mixed regression model. The b may be a regression coefficient (or y-intercept) value calculated from a Volt-linear mixed regression model. b is about -3.0 to about 3.0, about -3.0 to about 2.0, about -3.0 to about 1.0, about -3.0 to about 0, about -3.0 to about -1.0, about -3.0 to about -2.0, about -2.0 to about 3.0, about -1.0 to about 3.0, about 0 to about 3.0, about 1.0 to about 3.0, or about 2.0 to about 3.0.

상기 방법은 산출된 위암 발병 위험도에 따라 개체의 위암 발병 위험도를 양호 및 위험 중 어느 한 등급으로 결정하는 단계를 더 포함할 수 있다. 상기 방법은 위험 점수를 산출하고, 산출된 값을 정규화할 수 있다. 정규화된 위험 점수를 높은 순으로 나열하여 3:7로 나누고, 상위 30%를 위험 및 하위 70%를 양호로 결정하는 단계를 더 포함할 수 있다.The method may further include determining the individual's risk of gastric cancer as a grade of good or dangerous according to the calculated risk of gastric cancer. The method may calculate a risk score and normalize the calculated value. The method may further include dividing the normalized risk scores by 3:7 in ascending order, and determining that the upper 30% are risky and the lower 70% are good.

상기 위암 발병 위험도 예측 방법은 80세 이상, 80세 미만, 70세 미만, 60세 미만, 50세 미만, 또는 40세 미만의 개체에서 수득한 시료를 이용하는 것일 수 있다. 본 발병의 일 구체예에서 상기 10개의 위암 특이적 SNP를 이용하여 산출한 위암 발병 위험도 결과와 rs377176971 및 rs143472300를 이용하여 산출한 위암 발병 위험도 결과에서 모두 60세 미만 그룹에서 보다 더 높은 예측 정확도를 나타내었다(도 7 내지 도 10). 상기 결과를 통해, 일 양상에 따른 방법은 60세 미만의 개체에서 실시하는 것이 가장 정확한 예측 결과를 도출할 수 있음을 예상할 수 있다.The gastric cancer risk prediction method may use a sample obtained from an individual aged 80 years or older, younger than 80 years old, younger than 70 years old, younger than 60 years old, younger than 50 years old, or younger than 40 years old. In one embodiment of the present invention, the gastric cancer risk results calculated using the 10 gastric cancer-specific SNPs and the gastric cancer risk results calculated using rs377176971 and rs143472300 showed higher prediction accuracy than the group under 60 years of age. (Figs. 7 to 10). Through the above results, it can be expected that the method according to one aspect can derive the most accurate prediction result when it is performed on an individual under the age of 60.

일 양상에 따른 조성물, 마이크로어레이, 키트 및 이를 이용하여 개체의 위암 발병 위험도를 예측하는 방법 또는 위암 발병 위험도 예측에 필요한 정보를 제공하기 위하여 개체의 SNP를 분석하는 방법에 의하면, 개체의 위암 발병 위험도를 정확하고 간편하게 예측할 수 있다. 따라서, 본 발명은 위암 발병을 예방하는데 도움을 줄 수 있다.According to the composition, microarray, kit and method for predicting the risk of gastric cancer of an individual using the composition, microarray, and kit according to one aspect, or the method of analyzing an individual's SNPs to provide information necessary for predicting the risk of gastric cancer, the risk of gastric cancer of an individual can be accurately and easily predicted. Thus, the present invention can help prevent the development of gastric cancer.

도 1은 전장 유전체 연관성 분석(GWAS) 결과를 맨해튼 플랏(manhattan plot)으로 나타낸 그래프이다.
도 2는 전장 유전체 연관성 분석(GWAS) 결과 중 위암 발병과 상관성이 높은 상위 10개의 신규한 위암 SNP 마커를 선별한 결과를 나타낸 도면이다.
도 3은 10개의 선별된 위암 SNP 마커에 대해 회귀분석을 통한 위험 점수를 산출하는 방식에 따른 위암 발병 연관성 및 예측 정확도를 평가한 결과를 나타낸 도면이다.
도 4는 10개의 선별된 위암 SNP 마커에 대해 회귀분석을 통한 연령별(60대, 70대, 및 80대)의 위암 발병 연관성 및 위험 점수의 예측 정확도를 평가한 결과를 나타낸 도면이다.
도 5는 10개의 선별된 위암 SNP 마커 중 상위 2개(rs377176971 또는 GC-0001, 및 rs143172300 또는 GC-0002)의 SNP 마커의 유전자 변이에 대해 회귀분석을 통한 위암 발병 연관성을 확인한 결과를 나타낸 도면이다.
도 6은 10개의 선별된 위암 SNP 마커 중 상위 2개(rs377176971 또는 GC-0001, rs143172300 또는 GC-0002)의 SNP 마커의 유전자 변이 조합별에 회귀분석을 통한 위암 발병 연관성을 확인한 결과를 나타낸 도면이다.
도 7은 유전자 위험 점수 산출식에 따라 분류된 유전자 위험도 그룹(risk) 및 유전자 비위험도 그룹(normal)에서 위암 발병률(상단) 및 연령별(60대, 70대, 및 80대)의 위암 발병률을 분석한 결과를 나타낸 도면(하단)이다.
도 8은 유전자 위험 점수 공식에 따라 분류된 유전자 위험도 그룹(risk) 및 유전자 비위험도 그룹(normal)에서 연령별(60대, 70대, 및 80대)의 위암 발병률 분석에 대한 예측 성능 검증을 실시한 결과를 나타낸 도면이다.
도 9는 유전자 위험 점수 공식에 따라 분류된 유전자 위험도 그룹(risk) 및 유전자 비위험도 그룹(normal)에서 연령별(60대, 70대, 80대)의 위암 발병률을 나타낸 그래프(우측) 및 도면이다(중간 및 좌측).
도 10은 유전자 위험 점수 공식에 따라 분류된 유전자 위험도 그룹(risk) 및 유전자 비위험도 그룹(normal)에서 선별된 위암 SNP인 rs377176971(GC-0001)의 유전자 변이별 위암 발병률을 분석한 결과를 나타낸 그래프(우측) 및 도면(좌측)이다.
도 11은 유전자 위험 점수 공식에 따라 분류된 유전자 위험도 그룹 및 유전자 비위험도 그룹에서 선별된 위암 SNP인 rs143472300(GC-0002)의 유전자 변이별 위암 발병률을 분석한 결과를 나타낸 그래프(우측) 및 도면(좌측)이다.
1 is a graph showing the genome-wide association analysis (GWAS) results as a Manhattan plot.
2 is a diagram showing the results of selecting the top 10 new gastric cancer SNP markers highly correlated with gastric cancer incidence among the results of whole genome association analysis (GWAS).
3 is a diagram showing the results of evaluating the gastric cancer incidence association and prediction accuracy according to a method of calculating risk scores through regression analysis for 10 selected gastric cancer SNP markers.
FIG. 4 is a diagram showing the results of evaluation of association with gastric cancer incidence and prediction accuracy of risk scores by age (60s, 70s, and 80s) through regression analysis for 10 selected gastric cancer SNP markers.
5 is a diagram showing the results of confirming the association with gastric cancer incidence through regression analysis on genetic mutations of the top two SNP markers (rs377176971 or GC-0001, and rs143172300 or GC-0002) among 10 selected gastric cancer SNP markers. .
6 is a view showing the results of confirming the association of gastric cancer incidence through regression analysis for each genetic mutation combination of the top two (rs377176971 or GC-0001, rs143172300 or GC-0002) SNP markers among 10 selected gastric cancer SNP markers. .
Figure 7 analyzes the incidence of gastric cancer (top) and the incidence of gastric cancer by age (60s, 70s, and 80s) in a genetic risk group (risk) and a gene non-risk group (normal) classified according to the genetic risk score calculation formula. It is a drawing showing the result (bottom).
8 is a result of predictive performance verification for gastric cancer incidence analysis by age (60s, 70s, and 80s) in a genetic risk group (risk) and a genetic non-risk group (normal) classified according to the genetic risk score formula is a drawing showing
9 is a graph (right) and a diagram showing the incidence of gastric cancer by age (60s, 70s, 80s) in a genetic risk group (risk) and a genetic non-risk group (normal) classified according to the genetic risk score formula ( middle and left).
10 is a graph showing the results of analyzing the incidence of gastric cancer by genetic mutation of rs377176971 (GC-0001), a gastric cancer SNP selected from a genetic risk group (risk) and a genetic non-risk group (normal) classified according to the genetic risk score formula; (right) and drawings (left).
11 is a graph (right) and diagram (right) showing the results of analyzing the incidence of gastric cancer by genetic mutation of rs143472300 (GC-0002), a gastric cancer SNP selected from a genetic risk group and a genetic non-risk group classified according to a genetic risk score formula; left) is.

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.Hereinafter, the present invention will be described in more detail through examples. These examples are only for exemplifying the present invention, and it will be apparent to those skilled in the art that the scope of the present invention is not to be construed as being limited by these examples.

실시예 1. 위암 특이적 SNP 탐색Example 1. Gastric cancer-specific SNP search

한국인 약 51,000명 코호트에 대한 한국인 칩(Korean chip v1.1_SNP microarray chip, 자체 제조)을 통하여 유전자 검사를 수행하고 유전체 데이터를 구축하였다. 구축한 유전체 데이터를 위암군과 정상군으로 구분하여 전장 유전체 연관성 분석(GWAS)을 수행하였다(도 1). 이때, 연관성 변이를 구축하는 임계값은 p-값 < 5×10-8으로 설정하였고, The R Project for Statistical Computing (https://www.r-project.org/)을 이용하여 분석을 실시하였다. 그 결과, 위암 전체 결과에서 최적의 위험도 예측을 위한 SNP를 총 636개 선별하였다.Genetic testing was performed on a cohort of approximately 51,000 Koreans using a Korean chip (Korean chip v1.1_SNP microarray chip, self-manufactured) and genomic data were constructed. Genome association analysis (GWAS) was performed by dividing the constructed genome data into a gastric cancer group and a normal group (FIG. 1). At this time, the critical value for constructing the association variance was set to p-value < 5 × 10 -8 , and the analysis was performed using The R Project for Statistical Computing (https://www.r-project.org/). . As a result, a total of 636 SNPs for optimal risk prediction were selected from the overall gastric cancer results.

선별된 유전자 변이들에 대한 게놈 윈도우(genomic window)를 ±250 KB로 설정하고 LD block은 R2 > 0.2로 설정하여 크럼핑(clumping) 또는 프루닝(pruning)을 진행하였다. 크럼핑은 각 연관비평형(Linkage disequilibrium: LD) 블록에서 가장 중요한 SNP를 식별하고 선택하기 위한 추가 과정을 진행하는 방법을 말하고, 프루닝은 대략적인 연관평형(linkage equilibrium: LE) 관계에 있는 마커의 부분 집합을 선별하는 방법을 말한다. 크럼핑 또는 프루닝된 636개의 SNP 중 데이터에서 머신 러닝(machine learning) 방법을 통하여 위암에 대한 중요도를 구하여 순위를 선정하였다. 상기 선별된 마커 중 강한 신호를 갖고, 게놈 윈도우 당 중복되지 않는 바이오마커들을 선별하여 총 10개의 SNP 바이오마커를 발굴하였다(표 1 및 도 2)(CHR: 염색체 번호, BP: 염색체 중 위치, A1: 대립형질(minor allele), MAF: 대립유전자형빈도(minor allele frequency), OR: 승산비(odd ratio), CI: 신뢰구간(confidence interval)).The genomic window for the selected genetic mutations was set to ±250 KB, and the LD block was set to R 2 > 0.2 to perform clumping or pruning. Krumping refers to a method of proceeding with an additional process to identify and select the most important SNPs in each linkage disequilibrium (LD) block, while pruning refers to markers in approximate linkage equilibrium (LE) relationships. How to select a subset of Among the 636 crumpled or pruned SNPs, the importance of gastric cancer was obtained through a machine learning method from the data, and the rankings were selected. A total of 10 SNP biomarkers were discovered by selecting biomarkers that had strong signals among the selected markers and did not overlap per genomic window (Table 1 and FIG. 2) (CHR: chromosome number, BP: location in chromosome, A1 : allele, MAF: minor allele frequency, OR: odds ratio, CI: confidence interval).

SNPSNPs 서열order 서열번호sequence number rs377176971rs377176971 CATTTGTTTTTGTCCATTGATTCTTTAGGATAGTGAATGAGCAGCTACAG [C/T] GGTCAGTTGATGACTATCAGCACCGACTTTCCATAAAAAGAGGTGAACTTCATTTGTTTTTGTCCATTGATTCTTTAGGATAGTGAATGAGCAGCTACAG [C/T] GGTCAGTTGATGACTATCAGCACCGACTTTCCATAAAAAGAGGTGAACTT 1One rs78381605rs78381605 AGATTATTTCAACCCTAAGAAAGAATAAAAAAACACCATACCCTAAACTT [G/A] CGTGTTCTCAATAAAATAATAGAGTTATTAAACTAACTGGTTGTGTCCAAAGATTATTTCAACCCTAAGAAAGAATAAAAAAACACCATACCCTAAACTT [G/A] CGTGTTCTCAATAAAATAATAGAGTTATTAAACTAACTGGTTGTGTCCAA 22 rs145516817rs145516817 AAATGGTGACAGGAAACATTTTAAAAGAAACATGTATTAATCACCTACAG [G/T] GTAGTTAGCTCAGTGTCATTTACTTTAGGTGCTATAAAATACGGAAGAAAAAATGGTGACAGGAAACATTTTAAAAGAAACATGTATTAATCACCTACAG [G/T] GTAGTTAGCTCAGTGTCATTTACTTTAGGTGCTATAAAATACGGAAGAAA 33 rs114167943rs114167943 CGAGGTGGCCGTCCACTGGAGGGCGCTGGTCGGGGGCCTGACGGCCGGCG [C/T] CGCGCTGCTGGTGCTGCTGCTGCTGGCGCTGGGCGTCCGGGCGGTGCGCTCGAGGTGGCCGTCCACTGGAGGGCGCTGGTCGGGGGCCTGACGGCCGGCG [C/T] CGCGCTGCTGGTGCTGCTGCTGCTGGCGCTGGGCGTCCGGGCGGTGCGCT 44 rs150274610rs150274610 ACAAATAAAACAGGAAAAACAGAGTTATCATTTACCGAGATGAGCACAAC [C/A] AAGAACGGCCTGCCCTGAGGGACAGAGTAACAAAAGATCAGTTTAGCTTGACAAATAAAACAGGAAAAACAGAGTTATCATTTACCGAGATGAGCACAAC [C/A] AAGAACGGCCTGCCCTGAGGGACAGAGTAACAAAGATCAGTTTAGCTTG 55 rs10674898rs10674898 ATTTGGGTGGGGACACAGATCCAAACTATATCACAACTGTAAAAAAAAAA [AAAA/AA] GACAAAGAAGAAAGCAAAGAAAGGAAAAGAGTGTGAAATTCCTGCTCCTGATTTGGGTGGGGACACAGATCCAAACTATATCACAACTGTAAAAAAAAAA [AAAA/AA] GACAAAGAAGAAAGCAAAGAAAGGAAAAGAGTGTGAAATTCCTGCTCCTG 66 rs143172300rs143172300 CGTGGAGCGCCAGGGCGTCCGACCTCTGCACCTGAGAGAAGATGAACACG [G/A] CCGACCAGGCCCGGGTGGGGCCCGCGGACGACGGGCCTGCGCCGTCTGGGCGTGGAGCGCCAGGGCGTCCGACCTCTGCACCTGAGAGAAGATGAACACG [G/A] CCGACCAGGCCCGGGTGGGGCCCGCGGACGACGGGCCTGCGCCGTCTGGG 77 rs373412232rs373412232 TGATTCTGAGATAGCTGTAATCTGTCCTCTGTGACCCCACAGCTGACAAT [C/T] GGAAAAAGCAGAGGGTCCCGCAACGGGAGCGGAAGCGGCATGACTTCTCCTGATTTCTGAGATAGCTGTAATCTGTCCTCTGTGACCCCACAGCTGACAAT [C/T] GGAAAAAGCAGAGGGTCCCGCAACGGGAGCGGAAGCGGCATGACTTCTCC 88 rs2470155rs2470155 CCTAAACCATCATCCACTTTACTTTCTCATCTGTAGAAATTTTCTAGGGA [G/T] GGAAAAAGCAGACTAGATGGTTTCTAAGGACTCTTCTAGCTTGGCCATTTCCTAAACCATCATCCACTTTACTTTCTCATCTGTAGAAATTTTCTAGGGA [G/T] GGAAAAAGCAGACTAGATGGTTTCTAAGGACTCTTCTAGCTTGGCCATTT 99 rs760077rs760077 CTGCCGCGCCTTCAGGGGTTCGGGGCTCCACTTGGACGAGGCGCCGTGAC [T/A] CTCCGAGGCGCGCCGGGCCGACAGCGCTGTCCCGCTACGTGGGCCACCTCCTGCCGCGCCTTCAGGGGTTCGGGGCTCCACTTGGACGAGGCGCCGTGAC [T/A] CTCCGAGGCGCGCCGGGCCGACAGCGCTGTCCCGCTACGTGGGCCACCTC 1010

실시예 2. 선별된 위암 특이적 SNP 마커의 유의성 검증Example 2. Significance verification of selected gastric cancer-specific SNP markers

상기 실시예 1의 방법으로 선별된 10개의 SNP를 토대로 The R Project for Statistical Computing (https://www.r-project.org/)을 이용하여 실시예 1에서 상기 SNP 선별에 사용된 유전자 샘플을 제공한 위암군과 정상군에 대하여, 유전자 위험 점수 산출 방식에 따른 정확성을 평가하였다. 통계적 처리는 총 11가지의 알고리즘을 이용하였으며, 그 결과는 도 3에 나타내었다.Based on the 10 SNPs selected by the method of Example 1, The R Project for Statistical Computing (https://www.r-project.org/) was used to generate the genetic samples used for the SNP selection in Example 1. For the provided gastric cancer group and normal group, the accuracy according to the genetic risk score calculation method was evaluated. A total of 11 algorithms were used for statistical processing, and the results are shown in FIG. 3 .

도 3에 나타낸 바와 같이 총 11개의 분석 모델 중 boosting 분석 모델을 사용한 경우, AUC(area under curve) 값이 0.63으로 가장 정확하게 위암 발병 위험도를 예측 가능할 수 있었다(PPV: 양성예측도, NPV: 음성예측도).As shown in FIG. 3, when the boosting analysis model was used among a total of 11 analysis models, the AUC (area under curve) value was 0.63, which could most accurately predict the risk of gastric cancer (PPV: positive predictive value, NPV: negative predictive value Degree).

또한, 상기 10개의 SNP를 토대로 볼트-선형 혼합 회귀모델을 이용하여 연령별(60대, 70대, 80대) 층화분석을 실시한 결과, 도 4에 나타낸 바와 같이 60대에서 가장 정확하게 위암 발병도를 예측하였다(AUC=0.64).In addition, as a result of stratification analysis by age (60s, 70s, 80s) using a bolt-linear mixed regression model based on the 10 SNPs, the incidence of gastric cancer was most accurately predicted in the 60s as shown in FIG. (AUC=0.64).

상기 10개의 SNP 중 분석 결과에서 가장 유의하게 나타난 2개의 SNP(rs377176971 또는 GC-0001(서열번호 1), 및 rs143472300 또는 GC-0002(서열번호 7))에 대하여 위암 발병률 및 유전자 위험 점수의 정확성을 확인하였다. 그 결과, rs377176971(GC-0001, 서열번호 1)의 경우, C가 T로 변이된 경우 위암 발병률이 8.8배 증가하였고, rs143472300(GC-0002, 서열번호 7)의 경우, G가 A로 변이된 경우, 위암 발병률이 8.1배 증가하였음을 확인하였다(도 5). 또한, 상기 2개의 SNP의 유전자 변이의 조합별로 위암 발병률을 예측한 결과, rs377176971의 C 및 rs143472300의 G가 각각 T 및 A로 모두 변이된 경우, 위암 발병률이 3.7배로 증가하여 가장 높았다(도 6).For the two SNPs (rs377176971 or GC-0001 (SEQ ID NO: 1), and rs143472300 or GC-0002 (SEQ ID NO: 7)) that appeared most significantly in the analysis results among the 10 SNPs, the accuracy of gastric cancer incidence and genetic risk scores Confirmed. As a result, in the case of rs377176971 (GC-0001, SEQ ID NO: 1), the incidence of gastric cancer increased 8.8 times when C was mutated to T, and in the case of rs143472300 (GC-0002, SEQ ID NO: 7), when G was mutated to A In this case, it was confirmed that the incidence of gastric cancer increased 8.1 times (FIG. 5). In addition, as a result of predicting the incidence of gastric cancer for each combination of genetic mutations of the two SNPs, when C of rs377176971 and G of rs143472300 were both mutated to T and A, respectively, the incidence of gastric cancer increased by 3.7 times and was the highest (FIG. 6) .

실시예 3. 선별된 위암 특이적 SNP 마커를 이용한 위암 발병 위험도 공식 구축 및 검증Example 3. Gastric cancer risk formula construction and verification using selected gastric cancer-specific SNP markers

상기 실시예 2에서 가장 높은 예측 정확도를 나타내었던 boosting 예측 모델을 바탕으로 다유전자 위험 점수 산출 방식을 공식화하여 위암 발병 위험도를 예측하는 수학식을 구축하여 하기 수학식 2에 나타내었다.Based on the boosting prediction model that showed the highest prediction accuracy in Example 2, a polygenic risk score calculation method was formulated to construct a formula for predicting the risk of gastric cancer, which is shown in Equation 2 below.

<수학식 2><Equation 2>

위암 발병 위험도(유전자 위험 점수) = -2.651 + [(-0.1608 × rs760077에서 다향성 부위 A 점수) + (0.4053 × rs377176971에서 다형성 부위 T의 점수) + (0.1038 × rs78381605에서 다형성 부위 A의 점수) + (0.1584 × rs145516817에서 다형성 부위 T의 점수) + (0.3743 × rs114167943에서 다형성 부위 T의 점수) + (0.0309 × rs150274610에서 다형성 부위 A의 점수) + (0.1342 × rs10674898에서 다형성 부위 TAA의 점수) + (0.3643 × rs143172300에서 다형성 부위 A의 점수) + (-0.2912 × rs373412232에서 다형성 부위 T의 점수) + (-0.2592 × rs2470155에서 다형성 부위 T의 점수)]Gastric cancer risk (genetic risk score) = -2.651 + [(polymorphic site A score at -0.1608 × rs760077) + (polymorphic site T score at 0.4053 × rs377176971) + (polymorphic site A score at 0.1038 × rs78381605) + (score of polymorphic site T at 0.1584 × rs145516817) + (score of polymorphic site T at 0.3743 × rs114167943) + (score of polymorphic site A at 0.0309 × rs150274610) + (score of polymorphic site TAA at 0.1342 × rs10674898) + (0.3643 × score of polymorphic site A at rs143172300) + (score of polymorphic site T at -0.2912 × rs373412232) + (score of polymorphic site T at -0.2592 × rs2470155)]

상기 수학식 2에서 10개의 SNP에 대해 유전자형에 따라 0,1 또는 2의 점수를 부여하였다. 각각의 유전자형이 비위험/비위험 인 경우 1점을 부여하였고, 비위험/위험인 경우 2점을 부여하였고, 위험/위험인 경우 3점을 부여하였다. In Equation 2, scores of 0, 1, or 2 were assigned to the 10 SNPs according to the genotype. For each genotype, 1 point was assigned for non-risk/non-risk, 2 points for non-risk/risk, and 3 points for risk/risk.

상기 수학식 2를 토대로 산출한 유전자 위험 점수를 개인에게 부여하고 이를 토대로 유전자 위험도 그룹을 분류하였다. Genetic risk scores calculated based on Equation 2 were assigned to individuals, and genetic risk groups were classified based on this.

상기 유전자 위험도 그룹(risk)을 위암 환자군에서 시간 경과에 따른 위암 발병 위험도 변화량을 제시하는 모델을 확립하고 그 결과를 도 7 내지 도 10에 나타내었다(HR: 위험비(Hazard Ratio), C-index: 일치지수(concordance index)).A model presenting the change in risk of gastric cancer over time was established for the genetic risk group (risk) in the gastric cancer patient group, and the results are shown in FIGS. 7 to 10 (HR: Hazard Ratio, C-index). : concordance index).

그 결과, 유전자 비위험도 그룹(normal)에 비하여 유전자 위험도 그룹(risk)로 분류된 군에서 위암 발병률이 높게 예측되었고, 연령별 위암 발병률(도 8) 및 사망 위험도도 증가하였다(도 7). 특히, 상기 10개의 SNP를 사용한 유전자 위험 점수에 따른 위암 발병 위험도 예측 결과와 rs377176971(GC-0001) 및 rs143472300(GC-0002)를 사용한 유전자 위험 점수에 따른 위암 발병 위험도 예측 결과(도 10 및 11)에서 모두 60세 미만 그룹에서 보다 더 높은 예측 정확도를 나타내었다. 상기 결과를 통해, 위암의 경우 50세 내지 60세에서의 유전자 검사를 통한 예측 정확도가 가장 높을 것으로 예측된다.As a result, compared to the gene non-risk group (normal), the gastric cancer incidence rate was predicted to be higher in the group classified as genetic risk group (normal), and the gastric cancer incidence rate by age (FIG. 8) and the risk of death also increased (FIG. 7). In particular, gastric cancer risk prediction results according to genetic risk scores using the 10 SNPs and gastric cancer risk prediction results according to genetic risk scores using rs377176971 (GC-0001) and rs143472300 (GC-0002) (Figs. 10 and 11) All of them showed higher prediction accuracy than the group under 60 years of age. Through the above results, in the case of gastric cancer, it is predicted that the prediction accuracy through genetic testing at the age of 50 to 60 will be the highest.

<110> basgenbio Co., Ltd. <120> Composition for predicting a risk of developing gastric cancer and method using the same <130> SPD21-088/BSG <160> 10 <170> KoPatentIn 3.0 <210> 1 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> rs377176971 <220> <221> variation <222> (51) <223> C at position 51 is a single nucleotide polymorphism of T. <400> 1 catttgtttt tgtccattga ttctttagga tagtgaatga gcagctacag cggtcagttg 60 atgactatca gcaccgactt tccataaaaa gaggtgaact t 101 <210> 2 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> rs78381605 <220> <221> variation <222> (51) <223> G at position 51 is a single nucleotide polymorphism of A. <400> 2 agattatttc aaccctaaga aagaataaaa aaacaccata ccctaaactt gcgtgttctc 60 aataaaataa tagagttatt aaactaactg gttgtgtcca a 101 <210> 3 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> rs145516817 <220> <221> variation <222> (51) <223> G at position 51 is a single nucleotide polymorphism of T. <400> 3 aaatggtgac aggaaacatt ttaaaagaaa catgtattaa tcacctacag ggtagttagc 60 tcagtgtcat ttactttagg tgctataaaa tacggaagaa a 101 <210> 4 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> rs114167943 <220> <221> variation <222> (51) <223> C at position 51 is a single nucleotide polymorphism of T. <400> 4 cgaggtggcc gtccactgga gggcgctggt cgggggcctg acggccggcg ccgcgctgct 60 ggtgctgctg ctgctggcgc tgggcgtccg ggcggtgcgc t 101 <210> 5 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> rs150274610 <220> <221> variation <222> (51) <223> C at position 51 is a single nucleotide polymorphism of A. <400> 5 acaaataaaa caggaaaaac agagttatca tttaccgaga tgagcacaac caagaacggc 60 ctgccctgag ggacagagta acaaaagatc agtttagctt g 101 <210> 6 <211> 104 <212> DNA <213> Artificial Sequence <220> <223> rs10674898 <220> <221> variation <222> (51)..(55) <223> AAAA at positions 51 to 55 is a single nucleotide polymorphism of AA. <400> 6 atttgggtgg ggacacagat ccaaactata tcacaactgt aaaaaaaaaa aaaagacaaa 60 gaagaaagca aagaaaggaa aagagtgtga aattcctgct cctg 104 <210> 7 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> rs143172300 <220> <221> variation <222> (51) <223> G at position 51 is a single nucleotide polymorphism of A. <400> 7 cgtggagcgc cagggcgtcc gacctctgca cctgagagaa gatgaacacg gccgaccagg 60 cccgggtggg gcccgcggac gacgggcctg cgccgtctgg g 101 <210> 8 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> rs373412232 <220> <221> variation <222> (51) <223> C at position 51 is a single nucleotide polymorphism of T. <400> 8 tgattctgag atagctgtaa tctgtcctct gtgaccccac agctgacaat cggaaaaagc 60 agagggtccc gcaacgggag cggaagcggc atgacttctc c 101 <210> 9 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> rs2470155 <220> <221> variation <222> (51) <223> G at position 51 is a single nucleotide polymorphism of T. <400> 9 cctaaaccat catccacttt actttctcat ctgtagaaat tttctaggga gggaaaaagc 60 agactagatg gtttctaagg actcttctag cttggccatt t 101 <210> 10 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> rs760077 <220> <221> variation <222> (51) <223> T at position 51 is a single nucleotide polymorphism of A. <400> 10 ctgccgcgcc ttcaggggtt cggggctcca cttggacgag gcgccgtgac tctccgaggc 60 gcgccgggcc gacagcgctg tcccgctacg tgggccacct c 101 <110> basgenbio Co., Ltd. <120> Composition for predicting a risk of developing gastric cancer and method using the same <130> SPD21-088/BSG <160> 10 <170> KoPatentIn 3.0 <210> 1 <211> 101 <212> DNA <213> artificial sequence <220> <223> rs377176971 <220> <221> variation <222> (51) <223> C at position 51 is a single nucleotide polymorphism of T. <400> 1 catttgtttt tgtccattga ttctttagga tagtgaatga gcagctacag cggtcagttg 60 atgactatca gcaccgactt tccataaaaa gaggtgaact t 101 <210> 2 <211> 101 <212> DNA <213> artificial sequence <220> <223> rs78381605 <220> <221> variation <222> (51) <223> G at position 51 is a single nucleotide polymorphism of A. <400> 2 agattatttc aaccctaaga aagaataaaa aaacaccata ccctaaactt gcgtgttctc 60 aataaaataa tagagttat aaactaactg gttgtgtcca a 101 <210> 3 <211> 101 <212> DNA <213> artificial sequence <220> <223> rs145516817 <220> <221> variation <222> (51) <223> G at position 51 is a single nucleotide polymorphism of T. <400> 3 aaatggtgac aggaaacatt ttaaaagaaa catgtattaa tcacctacag ggtagttagc 60 tcagtgtcat ttactttagg tgctataaaa tacggaagaa a 101 <210> 4 <211> 101 <212> DNA <213> artificial sequence <220> <223> rs114167943 <220> <221> variation <222> (51) <223> C at position 51 is a single nucleotide polymorphism of T. <400> 4 cgaggtggcc gtccactgga gggcgctggt cggggggcctg acggccggcg ccgcgctgct 60 ggtgctgctg ctgctggcgc tgggcgtccg ggcggtgcgc t 101 <210> 5 <211> 101 <212> DNA <213> artificial sequence <220> <223> rs150274610 <220> <221> variation <222> (51) <223> C at position 51 is a single nucleotide polymorphism of A. <400> 5 acaaataaaa caggaaaaac agagttatca tttaccgaga tgagcacaac caagaacggc 60 ctgccctgag ggacagagta acaaaagatc agtttagctt g 101 <210> 6 <211> 104 <212> DNA <213> artificial sequence <220> <223> rs10674898 <220> <221> variation <222> (51)..(55) <223> AAAA at positions 51 to 55 is a single nucleotide polymorphism of AA. <400> 6 atttgggtgg ggacacagat ccaaactata tcacaactgt aaaaaaaaaa aaaagacaaa 60 gaagaaagca aagaaaggaa aagagtgtga aattcctgct cctg 104 <210> 7 <211> 101 <212> DNA <213> artificial sequence <220> <223> rs143172300 <220> <221> variation <222> (51) <223> G at position 51 is a single nucleotide polymorphism of A. <400> 7 cgtggagcgc cagggcgtcc gacctctgca cctgagagaa gatgaacacg gccgaccagg 60 cccgggtggg gcccgcggac gacgggcctg cgccgtctgg g 101 <210> 8 <211> 101 <212> DNA <213> artificial sequence <220> <223> rs373412232 <220> <221> variation <222> (51) <223> C at position 51 is a single nucleotide polymorphism of T. <400> 8 tgattctgag atagctgtaa tctgtcctct gtgaccccac agctgacaat cggaaaaagc 60 agagggtccc gcaacgggag cggaagcggc atgacttctc c 101 <210> 9 <211> 101 <212> DNA <213> artificial sequence <220> <223> rs2470155 <220> <221> variation <222> (51) <223> G at position 51 is a single nucleotide polymorphism of T. <400> 9 cctaaaccat catccacttt actttctcat ctgtagaaat tttctaggga gggaaaaagc 60 agactagatg gtttctaagg actcttctag cttggccatt t 101 <210> 10 <211> 101 <212> DNA <213> artificial sequence <220> <223> rs760077 <220> <221> variation <222> (51) <223> T at position 51 is a single nucleotide polymorphism of A. <400> 10 ctgccgcgcc ttcaggggtt cggggctcca cttggacgag gcgccgtgac tctccgaggc 60 gcgccgggcc gacagcgctg tcccgctacg tgggccacct c 101

Claims (12)

서열번호 1의 핵산 서열로 이루어진 폴리뉴클레오티드 및 서열번호 7의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 내지 100개의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드를 포함하는
위암 발병 위험도를 예측하기 위한 조성물.
In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 1 and the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 7, 5 to 100 contiguous nucleic acid sequences containing the polymorphic site at the 51st nucleotide from the 5'-terminus are identical to or complementary to containing polynucleotides
A composition for predicting the risk of gastric cancer.
제1항에 있어서,
서열번호 1의 51번째 뉴클레오티드의 다형성 부위는 C 또는 T이고; 및
서열번호 7의 51번째 뉴클레오티드의 다형성 부위는 G 또는 A인 것인, 위암 발병 위험도를 예측하기 위한 조성물.
According to claim 1,
The polymorphic site at the 51st nucleotide of SEQ ID NO: 1 is C or T; and
A composition for predicting the risk of gastric cancer, wherein the polymorphic site at the 51st nucleotide of SEQ ID NO: 7 is G or A.
제1항 또는 제2항에 따른 조성물을 포함하는 위암 발병 위험도를 예측하기 위한 마이크로어레이.A microarray for predicting the risk of developing gastric cancer comprising the composition according to claim 1 or 2. 제1항에 따른 조성물을 포함하는 위암 발병 위험도를 예측하기 위한 키트.A kit for predicting the risk of developing gastric cancer comprising the composition according to claim 1. 제4항에 있어서,
상기 키트는 PCR 키트 또는 DNA 칩 키트인 것인, 위암 발병 위험도를 예측하기 위한 키트.
According to claim 4,
The kit is a kit for predicting the risk of developing gastric cancer, which is a PCR kit or a DNA chip kit.
개체로부터 수득된 핵산 시료로부터 서열번호 1의 핵산서열로 이루어진 폴리뉴클레오티드 및 서열번호 7의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위의 유전자형(genotype)을 검출하는 단계; 및
검출된 유전자형으로부터 개체의 위암 발병 위험도를 산출하는 단계로서,
서열번호 1의 검출된 유전자형이 T이고 서열번호 7의 검출된 유전자형이 A인 경우, 위암 발병 위험도가 높아질 것으로 결정하는 것인 단계를 포함하는 위암 발병 위험도를 예측하는 방법.
Detecting a genotype of a polymorphic site at the 51st nucleotide from the 5'-end of a polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 1 and a polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 7 from a nucleic acid sample obtained from a subject ; and
A step of calculating the risk of developing gastric cancer of an individual from the detected genotype,
A method for predicting a risk of developing gastric cancer comprising determining that the risk of developing gastric cancer will increase when the detected genotype of SEQ ID NO: 1 is T and the detected genotype of SEQ ID NO: 7 is A.
제6항에 있어서,
상기 유전자형을 검출하는 단계는
서열번호 1의 핵산 서열로 이루어진 폴리뉴클레오티드 및 서열번호 7의 핵산 서열로 이루어진 폴리뉴클레오티드에서 상기 다형성부위를 포함하는 5개 이상의 연속 핵산 서열과 동일하거나 또는 상보적인 핵산 서열을 포함하는 프라이머 또는 프로브를 사용하거나, 또는
서열번호 1의 핵산 서열로 이루어진 폴리뉴클레오티드 및 서열번호 7의 핵산 서열로 이루어진 폴리뉴클레오티드에서 그의 5'-말단으로부터 51번째 뉴클레오티드의 다형성 부위를 포함하는 5개 이상의 연속 핵산 서열과 동일하거나 또는 상보적인 폴리뉴클레오티드가 고정된 마이크로어레이에 상기 핵산 시료를 혼성화하여 수행되는 것인, 위암 발병 위험도를 예측하는 방법.
According to claim 6,
The step of detecting the genotype is
A polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 1 and a polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 7 using primers or probes containing nucleic acid sequences identical to or complementary to 5 or more contiguous nucleic acid sequences containing the polymorphic site either, or
In the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 1 and the polynucleotide consisting of the nucleic acid sequence of SEQ ID NO: 7, 5 or more contiguous nucleic acid sequences comprising a polymorphic site at the 51st nucleotide from the 5'-end Polynucleotide identical or complementary to A method for predicting the risk of developing gastric cancer, which is performed by hybridizing the nucleic acid sample to a nucleotide-immobilized microarray.
삭제delete 삭제delete 삭제delete 제6항에 있어서,
상기 개체는 60세 미만인 것인, 위암 발병 위험도를 예측하는 방법.
According to claim 6,
Method for predicting the risk of developing gastric cancer, wherein the subject is less than 60 years old.
제6항에 있어서,
산출된 위암 발병 위험도에 따라 개체의 위암 발병의 위험도를 양호 등급 또는 위험 등급으로 결정하는 단계를 더 포함하는 것인, 위암 발병 위험도를 예측하는 방법.
According to claim 6,
The method for predicting the risk of developing gastric cancer further comprising determining the risk of gastric cancer of the individual as a good grade or a risk grade according to the calculated risk of gastric cancer.
KR1020220052542A 2022-04-28 2022-04-28 Composition for predicting a risk of developing gastric cancer and method using the same KR102479605B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220052542A KR102479605B1 (en) 2022-04-28 2022-04-28 Composition for predicting a risk of developing gastric cancer and method using the same
PCT/KR2023/004524 WO2023210997A1 (en) 2022-04-28 2023-04-04 Composition for predicting risk of developing gastric cancer, and method using same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220052542A KR102479605B1 (en) 2022-04-28 2022-04-28 Composition for predicting a risk of developing gastric cancer and method using the same

Publications (1)

Publication Number Publication Date
KR102479605B1 true KR102479605B1 (en) 2022-12-23

Family

ID=84536518

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220052542A KR102479605B1 (en) 2022-04-28 2022-04-28 Composition for predicting a risk of developing gastric cancer and method using the same

Country Status (2)

Country Link
KR (1) KR102479605B1 (en)
WO (1) WO2023210997A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023210997A1 (en) * 2022-04-28 2023-11-02 주식회사 바스젠바이오 Composition for predicting risk of developing gastric cancer, and method using same

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102168801B1 (en) * 2019-08-05 2020-10-22 충남대학교산학협력단 Composition and method for detecting gastric cancer using Single Nucleotide Polymorphism of MTND3
KR102281058B1 (en) * 2020-07-10 2021-07-23 서울대학교병원 Composition for predicting or diagnosing gastric cancer comprising detection agent of mutation of MUC4 gene

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111549137B (en) * 2020-05-22 2023-08-15 南京医科大学 Genetic molecular marker related to gastric cancer auxiliary diagnosis and application thereof
CN112410431B (en) * 2020-12-04 2022-03-22 訾力 SNP for prognosis of gastric cancer
KR102479605B1 (en) * 2022-04-28 2022-12-23 주식회사 바스젠바이오 Composition for predicting a risk of developing gastric cancer and method using the same

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102168801B1 (en) * 2019-08-05 2020-10-22 충남대학교산학협력단 Composition and method for detecting gastric cancer using Single Nucleotide Polymorphism of MTND3
KR102281058B1 (en) * 2020-07-10 2021-07-23 서울대학교병원 Composition for predicting or diagnosing gastric cancer comprising detection agent of mutation of MUC4 gene

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Jie Tian et al. Cancer Biol Med (2019) 16:361-389.
Lancet Oncol, 21(10): 1378-1386 (2020.09.28.) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023210997A1 (en) * 2022-04-28 2023-11-02 주식회사 바스젠바이오 Composition for predicting risk of developing gastric cancer, and method using same

Also Published As

Publication number Publication date
WO2023210997A1 (en) 2023-11-02

Similar Documents

Publication Publication Date Title
US8150627B2 (en) Methods and compositions for diagnosing lung cancer with specific DNA methylation patterns
JP6440658B2 (en) Methods for discovering pharmacogenomic biomarkers
DK2438193T3 (en) Methods for assessing the risk of breast cancer
JP2017158573A (en) Diagnostic methods for determining prognosis of non small cell lung cancer
US20080058432A1 (en) Molecular assay to predict recurrence of Duke&#39;s B colon cancer
CN109952383B (en) Methods and compositions for predicting enzatocin activity
KR101141829B1 (en) Genetic marker for predicting survival in patients with early stage lung cancer and method for predicting survival using the same
US20100092959A1 (en) Single nucleotide polymorphisms as genetic markers for childhood leukemia
KR102479605B1 (en) Composition for predicting a risk of developing gastric cancer and method using the same
WO2014173905A2 (en) Methods and kits for prognosis of stage i nsclc by determining the methylation pattern of cpg dinucleotides
KR100937144B1 (en) Makers for the diagnosis of prognosis of rheumatoid arthritis using DNMT3B gene and method for predicting severity and analyzing prognosis of rheumatoid arthritis using the same
KR102506347B1 (en) A polymorphic marker for predicting the risk of bleeding side effects following warfarin therapy and a method for predicting the risk of bleeding side effects from warfarin therapy using the same
KR102268059B1 (en) Composition, kit for predicting weight control according to exercise, and method using the same
US10087487B2 (en) Method for determining risk of metastatic relapse in a patient diagnosed with colorectal cancer
KR101992952B1 (en) Composition, kit for predicting the risk of developing cardiovascular disease related to Cholesterol efflux capacity, and method using the same
KR101663171B1 (en) Biomarkers indicative of Down Syndrom and Their uses
KR101795920B1 (en) SLC5A10 gene polymorphisms marker for predicting survival in patients with lung cancer and method for predicting survival using the same
KR101972355B1 (en) Polymorphic Marker of obesity or obesity related diseases in Korean and Method of Predicting obesity or obesity related diseases Risk in Korean Using The Genotype Information
KR101860997B1 (en) EGFR gene polymorphisms marker for predicting survival in patients with lung cancer and method for predicting survival using the same
RU2749465C1 (en) Method for determining genetic markers for assessing polygenic risk of breast cancer (hormone-negative and hormone-positive subtypes)
KR102152893B1 (en) Use for detection of hepatocellular carcinoma specific MLH1 circulating tumor DNA mutation
KR101167945B1 (en) Polynucleotides derived from ATG16L1 gene comprising single nucleotide polymorphisms, microarrays and diagnostic kits comprising the same, and analytic methods for autism spectrum disorders using the same
WO2011010870A2 (en) Genetic marker for predicting the survival of a patient with early-stage lung cancer, and method for predicting survival using same
KR20240057772A (en) Single nucleotide polymorphism for diagnosing of depression and the use thereof
US20070264648A1 (en) Dna Oligomer, Genetic Marker and Dna Oligomer Set for Prediction of Onset of Side-Effect from Radiation Therapy, and Method for Predicting Onset of Side-Effect

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant