KR101106014B1 - Polynucleotides derived from chromosome 1 comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same - Google Patents

Polynucleotides derived from chromosome 1 comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same Download PDF

Info

Publication number
KR101106014B1
KR101106014B1 KR1020090006101A KR20090006101A KR101106014B1 KR 101106014 B1 KR101106014 B1 KR 101106014B1 KR 1020090006101 A KR1020090006101 A KR 1020090006101A KR 20090006101 A KR20090006101 A KR 20090006101A KR 101106014 B1 KR101106014 B1 KR 101106014B1
Authority
KR
South Korea
Prior art keywords
seq
base
polynucleotide
dna sequence
polymorphic site
Prior art date
Application number
KR1020090006101A
Other languages
Korean (ko)
Other versions
KR20100064276A (en
Inventor
곽규범
편정아
이광재
김진
조성원
Original Assignee
차의과학대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 차의과학대학교 산학협력단 filed Critical 차의과학대학교 산학협력단
Publication of KR20100064276A publication Critical patent/KR20100064276A/en
Application granted granted Critical
Publication of KR101106014B1 publication Critical patent/KR101106014B1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

본 발명은 1번 염색체상의 유전자, 특히, ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 유전자로부터 유래된 단일염기다형(Single-Nucleotide Polymorphism; SNP)을 포함하는 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 제공하며, 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드는 장형 위암(Intestinal type of gastric cancer) 의 임상적 진단의 표지 인자로서, 사용될 수 있다. The present invention provides polynucleotides or their complementary polynucleotides comprising a single-nucleotide polymorphism (SNP) derived from genes on chromosome 1, in particular ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 genes. In addition, the polynucleotide or its complementary polynucleotide may be used as a marker for clinical diagnosis of intestinal type of gastric cancer.

ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3, 장형 위암 ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3, Enteric Gastric Cancer

Description

1번 염색체로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법{Polynucleotides derived from chromosome 1 comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same}Polynucleotides derived from chromosome 1 comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same}

본 발명은 1번 염색체상의 유전자, 특히, ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드; 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드로 이루어진 장형 위암(intestinal type of gastric cancer) 진단을 위한 증폭용 프라이머 또는 장형 위암 진단용 프로브; 상기 프로브를 포함하는 마이크로어레이; 및 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 이용한 장형 위암 진단에 필요한 정보를 제공하기 위한 분석 방법에 관한 것이다.The present invention relates to polynucleotides or their complementary polynucleotides comprising monobasic polymorphisms derived from genes on chromosome 1, in particular, ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 genes; Amplification primers or enteric gastric cancer diagnostic probes for diagnosing intestinal type of gastric cancer comprising the polynucleotide or its complementary polynucleotides; A microarray comprising the probe; And an analysis method for providing information necessary for diagnosing enteric gastric cancer using the polynucleotide or its complementary polynucleotide.

인간의 게놈은 모두 22쌍의 상동 염색체와 두 개의 성염색체로 이루어져 있다. 그러나 모든 인간이 각기 다른 외모와 성격을 갖는다. 이는 개개인이 같은 수 의 염색체를 가지고 있기는 하지만, 그 염색체로부터 발현되는 유전자들에 의한 표현형이 모두 다르기 때문이다. 개개인의 이러한 유전자 발현의 다양성은 곧 유전자를 가지고 있는 게놈의 유전적 다양성 때문이다. 이러한 유전적 다양성은 많은 연구가 수행되어 왔으며, 최근 인간게놈프로젝트의 완성으로 그 구조가 모두 밝혀졌다. The human genome consists of 22 pairs of homologous chromosomes and two sex chromosomes. But every human being has a different appearance and character. This is because each person has the same number of chromosomes, but all of the phenotypes of the genes expressed from that chromosome are different. The diversity of these gene expressions in individuals is due to the genetic diversity of the genome carrying the gene. Much research has been done on this genetic diversity, and the structure of the genetic genome has recently been revealed.

게놈에서의 유전적 다양성을 대표하는 것으로는 Transposable element, STR (short tandem repeats), Microsatellites, STS (sequence tagged site), VNTR (variable number tandem repeat), SNP (single nucleotide polymorphism : 단일염기다형) 등이 알려져 있다. 이중 SNP는 단일염기다형으로서, 인간 게놈 상에서 약 1000개의 뉴클레오티드 중 1개의 빈도로 나타나며 동일한 종의 개체 사이의 단일뉴클레오티드 변이의 형태를 취한다. 이러한 단일염기다형이 나타내는 유전학에서의 의미는 그 위치에 따라 각 개체에 큰 차이를 가져온다. 예를 들면, 단일염기다형이 단백질을 암호화하고 있는 위치에 존재할 경우, 단백질의 구조에 영향을 미칠 수 있게 되어 단백질 기능이 달라질 수 있게 되며, 질병과도 연관될 수 있다. 다른 예로 단일염기다형이 단백질을 암호화하지 않는 다른 유전자상에서 존재할 경우, 즉 프로모터(promoter) 또는 인트론(intron)에 존재할 경우, 각각에 대하여 단백질의 발현 수준에 차이를 가져와 그 단백질의 전체적인 활성이 줄어들 수 있고, 변성적인 인트론 제거 과정(alternative splicing)을 통하여 단백질이 비정상적으로 발현될 수도 있다. Genetic diversity in the genome is represented by transposable elements, short tandem repeats (STRs), microsatellites, sequence tagged sites (STS), variable number tandem repeats (VNTRs), and single nucleotide polymorphisms (SNPs). Known. Dual SNPs are monobasic, appearing at a frequency of about one thousand nucleotides on the human genome and taking the form of single nucleotide variations between individuals of the same species. The meaning in the genetics represented by these monobasic polymorphisms makes a big difference in each individual depending on its location. For example, when a monobasic polymorph is present at a location that encodes a protein, it may affect the structure of the protein, altering protein function and associated with disease. In another example, if a monobasic polymorph is present on another gene that does not encode a protein, ie, on a promoter or intron, the expression level of the protein may differ for each, resulting in a decrease in the overall activity of the protein. In addition, a protein may be abnormally expressed through alterative splicing.

단일염기다형들은 질병과 같은 특정 표현형(phenotype)의 지표로 사용될 수 있고, 이를 위해서는 가장 우선적으로 인간 유전체에 존재하는 대량의 단일염기다형을 발굴하고 발굴된 단일염기다형는 다수의 인간 유전체 시료에서 전체 인간집단의 1% 이상 존재하는 유전변이형 마커인지를 조사하는 검정작업을 거치게 된다. 검정된 SNP은 특정 질병 또는 약물반응과 같은 유전적 차이에 기인된 원인을 찾기 위한 연관성 연구에 사용되게 된다. 예를 들면, 특정 단일염기다형이 환자군과 대조군 간의 비교에서 유의적인 빈도의 차이가 관측된다면 아주 유용한 단일염기다형으로 선발되어 임상실험을 거치게 될 것이며 임상실험의 결과가 계속적으로 진행되어 그 결과가 좋을 때는 경제적으로 아주 유용한 가치를 지니는 유전지표로 실제 임상에 사용할 수 있게 될 것이다.Monobasic polymorphs can be used as indicators of specific phenotypes, such as disease. To do this, first of all, a large number of monobasic polymorphisms present in the human genome are identified and the single monopolymorphism is found in a number of human genome samples. An assay will be conducted to determine if there is a genetic variation marker present in more than 1% of the population. Assayed SNPs will be used in association studies to find the cause due to genetic differences such as specific diseases or drug responses. For example, if a single base polymorphism is found to be significantly different in the comparison between the patient and control group, it will be selected as a very useful single base polymorphism and subjected to clinical trials. It is a genetic indicator of economically useful value and will be available for actual clinical use.

이러한 단일염기다형의 발견을 위한 종래 기술로는 제한효소를 이용한 제한 단편화 길이 다형성(Restriction Fragment Length Polymorphism; RFLP), 대립형질 특이적 혼성화(Allele-specific hybridization)를 이용한 TaqManTM 프로브 방법, 용융온도(melting temperature; Tm)을 이용한 역동적 대립형질 특이적 혼성화(Dynamic Allele-Specific Hybridization; DASH)방법, 중합반응을 이용한 pyrosequencing등이 있다. 최근, 마이크로어레이 기술은 단일 염기 신장(Single Base Extension)이라는 원리를 이용한 프로브들을 조그만 기판위에 집적화시켜 심은 후, 목적 DNA들과의 혼성화와 신장(Extension)을 시킴으로써 단일염기다형을 발견해 내고 있다. Conventional techniques for the discovery of such monobasic polymorphisms include Restriction Fragment Length Polymorphism (RFLP) using restriction enzymes, TaqMan probe method using Allele-specific hybridization, and melting temperature ( dynamic allele-specific hybridization (DASH) using melting temperature (Tm) and pyrosequencing using polymerization. Recently, microarray technology has discovered a single base polymorphism by integrating and planting probes using a principle of single base extension on a small substrate, followed by hybridization and extension with target DNAs.

한편, 위암의 발생률과 사망률은 감소하고 있으나, 아직도 전 세계에서 두 번째로 많이 발생하는 악성 종양이다. 우리나라의 경우, 남성과 여성에서의 암 발생률은 위암이 1위를 차지하고 사망률의 경우 2위를 차지한다. 위암과 깊게 관련되는 Helicobacter pylori (H. pylori) 감염은 사람에서 가장 흔한 만성 감염으로서 전 세계 인구의 50% 이상이 감염되어 있다. 우리나라의 H. pylori 감염률은 전 국민에서 46.6%, 16세 이상의 성인에서는 69.4%, 40대 에서는 78.5% 라는 높은 감염률을 보인다. 위암은 로렌 분류법(Lauren classification) 에 의해 장형 위암(Intestinal type of gastric cancer) 과 미만형 위암(Diffuse type of gastric cancer)로 분류 된다. 장형 위암은 H. pylori 감염과 관련되어 만성 위염(chronic gastritis), 위축성 위염(atrophic gastritis), 장상피화생(intestinal metaplasia), 이형성증(displasia), 장형 위암(Intestinal type of gastric cancer)의 순서로 진행된다. 반면 미만형 위암은 정상적인 점막으로 부터 H. pylori 감염과 관계없이 유발 될 수 있다. 우리나라에서 H. pylori 감염률이 높다는 것은 장형 위암에 대한 위험이 높다는 것을 의미 한다. The incidence and mortality rate of gastric cancer is decreasing, but it is still the second most common malignancy in the world. In Korea, the incidence of cancer in men and women is ranked first in gastric cancer and second in mortality. Helicobacter pylori (H. pylori) infection, which is closely related to gastric cancer, is the most common chronic infection in humans, affecting more than 50% of the world's population. The prevalence of H. pylori infection in Korea is high at 46.6%, 69.4% in adults over 16 years old, and 78.5% in 40s. Gastric cancer is classified into Intestinal type of gastric cancer and Diffuse type of gastric cancer by Lauren classification. Enteric gastric cancer is associated with H. pylori infection in the order of chronic gastritis, atrophic gastritis, intestinal metaplasia, displasia, and intestinal type of gastric cancer. do. Diffuse gastric cancer, on the other hand, can be induced from normal mucous membranes regardless of H. pylori infection. A high H. pylori infection rate in Korea means a high risk for intestinal gastric cancer.

초기 위암은 5년 생존률이 95∼100%로 높지만 증상을 나타내지 않는 경우가 80% 를 차지한다. 이는 조기 진단의 중요성과 함께 적절한 조기 진단법의 개발이 필요함을 뜻한다. H. pylori 감염된 100명 중 1∼2명에서만 위암이 발생하기 때문에 H. pylori 감염만으로 위암 발생 위험군으로 판단 내리는 것은 적합하지 않다. 위암의 전 단계에 속하는 만성 위염 환자 사이에서 장형 위암이 발생할 위험성이 있는 사람을 미리 예측하는 것과 위암 발생에 관여하는 인자를 규명하는 것은 국민 보건에 중요하며 위암을 예방하기 위한 검사의 필수 요건이다. 장형 위암에 특이적 으로 나타날 수 있는 단일염기다형을 찾아내는 것은 장형 위암을 조기에 진단할 수 있으며, 더 나아가 병태생리학적 경로를 밝히고 치료 방법을 개발하는데까지 이용될 수 있을 것이다.Early gastric cancer has a 5-year survival rate of 95% to 100%, but 80% of cases have no symptoms. This implies the need for early diagnosis, along with the importance of early diagnosis. Since only 1 to 2 out of 100 H. pylori infections develop gastric cancer, it is not appropriate to determine H. pylori infection as a risk group for gastric cancer. Predicting the risk of developing gastrointestinal cancer among patients with chronic gastritis at all stages of gastric cancer and identifying the factors involved in the development of gastric cancer is important for public health and is an essential requirement for tests to prevent stomach cancer. Finding monobasic polymorphisms that may be specific for enteric gastric cancer can help diagnose early gastric cancer, furthermore, to identify pathophysiological pathways and to develop therapeutic methods.

본 발명자들은 한국인의 장형 위암 환자에서 특이적으로 나타나는 단일염기다형을 찾아내고자 연구를 거듭한 결과, 1번 염색체상의 유전자, 특히, ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 유전자로부터 장형 위암환자에 특이적으로 나타나는 단일염기다형 부위를 발견하여 본 발명을 완성하게 되었다. The present inventors conducted a study to find a single nucleotide polymorphism specific to Korean patients with enteric gastric cancer. Specific monobasic polymorphic sites were found to complete the present invention.

따라서, 본 발명은 장형 위암과 관련된 단일염기다형으로서 ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 제공하는 것을 목적으로 한다.Accordingly, an object of the present invention is to provide a polynucleotide or a complementary polynucleotide thereof comprising a monobasic polymorphism derived from ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 genes as a monobasic polymorphism associated with enteric gastric cancer.

또한, 본 발명은 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드로 이루어진 장형 위암 진단을 위한 증폭용 프라이머 또는 장형 위암 진단용 프로브를 제공하는 것을 목적으로 한다.In addition, an object of the present invention is to provide an amplification primer or a gastric cancer diagnostic probe for diagnosing enteric gastric cancer consisting of the polynucleotide or a complementary polynucleotide thereof.

또한, 본 발명은 상기 프로브를 포함하는 마이크로어레이를 제공하는 것을 목적으로 한다.Another object of the present invention is to provide a microarray including the probe.

또한, 본 발명은 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 이용한 장형 위암 진단 방법을 제공하는 것을 목적으로 한다.It is also an object of the present invention to provide a method for diagnosing enteric gastric cancer using the polynucleotide or its complementary polynucleotide.

본 발명의 일 태양에 따라, 서열번호 1의 DNA 서열로 구성된 폴리뉴클레오티드에서, 501번째 염기(다형성 부위)가 A이고, 상기 501번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (a); 서열번호 2의 DNA 서열로 구성된 폴리뉴클레오티드에서, 101번째 염기(다형성 부위)가 G이고, 상기 101번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (b); 서열번호 3의 DNA 서열로 구성된 폴리뉴클레오티드에서, 401번째 염기(다형성 부위)가 G이고, 상기 401번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (c); 서열번호 4의 DNA 서열로 구성된 폴리뉴클레오티드에서, 501번째 염기(다형성 부위)가 G이고, 상기 501번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (d); 서열번호 5의 DNA 서열로 구성된 폴리뉴클레오티드에서, 301번째 염기(다형성 부위)가 C이고, 상기 301번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (e); 서열번호 6의 DNA 서열로 구성된 폴리뉴클레오티드에서, 501번째 염기(다형성 부위)가 G이고, 상기 501번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (f); 서열번호 7의 DNA 서열로 구성된 폴리뉴클레오티드에서, 262번째 염기(다형성 부위)가 G이고, 상기 262번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (g); 서열번호 8의 DNA 서열로 구성된 폴리뉴클레오티드에서, 2187번째 염기(다형성 부위)가 G이고, 상기 2187번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (h); 서열번호 9의 DNA 서열로 구성된 폴리뉴클레오티드에서, 301번째 염기(다형성 부위)가 G이고, 상기 301번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (i); 및 서열번호 10의 DNA 서열로 구성된 폴리뉴클레오티드에서, 201번째 염 기(다형성 부위)가 A이고, 상기 201번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (j)로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드가 제공된다.According to one aspect of the invention, in the polynucleotide consisting of the DNA sequence of SEQ ID NO: 1, the 501th base (polymorphic site) is A, a polynucleotide consisting of 10 or more consecutive DNA sequences comprising the 501th base ( a); In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 2, the polynucleotide (b) consisting of ten or more consecutive DNA sequences comprising the 101 st base (polymorphic site) G and comprising the 101 st base; In a polynucleotide consisting of a DNA sequence of SEQ ID NO: 3, a polynucleotide (c) consisting of ten or more consecutive DNA sequences comprising the 401 th base (polymorphic site) G and comprising the 401 th base; A polynucleotide consisting of the DNA sequence of SEQ ID NO: 4, wherein the 501th base (polymorphic site) is G and the polynucleotide consists of 10 or more consecutive DNA sequences comprising said 501th base; In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 5, the polynucleotide (e) consisting of ten or more contiguous DNA sequences comprising the 301 th base (polymorphic site) is C and the 301 th base; A polynucleotide consisting of the DNA sequence of SEQ ID NO: 6, wherein the 501th base (polymorphic site) is G, and the polynucleotide (f) is composed of 10 or more consecutive DNA sequences comprising the 501th base; In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 7, a polynucleotide (g) consisting of at least 10 contiguous DNA sequences comprising a 262 th base (polymorphic site) G and comprising the 262 th base; In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 8, a polynucleotide (h) consisting of 10 or more contiguous DNA sequences including the 2187th base (polymorphic site) G and comprising the 2187th base; In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 9, a polynucleotide (i) consisting of 10 or more consecutive DNA sequences comprising the 301th base (polymorphic site) G and comprising the 301th base; And a polynucleotide consisting of the DNA sequence of SEQ ID NO: 10, wherein the 201 base (polymorphic site) is A, and the polynucleotide (j) is composed of 10 or more consecutive DNA sequences comprising the 201 base. One or more selected polynucleotides or complementary polynucleotides thereof are provided.

또한, 본 발명의 다른 태양에 따라, 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드로 이루어진, 장형 위암 진단을 위한 증폭용 프라이머가 제공된다.In addition, according to another aspect of the present invention, an amplification primer for diagnosing enteric gastric cancer, comprising the polynucleotide or a complementary polynucleotide thereof, is provided.

또한, 본 발명의 다른 태양에 따라, 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드로 이루어진, 장형 위암 진단용 프로브 및 이를 포함한 마이크로어레이가 제공된다.In addition, according to another aspect of the present invention, there is provided a enteric gastric cancer diagnostic probe and a microarray comprising the polynucleotide or a complementary polynucleotide thereof.

또한, 본 발명의 다른 태양에 따라, 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 포함하는 장형 위암 진단용 키트가 제공된다.In addition, according to another aspect of the present invention, there is provided a kit for diagnosing enteric gastric cancer comprising the polynucleotide or a complementary polynucleotide thereof.

또한, 본 발명의 다른 태양에 따라, 장형 위암 진단에 필요한 정보를 제공하기 위하여, (i) 검체로부터 핵산 시료를 얻는 단계; 및 (ii) 상기 핵산 시료로부터, 서열번호 1 내지 10의 폴리뉴클레오티드로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드의 다형성 부위의 염기 서열을 분석하는 단계 (단, 상기 다형성 부위는 서열번호 1의 DNA 서열의 경우 501번째 염기, 서열번호 2의 DNA 서열의 경우 101번째 염기, 서열번호 3의 DNA 서열의 경우 401번째 염기, 상기 다형성 부위는 서열번호 4의 DNA 서열의 경우 501번째 염기, 상기 다형성 부위는 서열번호 5의 DNA 서열의 경우 301번째 염기, 상기 다형성 부위는 서열번호 6의 DNA 서열의 경우 501번째 염기, 상기 다형성 부위는 서열번호 7의 DNA 서 열의 경우 262번째 염기, 상기 다형성 부위는 서열번호 8의 DNA 서열의 경우 2187번째 염기, 상기 다형성 부위는 서열번호 9의 DNA 서열의 경우 301번째 염기, 서열번호 10의 DNA 서열의 경우 201번째 염기를 각각 의미한다)를 포함하는, 검체 중의 단일염기다형을 검출하는 방법이 제공된다.In addition, according to another aspect of the invention, to provide information necessary for the diagnosis of enteric gastric cancer, (i) obtaining a nucleic acid sample from a sample; And (ii) analyzing the nucleotide sequence of the polymorphic site of at least one polynucleotide selected from polynucleotides of SEQ ID NOs: 1 to 10 or complementary polynucleotides thereof from the nucleic acid sample, provided that the polymorphic site is 501 base for DNA sequence, 101 base for DNA sequence of SEQ ID NO: 2, 401 base for DNA sequence of SEQ ID NO: 3, polymorphic site is 501 base for DNA sequence of SEQ ID NO: 4, polymorphism The site is the 301th base for the DNA sequence of SEQ ID NO: 5, the polymorphic site is the 501st base for the DNA sequence of SEQ ID NO: 6, the polymorphic site is the 262th base for the DNA sequence of SEQ ID NO: 7, and the polymorphic site is 2187 base for the DNA sequence of SEQ ID NO: 8, the polymorphic site is 301 base for the DNA sequence of SEQ ID NO: 9, DNA sequence of SEQ ID NO: 10 If there is provided a second method 201, which means the base respectively), detecting a single nucleotide polymorphism in a sample comprising a.

본 발명에 따른 폴리뉴클레오티드 (a) 내지 (j)로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드는 장형 위암의 진단에 유용하게 사용될 수 있다.One or more polynucleotides selected from the group consisting of polynucleotides (a) to (j) according to the present invention or complementary polynucleotides thereof may be usefully used for the diagnosis of enteric gastric cancer.

또한, 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드로 이루어진 프라이머 또는 프로브, 및 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 포함하는 키트는 장형 위암의 진단에 유용하게 사용될 수 있다.In addition, a primer or probe consisting of the polynucleotide or its complementary polynucleotide, and a kit comprising the polynucleotide or the complementary polynucleotide thereof may be usefully used for the diagnosis of enteric gastric cancer.

또한 본 발명의 분석방법은 장형 위암 진단에 필요한 정보를 제공하는데 유용하게 사용될 수 있다.In addition, the analysis method of the present invention can be usefully used to provide information necessary for diagnosing gastric cancer.

본 발명은 장형 위암과 관련된 것으로 새롭게 밝혀진 서열번호 1 내지 10의 서열로부터 유래하는 폴리뉴클레오티드 (a) 내지 (j)로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 제공한다. 즉, 본 발명은 서열번호 1의 DNA 서열로 구성된 폴리뉴클레오티드에서, 501번째 염기(다형성 부위)가 A이고, 상기 501번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (a); 서열번호 2의 DNA 서열로 구성된 폴리뉴클레 오티드에서, 101번째 염기(다형성 부위)가 G이고, 상기 101번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (b); 서열번호 3의 DNA 서열로 구성된 폴리뉴클레오티드에서, 401번째 염기(다형성 부위)가 G이고, 상기 401번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (c); 서열번호 4의 DNA 서열로 구성된 폴리뉴클레오티드에서, 501번째 염기(다형성 부위)가 G이고, 상기 501번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (d); 서열번호 5의 DNA 서열로 구성된 폴리뉴클레오티드에서, 301번째 염기(다형성 부위)가 C이고, 상기 301번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (e); 서열번호 6의 DNA 서열로 구성된 폴리뉴클레오티드에서, 501번째 염기(다형성 부위)가 G이고, 상기 501번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (f); 서열번호 7의 DNA 서열로 구성된 폴리뉴클레오티드에서, 262번째 염기(다형성 부위)가 G이고, 상기 262번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (g); 서열번호 8의 DNA 서열로 구성된 폴리뉴클레오티드에서, 2187번째 염기(다형성 부위)가 G이고, 상기 2187번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (h); 서열번호 9의 DNA 서열로 구성된 폴리뉴클레오티드에서, 301번째 염기(다형성 부위)가 G이고, 상기 301번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (i); 및 서열번호 10의 DNA 서열로 구성된 폴리뉴클레오티드에서, 201번째 염기(다형성 부위)가 A이고, 상기 201번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴 클레오티드 (j)로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 제공한다.The present invention provides polynucleotides or complementary polynucleotides selected from the group consisting of polynucleotides (a) to (j) derived from the sequences of SEQ ID NOs 1 to 10 newly found to be associated with enteric gastric cancer. That is, the present invention provides a polynucleotide consisting of the DNA sequence of SEQ ID NO: 1, wherein the 501st base (polymorphic site) is A, and is composed of 10 or more consecutive DNA sequences comprising the 501th base (a); In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 2, a polynucleotide (b) consisting of ten or more consecutive DNA sequences comprising the 101 st base (polymorphic site) G and comprising the 101 st base; In a polynucleotide consisting of a DNA sequence of SEQ ID NO: 3, a polynucleotide (c) consisting of ten or more consecutive DNA sequences comprising the 401 th base (polymorphic site) G and comprising the 401 th base; A polynucleotide consisting of the DNA sequence of SEQ ID NO: 4, wherein the 501th base (polymorphic site) is G and the polynucleotide consists of 10 or more consecutive DNA sequences comprising said 501th base; In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 5, the polynucleotide (e) consisting of ten or more contiguous DNA sequences comprising the 301 th base (polymorphic site) is C and the 301 th base; A polynucleotide consisting of the DNA sequence of SEQ ID NO: 6, wherein the 501th base (polymorphic site) is G, and the polynucleotide (f) is composed of 10 or more consecutive DNA sequences comprising the 501th base; In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 7, a polynucleotide (g) consisting of at least 10 contiguous DNA sequences comprising a 262 th base (polymorphic site) G and comprising the 262 th base; In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 8, a polynucleotide (h) consisting of 10 or more contiguous DNA sequences including the 2187th base (polymorphic site) G and comprising the 2187th base; In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 9, a polynucleotide (i) consisting of 10 or more consecutive DNA sequences comprising the 301th base (polymorphic site) G and comprising the 301th base; And a polynucleotide consisting of the DNA sequence of SEQ ID NO: 10, wherein the 201 base (polymorphic site) is A, and the polynucleotide (j) is composed of 10 or more consecutive DNA sequences comprising the 201 base One or more polynucleotides selected from or complementary polynucleotides thereof are provided.

상기 서열번호 1 내지 10의 DNA 서열은 만성 위염 환자군과 장형 위암 환자군에서 통계학적으로 유의성 있는 차이(유의수준 p value < 0.05)를 보이는 단일염기다형으로서, 이들은 1번 염색체 상에 위치하는 ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 유전자에 존재한다. ZMPSTE24 유전자는 zinc metalloproteinase를 암호화하며, 이 유전자 상의 돌연변이는 mandibuloacral dysplasia 와 제한 피부병증(restrictive dermopathy)과 연관되는 것으로 보고된 바 있다. GPR37L1 (G protein-coupled receptor 37 like 1) 유전자는 그 기능이 아직 밝혀져 있지 않다. LMX1A (LIM homeobox transcription factor 1, alpha) 유전자는 인슐린 프로모터에 붙어 인슐린의 전사를 자극하는 것으로 알려져 있다. SRGAP2 (SLIT-ROBO Rho GTPase activating protein 2) 유전자는 ARHGAP 관련 단백질(family protein)을 암호화하며 흑색종(melanoma), 생식세포 종양(germ cell tumors), 연골육종(chondrosarcoma) 및 망막모세포종(retinoblastoma)에 발현되는 것이 보고된 바 있다. FAM5C (family with sequence similarity 5, member C) 유전자는 심근경색(myocardial infarction)과의 연관성이 보고된 바 있고, EDEM3 (ER degradation enhancer, mannosidase alpha-like 3) 유전자는 당단백(glycoprotein)에 의한 ERAD(endoplasmic reticulum-associated degradation) 및 만노오즈 트리밍(mannose trimming)을 증진시킨다고 보고된 바 있다.The DNA sequences of SEQ ID NOs: 1 to 10 are monobasic polymorphisms showing statistically significant difference (significance level p value <0.05) in patients with chronic gastritis and intestinal gastric cancer, and they are located on chromosome 1, ZMPSTE24, GPR37L1. , LMX1A, SRGAP2, FAM5C, EDEM3 genes. The ZMPSTE24 gene encodes zinc metalloproteinase, and mutations in this gene have been reported to be associated with mandibuloacral dysplasia and restrictive dermopathy. GPR37L1 (G protein-coupled receptor 37 like 1) gene has yet to be identified. The LMX1A (LIM homeobox transcription factor 1, alpha) gene is known to stimulate insulin transcription by attaching to an insulin promoter. The SRGAP2 (SLIT-ROBO Rho GTPase activating protein 2) gene encodes an ARHGAP family protein and is responsible for melanoma, germ cell tumors, chondrosarcoma and retinoblastoma. It has been reported to be expressed. FAM5C (family with sequence similarity 5, member C) genes have been reported to be associated with myocardial infarction, and EDEM3 (ER degradation enhancer, mannosidase alpha-like 3) genes are known to be glycoprotein-induced ERADs (glycoproteins). It has been reported to enhance endoplasmic reticulum-associated degradation and mannose trimming.

본 발명자들은 장형 위암과 관련된 후보 유전자군으로서 1번 염색체 상에 위 치하는 ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 유전자를 선정하여, 장형 위암 진단에 있어서 분자 수준에서의 진단 지표를 개발하고자 다양한 연구를 수행하였다. 본 발명자들은 한국인 만성 위염 환자 24명과 장형 위암 환자 21명을 대상으로 유전자형 분석 및 통계학적 분석을 수행하였으며, 놀랍게도 수많은 단일염기다형 중 극히 일부의 단일염기다형만이 만성 위염 환자군과 장형 위암 환자군에서 통계적으로 유의성 있는 차이를 나타낸다는 것을 발견하였다. 특히, 서열번호 1 내지 10의 단일염기다형은 하디-와인버그 평형 (Hardy-Weinberg Equilibrium) 및 로지스틱 회기분석 결과, 각각의 다형성 부위에 위험대립인자가 존재함을 확인하였다.The present inventors selected ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, and EDEM3 genes located on chromosome 1 as candidate gene groups related to enteric gastric cancer, and developed various diagnostic indicators at the molecular level in the diagnosis of enteric gastric cancer. The study was conducted. We performed genotyping and statistical analysis on 24 Korean patients with chronic gastritis and 21 patients with gastrointestinal gastric cancer. Surprisingly, only a single polymorphic polymorphic polymorphism was found in patients with chronic gastritis and intestinal gastric cancer. It was found that this represents a significant difference. In particular, the monobasic polymorphisms of SEQ ID NOS: 1 to 10 showed a risk allele at each polymorphic region as a result of Hardy-Weinberg Equilibrium and logistic regression analysis.

본 발명은 상기 폴리뉴클레오티드 (a) 내지 (j)로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드와 혼성화하는 폴리뉴클레오티드를 포함하며, 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드의 길이는 10 내지 100 뉴클레오티드, 바람직하게는 20 내지 60 뉴클레오티드, 더욱 바람직하게는 40 내지 60 뉴클레오티드이다. The present invention includes a polynucleotide hybridizing with at least one polynucleotide selected from the group consisting of the polynucleotides (a) to (j) or a complementary polynucleotide thereof, and the length of the polynucleotide or the complementary polynucleotide thereof is 10 To 100 nucleotides, preferably 20 to 60 nucleotides, more preferably 40 to 60 nucleotides.

본 발명에 따른 상기 폴리뉴클레오티드 (a) 내지 (j)로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드는 다형성 서열이다. 다형성 서열 (polymorphic sequence)이란 뉴클레오티드 서열 중에 단일염기다형을 나타내는 다형성 부위 (polymorphic site)를 포함하는 서열을 말한다. 다형성 부위 (polymorphic site)란 다형성 서열 중 단일염기다형이 일어나는 부위를 말한다. 상기 폴리뉴클레오티드는 DNA 또는 RNA가 될 수 있다.At least one polynucleotide selected from the group consisting of the polynucleotides (a) to (j) according to the present invention is a polymorphic sequence. A polymorphic sequence refers to a sequence comprising a polymorphic site representing a monobasic polymorphism in a nucleotide sequence. A polymorphic site refers to a site where a monobasic polymorphism occurs in the polymorphic sequence. The polynucleotide can be DNA or RNA.

본 발명은 또한, 상기 폴리뉴클레오티드 (a) 내지 (j)로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드로 이루어진, 장형 위암 진단을 위한 증폭용 대립형질 특이적 프라이머를 포함한다. 여기서 "프라이머(primer)"란 적절한 버퍼 중의 적절한 조건 (예를 들면, 4개의 다른 뉴클레오시드 트리포스페이트(ATP,GTP,CTP,TTP) 및 DNA 폴리머라제) 및 적당한 온도 하에서 주형-지시 DNA 합성의 시작점으로서 작용할 수 있는 단일가닥 올리고뉴클레오티드를 말한다. 상기 프라이머의 적절한 길이는 사용 목적에 따라 달라질 수 있으나, 통상 10 내지 100, 바람직하게는 10 내지 80 뉴클레오티드이다. 짧은 프라이머 분자는 일반적으로 주형과 안정한 혼성체를 형성하기 위해서는 더 낮은 온도를 필요로 한다. 프라이머 서열은 주형과 완전하게 상보적일 필요는 없으나, 주형과 혼성화 할 정도로 충분히 상보적이어야 한다. 상기 프라이머는 3'-말단이 서열번호 1 내지 10의 단일염기다형과 정렬하는 것이 바람직하다. 상기 프라이머는 다형성 부위를 포함하는 표적 DNA에 혼성화하고, 상기 프라이머가 완전한 상동성을 보이는 대립형질 형태의 DNA에서 증폭을 개시한다. 이 프라이머는 반대편에 혼성화하는 제2 프라이머와 쌍을 이루어 사용된다. 증폭에 의하여 두 개의 프라이머로부터 산물이 증폭되고, 증폭된 산물만을 특이적으로 염색하여 시각화한다. 이는 특정 대립형질 형태가 존재한다는 것을 의미한다. 여기서 사용되는 대립형질 특이적 폴리뉴클레오티드들이 다른 변성화 과정을 거치게 되면, InfiniumTM Assay I 뿐만 아니라 다른 방법들에 의해서도 사용될 수 있다. The invention also includes an allele specific primer for amplification for enteric gastric cancer, comprising at least one polynucleotide selected from the group consisting of the polynucleotides (a) to (j) or complementary polynucleotides thereof. “Primer” herein refers to the synthesis of template-directed DNA synthesis under appropriate conditions (eg, four different nucleoside triphosphates (ATP, GTP, CTP, TTP) and DNA polymerase) in a suitable buffer and at a suitable temperature. It refers to a single stranded oligonucleotide that can act as a starting point. The appropriate length of the primer may vary depending on the purpose of use, but is usually 10 to 100, preferably 10 to 80 nucleotides. Short primer molecules generally require lower temperatures to form stable hybrids with the template. The primer sequence need not be completely complementary to the template, but should be sufficiently complementary to hybridize with the template. It is preferred that the primer 3'-terminal alignment with the single nucleotide polymorphism of SEQ ID NO: 1 to 10. The primer hybridizes to the target DNA comprising the polymorphic site and initiates amplification in allelic form of DNA where the primer exhibits complete homology. This primer is used in pairs with a second primer that hybridizes to the other side. The product is amplified from two primers by amplification, and only the amplified product is specifically stained and visualized. This means that certain allelic forms exist. If the allele-specific polynucleotides used herein undergo different denaturation, Infinium Assay I can be used by other methods as well.

본 발명은 폴리뉴클레오티드 (a) 내지 (j)로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드로 이루어진, 장형 위암 진단용 프로브 및 이를 포함하는 장형 위암 진단용 마이크로어레이를 포함한다. 또한, 본 발명은 폴리뉴클레오티드 (a) 내지 (j)로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 포함하는, 장형 위암 진단용 키트를 포함한다.The present invention includes a probe for diagnosing enteric gastric cancer and a microarray for diagnosing enteric gastric cancer comprising the polynucleotide (a) to (j) selected from the group consisting of one or more polynucleotides or complementary polynucleotides thereof. The present invention also includes a kit for diagnosing enteric gastric cancer, comprising a polynucleotide selected from the group consisting of polynucleotides (a) to (j) or complementary polynucleotides thereof.

본 발명은 장형 위암 진단에 필요한 정보를 제공하기 위하여, (i) 검체로부터 핵산 시료를 얻는 단계; 및 (ii) 상기 핵산 시료로부터, 서열번호 1 내지 10의 폴리뉴클레오티드로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드의 다형성 부위의 염기 서열을 분석하는 단계 (단, 상기 다형성 부위는 서열번호 1의 DNA 서열의 경우 501번째 염기, 서열번호 2의 DNA 서열의 경우 101번째 염기, 서열번호 3의 DNA 서열의 경우 401번째 염기, 상기 다형성 부위는 서열번호 4의 DNA 서열의 경우 501번째 염기, 상기 다형성 부위는 서열번호 5의 DNA 서열의 경우 301번째 염기, 상기 다형성 부위는 서열번호 6의 DNA 서열의 경우 501번째 염기, 상기 다형성 부위는 서열번호 7의 DNA 서열의 경우 262번째 염기, 상기 다형성 부위는 서열번호 8의 DNA 서열의 경우 2187번째 염기, 상기 다형성 부위는 서열번호 9의 DNA 서열의 경우 301번째 염기, 서열번호 10의 DNA 서열의 경우 201번째 염기를 각각 의미한다)를 포함하는, 검체 중의 단일염기다형을 검출하는 방법을 포함한다.The present invention provides a nucleic acid sample from a sample in order to provide information necessary for the diagnosis of enteric gastric cancer; And (ii) analyzing the nucleotide sequence of the polymorphic site of at least one polynucleotide selected from polynucleotides of SEQ ID NOs: 1 to 10 or complementary polynucleotides thereof from the nucleic acid sample, provided that the polymorphic site is 501 base for DNA sequence, 101 base for DNA sequence of SEQ ID NO: 2, 401 base for DNA sequence of SEQ ID NO: 3, polymorphic site is 501 base for DNA sequence of SEQ ID NO: 4, polymorphism The site is the 301th base for the DNA sequence of SEQ ID NO: 5, the polymorphic site is the 501st base for the DNA sequence of SEQ ID NO: 6, the polymorphic site is the 262th base for the DNA sequence of SEQ ID NO: 7, and the polymorphic site is 2187 base for the DNA sequence of SEQ ID NO: 8, the polymorphic site is 301 base for the DNA sequence of SEQ ID NO: 9, DNA sequence of SEQ ID NO: 10 In the case, the sample containing the 201st base means, respectively) include a method of detecting a single nucleotide polymorphism.

상기 검체는 혈액, 조직, 세포 등을 포함하며, 핵산 시료는 통상의 방법에 따라 얻을 수 있다. 예를 들어 혈액에 경우 다음과 같이 핵산 시료를 얻을 수 있다. 혈액을 원심분리 시험관으로 옮기고 낮은 농도의 염 성분 완충용액(low-salt buffer solution(10mM Tris-HCl [pH 7.6], 10mM KCl, 10mM MgCl2, 및 2mM EDTA))을 첨가한다. 그리고 Nonidet P-40을 첨가한 다음, 얻어진 용액을 잘 섞어준 후, 상온에서 10분간 약 2,200 rpm으로 원심분리한다. 이때 얻어진 덩어리는 고농도의 염 성분 완충용액(high-salt buffer solution(10mM Tris-HCl [pH 7.6], 10mM KCl, 10mM MgCl2, 0.4M NaCl, 및 2mM EDTA))으로 재현탁한다. 게놈 DNA는 50ul의 10% SDS와 섞은 후, 약 55℃에서 밤새 반응시킨다. 반응 후에, 각 게놈 DNA들은 1.5ml 용량의 원심분리 시험관으로 옮겨, 6M NaCl을 0.3ml 첨가한다. 게놈 DNA들을 잘 섞어준 후, 약 12,000rpm에서 10분간 원심분리한다. 원심분리 후, 게놈 DNA가 들어있는 상층을 모아서 새로운 시험관으로 옮기고, 상온에서 동량의 100% 에탄올을 첨가한다. 게놈 DNA들이 침전될 때까지 잘 섞어 주고, 침전이 되면 70% 에탄올로 게놈 DNA들을 세척한다. 이 과정이 끝나면 시험관 뚜껑을 열어, 용액성분이 마르도록 놓아둔다. 그리고 TE 완충용액(pH 8.0)을 넣어 게놈 DNA를 재현탁함으로써, 핵산 시료를 얻을 수 있다.The sample includes blood, tissue, cells, and the like, and a nucleic acid sample can be obtained according to a conventional method. For example, in the case of blood, a nucleic acid sample can be obtained as follows. Transfer blood to a centrifuge tube and add low concentrations of salt component buffer (10 mM Tris-HCl [pH 7.6], 10 mM KCl, 10 mM MgCl 2 , and 2 mM EDTA). Then, after adding Nonidet P-40, the resulting solution was mixed well and centrifuged at about 2,200 rpm for 10 minutes at room temperature. The resulting mass is resuspended in a high concentration of salt component buffer (10 mM Tris-HCl [pH 7.6], 10 mM KCl, 10 mM MgCl 2 , 0.4M NaCl, and 2 mM EDTA). Genomic DNA is mixed with 50ul of 10% SDS and reacted at about 55 ° C overnight. After the reaction, each genomic DNA is transferred to a 1.5 ml centrifuge tube and 0.3 ml of 6 M NaCl is added. After mixing the genomic DNA well, centrifuge for 10 minutes at about 12,000rpm. After centrifugation, the upper layer containing genomic DNA is collected, transferred to a new test tube, and the same amount of 100% ethanol is added at room temperature. Mix the genomic DNA well until it is settled, and wash the genomic DNA with 70% ethanol when settling. At the end of this procedure, open the test tube lid and allow the solution to dry. The nucleic acid sample can be obtained by resuspending genomic DNA by adding TE buffer solution (pH 8.0).

여기에서, 상기 다형성 부위의 염기 서열을 분석하는 단계는 서열번호 1 내지 10의 폴리뉴클레오티드로 이루어진 군으로부터 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드 서열로서 다형성 부위를 포함하는 서열(단, 상기 다형성 부위는 서열번호 1의 DNA 서열의 경우 501번째 염기, 서열번호 2의 DNA 서열 의 경우 101번째 염기, 서열번호 3의 DNA 서열의 경우 401번째 염기, 상기 다형성 부위는 서열번호 4의 DNA 서열의 경우 501번째 염기, 상기 다형성 부위는 서열번호 5의 DNA 서열의 경우 301번째 염기, 상기 다형성 부위는 서열번호 6의 DNA 서열의 경우 501번째 염기, 상기 다형성 부위는 서열번호 7의 DNA 서열의 경우 262번째 염기, 상기 다형성 부위는 서열번호 8의 DNA 서열의 경우 2187번째 염기, 상기 다형성 부위는 서열번호 9의 DNA 서열의 경우 301번째 염기, 서열번호 10의 DNA 서열의 경우 201번째 염기를 각각 의미한다)을 주형으로 하는 프라이머 또는 프로브를 이용하여 수행될 수 있다. 상기 프라이머 또는 프로브는 상기에서 설명한 바와 같다. Here, the step of analyzing the nucleotide sequence of the polymorphic site is a sequence comprising a polymorphic site as a polynucleotide or a complementary polynucleotide sequence thereof selected from the group consisting of polynucleotides of SEQ ID NO: 1 to 10, wherein the polymorphic site is 501th base for the DNA sequence of SEQ ID NO: 1, 101 base for the DNA sequence of SEQ ID NO: 2, 401 base for the DNA sequence of SEQ ID NO: 3, and 501th base for the DNA sequence of SEQ ID NO: 4 Base, the polymorphic site is the 301th base for the DNA sequence of SEQ ID NO: 5, the polymorphic site is the 501th base for the DNA sequence of SEQ ID NO: 6, the polymorphic site is the 262th base for the DNA sequence of SEQ ID NO: 7, The polymorphic site is 2187th base for the DNA sequence of SEQ ID NO: 8, and the polymorphic site is No. 301 for the DNA sequence of SEQ ID NO: 9 The second base, in the case of the DNA sequence of SEQ ID NO: 10 means 201 base each) can be carried out using a primer or a probe as a template. The primer or probe is as described above.

또한, 상기 다형성 부위의 염기 서열을 분석하는 단계는 폴리뉴클레오티드 (a) 내지 (j)로 이루어진 군으로부터 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드가 고정된 마이크로어레이에 상기 핵산 시료를 혼성화시키는 단계 (단, 상기 폴리뉴클레오티드 (a) 내지 (j)는 상기에서 정의한 바와 같다); 및 얻어진 혼성화 결과를 분석하는 단계를 포함하여 수행될 수 있으며, 상기 마이크로어레이에 고정되는 폴리뉴클레오티드 또는 그의 상보적 뉴클레오티드의 DNA 서열의 길이는 각각 10 내지 100 뉴클레오티드일 수 있다.In addition, the step of analyzing the nucleotide sequence of the polymorphic site is a step of hybridizing the nucleic acid sample in a microarray to which a polynucleotide selected from the group consisting of polynucleotides (a) to (j) or a complementary polynucleotide thereof is immobilized. Wherein the polynucleotides (a) to (j) are as defined above); And analyzing the obtained hybridization results, wherein the lengths of the DNA sequences of the polynucleotides or complementary nucleotides immobilized on the microarrays may be 10 to 100 nucleotides, respectively.

본 발명의 검체 중의 단일염기다형을 검출하는 방법에 따라 얻어진 결과는 장형 위암 진단에 필요한 정보를 제공할 수 있으며 예를 들어, 서열번호 1 내지 10의 다형성 부위의 염기가 각각 A, G, G, G, C, G, G, G, G, A (위험 대립인자)인 것이 하나 이상 존재하는 경우, 장형 위암에 걸릴 확률이 높은 위험군에 속하는 것으로 판정할 수 있다. 상기 위험 대립 인자를 갖는 핵산 서열이 하나의 검체에서 많이 검출되면 될수록 위험군에서 속하는 확률은 더 높은 것으로 판단할 수 있다. The results obtained according to the method for detecting a monobasic polymorphism in a sample of the present invention may provide information necessary for diagnosing gastrointestinal gastric cancer. If one or more G, C, G, G, G, G, A (risk alleles) are present, it can be determined that they belong to a high risk group of gastric cancer. The more the nucleic acid sequence having the risk allele is detected in one sample, the higher the probability of belonging to the risk group can be determined.

또한, 상기 다형성 부위의 염기 서열을 분석하는 단계는 서열번호 1 내지 10의 DNA 서열로 이루어진 군으로부터 선택된 DNA 서열의 다형성 부위의 유전자형(genotype) 분석을 포함할 수 있다. 즉, 서열번호 1 내지 10의 다형성 부위의 유전자형이 A/A와 A/G (서열번호 1), G/G와 A/G (서열번호 2), G/G (서열번호 3), G/G (서열번호 4), C/C와 A/C (서열번호 5), G/G와 A/G (서열번호 6), G/G와 A/G (서열번호 7), G/G와 A/G (서열번호 8), G/G (서열번호 9) 및 A/A (서열번호 10) 가 하나 이상 존재하는 경우 장형 위암에 걸릴 위험도가 높은 것으로 판단할 수 있다. 상기 위험 유전자형을 갖는 핵산 서열이 하나의 검체에서 많이 검출되면 될수록 위험군에서 속하는 확률은 더 높은 것으로 판단할 수 있다. In addition, analyzing the nucleotide sequence of the polymorphic site may include genotype analysis of the polymorphic site of the DNA sequence selected from the group consisting of the DNA sequence of SEQ ID NO: 1 to 10. That is, the genotypes of the polymorphic regions of SEQ ID NOs: 1 to 10 are A / A and A / G (SEQ ID NO: 1), G / G and A / G (SEQ ID NO: 2), G / G (SEQ ID NO: 3), G / G (SEQ ID NO: 4), C / C and A / C (SEQ ID NO: 5), G / G and A / G (SEQ ID NO: 6), G / G and A / G (SEQ ID NO: 7), G / G and If one or more A / G (SEQ ID NO: 8), G / G (SEQ ID NO: 9), and A / A (SEQ ID NO: 10) are present, the risk of developing gastrointestinal cancer may be high. The more the nucleic acid sequence having the risk genotype is detected in one sample, the higher the probability of belonging to the risk group can be determined.

이하, 본 발명을 실시예를 통하여 더욱 상세히 설명한다. 그러나 이들 실시예는 본 발명을 예시하기 위한 것으로, 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.Hereinafter, the present invention will be described in more detail with reference to examples. However, these examples are for illustrating the present invention, and the scope of the present invention is not limited to these examples.

실시예 Example

1. 피검자 선정1. Selection of subjects

본 실험은 한국 아주대 병원으로부터 임상적으로 장형 위암으로 진단받은 21명의 환자들과 만성 위염으로 진단받은 24명의 환자들로부터 동의를 받아서 실험과 연관성 분석이 수행되었다. 45명의 환자 모두가 Helicobacter pylori에 감염된 환자이다. 사용된 군집의 크기는 다음 표 1과 같다.This study was performed with 21 patients who were clinically diagnosed as enteric gastric cancer and 24 patients who were diagnosed with chronic gastritis from Korea Ajou University Hospital. All 45 patients were infected with Helicobacter pylori. The size of the clusters used is shown in Table 1 below.

그룹group 정상인Normal 환자군Patient group 총합계total 조사인원Survey 2424 2121 4545

2. 게놈 DNA의 준비2. Preparation of Genomic DNA

게놈 DNA(genomic DNA; gDNA)를 준비하기 위하여 장형 위암 환자와 만성 위염 환자들로부터 혈액을 채취하였다. 전체 정맥혈의 5ml은 각 지원자들의 전주정맥으로부터 얻었고 15% EDTA가 들어있는 Vacutainer tube로 옮겨졌다. 게놈 DNA를 추출하기 위하여, 혈액을 원심분리 실험관으로 옮기고 낮은 농도의 염 성분 완충용액(low-salt buffer solution(10mM Tris-HCl [pH 7.6], 10mM KCl, 10mM MgCl2, and 2mM EDTA))을 5ml 첨가 하였다. 그리고 Nonidet P-40을 첨가하였다. 얻어진 용액을 잘 섞어준 후, 상온에서 10분간 2,200 rpm으로 원심분리 하였다. 이 때 얻어진 덩어리는 고농도의 염 성분 완충용액(high-salt buffer solution(10mM Tris-HCl [pH 7.6], 10mM KCl, 10mM MgCl2, 0.4M NaCl, and 2mM EDTA))으로 재현탁 하였다. 이 게놈 DNA는 50ul의 10% SDS와 섞은 후, 55℃에서 밤새 반응시켰다.Blood was collected from enteric gastric cancer patients and chronic gastritis patients to prepare genomic DNA (gDNA). 5 ml of total venous blood was obtained from each volunteer's anterior venous vein and transferred to a Vacutainer tube containing 15% EDTA. To extract genomic DNA, the blood is transferred to a centrifuge tube and a low concentration of salt buffer solution (10 mM Tris-HCl [pH 7.6], 10 mM KCl, 10 mM MgCl 2 , and 2 mM EDTA) is added. 5 ml was added. And Nonidet P-40 was added. The resulting solution was mixed well and centrifuged at 2,200 rpm for 10 minutes at room temperature. The obtained mass was resuspended in a high concentration salt buffer solution (10 mM Tris-HCl [pH 7.6], 10 mM KCl, 10 mM MgCl 2 , 0.4M NaCl, and 2 mM EDTA). The genomic DNA was mixed with 50ul of 10% SDS and reacted overnight at 55 ° C.

반응 후에, 각 게놈 DNA들은 1.5ml 용량의 원심분리 실험관으로 옮겨, 6M NaCl을 0.3ml 첨가하였다. 게놈 DNA들을 잘 섞어준 후, 12,000rpm에서 10분간 원심분리하였다. 원심분리 후, 게놈 DNA가 들어있는 상층을 모아서 새로운 시험관으로 옮기고, 상온에서 동량의 100% 에탄올을 첨가하였다. 게놈 DNA들이 침전될 때까지 잘 섞어 주고, 침전이 되면 70% 에탄올로 게놈 DNA들을 세척하였다. 이 과정이 끝나면 실험관 뚜껑을 열어, 용액성분이 마르도록 놓아둔다. 그리고 TE 완충용액(pH 8.0)을 넣어 게놈 DNA를 재현탁하였다.After the reaction, each genomic DNA was transferred to a 1.5 ml centrifuge tube and 0.3 ml of 6 M NaCl was added. After mixing the genomic DNA well, it was centrifuged for 10 minutes at 12,000rpm. After centrifugation, the upper layer containing genomic DNA was collected and transferred to a new test tube, and the same amount of 100% ethanol was added at room temperature. Mix well until genomic DNA precipitates and wash genomic DNA with 70% ethanol when precipitated. At the end of this process, open the test tube lid and let the solution dry. Then, TE buffer solution (pH 8.0) was added to resuspend the genomic DNA.

준비된 게놈 DNA는 Infinium II Assay를 위해 Quant-iTTM PicoGreen dsDNA reagent (Molecular Probes, Invitrogen)을 사용하여 750ng/15uL의 농도로 조정하였다. Prepared genomic DNA using the Quant-iT TM PicoGreen dsDNA reagent ( Molecular Probes, Invitrogen) for the Infinium Assay II is adjusted to a concentration of 750ng / 15uL.

3. 전체 게놈의 유전자형 분석 - Infinium II Assay3. Genotyping of the Whole Genome-Infinium II Assay

전체 게놈의 증폭(Whole-genome amplification(WGA)) 게놈 DNA (750ng/15uL)를 상온(22℃)에서 녹인 후, 0.8mL micotiter plate의 각 well에 옮겼다. 0.1N NaOH를 15uL 첨가하고 상온에서 10분간 반응시켰다. 반응이 끝나면 270uL의 MP1 용액과 300uL의 AMM 용액을 차례로 첨가한 후, 뒤집어가며 잘 섞어준다. 280g에서 원심분리하여 37℃ 오븐에서 20시간 동안 반응시켰다. Whole-genome amplification (WGA) Genomic DNA (750ng / 15uL) was dissolved at room temperature (22 ° C) and transferred to each well of 0.8mL micotiter plate. 15 uL of 0.1N NaOH was added and reacted at room temperature for 10 minutes. After the reaction, add 270uL of MP1 solution and 300uL of AMM solution in turn, and mix well. The reaction was centrifuged at 280g for 20 hours in a 37 ℃ oven.

증폭된 게놈 DNA의 단편화와 정제 전체 게놈 DNA 증폭 단계가 끝나면 50g에서 1분간 원심분리 한 후, 150uL 씩 3개의 여분의 well로 옮겼다. 결과적으로 4개의 well이 같은 게놈 DNA가 된다. 각 well에 FRG 용액을 50uL 첨가한 후, 1600rpm으로 1분 동안 와동(vortex)하였다. 상온에서 50g로 원심분리한 다음, 37℃에서 1시간 동안 반응시켰다. 게놈 DNA을 50g에서 원심분리 하고, PA-1 용액을 100uL 첨가하고 1600rpm으로 와동하여, 상온에서 50g로 원심분리 한 후, 37℃에서 5분 동안 방치하였다. 상온에서 50g로 1분 동안 원심분리하고, 100% 아이소프로판올을 300uL 첨가하여 4℃에서 30분 동안 반응시켰다. 4℃에서 3000g로 20분 동안 원심분리하고 게놈 DNA 덩어리를 확인한 다음, microtiter plate를 뒤집어 상층을 제거하였다. 상온에서 1시간 동안 게놈 DNA를 말린 다음, RA1 용액을 42uL 넣고, 48℃ 오븐에서 1시간 동안 반응시켰다. Fragmentation and Purification of Amplified Genomic DNA After the whole genome DNA amplification step, the cells were centrifuged at 50 g for 1 minute and transferred to three extra wells at 150 μL. As a result, four wells become identical genomic DNA. 50 μL of FRG solution was added to each well, followed by vortex for 1 minute at 1600 rpm. After centrifugation at 50g at room temperature, the reaction was carried out at 37 ℃ for 1 hour. Genomic DNA was centrifuged at 50g, 100uL of PA-1 solution was added and vortexed at 1600rpm, centrifuged at 50g at room temperature, and left at 37 ° C for 5 minutes. After centrifugation at 50g for 1 minute at room temperature, 300uL of 100% isopropanol was added and reacted at 4 ° C for 30 minutes. After centrifugation at 3000g for 20 minutes at 4 ℃ to confirm the genomic DNA clumps, the top layer was removed by inverting the microtiter plate. After drying the genomic DNA for 1 hour at room temperature, 42uL of RA1 solution was added, and reacted for 1 hour at 48 ℃ oven.

Sentrix R BeadChip의 준비와 활성화 증폭된 게놈 DNA를 RA1 용액에서 재현탁하는 동안, (SentrixR) BeadChip을 준비하였다. BeadChip을 꺼내어 게놈 DNA를 첨가하기 전까지 PB2 용액이 든 혼성화 챔버(Hybridization chamber)에 넣어 두었다. Preparation and Sentrix R BeadChip (Sentrix R ) BeadChip was prepared while resuspending amplified genomic DNA in RA1 solution. The BeadChip was removed and placed in a hybridization chamber containing PB2 solution until genomic DNA was added.

혼성화 증폭된 게놈 DNA의 재현탁 (48℃, 1시간 반응)이 끝나면, 1800rpm으로 1분 동안 와동하고 280g에서 원심분리한 다음, 95℃ heat block에서 20분 동안 증폭된 게놈 DNA를 변성화 한 후, 280g로 원심분리하였다. 4개의 well로 나누어진 게놈 DNA를 하나의 well로 모으고, 280g로 원심분리하였다. 혼성화 챔버(Hybridization Chamber)로부터 BeadChip Chamber를 꺼내어 게놈 DNA를 넣어준 다음, BeadChip Chamber를 다시 혼성화 챔버(Hybridization Chamber)에 넣고, 48℃에서 18시간 동안 적정속도로 흔들어가면 반응시켰다. After resuspension of hybridized amplified genomic DNA (48 ° C., 1 hour reaction), vortex for 1 minute at 1800 rpm, centrifuge at 280 g, and denature amplified genomic DNA for 20 minutes in a 95 ° C. heat block. , Centrifuged at 280 g. Genomic DNA divided into four wells was pooled into one well and centrifuged at 280g. After removing the BeadChip Chamber from the hybridization chamber (Hybridization Chamber), the genomic DNA was added, the BeadChip Chamber was put back into the hybridization chamber, and reacted by shaking at 48 ° C. at an appropriate speed for 18 hours.

단일 염기 신장(Single Base Extension; SBE)에 의한 염색 18시간의 혼성화가 끝나면, BeadChip 을 꺼내어 WB1 용액과 PB1 용액에 차례로 세척한 후, 150uL의 RA1 용액을 흘려 보냈다. XC1 용액 450uL와 XC2 용액 450uL, TEM 용액 200uL에 차례로 각각 10분, 5분, 15분 동안 반응시키고, 450uL의 95% 포름아마이드/1mM EDTA를 흘려 보냈다. 450uL의 XC3 용액을 흘려보내고, Illuminas 프로토콜에 따라 LTM과 ATM 용액으로 게놈 DNA을 염색하였다. BeadChip chamber를 분해하여 BeadChip을 PB1 용액과, XC4 용액을 이용하여 차례로 세척하고, vacuum desiccator를 이용하여 말린다. 마지막 단계로 Illumina BeadArray reader을 사용하여 스캔함으로써 각 BeadChip에 대한 이미지 파일을 저장하였다.After 18 hours of hybridization with single base extension (SBE) , the BeadChip was taken out, washed sequentially with the WB1 solution and the PB1 solution, and then flowed 150 μL of RA1 solution. 450uL of the XC1 solution, 450uL of the XC2 solution, and 200uL of the TEM solution were sequentially reacted for 10 minutes, 5 minutes, and 15 minutes, respectively, and 450uL of 95% formamide / 1 mM EDTA was flowed. 450 uL of XC3 solution was flowed and genomic DNA stained with LTM and ATM solution according to Illuminas protocol. After disassembling the BeadChip chamber, the BeadChip is washed sequentially with PB1 solution, XC4 solution, and dried using vacuum desiccator. The final step was to scan the Illumina BeadArray reader and save an image file for each BeadChip.

유전자형 분석 이미지 파일로부터 유전자형의 분석은 Bead Studio Version 3.2 software를 사용하여 각 단일염기다형에 대한 유전자형를 정하였다. Genotyping Analysis of genotypes from image files was performed using the Bead Studio Version 3.2 software to genotype each single polymorph.

4. 통계학적 분석4. Statistical Analysis

단일염기다형들을 구성하는 대립인자들에 대한 집단내의 유전학적 분포여부에 대하여 하아디-와인버그 평형 검정을 하였다. 여기에서 단일염기다형의 기준이 되는 HWE p value > 0.05와 작은 대립인자 빈도(Minor Allele Frequency; MAF) > 0.1의 기준을 적용하였다. 장형 위암 환자군과 만성 위염 환자군간의 출현빈도를 이용하여 질병에 대한 각 단일염기다형들의 연관성분석은 유의수준을 < 0.05로 정하였으며, SAS software version 9.1.3를 사용하여 분석하였다. 연관성분석은 대립인자들 간의 장형 위암 환자군과 만성 위염 환자군에서의 출현빈도로 나누어 유의성 있는 차이를 비교하였으며, 유의수준을 < 0.05로 하였다. 오즈 비(Odds Ratio)는 로지스틱 회귀모형을 통하여 산출하였으며 우성 (Dominant), 열성 (Recessive) 및 공우성(Co-Dominant) 모형을 적용하였다. 각 모형에 따른 질병과의 유의성을 분석함에 있어 다수 대립인자를 A1이라 하고 소수 대립인자를 A2라 하면 우성 (Dominant) 모형은 A1A1의 빈도와 A1A2와 A2A2의 빈도에 대한 합을 비교하는 것이고, 열성 (Recessive) 형질 모형은 A1A1과 A1A2의 합과 A2A2의 빈도를 비교하는 것이고, 공우성 (Co-Dominant) 형질 모형은 A1A1, A1A2 및 A2A2에 대한 각각의 빈도를 비교하는 것이다. The Hardy-Weinberg equilibrium test was performed to determine the genetic distribution of the alleles that make up the monobasic polymorphisms. In this case, the criteria of HWE p value> 0.05 and Minor Allele Frequency (MAF)> 0.1, which are the criteria for polybasic polymorphism, were applied. Using the frequency of incidence between intestinal gastric cancer patients and chronic gastritis patients, the significance level of each polybasic polymorphism was set to <0.05 and analyzed using SAS software version 9.1.3. Correlation analysis was performed to compare significant differences between alleles in the incidence of intestinal gastric cancer and in patients with chronic gastritis. The significance level was <0.05. Odds Ratio was calculated by logistic regression model and dominant, recessive and co-dominant models were applied. In analyzing the significance of each model, the majority allele is A1 and the minor allele is A2. The dominant model compares the sum of the frequency of A1A1 with the frequency of A1A2 and A2A2. The Recessive trait model compares the sum of A1A1 and A1A2 with the frequency of A2A2, while the Co-Dominant trait model compares the respective frequencies for A1A1, A1A2 and A2A2.

5. 결과5. Results

(1) 장형 위암 연관 단일염기다형 선별(1) Single base polymorphism associated with enteric gastric cancer

하기 표 2는 51만개의 단일염기다형들 중 장형 위암과 강하게 연관된 SNP 집합을 선별한 결과 중 가장 높은 점수를 나타낸 6개 집합을 나타낸 것이다. Table 2 shows six sets showing the highest score among the results of screening SNP sets strongly associated with gastric cancer of 510,000 monobasic polymorphisms.

단일염기다형 집합Monobasic Polymorphic Set AccuracyAccuracy SensitivitySensitivity SpecificitySpecificity rs12117796 rs16841280 rs2333715 rs3820380 rs10158553rs12117796 rs16841280 rs2333715 rs3820380 rs10158553 97.7897.78 100100 95.8395.83 rs12117796 rs16841280 rs971081 rs3820380 rs10158553 rs12117796 rs16841280 rs971081 rs3820380 rs10158553 97.7897.78 100100 95.8395.83 rs12117796 rs16841280 rs6691829 rs3820380 rs10158553 rs12117796 rs16841280 rs6691829 rs3820380 rs10158553 97.7897.78 100100 95.8395.83 rs12117796 rs16841280 rs3860304 rs3820380 rs10158553 rs12117796 rs16841280 rs3860304 rs3820380 rs10158553 97.7897.78 100100 95.8395.83 rs12117796 rs16841280 rs1171386 rs3820380 rs10158553 rs12117796 rs16841280 rs1171386 rs3820380 rs10158553 97.7897.78 100100 95.8395.83 rs12117796 rs16841280 rs3795593 rs3820380 rs10158553 rs12117796 rs16841280 rs3795593 rs3820380 rs10158553 97.7897.78 100100 95.8395.83

표 2는 51만개의 단일염기다형들 중 장형 위암과 강하게 연관된 단일염기다형 집합을 찾기 위해 χ2 value에 의해 상위 500개의 단일염기다형만을 추출한 후 forward selection 방법을 이용하여 장형 위암과 연관된 단일염기다형 집합을 추출한 결과 중 상위 6개 집합이다. forward selection 방법의 단계는 다음과 같다. 먼저 n개의 단일염기다형에 대해 하나의 단일염기다형으로 구성된 n개의 집합에 대한 인식률을 구하고 가장 높은 인식률을 보이는 집합 s l 을 선택하고 그 다음으로, 전단계에서 선택된 집합 s is j 에 포함되지 않은 각 단일염기다형 s j 에 대해 s i ∪ {s j}를 구성하여 그 인식률을 구하고 가장 높은 인식률을 보이는 집합을 s i+1 로 선택한다. i n 보다 작을 경우 두번째 단계를 반복하여 수행하고 i n 일 경우 s k (1≤k≤n) 중에서 가장 높은 인식률을 보이는 집합을 결과로 출력한다. 이 실험을 위한 인식기로는 결정 트리(decision tree)를 사용하였다. 그리고 자료의 수가 너무 작은 관계로 인식률을 평가함에 있어 인식기의 훈련과 평가를 위한 자료를 따로 나누어 사용하는 것이 불가능하므로 LOOCV 방법을 이용하였다. LOOCV 방법은 주어진 자료 중에서 각 자료 P i를 제외한 자료로 인식기를 훈련시키고 남은 자료 P i에 대해 훈련된 인식기를 이용하여 환자여부를 판별하고 그 결과의 맞고 틀림을 평가하는 과정을 모든 자료에 대해 수행하여 인식기가 환자여부를 맞게 판별한 수와 틀리게 판별한 수를 이용하여 인식률을 산정하는 것을 말한다. 표 2에 있어서, 각 칼럼이 의미하는 바는 다음과 같다. Table 2 shows the single nucleotide polymorphisms associated with intestinal gastric cancer using the forward selection method after extracting only the top 500 single nucleotide polymorphisms by χ 2 value to find a single nucleotide polymorphism set strongly associated with long-term gastric cancer among 510,000 single nucleotide polymorphisms. The top six of the set extraction results. The steps of the forward selection method are as follows. First, not selecting a set to obtain a single recognition rate for the n sets of the single nucleotide polymorphisms for the n number of single nucleotide polymorphisms having highest recognition rate s l and contained in the following, the set selected in the previous step s i and s j For each monobasic polymorphism s j , we construct s i ∪ { s j } to find the recognition rate and select the set with the highest recognition rate as s i + 1 . If i is smaller than n , the second step is repeated, and if i is n , a set having the highest recognition rate among s k (1 ≦ k ≦ n) is output as a result. A decision tree was used as a recognizer for this experiment. In addition, the LOOCV method was used in evaluating the recognition rate because the number of data was too small to use separate data for training and evaluation of the recognizer. The LOOCV method trains the recognizer with the data except for each data P i from the given data, and uses the trained recognizer for the remaining data P i to determine whether the patient is present and to evaluate the correctness and wrongness of the results for all data. This means that the recognition rate is calculated by using the number correctly recognized by the recognizer and the wrong number. In Table 2, the meaning of each column is as follows.

ㆍ 단일염기다형 집합은 forward selection 방법에 의해 추출된 단일염기다형의 집합이다.A monobasic polymorphic set is a monobasic polymorphic set extracted by the forward selection method.

ㆍ Accuracy는 모든 샘플에 대해 바르게 판별한 비율을 말한다.Accuracy refers to the ratio correctly determined for all samples.

ㆍ Sensitivity는 환자를 환자로 바르게 판별한 비율을 말한다.Sensitivity refers to the rate at which patients are correctly identified as patients.

ㆍ Specificity는 정상을 정상으로 바르게 판별한 비율을 말한다.Specificity refers to the ratio of correctly determined normal to normal.

(2) ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 유전자에 존재하는 유의성을 나타내는 단일염기다형(2) Monobasic polymorphisms showing significance in ZMPSTE24, GPR37L1, LMX1A, SRGAP2, FAM5C, EDEM3 genes

하기 표 3는 상기 만성 위염 환자군과 장형 위암 환자군이 참여하여 장형 위암과의 연관성을 분석한 결과 통계학적으로 유의성을 나타낸 서열번호 1 내지 10의 다형성 서열의 특성을 나타낸 것이다.Table 3 below shows the characteristics of the polymorphic sequences of SEQ ID NOs: 1 to 10, which are statistically significant as a result of analyzing the association between the patients with chronic gastritis and the patients with bowel gastric cancer.

서열번호SEQ ID NO: Reference SNP IDReference SNP ID 대립인자Allele 위치location 유전자gene SNP역할SNP Role 아미노산 변화Amino acid changes 1One rs12117796rs12117796 G>AG> A 4050948440509484 ZMPSTE24ZMPSTE24 intronintron 변화없음 No change 22 rs16841280rs16841280 A>GA> G 163458326163458326 LMX1ALMX1A intronintron 변화없음No change 33 rs3795593rs3795593 G>AG> A 200358669200358669 GPR37L1GPR37L1 5'UTR5'UTR 변화없음No change 44 rs3820380rs3820380 G>AG> A 200363438200363438 GPR37L1GPR37L1 intronintron 변화없음No change 55 rs10158553rs10158553 A>CA> C 204687870204687870 SRGAP2SRGAP2 intronintron 변화없음 No change 66 rs1171386rs1171386 A>GA> G 188578948188578948 FAM5CFAM5C intronintron 변화없음No change 77 rs3860304rs3860304 A>GA> G 188501670188501670 FAM5CFAM5C intronintron 변화없음No change 88 rs6691829rs6691829 A>GA> G 188456354188456354 FAM5CFAM5C intronintron 변화없음No change 99 rs971081rs971081 G>AG> A 182983080182983080 EDEM3EDEM3 intronintron 변화없음No change 1010 rs2333715rs2333715 A>GA> G 182962655182962655 EDEM3EDEM3 intronintron 변화없음No change

ㆍ서열번호는 각 단일염기다형을 나타내는 서열번호이다.Sequence number is a sequence number which represents each monobasic polymorphism.

ㆍReference SNP ID는 표준단일염기다형의 명칭 (Reference SNP ID; rs)을 의미하며, 이는 인간게놈프로젝트 후, 미국 국립보건원 산하 생물공학정보연구소 (NCBI)의 데이터베이스에서 각 단일염기다형을 구분하기 위하여 붙인 이름이다. Reference SNP ID refers to the name of the standard single nucleotide polymorphism (Reference SNP ID; rs), which is used to distinguish each single nucleotide polymorphism from the database of the National Institute of Biotechnology Information (NCBI) under the National Institute of Health. Name given.

ㆍ대립인자는 각 단일염기다형에서의 Major allele과 Minor allele을 나타낸다.Alleles represent major and minor alleles in each monobasic polymorph.

ㆍ위치는 염색체상에서 표준염기서열의 위치를 의미한다(NCBI Genome build 36.3).Position refers to the position of the standard base sequence on the chromosome (NCBI Genome build 36.3).

ㆍSNP 역할은 상기 단일염기다형들이 유전자상에서 어디에 위치하고 있는지를 나타내주고 있다. 따라서 각각의 단일염기다형들이 유전자의 발현과 기능에 있어서 어떻게 작용하는지를 알 수 있다. The SNP role indicates where the single base polymorphisms are located on the gene. Thus, it can be seen how each monobasic polymorphism works in gene expression and function.

ㆍ아미노산의 변화는 상기 단일염기다형들이 유전자가 발현되어 단백질을 생성할 때, 그 단백질을 이루는 아미노산에 변화를 주고 있는지에 대한 설명이다.A change in amino acid is a description of whether the monobasic polymorphs are changing the amino acids constituting the protein when the gene is expressed to produce a protein.

(3) 유전자형(genotype) 및 위험대립인자 분석(3) Genotype and Risk Allele Analysis

하기 표 4는 표 2에서 추출된 장형 위암 연관 단일염기다형 집합에 속하는 10 개의 단일염기다형(서열번호 1 내지 10)의 DNA 서열의 대립인자 빈도와 각 유전자형에 대한 만성 위염 환자군과 장형 위암 환자군 각각의 빈도를 나타내며 표 5는 표 4의 유전자형 빈도를 토대로 진행한 하아디-와인버그 평형 검정(Hardy-Weinberg Equilibrium Test) 결과와 장형 위암 연관성 분석[즉, 케이스-컨트롤 연관 분석(Case-control association study)] 결과로서, 하기 연관성 분석에 의해 장형 위암에 영향을 미칠 수 있는 단일염기다형들과 이들의 유전자형을 확인할 수 있다. Table 4 shows the allele frequency of the DNA sequences of ten monobasic polymorphisms (SEQ ID NOS: 1 to 10) belonging to the intestinal gastric cancer associated monobasic polymorphism set extracted from Table 2, and the chronic gastritis and typhoid gastric cancer patient groups for each genotype, respectively. Table 5 shows the results of the Hardy-Weinberg Equilibrium Test based on the genotype frequency of Table 4 and the analysis of gastric cancer (ie, Case-control association study). As a result, the following association analysis can identify monobasic polymorphisms and their genotypes that may affect intestinal gastric cancer.

Figure 112009004777659-pat00001
Figure 112009004777659-pat00001

표 4에 있어서, 각 칼럼이 의미하는 바는 다음과 같다.In Table 4, the meaning of each column is as follows.

ㆍ서열번호는 각 단일염기다형을 나타내는 서열번호이다.Sequence number is a sequence number which represents each monobasic polymorphism.

ㆍReference SNP ID는 표준단일염기다형의 명칭 (Reference SNP ID; rs)을 의미하며, 이는 인간게놈프로젝트 후, 미국 국립보건원 산하 생물공학정보연구소 (NCBI)의 데이터베이스에서 각 단일염기다형을 구분하기 위하여 붙인 이름이다. Reference SNP ID refers to the name of the standard single nucleotide polymorphism (Reference SNP ID; rs), which is used to distinguish each single nucleotide polymorphism from the database of the National Institute of Biotechnology Information (NCBI) under the National Institute of Health. Name given.

ㆍ 대립인자형 빈도(allele frequency) 란에서는 각각의 단일염기다형을 구성하는 두 개의 뉴클레오티드 염기를 표시하며, 집단 내에서 관찰되는 각각의 대립인자들의 빈도를 나타내고 있다. 여기서 대립인자란 단일염기다형 부위에 실제로 존재하고 있는 뉴클레오티드의 염기서열을 뜻하며, 하나의 단일염기다형은 그 특성상 두 개의 대립인자를 가질 수 있다. 이들 대립인자 빈도의 고저에 따라 큰 대립인자(Major allele)와 작은 대립인자(Minor allele)로 나뉜다. 특히 작은 대립인자의 빈도(Minor allele frequency; MAF)는 0.1을 기준으로 하여 단일염기다형과 단일염기변이(point mutation)을 나누는 유전학적 기준으로 사용된다. 이러한 기준은 다형성 자체의 안정성을 뜻하기 때문에(즉, 단일염기다형이 일어나는 부위는 일정하다라는 뜻), 유전적 표지인자로써의 사용 가능성을 대변해 준다. The allele frequency column indicates the two nucleotide bases that make up each monobasic polymorphism and indicates the frequency of each allele observed in the population. Here, an allele means a nucleotide sequence of nucleotides actually present at a single nucleotide polymorphism site, and a single nucleotide polymorphism may have two alleles due to its characteristics. According to the high and low frequency of these alleles, they are divided into large alleles and small alleles. In particular, the minor allele frequency (MAF) is used as a genetic reference for dividing a single nucleotide polymorphism and a point mutation based on 0.1. This criterion represents the stability of the polymorphism itself (that is, the site where a monobasic polymorphism occurs is constant), thus representing its potential use as a genetic marker.

ㆍ 유전자형은 각 단일염기다형을 형성하는 각각의 대립인자들로 이루어지며, 단일염기다형 부위가 존재하는 유전자좌(locus)에 어떠한 대립인자들이 있는지를 나타내 주고 있다.Genotype consists of alleles that form each monobasic polymorphism, and shows what alleles are in the locus where the monobasic polymorphic site exists.

ㆍ 유전자형 빈도(genotype frequency) 란은 단일염기다형을 형성하는 각각의 대립인자들로 이루어지며, 단일염기다형 부위가 존재하는 유전자좌(locus)에 어떠한 대립인자들이 있는지를 나타내 주고 있다. 여기서 큰 대립인자들로만 구성되어 있는 유전자형을 큰 동형유전자형(Major homotype), 큰 대립인자와 작은 대립인자로 이루어진 유전자형을 이형유전자형(Heterotype), 그리고 작은 대립인자들로만 이루어진 유전자형을 작은 동형유전자형(Minor homotype)이라고 한다. 숫자들은 각각의 유전자형에 해당하는 사람들의 수를 만성 위염 환자군과 장형 위암 환자군으로 나누어 나타낸다. 이를 관측치라고 할 수 있다. The genotype frequency column is made up of alleles that form a monobasic polymorphism and indicates what alleles are in the locus where the monobasic polymorphic site exists. Here, the genotype consisting of only large alleles is represented by the genotype consisting of the large major homotype, the large allele and the small allele is heterotyped, and the genotype consisting of only the small alleles is represented by the small minor homotype. It is called. The numbers represent the number of people of each genotype divided into patients with chronic gastritis and those with enteric gastric cancer. This can be called an observation.

Figure 112009004777659-pat00002
Figure 112009004777659-pat00002

표 5는 하나의 단일염기다형을 이루는 두 개의 대립인자와 이로 인하여 형성되는 3가지 형태의 유전자형에 대한 만성 위염 환자군-장형 위암 환자군 간의 빈도차이를 비교하여 어떠한 대립인자가 또는 어떠한 유전자형이 질병과 연관되어 있는지를 분석한 결과이다. 이러한 연관성 분석은 대립인자형(allele model), 공동-우성 유전자형(Co-dominant model), 우성 유전자형(Dominant model), 그리고 열성 유전자형(Recessive model)이라는 네 가지 항목에서 실시하였다. 표 5에 있어서 각 칼럼이 의미하는 바는 다음과 같다. Table 5 compares the frequency differences between the two alleles that form a single polymorphism and the three types of genotypes resulting from chronic gastritis patients and gastrointestinal cancer patients, and which alleles or genotypes are associated with the disease. This is the result of analysis. This association analysis was carried out in four categories: the allele model, the co-dominant genotype, the dominant genotype, and the recessive model. Meaning of each column in Table 5 is as follows.

ㆍ서열번호는 각각의 단일염기다형을 나타내는 번호이다. The sequence number is a number representing each monobasic polymorphism.

ㆍReference SNP ID는 표준단일염기다형의 명칭 (Reference SNP ID; rs)을 의미하며, 이는 인간게놈프로젝트 후, 미국 국립보건원 산하 생물공학정보연구소 (NCBI)의 데이터베이스에서 각 단일염기다형을 구분하기 위하여 붙인 이름이다. Reference SNP ID refers to the name of the standard single nucleotide polymorphism (Reference SNP ID; rs), which is used to distinguish each single nucleotide polymorphism from the database of the National Institute of Biotechnology Information (NCBI) under the National Institute of Health. Name given.

ㆍHWE는 하아디-와인버그 평형 (Hardy-Weinberg Equilibrium)의 상태를 나타내는 것이다. 카이제곱 (df=1) 검정에서 chi-value = 3.84(p-value=0.05, df=1)을 기준으로, 3.84보다 큰 경우에는 하아디-와인버크 평형 HWE (Hardy-Weinberg Equilibrium)으로 판단하고, 3.84보다 작은 경우에는 하아디-와인버그 비평형 (Hardy-Weinberg Disequilibrium)으로 판단하였다. 이는 만성 위염 환자군과 장형 위암 환자군 모두에서 관찰된 각 단일염기다형들의 유전적 표지인자로서의 기능과 이들로 이루어지는 유전자형의 분포가 일반적인 것들인지를 나타낸다.HWE represents the state of the Hardy-Weinberg Equilibrium. Based on chi-value = 3.84 (p-value = 0.05, df = 1) in the chi-square (df = 1) test, it is judged by Hardy-Weinberg equilibrium HWE (Hardy-Weinberg Equilibrium) if it is greater than 3.84, If less than 3.84, it was judged as Hardy-Weinberg Disequilibrium. This indicates that the genotype and distribution of genotypes of the individual monobasic polymorphisms observed in both patients with chronic gastritis and intestinal gastric cancer are common.

ㆍ오즈 비율 (odds ratio, OR)은 장형 위암 환자 중에서 위험 대립인자를 가질 오즈에 대한 만성 위염 환자군 중에서 위험 대립인자를 가질 오즈의 비율을 나타낸다. 95% CI는 오즈 비율의 95% 신뢰구간을 나타내는 것으로, (하한 신뢰구간, 상한 신뢰구간)을 나타낸다. 신뢰구간은 1을 포함하는 경우에는 질병과의 연관성을 유의하다고 판단할 수 없다. 오즈비율이 1보다 크고 95%신뢰구간에 1이 포함되어 있지 않은 경우 소수 대립인자가 질환군에서 더 높은 빈도를 가지며, 오즈비율이 1보다 작은 경우에는 다수 대립인자가 질환군에서 더 높은 빈도를 가진다. The odds ratio (OR) represents the ratio of odds of risk allele among the group of chronic gastritis patients to odds of risk allele among patients with gastric cancer. 95% CI represents the 95% confidence interval of the odds ratio, indicating (lower confidence interval, upper confidence interval). Confidence intervals with a value of 1 cannot be considered significant for association with disease. If the odds ratio is greater than 1 and does not include 1 in the 95% confidence interval, minor alleles have a higher frequency in the disease group. If the odds ratio is less than 1, the majority allele has a higher frequency in the disease group. Have

ㆍ대립인자형에 대한 연관성 분석에서 Logit_p value는 오즈비에 대한 통계적 유의성을 나타낸다. 이는 오즈비 만큼 만성 위염 환자군과 장형 위암 환자군간에 차이에 대한 유의성을 뜻한다. 여기서 유의성있는 차이가 있다고 판단하는 기준은 Logit_p value가 0.05 이하의 값을 나타낼 경우이다. 이러한 값은 로지스틱 회귀(logistic regression) 분석을 통하여 얻었다. In the correlation analysis on the allele type, the Logit_p value represents the statistical significance for the odds ratio. This means that the difference between the patients with chronic gastritis and the patients with gastrointestinal cancer is as significant as the odds ratio. The criterion for determining that there is a significant difference is when the Logit_p value indicates a value of 0.05 or less. These values were obtained through logistic regression analysis.

ㆍ대립인자형에 대한 연관성 분석에서 Exact p value 또한 Logit_p value 처럼 만성 위염 환자군과 장형 위암 환자군간에 차이에 대한 유의성을 뜻한다. 이 역시 p value의 값이 0.05 이하일 때, 유의성있는 차이를 인정한다. Exact p value는 피셔의 정밀 검정(Fisher's exact test)라는 통계 방식을 사용하여 얻어진 값인데, 이는 만성 위염 환자군과 장형 위암 환자군의 비교시 필요되는 기대빈도가 5 이하의 수가 있을 때, 정밀한 검정을 하기 위해 개발된 통계기법이다. 따라서 표 5에서 보여주는 데이터에는 매우 적합한 검정법이라 할 수 있다. In the correlation analysis of allele types, Exact p value also means the significance of the difference between the patients with chronic gastritis and gastrointestinal gastric cancer like Logit_p value. This also recognizes a significant difference when the p value is less than 0.05. The exact p value is obtained using a statistical method called Fisher's exact test, which can be performed when the expected frequency required for the comparison of patients with chronic gastritis and those with enteric gastric cancer is less than or equal to 5 This is a statistical technique developed for the purpose. Therefore, the data shown in Table 5 is a very suitable assay.

ㆍ위험 대립 인자 (risk allele)는 p-value에 유의성이 있는 경우 오즈비가 1 보가 크면 소수 대립인자, 오즈비가 1 보다 작으면 다수 대립인자로 하였다.The risk allele was a small allele if the odds ratio was greater than 1 when the p-value was significant and a majority allele if the odds ratio was less than 1.

ㆍ각 네가지 분석모델에 따른 질병과의 유의성을 분석함에 있어 다수 대립인자를 A1이라 하고 소수 대립인자를 A2라 하면 우성 (Dominant) 모형은 A1A1의 빈도와 A1A2와 A2A2의 빈도에 대한 합을 비교하는 것이고, 열성 (Recessive) 형질 모형은 A1A1과 A1A2의 합과 A2A2의 빈도를 비교하는 것이고, 공우성 (Co-Dominant) 형질 모형은 A1A1, A1A2 및 A2A2에 대한 각각의 빈도를 비교하는 것이다. In analyzing the significance of the disease according to the four analysis models, if the majority allele is A1 and the minor allele is A2, the dominant model compares the sum of the frequency of A1A1 with the frequency of A1A2 and A2A2. The recessive trait model compares the sum of A1A1 and A1A2 with the frequency of A2A2, and the co-dominant trait model compares the respective frequencies for A1A1, A1A2 and A2A2.

대립인자 (Allele)에 대한 연관성 분석은 대립형질들이 만성 위염 환자군과 장형 위암 환자군 사이에서 출현되는 빈도수의 비율을 통하여 위험 대립인자가 장형 위암에 어느 정도의 연관성 (위험도)를 가지고 있는지 확인할 수 있다. 95% 신뢰구간에 1을 포함하고 있을 경우 유의성이 없기 때문에, 상기 표 5로부터 확인할 수 있는 바와 같이, 서열번호 1 내지 10의 다형성 부위의 뉴클레오티드 서열이 각각 A, G, G, G, C, G, G, G, G, A(위험 대립인자)인 것이 하나 이상 존재하는 경우, 장형 위암에 걸릴 가능성이 높은 것으로 판단할 수 있다Correlation analysis of alleles can be used to determine how relevant alleles are to enteric gastric cancer by the ratio of the frequency with which alleles are present in patients with chronic gastritis and gastrointestinal gastric cancer. Since there is no significance when 1 is included in the 95% confidence interval, as shown in Table 5, the nucleotide sequences of the polymorphic sites of SEQ ID NOs: 1 to 10 are A, G, G, G, C, and G, respectively. If more than one G, G, G, or A (risk allele) exists, you may be more likely to develop gastric cancer

또한, 서열번호 1 내지 10은 대립인자와 공우성과 우성 모델에서 유의성을 보이며, 서열번호 1 내지 2, 서열번호 5 내지 8은 오즈비가 > 1로 유전자형(genotype)이 소수대립인자(Minor Allele)를 가지고 있는 사람이 다수대립인자(Major Allele)를 가지고 있는 사람보다 장형 위암에 걸릴 위험이 더 높은 것으로 나타났고 또한 유전자형이 소수 대립인자를 하나라도 가지고 있는 사람이 다수대립인자 둘로 구성된 사람보다 장형 위암에 걸릴 위험이 높은 것으로 나타났다. 반면 서열번호 3 내지 4, 서열번호 9 내지 10은 오즈비가 < 1로 유전자형(genotype)이 다수대립인자(Minor Allele)를 가지고 있는 사람이 소수대립인자(Major Allele)를 가지고 있는 사람보다 장형 위암에 걸릴 위험이 더 높은 것으로 나타났고 또한 유전자형이 다수 대립인자 둘을 가지고 있는 사람이 소수대립인자를 하나라도 가진 사람보다 장형 위암에 걸릴 위험이 높은 것으로 나타났다.In addition, SEQ ID Nos. 1 to 10 show significance in alleles, co-occurrence and dominant models, and SEQ ID Nos. 1 to 2 and SEQ ID NOs: 5 to 8 show odds ratios> 1 and genotypes to minor alleles. Those who have a higher risk of developing gastrointestinal cancer than those who have Major Allele, and those who have at least one genotype with a small number of alleles are more likely to have The risk of catching was high. On the other hand, SEQ ID NOs: 3 to 4 and SEQ ID NOs: 9 to 10 have an odds ratio of <1, and those with genotype Minor Allele are more likely to have gastrointestinal gastric cancer than those with Major Allele. The risk of getting higher was also higher, and people with two alleles of the genotype had a higher risk of developing gastric cancer than those with any one of the minor alleles.

상기 결과로부터, 서열번호 1 내지 10의 다형성 부위가 각각 유전자형이 A/A와 A/G (서열번호 1), G/G와 A/G (서열번호 2), G/G (서열번호 3), G/G (서열번호 4), C/C와 A/C (서열번호 5), G/G와 A/G (서열번호 6), G/G와 A/G (서열번호 7), G/G와 A/G (서열번호 8), G/G (서열번호 9) 및 A/A (서열번호 10)가 하나 이상 존재하는 경우 장형 위암에 걸릴 위험도가 높은 것으로 판단할 수 있다. 또한 서열번호 1의 경우는 A, 서열번호 2는 G, 서열번호 3은 G, 서열번호 4는 G, 서열번호 5는 C, 서열번호 6은 G, 서열번호 7은 G, 서열번호 8은 G, 서열번호 9는 G, 서열번호 10은 A가 각각 만성 위염군에 비해 장형 위암군에서 유의적으로 높은 출현빈도로 나타났으므로, 이는 각각의 대립인자들이 장형 위암에 감수성(susceptibility)을 가진다고 예측할 수 있다. 상기 위험 대립 인자를 갖는 핵산 서열이 하나의 검체에서 많이 검출되면 될수록 위험군에 속하는 확률은 더 높은 것으로 판단할 수 있다. 반대로, 서열번호 1의 경우는 G, 서열번호 2는 A, 서열번호 3은 A, 서열번호 4는 A, 서열번호 5는 A, 서열번호 6은 A, 서열번호 7은 A, 서열번호 8은 A, 서열번호 9는 A, 서열번호 10은 G가 각각 장형 위암군에 비해 만성 위염군에서 유의적으로 높은 출현빈도로 나타났으므로, 이는 각각의 대립인자를 가진 사람들은 장형 위암에 저항성을 가지고 있다고 예측할 수 있다. 따라서 본 발명에 있어서 서열번호 1 내지 10의 단일염기다형은 장형 위암과 관련되는 진단에 효과적으로 이용될 수 있다. 구체적으로는 장형 위암의 진단을 위한 프라이머 또는 프로브로의 목표 부위(target site)로서 사용될 수 있다. From the above results, the polymorphic regions of SEQ ID NOs: 1 to 10 are genotypes A / A and A / G (SEQ ID NO: 1), G / G and A / G (SEQ ID NO: 2), and G / G (SEQ ID NO: 3), respectively. , G / G (SEQ ID NO: 4), C / C and A / C (SEQ ID NO: 5), G / G and A / G (SEQ ID NO: 6), G / G and A / G (SEQ ID NO: 7), G One or more of / G and A / G (SEQ ID NO: 8), G / G (SEQ ID NO: 9), and A / A (SEQ ID NO: 10) may be considered to be at high risk for gastric cancer. In the case of SEQ ID NO: 1, A, SEQ ID 2 is G, SEQ ID 3 is G, SEQ ID 4 is G, SEQ ID 5 is C, SEQ ID 6 is G, SEQ ID 7 is G, SEQ ID 8 is G , SEQ ID NO: 9, G, SEQ ID NO: 10, A, respectively, appeared to be significantly higher in the gastrointestinal gastric cancer group than in the chronic gastritis group, indicating that each allele is susceptible to gastrointestinal gastric cancer. Can be. The more a nucleic acid sequence having the risk allele is detected in one sample, the higher the probability of belonging to a risk group can be determined. In contrast, in the case of SEQ ID NO: 1, G, SEQ ID NO: 2 is A, SEQ ID NO: 3 is A, SEQ ID NO: 4 is A, SEQ ID NO: 5 is A, SEQ ID NO: 6 is A, SEQ ID NO: 7 is A, and SEQ ID NO: 8 is A, SEQ ID NO: 9 and A, SEQ ID NO: 10, respectively, were significantly higher in the chronic gastritis group than in the gastrointestinal gastric cancer group, so that those with alleles were resistant to enteric gastric cancer. Can be predicted. Therefore, in the present invention, the single nucleotide polymorphism of SEQ ID NOs: 1 to 10 can be effectively used for diagnosis related to enteric gastric cancer. Specifically, it may be used as a target site as a primer or probe for diagnosis of enteric gastric cancer.

상기와 같은 분석의 결과를 볼 때, 각 대립인자는 각 개체에 있어서 동형접합자 (homozygote) 또는 이형접합자 (heterozygote)의 형태로 존재할 수 있다. 멘델의 유전법칙과 하디-와인버그 (Hardy-Weinberg) 법칙에 의하면, 집단을 구성하는 대립인자의 조성은 일정한 빈도로 유지되며, 통계적으로 유의한 경우 생물학적 기능상의 의미를 부여할 수 있다. 본 발명의 단일염기다형은 장형 위암 환자와 만성 위염 환자 사이에서 통계적으로 유의한 수준으로 차이를 나타내며 출현되어, 이들 단일염기다형들은 장형 위암의 진단에 사용될 수 있음을 알 수 있다.In view of the results of such an analysis, each allele may exist in the form of a homozygote or heterozygote in each individual. Mendel's genetic law and Hardy-Weinberg law show that the composition of the alleles that make up a group is maintained at a constant frequency and, if statistically significant, can give a biological function meaning. The monobasic polymorphism of the present invention exhibits a statistically significant difference between entero gastric cancer patients and chronic gastritis patients, indicating that these monobasic polymorphisms can be used for the diagnosis of enteric gastric cancer.

<110> College of Medicine Pochon CHA University Industry-Academic Cooperation Foundation <120> Polynucleotides derived from chromosome 1 comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same <130> PN0243 <150> KR10-2008-0122469 <151> 2008-12-04 <160> 10 <170> KopatentIn 1.71 <210> 1 <211> 701 <212> DNA <213> Homo sapiens <400> 1 tcttttcccc ctgatttttc cctccctcac atctcctatt cctcttctct ttccatactc 60 tcaagtgctt cacaacacaa acactacaac gcagtcaaaa tggtctgttc agggccaggc 120 acagtggctt atgcctgtaa tcctggcact ttgggaagcc aaggtgggag gattgcttaa 180 gcccaagagt ttaagaccag cctgggtaac acagtgagac tctgtctcta caaataataa 240 tttttaaaaa acccaaatga aaaaacccaa agtggtctgt tcagtgcacc cagaaattat 300 catctatcag ctcttcagct ccactgatga ggtttatttt attttagaga tagggcctcc 360 ctgtgttgcc caggctggag tacagtggct atttcacagg catgatcata gtgcactaca 420 gctttgagct cctgggctca agcagtcctc ctgccttggc ctcctgagta gctgggacta 480 caggtgtgtg acaccatgcc yaagctgagg tttattttag tctgaattac ataatgctca 540 ttgtttcatt ttccattgat gggatcaaga tcagaaaatg ggcgctagtt ggatttacag 600 gtatctattg tatggcaaat taaagtaaga tgaaaaagag cagagaaaat gctctaaaaa 660 tgcttaagga agtgctattt caaccacatt gtacaattat g 701 <210> 2 <211> 201 <212> DNA <213> Homo sapiens <400> 2 taggttcaaa tgaataaggt ttgagtgtgt ttgtcctaat ttgggaagta acttaagtgg 60 atcgaatacc atctctcttt ggagtagtcc aattctgcta yattaattac tagtcttttg 120 aaggataaat tatctgagaa aattaaattg tttctaggca agggttggaa gacaaagggt 180 taattatctc tccaaattga a 201 <210> 3 <211> 801 <212> DNA <213> Homo sapiens <400> 3 ctagcaccta gtaagtgttc agtaagtgac agtgatggtt attgctgagt tttgaatgga 60 ggagctgcct tagaatcagg agacctgcgc cccagttccc attctgcccc acctccctgt 120 gtcaccctag gcaggccaca tttcctccct agtttcaggg gcctgaagca gatgccctct 180 tagggcccca cagcctgaca tgctgtaggg cctgagaagc ggcgtcgtgg aggacgagat 240 gtgtgagggc agcaaagagt gctatgtgtc cagcagaggg ccctgcccgg cctgtggccg 300 gaggctggga gggagggcag gcgagtgatg ccagacgcct gactggaggc ggatccagcc 360 ggccagctgc ctctctggag cccagctctt gggccccctg yactcacctg ctcttcctgg 420 gctggctgtc tcctgctcat ccagccatgc ggtggctgtg gcccctggct gtctctcttg 480 ctgtgatttt ggctgtgggg ctaagcaggg tctctggggg tgcccccctg cacctgggca 540 ggcacagagc cgagacccag gagcagcaga gccgatccaa gaggggcacc gaggatgagg 600 aggccaaggg cgtgcagcag tatgtgcctg aggagtgggc ggagtacccc cggcccattc 660 accctgctgg cctgcagcca accaagccct tggtggccac cagccctaac cccggcaagg 720 atgggggcac cccagacagt gggcaggaac tgaggggcaa tctgacagga gcaccagggc 780 agaggctaca gatccagaac c 801 <210> 4 <211> 701 <212> DNA <213> Homo sapiens <400> 4 gttgattggg aatgtgatga cacgtaaagt gcccgaccca taggaaatgc tcattaaatg 60 gagttgttac cattattata attccttcct tctttccttc cttccttcct tccttccttc 120 tttccttcct tccttccttc cttgtttcca cagggttttg ctctgtcacc caggctggag 180 tgcagtgtcg tgatcttggc tcactgcagc ctcagcctcc taggctcaag ccatcctcct 240 acctaagttt cccgagtagt tgggaccaca ggcgtgcctc accacgacag gctatttttt 300 tgtattttta gtagagacag ggttccatca tgttgcccag gctggccttg aactcctggg 360 ctcaagtgat ctgcctgcct cggcctctca aagtgctggg attacaggtg tgagtcaccg 420 cacccggccc attattataa tttctatgct tatcactcaa ttcatggtct aactgagcca 480 gaagccaggt gtccttcctt rtccccatag attttgacca agtgcttctc tcttccctca 540 catcctgccc acaggtctcc tctctgggag tcacgacttt cagcctctgt gccctgggca 600 ttgaccgctt ccacgtggcc accagcaccc tgcccaaggt gaggcccatc gagcggtgcc 660 aatccatcct ggccaagttg gctgtcatct gggtgggctc c 701 <210> 5 <211> 601 <212> DNA <213> Homo sapiens <400> 5 ggtctcagcc tactggatga tgagctccag ggagctgtcc ttgtgcatgt gacttagagc 60 tttggttttc ccccttgcat gagtggtgaa aagctgtaga atagcattcc cttccttcta 120 aagtcaggca gaacctccgc cctcacttct caaacatcaa accactgcag gctctggtcc 180 agtgcccggg gcacagagac ccctacagcc ctggcccctg agtcccagcc cagtgggtca 240 gagtcctgga ggggtgtggc tcacggggac aggtgccttc ctccagtttc ctccaagata 300 ktctcccaac ctacccacct gtttcttgtg cactcaacat ttattagcag cctctggaaa 360 aaccacaaga ttagtcaggg aacattacta ccgcagactg tgtgggaggc tagaagcacc 420 tgaggaacaa gagtcagcaa ccttgggttg agagggacct tctaaccgct ggattcacac 480 ccacctggaa ggctcatggc ctctcctctc ccttctttgg gaagtgagag aagtgccagc 540 cccgggagct aaggcagtaa ggaggtgagt gagggtggta gaaggggaga tagagcacta 600 a 601 <210> 6 <211> 1001 <212> DNA <213> Homo sapiens <400> 6 agacacctcc ctttatgatg tcaatctaag ggctgagcta agggaaataa atgtgattat 60 tgtaagtaac aatacttctg atctcagtta tataaactac atgtacattt ttaggaaaaa 120 aatgaataaa tatagatgtt taaacatatg aagtatatct caaatgataa atgtttgtat 180 ttagctgtgg cctagaataa atacagaatt ttcttatggg ccaaagacag aaaacggtgt 240 taagatcaag tgatgaaaag ctttgaatac aagtttaagg aggtagactt cattcagtag 300 gattcgaaga actatggtgg ctctttaaac agaactgcgg catagccatt aaatgtatct 360 aggaaaaata tctaccatca atcaaagtac aggttgaagt taagatgaac aggcgatgta 420 tcaattattg atttattaaa ctgagggaaa ctgctgcatg tataatgagg aagaaccacc 480 cagggttaga ttttgggaac rgaggaagag tgaattaaaa agttgacaga aaaataaaat 540 gagttaggtt tgaagaggta aatatttaaa attctgtggc agatatactt ggaagaaggt 600 ggctgtttaa ggctagagtt tgagagagaa gttaagacta cagatgaata aatgcagaaa 660 ctttgcacag taaagtgaaa acaaaaccaa attagcctga ttttgaatct tgattctgct 720 atgtactatg gtgagctact tgggaaagtc agttatcctt tccaaaactc agcttactta 780 actgtaaaat tggaaaataa taagcattct gcacaggtat tataaaggaa ggatgacata 840 taaattaagt gcatatttga atgccttgta tatagtacat gctcaacaat catttttact 900 tttattatta tcattacaat aataaaaacc attactagta ttattatatt taatctctaa 960 tttgttagag gtgttagatt aaagaaaatt ggtaacatag a 1001 <210> 7 <211> 1371 <212> DNA <213> Homo sapiens <400> 7 ccaaacaaaa gggttgctga aagaatgaaa acagcaagtt tgacaattat gtgctagatg 60 agtatccgat aatatgtttg tcggaggatc acaagttctt aatgtctaac ttcaatgaca 120 tggatttttg tcttttggac attgaaaagt tcagcttaat tgtaatacac tttacgtttt 180 acgtttgaga accaattgct actacctaaa tcctacatag atttcagtgt ttttcacaca 240 gtgtattaac acacaatgtt tyaatatatc ctatgcaggg aaattctgaa tttattacat 300 atatatacat acctgtatat gcatacacat gctttatctg aattttaaag gtgcagatga 360 aaactagtgc tttgtcatat ttccatttgg atattctatt ctatggtaaa aatttctgag 420 taaatgcaat ttctttcttt ttatttattt atttatttat ttttgagacg gagtctcgct 480 ctgtcgccca ggctggagtg cagtggcggg aacctccgct cactgcaagc tccgcctccc 540 gggttcacgc cattcttctg ccacagcctc cggagtagct ggaactactg gcgcccgcca 600 ccacgcccgg ctaatttata tatatatata tatatatatt tagtagagac ggggtttcac 660 cgtgttagcc aggatagtct cgatctcctg ccctcatgat ccgcccacct cggccttcca 720 tagtgctggg attacaggcg tgagccaccg tgcccggccc tgagtaaaat acagtttcat 780 tttatgcccc tcacttgttt gttttccata aattaatttt attttggacc atatgagtgt 840 tatgctaaac tttgttagaa agtcaataaa atctggagaa actgttctgc aaaagctaaa 900 tatctgacat tcagtaacta cgtgtttaaa gtgaccaata tcccaggcac tttttgaggt 960 acttgagaaa tatctgtgac caaaaataaa accccttgcc cttttggcat atatcactcc 1020 tttgttttac tatattcata agctagacct ttccacctgc agataagtta aaaaaaaaga 1080 ttttaagtgg aaaattgaat aatttgaaat attattaatg caggagagga gtcactcaca 1140 atttttgtgg acaagcggaa gttgagcaaa cgagctgaag gaagtgattc caccaccaat 1200 agctcttcgg tcactctgga gacgctacat cagctagccg cttcttattt cattgacagg 1260 gacagcaccc ttcggagact tcaccacatt caaattgcat ccactgccat aaaggtaaga 1320 atgagtttac gctaaaatta tcaccttcca ttgtttgttt cctctatatc c 1371 <210> 8 <211> 7297 <212> DNA <213> Homo sapiens <400> 8 aaaatcattt ttaattgatg tgtattttat tgtaatttga agaattataa ttgtatacat 60 ttatgaggta acactggatg ttattatata tgtatataat gaagaatgag taattcaaac 120 taattaacat atctaccacc tcaaatactt atttttttat ggtgagaata tttgaaatat 180 attagaaata tattctgttg gcaattttga aacatacatt ttattaacaa gtcaacatgc 240 tatgctatag atctcaaaac ctatttttcc ggtctaactg aaactttgca acatttgatg 300 atcacatcct catacctccc cccaccctcc ttgtcccctc tattcaccaa tgtctgcttc 360 cattattttg gttgttttta atgctctatt ttgatcaaat aaatcttaag ggagcctaca 420 tttactaact cttcctaaat ctatttaccc tttcattgtg taatttgtgt tatttccaac 480 aacaacaaca aaagcaaaat attttgttga agccatcatt gtgttttctc ttgtctggaa 540 catgttttgt caccttcaca cagtactagg ataattcctt tgggaccaac tccattcagg 600 actgccagtg ctctcattat ttacaacggc aatgcaaata ggggattcag gcacaactaa 660 gagccaagaa taaagcagac ctagcagtaa agaatcacgg agcaagcata tttaactata 720 aatgaaaaaa attggacaga taaaactgga attaataatt aatccttcaa tgcaattcac 780 agacatttac ccataagaaa caacagcaaa caggaaacca tgacctcctc aaaaagacag 840 aacaaaaatt gagtgactga cccaaacaag atgctgattt gtgagctctc tgaccaagaa 900 ttcaaaacag cagttttcag gaaactcagt gatctctaag ataacacaga aaagcaattc 960 tgaaatttat tagagaaatt taacaaagat attaaaataa taaaaaatca aacagaaatc 1020 atggaataga gaaatacatt tcctgaactg aacaattcat tagaggtctc aacagtagaa 1080 tggaccaagc agagaaaaga atcagtgagc taaaagactg gctatttgaa aatacatagt 1140 cagggccagg aatggtggct cacgcctgta atcccagcac tttgggaggc cgaggtgggt 1200 ggatcacgag gtcaagagat cgagaccatc ctggccaaca tggtgaaacc ctgtctctac 1260 taaaaataca aaaattagct ggatgtggtg gcggatgtct gtagtcccag ctactcagga 1320 agctgaggca ggagaatcgc ttgaacctgg gaggtggagg tttcagtgag ccaagatctc 1380 accactgcac tccagcctgg gtgacagagt gagactccaa aaaaaaaatt aaaataataa 1440 taataataat aaattttaaa aaaagggaaa tacacagtca gagggaaaca aacaagcaaa 1500 caaatgaaaa acatgaaaag gaacaaagac cacctataag atacagaaaa ttacctcaaa 1560 agaccaaatt gaagaattat tggtattcaa aagtgagctg agcaagatca aggagtggaa 1620 attttagtca aataaataat gaaaaactgt gcaaagcttg agaaatattc aggtatagaa 1680 cgatctggga atactagtca gattcaatcc cgataagact acctccaagg catataataa 1740 ccaaactccc taagatcaat gaaaaagaga gaatcctaaa agcagcaaga gaaaagaagc 1800 aaaaaggatg agttcatgtc ctttacaggg acatgggtga agctggaaac catcattctc 1860 agctaactat cgtaagatca gaaaaccaaa cactgcatgt tctcaatcat atgtgggagt 1920 tgaacaatga gatcacacgg acacagggag aggaacatca cacatcaggg cctgtcaggg 1980 gttgggggct aggggagggt taacattagg agaaatacct aatgttggtg acgggttgat 2040 gggtgtagca aaccaccatg gcccgtgtat acctatgtaa caaaactgca cgttctgcac 2100 atgtaacgca gaacttaaag tataattttt tttaaaaaag aagcaaataa cataaaagac 2160 ataaaaggag cttcaatttg tctggcraca aacttctcaa tggcattttc aatgtgttca 2220 aagataaaaa aaattgcaac tcaaaaatat tgtattaggc aaaatcatcc ttaaaacatg 2280 aaggagagat aaactatttc ccaaataaac aaaaatggag agaatttacc accaccagac 2340 tcatcttaca agaaatgata aaggaagctc ttcagtctga aagtaaaaac atacaaatat 2400 gccaaaaaaa agttttcaag gcataaatcc cactggtaaa attaagtaca aggacaaact 2460 cagaatactc tgtcacttta attttggtgt gcaattctct tgtaacctca tatgaagccc 2520 aaaagtaaaa tctgtcaaaa acagtaatag ctatagcaac tttctaagag atagtataaa 2580 aatctgtaaa cagaggagtt cgagaccagc ctggccaaca tggtgaaacc ctgtctctac 2640 tacaaacaca aaaattagtc gggcatggtg gcagatgcct gtaatcccaa ctacttgggt 2700 ggctgaagca agagaatcgc ttgaacccgg gaggcagagg ttgcagtgag ctgagatcgc 2760 accactacac tccagcctag gcgacagagt gagactccat ctcaaacaaa caaacaacaa 2820 aaaaagtaaa ctggggcaac taaaagtaaa catgtgggtg agtggagtta aagtgtaaaa 2880 ttttttgtgt gctttttgtc tttgttgttt ctgttcttag tttgttatcc aaggtaagtt 2940 gtcttctctt tagcataact tactatatct ataagatgat ttttgtaagc ctcataactt 3000 gagataaatt catggaaaat gaaaagcaac aaattaaaac acactaccaa tgaaaatcac 3060 ttaatcacaa agaaagacag taagaagaga agaagagact aaaacgaacc agaaaacaag 3120 ccacaaaatg gcagtagtgt gcacttattt atcaataata acactgaatg taaatgatct 3180 cacttcccca attataacgt gtatagtggc tgaatgaata aagaagtaag acccaactat 3240 atgttgcctt caaaaaatcc acttaatgta gaaagataca catagactga gcgtgaaggg 3300 gtggaaaaag atactcgatg caactggaaa acaaaggagc aggagtagct atacctatat 3360 cagacaaaat agattaaaaa tctaagattt aaaaagacat aggaggtcaa tataaaatga 3420 taaaggggtc aatacagcaa gataatataa caattatcaa tagttttatg cccaacaaca 3480 gagtttccta taagtatata aagcacacat tagtagagct aaaaatatat ataagactat 3540 aataaaataa cagcagggga atttaacacc ctcgtatcag taatgaacat atcatccaga 3600 cagaaaatca agaaagaaag agcacagtta aactacgcac tagatctaat gggccctaga 3660 tgacattaac aaaacatttc acccaactgc tgcagaatat acattctttc cttcagtgca 3720 tggaacattc ttcagaatag gtcatatctt aagcaacaaa aaagtctgaa taaattaaaa 3780 aataaaaatc ttatcaagta acttttctga ccacaatgga ataaaaacca caaattgaaa 3840 acaagaggaa ccttggaaaa tacacaaaca catagaaata aaacatccta ctggacagct 3900 aatgagtcaa ttaaaaaaat aagaaggcaa ttaaaaaaaa caaatgaaaa caaaaataca 3960 acaaaccaaa acttgagata caataacatc tatatcaagc gggatgttta tagtaataaa 4020 tgcctaaatt aaaagagtat aaagacttca aataacctaa caatgaacct caacgaacga 4080 gaaaagcaag aataaaccaa accccaaatt aatagaagaa ataataaaaa tcacagcaga 4140 tatgaataaa gttgagacaa aaaaatacat aagatcaaca aaaggaaaag ctgcatgttt 4200 gaaaagatat taacaaaccc ttagccagat taagaataaa ggaagaagag gcaaataaat 4260 aaaataagaa atgaaaaagg gaaataaatg aaatttatac tagaaaaata cataagatca 4320 atgatagaaa aagttgggtt tttgaaaaga taatcaaaac tgacaaattc tttgtctaag 4380 aaaaaaaaga cctaattaaa taaaatcaga aatgaaaaag gagacataac aactgagaac 4440 ccagaagcac aaagaatcgt tagagactat tgtgaacaac tgcatgccaa caaattggaa 4500 aacttggaag aaatgaataa attcctggac acacacaact taccaagatt gaacaatgaa 4560 gaaataaaaa aaaaattaac aagccaaaaa tcaatatggc tatcaaagag ataattcaaa 4620 gtcttccatc aaaatgaagc tcaggatcat tggcttcact gctaactcta ccaaaattta 4680 aagaagaacc aatatcagtt ctacccaaat tctccaaaaa tttggaagga aggtaatact 4740 ccaaactcat tatatgaggt cagcattacc ctgatactaa aaccagacaa aaacatgaca 4800 agaaaccaat aagaacacta cagatcaata tcactgatga gcagagatgc aaagataatc 4860 aacaaaacac tagcaaacca aattcaacaa cacattaaca tgatcaagtg aaattcatcc 4920 tagggataca aagatggttc aacacatgca aatcaacaaa cgtgatgcat cacattagca 4980 gaatcaagaa aataaacata tcattatttc aatagatgcc aaaaaagcac ttgataaaat 5040 tgaacaacag ttcatgataa aaactctcat caaaatgggt atagagagaa tacacttcaa 5100 aattataaag gccatgtatg acaaacccac agttaacact gtgctgaatg agaaaaataa 5160 ttttttctta tgagaaaggc cttttcttta aagactggaa caagataaga atgcttactt 5220 tcaccacttt tattcaacat gacatggaaa gtcctctcca gaacaagtag ggaaaagaac 5280 taaataaaaa gcataaaaac tggaaagaag aagtcaaatt agcgttgttt gtagacaaca 5340 caatttcata cctagaaaaa acctcaataa aaacaatgtt aaaattgata aaaacattca 5400 gtaaagttgc gggatacaaa ataaactaca gaaatcaaca aataatctga aaaaacaaga 5460 aagcaacctc atttactatg gctacaactg tataaaatac ctcaaagcaa tcaaaccaaa 5520 taatggaaag atctatataa gaaaaactat gaaattctta tgcaaaaagt acaagaaaac 5580 acacaaataa tgtaaagata tttcatatgt atggattgga atatttaatg ttgttaaaat 5640 gacaatacta ctaaagcaat ttacggattc agcacaatcc ccatcaaaac agtggcattc 5700 ttcacagaaa tagaaaaaaa aaattataaa atatgtgcag gacatcaaaa gatacccaaa 5760 taactaaagt aatcatgagc aaaaaagaac aaagctagaa tcatcacacc acctgacttc 5820 aaatttacta caaagctatc acaatcaaaa cagcatagta ctgggataaa agcagacaca 5880 tagaccaatg gaatagaata gagaaccata tatatatcca cacatttaca gccaactcaa 5940 ctttgacaaa gactacacat acgttgggga aaagaaaatc ttttaaataa atattgctgg 6000 aaaaaatgga taattttatg cagaaaaaat ctagacccct atctctcacc atacacaaaa 6060 atcaaataaa aataaattat agacttaaat ctaaaactta aaaatataaa actaaaaacg 6120 aaattattta ggaaacacta caggacattg gtctgggcaa agattttttt gtttgtaaaa 6180 cctcaacatt acagacaact aaagcaaaaa atagacaaat ggaattatat caagctaaaa 6240 agcctctgta cagtaaacaa tcagcaaagt gaagagataa cccacagaat gggagaaaat 6300 atttacaaac cattcatctg tccagggatt aataaccaga atacataagg agctcaaaca 6360 actaaataac caaaacaaaa tactaaaaac caaaactaat aacccaatta aagactgggc 6420 agaatatctg aatacatatt tctcataaga agacataaag atggcaaaca gatatatgaa 6480 ataatgctca acatcactaa ttatcagaga aatgcaagtc aaaactacaa tttaaaatgg 6540 gttgtatcaa aagacaggca ataacaggtg ctggtgagga tgcagagaaa ggggaaccct 6600 tctacactgt tggtggaaat atagattagt agagccacta aggagaactc tatggagttt 6660 gctcaaacac ctaaagtaga agtaccatat tattaatctc actactgaat atatatacaa 6720 aataaaggaa atcagtatat tgaatatata gctgcactcc cttatttatt gcagcactat 6780 tcccaataac caaatacgga ttcaatttaa ctgcccatca gtggatgaat agattaagag 6840 aatgtgttat atatacacaa tggaatatta ttcagccata aaatagaatg aaatcttgtc 6900 atctgcaaca acatggatgg aacaagaggc ctttatatta agtgaaataa gtcaatcaca 6960 gaaagacaaa tattctaacc cacatgttcc cactcatatg tggaagctaa aaaaagtaga 7020 actcatgaag atagagagta gaacggtggt ttccagaggc caggaagggt agtgggggct 7080 gggagaaaat gcagggaaaa taaaagaata aaaatgtatt tattaagtgt gcttaaaaat 7140 cgcaaagata gtaaatttta tatgtatgtt ttaaccaagt aaaaataaaa caatcataac 7200 aaaactcaca aaacactata aaattaaaat ttagataact tcattgtaga aataagtgaa 7260 gtgaaaataa gcactaatga gaatcatgtt gaaaaag 7297 <210> 9 <211> 601 <212> DNA <213> Homo sapiens <400> 9 atatttccag tgggaccata cgtgtccact gtaatatgta ttttaaaatg ttcaactatt 60 ttacaatgtg agtgactctt gctgtgtact tcttctatat tcaatctgtg tgaggtctgt 120 aacccaagat ttagtctaga atttacactt cctcttttca agttctcaac taacatgaca 180 cagttctaaa atattaaaga gaatacagtt gccttgtatt tgttatttga agtcagttgg 240 aaattttttt ccggtcccta cactcagaaa cacttttagc tttctgtagg gtaaaagtgt 300 rtaggttttg gagttagaag ggcttgagtt caaatcctgt ctcagctatt tacaggttgg 360 accctaaaca ggttatttaa cccatctgag cagtgtcttt ctatgtaaaa tgagaataat 420 tgcaaagagt tattgtagac tatagatttt tttttaaaga acaggaacca atttctttaa 480 tttttaatac attcaccttt tttatatgtc ttgtgcctgg tacataaatg cttagcaaat 540 ttttttgaaa gaactgaatt gaattcttgt gaagatgaag taaaataatg tttttttttt 600 t 601 <210> 10 <211> 673 <212> DNA <213> Homo sapiens <400> 10 gtatctttta taacaatttt gttctctgga cagtttgaac tagtaagtac aagaataggg 60 aagtagacca gccttagaag aaattagggt tagtttagaa tttgtgaaaa accagtctat 120 attatatatt aactagttca ccatagagaa aaaacggatt gttatggtat acatttgaaa 180 ggaaattaaa atttcattta ygggttttaa gagtttggaa atatagagtg tatcaccttg 240 ctggcaggct aacaacacaa gggaaatttt ttcaaaggtg tatttcttta ttaagtggaa 300 gacaaccaaa taggccacga gcggtagctc atgcctgtaa tcccagcact ttgtgaggcc 360 aaggcgagtg gatcacttga ggccagaagt ttgagaccag cctcaccaac atggcgtaac 420 cccatctcta ctaaaaatac aaaaatcagc caggcatggt tgcgtgtgcc tgtaatccca 480 gctacctggg aggctgaggc acgaatctct tgaacttggg aggtggaggt tgcagtgagc 540 tgagatagcg ccacagcact ccagcctgtg tgacagagca agacctttac tattacaata 600 tgaatctgga ttaactagac tcaaactgag cagacactga ttaaaattag aatatttttc 660 agcaatccaa ata 673 <110> College of Medicine Pochon CHA University Industry-Academic Cooperation Foundation <120> Polynucleotides derived from chromosome 1 comprising single          nucleotide polymorphism, microarrays and diagnostic kits          configuring the same, and analytic methods using the same <130> PN0243 <150> KR10-2008-0122469 <151> 2008-12-04 <160> 10 <170> KopatentIn 1.71 <210> 1 <211> 701 <212> DNA <213> Homo sapiens <400> 1 tcttttcccc ctgatttttc cctccctcac atctcctatt cctcttctct ttccatactc 60 tcaagtgctt cacaacacaa acactacaac gcagtcaaaa tggtctgttc agggccaggc 120 acagtggctt atgcctgtaa tcctggcact ttgggaagcc aaggtgggag gattgcttaa 180 gcccaagagt ttaagaccag cctgggtaac acagtgagac tctgtctcta caaataataa 240 tttttaaaaa acccaaatga aaaaacccaa agtggtctgt tcagtgcacc cagaaattat 300 catctatcag ctcttcagct ccactgatga ggtttatttt attttagaga tagggcctcc 360 ctgtgttgcc caggctggag tacagtggct atttcacagg catgatcata gtgcactaca 420 gctttgagct cctgggctca agcagtcctc ctgccttggc ctcctgagta gctgggacta 480 caggtgtgtg acaccatgcc yaagctgagg tttattttag tctgaattac ataatgctca 540 ttgtttcatt ttccattgat gggatcaaga tcagaaaatg ggcgctagtt ggatttacag 600 gtatctattg tatggcaaat taaagtaaga tgaaaaagag cagagaaaat gctctaaaaa 660 tgcttaagga agtgctattt caaccacatt gtacaattat g 701 <210> 2 <211> 201 <212> DNA <213> Homo sapiens <400> 2 taggttcaaa tgaataaggt ttgagtgtgt ttgtcctaat ttgggaagta acttaagtgg 60 atcgaatacc atctctcttt ggagtagtcc aattctgcta yattaattac tagtcttttg 120 aaggataaat tatctgagaa aattaaattg tttctaggca agggttggaa gacaaagggt 180 taattatctc tccaaattga a 201 <210> 3 <211> 801 <212> DNA <213> Homo sapiens <400> 3 ctagcaccta gtaagtgttc agtaagtgac agtgatggtt attgctgagt tttgaatgga 60 ggagctgcct tagaatcagg agacctgcgc cccagttccc attctgcccc acctccctgt 120 gtcaccctag gcaggccaca tttcctccct agtttcaggg gcctgaagca gatgccctct 180 tagggcccca cagcctgaca tgctgtaggg cctgagaagc ggcgtcgtgg aggacgagat 240 gtgtgagggc agcaaagagt gctatgtgtc cagcagaggg ccctgcccgg cctgtggccg 300 gaggctggga gggagggcag gcgagtgatg ccagacgcct gactggaggc ggatccagcc 360 ggccagctgc ctctctggag cccagctctt gggccccctg yactcacctg ctcttcctgg 420 gctggctgtc tcctgctcat ccagccatgc ggtggctgtg gcccctggct gtctctcttg 480 ctgtgatttt ggctgtgggg ctaagcaggg tctctggggg tgcccccctg cacctgggca 540 ggcacagagc cgagacccag gagcagcaga gccgatccaa gaggggcacc gaggatgagg 600 aggccaaggg cgtgcagcag tatgtgcctg aggagtgggc ggagtacccc cggcccattc 660 accctgctgg cctgcagcca accaagccct tggtggccac cagccctaac cccggcaagg 720 atgggggcac cccagacagt gggcaggaac tgaggggcaa tctgacagga gcaccagggc 780 agaggctaca gatccagaac c 801 <210> 4 <211> 701 <212> DNA <213> Homo sapiens <400> 4 gttgattggg aatgtgatga cacgtaaagt gcccgaccca taggaaatgc tcattaaatg 60 gagttgttac cattattata attccttcct tctttccttc cttccttcct tccttccttc 120 tttccttcct tccttccttc cttgtttcca cagggttttg ctctgtcacc caggctggag 180 tgcagtgtcg tgatcttggc tcactgcagc ctcagcctcc taggctcaag ccatcctcct 240 acctaagttt cccgagtagt tgggaccaca ggcgtgcctc accacgacag gctatttttt 300 tgtattttta gtagagacag ggttccatca tgttgcccag gctggccttg aactcctggg 360 ctcaagtgat ctgcctgcct cggcctctca aagtgctggg attacaggtg tgagtcaccg 420 cacccggccc attattataa tttctatgct tatcactcaa ttcatggtct aactgagcca 480 gaagccaggt gtccttcctt rtccccatag attttgacca agtgcttctc tcttccctca 540 catcctgccc acaggtctcc tctctgggag tcacgacttt cagcctctgt gccctgggca 600 ttgaccgctt ccacgtggcc accagcaccc tgcccaaggt gaggcccatc gagcggtgcc 660 aatccatcct ggccaagttg gctgtcatct gggtgggctc c 701 <210> 5 <211> 601 <212> DNA <213> Homo sapiens <400> 5 ggtctcagcc tactggatga tgagctccag ggagctgtcc ttgtgcatgt gacttagagc 60 tttggttttc ccccttgcat gagtggtgaa aagctgtaga atagcattcc cttccttcta 120 aagtcaggca gaacctccgc cctcacttct caaacatcaa accactgcag gctctggtcc 180 agtgcccggg gcacagagac ccctacagcc ctggcccctg agtcccagcc cagtgggtca 240 gagtcctgga ggggtgtggc tcacggggac aggtgccttc ctccagtttc ctccaagata 300 ktctcccaac ctacccacct gtttcttgtg cactcaacat ttattagcag cctctggaaa 360 aaccacaaga ttagtcaggg aacattacta ccgcagactg tgtgggaggc tagaagcacc 420 tgaggaacaa gagtcagcaa ccttgggttg agagggacct tctaaccgct ggattcacac 480 ccacctggaa ggctcatggc ctctcctctc ccttctttgg gaagtgagag aagtgccagc 540 cccgggagct aaggcagtaa ggaggtgagt gagggtggta gaaggggaga tagagcacta 600 a 601 <210> 6 <211> 1001 <212> DNA <213> Homo sapiens <400> 6 agacacctcc ctttatgatg tcaatctaag ggctgagcta agggaaataa atgtgattat 60 tgtaagtaac aatacttctg atctcagtta tataaactac atgtacattt ttaggaaaaa 120 aatgaataaa tatagatgtt taaacatatg aagtatatct caaatgataa atgtttgtat 180 ttagctgtgg cctagaataa atacagaatt ttcttatggg ccaaagacag aaaacggtgt 240 taagatcaag tgatgaaaag ctttgaatac aagtttaagg aggtagactt cattcagtag 300 gattcgaaga actatggtgg ctctttaaac agaactgcgg catagccatt aaatgtatct 360 aggaaaaata tctaccatca atcaaagtac aggttgaagt taagatgaac aggcgatgta 420 tcaattattg atttattaaa ctgagggaaa ctgctgcatg tataatgagg aagaaccacc 480 cagggttaga ttttgggaac rgaggaagag tgaattaaaa agttgacaga aaaataaaat 540 gagttaggtt tgaagaggta aatatttaaa attctgtggc agatatactt ggaagaaggt 600 ggctgtttaa ggctagagtt tgagagagaa gttaagacta cagatgaata aatgcagaaa 660 ctttgcacag taaagtgaaa acaaaaccaa attagcctga ttttgaatct tgattctgct 720 atgtactatg gtgagctact tgggaaagtc agttatcctt tccaaaactc agcttactta 780 actgtaaaat tggaaaataa taagcattct gcacaggtat tataaaggaa ggatgacata 840 taaattaagt gcatatttga atgccttgta tatagtacat gctcaacaat catttttact 900 tttattatta tcattacaat aataaaaacc attactagta ttattatatt taatctctaa 960 tttgttagag gtgttagatt aaagaaaatt ggtaacatag a 1001 <210> 7 <211> 1371 <212> DNA <213> Homo sapiens <400> 7 ccaaacaaaa gggttgctga aagaatgaaa acagcaagtt tgacaattat gtgctagatg 60 agtatccgat aatatgtttg tcggaggatc acaagttctt aatgtctaac ttcaatgaca 120 tggatttttg tcttttggac attgaaaagt tcagcttaat tgtaatacac tttacgtttt 180 acgtttgaga accaattgct actacctaaa tcctacatag atttcagtgt ttttcacaca 240 gtgtattaac acacaatgtt tyaatatatc ctatgcaggg aaattctgaa tttattacat 300 atatatacat acctgtatat gcatacacat gctttatctg aattttaaag gtgcagatga 360 aaactagtgc tttgtcatat ttccatttgg atattctatt ctatggtaaa aatttctgag 420 taaatgcaat ttctttcttt ttatttattt atttatttat ttttgagacg gagtctcgct 480 ctgtcgccca ggctggagtg cagtggcggg aacctccgct cactgcaagc tccgcctccc 540 gggttcacgc cattcttctg ccacagcctc cggagtagct ggaactactg gcgcccgcca 600 ccacgcccgg ctaatttata tatatatata tatatatatt tagtagagac ggggtttcac 660 cgtgttagcc aggatagtct cgatctcctg ccctcatgat ccgcccacct cggccttcca 720 tagtgctggg attacaggcg tgagccaccg tgcccggccc tgagtaaaat acagtttcat 780 tttatgcccc tcacttgttt gttttccata aattaatttt attttggacc atatgagtgt 840 tatgctaaac tttgttagaa agtcaataaa atctggagaa actgttctgc aaaagctaaa 900 tatctgacat tcagtaacta cgtgtttaaa gtgaccaata tcccaggcac tttttgaggt 960 acttgagaaa tatctgtgac caaaaataaa accccttgcc cttttggcat atatcactcc 1020 tttgttttac tatattcata agctagacct ttccacctgc agataagtta aaaaaaaaga 1080 ttttaagtgg aaaattgaat aatttgaaat attattaatg caggagagga gtcactcaca 1140 atttttgtgg acaagcggaa gttgagcaaa cgagctgaag gaagtgattc caccaccaat 1200 agctcttcgg tcactctgga gacgctacat cagctagccg cttcttattt cattgacagg 1260 gacagcaccc ttcggagact tcaccacatt caaattgcat ccactgccat aaaggtaaga 1320 atgagtttac gctaaaatta tcaccttcca ttgtttgttt cctctatatc c 1371 <210> 8 <211> 7297 <212> DNA <213> Homo sapiens <400> 8 aaaatcattt ttaattgatg tgtattttat tgtaatttga agaattataa ttgtatacat 60 ttatgaggta acactggatg ttattatata tgtatataat gaagaatgag taattcaaac 120 taattaacat atctaccacc tcaaatactt atttttttat ggtgagaata tttgaaatat 180 attagaaata tattctgttg gcaattttga aacatacatt ttattaacaa gtcaacatgc 240 tatgctatag atctcaaaac ctatttttcc ggtctaactg aaactttgca acatttgatg 300 atcacatcct catacctccc cccaccctcc ttgtcccctc tattcaccaa tgtctgcttc 360 cattattttg gttgttttta atgctctatt ttgatcaaat aaatcttaag ggagcctaca 420 tttactaact cttcctaaat ctatttaccc tttcattgtg taatttgtgt tatttccaac 480 aacaacaaca aaagcaaaat attttgttga agccatcatt gtgttttctc ttgtctggaa 540 catgttttgt caccttcaca cagtactagg ataattcctt tgggaccaac tccattcagg 600 actgccagtg ctctcattat ttacaacggc aatgcaaata ggggattcag gcacaactaa 660 gagccaagaa taaagcagac ctagcagtaa agaatcacgg agcaagcata tttaactata 720 aatgaaaaaa attggacaga taaaactgga attaataatt aatccttcaa tgcaattcac 780 agacatttac ccataagaaa caacagcaaa caggaaacca tgacctcctc aaaaagacag 840 aacaaaaatt gagtgactga cccaaacaag atgctgattt gtgagctctc tgaccaagaa 900 ttcaaaacag cagttttcag gaaactcagt gatctctaag ataacacaga aaagcaattc 960 tgaaatttat tagagaaatt taacaaagat attaaaataa taaaaaatca aacagaaatc 1020 atggaataga gaaatacatt tcctgaactg aacaattcat tagaggtctc aacagtagaa 1080 tggaccaagc agagaaaaga atcagtgagc taaaagactg gctatttgaa aatacatagt 1140 cagggccagg aatggtggct cacgcctgta atcccagcac tttgggaggc cgaggtgggt 1200 ggatcacgag gtcaagagat cgagaccatc ctggccaaca tggtgaaacc ctgtctctac 1260 taaaaataca aaaattagct ggatgtggtg gcggatgtct gtagtcccag ctactcagga 1320 agctgaggca ggagaatcgc ttgaacctgg gaggtggagg tttcagtgag ccaagatctc 1380 accactgcac tccagcctgg gtgacagagt gagactccaa aaaaaaaatt aaaataataa 1440 taataataat aaattttaaa aaaagggaaa tacacagtca gagggaaaca aacaagcaaa 1500 caaatgaaaa acatgaaaag gaacaaagac cacctataag atacagaaaa ttacctcaaa 1560 agaccaaatt gaagaattat tggtattcaa aagtgagctg agcaagatca aggagtggaa 1620 attttagtca aataaataat gaaaaactgt gcaaagcttg agaaatattc aggtatagaa 1680 cgatctggga atactagtca gattcaatcc cgataagact acctccaagg catataataa 1740 ccaaactccc taagatcaat gaaaaagaga gaatcctaaa agcagcaaga gaaaagaagc 1800 aaaaaggatg agttcatgtc ctttacaggg acatgggtga agctggaaac catcattctc 1860 agctaactat cgtaagatca gaaaaccaaa cactgcatgt tctcaatcat atgtgggagt 1920 tgaacaatga gatcacacgg acacagggag aggaacatca cacatcaggg cctgtcaggg 1980 gttgggggct aggggagggt taacattagg agaaatacct aatgttggtg acgggttgat 2040 gggtgtagca aaccaccatg gcccgtgtat acctatgtaa caaaactgca cgttctgcac 2100 atgtaacgca gaacttaaag tataattttt tttaaaaaag aagcaaataa cataaaagac 2160 ataaaaggag cttcaatttg tctggcraca aacttctcaa tggcattttc aatgtgttca 2220 aagataaaaa aaattgcaac tcaaaaatat tgtattaggc aaaatcatcc ttaaaacatg 2280 aaggagagat aaactatttc ccaaataaac aaaaatggag agaatttacc accaccagac 2340 tcatcttaca agaaatgata aaggaagctc ttcagtctga aagtaaaaac atacaaatat 2400 gccaaaaaaa agttttcaag gcataaatcc cactggtaaa attaagtaca aggacaaact 2460 cagaatactc tgtcacttta attttggtgt gcaattctct tgtaacctca tatgaagccc 2520 aaaagtaaaa tctgtcaaaa acagtaatag ctatagcaac tttctaagag atagtataaa 2580 aatctgtaaa cagaggagtt cgagaccagc ctggccaaca tggtgaaacc ctgtctctac 2640 tacaaacaca aaaattagtc gggcatggtg gcagatgcct gtaatcccaa ctacttgggt 2700 ggctgaagca agagaatcgc ttgaacccgg gaggcagagg ttgcagtgag ctgagatcgc 2760 accactacac tccagcctag gcgacagagt gagactccat ctcaaacaaa caaacaacaa 2820 aaaaagtaaa ctggggcaac taaaagtaaa catgtgggtg agtggagtta aagtgtaaaa 2880 ttttttgtgt gctttttgtc tttgttgttt ctgttcttag tttgttatcc aaggtaagtt 2940 gtcttctctt tagcataact tactatatct ataagatgat ttttgtaagc ctcataactt 3000 gagataaatt catggaaaat gaaaagcaac aaattaaaac acactaccaa tgaaaatcac 3060 ttaatcacaa agaaagacag taagaagaga agaagagact aaaacgaacc agaaaacaag 3120 ccacaaaatg gcagtagtgt gcacttattt atcaataata acactgaatg taaatgatct 3180 cacttcccca attataacgt gtatagtggc tgaatgaata aagaagtaag acccaactat 3240 atgttgcctt caaaaaatcc acttaatgta gaaagataca catagactga gcgtgaaggg 3300 gtggaaaaag atactcgatg caactggaaa acaaaggagc aggagtagct atacctatat 3360 cagacaaaat agattaaaaa tctaagattt aaaaagacat aggaggtcaa tataaaatga 3420 taaaggggtc aatacagcaa gataatataa caattatcaa tagttttatg cccaacaaca 3480 gagtttccta taagtatata aagcacacat tagtagagct aaaaatatat ataagactat 3540 aataaaataa cagcagggga atttaacacc ctcgtatcag taatgaacat atcatccaga 3600 cagaaaatca agaaagaaag agcacagtta aactacgcac tagatctaat gggccctaga 3660 tgacattaac aaaacatttc acccaactgc tgcagaatat acattctttc cttcagtgca 3720 tggaacattc ttcagaatag gtcatatctt aagcaacaaa aaagtctgaa taaattaaaa 3780 aataaaaatc ttatcaagta acttttctga ccacaatgga ataaaaacca caaattgaaa 3840 acaagaggaa ccttggaaaa tacacaaaca catagaaata aaacatccta ctggacagct 3900 aatgagtcaa ttaaaaaaat aagaaggcaa ttaaaaaaaa caaatgaaaa caaaaataca 3960 acaaaccaaa acttgagata caataacatc tatatcaagc gggatgttta tagtaataaa 4020 tgcctaaatt aaaagagtat aaagacttca aataacctaa caatgaacct caacgaacga 4080 gaaaagcaag aataaaccaa accccaaatt aatagaagaa ataataaaaa tcacagcaga 4140 tatgaataaa gttgagacaa aaaaatacat aagatcaaca aaaggaaaag ctgcatgttt 4200 gaaaagatat taacaaaccc ttagccagat taagaataaa ggaagaagag gcaaataaat 4260 aaaataagaa atgaaaaagg gaaataaatg aaatttatac tagaaaaata cataagatca 4320 atgatagaaa aagttgggtt tttgaaaaga taatcaaaac tgacaaattc tttgtctaag 4380 aaaaaaaaga cctaattaaa taaaatcaga aatgaaaaag gagacataac aactgagaac 4440 ccagaagcac aaagaatcgt tagagactat tgtgaacaac tgcatgccaa caaattggaa 4500 aacttggaag aaatgaataa attcctggac acacacaact taccaagatt gaacaatgaa 4560 gaaataaaaa aaaaattaac aagccaaaaa tcaatatggc tatcaaagag ataattcaaa 4620 gtcttccatc aaaatgaagc tcaggatcat tggcttcact gctaactcta ccaaaattta 4680 aagaagaacc aatatcagtt ctacccaaat tctccaaaaa tttggaagga aggtaatact 4740 ccaaactcat tatatgaggt cagcattacc ctgatactaa aaccagacaa aaacatgaca 4800 agaaaccaat aagaacacta cagatcaata tcactgatga gcagagatgc aaagataatc 4860 aacaaaacac tagcaaacca aattcaacaa cacattaaca tgatcaagtg aaattcatcc 4920 tagggataca aagatggttc aacacatgca aatcaacaaa cgtgatgcat cacattagca 4980 gaatcaagaa aataaacata tcattatttc aatagatgcc aaaaaagcac ttgataaaat 5040 tgaacaacag ttcatgataa aaactctcat caaaatgggt atagagagaa tacacttcaa 5100 aattataaag gccatgtatg acaaacccac agttaacact gtgctgaatg agaaaaataa 5160 ttttttctta tgagaaaggc cttttcttta aagactggaa caagataaga atgcttactt 5220 tcaccacttt tattcaacat gacatggaaa gtcctctcca gaacaagtag ggaaaagaac 5280 taaataaaaa gcataaaaac tggaaagaag aagtcaaatt agcgttgttt gtagacaaca 5340 caatttcata cctagaaaaa acctcaataa aaacaatgtt aaaattgata aaaacattca 5400 gtaaagttgc gggatacaaa ataaactaca gaaatcaaca aataatctga aaaaacaaga 5460 aagcaacctc atttactatg gctacaactg tataaaatac ctcaaagcaa tcaaaccaaa 5520 taatggaaag atctatataa gaaaaactat gaaattctta tgcaaaaagt acaagaaaac 5580 acacaaataa tgtaaagata tttcatatgt atggattgga atatttaatg ttgttaaaat 5640 gacaatacta ctaaagcaat ttacggattc agcacaatcc ccatcaaaac agtggcattc 5700 ttcacagaaa tagaaaaaaa aaattataaa atatgtgcag gacatcaaaa gatacccaaa 5760 taactaaagt aatcatgagc aaaaaagaac aaagctagaa tcatcacacc acctgacttc 5820 aaatttacta caaagctatc acaatcaaaa cagcatagta ctgggataaa agcagacaca 5880 tagaccaatg gaatagaata gagaaccata tatatatcca cacatttaca gccaactcaa 5940 ctttgacaaa gactacacat acgttgggga aaagaaaatc ttttaaataa atattgctgg 6000 aaaaaatgga taattttatg cagaaaaaat ctagacccct atctctcacc atacacaaaa 6060 atcaaataaa aataaattat agacttaaat ctaaaactta aaaatataaa actaaaaacg 6120 aaattattta ggaaacacta caggacattg gtctgggcaa agattttttt gtttgtaaaa 6180 cctcaacatt acagacaact aaagcaaaaa atagacaaat ggaattatat caagctaaaa 6240 agcctctgta cagtaaacaa tcagcaaagt gaagagataa cccacagaat gggagaaaat 6300 atttacaaac cattcatctg tccagggatt aataaccaga atacataagg agctcaaaca 6360 actaaataac caaaacaaaa tactaaaaac caaaactaat aacccaatta aagactgggc 6420 agaatatctg aatacatatt tctcataaga agacataaag atggcaaaca gatatatgaa 6480 ataatgctca acatcactaa ttatcagaga aatgcaagtc aaaactacaa tttaaaatgg 6540 gttgtatcaa aagacaggca ataacaggtg ctggtgagga tgcagagaaa ggggaaccct 6600 tctacactgt tggtggaaat atagattagt agagccacta aggagaactc tatggagttt 6660 gctcaaacac ctaaagtaga agtaccatat tattaatctc actactgaat atatatacaa 6720 aataaaggaa atcagtatat tgaatatata gctgcactcc cttatttatt gcagcactat 6780 tcccaataac caaatacgga ttcaatttaa ctgcccatca gtggatgaat agattaagag 6840 aatgtgttat atatacacaa tggaatatta ttcagccata aaatagaatg aaatcttgtc 6900 atctgcaaca acatggatgg aacaagaggc ctttatatta agtgaaataa gtcaatcaca 6960 gaaagacaaa tattctaacc cacatgttcc cactcatatg tggaagctaa aaaaagtaga 7020 actcatgaag atagagagta gaacggtggt ttccagaggc caggaagggt agtgggggct 7080 gggagaaaat gcagggaaaa taaaagaata aaaatgtatt tattaagtgt gcttaaaaat 7140 cgcaaagata gtaaatttta tatgtatgtt ttaaccaagt aaaaataaaa caatcataac 7200 aaaactcaca aaacactata aaattaaaat ttagataact tcattgtaga aataagtgaa 7260 gtgaaaataa gcactaatga gaatcatgtt gaaaaag 7297 <210> 9 <211> 601 <212> DNA <213> Homo sapiens <400> 9 atatttccag tgggaccata cgtgtccact gtaatatgta ttttaaaatg ttcaactatt 60 ttacaatgtg agtgactctt gctgtgtact tcttctatat tcaatctgtg tgaggtctgt 120 aacccaagat ttagtctaga atttacactt cctcttttca agttctcaac taacatgaca 180 cagttctaaa atattaaaga gaatacagtt gccttgtatt tgttatttga agtcagttgg 240 aaattttttt ccggtcccta cactcagaaa cacttttagc tttctgtagg gtaaaagtgt 300 rtaggttttg gagttagaag ggcttgagtt caaatcctgt ctcagctatt tacaggttgg 360 accctaaaca ggttatttaa cccatctgag cagtgtcttt ctatgtaaaa tgagaataat 420 tgcaaagagt tattgtagac tatagatttt tttttaaaga acaggaacca atttctttaa 480 tttttaatac attcaccttt tttatatgtc ttgtgcctgg tacataaatg cttagcaaat 540 ttttttgaaa gaactgaatt gaattcttgt gaagatgaag taaaataatg tttttttttt 600 t 601 <210> 10 <211> 673 <212> DNA <213> Homo sapiens <400> 10 gtatctttta taacaatttt gttctctgga cagtttgaac tagtaagtac aagaataggg 60 aagtagacca gccttagaag aaattagggt tagtttagaa tttgtgaaaa accagtctat 120 attatatatt aactagttca ccatagagaa aaaacggatt gttatggtat acatttgaaa 180 ggaaattaaa atttcattta ygggttttaa gagtttggaa atatagagtg tatcaccttg 240 ctggcaggct aacaacacaa gggaaatttt ttcaaaggtg tatttcttta ttaagtggaa 300 gacaaccaaa taggccacga gcggtagctc atgcctgtaa tcccagcact ttgtgaggcc 360 aaggcgagtg gatcacttga ggccagaagt ttgagaccag cctcaccaac atggcgtaac 420 cccatctcta ctaaaaatac aaaaatcagc caggcatggt tgcgtgtgcc tgtaatccca 480 gctacctggg aggctgaggc acgaatctct tgaacttggg aggtggaggt tgcagtgagc 540 tgagatagcg ccacagcact ccagcctgtg tgacagagca agacctttac tattacaata 600 tgaatctgga ttaactagac tcaaactgag cagacactga ttaaaattag aatatttttc 660 agcaatccaa ata 673  

Claims (11)

삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 서열번호 6의 DNA 서열로 구성된 폴리뉴클레오티드에서, 501번째 염기(다형성 부위)가 G이고, 상기 501번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (f);A polynucleotide consisting of the DNA sequence of SEQ ID NO: 6, wherein the 501th base (polymorphic site) is G, and the polynucleotide (f) is composed of 10 or more consecutive DNA sequences comprising the 501th base; 서열번호 7의 DNA 서열로 구성된 폴리뉴클레오티드에서, 262번째 염기(다형성 부위)가 G이고, 상기 262번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (g); 및In a polynucleotide consisting of the DNA sequence of SEQ ID NO: 7, a polynucleotide (g) consisting of at least 10 contiguous DNA sequences comprising a 262 th base (polymorphic site) G and comprising the 262 th base; And 서열번호 8의 DNA 서열로 구성된 폴리뉴클레오티드에서, 2187번째 염기(다형성 부위)가 G이고, 상기 2187번째 염기를 포함하는 10개 이상의 연속 DNA 서열로 구성되는 폴리뉴클레오티드 (h)In the polynucleotide consisting of the DNA sequence of SEQ ID NO: 8, the polynucleotide consisting of 10 or more contiguous DNA sequences including the 2187th base (polymorphic site) G and the 2187th base (h) 로 이루어진 군으로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드를 포함하는, 장형 위암 진단용 키트.Enteric gastric cancer diagnostic kit comprising at least one polynucleotide selected from the group consisting of or complementary polynucleotides thereof. 장형 위암 진단에 필요한 정보를 제공하기 위하여, (i) 검체로부터 핵산 시료를 얻는 단계; 및 (ii) 상기 핵산 시료로부터, 서열번호 6 내지 8의 폴리뉴클레오티드로부터 하나 이상 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드의 다형성 부위의 염기 서열을 분석하는 단계 (단, 상기 다형성 부위는 서열번호 6의 DNA 서열의 경우 501번째 염기, 서열번호 7의 DNA 서열의 경우 262번째 염기, 서열번호 8의 DNA 서열의 경우 2187번째 염기를 각각 의미한다)를 포함하는, 검체 중의 단일염기다형을 검출하는 방법.In order to provide information necessary for diagnosing enteric gastric cancer, (i) obtaining a nucleic acid sample from a sample; And (ii) analyzing the nucleotide sequence of the polymorphic site of at least one polynucleotide selected from the polynucleotides of SEQ ID NOS: 6-8 or its complementary polynucleotides from the nucleic acid sample, provided that the polymorphic site is Means a 501st base for a DNA sequence, a 262th base for a DNA sequence of SEQ ID NO: 7, and a 2187th base for a DNA sequence of SEQ ID NO: 8, respectively). 제7항에 있어서, 상기 다형성 부위의 염기 서열을 분석하는 단계가 서열번호 6 내지 8의 폴리뉴클레오티드로 이루어진 군으로부터 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드 서열로서 다형성 부위를 포함하는 서열(단, 상기 다형성 부위는 서열번호 6의 DNA 서열의 경우 501번째 염기, 서열번호 7의 DNA 서열의 경우 262번째 염기, 서열번호 8의 DNA 서열의 경우 2187번째 염기를 각각 의미한다)을 주형으로 하는 프라이머 또는 프로브를 이용하여 수행되는 것을 특징으로 하는, 검체 중의 단일염기다형을 검출하는 방법.8. The method of claim 7, wherein analyzing the base sequence of the polymorphic site comprises a polynucleotide selected from the group consisting of polynucleotides of SEQ ID NOs: 6-8 or a complementary polynucleotide sequence thereof comprising the polymorphic site; A polymorphic site means a 501st base for the DNA sequence of SEQ ID NO: 6, a 262th base for the DNA sequence of SEQ ID NO: 7, and a 2187th base for the DNA sequence of SEQ ID NO: 8) respectively; A method for detecting a monobasic polymorph in a sample, characterized in that carried out using. 제7항에 있어서, 상기 다형성 부위의 염기 서열을 분석하는 단계가 폴리뉴클레오티드 (f) 내지 (h)로 이루어진 군으로부터 선택된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드가 고정된 마이크로어레이에 상기 핵산 시료를 혼성화시키는 단계 (단, 상기 폴리뉴클레오티드 (f) 내지 (h)는 제6항에서 정의한 바와 같다); 및 얻어진 혼성화 결과를 분석하는 단계를 포함하는 것을 특징으로 하는, 검체 중의 단일염기다형을 검출하는 방법.8. The method of claim 7, wherein analyzing the base sequence of the polymorphic site comprises hybridizing the nucleic acid sample to a polynucleotide selected from the group consisting of polynucleotides (f) to (h) or a microarray to which a complementary polynucleotide thereof is immobilized. A step wherein the polynucleotides (f) to (h) are as defined in claim 6; And analyzing the obtained hybridization result. 제9항에 있어서, 상기 마이크로어레이에 고정되는 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드의 DNA 서열의 길이가 각각 10 내지 100 뉴클레오티드인 것을 특징으로 하는, 검체 중의 단일염기다형을 검출하는 방법.10. The method of claim 9, wherein the length of the DNA sequence of the polynucleotide immobilized on the microarray or its complementary polynucleotide is 10 to 100 nucleotides each. 제7항에 있어서, 상기 다형성 부위의 염기 서열을 분석하는 단계가 서열번호 6 내지 8의 DNA 서열로 이루어진 군으로부터 선택된 DNA 서열의 다형성 부위(단, 상기 다형성 부위는 서열번호 6의 DNA 서열의 경우 501번째 염기, 서열번호 7의 DNA 서열의 경우 262번째 염기, 서열번호 8의 DNA 서열의 경우 2187번째 염기를 각각 의미한다)의 유전자형(genotype) 분석을 포함하는 것을 특징으로 하는, 검체 중의 단일염기다형을 검출하는 방법.The method according to claim 7, wherein the step of analyzing the nucleotide sequence of the polymorphic site is a polymorphic site of the DNA sequence selected from the group consisting of the DNA sequence of SEQ ID NO: 6 to 8, wherein the polymorphic site is the DNA sequence of SEQ ID NO: 6 Single base in the sample, characterized in that the genotype analysis of the 501st base, the 262th base for the DNA sequence of SEQ ID NO: 7, and the 2187th base for the DNA sequence of SEQ ID NO: 8, respectively) How to detect polymorphisms.
KR1020090006101A 2008-12-04 2009-01-23 Polynucleotides derived from chromosome 1 comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same KR101106014B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020080122469 2008-12-04
KR20080122469 2008-12-04

Publications (2)

Publication Number Publication Date
KR20100064276A KR20100064276A (en) 2010-06-14
KR101106014B1 true KR101106014B1 (en) 2012-01-17

Family

ID=42363969

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090006101A KR101106014B1 (en) 2008-12-04 2009-01-23 Polynucleotides derived from chromosome 1 comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same

Country Status (1)

Country Link
KR (1) KR101106014B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101309887B1 (en) * 2011-08-22 2013-09-17 가톨릭대학교 산학협력단 SNP for diagnosing susceptibility to gastric cancer and method for diagnosing susceptibility to gastric cancer using the LOX gene SNP
CN112301126B (en) * 2019-07-24 2023-10-27 中国医学科学院医药生物技术研究所 Application of ARHGAP9 gene in prognosis of retinoblastoma and drug resistance diagnosis

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003042409A2 (en) * 2001-11-16 2003-05-22 Universita' Degli Studi Di Urbino Germ line mutation in the promoter of e-caderine and diagnostic method for finding a greater susceptibility to gastric carcinoma

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003042409A2 (en) * 2001-11-16 2003-05-22 Universita' Degli Studi Di Urbino Germ line mutation in the promoter of e-caderine and diagnostic method for finding a greater susceptibility to gastric carcinoma

Also Published As

Publication number Publication date
KR20100064276A (en) 2010-06-14

Similar Documents

Publication Publication Date Title
KR101141543B1 (en) Polynucleotides derived from ALDH4A1, PINK1, DDOST, KIF17, LMX1A, SRGAP2, ASB3, PSME4, ANXA4, GMCL1, and MAP2 genes comprising single nucleotide polymorphisms, microarrays and diagnostic kits comprising the same, and analytic methods using the same
KR101206028B1 (en) Method for diagnosing a breast cancer using a breast cancer specific polymorphic sequence, polynucleotide specific to a breast cancer and microarray immobilized with the polynucleotide
KR101106014B1 (en) Polynucleotides derived from chromosome 1 comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same
WO2010091581A1 (en) Detection of ptp1b gene mutations and the uses thereof in diagnosing cancers
KR101023194B1 (en) Marker for diagnosing atopic dermatitis and use thereof
KR101138863B1 (en) A polynucleotide associated with a colon cancer comprising single nucleotide polymorphism, microarray and diagnostic kit comprising the same and method for diagnosing a colon cancer using the polynucleotide
KR101141546B1 (en) Polynucleotides derived from ANKRD15, HPD, PSMD9, WDR66, GPC6, PAX9, LRRC28, TNS4, AXL, and HNRPUL1 genes comprising single nucleotide polymorphisms, microarrays and diagnostic kits comprising the same, and analytic methods using the same
KR101114033B1 (en) Polynucleotides comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same
KR101167945B1 (en) Polynucleotides derived from ATG16L1 gene comprising single nucleotide polymorphisms, microarrays and diagnostic kits comprising the same, and analytic methods for autism spectrum disorders using the same
US20040067512A1 (en) Single nucleotide polymorphisms and mutations on Alpha-2-Macroglobulin
KR100909372B1 (en) Methods for diagnosing premature ovarian failure using polynucleotides comprising single nucleotide polymorphism
KR101100323B1 (en) Polynucleotides derived from PCMT1 gene comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and analytic methods using the same
US20030162202A1 (en) Single nucleotide polymorphisms and mutations on Alpha-2-Macroglobulin
KR101139360B1 (en) Polynucleotides derived from PRKCI, MAPK10, SPP1, IQGAP2, FGFR4, NOTCH4, HLA-DRA, HLA-DOA, THBS2, DFNA5, TBXAS1, TNKS, CDH17, UBR5, KIAA0196, and NSMCE2 genes comprising single nucleotide polymorphisms, microarrays and diagnostic kits comprising the same, and analytic methods using the same
KR100841556B1 (en) Polynucleotides comprising single nucleotide polymorphism and diagnostic kits comprising the same
KR100803258B1 (en) - Polynucleotides comprising single nucleotide polymorphism microarrays and diagnostic kits comprising the same and methods for diagnosing antibody-nonresponse to hepatitis B vaccine
KR101167942B1 (en) Polynucleotides derived from ALG12 gene comprising single nucleotide polymorphisms, microarrays and diagnostic kits comprising the same, and analytic methods for autism spectrum disorders using the same
KR100768685B1 (en) Polynucleotides comprising single nucleotide polymorphism microarrays and diagnostic kits comprising the same and methods for diagnosing premature ovarian failure using the same
KR101632666B1 (en) Method for diagnosing premature ovarian failure comprising genotype analysis or diplotype analysis of single nucleotide polymorphisms derived from IGF2R and ADAMTS19 genes
KR101071081B1 (en) Polynucleotides comprising single nucleotide polymorphism derived from DEFA4 gene, microarrays and diagnostic kits comprising the same, and detection methods using the same
KR100861493B1 (en) Polynucleotides comprising single nucleotide polymorphism, microarrays and diagnostic kits comprising the same, and methods for diagnosing premature ovarian failure using the same
KR101167934B1 (en) Polynucleotides derived from TICAM1 gene comprising single nucleotide polymorphisms, microarrays and diagnostic kits comprising the same, and analytic methods for autism spectrum disorder using the same
KR101075392B1 (en) Polynucleotides comprising single nucleotide polymorphism derived from FGA gene, microarrays and diagnostic kits comprising the same, and detection methods using the same
KR101167940B1 (en) Polynucleotides derived from FMN2 gene comprising single nucleotide polymorphisms, microarrays and diagnostic kits comprising the same, and analytic methods for autism spectrum disorders using the same
KR20120028953A (en) Snp for predicting sensitivity to an anti-cancer targeted agent

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150106

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160108

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161226

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171226

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190103

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20191219

Year of fee payment: 9