KR101012601B1 - 유방암 발병 위험성 검진용 조성물 - Google Patents

유방암 발병 위험성 검진용 조성물 Download PDF

Info

Publication number
KR101012601B1
KR101012601B1 KR1020080009144A KR20080009144A KR101012601B1 KR 101012601 B1 KR101012601 B1 KR 101012601B1 KR 1020080009144 A KR1020080009144 A KR 1020080009144A KR 20080009144 A KR20080009144 A KR 20080009144A KR 101012601 B1 KR101012601 B1 KR 101012601B1
Authority
KR
South Korea
Prior art keywords
breast cancer
snp
base
risk
snps
Prior art date
Application number
KR1020080009144A
Other languages
English (en)
Other versions
KR20090083152A (ko
Inventor
우정훈
양송주
양갑석
서정선
강종호
노동영
한원식
곽규범
Original Assignee
주식회사 마크로젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 마크로젠 filed Critical 주식회사 마크로젠
Priority to KR1020080009144A priority Critical patent/KR101012601B1/ko
Publication of KR20090083152A publication Critical patent/KR20090083152A/ko
Application granted granted Critical
Publication of KR101012601B1 publication Critical patent/KR101012601B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)

Abstract

본 발명은 유방암 발병과 유의적 상관관계를 갖는 특정 단일염기다형성(SNP)를 선별하고, 이를 마커로 이용하여 유방암 발병 위험성을 예측하는 기술과 관련된 것으로, 보다 구체적으로, 유방암 발병과 유의적 상관관계를 갖는 특정 단일염기다형성(SNP)의 염기를 확인하여 유방암 발병 위험성을 예측하는 방법; 상기 SNP를 검출하기 위한 프로브 및/또는 상기 염색체 부위를 증폭하기 위한 프라이머를 포함하는 유방암 발병 위험성 검진용 조성물, 및 상기 프로브를 표면에 고정시킨 유방암 발병 위험성 검진용 키트에 관한 것이다. 본 발명에 따른 예측 방법, 검진용 조성물 및 키트는 간편하면서도 고감도로 유방암 발병 위험군을 분류할 수 있도록 하여, 이들 위험군을 별도 관리함으로써 유방암 발병을 미연에 예방하거나 조기 발견할 수 있도록 하는 매우 유용한 기술이다.

Description

유방암 발병 위험성 검진용 조성물{Composition for Predicting the Risk of Developing Breast Cancer}
본 발명은 유방암 발병과 유의적 상관관계를 갖는 특정 단일염기다형성(SNP)를 선별하고, 이를 마커로 이용하여 유방암 발병 위험성을 예측하는 기술과 관련된 것으로, 보다 구체적으로, 유방암 발병과 유의적 상관관계를 갖는 특정 단일염기다형성(SNP)의 염기를 확인하여 유방암 발병 위험성을 예측하는 방법; 상기 SNP를 검출하기 위한 프로브 및/또는 상기 염색체 부위를 증폭하기 위한 프라이머를 포함하는 유방암 발병 위험성 검진용 조성물, 및 상기 프로브를 표면에 고정시킨 유방암 발병 위험성 검진용 키트에 관한 것이다. 본 발명에 따른 예측 방법, 검진용 조성물 및 키트는 간편하면서도 고감도로 유방암 발병 위험군을 분류할 수 있도록 하여, 이들 위험군을 별도 관리함으로써 유방암 발병을 미연에 예방하거나 조기 발견할 수 있도록 하는 매우 유용한 기술이다.
유방암은 경제발전과 생활수준의 변화로 해마다 증가추세에 있으며, 점차 20 내지 30대의 여성에게도 유병률이 높아지고 있는 추세이다. 2002년 보건복지부 암 등록사업 조사결과 여성의 암 발생률 중 유방암이 16.8%로 1위를 차지하고 있고, 30대 미만의 여성의 암 발생률은 선진국 대비 3배나 되는 것으로 나타났다. 유방암의 발병은 유전적 요인 및 환경적 요인과 깊은 상관관계가 있는 것으로 보고되고 있다. 아직까지는 자가검사나 X-ray로 하는 주기적인 검사에 의해서만 암의 조기진단이 가능한 실정이며, 사실 암이 이미 어느 정도 발생하여 커져야 진단이 이루어지는 후향적 방법이 주류를 이루고 있다. 
현재, 유방암을 극복하기 위한 방법으로는 정기적 검진에 의한 조기진단 및 조기치료가 가장 바람직한 것으로 받아들여지고 있다. 그러나, 조기진단도 이미 암이 발생한 이후에 이루어지는 것이므로, 암 치료를 위한 환자의 육체적 정신적 고통을 수반하게 된다. 따라서, 정기적 검진에 의한 조기검진 및 치료도 중요하지만, 유방암 발병 위험성을 미리 예측할 수 있다면, 별도의 관리를 통하여 유방암 발병을 미연에 예방하거나 조기 진단하는데 유리할 것이다. 그러나, 아직까지 개인별 감수성을 미리 판단하여 유방암의 발병 위험성을 미리 예측할 수 있는 분자진단적인 방법이 상용화 되지 못하고 있어서, 이에 대한 연구 및 기술 개발이 요구된다.
이에, 본 발명자들은 유방암 환자의 개인별 염기서열을 검사하여 유방암 환자에서 많이 나타나는 단일염기다형성(SNP)을 선별하여 유방암 발병 위험성 예측에 사용함으로써, 유방암의 전향적인 예방을 가능하게 하는 검진 기술을 개발하여 본 발명을 완성하였다.
따라서, 본 발명은 인간 피험자로부터 채취한 유전자 시료에 대하여 유방암 발병과 유의적 상관관계를 갖는 소정의 SNP의 염기를 확인하여 유방암 발병 위험성을 예측하는 방법을 제공하는 것을 목적으로 한다.
본 발명의 또 다른 목적은 유방암 발병과 유의적 상관관계를 갖는 소정의 SNP를 포함하는 염색체 부위와 상보적 서열을 갖는 프로브, 및/또는 상기 염색체 부위의 증폭을 위한 프라이머를 포함하는 유방암 발병 위험성 검진용 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 기판 표면에 유방암 발병과 유의적 상관관계를 갖는 소정의 SNP를 포함하는 염색체 부위와 상보적 서열을 갖는 프로브가 고정된 유방암 발병 위험성 검진용 키트을 제공하는 것이다.
본 발명자들은 유방암 환자군과 정상인 군의 전체 게놈 DNA를 분석하여 유방암 발병과 관련이 있을 것으로 예상되는 DNA repair 유전자에 위치하는 SNP의 염기 를 확인함으로써, 유방암 환자군에 특이적으로 나타나는 SNP 및 그 양상을 조사하여 이를 유방암과 유의적 상관관계를 갖는 SNP로서 선별하였으며, 개체의 유전자 중의 상기 선별된 SNP의 양상에 대한 정보를 기반으로 그 개체의 유방암 발병 위험성을 측정하는 기술을 완성하였다.
본 발명에서는 유방암 환자군에 특이적이고 유의성 상관관계를 갖는 SNP로서 5개의 SNP를 선별하였으며 (도 1 참조), 상기 유방암과 유의적 상관관계를 갖는 SNP를 하기의 표 1에 나타내었다.
[표 1]
마커 SNP 유전자 Wild
homo
Hetero Mutant
homo
Significant genetic
Model
염색체 번호 염색체상 위치(ref)
rs4703564 XRCC4 TT TC CC recessive 5 82549499
rs751402 ERCC5 CC CT TT co.dominant 13 102296199
rs5762766 CHEK2 CC CT TT dominant 22 27465889
rs9909163 RPA1 TT TC CC dominant 17 1735396
rs238415 ERCC2 GG GC CC recessive 19 50549075
상기 표 중에서 굵은체로 표시된 것은 유방암 발병 위험성이 높은 인자이고, 이탤릭체로 표시된 것은 야생형과 변이형의 중간 정도의 위험성을 갖는 인자를 나타낸 것이다. 또한, 상기 표 중의 SNP rs9909163에 해당하는 염기는 이중 가닥 중 역방향 가닥 (reverse strand)의 두 대립 유전자 염기를 나타낸 것이고, 나머지는 정방향 가닥의 (forward strand)의 두 대립 유전자 염기를 나타낸 것이며, 이러한 표시는 본 명세서 전체에 걸쳐서 동일하다.
상기 표 1에 나타낸 바와 같이, SNP rs4703564는 5번 염색체의 82549499번째 염기 위치에 존재하는 SNP로서, 야생형의 경우 상기 위치에 염기 T를 갖지만, 변이가 일어나 C로 바뀌면 변이가 된 C는 유방암 발병에 있어서 열성으로 작용하여 두 대립유전자가 모두 C로 변이된 CC의 경우 유방암 발병의 위험성이 유의적으로 높아진다(굵은체로 표시).
SNP rs751402는 13번 염색체의 102296199번째 염기 위치에 존재하는 SNP로서, 야생형의 경우 상기 위치에 염기 C를 갖지만, 변이가 일어나 T로 바뀌면 변이된 T는 유방암 발병에 있어서 공우성(co-dominant)으로 작용하여, 두 대립 유전자가 모두 T로 변이된 TT의 경우 유방암 발병 위험이 높아지며 (굵은체로 표시), 하나의 대립 유전자가 T로 변이된 CT의 경우에도 TT의 경우보다는 약간 낮지만 야생형의 경우보다는 높은 유방암 발병 위험을 나타낸다 (이탤릭체로 표시).
SNP rs5762766는 22번 염색체의 27465889 위치에 존재하는 SNP로서, 야생형의 경우 상기 위치에 염기 C를 갖지만, 변이가 일어나 T로 바뀌면 변이된 T는 유방암 발병에 있어서 우성으로 작용하여, 두 대립 유전자가 모두 T로 변이된 TT의 경우뿐 아니라, 한 대립 유전자만 T로 변이된 CT의 경우에도 유방암 발명의 위험성이 높아진다 (굵은체로 표시).
SNP rs9909163는 17번 염색체의 1735396번째 염기 위치에 존재하는 SNP로서, 야생형의 경우 상기 위치에 염기 T를 갖지만, 변이가 일어나 C로 바뀌면 변이된 C는 유방암 발병에 있어서 우성으로 작용하여, 두 대립 유전자가 모두 C로 변이된 CC의 경우뿐 아니라, 한 대립 유전자만 C로 변이된TC의 경우에도 유방암 발명의 위험성이 높아진다 (굵은체로 표시).
SNP rs238415는 19번 염색체의 50549075번째 염기 위치에 존재하는 SNP로서, 야생형의 경우 상기 위치에 염기 G를 갖지만, 변이가 일어나 C로 바뀌면 변이가 된 C는 유방암 발병에 있어서 열성으로 작용하여 두 대립유전자가 모두 C로 변이된 CC의 경우 유방암 발병의 위험성이 유의적으로 높아진다(굵은체로 표시).
상기의 5개 SNP의 유방암과의 관련성은 본 발명에서 최초로 밝혀진 것이다. 그 이유는 유방암과 유전형질의 관련성에 대한 연구가 대부분 서구 선진국을 중심으로 진행되어 왔고, 인종들 간 특정 SNP의 유전형질의 분포가 매우 상이하기 때문에, 서구 선진국의 백인종에서 얻어진 SNP 연구 결과가 황인종에게 동일하게 적용되지 않기 때문이다. 특히, 상기 5개의 SNP들은 백인종과 황인종에서의 유전형질 분포가 매우 상이하여, 기존의 서구 선진국에서 진행되었던 연구에서는 이들 SNP와 유방암 발병과의 어떠한 관계도 밝히지 못했던 것으로 생각된다.
상기와 같은 5개의 SNP에 대한 정보를 기반으로, 유방암이 발병하지 않은 개체의 전체 유전자 중 상기 5개 SNP의 염기를 확인하고, 유방암 발병 위험이 높은 경우에 해당하는지 여부를 결정하여, 상기 개체의 유방암 발병 위험을 예측할 수 있다. 또한, 본 발명의 기술적 특징은 유방암 발병 위험이 있는 SNP를 선별한 것에 더하여, 각 SNP의 변이형이 우성, 열성, 공우성 중 어떠한 양상으로 작용하는지를 밝혀서 각 SNP에서의 유방암 발병 위험성이 높은 양상을 세분하여 정량화할 수 있다는 점에 있다. 따라서, 본 발명에 따른 SNP와 그의 유방암 발병 위험성 관련 염기형에 대한 정보를 이용하면 보다 고감도로 유방암 발병 위험군을 선별해낼 수 있다. 실제로, 본 발명에서 선별된 SNP를 그 선별에 사용된 유전자 시료의 소스가 된 유방암 환자군에 다시 시험한 경우뿐 아니라, 전혀 다른 유방암 환자군에 사용한 경우에도 60%가 넘는 감도를 나타내었다.
한편, 연관불균형 (Linkage Disequilibrium, LD) 부위는 특정 게놈 상의 구간이 세대를 거치며 cross-over가 거의 일어나지 않을 정도로 짧거나 유전자가 밀집되어 있어서 생기는 부분이다. 따라서 이 구간에 존재하는 유전적 정보(genomic information)는 거의 동일하고 세대를 거쳐도 거의 보존된다. 본 발명에서 발견한 유방암 발병 위험성과 유의적 상관관계를 갖는 5개의 SNP는 게놈 상에 특정 위치에 존재하는 변이이다. 따라서 상기 5개의 SNP 주변에 LD 구간이 형성되어 있는 경우, 그 LD 구간에 위치하는 유전자들도 상기 SNP와 동일한 유전적 정보를 갖게 되므로, 상기 5개의 SNP 이외에도 그 각각의 LD 구간 내에 존재하는 다른 SNP를 사용하는 경우에도 유방암 발병 위험성을 예측 가능하다.
상기 5 개의 SNP와 R 스퀘어 값(R square value)이 1인 연관불균형 부위 (LD region)에 존재하는 SNP 또한 유방암 발병 위험성 예측에 유용하게 사용될 수 있다. 특정SNP 쌍의R 스퀘어 값이 1이라는 것은 두 SNP의 정보가 동일하다는 것을 의미하기 때문이다. International Hapmap project (http://www.hapmap.org/downloads/index.html.en)의 데이터에 의거하여 각 SNP이 위치한 5개 염색체의, 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교하여 그 결과를 도 2 내지 도 6에 나타내었다. 도 2 내지 도 6에서 확인할 수 있는 바와 같이, 각 염색체에서 특정 SNP 쌍의 R 스퀘어 값이 1이 나올 수 있는 거리(distance)는 1bp에서 시작하여250Mbp 이상까지도 분포하는 것으로 나타났다. 그러나 이상 값의 존재를 고려하여, 본 발명에서는 위 분포의90 퍼센타일의 값을 연관 불균형 길이의 한계로 잡기로 한다. 도2 내지 6의 파란색 수직선이 상기 거리의 한계를 의미한다. 또한 도 2 내지 6의 X축은 본 발명에서 동정된 5 개의 SNP이 위치한 각 5개의chromosome 상의 모든 SNP 쌍의 거리를, base pair(bp) 단위로 나타낸 것이다. , 파란색 수직선으로 나타낸 거리의 한계, 즉 R스퀘어 값이 1이 나올 수 있는 SNP 쌍의 거리의 분포에서 90 퍼센타일의 bp 길이를 가능한 연관불균형 블록(LD 블록) 길이로 하여 아래의 표 2에 나타내었다. 또한, 이러한 연관불균형 블록은 상기 5 개의 SNP의 상류 및 하류 양쪽에 모두 존재하므로, 연관불균형 부위는 각각의 SNP를 기준으로 상류 및 하류로 각각 연관불균형 블록 길이만큼에 걸쳐서 존재하는 것으로 나타낼 수 있으며, 이 또한 아래의 표 2에 염색체 내에서의 염기 위치로서 나타내었다.
[표 2]
염색체 가능 LD 블록 길이 (bp) 마커 SNP 중심의 가능 LD 부위
5 86532 82462967~82636031
13 82904 102213295~102379103
17 81913 27383976~27547802
19 75457 1659939~1810853
22 79999 50469076~50629074
각 염색체마다 세대를 따라 상동 염색체들간의cross-over 경향이 조금씩 다르기 때문에, 연관 불균형 지역의 길이가 다를 수 있음을 상기 표 2를 통해 확인할 수 있다. 상기 R 스퀘어 값(R square value)이 1인 연관불균형 부위(LD 부위)는 각각의 SNP를 기준으로 상류 및 하류에 각각 약 70 내지 90Kbp에 걸친 부위로서 이 부위에 존재하는 모든 SNP로 이루어진 군에서 선택된 1종 이상의 SNP가 유방암 발병 위험성 예측에 사용할 수 있다. 상기와 같이 정해진 부위에 존재하는 SNP의 수와 종류는 이미 이 발명이 속하는 기술 분야에 공지된 내용이므로, 본 발명이 속하 는 기술분야의 통상의 지식을 가진 자라면 상기와 같이 시작 위치와 종결 위치가 특정된 연관불균형 부위에 존재하는 SNP를 용이하게 선택하여 사용할 수 있다. 예컨대, 상기 SNP는 National Center for Biotechnology Information에서 제공하는 사이트인 http://www.ncbi.nlm.nih.gov/sites/entrez?db=snp(entrezSNP)에서 용이하게 선택할 수 있으며, 상기 연관불균형 부위에 존재하는 SNP대표적인 예를 아래의 표 3에 예시하였다:
[표 3]
Marker SNP Neibor SNP (upstream) Neibor SNP (down stream)
rs4703564 rs6884636, rs6884807, rs34143450, rs16900237, rs12523148 rs34136194, rs33939031, rs5869169, rs2731858, rs16900239
rs751402 rs4150246, rs4150247, rs17840979, rs16960619, rs4150248 rs2296147, rs4150249, rs4150250, rs3218736, rs2296148
rs5762766 rs9608698, rs9625548, rs5997389, rs9613668, rs5997390 rs28880047, rs17884135, rs17885250, rs17882761, rs17881056
rs9909163 rs17292259, rs17339011, rs17339018, rs17339025, rs9916034 rs17339032, rs17292266, rs17292273, rs11869860, rs17292280
rs238415 rs34538024, rs3916874, rs238416, rs3932979, rs3916873 rs3916872, rs3916871, rs3916870, rs238414, rs238413
즉, 인간의 5번 염색체의 82549499번째 염기에 위치하는 SNP, 인간의 13번 염색체의 102296199번째 염기에 위치하는 SNP, 인간의 17번 염색체의 1735396번째 염기에 위치하는 SNP, 인간의 19번 염색체의 50549075번째 염기에 위치하는 SNP, 인간의 22번 염색체의 27465889번째 염기에 위치하는 SNP, 및 상기 각각의 SNP의 상류 및 하류에 각각 약 70Kbp 내지 90Kbp(표 2 참조)에 걸친 연관불균형 지역에 존재하는 SNP들은 유방암 발병 위험성에 대한 마커로서 매우 유용한 것이다. 따라서, 본 발명은 기본적으로 인간의 5번 염색체의 82549499번째 염기에 위치하는 SNP, 인간의 13번 염색체의 102296199번째 염기에 위치하는 SNP, 인간의 17번 염색 체의 1735396번째 염기에 위치하는 SNP, 인간의 19번 염색체의 50549075번째 염기에 위치하는 SNP, 인간의 22번 염색체의 27465889번째 염기에 위치하는 SNP, 및 상기 각각의 SNP의 상류 및 하류에 각각 약 70Kbp 내지 90Kbp(표 2 참조)에 걸친 연관불균형 지역에 존재하는 SNP들로 이루어진 군에서 선택된 1종 이상의 유방암 발병 위험성 예측용 마커로서의 용도에 관한 것이다.
이에, 본 발명은 본 발명은 인간의 5번 염색체의 82549499번째 염기에 위치하는 SNP, 인간의 13번 염색체의 102296199번째 염기에 위치하는 SNP, 인간의 17번 염색체의 1735396번째 염기에 위치하는 SNP, 인간의 19번 염색체의 50549075번째 염기에 위치하는 SNP, 인간의 22번 염색체의 27465889번째 염기에 위치하는 SNP, 및 상기 각각의 SNP의 상류 및 하류에 각각 약 70Kbp 내지 90Kbp(표 2 참조)에 걸친 연관불균형 지역에 존재하는 SNP들로 이루어진 군에서 선택된 1종 이상을 포함하는 유방암 발병 위험성 예측용 마커 조성물을 제공한다.
이러한 내용을 근거로, 본 발명은 각 개체의 유전자를 분석하여 상기 개체가 유방암 발병 위험군인지 여부를 결정하는 유방암 발병 위험성 예측 방법을 제공한다. 상기 유전자 분석은 인간 피험자로부터 얻은 유전자 시료에 대하여 인간의 5번 염색체의 82549499번째 염기에 위치하는 SNP, 인간의 13번 염색체의 102296199번째 염기에 위치하는 SNP, 인간의 17번 염색체의 1735396번째 염기에 위치하는 SNP, 인간의 19번 염색체의 50549075번째 염기에 위치하는 SNP, 인간의 22번 염색체의 27465889번째 염기에 위치하는 SNP, 및 상기 각각의 SNP의 상류 및 하류에 각각 약 70Kbp 내지 90Kbp에 걸친 연관불균형 지역에 존재하는 SNP들로 이루어진 군 에서 선택된 1종 이상의 SNP의 염기를 확인하는 것을 포함하며, 필요에 따라서 적절한 프로브 및/또는 프라이머를 사용할 수 있다. 이와 같은 유전자 분석의 구체적 방법은 특별한 제한이 없으며, 이 발명이 속하는 기술분야에 알려진 모든 유전자 검출 방법에 의하는 것일 수 있다. 상기 유전자 시료는 피험자로부터 분리한 모든 생체 시료를 포함하며, 예컨대, 머리카락, 혈액, 각종 체액, 분리된 조직 및 세포 등일 수 있으나, 이에 한정되지 않는다.
보다 구체적으로, 상기 예측 방법은 인간 피험자로부터 얻은 유전자 시료에 대하여,
인간의 5번 염색체의 82462967번째 염기부터 82636031번째 염기까지에 위치하는 SNP;
인간의 13번 염색체의 102213295번째 염기부터 102379103번째 염기까지에 위치하는 SNP;
인간의 17번 염색체의 27383976번째 염기부터 27547802번째 염기까지에 위치하는 SNP;
인간의 19번 염색체의 1659939번째 염기부터 1810853번째 염기까지에 위치하는 SNP; 및
인간의 22번 염색체의 50469076번째 염기부터 50629074번째 염기까지에 위치하는 SNP
로 이루어진 군에서 선택된 1종 이상의 SNP의 염기를 확인하는 단계를 포함하는, 유방암 발병 위험성 예측 방법을 제공한다.
보다 구체적으로,
상기 인간 5번 염색체의 82462967번째 염기부터 82636031번째 염기까지에 위치하는 SNP는 인간의 5번 염색체의 82549499번째 염기에 위치하는 SNP를 포함하는 1종 이상의 SNP일 수 있고,
상기 인간의 13번 염색체의 102213295번째 염기부터 102379103번째 염기까지에 위치하는 SNP는 인간의 13번 염색체의 102296199번째 염기에 위치하는 SNP를 포함하는 1종 이상의 SNP일 수 있으며,
상기 인간의 17번 염색체의 27383976번째 염기부터 27547802번째 염기까지에 위치하는 SNP는 인간의 17번 염색체의 1735396번째 염기에 위치하는 SNP를 포함하는 1종 이상의 SNP일 수 있고,
상기 인간의 19번 염색체의 1659939번째 염기부터 1810853번째 염기까지에 위치하는 SNP는 인간의 19번 염색체의 50549075번째 염기에 위치하는 SNP를 포함하는 1종 이상의 SNP일 수 있으며,
상기 인간의 22번 염색체의 50469076번째 염기부터 50629074번째 염기까지에 위치하는 SNP는 인간의 22번 염색체의 27465889번째 염기에 위치하는 SNP를 포함하는 1종 이상의 SNP일 수 있다.
상기한 바와 같이, 상기 SNP의 염기를 확인하는 단계는, 인간 피험자로부터 얻은 유전자 시료를 직접적 서열분석 하거나, 상기 SNP를 포함하는 소정의 부위와 혼성화 가능한 프로브와 접촉시켜 시료와 프로브와의 반응 여부를 조사하는 등 이 발명이 속하는 기술분야에 알려진 모든 통상의 방법에 의한 것일 수 있다. 또한, 상기 SNP의 염기 확인은 상기 SNP를 포함하는 소정의 부위를 증폭 가능한 적절한 프라이머를 사용하여 수행되는 것일 수 있다. 이 때, 사용 가능한 프로브와 프라이머는 하기하는 바와 같다.
본 발명의 한 구체예에 있어서, 상기 유방암 발병 위험성 예측 방법은 인간 피험자로부터 얻은 유전자 시료의 염기서열을 분석하여, 아래의 5 가지 경우 중 한 가지 이상에 해당하면 유방암 발병 위험성이 높은 위험군으로 분류하는 것을 특징으로 하는 것일 수 있다:
5번 염색체의 82549499번째 염기가 CC인 경우;
13번 염색체의 102296199번째 염기가 CT또는 TT인 경우;
17번 염색체의 1735396번째 염기가 TC 또는 CC인 경우;
19번 염색체의 50549075번째 염기가 CC인 경우; 및
22번 염색체의 27465889번째 염기가 CT 또는 TT인 경우.
또한, 본 발명의 한 구체 예에서, 유방암 발병 예측 감도를 보다 높이기 위하여, 유전적 정보 이외에 기존에 유방암 발병과 관련 있는 것으로 알려진 몇 가지 임상적 인자를 추가로 사용할 수 있다. 기존에 유방암 발병과 관련된 것으로 알려진 임상적 인자 중, 가장 관련성이 높게 나타난 4개의 인자, 즉, 학력 (고학력일수록 발병 위험성 증가), 가족력 (가족력 있는 경우 발병 위험성 증가), 모유수유여부 (모유 수유시 발병 위험성 감소), 및 흡연 여부 (흡연시 발병 위험성 증가)를 선별하고, 이들 인자간 관련성을 조사하여 상호 독립적 인자로서 2 개의 인자, 즉, 가족력과 모유수유여부를 선별하여, 이를 상기 마커로서의 SNP 정보에 추가하여 사 용할 수 있다.
따라서, 본 발명에 따른 유방암 발병 위험성 예측 방법은 상기와 같은 유전 정보 (SNP) 분석 이외에, 학력, 모유수유여부, 흡연, 유방암 가족력 등과 같은 임상적 변수, 바람직하게는 상호 독립적 변수인 모유수유 여부 및/또는 가족력에 대한 조사를 병행 실시하여 정확성을 보다 증진시킨 것일 수 있다.
또 다른 측면에서, 본 발명은 인간의 5번 염색체의 82549499번째 염기에 위치하는 SNP, 인간의 13번 염색체의 102296199번째 염기에 위치하는 SNP, 인간의 17번 염색체의 1735396번째 염기에 위치하는 SNP, 인간의 19번 염색체의 50549075번째 염기에 위치하는 SNP, 인간의 22번 염색체의 27465889번째 염기에 위치하는 SNP, 및 상기 각각의 SNP의 상류 및 하류에 각각 약 70Kbp 내지 90Kbp에 걸친 연관불균형 지역에 존재하는 SNP들로 이루어진 군에서 선택된 1종 이상의 SNP의 검출 가능한 1종 이상의 프로브 및/또는 상기 1종 이상의 SNP의 증폭 가능한 프라이머쌍을 포함하는 유방암 발병 위험성 검진용 조성물을 제공한다. 상기한 바와 같이, 상기 상류 및 하류 각각에 약 70 내지 90Kbp에 걸친 부위는 각 SNP이 위치한 chromosome R 스퀘어 값(R square value)이 1이 나오는 현재까지 알려진 모든SNP 쌍의 distance 의 90 퍼센타일을 의미하는 것으로, 즉, 가능한 연관불균형 부위에 해당하는 부위이다. 상기 R 스퀘어 값이 보여주듯이, 이들 연관불균형 부위의 유전적 정보는 완전히 동일하기 때문에, 표 1의 5개의 SNP가 아니더라도, 그 부위에 존재하는 SNP의 염기를 확인함으로써 유방암 발병 가능성을 예측할 수 있음은 상기한 바와 같다.
보다 구체적으로, 본 발명에 따른 유방암 발병 위험성 검진용 조성물은,
인간의 5번 염색체의 82462967번째 염기부터 82636031번째 염기까지에 위치하는 SNP;
인간의 13번 염색체의 102213295번째 염기부터 102379103번째 염기까지에 위치하는 SNP;
인간의 17번 염색체의 27383976번째 염기부터 27547802번째 염기까지에 위치하는 SNP;
인간의 19번 염색체의 1659939번째 염기부터 1810853번째 염기까지에 위치하는 SNP; 및
인간의 22번 염색체의 50469076번째 염기부터 50629074번째 염기까지에 위치하는 SNP
로 이루어진 군에서 선택된 1종 이상의 SNP를 검출 가능한 프로브, 또는 상기 1종 이상의 SNP를 증폭 가능한 프라이머 쌍, 또는 이들 모두를 포함하는 것일 수 있다.
더욱 보다 구체적으로,
상기 인간 5번 염색체의 82462967번째 염기부터 82636031번째 염기까지에 위치하는 SNP는 인간의 5번 염색체의 82549499번째 염기에 위치하는 SNP를 포함하는 1종 이상의 SNP일 수 있고,
상기 인간의 13번 염색체의 102213295번째 염기부터 102379103번째 염기까지에 위치하는 SNP는 인간의 13번 염색체의 102296199번째 염기에 위치하는 SNP를 포 함하는 1종 이상의 SNP일 수 있으며,
상기 인간의 17번 염색체의 27383976번째 염기부터 27547802번째 염기까지에 위치하는 SNP는 인간의 17번 염색체의 1735396번째 염기에 위치하는 SNP를 포함하는 1종 이상의 SNP일 수 있고,
상기 인간의 19번 염색체의 1659939번째 염기부터 1810853번째 염기까지에 위치하는 SNP는 인간의 19번 염색체의 50549075번째 염기에 위치하는 SNP를 포함하는 1종 이상의 SNP일 수 있으며,
상기 인간의 22번 염색체의 50469076번째 염기부터 50629074번째 염기까지에 위치하는 SNP는 인간의 22번 염색체의 27465889번째 염기에 위치하는 SNP를 포함하는 1종 이상의 SNP일 수 있다.
본 발명의 한 구체 예에 있어서, 상기 유방암 발병 위험성 검진용 조성물은 유방암 발병과 유의적 상관관계를 갖는 SNP를 검출하기 위한 프로브를 포함하는 것일 수 있으며, 상기 프로브는 본 발명에서 밝힌 5개의 SNP를 포함하여 이와 유전적 정보가 거의 동일한 연관불균형 부위 내의 SNP를 검출 가능한 것으로,
인간의 5번 염색체의 82462967번째 염기부터 82636031번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드;
인간의 13번 염색체의 102213295번째 염기부터 102379103번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드;
인간의 17번 염색체의 27383976번째 염기부터 27547802번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴크레오타이드;
인간의 19번 염색체의 1659939번째 염기부터 1810853번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드; 및
인간의 22번 염색체의 50469076번째 염기부터 50629074번째 염기까지의 부위 중의 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드
로 이루어진 군에서 선택된 1종 이상의 올리고뉴클레오타이드일 수 있다.
본 발명의 구체예에서, 상기 프로브는 상기한 본 발명의 5개의 SNP 검출이 가능한 것으로,
인간의 5번 염색체의 82549499번째 염기는 CC이고, 상기 82549499번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드;
인간의 13번 염색체의 102296199번째 염기는 CT 또는 TT이고, 상기 102296199번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드;
인간의 17번 염색체의 1735396번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 가지며, 상기 1735396번째 염기는 CC 또는 TC인, 올리 고뉴크레오타이드;
인간의 19번 염색체의 50549075번째 염기는 CC이고, 상기 50549075번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드; 및
인간의 22번 염색체의 27465889번째 염기는 CT 또는 TT이고, 상기 27465889번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드
로 이루어진 군에서 선택된 1종 이상의 올리고뉴클레오타이드일 수 있으나, 상기한 바와 같이 이에 한정되는 것은 아니다.
본 발명의 또 다른 구체예에서, 상기 유방암 발병 위험성 진단용 조성물은 유전자 서열 분석을 통한 유방암 발병과 유의적인 SNP의 염기 확인을 위하여, 상기 SNP를 포함하는 유전자 단편을 증폭할 수 있는 특정 프라이머 쌍을 포함하는 것일 수 있다. 본 명세서에 있어서, "프라이머 쌍"은 정방향 프라이머 및 역방향 프라이머를 포함하는 개념으로 사용된다. 본 발명에서 사용 가능한 프라이머 쌍은,
인간의 5번 염색체의 82462967번째 염기부터 82636031번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍;
인간의 13번 염색체의 102213295번째 염기부터 102379103번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍;
인간의 17번 염색체의 27383976번째 염기부터 27547802번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴크레오타이드로 이루어진 프라이머 쌍;
인간의 19번 염색체의 1659939번째 염기부터 1810853번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍; 및
인간의 22번 염색체의 50469076번째 염기부터 50629074번째 염기까지의 부위 중의 상호 중복되지 않는 두 개의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 두 개의 올리고뉴클레오타이드로 이루어진 프라이머 쌍
으로 이루어진 군에서 선택된 1종 이상의 프라이머 쌍일 수 있다.
본 발명의 한 구체예에서, 상기 프라이머 쌍은,
인간의 5번 염색체의 82549499번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 82549499번째 염기를 기준으로 상류쪽으로 86532bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 86532bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍;
인간의 13번 염색체의 102296199번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 102296199번째 염기를 기준으로 상류쪽으로 82904bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 82904bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍;
인간의 17번 염색체의 1735396번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 1735396번째 염기를 기준으로 상류쪽으로 81913bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 81913bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍;
인간의 19번 염색체의 50549075번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 50549075번째 염기를 기준으로 상류쪽으로 75457bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 75457bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍; 및
인간의 22번 염색체의 27465889번째 염기를 포함하는 염색체 단편을 증폭시키기 위한 것으로, 상기 27465889번째 염기를 기준으로 상류쪽으로 79999bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드 및 하류쪽으로 79999bp 부위 중의 연속하는 5 내지 50bp 염기서열과 상보적인 서열을 갖는 올리고뉴클레오타이드로 이루어진 프라이머 쌍
으로 이루어진 군에서 선택된 1종 이상의 프라이머 쌍일 수 있다.
상기 프라이머 쌍으로 증폭된 염색체 단편은 염기 서열을 분석하여 상기 유방암 발병과 유의적 상관관계가 있는 SNP의 염기를 확인하여 유방암 발병 위험성을 예측할 수 있다. 상기 유전자 증폭 및 염기 서열 분석 방법은 특별한 제한이 없으 며, 이 발명이 속하는 기술분야에 통상적으로 알려진 모든 방법을 사용할 수 있다.
또 다른 측면에 있어서, 본 발명은 상기와 같은 유방암 발병 위험성 진단용 조성물 및 유전자 검출 수단을 포함하는 유방암 발병 위험성 검진용 키트를 제공한다. 보다 구체적으로, 상기 유방암 발병 위험성 진단용 조성물에 포함된, 상기한 바와 같은 표 1의 5개의 SNP 및 상기 각각의 SNP의 상류 및 하류에 각각 약 70Kbp 내지 90Kbp에 걸친 연관 불균형 지역에 존재하는 SNP들로 이루어진 군에서 선택된 1종 이상의 SNP의 검출 가능한 1종 이상의 프로브 및/또는 프라이머쌍의 사용 형태는 아무런 제한이 없으며, 예컨대, 기판에 고정되어 칩 형태로 사용되거나, 용액 형태로 사용되거나, 어떠한 형태도 무방하다. 또한, 상기 유전자 검출 수단은 상기 유방암 발병 위험성 진단용 조성물에 포함된 프로브 및/또는 프라이머쌍의 사용 형태에 따라 달라지며, 형광 표지된 프로브를 사용하는 경우, 형광 측정 수단을 포함할 수 있고, 프라이머쌍을 사용하는 경우 PCR을 통한 서열분석 수단을 포함할 수 있으며, 이 외에도 이 발명이 속하는 기술분야에 통상적으로 알려진 어떠한 유전자 분석 수단도 포함될 수 있다.
본 발명에 따른 유방암 발병 위험성 예측 기술은 유방암이 이미 발병한 상태에서 진단하는 사후적 방법이 아니고, 유방암 미발병 개체에서의 유방암 발병 위험성을 미리 예측하는 사전적 방법으로서, 유방암 발병 위험성이 높은 개체가 특별하고 적절한 관리를 통하여 발병시기를 늦추거나 발병하지 않도록 할 수 있고, 발병 되더라도 지속적인 관리를 통하여 조기에 진단할 수 있도록 할 수 있는 기술이다.
이하, 하기의 실시예에 의하여 본 발명을 보다 상세히 설명한다. 그러나, 이들 실시예는 본 발명을 예시하기 위한 것일 뿐이며, 본 발명이 이들 실시예에 의하여 제한되는 것은 아니다.
실시예 1: 유방암에 특이적 SNP 탐색
본 실시예는 유방암 환자의 유전자를 분석하여 유방암에서 특징적으로 나타나는 단일 염기다형성 (Single Nucleotide Polymorphism: SNP)을 찾아내는 것을 목적으로 한다.
1.1. 분석대상 유전자 및 SNP
유방암 환자의 유전적 성향을 파악하기 위한 실험 대상 유전자로서, DNA repair와 관련된 유전자로 알려진 하기의 표4에 나타낸 38개의 유전자를 사용하였다. 표 4의 38개 유전자에 존재하는 SNP들 중, 아시아 개체군에서 minor allele frequency가 0.05 이상인 총 384개의 SNP를 선택하였고, 하기의 실시예에서는 유방암 환자군과 정상인군에 대하여 상기 384개 SNP를 조사하여 유방암 환자에 유의적 상관성을 갖는 SNP를 선별하였다.
[표 4] 유전자 별 기능모티브의 SNP 개수
No. Gene Promoter/ Exon Intron 3'UTR/ Total
5'UTR flanking
1 APEX1 - 1 - - 1
2 ATM - 7 4 - 11
3 BARD1 - 5 12 - 17
4 BLM - 2 23 - 25
5 BRCA1 - 5 4 - 9
6 BRCA2 3 7 10 - 20
7 CHEK2 3 2 11 - 16
8 ERCC1 3 3 3 1 10
9 LIG4 - 4 - 1 5
10 MGMT 7 4 38 - 49
11 MLH1 3 6 - - 9
12 MRE11A - - 8 - 8
13 MSH2 - 1 7 - 8
14 MSH6 - 5 4 - 9
15 NBN - 6 8 - 14
16 OGG1 - 2 2 - 4
17 PMS2 - 2 1 - 3
18 PRKDC - - 9 - 9
19 RAD50 - 1 12 - 13
20 RAD51 1 - 3 - 4
21 RAD52 2 2 5 1 10
22 ATRX - 1 - - 1
23 RPA1 - 3 8 - 11
24 RPA2 - 2 1 - 3
25 TDG - 2 4 - 6
26 TP53 1 1 4 - 6
27 XPA - 3 2 - 5
28 ERCC3 - - 1 - 1
29 XPC - 4 9 - 13
30 ERCC2 - 2 5 - 7
31 ERCC4 - 3 2 - 5
32 ERCC5 2 4 6 - 12
33 XRCC1 - 3 8 - 11
34 XRCC2 - 2 6 - 8
35 XRCC3 - 1 3 - 4
36 XRCC4 3 1 17 - 21
37 XRCC5 - - 13 - 13
38 XRCC6 1 1 1 - 3
Total 29 98 254 3 384
1.2. 시료 및 분석기구 준비
유전자 시료는 임상판단 및 치료/수술이 이미 이루어진 유방암 환자와 정상인의 혈액으로부터 게놈 DNA를 추출하였다. 본 실험에 유방암 환자 346명과 정상인 338명으로 총 684명의 유전자 시료가 사용되었다. 환자군은 서울대병원에 외래 로 방문한 여성 중 2002년에서 2004년 12월까지 입원하여 임상적/병리 조직학적으로 확진된 여성 유방암 환자를 대상으로 하였다. 대조군은 2003년 이대 목동병원에서 서베이를 통해 수집된 지역대조군과 2004년 한림평촌병원 건강검진센터에 방문 수집된 지역대조군에서 선정하였다. 
SNP 유전자형 분석 플랫폼으로서 Illumina사의 BeadArray technology를 이용하여 상기 표 3의 384개의 SNP을 contents로 포함하도록 제작된 SNP칩을 이용하였다. 유전자형 분석은 GoldenGate Genotyping Assay로 Illumina사에서 제공하는 protocol에 준하여 수행하였다.
1.3. 분석 방법
1.3.1. feature 선별
① 특징적 SNP 선별
상기 384 개의 SNP의 유방암과의 관련성 정도를 각각 독립적으로 판별하기 위하여 세 개의 genetic model [우성(dominant), 열성(recessive), 공우성(co-dominant)]에 대하여 로지스틱 회귀분석(logistic regression)을 수행하였다. 각 SNP별로 가장 유의한 genetic model을 선별하고 그의 p-value로 SNP을 정렬하였다. 보통의 discriminate analysis에서 feature의 수를 결정하는 rule of thumb은 모델 구축에 이용된 샘플 수의 1/10 이하 이다. 본 실험에서 이용된 샘플의 개수는 684 개이므로, 약 50 내지 60 개 정도의 feature수가 적절하다. P value 순으로 정렬된 SNP 목록에서 상위 60개 SNP을 추출하였다.
한국인 집단에서 Minor Allele 빈도가 0.05 이하가 되는 것은 다형성(polymorphism)의 정의를 충족하지 못하므로, 이를 필터링하였다. 또한, All pair-wise SNP의 r^2 > 0.8 인 SNP이 존재한다면, 인포메이션 중복으로 인하여 모델 구축 과정에서 문제가 생기므로, 이 또한 필터링하였다.
상기 단계를 거쳐 선택된 최종 43개의 SNP을 기반으로 아래의 실험을 수행하여, 유방암에 보다 유의적인 SNP를 탐색하였다.
② 임상적 변수 선별
상기에서 얻어진 샘플에 대한 로지스틱 회귀분설을 통하여, 여러가지 임상적 변수 중, 유방암과 관련성이 있는 변수를 검정하여 그 결과를 아래의 표 5에 나타내었다.
[표 5]
Figure 112008007536418-pat00001
* 유의한 variable 에 highlight.
* 주황색은 risk variable, 초록색은 protective variable.
표 5에서 확인할 수 있는 바와 같이, 여러 가지 변수 중 학력, 유방암 가족력, 모유 수유 여부, 흡연 여부의 총 4개의 임상 변수가 유방암과 유의성을 보이는 것으로 나타났다.
또한, 상기 4개의 변수에 대하여 각각의 독립성 테스트(Biostatistics: A Foundation for Analysis in the Health Sciences, W.W. Daniel) 를 수행한 결과를 아래의 표 6에 나타내었다. 모두 범주형 변수 (categorical data) 이므로 각 쌍의 독립성 테스트를 위해 Chi-square independence test를 수행하였다.
[표 6]
Figure 112008007536418-pat00002
* Left diagonal의 각 cell은 두 변수의 independence를 null hypothesis로 두었을 때의 검정 통계량의 p value를 의미한다.
* 노란색으로 표시한 부분은 두 변수간의 상관관계가 있음을 의미한다.
상기 표 6에서 알 수 있는 바와 같이, 4개의 변수 중, 학력, 흡연 여부, 모유 수유 여부가 강한 상관 관계를 보였다. 또한 유방암 가족력 여부와 학력 또한 상관 관계를 보였다. 본 실험에서, 1.3.1.에서 와 마찬가지로, 모델 구축시의 정보 중복 (information redundancy)을 막기 위해 유방암과 생물학적으로 가장 관련이 있어 보이고, 서로 독립인 두 개의 변수인, 모유 수유 여부와, 유방암 가족력을 유방암 발명의 임상적 요인으로 선택하였다.
1.3.2. 모델 구축
① 모델 구축에 사용된 알고리즘
i) Artificial Neural Net (ANN): 선택된 Feature들을 입력 뉴런(Input neuron)으로 두고, 그 feature들을 이용하여 특정 개체가 유방암인지 아닌지를 판별하는 출력 뉴런(output neuron)을 설정한 뒤, 은닉층(hidden layer)의 connection과 값의 업데이트를 통하여 가장 판별력이 좋은 모델을 찾는 대표적인 machine learning 기법이다.
ii) Logistic Regression: 선택된 Feature들을 independent variable, 유방암 여부를 dependent variable로 이용하여, 회귀 모델의 계수를 추정함. 추정된 함수에 특정 sample의 각 feature에 대한 information을 대입하면 그 sample이 유방암에 걸릴 확률이 얼만큼 되는지에 대한 결과가 추론되어 나온다.
iii) Support Vector Machine: ANN과 더불어 최근 많은 분야에서 사용되고 있는 분류 알고리즘이다. Data point들을 support vector로 이용하여 가장 유의미한 classifier를 구분한다. 여러 kernel method를 통해 non-linear한 형태의 classifier도 구현이 가능하다.
② 모델 구축을 위한 세 가지 단계
i) 43개의 SNP feature에 대하여 샘플들의 유전자형 정보를 모두 (0 = Wild Homo, 1 = Hetero, 2 = Mutant Homo)로 코딩한다. 이는 SNP 데이터에 Machine Learning 알고리즘을 적용하여 유방암의 감수성 여부를 판별하는 기존의 논문에서 사용된 방법론이다.
Ref 1. A multigenic approach to predict breast cancer risk. Breast Cancer Res Treat (2007) 104:159-164
Ref 2. Predictive Models for Breast Cancer Susceptibility from Multiple Single Nucleotide Polymorphisms. Clinical Cancer Research (2004) 10:2725-2737
ii) SNP feature selection 과정에서 세가지 genetic model 즉, dominant, recessive, co-dominant 모델 중 각 SNP이 유방암과 가장 유의했던 모델에 따라 코딩에 변화를 주어 알고리즘의 input으로 사용하는 방법론이다.
iii) SNP feature이외에 환자의 환경적인 변수, 즉 유방암 가족력 여부와, 모유 수유 여부를 SNP과 함께 이용하여 모델을 구축하는 방법론이다.
이 중에서, ii) 및 iii)의 방법은 현재까지 적용된 바 없는 새로운 모델 구축 전략이다. 본 발명에서는 ii) 및 iii)의 방법에 의하여 실험 모델을 구축하였다.
1.4. 선별된 SNP pool의 유의성 시험
1.4.1. 각 알고리즘의 최적 파라미터
i) Artificial Neural Network (ANN): Weight decay=0.01, number of hidden nodes=2
ii) Logistic Regression: no parameter
iii) Support Vector Machine (SVM): Linear kernel
더불어, 앞서 언급한 모델 구축을 위한 세 가지 방법 중, SNP feature 이외에 환자의 환경적인 변수, 즉 유방암 가족력 여부와, 모유 수유 여부를 본 발명에서 선별한 SNP과 함께 이용하여 모델을 구축하는 방법론이 항상 가장 높은 예측 정확성을 보였다.
1.4.2. 샘플 제공군에서의 유방암 발병 위험군 분류 실험
상기 실시예 1.3.1에서 선별된 43개의 SNP를 사용하여, 실시예 1.1에서 상기 SNP 선별에 사용된 유전자 샘플을 제공한 유방암 환자군과 정상인군에 대하여, 유방암 환자군과 정상인군 분류 정확성을 시험하였다. 통계적 처리를 위하여 상기 3 가지 알고리즘을 이용하였으며, 얻어진 결과를 아래의 표 7에 나타내었다. 10 번의 cross validation을 통해 평균과 표준편차를 구하여 표 7에 함께 나타내었다.
[표 7]
Figure 112008007536418-pat00003
표 7에 나타낸 바와 같이, 상기 4 개의 분석 모델을 활용하여 유방암 발생 위험도를 최대 63%(민감도 81%, 특이도 66.85%)로 예측 가능하였다.
실시예 2: 다양한 개체군에서의 유방암 발병 위험성 예측
상기 실시예 1.3.1에서 선별된 43개의 SNP의 유방암 발병 위험성 예측의 객관적 정확성을 담보하기 위하여, 상기 SNP 선별을 위한 유전자 샘플을 제공한 개체군 이외의 다른 개체군에서의 유방암 발병 위험군 예측 정확성을 측정하여, 샘플 제공군에서의 정확성과 동등 이상의 결과를 얻을 수 있음을 증명함으로써, 실제 환자 검진에서의 유방암 발병 위험성 결정에 만족할만한 효용성을 나타낼 수 있음을 입증하였다. 상기 다른 개체군으로서 서울대학교 유방암 센터에서 제공한 30명의 유방암 환자 샘플과 30명의 정상인 샘플을 채용하였다. 유전자형 분석은 유전자 형 분석의 기술적 편향보정을 위하여 기존의 Illumina chip 대신Applied Biosystems사의 Taqman assay를 통해 수행하였다.
2.1. 최적 SNP subset 선별
43 개의 SNP pool에서 샘플 제공군 (original data set)과 이와 다른 개체군(validation set)에서 모두 60% 이상의 예측 정확성을 나타내는 SNP subset을 선별하였다. 선별될 SNP subset의 범위는 2 내지 10 개로 제한하였다. SNP의 개수가 많아 질수록, 즉 예측에 사용되는 변수가 많아질수록 모델이 주어진 데이터에서는 잘 작동하지만, 현실 세계의 문제에서 예측력이 떨어지는 over-fitting이 발생할 우려가 있어서 상기 수치로 조절하는 것이 좋다.
43 SNP feature pool에서 SNP subset 개수 (2~10) 만큼, 각각 30000번의 무 작위 선별을 통하여 모델을 구축하였다. Logistic model은 Y ~ SNP(SNP만 조사), Y ~ SNP + FHBC + BFEDYN(SNP와 가족력 및 모유수유 여부 함께 조사), 두 경우 모두 측정하였다. Subset 개수 (2~10) * 30000 개의 모델이 측정되며, 이 중에서 샘플 제공군 (original data set)과 이와 다른 개체군(validation set) 모두에서 60% 이상의 예측 정확성을 나타낸 모델을 선별하였다. 상기 선별된 모델에 속하는 SNP feature의 분포를 구한 결과 빈도가 가장 높은 5 개의 SNP을 최종 feature로 선별하였다. 상기 SNP feature의 분포 결과를 도 1에 나타내었다. 도 1에서 알 수 있는 바와 같이 rs4703564가 60% 이상의 정확성을 나타내는 빈도가 가장 높았으며, 이 외에도 rs751402, rs5762766, rs9909163, rs238415의 빈도도 높게 나타났다. 상기 결과를 통하여, 유방암 발병과 유의적 상관관계를 갖는 SNP로서 rs4703564, rs751402, rs5762766, rs9909163, 및 rs238415의 5개의 SNP가 선별되었다.
2.2. 최적 SNP subset의 유방암 발병 위험성 예측 성능
상기 실시예 2.1.에서 선별된 5개 SNP를 사용하여 샘플 제공군 (original data set)과 이와 다른 개체군(validation set)에 대하여 조사한 결과, 표 8과 같은 결과를 얻었다. 상기 조사는 Logistic model을 사용하였으며, Y ~ SNP(SNP만 조사), 및 Y ~ SNP + FHBC + BFEDYN(SNP와 가족력 및 모유수유 여부 함께 조사)의 두 경우를 모두 조사하여 그 결과를 아래의 표 8에 나타내었다.
[표 8]
Validation set Original set
Model Prediction Sensitivity specificity Prediction Sensitivity specificity
Y ~ SNP 0.65 0.667 0.633 0.619 0.584 0.636
Y ~ SNP + FHBC + BFEDYN 0.6 0.733 0.467 0.629 0.676 0.536
상기 표 8에서 알 수 있는 바와 같이, 선별된 5개 SNP를 사용하는 경우 선별에 사용된 샘플 제공군에서 60%에 가까운 감도를 나타낼 뿐 아니라, 무작위로 선택된 다른 개체군에서는 그 이상의 감도를 나타내었다. 또한, 상기 SNP와 함께 모유수유여부 및 가족력에 대한 고려가 추가됨으로써, 보다 높은 감도의 유방암 위험군 예측이 가능하다.
도 1은 샘플 제공군 (original data set)과 이와 다른 개체군(validation set) 모두에서 60% 이상의 예측 정확성을 나타내는 SNP의 빈도를 나타낸 그래프이다.
도 2는 인간의 5번 염색체의 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 3은 인간의 13번 염색체의 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 4는 인간의 17번 염색체의 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 5는 인간의 19번 염색체의 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.
도 6은 인간의 22번 염색체의 밝혀진 모든 SNP 쌍의 거리와 R 스퀘어 값을 비교한 결과를 나타낸 것이다.

Claims (13)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 인간의 5번 염색체의 82549499번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 가지며, 상기 82549499번째 염기는 CC인(rs4703564), 올리고뉴클레오타이드;
    인간의 13번 염색체의 102296199번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 가지며, 상기 102296199번째 염기는 CT 또는 TT인(rs751402), 올리고뉴클레오타이드;
    인간의 17번 염색체의 1735396번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 가지며, 상기 1735396번째 염기는 CC 또는 TC인(rs9909163), 올리고뉴크레오타이드;
    인간의 19번 염색체의 50549075번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 가지며, 상기 50549075번째 염기는 CC인(rs238415), 올리고뉴클레오타이드; 및
    인간의 22번 염색체의 27465889번째 염기를 포함하는 연속하는 5 내지 100bp 염기서열과 상보적인 서열을 가지며, 상기 27465889번째 염기는 CT 또는 TT인(rs5762766), 올리고뉴클레오타이드
    를 포함하는,
    유방암 발병 위험성 검진용 조성물.
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
KR1020080009144A 2008-01-29 2008-01-29 유방암 발병 위험성 검진용 조성물 KR101012601B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080009144A KR101012601B1 (ko) 2008-01-29 2008-01-29 유방암 발병 위험성 검진용 조성물

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080009144A KR101012601B1 (ko) 2008-01-29 2008-01-29 유방암 발병 위험성 검진용 조성물

Publications (2)

Publication Number Publication Date
KR20090083152A KR20090083152A (ko) 2009-08-03
KR101012601B1 true KR101012601B1 (ko) 2011-02-10

Family

ID=41204137

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080009144A KR101012601B1 (ko) 2008-01-29 2008-01-29 유방암 발병 위험성 검진용 조성물

Country Status (1)

Country Link
KR (1) KR101012601B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060091161A (ko) * 2005-02-14 2006-08-18 삼성전자주식회사 단일염기 다형을 포함하는 유방암과 관련된 폴리뉴클레오티드, 그를 포함하는 마이크로어레이 및 진단 키트 및 그를이용한 유방암 진단 방법
KR20060097316A (ko) * 2005-03-05 2006-09-14 삼성전자주식회사 유방암 특이적 다형성 서열을 이용한 유방암의 진단방법,유방암 특이적인 폴리뉴클레오티드 및 상기 폴리뉴클레오티드가 고정되어 있는 마이크로어레이
US20060240454A1 (en) * 2005-03-14 2006-10-26 Gould Michael N MMethod of analyzing breast cancer susceptibility and resistance
US20070072228A1 (en) * 2004-04-08 2007-03-29 Hiltrud Brauch ERCC2 polymorphisms

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070072228A1 (en) * 2004-04-08 2007-03-29 Hiltrud Brauch ERCC2 polymorphisms
KR20060091161A (ko) * 2005-02-14 2006-08-18 삼성전자주식회사 단일염기 다형을 포함하는 유방암과 관련된 폴리뉴클레오티드, 그를 포함하는 마이크로어레이 및 진단 키트 및 그를이용한 유방암 진단 방법
KR20060097316A (ko) * 2005-03-05 2006-09-14 삼성전자주식회사 유방암 특이적 다형성 서열을 이용한 유방암의 진단방법,유방암 특이적인 폴리뉴클레오티드 및 상기 폴리뉴클레오티드가 고정되어 있는 마이크로어레이
US20060240454A1 (en) * 2005-03-14 2006-10-26 Gould Michael N MMethod of analyzing breast cancer susceptibility and resistance

Also Published As

Publication number Publication date
KR20090083152A (ko) 2009-08-03

Similar Documents

Publication Publication Date Title
DK2582847T3 (en) METHODS AND MATERIALS TO ASSESS loss of heterozygosity
CN105243295B (zh) 与癌症相关的遗传或分子畸变的检测
CN107287285A (zh) 一种预测同源重组缺失机制及患者对癌症治疗响应的方法
JP5955557B2 (ja) 膵臓腫瘍形成の根底にある経路および遺伝性の膵癌遺伝子
CN108624650B (zh) 判断实体瘤是否适合免疫治疗的方法和检测试剂盒
WO2015171457A1 (en) Methods of identifying biomarkers associated with or causative of the progression of disease, in particular for use in prognosticating primary open angle glaucoma
JP7126704B2 (ja) 結腸直腸癌発症のリスクを評価するための方法
JP2023535962A (ja) 低カバレッジ次世代シーケンシングデータにおける相同修復欠損などの染色体空間不安定性を同定する方法
CN108138233A (zh) Dna混合物中组织的单倍型的甲基化模式分析
CN101679971A (zh) 青光眼恶化风险的判定方法
CN104736723B (zh) 用于预测对fgf‑18化合物的响应性的遗传标记
KR20190025814A (ko) 유방암과 관련된 염색체 상호 작용의 검출
US20130296182A1 (en) Variability single nucleotide polymorphisms linking stochastic epigenetic variation and common disease
KR101012601B1 (ko) 유방암 발병 위험성 검진용 조성물
KR101541139B1 (ko) 이식편대숙주병 발병 위험성의 예측 방법, 예측용 조성물 및 키트
KR101593090B1 (ko) 이식편대숙주병 발병 위험성의 예측 방법, 예측용 조성물 및 키트
KR101530535B1 (ko) 이식편대숙주병 발병 위험성의 예측 방법, 예측용 조성물 및 키트
KR102325356B1 (ko) 유사유전자를 이용한 신경교종의 악성도 진단용 조성물 및 이의 이용
KR101541140B1 (ko) 이식편대숙주병 발병 위험성의 예측 방법, 예측용 조성물 및 키트
KR101541142B1 (ko) 이식편대숙주병 발병 위험성의 예측 방법, 예측용 조성물 및 키트
KR101541141B1 (ko) 이식편대숙주병 발병 위험성의 예측 방법, 예측용 조성물 및 키트
KR101541143B1 (ko) 이식편대숙주병 발병 위험성의 예측 방법, 예측용 조성물 및 키트
Mohammadnejad et al. Identifying genetic variants regulating MGMT gene expression-A study in monozygotic Danish twins
CA3240150A1 (en) Methods and materials for assessing homologous recombination deficiency in breast cancer subtypes
JP2023545364A (ja) 疾患マーカー

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140127

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150116

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160127

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170120

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180119

Year of fee payment: 8