KR20230007102A

KR20230007102A - 유전자내 메틸화 검출을 통한 대장암의 진단 방법

Info

Publication number: KR20230007102A
Application number: KR1020210087933A
Authority: KR
Inventors: 김락균; 이영운; 이지연; 도소희
Original assignee: 연세대학교 산학협력단
Priority date: 2021-07-05
Filing date: 2021-07-05
Publication date: 2023-01-12

Abstract

본 발명은 PDX1, EN2 및/또는 MSX1의 유전자내(intragenic) 영역에서의 메틸화 수준을 측정함으로써 대장암을 진단하거나 이의 예후를 예측하는 방법에 관한 것이다. 본 발명은 대장암 환자에서 특이적으로 과메틸화되는 유전자내 CpG 영역을 발굴함으로써 대장암에 대한 신뢰도 높은 바이오 마커를 제공할 뿐 아니라, 발굴된 CpG 영역을 효율적으로 검출할 수 있는 최적화된 메틸화-특이적 PCR(MSP)용 프라이머를 제공한다. 이에, 본 발명은 대장암의 발병 여부 뿐 아니라 암 조직의 침윤 정도, 전이 가능성 및 환자의 생존율을 포함하는 종합적인 예후를 정확하게 예측함으로써 치료 전략을 조기에 수립하고 대장암 환자의 생존률을 현저히 향상시킬 수 있는 중요한 임상 정보를 제공할 수 있다.

Description

유전자내 메틸화 검출을 통한 대장암의 진단 방법{A Method for Diagnosing Colon Cancer by Detecting Intragenic Methylation}

본 발명은 PDX1, EN2 및/또는 MSX1 유전자의 유전자내 영역(intragenic region)에서의 메틸화 수준 측정을 통해 대장암의 발병 여부 또는 예후를 예측하는 방법에 관한 것이다.

대장직장암(CRC)은 전세계적으로 3번째로 흔한 암으로, 2020년 기준 2번째 사망원인을 차지한다[1]. CRC는 유전적 및 후생적 변형의 축적으로 인해 발병하는 것으로 알려졌다. CRC의 발병 및 진행과 관련되어 선암-암종 경로(염색체 불안정성 서열로도 불림), 톱니모양 암화 경로 및 현미부수체 불안정성(MSI)을 포함하는 몇몇 분자적 경로가 동정되었다[2, 3]. 70-90%의 CRC 사례가 선암-암종 경로와 관련이 있으며 APC 돌연변이에 의해 개시되어, KRAS 활성화 또는 TP53 기능 상실로 이어진다. 반면, 톱니모양 암화 경로는 KRAS와 BRAF 돌연변이를 경유하여 발달하며, 후생적 조절장애는 CpG섬 메틸화 표현형(CIMP)에 의해 명확하게 구분된다. MSI는 전형적으로 린치 증후군을 수반하는데, 이는 미스매치 수리(MMR) 유전자의 불활성화에 기인한다[4-7].

포유류의 후생적 변형 중 DNA 메틸화는 유전자 발현 조절에 핵심적인 역할을 한다. 이러한 후생적 조절은 종양 억제 유전자 및 종양 유전자 발현에 영향을 미치며, 이러한 기전은 암종에 따라 조금씩 차이가 난다. DNA 메틸화 마커는 CRC에서 광범위하게 연구되어 있다. LINE-1(long interspersed nuclear element-1) 및 Alu repeat과 같은 반복서열의 저메틸화 및 활성화로 인하여, 유전적 불안정성이 유발되어 CRC 발병을 촉발하는 것으로 여겨진다[11-13]. 반면, 프로모터 영역에서 과메틸화된 유전자의 패널이 발견되어 CIMP로 불리우는 CRC의 하나의 형태로 동정되었다[14]. 일반적으로, 유전자의 프로모터에서 DNA 과메틸화가 일어날 경우 유전자 발현은 감소하므로, CIMP의 과메틸화된 유전자는 종양 억제자로 기능할 것으로 예측되었다.

DNA 메틸화 변화와 암의 진행간의 관계에 대한 다양한 관찰에도 불구하고, SEPT9 (Epi proColon), NDRG4 및 BMP3(Cologuard)과 같은 몇몇 유전자만이 CRC 진단을 위한 바이오마커로 입증되었으며 상용화된 진단 키트로서 승인받았다[15-17]. DNA 메틸화-기반 바이오마커를 개발하기 위한 초석은 이상적인 유전자 부위, 즉 CpG 섬(CGI) 및 특정 CpG 부위의 선정에 있다[19]. 예를 들어, GSTP1의 프로모터 영역의 DNA 메틸화가 간세포암의 유망한 진단 마커로 밝혀졌으나 특이성 면에서는 상반되는 결과를 보였다.

이후 이러한 다양성은 DNA 메틸화 수준의 측정에 이용되는 GSTP1 프로모터의 5' 영역의 CpG 부위의 차이에서 비롯됨이 발견되었다[20]. 즉, 이는 동일한 CpG 섬 내에 어떠한 CpG 부위가 선정되는지에 따라 검출 민감도와 임상적 타당성은 다양할 수 있음을 보여준다.

차세대 시퀀싱 기술에 기반하여 임상 바이오마커를 발굴하기 위해, Illumina Infinium 450 K 또는 850 K 어레이-기반 검출방법을 사용하여 TCGA (Cancer Genome Atlas)를 통해 대량의 데이터를 생성하였다[21]. 이 방법으로 암세포 내 다양한 유전자의 메틸화 수준을 스크리닝할 수 있다. 전체-지놈 비설파이트 시퀀싱은 DNA 메틸화 수준을 광범위한 지놈-스케일에서 측정할 수 있는 유용한 방법이나 시간과 비용 면에서 제약이 크다. 표적화 시퀀싱 기술은 관심 유전자 영역의 대량 시퀀싱에 이용될 수 있다. DNA 메틸화의 정량화에 대한 특이성을 증가시키기 위해, 표적화된 비설파이트 시퀀싱은 PCR-기반 증폭을 위해 타겟 영역에 결합하여 이를 포집하도록 설계된 프로브를 이용한다.

그러나, 보다 직접적인 메틸화 방법인 메틸화-특이적 중합효소연쇄반응 (MS-PCR, MSP)이 개발되었으며[23], 이 방법은 타겟 영역의 메틸화를 보다 시간/비용 효율적으로 측정할 수 있으나, 이를 위한 프라이머 설계와 PCR 조건의 최적화가 상대적으로 어렵다[24].

본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.

비특허문헌 1. Kel et al. Walking pathways with positive feedback loops reveal DNA methylation biomarkers of colorectal cancer BMC Bioinformatics 20:119 (2019)

본 발명자들은 개체의 후생적인 유전적 변화를 기반으로 대장암의 발병 여부 및 예후를 정확하게 예측하는 방법을 개발하기 위하여 예의 연구 노력하였다. 그 결과, PDX1, EN2 및/또는 MSX1 유전자의 유전자 내 영역에서의 DNA 메틸화 양상을 측정할 경우 이를 통해 현재 대장암의 발병 여부 뿐 아니라 암 조직의 침윤 정도, 전이 가능성 및 환자의 생존율을 포함하는 종합적인 예후를 높은 신뢰도로 예측할 수 있음을 발견으로써, 본 발명을 완성하게 되었다.

따라서 본 발명의 목적은 대장암의 진단 또는 예후 예측용 조성물을 제공하는 데 있다.

본 발명의 다른 목적 및 이점은 하기의 발명의 상세한 설명, 청구범위 및 도면에 의해 보다 명확하게 된다.

본 발명의 일 양태에 따르면, 본 발명은 PDX1, EN2 및 MSX1 유전자로 구성된 군으로부터 선택되는 하나 이상의 유전자의 유전자내 영역(intragenic region)에서의 메틸화 수준을 측정하는 제제를 유효성분으로 포함하는 대장암의 진단 또는 예후 예측용 조성물을 제공한다.

본 발명자들은 개체의 후생적인 유전적 변화를 기반으로 대장암의 발병 여부 및 예후를 정확하게 예측하는 방법을 개발하기 위하여 예의 연구 노력하였다. 그 결과, PDX1, EN2 및/또는 MSX1 유전자의 유전자 내 영역에서의 DNA 메틸화 양상을 측정할 경우 이를 통해 현재 대장암의 발병 여부 뿐 아니라 암 조직의 침윤 정도, 전이 가능성 및 환자의 생존율을 포함하는 종합적인 예후를 높은 신뢰도로 예측할 수 있음을 발견하였다.

본 명세서에서 용어“대장암”은 소장과 항문 사이에 위치하는 소화기관인 대장에서 발생한 악성 종양을 의미한다. 대장암은 주로 대장의 상피세포에서 암세포가 발생하게 되며, 암이 발생하는 위치에 따라 결장암과 직장암으로 분류된다. 따라서, 용어“대장암”은“결장암”,“직장암”및“대장직장암” (colorectal cancer, CRC)을 포괄하는 의미이다.

본 명세서에서 용어“진단”은 특정 질환에 대한 개체의 감수성(susceptibility)의 판정, 특정 질환을 현재 개체가 가지고 있는 지 여부의 판정, 및 특정 질환에 걸린 한 객체의 예후(prognosis)의 판정 및 특정 약물에 대한 치료 반응성을 모두 포괄하는 의미이다.

본 명세서에서 용어“진단용 조성물”은 대상체의 대장암 발병 여부를 판단하거나 발병 가능성을 예측하기 위해 PDX1, EN2 및/또는 MSX1 유전자의 메틸화 수준 측정수단을 포함하는 통합적인 혼합물(mixture) 또는 장비(device)를 의미하며, 이에“진단용 키트”로 표현될 수도 있다.

본 명세서 용어“예후(prognosis)”는 질병을 진단하여 판단된 분석 시점 이후의 증세 또는 경과에 대한 전망을 포괄하는 의미이다. 대장암 환자에 있어서 예후는 통상적으로 암 발병 또는 외과적 시술 후 일정기간 내의 전이 여부, 전체 생존기간 또는 무병 생존률을 뜻하며, 예후의 예측은 특히 대장암 환자의 향후 치료 전략에 대한 단서를 제시하므로 중요한 임상적 과제이다.

본 명세서에서 용어“무병 생존율(disease-free survival)”또는“무진행 생존률(progression-free survival)”은 전체 환자 군에서 치료 시작 후 5년 동안 재발이나 전이의 증가 없이 생존한 환자들의 비율을 의미한다. 용어“전이(metastasis)”는 종양이 원발 부위에서 여러 경로를 따라 다른 신체의 부위에 이식되어 그곳에 생착 및 증식하는 상태를 의미한다. 암의 전이여부는 해당 암의 고유의 특성에 의하여 결정될 뿐만 아니라 암의 예후 결정에 있어서 가장 중요한 단서가 되는 사건이므로, 암 환자의 생존과 관련된 가장 중요한 임상정보로 다루어진다.

본 명세서에서 용어“치료 반응성(responsiveness)”은 치료제가 환자에게 치료적 유효량으로 투여되었을 때 생체 내에서 질환의 증상의 진행의 억제, 경감, 제거와 같은 작용을 하는 정도를 의미한다.

본 발명에 따르면, 본 발명자들은 종양 조직에서 정상 조직에 비하여 PDX1, EN2 및/또는 MSX1의 유전자내 영역에서 메틸화의 유의한 증가가 발생하며, 이러한 과메틸화가 대장암의 발병, 종양세포의 증식, 이동, 침윤의 증가 및 환자 생존률에 대한 표지자가 될 수 있음을 최초로 규명하였다.

본 발명의 구체적인 구현예에 따르면, 상기 PDX1의 유전자내 영역에서의 메틸화 수준을 측정하는 제제는 PDX1의 유전자내 CpG 섬을 특이적으로 인식하는 메틸화-특이적 중합효소연쇄반응(methylation specific PCR, MSP) 용 프라이머이다.

본 명세서에서 용어“프라이머”는 핵산쇄(주형)에 상보적인 프라이머 연장 산물의 합성이 유도되는 조건, 즉, 뉴클레오타이드와 DNA 중합효소와 같은 중합제의 존재 및 적합한 온도/ pH의 조건에서 합성의 개시점으로 작용하는 올리고뉴클레오타이드를 의미한다. 구체적으로는, 프라이머는 디옥시리보뉴클레오타이드 단일쇄이다. 본 발명에서 이용되는 프라이머는 자연(naturally occurring) dNMP(즉, dAMP, dGMP, dCMP 및 dTMP), 변형 뉴클레오타이드 또는 비-자연 뉴클레오타이드를 포함할 수 있으며, 리보뉴클레오타이드도 포함할 수 있다.

본 발명의 프라이머는 타겟 핵산에 어닐링 되어 주형-의존성 핵산 중합효소에 의해 타겟 핵산에 상보적인 서열을 형성하는 연장 프라이머(extension primer)일 수 있으며, 이는 고정화 프로브가 어닐링 되어 있는 위치까지 연장되어 프로브가 어닐링 되어 있는 부위를 차지한다.

본 발명에서 이용되는 연장 프라이머는 타겟 핵산, 예를 들어 PDX1, EN2 및/또는 MSX1 유전자내 CpG 섬의 특정 염기서열에 상보적인 혼성화 뉴클레오타이드 서열을 포함한다. 용어“상보적”은 소정의 어닐링 또는 혼성화 조건하에서 프라이머 또는 프로브가 타겟 핵산 서열에 선택적으로 혼성화할 정도로 충분히 상보적인 것을 의미하며, 실질적으로 상보적(substantially complementary)인 경우 및 완전히 상보적(perfectly complementary)인 경우를 모두 포괄하는 의미이며, 구체적으로는 완전히 상보적인 경우를 의미한다. 본 명세서에서 용어“실질적으로 상보적인 서열”은 완전히 일치되는 서열뿐만 아니라, 특정 서열에 어닐링하여 프라이머 역할을 할 수 있는 범위 내에서, 비교 대상의 서열과 부분적으로 불일치되는 서열도 포함되는 의미이다.

프라이머는, 중합제의 존재 하에서 연장 산물의 합성을 프라이밍시킬 수 있을 정도로 충분히 길어야 한다. 프라이머의 적합한 길이는 다수의 요소, 예컨대, 온도, pH 및 프라이머의 소스(source)에 따라 결정되지만 전형적으로 15-30 뉴클레오타이드이다. 짧은 프라이머 분자는 주형과 충분히 안정된 혼성 복합체를 형성하기 위하여 일반적으로 보다 낮은 온도를 요구한다. 이러한 프라이머의 설계는 타겟 뉴클레오티드 서열을 참조하여 당업자가 용이하게 실시할 수 있으며, 예컨대, 프라이머 디자인용 프로그램(예: PRIMER 3 프로그램)을 이용하여 할 수 있다.

본 명세서에서 용어“메틸화-특이적 중합효소연쇄반응(MSP)용 프라이머”는 표적 핵산분자에서의 DNA 메틸화 상태에 대한 정보를 수득하기 위해 수행되는 PCR에 사용하기 위한 프라이머를 의미한다. MSP는 분석 대상 DNA 분자를 소듐 바이설파이트로 처리하여 상기 DNA 내 메틸화되지 않은 시토신을 티민으로 변형시킨 뒤, 염기 서열이 변형된 분석 대상 유전자(예를 들어 예를 들어 PDX1, EN2 및/또는 MSX1)의 CpG 섬에 특이적으로 결합할 수 있는 프라이머로 PCR 반응을 함으로써 수행될 수 있다. 따라서, 용어 MSP용 프라이머는 소듐 바이설파이트 처리에 따른 시토신의 티민으로의 변환 여부를 고려하여 비메틸화된 시토신과 메틸화된 시토신을 구분할 수 있도록 설계된 프라이머를 의미한다.

본 발명에서는 프라이머와 함께 프로브가 사용될 수 있다.

본 명세서에서 용어“프로브”는 특정 뉴클레오타이드 서열에 혼성화될 수 있는 디옥시리보뉴클레오타이드 및 리보뉴클레오타이드를 포함하는 자연 또는 변형되는 모노머 또는 결합을 갖는 선형의 올리고머를 의미한다. 구체적으로, 프로브는 혼성화에서의 최대 효율을 위하여 단일가닥이며, 더욱 구체적으로는 디옥시리보뉴클레오타이드이다. 본 발명에 이용되는 프로브로서, PDX1, EN2 및/또는 MSX1 유전자내 CpG 섬의 특정 염기서열에 완전하게(perfectly) 상보적인 서열이 이용될 수 있으나, 특이적 혼성화를 방해하지 않는 범위 내에서 실질적으로(substantially) 상보적인 서열이 이용될 수도 있다. 일반적으로, 혼성화에 의해 형성되는 듀플렉스(duplex)의 안정성은 말단의 서열의 일치에 의해 결정되는 경향이 있기 때문에, 타겟 서열의 3’-말단 또는 5’-말단에 상보적인 프로브를 사용하는 것이 바람직하다.

혼성화에 적합한 조건은 Joseph Sambrook, et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.(2001) 및 Haymes, B. D., et al., Nucleic Acid Hybridization, A Practical Approach, IRL Press, Washington, D.C.(1985)에 개시된 사항을 참조하여 결정할 수 있다.

보다 구체적으로는, 상기 PDX1의 유전자내 CpG 섬은 서열목록 제1서열의 뉴클레오타이드를 포함한다(chr13: 28,498,226 - 28,499,046).

보다 구체적으로는, 상기 MSP 용 프라이머는 메틸화된 뉴클레오타이드를 특이적으로 인식하는 서열목록 제4서열의 뉴클레오타이드 및 서열목록 제5서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍; 또는 메틸화되지 않은 뉴클레오타이드를 특이적으로 인식하는 서열목록 제10서열의 뉴클레오타이드 및 서열목록 제11서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍이다.

보다 더 구체적으로는, 상기 MSP 용 프라이머는 서열목록 제4서열의 뉴클레오타이드 및 서열목록 제5서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍이다.

본 발명의 구체적인 구현예에 따르면, 상기 EN2의 유전자내 영역에서의 메틸화 수준을 측정하는 제제는 EN2의 유전자내 CpG 섬을 특이적으로 인식하는 메틸화-특이적 MSP 용 프라이머이다.

보다 구체적으로는, 상기 EN2의 유전자내 CpG 섬은 서열목록 제2서열의 뉴클레오타이드를 포함한다(chr7 : 155,255,098 - 155,255,311).

보다 구체적으로는, 상기 MSP 용 프라이머는 메틸화된 뉴클레오타이드를 특이적으로 인식하는 서열목록 제6서열의 뉴클레오타이드 및 서열목록 제7서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍; 또는 메틸화되지 않은 뉴클레오타이드를 특이적으로 인식하는 서열목록 제12서열의 뉴클레오타이드 및 서열목록 제13서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍이다.

보다 더 구체적으로는, 상기 MSP 용 프라이머는 서열목록 제6서열의 뉴클레오타이드 및 서열목록 제7서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍이다.

본 발명의 구체적인 구현예에 따르면, 상기 MSX1의 유전자내 영역에서의 메틸화 수준을 측정하는 제제는 MSX1의 유전자내 CpG 섬을 특이적으로 인식하는 메틸화-특이적 MSP 용 프라이머이다.

보다 구체적으로는, 상기 MSX1의 유전자내 CpG 섬은 서열목록 제3서열의 뉴클레오타이드를 포함한다(chr4 : 4,864,456 - 4,864,834).

보다 구체적으로는, 상기 MSP 용 프라이머는 메틸화된 뉴클레오타이드를 특이적으로 인식하는 서열목록 제8서열의 뉴클레오타이드 및 서열목록 제9서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍; 또는 메틸화되지 않은 뉴클레오타이드를 특이적으로 인식하는 서열목록 제14서열의 뉴클레오타이드 및 서열목록 제15서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍이다.

보다 더 구체적으로는, 상기 MSP 용 프라이머는 서열목록 제8서열의 뉴클레오타이드 및 서열목록 제9서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍이다.

본 명세서에서 용어“뉴클레오타이드”는 DNA(gDNA 및 cDNA) 그리고 RNA 분자를 포괄적으로 포함하는 의미를 갖으며, 핵산 분자에서 기본 구성 단위인 뉴클레오타이드는 자연의 뉴클레오타이드 뿐만 아니라, 당 또는 염기 부위가 변형된 유사체(analogue)도 포함한다. 본 발명에서 메틸화 수준을 측정하고자 하는 영역의 뉴클레오타이드 서열 또는 이를 위한 MSP 용 프라이머 서열은 첨부한 서열목록에 기재된 뉴클레오타이드 서열에 한정되지 않는다는 것은 당업자에게 명확하다. 뉴클레오타이드의 생물학적 균등 활성을 갖는 변이를 고려한다면, 본 발명의 각 마커 유전자 내 CpG 섬 및 이에 대한 MSP 프라이머는 서열목록에 기재된 서열과 실질적인 동일성(substantial identity)을 나타내는 서열도 포함하는 것으로 해석된다. 상기의 실질적인 동일성은, 상기한 본 발명의 서열과 임의의 다른 서열을 최대한 대응되도록 얼라인하고, 당업계에서 통상적으로 이용되는 알고리즘을 이용하여 얼라인된 서열을 분석한 경우에, 최소 70%의 상동성, 구체적으로는 80%의 상동성, 보다 구체적으로는 90%의 상동성, 가장 구체적으로는 95%의 상동성을 나타내는 서열을 의미한다. 서열비교를 위한 얼라인먼트 방법은 당업계에 공지되어 있다. 얼라인먼트에 대한 다양한 방법 및 알고리즘은 Huang et al., Comp. Appl. BioSci. 8:155-65(1992) and Pearson et al., Meth. Mol. Biol. 24:307-31(1994)에 개시되어 있다. NCBI Basic Local Alignment Search Tool(BLAST)(Altschul et al., J. Mol. Biol. 215:403-10(1990))은 NCBI(National Center for Biological Information) 등에서 접근 가능하며, 인터넷 상에서 blastp, blasm, blastx, tblastn and tblastx와 같은 서열 분석 프로그램과 연동되어 이용할 수 있다.

본 명세서에서 용어“개체”는 각 마커 유전자의 유전자 내 메틸화 수준을 측정하기 위한 시료를 제공하고, 궁극적으로 대장암의 진단 및 예후의 분석 대상이 되는 개체를 의미한다. 개체는 제한없이 인간, 마우스, 래트, 기니아 피그, 개, 고양이, 말, 소, 돼지, 원숭이, 침팬지, 비비 또는 붉은털 원숭이를 포함하며, 구체적으로는 인간이다. 본 발명의 조성물은 현재 대장암의 발병 여부 뿐 아니라 향후 발병, 전이, 재발이 발생할 유전적 위험성을 예측하기 위한 정보도 제공하기 때문에, 본 발명의 개체는 대장암 환자일 수도 있고 아직 발병하지 않은 정상개체(healthy subject)일 수도 있다.

본 발명의 다른 양태에 따르면, 본 발명은 PDX1, GRIN2D, PITX1, TFAP2A, EN2 및 MSX1 유전자로 구성된 군으로부터 선택되는 하나 이상의 유전자의 발현량을 측정하는 제제를 유효성분으로 포함하는 대장암의 진단용 조성물을 제공한다.

본 발명자들은 정상 시료와 종양 시료 간 상이한 메틸화 양상을 보이는 유전자내 영역의 CpG 섬을 발굴한 데 이어 이러한 메틸화 양상이 해당 유전자의 발현량에 미치는 영향을 추가적으로 조사하였다. 그 결과, 상기 나열된 6개의 유전자가 대장암 조직에서 2배 이상 발현이 증가함을 확인함으로써, 이들 유전자가 대장암에 대한 유효한 진단 표지자로 기능할 수 있음을 발견하였다.

본 발명의 또 다른 양태에 따르면, 본 발명은 PDX1, EN2 및 MSX1 유전자로 구성된 군으로부터 선택되는 하나 이상의 유전자의 발현량을 측정하는 제제를 유효성분으로 포함하는 대장암의 예후 예측용 조성물을 제공한다.

후술하는 실시예에서 보는 바와 같이, 본 발명자들은 PDX1, EN2 및 MSX1 유전자의 고발현은 대장암 세포의 증식, 침윤 및 이동을 촉진하고 환자 생존률과 음의 상관관계를 보임을 확인함으로써, 이들 유전자가 대장암의 예후 예측을 위한 신로도 높은 바이오마커로 기능할 수 있음을 발견하였다.

본 발명의 구체적인 구현예에 따르면, 상기 조성물은 대장암의 전이 예측용 조성물이다.

본 명세서에서 용어“전이”또는“전이암”은 원발성 암(primary tumor) 조직에서 이탈한 암세포가 주위의 혈관이나 림프관으로 침투해 이를 통로로 하여 체내의 다른 부위로 원거리 이동하면서 형성된 새로운 종양을 의미한다. 암 환자의 사망원인의 90% 이상은 원발암성 암으로부터의 전이에 기인하므로(Nature Reviews Cancer, 2006, 6:449-458), 암 전이를 조기에 검출하는 것은 암 환자의 생존률 개선에 있어 원발암의 치료에 못지않게 중요한 문제이다.

본 발명자들은 PDX1, EN2 및 MSX1의 유전자내 CpG 영역의 메틸화 수준 뿐 아니라 이들 유전자의 발현량 자체가 암세포의 이동과 유의한 관련성을 가진다는 사실을 확인함으로써 이들 유전자의 발현량이 암세포의 2차 부위로의 전이에 대한 표지자가 될 수 있음을 발견하였다. 이에“전이 예측”은“전이암의 진단”, “암 전이의 진단”또는“암의 예후 예측”과 동일한 의미로 사용된다.

본 발명의 특징 및 이점을 요약하면 다음과 같다:

(a) 본 발명은 PDX1, EN2 및/또는 MSX1의 유전자내(intragenic) 영역의 메틸화 수준을 측정함으로써 대장암을 진단하거나 이의 예후를 예측하는 방법을 제공한다.

(b) 본 발명은 대장암 환자에서 특이적으로 과메틸화되는 유전자내 CpG 영역을 발굴함으로써 대장암에 대한 신뢰도 높은 바이오 마커를 제공할 뿐 아니라 발굴된 CpG 영역을 효율적으로 검출할 수 있는 최적화된 메틸화-특이적 PCR(MSP)용 프라이머를 제공한다.

(c) 본 발명은 대장암의 발병 여부 뿐 아니라 암 조직의 침윤 정도, 전이 가능성 및 환자의 생존율을 포함하는 종합적인 예후를 정확하게 예측함으로써 치료 전략을 조기에 수립하고 대장암 환자의 생존률을 현저히 향상시킬 수 있는 중요한 임상 정보를 제공할 수 있다.

도 1은 대장직장암에서 코호트-특이적 DNA 메틸화 바이오마커 선정과정을 보여주는 모식도이다. TCGA에서 다운로드받은 5대 주요 위장관암(COAD, READ, LIHC, STAD 및 PAAD)의 Illumina Infinium 450 K 어레이 데이터를 전처리하고(A), 이후 10,754개의 상이하게 메틸화되는 CpG 섬(CGI)을 기준에 따라 상위권 나열한 뒤(B), NimbleDesig를 이용하여 선정된 CGI를 타겟팅하는 혼성화 프로브 풀을 설계한다(C). 한국 코호트의 CRC 환자 104명에 대해 표적화된 비설파이트 시퀀싱을 수행한다(D). 표적화된 비설파이트 시퀀싱 데이터를 분석하여 건강한 조직과 비교하여 종양 조직에서 상이하게 메틸화된 영역(DMR)을 선정한다(D).
도 2는 상이한 유전자 발현 및 CRC 환자 생존률 간의 관계에 기반하여 DNA 메틸화 바이오마커 후보 유전자를 특정한 결과를 보여주는 그림이다. 도 2a에서 보는 바와 같이, 표적화된 비설파이트 시퀀싱 데이터에서 상이하게 메틸화된 CGI에 대한 지놈 내 위치 분석을 통해 대부분의 과메틸화된 영역이 프로모터 영역과 유전자내 영역에 고르게 분포되어 있음에도, 저메틸화된 영역은 유전자내 영역에 더 많이 존재함을 확인하였다. 본 발명자들은 과메틸화된 유전자내 영역에 초점을 맞추었다. 도 2b는 TCGA에서 다운로드된 발현 데이터(리드 카운트)를 조사하여 종양에서 증가된 유전자를 동정한 결과이다. 다운로드된 RNA-seq 데이터는 DESeq2로 프로세싱하였다. 도 2c는 7개의 증가된 후보 유전자의 발현을 TPM으로 나타낸 그림이다. 이들의 상이한 발현 양상을 추가적으로 입증하였으며, 통계적 유의성이 없는 유전자는 다운스트림 분석에서 제외되었다. ns: 유의성 없음, *: p <0.05, **: p <0.01, ***: p <0.001. 도 2d는 6개의 증가된 유전자들에 대한 카플란-마이어 생존 곡선으로, 이를 통해 상기 유전자가 고발현된 환자(상위 25%)와 중간 또는 저발현된 환자(하위 75% 환자) 간의 차이점을 확인하였다. 유전자 발현 및 임상 데이터는 TCGA-COAD에 기반하였다.
도 3은 선정된 DNA 메틸화 바이오마커 후보 유전자가 세포 증식과 인 비트로 세포이동 촉진을 통해 종양 유전자의 특징을 가짐을 보여주는 그림이다. 도 3a는 CCK-8 시약을 이용한 세포 증식 시험 결과 PDX1, EN2 및 MSX1의 과발현이 HCT116 대장암 세포주의 증식을 촉진함을 보여준다. 각 유전자의 과발현은 FLAG-tag 캡쳐를 통해 확인하였다. 도 3b는 PDX1, EN2 및 MSX1를 과발현하는 HCT116 세포를 이용한 트랜스웰 침윤 어세이 결과이다. PDX1, EN2 및 MSX1의 과발현은 세포이동을 촉진하여 침윤 특성을 부여하는 것으로 나타났다.
도 4는 메틸화-특이적 PCR(MSP)에서 프라이머-결합부위 선정 및 프라이머 설계에 대한 최적화된 기준을 보여주는 그림이다. 도 4a-4c는 PDX1(도 4a), EN2(도 4b) 및 MSX1(도 4c)의 유전자내 CpG 섬에서의 MSP-타겟팅 지놈 영역을 각각 보여준다(노란 박스). 표적화된 비설파이트 시퀀싱 데이터의 건강한 조직 및 종양 시료에 대한 계층적 군집화를 통해 각 타겟영역에서 건강한 조직에 비해 종양조직이 과메틸화되었음을 확인하였다. 각 컬럼은 PDX1, EN2 및 MSX1C의 각 유전자내 CpG 섬 내의 CpG 부위 시토신에 상응한다. 저-퀄러티 시퀀싱 데이터는 제외되었다. 도 4d-4f는 설계된 MSP 프라이머의 메틸화 검출 및 정량 효율을 3개의 대장암 세포주(SW480, LoVo, HCT116)와 1개의 건강한 대장 세포주(CCD-18Co)를 통해 인 비트로에서 확인한 결과를 보여준다. 정량적-MSP(qMSP) 생성물에 대한 아가로스 젤 전기영동 결과 역시 설계된 프라이머가 메틸화 수준을 검출할 수 있음을 보여주었다. 도 4g-4i는 CCD-18Co 및 SW480 주형 DNA에 대한 qMSP를 통해 PDX1(도 4g), EN2(도 4h) 및 MSX1(도 4i) 메틸화에 대한 DNA 정량-의존적 신호 변화를 확인한 결과를 보여준다. Met: 모든 타겟 CpG 부위가 메틸화된 지놈 DNA에 결합하는 MSP 프라이머. Half-Met: 일부 타겟 CpG 부위가 메틸화된 지놈 DNA에 결합하는 MSP 프라이머. Unmet: 모든 타겟 CpG 부위가 메틸화되지 않은 지놈 DNA에 결합하는 MSP 프라이머. nd: 미정. *: p <0.05, **: p <0.01, ***: p <0.001.
도 5는 맞춤형 MSP 프라이머가 CRISPR/dCas9-gRNA 시스템으로 변이된 SW480 후보 바이오마커 내 메틸화 변화를 검출함으로 보여주는 그림이다. 도 5a는 본 발명에서 사용된 탈메틸화 유도 CRISPR/dCas9-gRNA 시스템의 모식도를 보여주는 그림이다. 도 5b, 5d 및 5f는 dCas9-TET1CD 모크 또는 PDX1(도 5b), EN2(도 5d) 및 MSX1(도 5f)에 특이적인 gRNA로 형질전환된 SW480 세포에 대한 qMSP 결과로서 설계된 프라이머가 CRISPR/dCas9-gRNA에 의한 메틸화 결핍 여부를 검출할 수 있음을 보여준다. 도 5c, 5e 및 5g는 dCas9-TET1CD 모크 또는 PDX1(도 5c), EN2(도 5e) 및 MSX1(도 5g)에 특이적인 gRNA로 형질전환된 SW480 세포에 대한 qPCR 결과로서 메틸화 감소가 유전자 발현 감소로 이어짐을 보여준다. qMSP 및 qPCR에 이용된 지놈 DNA 및 RNA는 세포주로부터 동시에 추출하였다.
도 6은 3개 유전자 메틸화 특징의 예후 마커로서의 가능성을 분석한 결과이다. 도 6a는 PDX1, EN2 및 MSX1의 유전자 내 CpG 섬의 DNA 메틸화 데이터에 대한 계층적 군집화 결과로서, CRC 환자에 대해 2개의 구별되는 서브그룹이 관찰되었다. 도 6b 및 6c는 하위그룹들 간 전체 생존기간(도 6b) 및 CRC 재발률(도 6c) 차이의 통계적 유의성을 분석한 카플란-마이어 플롯을 각각 나타낸 그림으로, 이를 통해 3개의 바이오마커의 메틸화 데이터가 예후 마커로 유효함을 알 수 있었다. 로그-순위 검정을 이용하여 2개 서브그룹 간의 통계적 차이를 비교하였다. 하나의 시료가 dal상 데이터 분실로 인해 분석에서 제외되었으며, 추가로 31명의 환자가 전이성 4기 CRC로 진단되어 재발 분석에서 제외되었다. 도 6d는 7명의 CRC 환자의 종양 조직 및 건강한 조직 유래 지놈 DNA를 이용하여 생성된 qMSP 데이터를 나타낸 그림으로, 상기 도 6a의 코호트-특이적 메틸화 변화 분석결과와 유사한 패턴을 보였다. PDX1, EN2 및 MSX1의 유전자내 CpG 섬의 상대적 메틸화 수준은 종양의 메틸화 수준을 건강한 조직의 그것으로 나눔으로써 계산하였다.
도 7은 TCGA Illumina 450K Array 데이터 전처리 과저을 나타낸 그림이다. NIH(National Institutes of Health)의 GDC 데이터 포털로부터 Cancer Genome Atlas의 Illumina Infinium 450 K 마이크로어레이 데이터를 다운로드받았다. 각 시료는 약 450,000개 프로브의 베타값을 포함하였다. CpG 섬의 메틸화값을 측정하기 위해, hg19에 따른 동일한 CpG 섬의 CpG 부위를 평균내었다. 종양 및 건강한 조직의 평균 간의 메틸화값의 차이를 계산하였으며, 전체 환자의 20% 이상에서 종양과 건강한 조직의 평균 간 메틸화 수준이 >20% 차이나는 CpG 섬을 선정하였다. 총 10,754개의 CpG 섬이 상이한 메틸화를 보였으며, 이를 이용하여 타겟팅 프로브를 설계하였다.
도 8은 표적화된 DNA 메틸화 시퀀싱 라이브러리 제작 과정을 보여주는 그림이다. CRC 코호트의 건강 조직 및 종양 조직 유래 지놈 DNA를 추출하였다. QC를 통과한 시료만을 사용하여 표적화된 비설파이트 시퀀싱 라이브러리를제작하였다. 각 지놈는 고처리(high-throughput) 시퀀싱에 표준적인 250-300 bp로 잘랐다. 잘린 지놈 DNA의 단일가닥 말단을 수리하고 A-테일링, 어댑터 라이게이션 및 크기 선정을 하였다. 지놈 DNA의 비설파이트 전환을 수행하여 비메틸화된 시토신을 메틸화된 것과 구분하고자 하였다. 비설파이트-전환된 지놈 DNA의 적절한 양을 회복하기 위해, 혼성화 후 PCR 증폭을 수행하였다. 각 증폭 단계 후, Agilent 2100 Bioanalyzer 시스템을 이용하여 PCR 산물의 양과 질을 확인하였다. 제작된 시료에 대해 Hiseq2500를 이용한 고처리 시퀀싱을 수행하였다.
도 9는 표적화된 비설파이트 시퀀싱 데이터의 사전 프로세싱 절차를 나타내는 모식도이다. Trimgalore(ver. 0.5.0)를 이용하여 표적화된 비설파이트 시퀀싱 데이터로부터 어댑터 서열을 잘라내고, Bismark 및 Bowtie2를 이용하여 시퀀싱 리드를 hg19 인간 참조 유전체에 정렬하였다. 이후 시퀀싱 리드를 분류하여 색인화하고 메틸화 수를 추출하였다. 리드 깊이 10 미만의 CpG 부위는 제외시켰다. CpG 부위의 메틸화값을 평균내어 CpG 섬의 메틸화값을 측정하였다.
도 10은 TCGA RNA-seq 데이터의 사전 프로세싱 절차를 나타내는 모식도이다. HT-seq에 의해 정렬된 데이터를 다운로드받았다. 각 RNA-seq 데이터는 매트릭스로 통합되었으며, 종양과 건강한 조직 간의 유전자 발현 차이는 DESeq2를 이용하여 계산하였다. 정규화된 유전자 발현 데이터(TPM 값)를 수득하기 위하여, STAR로 정렬된 RNA-seq 데이터의 스케일 추정값에 10⁶를 곱하였다.
도 11은 메틸화 바이오마커 후보 유전자의 발현 수준을 보여주는 그림으로, 표 1의 유전자의 TPM 값을 표시하였다. 건강한 조직 및 종양 대장 조직 내 후보 유전자의 RNA-seq 데이터는 TCGA에서 다운로드 받았으며, TPM 값은 RNA-seq 데이터의 스케일 추정값에 10⁶를 곱하여 계산하였다.
도 12는 PDX1, EN2, 및 MSX1 유전자내 CpG 섬의 MSP 타겟팅 지놈 영역을 보여주는 그림이다. 도 12a-12c는 후보 CpG 섬 내의 CpG 부위의 평균 DNA 메틸화 수준을 나타내는 선그래프 및 이들의 표적화된 MSP 프라이머 결합 부위를 보여준다. 플로팅에는 표적화된 비설파이트 시퀀싱 데이터가 사용되었다. 각 도의 좌측 패널에서 붉은 선과 파란 선은 건강한 시료와 종양 시료의 평균 메틸화 수준을 각각 나타낸다. 선그래프 상의 각 점은 CpG 섬에 포함된 CpG 부위를 나타낸다. 노란색 박스는 MSP 정방향 및 역방향 프라이머 결합부위를 나타낸다. 각 도의 우측 패널은 건강한 대장 조직 종양 조직 내 CpG 부위의 DNA 메틸화 상태를 나타낸다. 각 점은 CpG 부위를 나타내며, 각 점 내의 어두운 부분은 평균 메틸화 수준을 나타낸다.
도 13은 pPlatTET-gRNA2의 서브클로닝 결과를 나타낸다. 도 13a는 gRNA를 dCas9-TET1CD 벡터에 서브클로닝하는 과정을 나타내는 모식도이다. 도 13b는 서브클로닝 된 벡터의 파이로시퀀싱 결과를 나타낸 그림으로, 매뉴얼 검사를 통해 각 gRNA 코딩 서열을 확인하였다. 도 13c는 dCas9-TET1CD 벡터로 형질전환된 SW480 세포에서의 GFP 발현을 보여주는 그림이다.
도 14는 표적화된 비설파이트 시퀀싱 데이터로부터 도출되는 HOXA3-관련 CpG 섬에서의 메틸화 패턴을 보여주는 그림이다. HOXA3 의 7개 CpG 섬(chr7:27,163,819-27,164,098, chr7:27,162,087-27,162,426, chr7:27,154,999-27,155,426, chr7:27,153,187-27,153,647, chr7:27,150,030-27,150,418, chr7:27,147,589-27,148,389, chr7:27,146,069-27,146,600)에서의 DNA 메틸화 수준을 나타내었으며, 인간 참조 유전체 버전은 hg19이고, 데이터는 IGV 브라우저를 이용하여 시각화하였다. 막대그래프는 각 CpG 섬의 CpG 부위에서의 평균 메틸화 수준을 나타낸다.
도 15는 표적화된 비설파이트 시퀀싱 데이터로부터 도출되는 BCAT1-관련 CpG 섬에서의 메틸화 패턴을 보여주는 그림이다. BCAT1의 2개 CpG 섬 (chr12:25,101,607-25,102,073, chr12:25,055,599-25,056,246)에서의 DNA 메틸화 수준을 나타내었으며, 인간 참조 유전체 버전은 hg19이고, 데이터는 IGV 브라우저를 이용하여 시각화하였다. 막대그래프는 각 CpG 섬의 CpG 부위에서의 평균 메틸화 수준을 나타낸다.
도 16은 표적화된 비설파이트 시퀀싱 데이터로부터 도출되는 NDRG4-관련 CpG 섬에서의 메틸화 패턴을 보여주는 그림이다. NDRG4의 2개 CpG 섬(chr16:58,497,033-58,498,595, chr16:58,535,040-58,535,596)에서의 DNA 메틸화 수준을 나타내었으며, 인간 참조 유전체 버전은 hg19이고, 데이터는 IGV 브라우저를 이용하여 시각화하였다. 막대그래프는 각 CpG 섬의 CpG 부위에서의 평균 메틸화 수준을 나타낸다.
도 17은 표적화된 비설파이트 시퀀싱 데이터로부터 도출되는 SEPT9-관련 CpG 섬에서의 메틸화 패턴을 보여주는 그림이다. SEPT9의 3개 CpG 섬(chr17:75,277,317-75,278,172, chr17:75,368,688-75,370,506, chr17:75,447, 477-75,447,821)에서의 DNA 메틸화 수준을 나타내었으며, 인간 참조 유전체 버전은 hg19이고, 데이터는 IGV 브라우저를 이용하여 시각화하였다. 막대그래프는 각 CpG 섬의 CpG 부위에서의 평균 메틸화 수준을 나타낸다.
도 18은 표적화된 비설파이트 시퀀싱 데이터로부터 도출되는 BMP3-관련 CpG 섬에서의 메틸화 패턴을 보여주는 그림이다.
도 19는 표적화된 비설파이트 시퀀싱 데이터로부터 도출되는 IKZF1-관련 CpG 섬에서의 메틸화 패턴을 보여주는 그림이다.

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.

실시예

실험방법

Infinium 인간 TCGA 메틸화 450 마이크로어레이 데이터의 분석

표적화된 비설파이트 시퀀싱을 위한 지놈 DNA 후보 영역을 선정하기 위해, Infinium 인간 TCGA 메틸화 450 마이크로어레이 데이터를 GDC(Genomic Data Commons) 데이터 포털(https://portal.gdc.cancer.gov/) 상에서 5개의 주요 위장관암인 대장선암(COAD), 직장선암(READ), 간세포암(LIHC), 위선암(STAD) 및 췌장선암(PAAD)의 데이터를 다운받았다. 각 CpG 부위의 베타값을 평균내어 인간 참조 유전체 19 (hg19)에 따른 이들의 일치된 CpG 섬에 대한 메틸화 값을 나타내었다. 이후 건강한 조직 시료의 CpG 섬 메틸화 값을 평균내어, 종양 시료와 건강한 조직 시료의 평균값 간의 메틸화 차이를 도표화하였다. 마지막으로, 전체 환자의 20% 이상에서 정상 및 종양 조직 간 20% 이상의 메틸화 차이를 보이는 CpG 섬을 선정하였다.

혼성화 프로브의 설계

제조사의 설명서에 따라 프로브 풀(pool)을 설계하였다. 타겟 지놈에 대한 기본 정보는 다음과 같다: 적용 - SeqCap Epi, 생물 - Homo Sapiens, 유전체 구축-hg19/GRCh37. 이후 데이터를 적절한 BED(Browser Extensible Data) 포맷에서 NimbleDesign 소프트웨어(version 4.3; Roche Diagnostics, Rotkreuz, Switzerland)에 입력하였다. 전체 타겟 영역의 수는 18,834개이고, 해당 영역의 총 길이는 23,533,457bp 이다(프로브 설계번호: IRN4000028910).

대장직장 종양 및 인접한 정상 표본

총 104개의 대장직장 종양 및 이들 종양 조직과 인접한 건강한 조직을 서울대병원(SNUH; Seoul, Korea)으로부터 수득하였다. 시료의 사용은 서울대병원 연구윤리위원회의 승인을 받았으며 위원회 윤리규정을 준사하면서 수행되었다(IRB number: 1608-040-784).

표적화된 비설파이트 시퀀싱을 위한 시료의 제작

지놈 DNA(1μ를 사용하여 단일 표적화된 비설파이트 시퀀싱 라이브러리를 제작하였다. 건강한 조직 시료 및 종양 시료의 모든 지놈 DNA를 집속 초음파장치(M220; Covaris, Massachusetts, USA)로 절단하였다. 라이브러리를 제작하기 전에, 절단된 지놈 DNA의 양, 질 및 절편 크기(주요 피크는 250-300 bp)를 2100 Bioanalyzer 시스템(G2939BA; Agilent Technologies, California, USA)으로 측정하였다. 절단된 지놈 DNA를 말단 수리, A-테일링(Illumina NGS 플랫폼용 Kapa Library Prep Kit, 7137974001; Roche Diagnostics) 및 시퀀싱 어댑터 라이게이션 단계(SeqCap Adapter Kit A, 7141530001; Roche Diagnostics)를 통해 프로세싱하였다. Agencourt Ampure XP 비드(A63880, Beckman Coulter, California, USA)로 마무리한 뒤, DNA 라이브러리를 EZ DNA Methylation-Lightning 키트(D5031; Zymo Research, California, USA)로 비설파이트-전환하고 KAPA HiFi HotStart Uracil+ ReadyMix(NG SeqCap Epi Accessory Kit, 7145519001; Roche Diagnostics)와 Pre-LM-PCR Oligo를 이용하여 pre-capture PCR을 통해 증폭하였다. 증폭된 비설파이트-전환 라이브러리 시료의 질과 이들의 크기(주요 피크는 250-300 bp)는 Bio-Analyzer로 확인하였다. 각각의 증폭된 비설파이트-전환 라이브러리 1㎍을 SeqCap Epi universal 세트에서 합치고 올리고와 비설파이트 캡쳐 인핸서(SeqCap EZ HE-Oligo Kit A, 6777287001; Roche Diagnostics)를 색인화하였다. 각각의 풀(pool)을 DNA 진공 농축기(Modulspin 31; Hanil Science Co, Ltd, Daejeon, South Korea)로 순차적으로 동결건조하고 건조된 물질을 혼성화 완충액(SeqCap Epi Hybridization and Wash Kit, 5634253001; Roche Diagnostics)에서 재부유한 다음 프로브 풀(SeqCap Epi Choice S, 7138938001; Roche Diagnostics)과 72시간 동안 47℃에서 혼성화하였다. 뒤이은 인규베이션 동안 47℃ 수조에서 라이브러리를 캡쳐(SeqCap Pure Capture Bead Kit, 6977952001; Roche Diagnostics)하고 상온에서 정제하였다. 캡쳐된 비설파이트-전환 라이브러리를 post-capture PCR로 증폭하고 Ampure XP 비드로 세척하였다. 라이브러리의 질과 크기(250-300 bp에서 단일 피크)는 Bio-Analyzer로 확인하였고, QC (quality control)를 통과한 시료는 HiSeq2500(Illumina, California, USA)를 이용하여 이중말단(paired-end) 모드로 시퀀싱하였다.

표적화된 비설파이트 시퀀싱 데이터의 프로세싱 및 예비 스크리닝

Trim Galore(version 0.5.0)를 이용하여 표적화된 비설파이트 시퀀싱 데이터로부터 어댑터 서열을 제거하였다. 인간 CpG섬 참조 hg19 파일에 기반하여 Bismark를 통해 시퀀싱 리드를 Bowtie2로 정렬하였다. Samtool의 Sort 및 index 커맨드를 이용하였다. 각 CpG 부위의 메틸화된 시토신과 비메틸화된 시토신의 수는 Bismark 메틸화 추출기를 통해 측정하였고, 10X 또는 그 이상인 경우만 선정하여 다운스트림 분석에 사용하였다.

마지막으로, hg19 참조 파일에 기반하여 메틸화 값의 평균을 구함으로써 동일한 CpG 섬에 포함된 CpG 부위의 메틸화 값을 계산하였다. 이후의 분석은 평균값은 각 CpG 섬을 반영한다는 가정에 기반하여 수행하였다.

DNA 메틸화가 전체 90명의 환자 중 50% 이상에서 건강한 조직 시료에 비해 종양에서 30% 넘게 증가 또는 감소한 타겟에 대하여 표적화된 비설파이트 시퀀싱 데이터를 스크리닝하였다. 또한, 종양 시료에서 과메틸화된 CpG 섬을 추가적으로 필터링하여 건강한 조직 시료에서 30% 미만 또는 종양 시료에서 50% 이상의 DNA 메틸화를 보이는 영역을 검색하였다. 반면, 종양시료에서 평균 DNA 메틸화가 30% 미만이고 건강한 조직 시료에서는 50% 초과인 저메틸화된 CpG 섬을 선정하였다. 마지막으로, 건강한 조직 시료와 종양 간의 평균 DNA 메틸화 차이가 30%가 넘는 CpG 섬을 선별하였다.

표적화된 비설파이트 시퀀싱 데이터의 분석

건강한 조직 및 종양 시료 유래 후보 CpG 섬의 CpG 부위 메틸화 수준을 분석하기 위해, Samtool의 tabix 프로그램(version 1.9)을 이용하여 후보 CpG 섬 내 CpG 부위의 베타값을 추출하고, 인접 유전자의 동일가닥에서의 시토신의 베타값 만을 이후의 분석에 사용하여 최적의 MSP 타겟 부위를 탐색하고자 하였다. 저-퀄러티 시퀀싱 데이터를 걸러내기 위해 각 CpG 섬에서 CpG 부위의 메틸화 수준이 전체 CpG 부위의 1/3 이상인 시퀀싱 데이터만을 이용하였다. 각 시료의 메틸화 수준에 캔버라 거리를 이용한 계층적 군집화를 적용하였다. 동일한 메틸화 데이터를 R 소프트웨어의 ggplot2(version 3.3.3)과 ggsci(version 2.9)를 이용하여 선그래프로 나타내었다. 건강한 조직 및 종양 시료 간 후보 CpG 섬의 메틸화 차이를 나타내기 위해, p열지도를 이용하여 맨하탄 거리를 통한 계층적 군집화를 수행하였다. CRC 환자의 군집화는 각각 PDX1, EN2 및 MSX1 내의 3개의 후보 CpG 섬의 메틸화 데이터로 수행하였다. IGV를 이용하여, 건강한 조직 및 종양 조직 내 유전자의 평균 메틸화 수준과 관련된 데이터를 시각화하였다.

TCGA 대장 선암 RNA 시퀀싱 데이터의 분석

HTSeq로 정량화한 320개 리드 카운트 파일(건강한 조직시료=41, 종양시료=279)을 건강한 조직 및 종양 시료에서의 CRC 유전자 발현패턴 분석에 이용하였다. 각 리드 카운트는 매트릭스 포맷에 통합되었으며, R 소프트웨어의 DeSeq2 패키지(version 3.12)를 이용하여 건강한 조직과 종양 간 상이하게 발현되는 유전자의 목록을 만들었다. 한편, TCGA RNA-seq V2 데이터로부터 스케일 추정값을 이용하여 각 유전자의 TPM 값을 도출하였다. 2배가 넘는 변화를 보인 유전자로서 정상 및 종양 시료간 통계적 유의성(조정된 p-값<0.05)을 가지는 유전자를 최종 후부로 선정하였다.

카플란-마이어 생존률 평가

후보 유전자의 발현 수준에 따른 환자 생존률을 조사하기 위해, UALCAN 데이터베이스(http://ualcan.path.uab.edu/index.html)를 사용하였다. 관심 유전자를 특정 포맷으로 도표화하고 분석을 위한 적절한 암 형태를 미리 선정하였다. UALCAN 결과를 최종적으로 2개 그룹으로 분류하였다: (1) 검색 유전자의 고발현(상위 25%) 및 (2) 검색 유전자의 저/중간 발현(하위 75%). PDX1, EN2 및 MSX1의 유전자내 영역의 메틸화가 CRC에서의 예후적 마커로서 가능성을 가지는지를 평가하기 위해, R 소프트웨어의 survival(version 3.2-7), survminer(version 0.4.8) 및 ggplot2 패키지(version 3.3.3)를 사용하였다. CRC 환자에 대한 암재발 분석에서 무진행 생존 및 생존 분석에서 전체 생존기간(OS)을 평가하였다. 생존 비율의 통계적 유의성은 logrank 검정을 이용하여 계산하였다.

과발현 컨스트럭트

각 후보 유전자의 과발현 컨스트럭트를 pcDNA3-N-FlagNLRP3 벡터로부터 서브클로닝하였다. 삽입 절편을 수득하기 위해, NCBI(National Center for Biotechnology Information)를 참조하여 HCT116 및 SW480 cDNA 상의 타겟 서열을 특이적으로 증폭시키는 PCR 프라이머를 설계하였다. 타겟 유전자는 수많은 CpG 부위를 가지므로, 타겟 앰플리콘의 녹는점(Tm)은 자연적으로 상승하여 PCR 반응을 방해한다. 따라서, 주형 DNA의 이중가닥 구조를 완전히 분리시키기 위해 PCR 수행 전 HCT116 및 SW480 cDNA를 10분간 미리 가열하였다.

세포 배양

대장암 세포주인 HCT116, LoVo, SW480는 연세대학교 황선순 교수로부터 제공받았으며, 건강한 대장 섬유아세포주인 CCD-18Co는 한국세포주은행(KCLB)에서 구입하였다. HCT116, LoVo 및 SW480 세포를 10% 우태아 혈청(SH30084.03; Hyclone)이 보충된 RPMI 1640 배지(11875119; Gibco)에서 유지하고, CCD-18Co를 DMEM(DMEM/고 글루코스, L-글루타민, 피루브산나트륨, 페놀 레드, SH30243.01; Hyclone)에서 10% FBS와 함께 배양하였다. 모든 세포주는 37℃, 5% CO₂의 가습 인큐베이터에서 배양하였다. 후보 유전자의 인 비트로 과발현을 위해, HCT116 세포를 60mm 배양 접시에 씨딩하고 Lipofectamine 2000 (11668019; Thermo Fisher Scientific, Massachusetts, USA)을 이용하여 공벡터 또는 후보 유전자 컨스트럭트로 형질도입하였다. 각 과발현 컨스트럭트의 형질도입 효율은 태그에 대한 웨스턴 블롯팅으로 확인하였다. Lipofectamine 3000(L3000015; Thermo Fisher Scientific)을 통해 SW480 세포에 dCas9-TET1 컨스트럭트를 형질도입하여 형질도입 효율을 증가시켰다.

형질도입 효율은 형광현미경(Cell Imaging System, fl_AMF-4306; EVOS)으로 GFP를 검출함으로써 확인하였다. DNA 메틸화 상태와 mRNA 발현 수준을 동시에 검출하기 위해, AllPrep DNA/RNA 미니 킷(80204; Qiagen)을 이용하여 단일 시료로부터 지놈 DNA와 총 RNA를 추출하고, qMSP 및 qPCR에 각각 사용하였다.

웨스턴 블롯팅

공벡터에 비해 후보 유전자가 과발현됨을 확인하기 위해 각 컨스트럭트의 N-말단의 FLAG-tag를 면역블롯팅하는 웨스턴 블롯팅을 α-flag(F7425-.2MG; Sigma-Aldrich) 및 α-GAPDH(SC-25778; Santa Cruz, Texas, USA)에 대한 항체를 사용하여 수행하였다.

세포 증식 어세이

총 1 x 10⁵개의 HCT116 세포를 유전자 컨스트럭트로 24시간 동안 형질도입 후 24-웰 플레이트에 씨딩하였다. 세포 생존능은 Cell Counting kit-8 (CK04-11; Dojindo, Kumamoto, Japan) 및 마이크로플레이트 리더(Molecular Devices, LLC)를 이용하여 450 nm에서 지정된 각 시점에 측정하였다.

침윤 어세이

24-웰 트랜스웰 플레이트(포어 크기 8μm, 3422; Costar)에서 침윤 어세이를 수행하였다. 침윤 어세이를 위해, 2 x 10⁵개의 HCT116 세포를 유전자 컨스트럭트로 24시간 동안 형질도입하고 마트리젤-코팅된 상부 챔버에 씨딩하였다. 상부 챔버를 무혈청 RPMI 배지로 채워 넣고, 하부 챔버는 화학유인물질로서 혈청이 보충된 RPMI 배지를 채워넣었다. 48시간 동안 배양한 뒤, 막을 통과하여 침투하지 못한 세포들을 제거하고 침투된 세포를 크리스탈 바이올렛으로 염색한 뒤 계수하였다.

MSP 프라이머 설계

후보 CpG 섬의 DNA 과메틸화를 인 비트로에서 검증하기 위해, MSP 프라이머 설계를 위한 다음의 기준을 이용하였다. 먼저, 역방향 및 정방향 프라이머 간의 Tm 차이는 2℃ 미만이다. Oligo Calc(version 3.27)을 이용하여 계산된 Tm은 55℃에서 60℃ 사이로 세팅되었다. 프라이머 길이는 22 bp에서 33 bp로 지정되었고, PCR 앰플리콘의 예상 크기는 100 bp 내지 160 bp로 세팅되었다[25]. 또한, 표적화된 비설파이트 시퀀싱 데이터에서의 DNA 메틸화 상태와 관련하여, MSP 프라이머가 프라이머 결합 영역에서 최소 6개의 CpG 부위를 포함하도록 설계하였다. 마지막으로, CpG 부위의 2/3 이상이 메틸화되고 건강한 조직에서는 20% 미만이, 종양 조직에서는 50% 초과가 메틸화된 영역을 프라이머 결합 타겟으로 선정하였다. 메틸화되거나(Met) 또는 비메틸화된(Unmet) CpG 부위에 결합하는 MSP 프라이머 세트를 상술한 기준에 따라 설계하였다. 아울러, 부분적으로 메틸화된 CpG 부위(Half-Met)에 결합하는 프라이머도 포함시켰다.

정량적인 메틸화-특이적 PCR (qMSP)

타겟 유전자의 DNA 메틸화 수준을 측정하기 전에, 대장직장 세포주 또는 CRC 환자에게서 추출한 500 ng의 지놈 DNA에 아황산나트륨(EZ DNA Methylation Lightning Kits, D5031; Zymo Research)을 처리하였다. 비설파이트-전환된 지놈 DNA의 농도를 UV 분광 광도계(Nanodrop 2000; Thermo Fisher Scientific)로 측정하였다. qMSP 반응에서, KAPA SYBR FAST qPCR Master Mix(2X)(KK4608; Kapa Biosystems)를 사용하여 PCR 사이클러(LightCycler 480 II; Roche Diagnostics)를 통해 GC-풍부 PCR을 촉진하였다. 신호 역치를 조정함으로써 교차점(Cp) 값을 계산하였다. 각 CpG 섬의 DNA 메틸화 수준은 다음의 식으로 계산하였다: (메틸화 수준)=2^{(Cp of Unmet) - (Cp of Met)}.

CRISPR/dCas9-TET1 컨스트럭트

Chopchopv2를 통해 100bp의 MSP 프라이머 결합부위 내에서 gRNA 타겟팅 부위를 선정하고 가장 적은 오프-타겟 부위와 가장 높은 타겟팅 효율을 기준으로 추가적인 필터링을 하였다(Labun et al., 2016). 클로닝 과정은 Mali P의 gRNA 클로닝 프로토콜(Mali et al., 2013; Morita et al., 2016)에 따라 수행되었다. 깁슨(Gibson) 라이게이션은 클로닝 킷(639649; Takara Bio Inc., Shiga, Japan)을 이용하여 수행되었으며, 클로닝된 gRNA 서열은 파이로시퀀싱으로 확인하였다.

정량적 PCR (qPCR)

dCas9에 의한 탈메틸화 상황에서 각 후보 유전자의 발현을 확인하기 위해, 역전사 효소(18090050; Invitrogen)를 이용하여 총 RNA로부터 상보적 DNA를 합성하였다.

실험결과

표적화된 비설파이트 시퀀싱을 통한 CRC 조직 내 상이하게 메틸화된 영역의 동정

CRC 및 다른 암종에서의 메틸화 수준을 관찰하기 위해, TCGA로부터 5개 암종(COAD, READ, LIHC, AD 및 PAAD)에 대한 450 K 마이크로어레이 데이터를 수집하였다(도 1a). 각 CpG 부위의 베타값을 평균내어 인간 참조 유전체 19 (hg19)에 따른 메틸화 값을 나타내었다. 선정된 CpG 섬에 대해 다음 2가지 기준에 따른 추가적인 필터링을 하였다: 첫째, 건강 조직과 종양 조직 간의 메틸화값 차이는 20% 이상일 것; 둘째, 이러한 차이는 20% 이상의 암 환자에서 나타날 것. 이를 통해 10,754개의 상이하게 메틸화된 CpG 섬(도 1b 및 도 7)을 수득하였다. 선정된 CpG 섬을 통해 NimbleDesign(Roche)을 이용하여 프로브를 설계하였다(도 1c).

다음으로, 프로브 툴을 이용하여 CRC 조직에서 비설파이트 시퀀싱을 수행하였다. 이를 위해, 104명의 한국인 CRC 환자의 조직(90쌍의 종양 및 인접한 건강한 조직, 추가적인 2개의 건강한 조직과 12개 종양 조직)으로부터 지놈 DNA를 수득하였다. 제조사의 설명서(Roche)에 따라 표적화된 비설파이트 시퀀싱 라이브러리를 제작하고(도 1d 및 도 8), 시퀀싱을 수행하였다. 194개 CRC 조직에 대한 표적화된 비설파이트 시퀀싱을 통해 CpG 부위의 베타값을 수득하여 평균을 냄으로써 이들의 각 상응하는 CpG 섬의 메틸화 값을 도출하였다(도 9). 이후, 데이터에 보다 엄격한 기준을 적용하였다: 첫째, 종양 및 인접한 건강한 조직(동일환자 유래) 간 CpG 섬의 메틸화 값 차이는 30%를 넘을 것; 둘째, 이러한 차이는 50% 이상의 환자에서 나타날 것; 셋째, 종양 및 건강한 조직 간 메틸화 값 차이가 30%를 넘더라도, 신호-잡음 비율을 극대화함으로써 MSP를 용이하게 최적화하기 위해 낮은 값은 30% 미만이어야 함; 마지막으로, 몇몇 환자에게만 특이적이지 않은 상이하게 메틸화된 영역을 발굴하기 위해, 건강한 조직 및 종양 조직의 전체적 평균을 계산한 뒤, 30%가 넘는 차이를 보이는 영역을 선정하였다(도 1e).

최종적으로 본 발명자들은 종양 조직에서 상이하게 메틸화되는 40개의 CpG 섬을 선정하였다(35개 과메틸화 영역+ 5개 저메틸화 영역). 예를 들어 염색체 7: 27,147,589 - 27,148,389의 지놈 상 위치는 HOXA3의 유전자내 영역이며, 67개의 CpG 부위가 위치한다. 평균적으로 이 영역에서의 메틸화 수준은 건강한 조직에서 29%인 반면 종양 조직에서는 78.7%로 나타났다. 이러한 차이는 83.3%의 CRC 환자(90명 중 75명)에게서 관찰되었다(표 1).

90명의 CRC 환자의 표적화된 비설파이트 시퀀싱 데이터로부터 선정된 후보 CpG 섬 및 이들의 매칭 유전자.

CGI_위치	CGI_정보	유전자	30%_Diff	McoM	McaM	(McaM- McoM)
chr7:27147589- 27148389	유전자내	HOXA3	83.3% (75/90)	29.0	78.7	49.7
chr7:27146069- 27146600	유전자내	HOXA3	82.2% (74/90)	26.0	74.0	48.0
chr19:49669275-49669552	유전자내	TRPM4	81.1% (73/90)	24.2	73.7	49.5
chr2:54086776- 54087266	프로모터	GPR75- ASB3	80% (72/90)	23.9	74.3	50.3
chr1:200010625-200010832	유전자내	NR5A2	78.9% (71/90)	9.1	57.7	48.7
chr13:28498226-28499046	유전자내	PDX1	72.2% (65/90)	9.1	55.0	45.9
chr5:140857864-140858065	유전자내	PCDHGA2	72.2% (65/90)	17.3	62.8	45.5
chr7:27182613-27185562	프로모터	HOXA- AS3	71.1% (64/90)	21.4	62.6	41.2
chr19:48918115-48918340	유전자내	GRIN2D	69.9% (58/83)	10.7	53.1	46.2
chr5:140864527-140864748	프로모터	PCDHGA2	68.9% (62/90)	9.1	52.3	43.1
chr5:134363092-134365146	유전자내	PITX1	67.8% (61/90)	21.5	59.8	38.3
chr7:158936507-158938492	프로모터	VIPR2	65.6% (59/90)	12.4	50.1	37.7
chr6:62995855- 62996228	프로모터	KHDRBS2	63.3% (57/90)	11.7	51.3	39.6
chr6:10398573-10398812	유전자내	TFAP2A	63.3% (57/90)	16.1	53.0	36.9
chr7:27143181- 27143479	유전자내	-	63.3% (57/90)	26.0	62.6	36.7
chr7:24323558-24325080	프로모터	NPY	63.3% (57/90)	16.5	52.7	36.2
chr8:97171805-97172022	프로모터	GDF6	63.3% (57/90)	19.8	53.5	33.7
chr13:53313127-53314045	프로모터	CNMD	62.2% (56/90)	15.6	50.9	35.3
chrX:142721410-142722958	프로모터	SLITRK4	60.7% (54/89)	19.2	54.8	35.5
chr7:155255098-155255311	유전자내	EN2	60% (54/90)	17.0	52.2	35.2
chr13:102568425-102569495	프로모터	FGF14	60% (54/90)	15.6	50.6	35.0
chrX:66766037-66766279	유전자내	AR	58.9% (53/90)	20.3	55.8	35.5
chr9:37002489-37002957	프로모터	PAX5	58.9% (53/90)	22.1	56.3	34.1
chrX:101906001- 101907017	프로모터	ARMCX5- GPRASP2	57.8% (52/90)	21.6	58.2	36.6
chr4:111549879- 111550203	유전자내	PITX2	57.8% (52/90)	22.9	53.7	30.8
chr4:4864456-4864834	유전자내	MSX1	57.3% (51/89)	29.7	64.3	35.3
chr8:72753874-72754755	프로모터	MSC	56.7% (51/90)	26.7	58.7	32.0
chr19:46915311-46915802	유전자내	CCDC8	55.6% (50/90)	17.7	52.1	34.5
chr8:130995921-130996149	유전자내	FAM49B	54.4% (49/90)	20.9	53.1	32.1
chr2:98962873-98964187	프로모터	CNGA3	54.4% (49/90)	19.6	51.7	32.1
chr2:5836068-5837643	유전자내	SOX11	54.4% (49/90)	20.8	51.7	30.9
chr11:65359292- 65360328	유전자내	EHBP1L1	53.3% (48/90)	26.6	58.0	31.4
chr6:108495654- 108495986	유전자내	NR2E1	53.3% (48/90)	21.5	52.0	30.5
chr1:120905971-120906396	프로모터	HIST2H2B A(H2BP1)	53.3% (48/90)	28.8	59.1	30.3
chr13:70681732-70682219	프로모터	KLHL1	50% (45/90)	25.1	55.5	30.4
chr16:87441387-87441671	유전자내	ZCCHC14	78.9% (71/90)	77.98	28.81	-49.17
chr7:5342299-5342599	유전자내	SLC29A4	77.8% (70/90)	73.15	26.40	-46.75
chr20:33762403- 33762774	유전자내	PROCR	66.7% (60/90)	68.94	29.90	-39.04
chr1:235805318- 235805771	유전자내	GNG4	56.7% (51/90)	62.69	29.03	-33.66
chr2:233925091-233925318	프로모터	INPP5D	57.8% (52/90)	52.94	20.31	-32.63

*McoM: 대조군(건강) 시료 메틸화의 평균값, **McaM: 환자(암) 메틸화의 평균값

CRC 바이오마커 개발을 위한 후보 유전자의 선정

메틸화 위치는 메틸화 양상과 유전자 발현 간의 관계에 있어 중요한 변수가 된다[19, 26-28]. 그러나, 프로모터 영역의 과메틸화가 유전자 발현을 억제함은 잘 알려진 반면[29], 유전자내 영역의 메틸화가 유전자 발현에 미치는 영향은 명확하지 않다[30-36].

상이하게 메틸화되는 40개의 CpG 섬을 분석한 결과, 종양에서 과메틸화된 35개의 영역 중 16개 CpG 섬은 프로모터 영역에, 18개는 유전자내 영역에, 1개는 유전자간(intergenic) 영역에 위치하였다. 5개의 저메틸화된 영역 중 하나는 프로모터 영역, 4개는 유전자내 영역에 위치하였다(도 2a 및 표 1).

본 발명자들은 발굴된 40개의 상이하게 메틸화된 CpG 섬에서 메틸화 상태를 조사하는 시스템을 개발하고자 하였다. 이를 위해, 어떠한 영역의 메틸화 변화가 해당 유전자의 발현 변화와 직접적으로 관련되는지를 조사하였다. 건강한 조직에 비해 종양 조직에서 메틸화와 유전자 발현이 모두 증가할 경우 검출이 보다 용이할 것이라 예상하였다. 유전자간 영역이 유전자 발현에 영향을 미치기는 어려우며, 프로모터에서의 과메틸화가 유전자 발현 감소로 이어진다는 사실은 이미 잘 알려졌기 때문에, 본 발명자들은 유전자내 영역 중 과메틸화된 영역에 대해 추가적으로 조사하고자 하였다. 유전자 발현을 조사하기 위해, 본 발명자들은 대장 선암에 대한 TCGA RNA-seq 데이터세트를 이용하였다(도 10). 18개의 과메틸화된 유전자내 영역 중 2개 영역은 HOXA3 유전자에 포함되어 있었으므로, 17개 유전자의 발현을 조사하였다. DeSeq2에 의해 분석된 데이터에 따르면, 7개 유전자(PDX1, GRIN2D, PITX1, TFAP2A, EN2, MSX1 및 NR2E1)의 발현 만이 2배 이상 증가하였다(도 2b). 7개 유전자의 발현 증가를 검증하기 위해 다른 후보 유전자의 발현도 TPM 값으로 조사하였으며, NR2E1는 통계적 유의성이 없어 제외시켰다(도 2c 및 도 11).

다음으로, 6개 유전자의 발현과 CRC 환자의 생존률 간의 관계를 조사하였다. UALCAN 분석 결과[37], PDX1, EN2 및 MSX1의 고발현은 환자 생존률과 음의 상관관계를 보였다(도 2d). 이에, 본 발명자들은 이들 3개 유전자에 초점을 맞추었다.

PDX1, EN2 또는 MSX1의 과발현은 인간 대장암 세포의 증식과 침윤을 촉진한다.

PDX1(Pancreatic and duodenal homeobox 1)는 췌장 발달 및 베타-세포 성숙화에 중요한 전사인자이다[38]. PDX1은 췌장암 세포에서 과발현되나, 이의 역할은 암의 각 단계별로 상이하다[39-41]. PDX1가 이미 CRC에서의 유망한 암 마커로 보고되었으나, 이는 암세포의 PDX1 발현 양상에 기반한 것일 뿐 이의 기능은 아직 자세히 연구된 바가 없다. EN2(Homeobox protein engrailed-2)는 많은 발달 단계를 조절하는 homeobox 함유 전사인자이다[42]. 최근, EN2는 CRC에서 CCL20를 경유하여 종양 진행에 역할을 하는 것으로 보고되었다[43]. MSX1(Msh homeobox1) 역시 homeobox 함유 전사인자로서 CRC에 대한 mRNA 바이오마커로 제안되었으나, 이는 발현양상 관찰에 기반한 가설일 뿐 역시 CRC에서 세포 수준의 기능은 밝혀진 바가 없다[44].

본 발명자들은 각 유전자를 HCT116 대장암 세포주에 일시적으로 형질감염시킨 뒤 CCK-8을 이용하여 세포 증식을 측정한 결과, PDX1, EN2 및 MSX1의 과발현은 세포 증식을 증가시켰으며(도 3a), 트랜스웰 어세이 결과 PDX1, EN2 및 MSX1는 HCT116 세포의 이동을 유의하게 촉진시켰다(도 3b).

이를 종합하면 PDX1, EN2 및 MSX1의 과발현은 CRC 세포의 증식과 이동에 직접적으로 관련되어 있으며, 이들 유전자의 유전자내 영역에서의 메틸화 변화가 유전자 발현 변화로 이어진다면, 본 발명의 마커 영역에서의 메틸화 검출을 통해 세포의 상태를 예측할 수 있을 것으로 기대되었다.

메틸화 변화 검출에 최적화된 MSP 프라이머의 설계

본 발명의 마커 영역에서의 메틸화 변화를 검출하기 위해, 각 영역에 대한 qMSP를 수행하고자 하였다. MSP는 PCR-기반 증폭 방법이므로, 프라이머 영역의 선정이 매우 중요하다. 만약 정방향 및 역방향 프라이머가 가능한 많은 CpG 부위를 포함할 경우 건강한 조직과 종양 조직 간의 메틸화 차이가 두드러지겠지만, 동일한 장비에서 메틸화된 프라이머와 비메틸화된 프라이머로 PCR을 수행하는 것이 바람직하므로 너무 많은 CpG 부위는 메틸화된 프라이머와 비메틸화된 프라이머 간의 Tm 차이를 유발할 수 있다. 끝으로, 효율적인 증폭을 위해 앰플리콘 길이가 100-160 bp가 되도록 하였다. 종국적으로, 많은 시행착오 끝에 정방향 및 역방향 프라이머는 총 최소 6개의 CpG 부위를 가지며, 각 프라이머의 Tm은 55-60℃이고, 앰플리콘 길이는 100-160 bp여야 하는 것으로 결정되었다.

PDX1의 유전자내 CpG 섬(chr13: 28, 498, 226-28, 499, 046)에 특이적인 MSP 프라이머를 설계하기 위해, 80개의 개별적인 CpG 부위의 메틸화 변화를 조사하였다. 대부분의 CpG 부위가 종양과 건강한 조직 간 메틸화 변화 차이가 컸지만, 상술한 본 발명의 기준을 만족하는 영역을 선별하기 위하여 후보 CpG 섬 내 각 CpG 부위의 메틸화 수준에 대한 열지도 및 선 그래프를 토대로 MSP 프라이머를 설계하였다(도 4a 및 12a). 타겟 CpG 섬의 동일한 가닥의 메틸화 수준이 중요하므로, 센스 가닥의 CpG 부위의 메틸화 수준에 초점을 맞추었다.

PDX1에 대한 정방향 프라이머는 4개의 CpG 부위를 가지며, 역방향 프라이머는 3개의 CpG 부위를 가진다. 이들 7개 CpG 부위의 베타값은 정상 조직에서 평균 약 10%이나 종양조직에서는 70%이다. 앰플리콘 크기는 126 bp 및 123 bp이고 Tm은 55-57℃이다(도 4a 및 도 12a).

EN2 및 MSX1에 대한 MSP 프라이머도 유사한 방식으로 설계되었다. 요약하면, EN2의 정방향 및 역방향 프라이머는 각 3개의 CpG 부위를 가진다. 이들 총 6개 CpG 부위의 베타값은 정상 조직에서 평균 약 10%이고 종양조직에서는 70%이다. 앰플리콘 크기는 127 bp 및 112 bp이고 Tm은 57-58℃이다(도 4b 및 12b). MSX1의 경우 정방향 및 역방향 프라이머는 각 3개의 CpG 부위를 가진다. 6개 CpG 부위의 베타값은 정상 조직에서 평균 약 10%이고 종양조직에서는 70%이다. 앰플리콘 크기는 151 bp 및 144 bp이고 Tm은 55-57℃이다(도 4c 및 12c).

MSP 프라이머는 관심 영역의 메틸화 상태를 효율적으로 검출한다

본 발명의 MSP 프라이머는 총 6개 또는 7개의 CpG 부위를 가지므로, 시토신이 유지되거나(메틸화 프라이머) 또는 모든 시토신이 티민으로 변환된 프라이머(비메틸화된 프라이머) 뿐 아니라 절반의 시토신이 티민으로 변환된 프라이머(반-메틸화 프라이머)도 제작하였다. 이들 프라이머를 이용하여, 정상 대장 세포주인 CCD-18Co 및 대장암 세포주인 SW480, LoVo 및 HCT116 유래 비설파이트-처리된 지놈 DNA로 qPCR을 수행하였다.

SW480, LoVo 및 HCT116세포에서는 각 CpG 섬에서 메틸화 프라이머에 의해 증폭 산물이 수득되었으나 CCD-18Co에서는 그렇지 않았다. 반면, 비메틸화된 프라이머는 CCD-18Co에서 검출되었으나 SW480, LoVo 및 HCT116 세포에서는 그렇지 않았다. 반-메틸화 프라이머는 CCD-18Co, SW480, LoVo 및 HCT116 간 명확한 차이를 보여주지 못했다(도 4d-f). 메틸화 프라이머 값 또는 반-메틸화 프라이머 값을 비메틸화된 프라이머 값으로 나눔으로써 메틸화 수준을 정량적으로 계산하였다. SW480, LoVo 및 HCT116는 메틸화 프라이머 사용 시 CCD-18Co에 비해 유의하게 높은 메틸화 수준을 보였으나 반-메틸화 프라이머 사용시엔 그렇지 않았다(도 4d-f). 다음으로 메틸화 프라이머가 얼마나 민감하게 암세포와 정상세포를 구분하는지를 주형 DNA의 양의 측면에서 조사한 결과, qMSP를 이용하여 CCD-18Co 및 SW480 간의 상이한 메틸화 수준을 관찰하였으며, pdx1의 경우 0.5 ng의 주형 DNA만으로도 충분히 차이를 관찰할 수 있었다(도 4g-4i).

이러한 결과로부터, 본 발명의 MSP 프라이머가 암세포와 정상세포를 매우 효율적으로 구분할 수 있음을 확인하였다. 반-메틸화 프라이머가 정상세포 및 암세포 간 메틸화 수준이 상이한 4개의 CpG 부위를 가지고 있음에도 MSP 수행시 명확한 차이점이 보이지 않았는데, 이는 충분한 CpG 부위를 가진 MSP 프라이머 만이 실질적으로 구분되는 결과를 도출할 수 있음을 말해준다.

본 발명의 MSP 프라이머는 메틸화 상태의 동적 변화를 검출할 수 있다

다음으로, 세포주 데이터가 고정된 메틸화 값으로 인해 생리적인 메틸화 변화를 반영하는 데 충분치 못할 수 있다는 우려에서, 본 발명의 MSP 프라이머가 메틸화 수준의 동적인 변화를 구분할 수 있는지를 확인하고자 하였다. 메틸화 변화를 유도하기 위해 위치-특이적으로 메틸화 수준을 감소시킬 수 있는 CRISPR/dCas9-TET1 시스템(이하 dCas9-TET 시스템)을 사용하였다(도 5a)[45]. MSP 프라이머 결합 부위의 100 bp 내 gRNA 타겟팅 부위를 탐색하고 Chopchopv2로 선정한 뒤, gRNA를 dCas9-TET 컨스트럭트로 서브클로닝하였다(도 13a-13b).

dCas9-TET 시스템을 PDX1 지놈 영역에 도입한 뒤(도 13c), 7개의 CpG 부위를 함유하는 본 발명의 메틸화 프라이머를 이용하여 메틸화 수준의 유의한 감소를 확인하였다. 그러나, 반-메틸화 프라이머를 이용한 경우 이러한 차이점은 관찰되지 않았다(도 5b). 유전자내 영역의 메틸화 수준이 감소함에 따라 PDX1 발현이 유의하게 감소함이 관찰되어 메틸화 변화가 유전자 발현 변화에 직접적으로 관련되었음을 알 수 있었으며(도 5c), EN2 및 MSX1에서도 유사한 결과를 얻었다(도 5d-g). 이에, 본 발명의 메틸화 프라이머가 유전자 발현 변화에 선행하는 메틸화 변화를 검출할 수 있을 정도로 충분한 민감성을 가짐을 확인할 수 있었다.

PDX1, EN2 및 MSX1의 메틸화 수준을 통해 CRC 전이를 예측할 수 있다.

다음으로, PDX1, EN2 및 MSX1의 유전자내 CpG 영역의 메틸화 수준이 임상적 의미를 가지는지를 조사하였다. 맨하탄 거리를 이용한 계층적 군집화를 통해 환자를 이들 유전자의 메틸화 수준에 기반하여 분류하였다. 결론적으로, 과메틸화된 그룹(그룹 1, N=26)과 중간- 및 저-메틸화된 그룹(그룹 2, n=61)의 두 그룹을 형성하였다(도 6a). 흥미롭게도, 이들 두 그룹은 OS(도 6b)와 PFS(도 6c)에서 큰 차이를 보였다. 또한, 이러한 정보를 환자에 적용한 결과, 다수의 4기(전이 후) 환자는 그룹 1에 속한 반면, 다수의 3기(전이 전) 환자는 그룹 2에 속했다(표 2). 이를 통해 PDX1, EN2 및 MSX1 메틸화 수준이 CRC 환자의 예후를 예측할 수 있음을 확인하였다.

마지막으로, 본 발명의 MSP 시스템이 이들 두 환자 그룹을 구별할 수 있는지를 조사하였다. 7명 환자의 종양조직 유래 비설파이트-처리 지놈 DNA를 이용하여 qMSP를 수행한 결과, 그룹 1의 환자 2명이 PDX1, EN2의 유전자내 영역에서 더 높은 메틸화 수준을 보였다.

2개 하위그룹의 연령은 양측 t-검정을 통해 비교하였으며, 다른 파라미터는 카이제곱 검정으로 분석하였다.

이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

참고문헌

1. Global Cancer Observatory: Cancer Today. [https://gco.iarc.fr/today]

2. Day DW: Scand J Gastroenterol Suppl 1984, 104:99-107.

3. Dekker E, Tanis PJ, Vleugels JLA, Kasi PM, Wallace MB: The Lancet 2019, 394:1467-1480.

4. Vogelstein B, Kinzler KW: Nat Med 2004, 10:789-799.

5. Zecchin D, Boscaro V, Medico E, Barault L, Martini M, Arena S, Cancelliere C, Bartolini A, Crowley EH, Bardelli A, et al: Mol Cancer Ther 2013, 12:2950-2961.

6. Schell MJ, Yang M, Teer JK, Lo FY, Madan A, Coppola D, Monteiro AN, Nebozhyn MV, Yue B, Loboda A, et al: Nat Commun 2016, 7:11743.

7. Xia LC, Van Hummelen P, Kubit M, Lee H, Bell JM, Grimes SM, Wood-Bouwens C, Greer SU, Barker T, Haslem DS, et al: Sci Rep 2020, 10:5009.

8. National Cancer Institute Surveillance E, and End Results Program.: Cancer stat facts: colorectal cancer.

9. Dashwood RH: Oncol Rep 1999, 6:277-281.

10. Force USPST, Bibbins-Domingo K, Grossman DC, Curry SJ, Davidson KW, Epling JW, Jr., Garcia FAR, Gillman MW, Harper DM, Kemper AR, et al: JAMA 2016, 315:2564-2575.

11. Feinberg AP, Vogelstein B: Nature 1983, 301:89-92.

12. Ehrlich M: Oncogene 2002, 21:5400-5413.

13. Rodriguez J, Frigola J, Vendrell E, Risques RA, Fraga MF, Morales C, Moreno V, Esteller M, Capell

G, Ribas M, Peinado MA: Cancer Res 2006, 66: 8462-9468.

14. Toyota M, Ahuja N, Ohe-Toyota M, Herman JG, Baylin SB, Issa J-PJ: Proceedings of the National Academy of Sciences 1999, 96:8681-8686.

15. T

K, Sipos F, Kalm

A, Patai AV, Wichmann B, Stoehr R, Golcher H, Schellerer V, Tulassay Z, Moln

B: PLoS One 2012, 7:e46000.

16. A stool DNA test (Cologuard) for colorectal cancer screening. Med Lett Drugs Ther 2014, 56:100-101.

17. Peterse EFP, Meester RGS, de Jonge L, Omidvari AH, Alarid-Escudero F, Knudsen AB, Zauber AG, Lansdorp-Vogelaar I: J Natl Cancer Inst 2021, 113: 154-161.

18. Koch A, Joosten SC, Feng Z, de Ruijter TC, Draht MX, Melotte V, Smits KM, Veeck J, Herman JG, Van Neste L, et al: Nat Rev Clin Oncol 2018, 15: 459-466.

19. Tse JWT, Jenkins LJ, Chionh F, Mariadason JM: Trends Cancer 2017, 3:698-712.

20. Jain S, Chen S, Chang KC, Lin YJ, Hu CT, Boldbaatar B, Hamilton JP, Lin SY, Chang TT, Chen SH, et al: PLoS One 2012, 7:e35789.

21. Dedeurwaerder S, Defrance M, Calonne E, Denis H, Sotiriou C, Fuks F: Epigenomics 2011, 3:771-784.

22. Wendt J, Rosenbaum H, Richmond TA, Jeddeloh JA, Burgess DL: Methods Mol Biol 2018, 1708:383-405.

23. Herman JG, Graff JR, My

S, Nelkin BD, Baylin SB: Proc Natl Acad Sci U S A 1996, 93:9821-9826.

24. Hernandez HG, Tse MY, Pang SC, Arboleda H, Forero DA: Biotechniques 2013, 55:181-197.

25. Kibbe WA: OligoCalc: Nucleic Acids Res 2007, 35:W43-46.

26. Klutstein M, Nejman D, Greenfield R, Cedar H: Cancer Res 2016, 76: 3446-3450.

27. Lu J, Wilfred P, Korbie D, Trau M: Cancers (Basel) 2020, 12.

28. Ng JM, Yu J: Int J Mol Sci 2015, 16:2472-2496.

29. Suzuki MM, Bird A: Nat Rev Genet 2008, 9:465-476.

30. Maunakea AK, Nagarajan RP, Bilenky M, Ballinger TJ, D'Souza C, Fouse SD, Johnson BE, Hong C, Nielsen C, Zhao Y, et al: Nature 2010, 466:253-257.

31. Lee SM, Lee J, Noh KM, Choi WY, Jeon S, Oh GT, Kim-Ha J, Jin Y, Cho SW, Kim YJ: Proc Natl Acad Sci U S A 2017, 114:E1885-e1894.

32. Krinner S, Heitzer AP, Diermeier SD, Obermeier I, L

G, Wagner R: Nucleic Acids Res 2014, 42:3551-3564.

33. Shenker N, Flanagan JM: Br J Cancer 2012, 106:248-253.

34. Kinde B, Wu DY, Greenberg ME, Gabel HW: Proc Natl Acad Sci U S A 2016, 113:15114-15119.

35. Arechederra M, Daian F, Yim A, Bazai SK, Richelme S, Dono R, Saurin AJ, Habermann BH, Maina F: Nat Commun 2018, 9:3164.

36. Greenberg MVC, Bourc'his D: Nat Rev Mol Cell Biol 2019, 20: 590-607.

37. Chandrashekar DS, Bashel B, Balasubramanya SAH, Creighton CJ, Ponce-Rodriguez I, Chakravarthi B, Varambally S: UALCAN: Neoplasia 2017, 19: 649-658.

38. Teo AK, Tsuneyoshi N, Hoon S, Tan EK, Stanton LW, Wright CV, Dunn NR: Stem Cell Reports 2015, 4:578-590.

39. Lin C-P, He L: Annual Review of Cancer Biology 2017, 1:163-184.

40. Boons G, Vandamme T, Ibrahim J, Roeyen G, Driessen A, Peeters D, Lawrence B, Print C, Peeters M, Van Camp G, Op de Beeck K: Cancers (Basel) 2020, 12.

41. Vinogradova TV, Sverdlov ED: PDX1: Biochemistry (Mosc) 2017, 82:887-893.

42. Brunet I, Weinl C, Piper M, Nature 2005, 438:94-98.

43. Li Y, Liu J, Xiao Q, Tian R, Zhou Z, Gan Y, Li Y, Shu G, Yin G: Cell Death Dis 2020, 11:604.

44. Sun AJ, Gao HB, Liu G, Ge HF, Ke ZP, Li S: J Cell Physiol 2017, 232: 1879-1884.

<110> Industry-Academic Cooperation Foundation Yonsei University <120> A Method for Diagnosing Colon Cancer by Detecting Intragenic Methylation <130> PDPB214215 <160> 15 <170> KoPatentIn 3.0 <210> 1 <211> 821 <212> DNA <213> Homo sapiens <400> 1 tcgcgcgcct acactaggcg ctgaaatggg atgctggggc ttggtggctc cggcgggagc 60 agctggtagg gctagggctc cctggccccc cttgaagggg ttgggctgcg tgggtggggg 120 ctgtgcgggg ctccgggggc cacactcacg ccctgtgtcg cccgcaggcg gcgcctacgc 180 tgcggagccg gaggagaaca agcggacgcg cacggcctac acgcgcgcac agctgctaga 240 gctggagaag gagttcctat tcaacaagta catctcacgg ccgcgccggg tggagctggc 300 tgtcatgttg aacttgaccg agagacacat caagatctgg ttccaaaacc gccgcatgaa 360 gtggaaaaag gaggaggaca agaagcgcgg cggcgggaca gctgtcgggg gtggcggggt 420 cgcggagcct gagcaggact gcgccgtgac ctccggcgag gagcttctgg cgctgccgcc 480 gccgccgccc cccggaggtg ctgtgccgcc cgctgccccc gttgccgccc gagagggccg 540 cctgccgcct ggccttagcg cgtcgccaca gccctccagc gtcgcgcctc ggcggccgca 600 ggaaccacga tgagaggcag gagctgctcc tggctgaggg gcttcaacca ctcgccgagg 660 aggagcagag ggcctaggag gaccccgggc gtggaccacc cgccctggca gttgaatggg 720 gcggcaattg cggggcccac cttagaccga aggggaaaac ccgctctctc aggcgcatgt 780 gccagttggg gccccgcggg tagatgccgg caggccttcc g 821 <210> 2 <211> 214 <212> DNA <213> Homo sapiens <400> 2 ccgaacaaag aggacaagcg gccgcgcacg gcctttaccg ccgagcagct gcagaggctc 60 aaggccgagt tccagaccaa caggtacctg acggagcagc ggcgccagag cctggcgcag 120 gagctgagcc tcaacgagtc acagatcaag atttggttcc agaacaagcg cgccaagatc 180 aagaaggcca cgggcaacaa gaacacgctg gccg 214 <210> 3 <211> 379 <212> DNA <213> Homo sapiens <400> 3 ccgcaaacac aagacgaacc gtaagccgcg gacgcccttc accaccgcgc agctgctggc 60 gctggagcgc aagttccgcc agaagcagta cctgtccatc gccgagcgcg cggagttctc 120 cagctcgctc agcctcactg agacgcaggt gaagatatgg ttccagaacc gccgcgccaa 180 ggcaaagaga ctacaagagg cagagctgga gaagctgaag atggccgcca agcccatgct 240 gccaccggct gccttcggcc tctccttccc tctcggcggc cccgcagctg tagcggccgc 300 ggcgggtgcc tcgctctacg gtgcctctgg ccccttccag cgcgccgcgc tgcctgtggc 360 gcccgtggga ctctacacg 379 <210> 4 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> PDX1 Methylation F primer <400> 4 gattgcgtcg tgattttcgg cg 22 <210> 5 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> PDX1 Methylation R primer <400> 5 caaacgacaa acgaccctct cg 22 <210> 6 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> EN2 Methylation F primer <400> 6 ggtatttgac ggagtagcgg cg 22 <210> 7 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> EN2 Methylation R primer <400> 7 cccgtaacct tcttaatctt aacgcg 26 <210> 8 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> MSX1 Methylation F primer <400> 8 gaagtagtat ttgtttatcg tcgagcg 27 <210> 9 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> MSX1 Methylation R primer <400> 9 tcttataatc tctttacctt aacgcgacg 29 <210> 10 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> PDX1 Unmethylation F primer <400> 10 gagtaggatt gtgttgtgat ttttggtg 28 <210> 11 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> PDX1 Unmethylation R primer <400> 11 taaaaccaaa caacaaacaa ccctctca 28 <210> 12 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> EN2 Unmethylation F primer <400> 12 gattaatagg tatttgatgg agtagtggtg 30 <210> 13 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> EN2 Unmethylation R primer <400> 13 cttattaccc ataaccttct taatcttaac aca 33 <210> 14 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> MSX1 Unmethylation F primer <400> 14 gttagaagta gtatttgttt attgttgagt g 31 <210> 15 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> MSX1 Unmethylation R primer <400> 15 cctcttataa tctctttacc ttaacacaac a 31

Claims

PDX1, EN2 및 MSX1 유전자로 구성된 군으로부터 선택되는 하나 이상의 유전자의 유전자내 영역(intragenic region)에서의 메틸화 수준을 측정하는 제제를 유효성분으로 포함하는 대장암의 진단 또는 예후 예측용 조성물.
제 1 항에 있어서, 상기 PDX1의 유전자내 영역에서의 메틸화 수준을 측정하는 제제는 PDX1의 유전자내 CpG 섬을 특이적으로 인식하는 메틸화-특이적 중합효소연쇄반응(methylation specific PCR, MSP) 용 프라이머인 것을 특징으로 하는 조성물.
제 2 항에 있어서, 상기 PDX1의 유전자내 CpG 섬은 서열목록 제1서열의 뉴클레오타이드를 포함하는 것을 특징으로 하는 조성물
제 3 항에 있어서, 상기 MSP 용 프라이머는 서열목록 제4서열의 뉴클레오타이드 및 서열목록 제5서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍인 것을 특징으로 조성물.
제 1 항에 있어서, 상기 EN2의 유전자내 영역에서의 메틸화 수준을 측정하는 제제는 EN2의 유전자내 CpG 섬을 특이적으로 인식하는 메틸화-특이적 MSP 용 프라이머인 것을 특징으로 하는 조성물.
제 5 항에 있어서, 상기 EN2의 유전자내 CpG 섬은 서열목록 제2서열의 뉴클레오타이드를 포함하는 것을 특징으로 하는 조성물.
제 6 항에 있어서, 상기 MSP 용 프라이머는 서열목록 제6서열의 뉴클레오타이드 및 서열목록 제7서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍인 것을 특징으로 조성물.
제 1 항에 있어서, 상기 MSX1의 유전자내 영역에서의 메틸화 수준을 측정하는 제제는 MSX1의 유전자내 CpG 섬을 특이적으로 인식하는 메틸화-특이적 MSP 용 프라이머인 것을 특징으로 하는 조성물.
제 8 항에 있어서, 상기 MSX1의 유전자내 CpG 섬은 서열목록 제3서열의 뉴클레오타이드를 포함하는 것을 특징으로 하는 조성물.
제 9 항에 있어서, 상기 MSP 용 프라이머는 서열목록 제8서열의 뉴클레오타이드 및 서열목록 제9서열의 뉴클레오타이드를 각각 포함하는 프라이머 쌍인 것을 특징으로 조성물.
PDX1, GRIN2D, PITX1, TFAP2A, EN2 및 MSX1 유전자로 구성된 군으로부터 선택되는 하나 이상의 유전자의 발현량을 측정하는 제제를 유효성분으로 포함하는 대장암의 진단용 조성물.
PDX1, EN2 및 MSX1 유전자로 구성된 군으로부터 선택되는 하나 이상의 유전자의 발현량을 측정하는 제제를 유효성분으로 포함하는 대장암의 예후 예측용 조성물.
제 12 항에 있어서, 상기 조성물은 대장암의 전이 예측용 조성물인 것을 특징으로 하는 조성물.