WO2014163444A1

WO2014163444A1 - 국소 진행형 위암에 대한 예후 예측 시스템

Info

Publication number: WO2014163444A1
Application number: PCT/KR2014/002958
Authority: WO
Inventors: 허용민; 노성훈; 정재호; 서진석; 박은성
Original assignee: 연세대학교 산학협력단
Priority date: 2013-04-05
Filing date: 2014-04-07
Publication date: 2014-10-09
Also published as: EP2982985B1; CN105431737A; EP2982985A4; US20160063179A1; JP2016516421A; KR101504817B1; CN105431737B; EP2982985A1; KR20140121522A; JP6280206B2

Abstract

본 발명은 국소 진행형 위암의 예후 예측이 가능한 신규한 예후 예측 시스템에 관한 것으로, 보다 상세하게는, 유전자 집합 발현 비교 분석법을 통해 위암의 수술에 의한 절제 후 임상 결과를 예측할 수 있다.

Description

국소 진행형 위암에 대한 예후 예측 시스템

본 발명은 유전자 발현 비교 분석법을 통해 국소 진행형 위암의 예후 예측이 가능한 신규한 예후 예측 시스템에 관한 것이다.

위선암(Gastric adeno-carcinoma)은 2000년 700,349명의 사망에서 두 번째 원인으로, 세계에서 가장 일반적으로 진단된 네 번째 암이다. 몇 가지 역학적 및 조직병리학적 특징들을 갖는 단일 이질적 질환으로 간주하고 있다. 위암 치료는 주로 환자를 수술 만으로 또는 수술과 화학요법으로 치료하여야 하는지를 결정하는 TNM(tumor, node, metastasis) 병기결정 같은 임상적 파라미터에 근거한다. 위암은 유방암과 대장암 등과 달리 TNM 병기 시스템에 따라서 1기에서 4기까지 명확하게 차이가 난다. 즉, 1기의 경우에는 5년 생존율이 90% 이상이며, 4기의 경우에는 20% 이하로 큰 차이를 보인다. 그러므로 TNM 병기 시스템의 예후 예측력이 매우 뛰어남을 알 수 있다[참고문헌, 7th edition of the AJCC cancer staging Manual: stomach. Ann Surg Oncol 2010;17:3077-3079]. 상기 병기 시스템에 기반을 두어 위암은 흔히 조기 위암(Early Gastric Cancer), 국소진행형(Locally Advanced Gastric Cancer), 국소 침윤형(Locally Advanced Invasive Gastric Cancer) 및 전이 위암(Metastatic Gastric Cancer) 등으로 나눌 수 있다.

비록 수술이 실시 가능한 위암의 주요 치료이긴 하나, 진행성인 경우 재발률이 높다. 재발을 예방하고, 위암 환자들의 예후를 개선하기 위해 화학요법과 화학-방사선요법을 포함한 집학적 치료가 도입되었다. 그러나, 이들 치료 방법이 환자들에서 일반적인 임상 결과를 개선하기는 하나 종양의 임상병리학적 이질성과, 같은 병기에 있는 환자들의 다른 결과는 어쥬번트 화학요법의 임무를 예측하는데 한계가 있어 개별 환자들에 대한 최적 접근이 부족한 상태이다.

종양침윤 및 림프절 전이의 깊이는 위암에서 2개의 주요 예후 인자이다. 위암 환자의 50% 이상이 진단 시 림프절 전이를 수반하고 있으며, 30% 미만이 5년 생존율을 갖는 나쁜 예후를 나타냈다. 따라서, 위암 환자로부터 림프절 전이의 정확한 분류는 근치 위 절제술 후 뒤이은 치료 결정에 근본적으로 중요하다. 그러나, 림프절 상태만으로는 수술 후 예후 결과의 이질성 및 화학요법 약제의 임무를 설명하지 못한다. 심지어 같은 림프절 병기를 포함하는 같은 병기를 갖는 환자들도 같은 예후 결과를 나타내지는 않는다. 따라서, 고유의 임상적 이질성에 원인이 있는 종양들 간의 명확한 생물학적 차이가 위암의 새로운 치료 전략 개발을 위한 가장 중요한 단계이다.

위암 환자들의 예후 결과에 영향을 주는 생물학적 특징들에 대한 이해는 위암이 역학 및 조직병리학에서 차이를 갖는 이질적 질환이기 때문에 꽤 어렵다. 위암의 예후 결과는 비록 확산 타입 및 장내 타입 같이 위암 아류형을 포함하여 많은 다른 예후 인자들이 있긴 하나 주로 병기에 의해 영향을 받는다. 그러나, 같은 병기라 하더라도 이질적인 예후 결과를 가지며, 이들 이질성의 대부분이 완전히 설명되지는 않는다. 같은 병기 내에서 예후 결과의 차이에 원인이 있는 유전적 특징들의 동정은 환자들의 치료 방안을 선택하는데 매우 중요하다. 그러나, 이미 개발된 유전적 특징들 대부분은 재현가능성의 부족과 치료 방안의 선택에 이용될 수 있는 정보의 부족으로 인해 임상에서 이용되지 못했다. 이들 예후의 도입을 괴롭히는 다른 중요한 인자들은 이들 예후들 중 어느 것도 위암 환자들의 예후 결과를 정의함에 있어서 병기를 통제할 수 있는 것이 없다는 것이다. 따라서, 같은 병기의 환자들에서 예후 예측 인자의 도입이 필연적으로 필요하다.

본 발명의 목적은 국소 진행형 위암, 특히 N0 병기(N0 regional lymph node metastasis)에서 위암 환자들의 임상 결과에 영향을 주는 중요한 생물학적 특징들을 규명하고, 유전자 발현 위험도 점수(Rsk Score, RS)에 기초한 새로운 예후 예측 시스템을 제공하는 것이다.

상기 목적을 달성하기 위하여, 본 발명은 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서 GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및 상기 단계에서 결정된 RNA 전사체의 발현도에 기초하여 상기 생물학적 샘플의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 상기 RS(%)에 따라 예후를 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법을 제공한다.

본 발명은 또한 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서 GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현 수준을 측정하는 단계; 및 상기 전사체의 발현 증가는 긍정적인 임상 결과 가능성의 증가로 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법을 제공한다.

상기 예후 예측 방법은 TNM 병기 분류에서 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것일 수 있다.

본 발명은 또한 위암의 예후 예측을 실행하는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체에 있어서, 환자로부터 얻은 핵산 시료에서 GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및 상기 단계에서 결정된 RNA의 발현도에 기초하여 상기 시료의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)의 설정치 범위가 50% 이상을 갖는 경우 고 위험군 환자, 25% 이상 내지 50% 미만인 경우 중간 위험군 환자, 25% 미만인 경우 저 위험군 환자로 분류하는 단계를 컴퓨터에 실행시키는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체를 제공한다.

상기 기록 매체는 TNM 병기 분류에서 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것일 수 있다.

상기 RS 및 RS(%)은 하기 수학식 1 및 2에 따라 계산할 수 있다:

[수학식 1]

RS=HR₁*normLogTransValue₁ + HR₂*normLogTransValue₂ + ... + HR_n* normLogTransValue_n

[수학식 2]

RS(%)=100×(생물학적 샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)

상기 식에서,

HR_n는 n번째 RNA 전사체의 위험 계수(hazard ratio)를 나타내고, 상기 HR_n이 1 미만인 경우 -1/HR_n로 변환하여 사용하며,

normLogTransValue_n는 RNA 전사체의 발현과 관련된 값이고, 이 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값이며,

상기 모집단은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암을 갖는 일정 수의 집단을 의미하고, 일정 수는 RS 최고값과 최소값을 산출할 수 있는 정도의 임의의 정수이다.

본 발명은 TNM 병기 중 N0기 위암 환자군에 대한 전체 생존율 측면에서 예측 모델을 만든 후 통계적으로 유의한 생존에 영향을 미치는 RNA 전사체의 발현도를 결정하여 이로부터 위험도 평점 시스템을 만들어 예후 지표 값을 산출하는 방식으로 위암 수술에 의한 절제 후 임상 결과를 예측할 수 있다.

또한, 본 발명은 유전자의 생물학적 기능에 따른 유전자 집합 시스템을 이용함으로써 위암 자체의 생물학적 기능에 따른 유전자군의 분석이 가능하다.

도 1a-d는 분산 여과 후 프로브를 사용한 unsupervised hierarchical clustering analysis 에 의해 만든 2개의 주요 클러스터들의 예후 결과를 나타낸 것으로, a)는 분산 여과 후 unsupervised hierarchical clustering analysis 에 사용된 프로브의 수와 클러스터링 분석에서 생긴 2개의 주요 클래스를 사용한 log rank test 분석에서의 예후 p-값이다. 각 클러스터들은 필터링 기준에 기초하여 명명하였다. M 이후 첫 번째 숫자는 각 프로브의 평균값에 대한 폴드(fold) 차이를 표시한 것이고, 두 번째 숫자는 첫 번째 숫자에서 표시된 폴드 차이와 비교하여 높거나 낮은 발현을 보여주는 프로브의 수를 표시한 것이다. 예를 들어, M2_3는 평균값에 대해 2배 이상의 높거나 낮은 발현을 보여주는 적어도 3개의 샘플을 갖는 프로브를 선택하여 분산 여과 후 그 프로브를 사용하여 생긴 클러스터이다. b)는 분산 여과 후 2개의 주요 클러스터들의 환자 샘플의 분포이다. log rank test에서 좋은 예후 군과 나쁜 예후 군에 대해 주석을 단 후 2개의 주요 클래스의 샘플의 클러스터링 분석이다. c)는 M2_5 클러스터 환자들의 Kaplan Meier Plot을 나타낸 것이다. P-값은 log rank test 후 얻은 것이다. d)는 M3_3 클러스터 환자들의 Kaplan Meier Plot을 나타낸 것이다. P-값은 log rank test 후 얻은 것이다.

도 2는 분산 여과 후 unsupervised hierarchical clustering analysis 에 따라 만든 2개의 주요 대표 클러스터를 나타낸 것이다. M2_5에 대한 클러스터링 분석은 평균값에 대해 2배 이상의 증가 또는 감소를 보여주는 적어도 5개의 샘플을 갖는 프로브를 필터링한 후 여과된 1556개의 프로브로 만든 것이다. M3_3 에 대한 클러스터링 분석은 평균값에 대해 3배 이상의 증가 또는 감소를 보여주는 적어도 3개의 샘플을 갖는 프로브를 필터링한 후 여과된 706개의 프로브로 만든 것이다.

도 3은 unsupervised clustering analysis 후 2개의 주요 클래스의 비교 시 유의적인 차이를 보여주는 유전자 및 생물학적 특징을 나타낸 것으로, A)는 M2_5의 클러스터링 분석에 의해 만든 2개의 주요 클래스의 비교에서 통계적 유의(p<0.001 및 2배 차이, 554개의 프로브)를 보여주는 프로브를 사용한 조건부 클러스터링의 히트맵을 나타낸 것이다. B)는 M3_3의 클러스터링 분석에 의해 만든 2개의 주요 클래스의 비교에서 통계적 유의(p<0.001 및 2배 차이, 453개의 프로브)를 보여주는 프로브를 사용한 조건부 클러스터링의 히트맵을 나타낸 것이다.

도 4a-b는 Biocarta 경로 데이터 베이스에서 M2_5의 2개의 주요 분류군의 GSEA 결과(A)와, M3_3 의 2개의 주요 분류군의 GSEA 결과(B)를 나타낸 것이다.

도 5a-f는 GSEA 결과에서(p<0.001) 유의적인 증가를 보여주는 유전자들의 발현을 나타낸 것으로, 히트맵은 M2_5의 각 분류군의 평균 발현 수준을 나타낸다.

도 6a-f는 GSEA 결과에서(p<0.001) 유의적인 증가를 보여주는 유전자들의 발현을 나타낸 것으로, 히트맵은 M3_3의 각 분류군의 평균 발현 수준을 나타낸다.

도 7a-i는 M3_3의 분류군에 따른 NO 위암 환자들의 예후 예측을 나타낸 것이다. 프로브들은 M3_3 클러스터에 의해 정의된 2개의 클래스의 비교에서 유의적으로 다르다(p<0.001). 이 분석을 위해 3개의 다른 예측 알고리즘(CCP, LDA, 및 NC)을 사용하였다. 각 모형의 예측 오류를 추정하기 위해 단일잔류 교차검증을 사용하였다. 예후적 차이는 log rank test을 사용하여 추정하였다. 도 7a-i에 기재된 A-C)는 Training data (YUSH 데이터)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다. D-F)는 검증 데이터(MDACC data)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다. G-I)는 총 샘플 데이터(YUSH 데이터 및 MDACC 데이터)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다.

도 8a-i는 M2_5의 분류군에 따른 NO 위암 환자들의 예후 예측을 나타낸 것이다. 프로브들은 M2_5 클러스터에 의해 정의된 2개의 클래스의 비교에서 유의적으로 다르다(p<0.001). 이 분석을 위해 3개의 다른 예측 알고리즘(CCP, LDA, 및 NC)을 사용하였다. 각 모형의 예측 오류를 추정하기 위해 단일잔류 교차검증을 사용하였다. 예후적 차이는 log rank test을 사용하여 추정하였다. 도 8a-i에 기재된 A-C)는 Training data(YUSH 데이터)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다. D-F)는 Validation data(MDACC data)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다. G-I)는 총 샘플 데이터(YUSH 데이터 및 MDACC 데이터)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다.

도 9a-b는 NO 위암 환자들의 예후 결과에서 CGAP에 의해 미리 정해진 기능적 유전자 분류의 영향을 나타낸 것으로, 도 9a-b에 기재된 A)는 YUSH, MDACC 및 총 데이터 세트에서 CGAP에 의해 기능적으로 분류된 유전자의 예후 결과이다. unsupervised hierarchical clustering analysis 은 CGAP의 기능적 유전자 분류에서 그 유전자들을 이용하여 수행하였다. 주요 클러스터들의 예후적 차이는 log rank test에 따라 비교하였다. log rank test의 p-값은 로그 p-값으로 변화시켰고, 막대 그래프로 나타내었다. B)는 각 기능적 유전자 분류에서 주요 클러스터들의 차이를 나타내는 생물학적 특징이다. GSEA를 수행하고, GSEA의 통계적 유의를 로그 p-값으로 나타내었다.

도 10a-c는 위험도 평점 시스템의 백분율의 형성을 나타낸 것이다. 도 10a-c에 기재된 A)는 예측 모형과 CGAP의 기능적 유전자 분류에 의해 정의된 사망률의 히트맵을 나타낸 것이다. 모든 샘플은 분류군 또는 클러스터에 의해 정의된 각 분류군의 사망률로 주석을 달고, 예후 결과에서 환자 분포와 기능적 생물학의 각 분류의 영향을 체크하기 위해 unsupervised clustering analysis을 수행하였다. B)는 총 샘플 데이터 세트에서 각 환자들의 위험도 점수의 백분율이다. C)는 YUSH 샘플 데이터 세트에서 각 환자들의 위험도 점수의 백분율이다. D)는 MDACC 샘플 데이터 세트에서 각 환자들의 위험도 점수의 백분율이다. E-G)는 3개의 다른 데이터 세트(YUSH, MDACC 및 총 샘플 데이터 세트)에서 % 위험도 점수로 정의된 3개의 다른 위험 군(High, Intermediate and Low Risk Group)의 Kaplan Meier Plot을 나타낸 것이다. 3개의 다른 위험 군 간의 예후적 차이의 유의성은 log rank test에 따라 정의하였다.

이하 본 발명의 구성을 구체적으로 설명한다.

본 발명자들은 림프절 전이가 없는 상대적으로 초기 병기에서 위암 환자들의 예후적 차이에 원인이 있는 주요 생물학적 특징을 정의하기 위해 림프절 전이가 없는 환자들로부터 전체 게놈 유전자 발현 프로파일을 만들었다. 이를 위해, 필터링 기준을 바꿔주면서 연속 분산 여과 후 unsupervised hierarchical clustering analysis 방법을 적용하였다. 예후 결과는 클러스터링 분석에 따라 정의된 2개의 주요 분류군에 대해 log rank test을 사용하여 추정하였다. 각 암 환자들의 전체 생물학적 특징들을 나타내는 유전자들을 이용한 자율 분석이기 때문에, 각각 다른 예후 군을 나타내는 생물학적 특징들은 예후적 차이에 원인이 있는 주요 생물학적 특징일 것이며, 치료 방안의 개발을 위한 잠재적 표적으로 이용될 수 있다.

분석 결과 NO 병기 위암 환자들의 예후적 차이에 주로 원인이 있는 2개의 다른 생물학적 특징들(세포증식 및 면역반응)이 동정 되었고, 이들 2개의 생물학적 특징들은 분산 여과에 기초한 분류군 또는 CGAP의 기능적 유전자 분류와 상관없이 일반적으로 꽤 보존되어 있다. 세포증식 및 면역활성화의 생물학적 특징들을 나타내는 이들 분류군의 검증은 독립 데이터 세트에서 수행하였으며, log rank test에서 Training data set와 유사한 예후 결과를 나타냈다. 단일잔류 교차검증법으로 정정예후비를 실험한 결과 분류군의 타입과 예후 예측 알고리즘에 따라 85 내지 96%의 범위를 나타냈다. 좋은 예후 군에서 세포증식 관련 유전자들의 발현이 증가한 결과는 정상세포와 비교하여 대부분의 암세포에서 더 높은 증식율을 가지고 있기 때문에 예상치 못한 결과였다. 그러나, 초기 위암의 세포증식은 진행형 병기의 위암보다 훨씬 더 강력하여 세포 특징이 줄기세포 특징의 획득 및 전이 잠재력이 변화하는 중일 것으로 추측된다. 높은 세포증식율을 갖는 환자들의 좋은 예후 결과를 설명할 수 있는 다른 요인으로 화학요법 약제의 책임을 들 수 있다. 화학요법 약제 치료를 받은 환자들에서 세포증식 특징의 높은 발현을 갖는 환자들은 예상했던 대로 좋은 반응을 나타냈다. 그러나, 화학요법 약제 치료를 받지 않은 환자들은 그들이 화학요법 약제 치료를 받은 환자들과 유사한 세포증식 특징의 높은 발현을 가질 때에만 좋은 예후 결과를 나타냈기 때문에 MDACC 검증 데이터 세트의 예후 결과는 이러한 생각을 뒷받침하지는 못한다. 따라서, 높은 증식 특징 발현을 갖는 좋은 예후 결과에 대한 이유는 화학요법 약제의 감수성뿐만 아니라 높은 세포증식 생물학을 반영하는 생리적 차이에 있다.

림프절 침윤이 없는 위암 환자들의 좋은 예후에 대한 면역활성화 특징의 영향에 대한 발견은 면역활성화 특히 암 환자 치료에서 CTL의 활성화 상태의 중요한 역할을 입증한 것이다. 면역반응의 유의적인 역할은 위암에서 다운스트림 비-감시림프절 전이와 관련된 감시림프절에서 높은 Foxp3 양성 조절 T-세포 밀도를 제공하는 위암에서 이미 보고된바 있다. 종양 진행 조절에서 면역활성화의 중요한 역할은 몇몇 논문에서 보고된바 있고, 일반적으로 많은 암종에서 다른 치료 방안으로서 받아들여지고 있다. 치사량의 방사선 조사와 백신처리에 의한 활성 면역치료, GMCSF를 분비하도록 제작된 자가 종양세포 및 세포독성 T 림프구-결합 항원-4(CTLA-4)의 항체 차단은 종양 신생혈관형성을 표적화하여 종양 맥관 구조를 붕괴시켰다. 면역 내성 특히 종양 항원에 특이적인 T 세포에 대한 주요 메커니즘으로서 종양 포획(co-opt) 특정 면역 체크포인트 경로는 이미 알려져 있다. T 세포 반응의 극적인 확대 및 품질은 T 세포 수용체에 의한 항원 인지를 통해 개시되며, 공동-자극 및 억제 신호 간의 균형에 의해 조절된다. 공동-조절 수용체의 작용제 및 억제신호의 길항제 둘 다 항원 특이 T 세포 반응을 증폭시키고, 면역 체크포인트의 차단은 사람 암 치료 시 항-종양 면역 반응의 잠재력을 보여준다. 특히, CTLA-4는 중요한 면역-체크포인트 수용체이며, T 세포 활성화의 크기를 하향조절한다. CTLA-4 항체는 면역치료제로 미국 FDA에서 승인을 받았고, 길항적 CTLA4 항체를 이용한 임상 연구들은 진행성 흑색종 환자들에서 생존 장점을 입증하였다. 따라서, 길항적 CTLA4 항체를 위암 환자 치료에 도입하는 것은 초기 NO 환자들에서 나쁜 예후 결과를 갖는 환자들을 위한 다른 치료 방안일 수 있다. 본 발명에서 밝힌 유전적 특징들은 치료 방안을 위한 올바른 환자를 선택하기 위한 가이드 역할을 할 수 있다.

본 발명자들은 주로 세포증식과 관련된 특징과 면역반응과 관련된 특징으로 구성된 2개의 다른 생물학적 특징들이 NO 병기 위암 환자들의 예후 결과에 원인이 있는 주요 생물학적 특징임을 입증하였다. 이들 발견에 기초하여, 본 발명자들은 위암 환자에서 면역치료의 도입과 이들 치료를 위한 환자 선택 시 면역치료를 위한 최대 이점을 얻기 위해서는 유전적 특징에 기초하여야 함을 제안한다.

따라서, 본 발명은 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서

GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및

상기 단계에서 결정된 RNA 전사체의 발현도에 기초하여 상기 생물학적 샘플의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 상기 RS(%)에 따라 예후를 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법을 제공한다.

본 발명에 따른 예후를 예측하는 방법은 위암 환자들의 임상 결과를 지배하는 2가지 주용 생물학적 특징인 면역활성화 및 세포증식에 관련된 유전자들 중 CGAP(Cancer Genome Anatomy Project)에서 발견되는 기능적으로 분류된 유전자군(functional categorized gene group)에서 콕스 회귀 분석에서 통계적 유의(p<0.001)를 갖는 유전자를 예후와 관련된 유전자 대상으로 선정하고, 상기 유전자들의 위험 계수(hazard ratio)를 유전자의 발현 값에 곱하여 하기 수학식 1 및 2에 따라 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 구한 후 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)가 50% 이상을 갖는 샘플을 고 위험군, 25% 이상 내지 50% 미만인 경우 중간 위험군, 25% 미만인 경우 저 위험군으로 분류함으로써 위암으로 진단된 대상에서 예후를 예측할 수 있는 것을 특징으로 한다.

상기 RS 및 RS(%)은 하기 수학식 1 및 2에 따라 계산할 수 있다:

[수학식 1]

[수학식 2]

상기 식에서,

상기 모집단의 수는 특별히 제한하지는 않으며, 일 구체예에서는 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암 조직 158개를 모집단으로 사용하였다.

상기 식에서, 용어, 위험 계수(Hazard Ratio: HR)란 암의 진행, 재발, 또는 요법 반응에 대한 기여도를 반영하는 계수를 의미한다. 위험 계수는 다양한 통계적 기법에 의하여 도출될 수 있다. 상기 위험 계수, HR 값은 다양한 통계적 모델에서 결정할 수 있으며, 예컨대, 다변량 콕스 비례 위험 회귀 분석에서 결정할 수 있다. 일 구체예에서, HR 값을 RS 수식에 사용함에 있어서, HR 값이 1보다 크거나 같을 경우 HR 값을 그대로 사용하고, HR 값이 1 보다 작을 경우 -1/HR 값을 사용할 수 있다.

또한, 상기 식에서, 용어, RNA 전사체의 발현 값이란 개별유전자, 즉 RNA 전사체의 발현과 관련된 값을 의미한다. 상기 값은 공지된 다양한 통계적 수단을 사용하여 결정할 수 있다. 예를 들어 발현 값은 콕스 회귀 분석에 의해 측정된 p 값을 log2 함수값으로 변형 후 사분위수 표준화(quantile normalization) 후의 값을 사용할 수 있다. 상기 수학식 1에서 사용된 발현 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값을 사용하였다.

일 구체예에 따르면, RS는 다음과 같이 결정할 수 있다:

RS=-GART×3.584 + PTN×3.631 - PCNA×2.7027 + GLI3×4.073 + SMARCD3×2.266 - SULT1A3×3.278 + ILK×2.251 - FUCA1×2.80899 + PKD1×2.827 - TOP2A×1.7668 + ABL1×2.784 - CKS2×1.9685 + FZD1×4.302 - TIAL1×4.2553 + SGCD×2.494 - PIGF×2.6525 - CCNB1×2.4272 - CSK ×3.2573 + CRYAB×1.524 + TPM1×2.975 - RFC4×2.817 + GUCY1B3×2.801 - TYMS×2.0617 - FEN1×2.3148 + GNAI1×2.758 + CSRP1×1.642 - UNG×2.695 + AXL×2.018 + MAP1×B1.705 + VCL×2.478 + ITGA5×1.642 - LIG1×2.841 - HPRT1×2.95 - GRB2×3.636 - HMMR×1.98 - MCM4×2.02 + SRF×2.287 + DMPK×1.925 - ACP5×2.551 - CD38×2.16 - PRIM1×3.003 - CCNF×2.024 + GLRB×2.138 - IFNAR2×3.717 + HSPA2×1.734 - CLN3×2.445 - BUB1×1.74 + CALM1×2.839 - CDC2×1.562 + ATF4×5.677 - RRM1×3.717

상기 수학식 1에 따라 계산된 RS는 상기 수학식 2에 따라 RS(%)로 나타낼 수 있다.

위에서 결정된 값을 모집단에서 해당하는 순위로 변환하여 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)가 50% 이상을 갖는 샘플을 고 위험군, 25% 이상 내지 50% 미만인 경우 중간 위험군, 25% 미만인 경우 저 위험군으로 분류한다. 고 위험군은 나쁜 예후를, 저 위험군은 좋은 예후인 것으로 판단할 수 있다. 즉, RS(%) 값이 50% 이상을 갖는 샘플을 고 위험군은 3년 이상, 6년 이상, 10년 이상의 기간 동안 전체 생존율이 낮음을 의미하고, 25% 미만인 저 위험군은 3년 이상, 6년 이상, 10년 이상 동안 전체 생존율이 높음을 의미한다. 상기 용어, 좋은 예후는 임상 결과의 긍정적 임상 결과 가능성의 증가로 표현될 수 있고, 나쁜 예후는 임상 결과의 긍정적 임상 결과 가능성의 감소로 표현될 수 있다.

상기 방법은 TNM 병기 중 N0기 위암 환자군, 예컨대, T1N0기, T2N0기, T3N0기 또는T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는데 유용할 수 있다.

본 발명의 예후 예측 방법에 사용된 상기 유전자들은 면역반응과 세포증식에 관여하는 유전자 세트로 나눌 수 있고, 좋은 예후 군에서는 통계적으로 유의하게 발현이 증가한다.

면역반응에 관여하는 유전자 세트: GART, PTN, SULT1A3, FUCA1, PKD1, ABL1, TIAL1, SGCD, PIGF, CSK, CRYAB, TPM1, GUCY1B3, GNAI1, CSRP1, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, CD38, GLRB, IFNAR2, HSPA2, CLN3, BUB1, ATF4 및 RRM1

세포증식/DNA 복구에 관여하는 유전자 세트: PCNA, GLI3, SMARCD3, ILK, TOP2A, CKS2, FZD1, CCNB1, RFC4, TYMS, FEN1, UNG, MCM4, SRF, DMPK, ACP5, PRIM1, CCNF, CALM1 및 CDC2

상기 면역반응에 관여하는 유전자 세트는 주로 항원 프로세싱과 제시(MHC 경로) 및 IFN 감마 신호전달경로와, 이외에, Th1/Th2 분화(TH1TH2 경로), 표적세포에 대한 CTL 매개 면역 반응(CTL 경로), NK 세포에서 NO2 의존성 IL12 경로(NO2IL12 경로), T 세포 활성화에서 Tob의 역할(TOB1 경로), Th1 발달 시 IL12 및 Stat4 의존적 신호전달경로(IL12 경로) 및 T 세포독성 세포 표면 분자(T 세포독성경로)와 관련이 있다.

상기 세포증식/DNA 복구에 관여하는 유전자 세트는 암 감수성(ATR BRCA 경로)에서 BRCA1, BRCA2 및 ATR의 역할, DNA 손상(cdc25 경로)에 대한 반응에서 cdc25 및 chk1 조절 경로, 사이클린 및 세포주기조절(세포주기 경로), 사이클린 E 파괴 경로(FBW7 경로), 세포주기:G1/S 체크포인트(G1 경로), 세포주기:G2/M 체크포인트(G2 경로), CDK 조절(MCM 경로), 세포주기 진행 중 p27 인산화 조절(P27 경로), 세포주기를 조절하는 Sonic Hedgehog(SHH) 수용체 Ptc1(PTC1 경로), DNA 손상에 대한 반응에서 RB 종양억제자/체크포인트 신호전달(RB 경로), 및 E2F1 파괴경로(SKP2 E2F 경로)와 관련이 있다.

본 발명은 또한 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서

GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현 수준을 측정하는 단계; 및

상기 전사체의 발현 증가는 긍정적인 임상 결과 가능성의 증가로 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법을 제공한다.

상기 방법은 어레이 기반 방법일 수 있다.

상기 발현 수준이 하나 이상의 RNA 전사체의 발현 수준에 대해 표준화되는 것일 수 있다.

상기 임상 결과가 전체 생존율(Overall Survival, OS) 측면에서 표현되는 것일 수 있다.

상기 방법은 RNA 전사체 전체의 발현 수준을 측정하고 발현 증가를 분석하여 긍정적인 임상 결과 가능성의 증가 또는 감소를 판단하여 예후를 예측할 수 있다.

상기 방법은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는데 유용할 수 있다.

본 발명은 또한 환자로부터 얻은 핵산 시료에서

상기 단계에서 결정된 RNA의 발현도에 기초하여 상기 시료의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)의 설정치 범위가 50% 이상을 갖는 경우 고 위험군 환자, 25% 이상 내지 50% 미만인 경우 중간 위험군 환자, 25% 미만인 경우 저 위험군 환자로 분류하는 단계를 컴퓨터에 실행시키는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체를 제공한다.

상기 기록 매체는 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는데 유용한 매체를 제공할 수 있다.

상기 RS 및 RS(%)는 상기 수학식 1 및 2에 따라 계산할 수 있다.

상기 기록 매체는 전체 생존율(Overall Survival, OS) 측면에서 RS(%)의 설정치 범위가 50% 이상을 갖는 경우 고 위험군, 25% 이상 내지 50% 미만인 경우 중간 위험군, 25% 미만인 경우 저 위험군으로 판단할 수 있다. 즉, RS(%) 값이 50% 이상을 갖는 샘플을 고 위험군은 3년 이상, 6년 이상, 10년 이상의 기간 동안 전체 생존율이 낮다고 판단하고, 25% 미만인 저 위험군은 3년 이상, 6년 이상, 10년 이상 동안 전체 생존율이 높다고 판단한다. 상기 용어, 좋은 예후는 임상 결과의 긍정적 임상 결과 가능성의 증가로 표현될 수 있고, 나쁜 예후는 임상 결과의 긍정적 임상 결과 가능성의 감소로 표현될 수 있다.

달리 정의되지 않는다면, 본원에 사용된 기술 및 과학 용어들은 당업자 수준에서 일반적으로 이해하는 바와 같은 의미가 있다. 본 발명은 어떤 방식으로든 설명된 방법 및 재료로 제한되지 않는다. 본 발명의 목적상, 하기 용어들이 아래에서 정의된다.

용어, "마이크로어레이(microarray)"는 기질 상의 혼성화가능한 어레이 구성 요소, 바람직하게는 폴리뉴클레오티드 프로브의 규칙적인 배치를 말한다.

용어, "폴리뉴클레오티드"는 일반적으로 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 말하고, 예컨대 변형 또는 비-변형 RNA 또는 DNA일 수 있다. 본 명세서에서, "폴리뉴클레오티드"는 구체적으로 cDNA를 포함한다.

용어, "올리고뉴클레오티드"는 비제한적으로 한-가닥 데옥시리보뉴클레오티드, 한- 또는 두-가닥 리보뉴클레오티드, RNA:DNA 하이브리드 및 두-가닥 DNA를 포함하는, 비교적 짧은 폴리뉴클레오티드를 말한다. 올리고뉴클레오티드, 예를 들면 한-가닥 DNA 프로브 올리고뉴클레오티드는 종종 예를 들면 상업적으로 입수가능한 자동화 올리고뉴클레오티드 합성기를 사용하는 화학적 방법에 의해 합성된다. 그러나, 올리고뉴클레오티드는 시험관내 재조합 DNA-매개 기술을 포함하는 각종 다른 방법들에 의해 및 세포 및 유기체 중에서의 DNA 발현에 의해 제조될 수 있다.

용어, "차등적으로 발현된 유전자" 또는 "차등적인 유전자 발현"은 정상 또는 대조용 대상체의 발현에 비하여 위암과 같은 암을 앓는 대상체 중에서 더 높거나 낮은 수준으로 활성화되는 유전자를 말한다. 또한, 동일한 질병의 다른 병기에서 더 높거나 낮은 수준으로 활성화되는 유전자를 포함한다. 차등적으로 발현되는 유전자는 핵산 수준 또는 단백질 수준에서 활성화 또는 억제되거나, 다른 스플라이싱을 받아 상이한 폴리펩타이드 산물을 야기하는 경우일 수 있다. 이러한 차이는 예를 들면 폴리펩타이드의 mRNA 수준, 표면 발현, 분비 또는 다른 분배에 있어서의 변화에 의해 입증될 수 있다. 본 발명의 목적상, "차등적인 유전자 발현"은 정상 및 질병에 걸린 대상체에서 또는 질병에 걸린 대상체의 다양한 병기에서 주어진 유전자의 발현 사이에 약 1.5배 이상, 약 4배 이상, 약 6배 이상, 약 10배 이상의 차이가 있을 때 존재하는 것으로 간주 된다.

유전자 전사체 또는 유전자 발현 생성물에 관한 용어 "표준화된"은 기준 유전자 세트의 전사체/생성물의 평균 수준에 대한 전사체 또는 유전자 발현 생성물의 수준을 말하는데, 여기서 레퍼런스 유전자들은 환자, 조직 또는 치료에 걸쳐 이들의 최소한의 변동에 기준하여 선택되거나 ("하우스키핑 유전자(housekeeping genes)"), 또는 레퍼런스 유전자는 시험된 유전자들 전체를 말한다. 후자의 경우, 일반적으로 "전체 표준화(global normalization)"로 언급되는데, 시험된 유전자들의 총 수가 비교적 큰, 바람직하게는 50 초과인 것이 중요하다. 구체적으로, RNA 전사체에 관한 용어 '표준화된'은 기준 유전자 세트의 전사 수준의 평균에 대한 전사 수준을 말한다.

용어, "발현 역치" 및 "정의된 발현 역치"는 혼용하여 사용하며, 이 수준 이상에서는 유전자 또는 유전자 생성물이 환자 반응에 대한 예측 마커로서 사용되는 해당 유전자 또는 유전자 생성물의 수준을 말한다. 역치는 대표적으로 임상적 연구로부터 실험적으로 정의된다. 발현 역치는 최대 민감성, 또는 최대 선택성(예를 들면 한 약물에 대한 반응자들만을 선택하도록), 또는 최소 오차로 선택될 수 있다.

용어, "유전자 증폭"은 특정 세포 또는 세포주에서 유전자 또는 유전자 단편의 다수개의 복사물이 형성되는 과정을 말한다. 복제된 영역 (증폭된 DNA의 신장)은 종종 "암플리콘"으로 언급된다. 종종, 생산된 mRNA의 양, 즉 유전자 발현도는 또한 특정 유전자의 만들어진 복제 수에 비례하여 증가한다.

본 명세서에서, "예후"는 본원에서 암에 의한 사망 또는 위암과 같은 신생물성 질환의 진행(재발, 전이성 확산 및 내약물성 포함)의 가능성의 예측을 말하는데 사용된다. 용어 "예측"은 본원에서 환자가 주요 종양의 수술 제거 후에 암 재발 없이 특정 기간 동안 살아남게 될 가능성을 말하는데 사용된다. 이러한 예측은 임의의 특정 환자에 대하여 가장 적절한 치료 기법을 선택함으로써 치료를 결정하는데 임상적으로 사용될 수 있다. 이러한 예측은 환자가 치료 섭생, 예를 들면 수술 시술에 대하여 유리하게 반응하기 쉬운지, 또는 수술 종료 후에 환자의 장기간 생존이 가능한지를 예측하는데 있어서 귀중한 수단이 된다. 용어 "예후 지표" 는 "위험도 점수"와 혼용되어 사용할 수 있다.

달리 지시하지 않는 한, 분자 생물학(재조합 기술 포함), 미생물학, 세포 생물학 및 생화학의 종래 기술을 사용하여 본 발명을 수행할 수 있다.

1. 유전자 발현 프로파일 작성(Profiling)

유전자 발현 프로파일 작성 방법은 폴리뉴클레오티드의 혼성화 분석에 기초한 방법, 폴리뉴클레오티드의 서열화에 기초한 방법, 및 프로테오믹스 기재 방법을 포함한다. 예를 들어 mRNA 발현의 정량화를 위한 방법은 노던 블랏팅(northern blotting) 및 인 시츄 혼성화(in situ hybridization); RNAse 보호 검정시험; 및 PCR-기재 방법, 예를 들면 역 전사 폴리머라제 연쇄 반응(RT-PCR) 등을 포함한다. 또는, DNA 두 가닥, RNA 두 가닥, 및 DNA-RNA 하이브리드 두 가닥 또는 DNA-단백질 두 가닥을 포함하는 특정 두 가닥을 인식할 수 있는 항체들이 사용될 수 있다. 서열화-기재 유전자 발현 분석에서 대표적인 방법은 유전자 발현의 연속 분석(Serial Analysis of Gene Expression, SAGE) 및 대량적으로 평행한 시그너쳐 서열화(massively parallel signature sequencing, MPSS)에 의한 유전자 발현 분석을 포함한다.

2. 마이크로어레이

신선한 또는 파라핀에 매립된 종양 조직에서 암 관련 유전자의 발현 프로파일을 측정할 수 있다. 이 방법에서는, 관심을 갖는 서열(cDNA 및 올리고뉴클레오티드 포함)을 마이크로칩 기판상에 플레이팅 또는 배열시킨다. 배열된 서열들을 이어서 관심을 갖는 세포 또는 조직으로부터의 특정 DNA 프로브와 혼성화시킨다. RT-PCR 방법에서와 마찬가지로, mRNA의 공급원은 전형적으로 사람 종양 또는 종양 세포주, 및 대응하는 정상 조직 또는 세포주로부터 단리된 총 RNA이다. 따라서 RNA는 각종 주요 종양 또는 종양 세포주로부터 단리될 수 있다. 마이크로어레이 기술은 cDNA 클론의 PCR 증폭된 삽입물을 치밀한 어레이로 기판상에 제공한다. 바람직하게는, 10,000 이상의 뉴클레오티드 서열들을 기판에 가한다. 10,000 엘레멘트 각각으로 마이크로칩 상에 고정화된 미세배열된 유전자들이 엄격한 조건 하에서의 혼성화에 적합하다. 형광적으로 표지된 cDNA 프로브들이 관심을 갖는 조직으로부터 추출된 RNA의 역 전사에 의해 형광 뉴클레오티드의 혼입을 통해 생성될 수 있다. 칩에 가해진 표지된 cDNA 프로브는 어레이 상의 DNA 각 스팟에 특이성을 갖게 혼성화된다. 비-특이적으로 결합된 프로브들을 제거하기 위한 엄격한 세척 후, 칩을 동일초점 레이저 현미경에 의해 또는 다른 검출 방법, 예를 들면 CCD 카메라에 의해 주사한다. 각 배열된 엘레멘트의 혼성화에 대한 정량화는 대응하는 mRNA 과다의 평가를 가능하게 한다. 이중 색 형광의 경우, 2개의 RNA 공급원으로부터 생성된 별도로 표지된 cDNA 프로브가 어레이에 각 쌍 별로 혼성화된다. 따라서 각 명시된 유전자에 대응하는 2개의 공급원으로부터의 전사체의 상대적 과다가 동시에 결정된다. 소형화 규모의 혼성화가 많은 수의 유전자들에 대한 발현 패턴의 편리하고 신속한 평가를 제공한다. 이러한 방법은 희귀한 전사체(이것은 세포 당 소수개의 복사물로 발현됨)을 검출하는데 및 발현도에 있어서 적어도 대략 2배 차이로 재현 가능하게 검출하는데 필요한 민감성을 갖는 것으로 나타났다. 마이크로어레이 분석은 상업적으로 입수 가능한 장비에 의해 제조업체의 프로토콜에 따라, 예를 들면 아피매트릭스 겐칩(Affymetrix GenChip) 기술 또는 인사이트(Incyte's) 마이크로어레이 기술을 사용하여 수행될 수 있다.

3. mRNA 단리, 정제 및 증폭의 일반적인 설명

파라핀에 매립된 조직을 사용하여 유전자 발현 프로파일을 작성하는 기술은 상술한 바와 같다. 최종적으로 얻은 데이터를 분석하여 관찰된 종양 샘플에서 확인된 특징적인 유전자 발현 패턴에 기초하여 환자에게 이용할 수 있는 최상의 치료 선택사항(들)을 판별해낸다.

본 발명의 중요한 면은 위암 조직에 의한 특정 유전자의 측정된 발현을 사용하여 예후 정보를 제공하는 것이다. 이러한 목적을 위해, 검정시험된 RNA의 양, 사용된 RNA 품질에 있어서의 변동, 및 다른 인자, 예를 들면 기계 및 작업자 차이에 있어서의 차이에 대해 보정하는(표준화) 것이 필수적이다. 그러므로, 검정시험은 전형적으로 GAPD 및 ACTB와 같은 공지된 하우스키핑 유전자로부터 전사된 것들을 포함하는, 기준 RNA의 사용을 측정하여 혼입시킨다. 유전자 발현 데이터를 표준화하기 위한 정확한 방법은 문헌 ["User Bulletin #2" for the ABI PRISM 7700 Sequence Detection System (Applied Biosystems; 1997)]에 제공된다. 다르게는, 표준화는 검정시험된 유전자들 또는 이들의 많은 서브세트 전부의 평균 또는 중간 신호(Ct)를 기준으로 할 수 있다 (전체 표준화 접근법). 하기 실시예에 설명된 연구에서는, 소위 중심 표준화 전략을 사용하였는데, 이것은 표준화를 위해 임상적 성과와의 상관성 부족에 기초하여 선택된 스크리닝된 유전자의 서브세트를 이용하였다.

용어, "트레이닝 세트(Training set)"라 함은 예후에 통계적으로 유의한 RNA 전사체를 추출한 대상 샘플을 의미한다.

용어, "검증 세트(Validation set)" 또는 "테스트 세트(Test set)"라 함은 상기 추출된 변수가 실제로 예후의 좋고 나쁨을 판단할 수 있는 정확도를 테스트하는 세트를 의미한다. 이러한 방법을 사용하는 이유는 특정 샘플 군에서만 효과적으로 예후 판단 능력이 있는 것이 아니라 독립적 샘플에서도 효능이 있는 것을 판단하기 위해서이다.

4. 재발에 대한 위험도 점수 및 이들의 응용

위암 재발의 가능성에 대한 암 예후 방법을 구분 짓는 연산의 특징은 1) 재발 가능성을 측정하는데 사용된 독특한 시험 mRNAs 세트(또는 대응하는 유전자 발현 생성물), 2) 발현 데이터를 식으로 합치는데 사용된 특정 가중치, 및 3) 환자들을 상이한 수준의 위험을 갖는 군, 예를 들면 저, 중간 및 고 위험 군으로 나누는데 사용된 역치를 포함한다. 이 연산은 수치적인 위험도 점수(RS) 및 RS(%)를 산출해낸다.

시험은 명시된 mRNA 또는 이들의 발현 생성물의 수준을 측정하기 위한 실험실 검정시험을 필요로 하지만, 신선한 조직이거나 또는 냉동된 조직, 또는 이미 반드시 환자들로부터 수집되어 보관되어 있는 고정되어 파라핀에 매립된 종양 생검 시험편을 매우 소량으로 이용할 수 있다. 따라서, 시험은 비침입성일 수 있다. 예를 들면 코어 생검 또는 미세침 흡인을 통해 수확된 종양 조직의 몇 가지 상이한 방법들과 상용성이기도 하다. 이 방법에 따르면, 암 위험도 점수(RS)는

(a) 상기 대상체로부터 얻은 암 세포를 포함하는 생물학적 샘플로 유전자 또는 단백질 발현 프로파일을 작성하고;

(b) 다수개의 개별 유전자의 발현도 즉, mRNA 수준을 정량화하여 각 유전자에 대한 발현 값을 정하고;

(c) 각각 암-관련 생물학적 함수에 의해 및(또는) 동시발현에 의해 연결된 유전자들에 대한 발현 값을 포함하는, 유전자 발현 값들의 서브세트를 생성시키고;

(d) 한 서브세트 내의 각 유전자의 발현도에 상기 서브세트 내에서의 그의 암 재발 반응에 대한 상대적 기여도를 반영하는 계수를 곱하고 곱한 값을 더하여 상기 서브세트에 대한 값을 산출하고;

(e) 각 서브세트의 그 값에 그의 암 재발 반응에 대한 기여도를 반영하는 계수를 곱하고;

(f) 상기 계수를 곱한 각 서브세트에 대한 값들의 합을 구하여 위험도 점수(RS) 및 RS(%)를 얻음으로써 결정되는데, 여기서, 암 재발과 선형 상관관계를 보이지 않는 각 서브세트의 기여도는 단지 소정의 역치 값 이상에서만 포함되고,

명시된 유전자의 증가된 발현이 암 재발 위험을 감소시키는 서브세트에는 음의 값을 부여하고, 명시된 유전자의 발현이 암 재발 위험을 증가시키는 서브세트에는 양의 값을 부여한다.

구체적인 실시태양에서, RS 및 RS(%)는

(a) GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 측정하고,

(b) 하기 수학식 1 및 2에 의해 위험도 점수(RS) 및 RS(%)를 계산함으로써 결정된다:

[수학식 1]

[수학식 2]

상기 식에서,

여기서, RS(%) 값이 50% 이상이면 나쁜 예후이고, 25% 미만이면 좋은 예후인 것으로 판단한다.

이하, 본 발명을 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.

<제조예> 예후 예측 대상 선정 및 실험설계

예후 예측 대상 선정을 위해, 1999년 내지 2006년까지 연세대학교 세브란스 병원에서 일차 치료로 위 절제술을 받은 위선암 환자들(YUSH, n=78)에서 종양 표본 및 임상 데이터를 얻었다. 모든 샘플들은 환자로부터 상세하게 기재된 동의서를 받은 후 수집하였고, 연구는 연세대학교 세브란스 병원의 조사윤리위원회의 승인을 받았다. 임상 데이터는 소급하여 얻었다. 전체생존기간은 수술부터 사망에 이르는 시간으로 정하였고, 데이터는 환자가 마지막 접촉 시 살아있을 때 검열을 받은 것으로 간주하였다. YUSH 데이터는 예후 결과에 주로 원인이 있는 생물학적 특징을 규명하고, 트레이닝 데이터 세트(Training data set)로 그것을 이용하여 예후 예측 모델을 개발하는데 사용하였다.

예후 예측 모델 및 위험도 평점 시스템의 검증을 위해, 본 발명에서는 MD 앤더슨 암센터에서 만든 유전자 발현 프로파일을 사용하였다. 종양 표본 및 임상 데이터는 1999년에서 2006년까지 연세대학교 세브란스 병원, 고려대학교 구로병원 및 고신대학교 의과대학에서 일차 치료로 위 절제술을 받은 위선암 환자들로부터 얻었다. 모든 샘플들은 환자로부터 상세하게 기재된 동의서를 받은 후 수집하였고, 연구는 MD 앤더스 암센터의 조사윤리위원회의 승인을 받았다.

(유전자 발현 데이터)

YUSH 데이터 세트에서 78개의 샘플들에 대한 실험 및 분석은 연세대학교 세브란스 병원에서 수행하였다. 유전자 발현 프로파일은 48803개의 유전자 특징을 포함하는 Illumina human bead arrays(HumanHT-12, v3.0, Illumina, San Diego, CA)와 표지된 cRNAs를 혼성화시켜 만들었다. 총 RNA는 mirVana^TM RNA 분리 표지화 키트(Ambion, Inc.)를 사용하여 신선한 냉동 조직에서 추출하였다. 제조업체(Illumina)의 설명서에 따라 500ng의 총 RNA를 표지화 및 혼성화를 위해 사용하였다. 상기 비드 칩은 Illumina BeadArray Scanner로 스캐닝한 후 마이크로어레이 데이터는 R 언어 환경(Bolstad BM, 2003)에서 마이크로어레이 데이터(LIMMA) 패키지를 위한 선형모형에서 사분위수 표준화 방법에 따라 표준화하였다. 일차 마이크로어레이 데이터는 NCBI 유전자 발현 옴니버스(GEO) 공개 데이터베이스(microarray platform GEO0000, microarray data GEO0000)에서 이용할 수 있다. MDACC 데이터 세트에서 80개 샘플에 대한 실험 및 분석은 YUSH 데이터 세트에서 수행된 것과 같은 과정으로 MD 앤더스 암센터의 시스템 생물학부에서 수행하였다. MDACC 데이터 세트에 대한 일차 마이크로어레이 데이터는 NCBI 유전자 발현 옴니버스(GEO) 공개 데이터베이스(microarray platform GEO0000, microarray data GEO0000)에서 이용할 수 있다.

(마이크로어레이 데이터 분석)

클러스터 분석은 클러스터 및 트리뷰(http://rana.lbl.gov/EigenSoftware.htm)로 수행하였다. 클러스터 분석을 위해 로그 베이스 2 변환된 데이터는 각 유전자 발현 값에 대해 중간값을 기재하였다. 환자들 사이에 다른 발현 수준을 갖는 유전자들을 만들기 위해, 필터링 기준을 바꾸면서 연속 유전자 여과를 만들었다. unsupervised clustering analysis 은 연속 분산 여과 후 수행하였고, 2개의 주요 클러스터로 구성된 2개의 클래스의 예후적 차이는 log rank test 및 Kaplan Meier Plot 에 따라 시험하였다.

마이크로어레이 데이터 세트 분석을 위해 BRB ArrayTools Version 4.1 (http://linus.nic.nih.gov./BRB-ArrayTools.html)를 사용하였다. 주요 데이터 분석 전 및 사분위수 표준화 후에 데이터 세트에 대해 로그 베이스 2 변환을 적용하였다. 비교된 2개의 클래스 간에 유의적으로 다르게 발현된 유전자들을 동정하기 위해 2개 샘플의 t-테스트를 적용하였다. 주요 생물학적 기능 및 유전적 경로를 특성 규명하기 위해, Biocarta 데이터베이스에서 나열된 281개의 경로에 대해 GSEA(gene set enrichment analysis )를 수행하였다.

예후 예측 모형을 만들기 위해, YUSH 데이터를 트레이닝 세트로, MDACC 데이터 세트를 검증 세트로 사용하였다. 독립적인 환자 데이터 세트의 클래스를 예측하기 위해, 이미 개발된 3개의 다른 예측 알고리즘 기반 예측 모드(Linear Discriminant Analysis(LDA), Compound Covariate Predictor(CCP) 및 Nearest Centroid(NC))를 적용하였다. 2개의 샘플 테스트에 의해 평가될 때와 같이 상기 모형을 0.001 유의 수준에서 유전자들 사이에서 차등적으로 발현되는 것에 결합시켰다. 각 모형의 예측 오류를 추정하기 위해 단일잔류 교차검증(Leave-one-out cross-validation, LOOCV)을 사용하였다. 단일잔류 교차검증 트레이닝 세트를 위해, 유전자 선별을 포함하여 전체 모형-빌딩 프로세스를 반복하였다. 또한, 교차검증 오류율 추정치(cross-validated error rate estimate)가 유의적으로 1 미만인 것이 임의 예측으로부터 기대될 수 있는지를 평가하였다. 예측 모형의 예후력을 평가하기 위해 예측 모형을 위한 검증 데이터 세트를 사용하였고, Kaplan Meier Plot 및 log rank test을 사용하여 그 결과를 평가하였다.

분류된 환자 군의 예후 차이를 평가하기 위해 Kaplan Meier Plot 및 log rank test을 사용하였다.

공변량으로서 독립 예후 인자 관련 생존과, 유전자 특징, 종양 병기 및 병리학적 특징을 평가하기 위해 다변량 콕스 비례 위험 회귀 분석을 사용하였다.

(예후 위험도 평점 시스템의 개발)

종양발생 및 전이에 주로 원인이 있는 유전자들에 기초한 위험도 평점 시스템을 만들기 위해, CGAP에서 주석이 달린 유전자들로부터 기능적으로 분류된 유전자들의 예후적 영향을 수행하였다. 위험도 평점 시스템은 CGAP에서 주석이 달린 유전자들을 이용하여 만들었고, 콕스-회귀 분석(p<0.001)에서 유의적인 예후 값을 갖는다. 위험도 점수는 발현 값의 중간값에 위험 계수(hazard ratio, HR)를 곱하고, 그 값을 총 합하여 만들었다. HR 값이 1 미만인 경우 -1/HR로 변환하였다. 위험도 점수의 백분율(percentile risk score)은 다음 식에 따라 계산하였다:

RS(%)=100×(샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)

50% 이상의 RS(%)을 갖는 샘플은 고 위험군으로 분류하고, 25% 이상의 RS 백분율 및 50% 미만의 RS(%)을 갖는 샘플은 중간 위험군으로 분류하였다. 마지막으로 25% 미만의 RS(%)을 갖는 샘플은 저 위험군으로 분류하였다.

<실시예 1> NO 위암 환자들의 유전자 발현 프로파일 조사

필터링 기준을 바꾸면서 하는 연속 분산 여과는 독특한 2가지 주요 클러스터들을 갖는 15개 클러스터를 발생하였다. 분산 여과한 후 다수의 유전자는 5612개의 프로브에서 701개의 프로브에 이르기까지 다양하며, log rank test에서 p-값은 분산 여과 기준에 따라 최대 0.291(M2_1: 중간값과 비교하여 2배 이상의 증가 또는 감소를 나타내는 프로브들을 적어도 1개 갖는 유전자를 선택하여 분산 여과한 후 5612개의 프로브를 갖는 클러스터)에서 최소 0.0181(M3_3: 중간값과 비교하여 3배 이상의 증가 또는 감소를 나타내는 프로브들을 적어도 3개 갖는 유전자를 선택하여 분산 여과한 후 706개의 프로브를 갖는 클러스터)까지 다양하였다. 15개의 클러스터 중에서, 11개의 클러스터들은 unsupervised hierachical clustering analysis에서 log rank test에서 통계적으로 유의적인 예후적 차이를 나타내는 2가지 주요 클래스를 발생하였다(도 1a 및 표 1).

표 1

예후 결과에서 통계적 유의를 나타내는 11개의 클러스터를 사용하여 환자 샘플 패턴 분석을 수행한 결과, unsupervised clustering analysis에 따라 발생한 2개의 클래스의 구성은 필터링 기준에 상관없이 꽤 유사한 패턴을 나타냈고, 샘플 구성의 2개의 다른 패턴들을 보여주며, 심지어 각 클래스의 하나 또는 2개의 샘플들은 필터링 기준에 따른 분류에서 차이를 나타냈다(도 1b). 따라서, 샘플 구성의 2개의 다른 패턴을 나타내는 2개의 클러스터를 선택하였다(도 2).

M2_5(중간값과 비교하여 2배 이상의 증가 또는 감소를 나타내는 프로브들을 적어도 5개 갖는 유전자를 선택하여 분산 여과한 후 1556개의 프로브를 갖는 클러스터)의 좋은 예후 군은 단지 1명의 사망 환자를 갖지만(4% 사망률), 나쁜 예후 군은 15명의 사망 환자(28% 사망률)(log rank test p=0.0279, 도 1c)를 갖는다. M3_3의 좋은 예후 군은 단지 2명의 사망 환자(6% 사망률)를 갖지만, 나쁜 예후 군은 14명의 사망 환자(29.8% 사망률)를 갖는다(log rank test p=0.0181, 도 1d).

<실시예 2> 2개의 주요 클러스터들의 생물학적 특징

예후 결과에서 이러한 차이를 나타내는 2개의 클래스의 주요 유전적 특징을 정의하기 위해, 2개의 샘플에 대한 t-테스트를 수행하였다. unsupervised clustering analysis 후 M2_5의 2개의 주요 클러스터를 나타내는 2개의 클래스의 비교는 2886개의 유의적으로 다른 프로브를 생성했다(p<0.001).

도 3A는 M2_5의 2개의 클래스의 비교에서 통계적 유의(p<0.001)를 갖는 2배 이상의 차이를 보여주는 프로브를 이용한 조건부 클러스터링 분석의 히트맵을 나타낸 것이다. 면역 반응에 관련된 많은 유전자들(IFNG, GZMA, GZMB, CD8A, STAT1, JAK2, HLADPA1)이 좋은 반응 군에서 발현이 매우 증가하였다.

Biocarta 경로 데이터베이스에서 이들 2개의 클래스의 GSEA를 수행하였을 때, 가장 유의적으로 향상된 경로는 통계적 유의(p=0.00001)를 갖는 항원 프로세싱 및 제시(Antigen Processing and presentation)(MHC 경로)와 IFN 감마 신호전달경로(IFNG 경로)였다. 이들 2개의 주요 신호전달경로를 제외하고, Th1/Th2 분화(TH1TH2 경로), 표적세포에 대한 CTL 매개 면역 반응(CTL 경로), NK 세포에서 NO2 의존성 IL12 경로(NO2IL12 경로), T 세포 활성화에서 Tob의 역할(TOB1 경로), Th1 발달 시 IL12 및 Stat4 의존적 신호전달경로(IL12 경로) 및 T 세포독성 세포 표면 분자(T 세포독성경로)는 면역반응에 관련된 신호전달경로이며, Biocarta 경로 데이터베이스의 GSEA에서 유의적으로 향상되어 있다(도 4A). 유의적으로 향상된 각 경로의 유전자 성분들은 좋은 예후 군에서 면역 활성화와 관련된 유전자들의 일방향성 활성화를 나타냈다(도 5a-f).

unsupervised clustering analysis 후 M3_3의 2개의 주요 클러스터를 나타내는 2개의 클래스의 비교는 2680개의 유의적으로 다른 프로브를 생성하였다(p<0.001).

도 3B는 M3_3의 2개의 클래스의 비교에서 통계적 유의(p<0.001)를 갖는 3배 이상의 차이를 보여주는 프로브를 이용한 조건부 클러스터링 분석의 히트맵을 나타낸 것이다. 세포증식(CCNE1, CCNA2, CDCA5, AURKA, E2F7, CDC25A)에 관련된 유전자들과 DNA 복구에 관련된 유전자(TOP2A)가 좋은 반응 군에서 발현이 매우 증가하였다.

Biocarta 경로 데이터베이스에서 이들 2개의 클래스의 GSEA를 수행한 결과, 가장 유의적으로 향상된 경로는 암 감수성(ATR BRCA 경로)에서 BRCA1, BRCA2 및 ATR의 역할, DNA 손상(cdc25 경로)에 대한 반응에서 cdc25 및 chk1 조절 경로, 사이클린 및 세포주기조절(세포주기 경로), 사이클린 E 파괴 경로(FBW7 경로), 세포주기:G1/S 체크포인트(G1 경로), 세포주기:G2/M 체크포인트(G2 경로), CDK 조절(MCM 경로), 세포주기 진행 중 p27 인산화 조절(P27 경로), 세포주기를 조절하는 Sonic Hedgehog(SHH) 수용체 Ptc1(PTC1 경로), DNA 손상에 대한 반응에서 RB 종양억제자/체크포인트 신호전달(RB 경로), 및 E2F1 파괴경로(SKP2 E2F 경로)이다(도 4B, p=0.00001).

유의적으로 향상된 각 경로의 유전자 성분들은 좋은 예후 군에서 세포 증식과 관련된 유전자들의 일방향성 활성화를 나타냈다(도 6a-f).

<실시예 3> 예후 예측 모형의 생성

예후 예측 모형을 만들기 위해, 3개의 다른 예후 예측 알고리즘, 즉, Compound Covariate Prediction (CCP), Linear Discriminant Analysis (LDA), Nearest Centroid(NC)를 사용하였다. 분류군 예측을 위해 0.001 유의 수준에서 2개의 클래스 사이에 유의적으로 다른 유전자들을 사용하였고, 단일잔류 교차검증법을 사용하여 정정예측비를 계산하였다.

M3_3 분류군에 대한 Training data set (YUSH 데이터 세트)에서 2개의 예측된 군 사이의 예후적 차이는 통계적으로 유의하였고(log rank test, CCP: p=0.00933, LDA: p=0.0137 및 NC: p=0.00217), M3_3의 분류군을 위한 정정예측비는 85% 내지 92% (CCP:86%, LDA:85% 및 NC:92%)까지 다양하였다(도 7A-C).

MDACC 데이터 세트는 분류군의 검증을 위해 사용하였다. MDACC 테스트 데이터 세트 환자들(80명의 환자)의 예측 결과는 예후 결과에서 Training YUSH data set와 유사한 패턴을 나타내었다. 예후적 차이는 통계적으로 유의하였고(log rank test, CCP: p=0.00645, LDA: p=0.00372 및 NC: p=0.0247), 좋은 예후로 분류된 군은 CCP의 경우 3.3% 사망률(30명의 환자 중 1명의 환자가 사망함), LDA의 경우 3.2% 사망률(31명의 환자 중 2명의 환자가 사망함), NC의 경우 6.45% 사망률(31명의 환자 중 2명의 환자가 사망함)을 갖는 좋은 예후 결과를 나타냈다. 또한, 나쁜 예후 군으로 분류된 군은 CCP의 경우 30%의 사망률(50명의 환자 중 15명의 환자가 사망함), LDA의 경우 30.6% 사망률(49명의 환자 중 15명의 환자가 사망함), NC의 경우 28.6% 사망률(49명의 환자 중 14명의 환자가 사망함)을 갖는 나쁜 예후 결과를 나타냈다(도 7D-F).

총 샘플의 예측된 결과는 log rank test의 p-값이 CCP 및 LDA의 경우 0.000111를, NC의 경우 0.000012를 가지면서 3개의 다른 알고리즘 모두에 대해 2개의 주요 클래스 간의 꽤 강력한 예후적 차이를 나타냈다(도 7G-I).

비록 정정분류비(correct classification rate)는 M3_3 분류군(CCP 92%, LDA 90% 및 NC 95%) 보다 훨씬 더 높았으나 M2_5에 대한 테스트 데이터 세트에서 예측된 결과는 통계적으로 유의하지 않았다(log rank test, CCP: p=0.0948, LDA: p=0.056 및 NC: p=0.06)(도 8A-C).

MDACC 테스트 데이터 세트 환자들의 예측된 결과는 보다 강력한 통계적 유의를 갖는 예후 결과에서 Training YUSH data set와 유사한 패턴을 보여주고 있다. 예후적 차이는 통계적으로 유의하고(log rank test, CCP: p=0.0155, LDA: p=0.0155 및 NC: p=0.0214), 좋은 예후로 분류된 군은 CCP, LDA, 및 NC의 경우 3.8% 사망률(26명의 환자 중 1명의 환자가 사망함)을 갖는 좋은 예후 결과를 보여주고 있다. 또한, 나쁜 예후 군으로 분류된 군은 CCP, LDA 및 NC의 경우 27.8% 사망률(54명의 환자 중 15명의 환자가 사망함)을 갖는 나쁜 예후 결과를 보였다(도 8D-F). 총 샘플의 예측된 결과는 log rank test에서 p-값이 CCP의 경우 0.00377, LDA의 경우, 0.00203, NC의 경우 0.00284를 가지면서 3개의 다른 알고리즘 모두에서 꽤 강력한 예후 결과를 나타냈다(도 8G-I).

<실시예 4> NO 위암 환자의 예후에 영향을 주는 CGAP로부터 기능적 유전자 분류

NIH에서 CGAP로부터 유전자 주석은 주로 종양생성, 종양진행 및 암 전이에 영향을 주는 기능적 유전자 분류를 특징으로 하고 있다. 따라서, 이들 기능적 유전자 분류에 기초한 예후 특성규명은 이들 접근법이 암의 어떤 병기의 예후에 주로 원인이 되는 주요 생물학적 특징들을 나타낼 때 꽤 유익하다. 따라서, 본 발명자들은 YUSH (n=78) 및 MDACC (n=80) 및 합친 총 환자들 데이터 세트(n=158)로부터 2개의 데이터 세트로부터 각 유전자 분류의 영향을 시험하였다.

기능적 유전자 분류를 가지고 실시한 unsupervised hierachical clustering analysis 에 의해 생성된 주요 클러스터의 예후 결과는 2개의 다른 데이터 세트 사이에 다양하였다. 신생혈관생성은 YUSH 데이터로부터 CGAP에서 통계적 유의를 나타내는(log rank test p=0.0215) 유일한 기능적 분류인 반면, MDACC 데이터 세트는 신생혈관생성(p=0.0337), DNA 손상(p=0.0188), DNA 복제(p=0.0402), 전이(p=0.0235), 신호전달(p=0.0176) 및 전사인자(p=0.0000706)에서 통계적 유의를 나타냈다. 합친 환자들 데이터 세트는 세포사멸 및 발생을 제외하고는 대부분 기능적 유전자 분류에서 유의를 나타냈다(도 9A).

총 샘플의 기능적 유전자 분류의 프로브를 사용하여 unsupervised hierachical clustering analysis 에 의해 정의된 2개의 클래스에 대해 Biocarta 경로 데이터 베이스의 GSEA를 수행한 결과, 기능적 유전자 분류는 유의적으로 다른 유전자 세트 분류의 2가지 다른 패턴을 나타냈다. 대부분의 세포증식에 관련된 유전자 세트(DNA 복제의 CDK 조절, E2F1 파괴경로, 세포주기: G1/S 체크 포인트, 세포주기: G2/M 체크 포인트, DNA 손상에 대한 반응에서 CDC25 및 chk1 조절 경로)는 DNA 복제, DNA 손상, 유전자 조절, 대사 및 전사인자의 기능적 유전자 분류의 프로브에 의해 만들어진 2개의 클래스의 비교에서 유의적으로 향상되었다. 전이, 면역, 신생혈관생성, 세포 신호전달, 신호전달 및 세포주기의 기능적 유전자 분류는 면역반응(T 세포 활성화에서 Tob의 역할, TCR 활성화, T 세포 수용체 및 CD3 복합체의 개시에서 Lck 및 Fyn 티로신 키나아제, T 헬퍼 세포 표면 분자, NK 세포 및 B 세포 수용체 복합체에서 NO2 의존적 IL12 경로), 특히 T 세포 관련 면역 반응에 관련된 유전자 세트에서 가장 유의적인 차이를 나타냈다. M2_5 및 M3_3 클러스터를 사용하여 만든 2개의 클래스의 예후적 차이에 영향을 주는 생물학적 특징들에 원인이 되는 2가지 주요 생물학적 특징을 상기시킨다(도 9B).

<실시예 5> 예후 위험도 평점 시스템의 생성

unsupervised clustering analysis 후 각 클래스에서 만든 사망률과 2개의 분류군 M3_3 및 M2_5의 예측된 결과로 환자들을 배열하였을 때, 어떤 환자들은 분류군 및 기능적 유전자 분류에서 정의된 클러스터의 타입에 따라 다른 클래스로 분류됨을 발견하였다. 따라서, 특징 또는 분류군의 특정 타입에 기초한 분류 및 예후 예측은 비록 정의된 클래스가 log rank test의 예후 비교에서 통계적 유의를 나타낸다 하더라도 완전히 예후 결과를 나타내는 것은 아니었다(도 10A). 주로 위암 환자의 복잡한 생물학적 특징들 때문이며, 위암 환자들의 예후 결과에 영향을 주는 생물학적 또는 생리학적 특징들의 모든 측면을 고려하는 것이 중요함을 암시한다.

따라서, 다음으로 각 기능적 유전자 분류의 예후 결과의 차이에 원인이 되는 주요 생물학적 특징들을 반영하기 위해 기능적 유전자 분류에서 예후적 차이에 원인이 되는 유전자들을 조사하였다. 콕스 회귀 분석에서 통계적 유의(p<0.001)를 갖는 51개의 유전자를 선별하고, 예후 위험도 평점 시스템의 백분율을 만드는데 사용하였다(표 2). 예후 프로브는 CGAP에서 주석이 달린 프로브들로부터 콕스회귀분석(p<0.001)에 따라 선택되었다.

표 2

총 환자들(n=158)에서 21명의 환자들은 50% 이상의 위험도 점수를 보여주는 위험도 평점 시스템의 백분율에 기초하여 고 위험군으로 지정하였다. 고 위험군 환자들에 대한 사망률은 총 샘플에서 61.9%를 보여주어 극히 높았고, 2개의 데이터 세트 환자들은 꽤 유사한 임상 결과를 나타냈다(YUSH: 54.5% 사망률, MDACC: 70% 사망률).

70명의 환자들을 중간 위험군(25% 이상 내지 50% 미만의 위험도 점수)으로 지정하였고, 중간 위험군에 대한 사망률은 20%였다. YUSH 데이터 세트에 대한 임상 결과는 YUSH 환자들에 대한 25%의 사망률을 보여주는 MDACC 데이터 환자들보다 약간 더 나쁜 반면, MDACC 데이터 환자들에 대해서는 16%의 사망률을 보여주었다. 총 67명의 환자들은 저 위험군으로 지정하였고, 총 샘플 데이터에서 7.45%의 사망률을 나타냈다. YUSH 데이터 환자들은 9%의 사망률을 갖는 MDACC 데이터 환자들과 비교하여 약간 더 좋은 예후를 보여주는 5.7%의 사망률을 보여주었다(도 10B-D).

예후적 차이는 명백하게 3개의 다른 위험군은 총 데이터 세트에서 log rank test에서 p-값이 1.36 e-07으로 매우 강력한 통계적 유의를 나타냈다. YUSH 데이터 세트는 log rank test에서 p-값이 0.00254를 나타냈고, MDACC 데이터 세트는 log rank test에서 p-값이 1.11e-05를 나타냈다(도 10E-F).

본 발명은 위암 재발 예후 예측 분야에서 진단 키트로 사용할 수 있다.

Claims

대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서

GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및

상기 단계에서 결정된 RNA 전사체의 발현도에 기초하여 상기 생물학적 샘플의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 상기 RS(%)에 따라 예후를 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법.
제1항에 있어서,

RS 및 RS(%)은 하기 수학식 1 및 2에 따라 계산하는 방법:

[수학식 1]

RS=HR₁*normLogTransValue₁ + HR₂*normLogTransValue₂ + ... + HR_n* normLogTransValue_n

[수학식 2]

RS(%)=100×(생물학적 샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)

상기 식에서,

HR_n는 n번째 RNA 전사체의 위험 계수(hazard ratio)를 나타내고, 상기 HR_n이 1 미만인 경우 -1/HR_n로 변환하여 사용하며,

normLogTransValue_n는 n번째 RNA 전사체의 발현과 관련된 값이고, 이 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값이며,

상기 모집단은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암을 갖는 일정 수의 집단을 의미하고, 일정 수는 RS 최고값과 최소값을 산출할 수 있는 정도의 임의의 정수이다.
제1항에 있어서,

상기 방법이 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것인 방법.
제1항에 있어서,

상기 방법은 전체 생존율(Overall Survival, OS) 측면에서 생물학적 샘플의 RS(%)가 50% 이상을 갖는 경우 고 위험군, 25% 이상 내지 50% 미만인 경우 중간 위험군, 25% 미만인 경우 저 위험군으로 판단하는 것인 방법.
대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서

GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현 수준을 측정하는 단계; 및

상기 전사체의 발현 증가는 긍정적인 임상 결과 가능성의 증가로 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법.
제5항에 있어서,

상기 방법이 어레이 기반 방법인 방법.
제5항에 있어서,

상기 임상 결과가 전체 생존율(Overall Survival, OS) 측면에서 표현되는 것인 방법.
제5항에 있어서,

상기 방법이 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것인 방법.
위암의 예후 예측을 실행하는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체에 있어서, 환자로부터 얻은 핵산 시료에서

GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및

상기 단계에서 결정된 RNA의 발현도에 기초하여 상기 시료의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)의 설정치 범위가 50% 이상을 갖는 경우 고 위험군 환자, 25% 이상 내지 50% 미만인 경우 중간 위험군 환자, 25% 미만인 경우 저 위험군 환자로 분류하는 단계를 컴퓨터에 실행시키는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체.
제9항에 있어서,

상기 RS 및 RS(%)은 하기 수학식 1 및 2에 따라 계산하는 것인 기록 매체:

[수학식 1]

RS=HR₁*normLogTransValue₁ + HR₂*normLogTransValue₂ + ... + HR_n* normLogTransValue_n

[수학식 2]

RS(%)=100×(생물학적 샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)

상기 식에서,

HR_n는 n번째 RNA 전사체의 위험 계수(hazard ratio)를 나타내고, 상기 HR_n이 1 미만인 경우 -1/HR_n로 변환하여 사용하며,

normLogTransValue_n는 RNA 전사체의 발현과 관련된 값이고, 이 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값이며,

상기 모집단은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암을 갖는 일정 수의 집단을 의미하고, 일정 수는 RS 최고값과 최소값을 산출할 수 있는 정도의 임의의 정수이다.
제9항에 있어서,

상기 기록 매체는 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것인 기록 매체.