WO2014038884A1

WO2014038884A1 - 융합 단백질 및 이를 포함하는 암 진단용 조성물

Info

Publication number: WO2014038884A1
Application number: PCT/KR2013/008066
Authority: WO
Inventors: 서정선; 김영태; 주영석; 김은희; 강진형
Original assignee: 주식회사 마크로젠; 서울대학교산학협력단; 가톨릭대학교 산학협력단
Priority date: 2012-09-07
Filing date: 2013-09-06
Publication date: 2014-03-13

Abstract

융합 단백질의 암 진단 마커 및/또는 치료 타겟으로서의 용도와 관련된 것으로, 서로 다른 두 개의 단백질 단편이 융합된 융합 단백질, 상기 융합 단백질과 상호작용하는 물질을 포함하는 암 진단용 조성물, 이를 이용하여 암 진단에 정보를 제공하는 방법, 상기 융합 단백질의 억제제를 포함하는 암 예방 및/또는 치료용 조성물, 및 융합 단백질을 이용한 암 치료제 스크리닝 방법이 제공된다.

Description

융합 단백질 및 이를 포함하는 암 진단용 조성물

융합 단백질의 암 진단 마커 및/또는 치료 타겟으로서의 용도와 관련된 것으로, 융합 단백질, 상기 융합 단백질과 상호작용하는 물질을 포함하는 암 진단용 조성물, 이를 이용하여 암 진단에 정보를 제공하는 방법, 상기 융합 단백질의 억제제를 포함하는 암 예방 및/또는 치료용 조성물, 및 융합 단백질을 이용한 항암제 스크리닝 방법에 관한 것이다.

폐암은 인간에게 있어서 가장 흔하게 발병하는 암 중 하나이며, 세계적으로 암 관련 사망의 주된 원인이 되고 있다. 저선량 컴퓨터 단층촬영 스크리닝 기법이 도입되면서 초기 진단 비율이 높아지고 있지만, 폐암은 여전히 예후가 매우 좋지 않은 치명적인 질병이다. 폐암은 조직병리학적 관점에서 다음과 같이 분류될 수 있다: 폐선암은 비흡연자 또는 소량 흡연자 및 여성 환자에서도 빈번하게 발생하는 가장 흔한 유형이다. 과거 10년 동안, 폐선암은 폐암 연구의 중심이 되어 왔으며, 본 발명에서의 폐선암에 대한 이해는 병리학, 분자생물학, 유전학, 방사선학 및 임상 치료를 포함하는 모든 측면에서 진전된 것이다.

특히, 수반되는 주요한 유전적 변형(alterations)과 신호 경로의 이해의 진전은 기본적인 유전적 변화에 기초한 폐선암의 재분류를 제안한다. 핵심 돌연변이(driver mutations)라 불리는 이러한 유전적 변형을 갖는 암세포들은 이러한 변형을 갖지 않는 세포들과 비교하여 생존 및 성장에 있어서 이점을 갖는다. 핵심 돌연변이는 카이네이즈와 같은 신호화 단백질을 암호화하는 유전자에 발생하며, 이는 종양 발생을 개시하고 유지하는 구성적으로 활성이 있는 생존 신호를 발생시킬 수 있다. 현재, 폐선암에 있어서 약 10개의 핵심 돌연변이가 알려져 있으며, 이들 변형을 타겟팅하는 몇몇 약물이 최근 시험에서 주목할만한 성과를 보이는 것으로 보고되어 있다. 예컨대, 상피성장인자(EGFR) 타이로신 카이네이즈 억제제인 게피티닙(gefitinib)은 반응 응답률이 약 70%정도이며, EGFR-활성화 변이를 갖는 환자가 10개월 동안 종양 진행 없이 생존할 수 있도록 하였으며, 이러한 결과는 최근의 임상시험 중인 백금 기반 이중 화학요법 (platinum-based doublet chemotherapy)보다 우수한 효과이다. 역형성림프종 카이네이즈(anaplastic lymphoma kinase; ALK) 및 MET 타이로신 카이네이즈에 대한 이중 억제제인 크리조티닙(Crizotinib)은 ALK 융합 유전자를 포함하는 폐암 환자에 효과가 있는 것으로 입증되었다. 이와 같은 중추적인 연구들로부터, 폐선암의 치료 전략은 조직 기반 접근에서 핵심 돌연변이 관련 치료법으로 옮겨가고 있다. 최근 많은 연구에도 불구하고, 폐선암의 약 40%의 분자 수준 조종자(driver)가 아직 밝혀지지 않고 있다. 흥미롭게, 몇몇 핵심 돌연변이의 발생 빈도는 민족간 상당한 차이가 있으며, 따라서 폐암의 새로운 신약 타겟(druggable targets) 및 표적 치료를 개발하기 위하여 광범위한 유전적 연구가 필요한 것으로 나타났다.

이에 본 발명자들은 인간 고형 종양, 특히 폐암에서 특이적으로 서로 다른 두 개의 단백질의 전부 또는 일부가 융합된 형태의 융합 단백질의 발현 및/또는 이를 암호화하는 유전자의 존재가 관찰됨을 확인하여 본 발명을 완성하였다.

따라서, 본 발명의 일례는 다음으로 이루어진 군에서 선택되는 융합 단백질을 제공한다:

APLP2 단백질 또는 그의 단편과 TNFSF11 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질;

MAP4K3 단백질 또는 그의 단편과 PRKCE 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질;

BCAS3 단백질 또는 그의 단편과 MAP3K3 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질;

KRAS 단백질 또는 그의 단편과 CDH13 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질;

ZFYVE9 단백질 또는 그의 단편과 CGA 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질;

ERBB2IP 단백질 또는 그의 단편과 MAST4 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질;

TPD52L1 단백질 또는 그의 단편과 TRMT11 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질; 및

TXNRD1 단백질 또는 그의 단편과 GPR133 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질.

다른 예는 NM_004719의 엑손 1의 뉴클레오타이드 서열로 이루어진 SCAF11의 5UTR 부위와 NM_006206의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열로 이루어진 PDGFRA 유전자 단편이 융합된 SCAF11-PDGFRA 융합 유전자를 제공한다.

또 다른 예는 상기 융합 단백질을 암호화하는 융합 유전자를 제공한다.

상기 융합 단백질 또는 융합 유전자는 암 진단 마커로 사용 가능하다.

또 다른 예는 상기 융합 단백질 및/또는 상기 융합 단백질을 암호화하는 융합 유전자 및/또는 SCAF11-PDGFRA 융합 유전자 및/또는 상기 융합 유전자에 상응하는 mRNA와 상호작용하는 물질을 포함하는 암 진단용 약학 조성물을 제공한다.

또 다른 예는 환자로부터 얻은 생물 시료에서 상기 융합 단백질 및/또는 상기 융합 단백질을 암호화하는 융합 유전자 및/또는 SCAF11-PDGFRA 융합 유전자 및/또는 상기 융합 유전자에 상응하는 mRNA를 검출하는 단계를 포함하는 암 진단 방법 또는 암 진단에 정보를 제공하는 방법을 제공한다.

또 다른 예는 상기 융합 단백질 억제제 및/또는 상기 융합 단백질을 암호화하는 융합 유전자의 억제제 및/또는 SCAF11-PDGFRA 융합 유전자의 억제제, 및/또는 상기 융합 유전자에 상응하는 mRNA의 억제제를 유효성분으로 포함하는 암 예방 및/또는 치료용 약학 조성물을 제공한다.

또 다른 예는 상기 융합 단백질 억제제 및/또는 상기 융합 단백질을 암호화하는 융합 유전자의 억제제 및/또는 SCAF11-PDGFRA 융합 유전자의 억제제, 및/또는 상기 융합 유전자에 상응하는 mRNA의 억제제를 암의 예방 또는 치료를 필요로 하는 환자에게 투여하는 단계를 포함하는, 암 예방 또는 치료 방법을 제공한다.

또 다른 예는 상기 융합 단백질 억제제 및/또는 상기 융합 단백질을 암호화하는 융합 유전자의 억제제 및/또는 SCAF11-PDGFRA 융합 유전자의 억제제, 및/또는 상기 융합 유전자에 상응하는 mRNA의 억제제를 포함하는 조성물의 암의 예방 또는 치료에 사용하기 위한 용도를 제공한다.

또 다른 예는 상기 융합 단백질 또는 SCAF11-PDGFRA 융합 유전자를 발현하는 세포에 후보 물질을 처리하여 융합 단백질 발현 수준을 측정하는 단계를 포함하고, 상기 후보 물질을 처리하기 전 또는 후보 물질을 처리하지 않은 세포와 비교하여 상기 융합 단백질 또는 융합 유전자의 발현 수준이 감소한 경우, 상기 후보물질을 항암제로 선택하는 것을 특징으로 하는, 항암제 스크리닝 방법을 제공한다.

암 환자에게 적절하게 표적화된 요법을 적용하기 위하여 암의 분자적 특성을 이해하는 것이 중요하다. 유전자 발현, 점돌연변이, 융합 유전자, 대체적 스플라이싱(alternative splicing) 등의 암의 전반적인 유전적 기초를 이해하기 위한 효과적인 수단 중 하나로 대규모의 parallel RNA sequencing을 들 수 있다.

이에, 본 발명자들은 대표적인 고형암인 폐암을 대상으로 연구하였다. 구체적으로, 한국인 환자로부터 얻은 200개의 폐선암 수술 표본에서 유전적 변형을 광범위하게 조사하였으며, 이 중에서 87개는 대응하는 인접 정상 조직 샘플에 대한 전사체 시퀀싱(transciptome sequencing)(n=77) 및 전체 엑솜 시퀀싱(whole-exome sequencing)(n=76)과 조합된 전사체 시퀀싱에 의하여 분석하여, 폐암에 특이적인 융합단백질을 확인하여 본 발명을 완성하였다. 전사체 시퀀싱은, 체세포 점돌연변이 뿐 아니라 융합 유전자 및 대체적 스플라이싱(alternative splicing)과 같은 이상 RNA 변이체를 시험할 수 있기 때문에, 암에서의 핵심 돌연변이를 검출하는 적합한 방법이다. 유전자 기술의 진전에 의하여 암의 광범위한 게놈 분석이 가능해졌지만, 본 발명은 RNA 시퀀싱을 사용한 최초의 대규모 폐선암 연구이다.

보다 구체적으로, 한국인 환자로부터 얻어진 87개의 외과 수술 표본의 전사체(transcriptome)를, 77개의 인접하는 정상 조직의 엑솜(exome) 및 RNA 시퀀싱 결과와 조합하여 분석하였다. 유전자 발현 양상은 흡연자로부터 얻은 암조직에서 보다 강한 변태(perturbation)를 나타낸다. 또한, EGFR, KRAS, NRAS, BRAF, PIK3CA, MET 및 CTNNB1와 같은 transforming gene들에서의 체세포 돌연변이를 확인하였다. EGFR 돌연변이 빈도는 한국인 환자에게서 극단적으로 높게(~60%) 나타났으며, 이는 아시아인들에서 우세한 EGFR의 반수체형(haplotype)에 의하여 설명될 수 있다. 본 발명자들은 ALK, RET, ROS1 및 다른 타이로신 카이네이즈 유전자들(FGFR2, PDGFRA 및 AXL 등)을 포함하는 30개 키메릭 전사체를 동정하였으며, 이들은 폐암에서의 핵심 돌연변이(driver mutation)일 가능성이 매우 높을 것으로 보인다.

상기 연구 결과, 암(예컨대, 비소세포성 폐암, NSCLC) 환자의 수술 표본에서 상기 수술 표본과 동일한 조직 내의 주변 정상 조직 샘플에서는 발견되지 않고 암 조직에서 특이적으로 발현되는 변이로서 동일한 염색체 또는 상이한 염색체에 위치하는 두 유전자가 융합된 융합 유전자 및/또는 상기 융합 유전자가 발현되어 생성된 융합 단백질이 존재함을 확인하였다.

본 발명에서 확인된 암 조직 (예컨대 폐암 조직)에서 특이적으로 존재하는 융합 유전자를 다음의 표 1에 정리하였다:

표 1

	Donor Gene	Acceptor Gene	Chromosome (Donor;Acceptor)	Distance (Mb)
1	CCDC6	ROS1	chr10(q21.2);chr6(q22.1)	Interchromosomal
2	SCAF11	PDGFRA	chr12(q12);chr4(q12)	Interchromosomal
3	FGFR2	CIT	chr10(q26.13);chr12(q24.23)	Interchromosomal
4	AXL	MBIP	chr19(q13.2);chr14(q13.3)	Interchromosomal
5	APLP2	TNFSF11	chr11(q24.3);chr13(q14.11)	Interchromosomal
6	MAP4K3	PRKCE	chr2(p22.1);chr2(p21)	6.215
7	BCAS3	MAP3K3	chr17(q23.2); chr17(q23.3)	2.23
8	KRAS	CDH13	chr12(p12.1);chr16(q23.3)	Interchromosomal
9	ZFYVE9	CGA	chr1(p32.3);chr6(q14.3)	Interchromosomal
10	ERBB2IP	MAST4	chr5(q12.3);chr5(q12.3)	0.515
11	TPD52L1	TRMT11	chr6(q22.31); chr6(q22.32)	0.723
12	TXNRD1	GPR133	chr12(q23.3);chr12(q24.33)	26.694

상기 표 1에 기재된 융합 유전자는 암 조직에 특이적으로 관찰되는 것으로 확인되었으므로, 상기 융합 유전자 및/또는 상기 융합 단백질은 암 진단을 위한 바이오마커 및 암 치료를 위한 타겟으로서 유용하다.

이에, 본 발명의 일례는,

CCDC6 단백질 또는 그의 단편과 ROS1 단백질 또는 그의 단편이 융합된 CCDC6-ROS1융합 단백질;

FGFR2 단백질 또는 그의 단편과 CIT 단백질 또는 그의 단편이 융합된 FGFR2-CIT 융합 단백질;

AXL 단백질 또는 그의 단편과 MBIP 단백질 또는 그의 단편이 융합된 AXL-MBIP 융합 단백질;

TXNRD1 단백질 또는 그의 단편과 GPR133 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질

로 이루어진 군에서 선택된 융합 단백질을 제공된다.

다른 예는 상기 융합 단백질을 암호화하는 융합 유전자(폴리뉴클레오타이드 분자)를 제공한다.

상기 융합 단백질 및/또는 이를 암호화하는 융합 유전자는 암의 진단 마커로서 유용하게 사용될 수 있다.

이하 상기 융합 파트너와 융합 단백질을 보다 상세히 설명한다. 본 명세서에 있어서 융합 파트너인 단백질 단편들의 절단점 (break point; 또는 융합부위)은 이들을 암호화하는 유전자의 엑손을 기준으로 설명되며, 상기 단편의 N-말단 (C-말단 융합 파트너의 경우) 또는 C-말단(N-말단 융합 파트너의 경우) 마지막에 포함되는 엑손과 절단되어 제거되는 엑손 사이의 인트론 부위 중 어느 지점에서 절단되어도 암호화되는 단백질 단편의 아미노산 서열에는 영향을 미치지 않게 되므로, 실제 절단되는 지점은 상기 인트론 부위 중 어느 지점이어도 무방하다.

CCDC6(coiled-coil domain containing 6) 단백질을 암호화 하는 CCDC6 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 10(q21.2)에 위치하며, 이로부터 암호화되는 CCDC6 단백질은 총 아미노산 길이가 474aa인 단백질이다. CCDC6 단백질 또는 CCDC6 단백질의 단편은 CCDC6-ROS1융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, CCDC6 유전자는 GenBank accession no. NM_005436에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CCDC6 단백질은 NM_005436에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 CCDC6 단백질의 단편은 NM_005436의 첫 번째 엑손(exon)부터 엑손 5(exon 5)(염색체 10 상의 위치((-) strand)를 기준으로 61572393-61572553 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 5의 3' 말단에 코돈을 이루지 못하는 1개의 뉴클레오타이드(c)가 존재하는 형태일 수 있다. 구체예에서, 상기 CCDC6 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CCDC6 단백질에 대하여 아래의 표 2 및 3에 정리하였다:

표 2

CCDC6 단백질의 단편을 암호화 하는 유전자

CCDC6유전자(Accession No.)	CCDC6 단백질의 암호화 부위-CDS	CCDC6 단백질 단편의 암호화 부위: 엑손 기준	CCDC6 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_005436	233~1657(1425bp)(서열번호 1)	첫번째 엑손~엑손 5까지의 부위	233~1079(846bp+1nt(c); 총 847bp)(서열번호 2)	chr10:[61572393 (엑손 5의 3' 말단)	gctgctcagttacagc(서열번호 3)

표 3

CCDC6 단백질의 단편

CCDC6 단백질의 Full size(a.a)	CCDC6 단백질 단편 부위	Breakpoint 부위 아미노산 서열
474aa(서열번호 4)	1~282aa+1nt(c)(아미노산 서열: 서열번호 5)	AAQLQ+1nt(c)(아미노산 서열: 서열번호 6)

ROS1(receptor tyrosine kinase 1) 단백질을 암호화 하는 ROS1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q22.1)에 위치하며, 이로부터 암호화되는 ROS1 단백질은 총 아미노산 길이가 2347aa인 단백질이다. ROS1 단백질 또는 ROS1 단백질의 단편은 CCDC6-ROS1융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, 상기 ROS1 유전자는 GenBank accession no. NM_002944에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, 상기 ROS1 단백질은 NM_002944에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 ROS1 단백질의 단편은 NM_002944의 엑손 35(염색체 6 상의 위치((-) strand)를 기준으로 117642422-117642557 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 35의 5' 말단의 처음 시작하는 2개의 뉴클레오타이드(tc)는 코돈을 이루지 못하는 형태일 수 있고, CCDC6 단백질의 단편과 융합시에 앞서 설명한 바와 같이 CCDC6 단백질의 단편에 추가로 포함된 1개의 뉴클레오타이드(c)와 연결되어 코돈(ctc)을 이루어 하나의 아미노산(L)을 코딩할 수 있다. 구체예에서, 상기 ROS1 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 ROS1 단백질에 대하여 아래의 표 4 및 5에 정리하였다:

표 4

ROS1 단백질의 단편을 암호화 하는 유전자

ROS1유전자(Accession No.)	ROS1 단백질의 암호화 부위-CDS	ROS1 단백질 단편의 암호화 부위: 엑손 기준	ROS1 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_002944	200~7243(7044bp)(서열번호 7)	엑손 35~마지막 엑손까지의 부위	5841~7243(2nt(tc)+1401bp; 총 1403bp)(서열번호 8)	chr6:117642557] (엑손 35의 5' 말단)	tctggcatagaagatta(서열번호 9)

표 5

ROS1 단백질의 단편

ROS1 단백질의 Full size(a.a)	ROS1단백질 단편 부위	Breakpoint 부위 아미노산 서열
2347aa(서열번호 10)	1882~2347aa2nt(tc)+ 1882~2347aa (466aa) (아미노산 서열: 서열번호 11)	2nt(tc)+WHRRL(아미노산 서열: 서열번호 12)

상기 'CCDC6 단백질 또는 그의 단편과 ROS1 단백질 또는 그의 단편이 융합된 CCDC6-ROS1융합 단백질'을 암호화하는 융합 유전자 (CCDC6-ROS1융합 유전자)는 5'-말단에 상기한 바와 같은 CCDC6 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 ROS1 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 CCDC6-ROS1융합 유전자는 5' 말단쪽에 NM_005436의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002944의 엑손 35부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 CCDC6-ROS1융합 유전자는 5' 말단쪽에 NM_005436의 233번째부터 1079번째까지의 뉴클레오타이드 서열 (서열번호 2)과 3' 말단쪽에 NM_002944의 5841번째부터 7243번째까지의 뉴클레오타이드 서열(서열번호 8)이 연결된 융합 유전자(서열번호 13; 융합부위: 서열번호 14)일 수 있다.

상기 CCDC6-ROS1융합 단백질은 N-말단쪽에 상기한 바와 같은 CCDC6 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 ROS1 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_005436의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002944의 엑손 35부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 13의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 15; 융합부위: 서열번호 16) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

FGFR2 (fibroblast growth factor receptor 2) 단백질을 암호화 하는 FGFR2 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 10(q26.13)에 위치하며, FGFR2 단백질은 이로부터 암호화되는 단백질이다. FGFR2 단백질 또는 FGFR2 단백질의 단편은 FGFR2-CIT융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, FGFR2 유전자는 GenBank accession no. NM_001144914, NM_001144916, NM_001144915, NM_001144917, NM_001144918, NM_022970, NM_000141, NM_001144913, NM_001144919 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, FGFR2 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 FGFR2 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손(exon)부터 엑손 19(염색체 10 상의 위치((-) strand)를 기준으로 123243212-123243317 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 FGFR2 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 FGFR2 단백질에 대하여 아래의 표 6 및 7에 정리하였다:

표 6

FGFR2 단백질의 단편을 암호화 하는 유전자

FGFR2유전자(Accession No.)	FGFR2 단백질의 암호화 부위-CDS	FGFR2 단백질 단편의 암호화 부위: 엑손 기준	FGFR2 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_001144914	151~2280(2130bp)(서열번호 17)	첫번째 엑손~엑손 19까지의 부위	151~2115(1965bp)(서열번호 18)	chr10:[123243212 (엑손 19의 3' 말단)	ctcactctcacaaccaatgag (서열번호 19)
NM_001144916	442~2562(2121bp)		442~2397(1956bp)
NM_001144915	320~2443(2124bp)		320~2353(2034bp)
NM_001144917	648~2765 (2118bp)		648~2600(1953bp)
NM_001144918	648~2762(2115bp)		648~2597(1950bp)
NM_022970	648~3116(2469bp)		648~2951(2304bp)
NM_000141	648~3113(2466bp)		648~2948(2301bp)
NM_001144913	151~2460(1813bp)		151~2454(2304bp)
NM_001144919	648~2690(2043bp)		648~2648(2001bp)

표 7

FGFR2 단백질의 단편

FGFR2유전자(Accession No.)	FGFR2 단백질의 Full size(a.a)	FGFR2 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_001144914	709aa(서열번호 20)	1~655aa(서열번호 21)	LTLTTNE(서열번호 22)
NM_001144916	706aa	1~652aa
NM_001144915	707aa	1~678aa
NM_001144917	705aa	1~651aa
NM_001144918	704aa	1~650aa
NM_022970	822aa	1~768aa
NM_000141	821aa	1~767aa
NM_001144913	769aa	1~768aa
NM_001144919	680aa	1~679aa

CIT [citron (rho-interacting, serine/threonine kinase 21)] 단백질을 암호화 하는 CIT 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q24.23)에 위치하며, CIT 단백질은 이로부터 암호화되는 총길이 2027aa의 단백질이다. CIT 단백질 또는 CIT 단백질의 단편은 FGFR2-CIT융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, CIT 유전자는 GenBank accession no. NM_007174에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CIT 단백질은 상기 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 CIT 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 24 (염색체 12 상의 위치((-) strand)를 기준으로 120180216-12018026 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 CIT 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CIT 단백질에 대하여 아래의 표 8 및 9에 정리하였다:

표 8

CIT 단백질의 단편을 암호화 하는 유전자

CIT 유전자(Accession No.)	CIT 단백질의 암호화 부위-CDS	CIT 단백질 단편의 암호화 부위: 엑손 기준	CIT 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_007174	57~6140(6084bp)(서열번호 23)	엑손 24~마지막 엑손까지의 부위	2835~6140(3306bp)(서열번호 24)	chr12:120180269] (엑손 24의 5' 말단)	gcacatagagatgaaatccag(서열번호 25)

표 9

CIT 단백질의 단편

CIT 단백질의 Full size(a.a)	CIT 단백질 단편 부위	Breakpoint 부위 아미노산 서열
2027aa(서열번호 26)	927~2027aa (1101aa) (서열번호 27)	AHRDEIQ(서열번호 28)

상기 'FGFR2 단백질 또는 그의 단편과 CIT 단백질 또는 그의 단편이 융합된 FGFR2-CIT 융합 단백질'을 암호화하는 융합 유전자 (FGFR2-CIT 융합 유전자)는 5'-말단에 상기한 바와 같은 FGFR2 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 CIT 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 FGFR2-CIT 융합 유전자는 5' 말단쪽에 NM_001144914, NM_001144916, NM_001144915, NM_001144917, NM_001144918, NM_022970, NM_000141, NM_001144913, 또는 NM_001144919의 첫번째 엑손에서 엑손 19까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_007174의 엑손 24부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 예컨대, 상기 FGFR2-CIT 융합 유전자는 5' 말단쪽에 NM_001144914의 151번째부터 2115번째까지의 뉴클레오타이드 서열 (서열번호 18)과 3' 말단쪽에 NM_007174의 2835번째부터 6140번째까지의 뉴클레오타이드 서열(서열번호 24)이 연결된 융합 유전자(서열번호 29; 융합부위: 서열번호 30)일 수 있다 (23a 및 23b 참조).

상기 FGFR2-CIT 융합 단백질은 N-말단쪽에 상기한 바와 같은 FGFR2 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 CIT 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_001144914, NM_001144916, NM_001144915, NM_001144917, NM_001144918, NM_022970, NM_000141, NM_001144913, 또는 NM_001144919의 첫번째 엑손에서 엑손 19까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_007174의 엑손 24부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 29의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 31; 융합부위: 서열번호 32) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

AXL (AXL receptor tyrosine kinase) 단백질을 암호화 하는 AXL 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 19(q13.2)에 위치하며, AXL 단백질은 상기 AXL 유전자로부터 암호화된다. AXL 단백질 또는 AXL 단백질의 단편은 AXL-MBIP 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, AXL 유전자는 GenBank accession no. NM_021913, NM_001699 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, AXL 단백질은 NM_021913, NM_001699 등에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 AXL 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손(exon)부터 엑손 20(염색체 19 상의 위치((+) strand)를 기준으로 41765458-41767670 염기 부위) 중의 244번째 뉴클레오타이드까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 AXL 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 AXL 단백질에 대하여 아래의 표 10 및 11에 정리하였다:

표 10

AXL 단백질의 단편을 암호화 하는 유전자

AXL 유전자(Accession No.)	AXL 단백질의 암호화 부위-CDS	AXL 단백질 단편의 암호화 부위: 엑손 기준	AXL 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_021913	191~2875(2685bp)(서열번호 33)	첫번째 엑손~엑손 20 중의 244번째 뉴클레오타이드까지의 부위	191~2767 (2577bp)(서열번호 34)	chr19:41765701]엑손 20 중의 244번째 뉴클레오타이드의 3 위치	ctcactgcggctgag (서열번호 35)
NM_001699	191~2848(2658bp)	첫번째 엑손~엑손 20 중의 244번째 뉴클레오타이드까지의 부위	191~2740(2550bp)	chr19:41765701]엑손 20 중의 244번째 뉴클레오타이드의 3 위치	ctcactgcggctgag (서열번호 35)

표 11

AXL 단백질의 단편

AXL 유전자(Accession No.)	AXL 단백질의 Full size(a.a)	AXL 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_021913	894aa(서열번호 36)	1~859aa(서열번호 37)	LTAAE(서열번호 38)
NM_001699	885aa	1~850aa	LTAAE(서열번호 38)

MBIP (MAP3K12 binding inhibitory protein 1) 단백질을 암호화 하는 MBIP 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 14(q13.3)에 위치하며, MBIP 단백질은 상기 MBIP 유전자로부터 암호화된다. MBIP 단백질 또는 MBIP 단백질의 단편은 AXL-MBIP 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, MBIP 유전자는 GenBank accession no. NM_016586, NM_001144891 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MBIP 단백질은 NM_016586, NM_001144891 등에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 MBIP 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 4(염색체 14 상의 위치((-) strand)를 기준으로 36783718-36783814 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 MBIP 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MBIP 단백질에 대하여 아래의 표 12 및 13에 정리하였다:

표 12

MBIP 단백질의 단편을 암호화 하는 유전자

MBIP 유전자(Accession No.)	MBIP 단백질의 암호화 부위-CDS	MBIP 단백질 단편의 암호화 부위: 엑손 기준	MBIP 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_016586	89~1123(1035bp)(서열번호 39)	엑손 4부터 마지막 엑손까지의 부위	563~1123 (561bp)(서열번호 40)	chr14:36783814](엑손 4의 5' 말단)	attgacagacgaata (서열번호 41)
NM_001144891	89~1120(1032bp)	엑손 4부터 마지막 엑손까지의 부위	563~1120(558bp)	chr14:36783814](엑손 4의 5' 말단)	attgacagacgaata (서열번호 41)

표 13

MBIP 단백질의 단편

MBIP 유전자(Accession No.)	MBIP 단백질의 Full size(a.a)	MBIP 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_016586	344aa(서열번호 42)	159~344aa (186aa)(서열번호 43)	IDRRI(서열번호 44)
NM_001144891	343aa	159~343aa(185aa)	IDRRI(서열번호 44)

상기 'AXL 단백질 또는 그의 단편과 MBIP 단백질 또는 그의 단편이 융합된 AXL-MBIP 융합 단백질'을 암호화하는 융합 유전자 (AXL-MBIP 융합 유전자)는 5'-말단에 상기한 바와 같은 AXL 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 MBIP 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 AXL-MBIP 융합 유전자는 5' 말단쪽에 NM_021913, NM_001699 등의 첫번째 엑손에서 엑손 20 중의 244번째 뉴클레오타이드까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_016586, NM_001144891 등의 엑손 4부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 AXL-MBIP 융합 유전자는 5' 말단쪽에 NM_021913의 191번째부터 2767번째까지의 뉴클레오타이드 서열 (서열번호 34)과 3' 말단쪽에 NM_016586의 563번째부터 1123번째까지의 뉴클레오타이드 서열(서열번호 40)이 연결된 융합 유전자(서열번호 45; 융합부위: 서열번호 46)일 수 있다.

상기 AXL-MBIP 융합 단백질은 N-말단쪽에 상기한 바와 같은 AXL 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 MBIP 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대, 5' 말단쪽에 NM_021913, NM_001699 등의 첫번째 엑손에서 엑손 20의 244번째 뉴클레오타이드까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_016586, NM_001144891 등의 엑손 4부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 45의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 47; 융합부위: 서열번호 48) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

APLP2 (amyloid beta (A4) precursor-like protein 2) 단백질을 암호화 하는 APLP2 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 11(q24.3)에 위치하며, APLP2 단백질은 이로부터 암호화되는 단백질이다. APLP2 단백질 또는 APLP2 단백질의 단편은 APLP2-TNFSF11융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, APLP2 유전자는 GenBank accession no. NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, NR_024515 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, APLP2 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 APLP2 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손(exon)부터 엑손 12(염색체 11 상의 위치((+) strand)를 기준으로 129999933-130000061 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 APLP2 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 APLP2 단백질에 대하여 아래의 표 14 및 15에 정리하였다:

표 14

APLP2 단백질의 단편을 암호화 하는 유전자

APLP2유전자(Accession No.)	APLP2 단백질의 암호화 부위-CDS	APLP2 단백질 단편의 암호화 부위: 엑손 기준	APLP2 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_001642	158~2449(2292bp)(서열번호 49)	첫번째 엑손~엑손 12까지의 부위	158~1741(1584bp)(서열번호 50)	chr11:130000061] (엑손 12의 3' 말단)	gcggcccagatgaaatcccag (서열번호 51)
NM_001142276	158~2413(2256bp)		158~1741(1584bp)
NM_001142278	158~1726(1569bp)		158~1054(896bp)
NM_001142277	158~2245(2088bp)		158~1573(1416bp)

표 15

APLP2 단백질의 단편

APLP2유전자(Accession No.)	APLP2 단백질의 Full size(a.a)	APLP2 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_001642	763aa(서열번호 52)	1~528aa(서열번호 53)	AAQMKSQ(서열번호 54)
NM_001142276	751aa	1~528aa
NM_001142278	522aa	1~299aa
NM_001142277	695aa	1~472aa

TNFSF11 (tumor necrosis factor (ligand) superfamily, member 11) 단백질을 암호화 하는 TNFSF11 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 13(q14.11)에 위치하며, TNFSF11 단백질은 이로부터 암호화되는 단백질이다. TNFSF11 단백질 또는 TNFSF11 단백질의 단편은 APLP2-TNFSF11융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, TNFSF11 유전자는 GenBank accession no. NM_033012, NM_003701 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TNFSF11단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 TNFSF11단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 6 (염색체 13 상의 위치((+) strand)를 기준으로 43174888-43174933 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 TNFSF11단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TNFSF11 단백질에 대하여 아래의 표 16 및 17에 정리하였다:

표 16

TNFSF11단백질의 단편을 암호화 하는 유전자

TNFSF11유전자(Accession No.)	TNFSF11 단백질의 암호화 부위-CDS	TNFSF11 단백질 단편의 암호화 부위: 엑손 기준	TNFSF11 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_033012	530~1264(735bp)(서열번호 55)	엑손 6부터 마지막 엑손까지의 부위	698~1264(567bp)(서열번호 56)	chr13:[43174888 (엑손 6의 5' 말단)	gaattacaacatatcgttgga (서열번호 57)
NM_003701	150~1122(973bp)	엑손 6부터 마지막 엑손까지의 부위	537~2198(1662bp)	chr13:[43174888 (엑손 6의 5' 말단)	gaattacaacatatcgttgga (서열번호 57)

표 17

TNFSF11단백질의 단편

TNFSF11유전자(Accession No.)	TNFSF11 단백질의 Full size(a.a)	TNFSF11 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_033012	244aa(서열번호 58)	57~244aa (188aa)(서열번호 59)	ELQHIVG(서열번호 60)
NM_003701	315aa	130~315(186aa)	ELQHIVG(서열번호 60)

상기 'APLP2 단백질 또는 그의 단편과 TNFSF11 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질'을 암호화하는 융합 유전자 (APLP2-TNFSF11 융합 유전자)는 5'-말단에 상기한 바와 같은 APLP2 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 TNFSF11 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 APLP2-TNFSF11 융합 유전자는 5' 말단쪽에 NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, NR_024515 등의 첫번째 엑손에서 엑손 12까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_033012, NM_003701 등의 엑손 6부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 APLP2-TNFSF11 융합 유전자는 5' 말단쪽에 NM_001642의 158번째부터 1741번째까지의 뉴클레오타이드 서열 (서열번호 50)과 3' 말단쪽에 NM_033012의 698번째부터 1264번째까지의 뉴클레오타이드 서열(서열번호 56)이 연결된 융합 유전자(서열번호 61; 융합부위: 서열번호 62)일 수 있다.

상기 APLP2-TNFSF11 융합 단백질은 N-말단쪽에 상기한 바와 같은 APLP2 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 TNFSF11 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, NR_024515 등의 첫번째 엑손에서 엑손 12까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_033012, NM_003701 등의 엑손 6부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 61의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 63; 융합부위: 서열번호 64) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

MAP4K3 (mitogen-activated protein kinase kinase kinase kinase3) 단백질을 암호화 하는 MAP4K3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 2(p22.1)에 위치하며, 이로부터 암호화되는 MAP4K3 단백질은 총 아미노산 길이가 894aa인 단백질이다. MAP4K3 단백질 또는 MAP4K3 단백질의 단편은 MAP4K3-PRKCE 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, MAP4K3 유전자는 GenBank accession no. NM_003618에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MAP4K3 단백질은 NM_003618에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 MAP4K3 단백질의 단편은 NM_003618의 엑손 1 (염색체 2 상의 위치((-) strand)를 기준으로 39664033-39664219 염기 부위)의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 포함하는 것일 수 있다. 구체예에서, 상기 MAP4K3 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MAP4K3 단백질에 대하여 아래의 표 18 및 19에 정리하였다:

표 18

MAP4K3 단백질의 단편을 암호화 하는 유전자

MAP4K3 유전자(Accession No.)	MAP4K3 단백질의 암호화 부위-CDS	MAP4K3 단백질 단편의 암호화 부위: 엑손 기준	MAP4K3 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_003618	326~3010(2685bp)(서열번호 65)	엑손 1 부위	326~421(96bp)(서열번호 66)	chr2:[39664033 (엑손 1의 3' 말단)	acctacggcgacgtctacaag (서열번호 67)

표 19

MAP4K3 단백질의 단편

MAP4K3 단백질의 Full size(a.a)	MAP4K3 단백질 단편 부위	Breakpoint 부위 아미노산 서열
894aa(서열번호 68)	1~32aa(서열번호 69)	TYGDVYK(서열번호 70)

PRKCE (protein kinase C, epsilon) 단백질을 암호화 하는 PRKCE 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 2(p21)에 위치하며, 이로부터 암호화되는 PRKCE 단백질은 총 아미노산 길이가 737aa인 단백질이다. PRKCE 단백질 또는 PRKCE 단백질의 단편은 MAP4K3-PRKCE 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, 상기 PRKCE 유전자는 GenBank accession no. NM_005400에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, 상기 PRKCE 단백질은 NM_005400에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 PRKCE 단백질의 단편은 NM_005400의 엑손 2(염색체 2 상의 위치((+) strand)를 기준으로 46070139-46070202 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열일 수 있다. 구체예에서, 상기 PRKCE 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 PRKCE 단백질에 대하여 아래의 표 20 및 21에 정리하였다:

표 20

PRKCE 단백질의 단편을 암호화 하는 유전자

PRKCE 유전자(Accession No.)	PRKCE 단백질의 암호화 부위-CDS	PRKCE 단백질 단편의 암호화 부위: 엑손 기준	PRKCE 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_005400	198~2411(2214bp)(서열번호 71)	엑손 2~마지막 엑손까지의 부위	546~2411(1866bp)(서열번호 72	chr2:[46070139 (엑손 2의 5' 말단)	attgatctggagccagaaggaaga(서열번호 73)

표 21

PRKCE 단백질의 단편

PRKCE 단백질의 Full size(a.a)	PRKCE 단백질 단편 부위	Breakpoint 부위 아미노산 서열
737aa(서열번호 74)	117~737aa (621aa) (서열번호 75)	IDLEPEGR(서열번호 76)

상기 'MAP4K3 단백질 또는 그의 단편과 PRKCE 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질'을 암호화하는 융합 유전자 (MAP4K3-PRKCE 융합 유전자)는 5'-말단에 상기한 바와 같은 MAP4K3 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 PRKCE 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 MAP4K3-PRKCE 융합 유전자는 5' 말단쪽에 NM_003618의 엑손 1의 뉴클레오타이드 서열과 3' 말단쪽에 NM_005400의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 MAP4K3-PRKCE 융합 유전자는 5' 말단쪽에 NM_003618의 326번째부터 421번째까지의 뉴클레오타이드 서열 (서열번호 66)과 3' 말단쪽에 NM_005400의 546번째부터 2411번째까지의 뉴클레오타이드 서열(서열번호 72)이 연결된 융합 유전자(서열번호 77; 융합부위: 서열번호 78)일 수 있다.

상기 MAP4K3-PRKCE 융합 단백질은 N-말단쪽에 상기한 바와 같은 MAP4K3 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 PRKCE 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_003618의 엑손 1의 뉴클레오타이드 서열과 3' 말단쪽에 NM_005400의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 77의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 79; 융합부위: 서열번호 80) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

BCAS3 (breast carcinoma amplified sequence3) 단백질을 암호화 하는 BCAS3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 17(q23.2)에 위치하며, BCAS3 단백질은 이로부터 암호화되는 단백질이다. BCAS3 단백질 또는 BCAS3 단백질의 단편은 BCAS3-MAP3K3 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, BCAS3 유전자는 GenBank accession no. NM_017679, NM_001099432 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, BCAS3 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 BCAS3 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 23(염색체 17 상의 위치((+) strand)를 기준으로 59161828-59161925 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 23의 3' 말단에 코돈을 이루지 못하는 1개의 뉴클레오타이드(g)가 존재하는 형태일 수 있다. 구체예에서, 상기 BCAS3 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 BCAS3 단백질에 대하여 아래의 표 22 및 23에 정리하였다:

표 22

BCAS3 단백질의 단편을 암호화 하는 유전자

BCAS3유전자(Accession No.)	BCAS3 단백질의 암호화 부위-CDS	BCAS3 단백질 단편의 암호화 부위: 엑손 기준	BCAS3 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_001099432	110~2896(2787bp)(서열번호 81)	첫번째 엑손~엑손 23까지의 부위	110~2579(2469bp+1nt(c); 총 2470bp)(서열번호 82)	chr17:59161925] (엑손 23의 3' 말단)	acagtgattgatgctgcctcag (서열번호 83)
NM_017679	110~2851(2742bp)	첫번째 엑손~엑손 23까지의 부위	110~2534(2454bp)	chr17:59161925] (엑손 23의 3' 말단)	acagtgattgatgctgcctcag (서열번호 83)

표 23

BCAS3 단백질의 단편

BCAS3유전자(Accession No.)	BCAS3 단백질의 Full size(a.a)	BCAS3 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_001099432	928aa(서열번호 84)	1~823aa+1nt(g)(아미노산 서열: 서열번호 85)	TVIDAAS+1nt(g)(아미노산 서열: 서열번호 86)
NM_017679	913aa	1~808aa	TVIDAAS+1nt(g)(아미노산 서열: 서열번호 86)

MAP3K3 (mitogen activated protein kinase kinase kinase3) 단백질을 암호화 하는 MAP3K3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 17(q23.3)에 위치하며, MAP3K3 단백질은 이로부터 암호화되는 단백질이다. MAP3K3 단백질 또는 MAP3K3 단백질의 단편은 BCAS3-MAP3K3 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, MAP3K3 유전자는 GenBank accession no. NM_002401, NM_203351 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MAP3K3 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 MAP3K3 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 2 (염색체 17 상의 위치((+) strand)를 기준으로 61710041-61710162 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 2의 5' 말단의 처음 시작하는 2개의 뉴클레오타이드(ac)는 코돈을 이루지 못하는 형태일 수 있고, BCAS3 단백질의 단편과 융합시에 앞서 설명한 바와 같이 BCAS3 단백질의 단편에 추가로 포함된 1개의 뉴클레오타이드(g)와 연결되어 코돈(gac)을 이루어 하나의 아미노산(D)을 코딩할 수 있다. 구체예에서, 상기 MAP3K3단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MAP3K3 단백질에 대하여 아래의 표 24 및 25에 정리하였다:

표 24

MAP3K3단백질의 단편을 암호화 하는 유전자

MAP3K3 유전자(Accession No.)	MAP3K3 단백질의 암호화 부위-CDS	MAP3K3 단백질 단편의 암호화 부위: 엑손 기준	MAP3K3 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_002401	320~2200(1881bp)(서열번호 87)	엑손 2부터 마지막 엑손까지의 부위	324~2200(2nt(ac)+1875bp; 총 1877bp)(서열번호 88)	chr17:61710041] (엑손 2의 5' 말단)	acgaacaggaggcattgaactca (서열번호 89)
NM_203351	320~2293(1974bp)	엑손 2부터 마지막 엑손까지의 부위	324~2293(1970bp)	chr17:61710041] (엑손 2의 5' 말단)	acgaacaggaggcattgaactca (서열번호 89)

표 25

MAP3K3 단백질의 단편

MAP3K3 유전자(Accession No.)	MAP3K3 단백질의 Full size(a.a)	MAP3K3 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_002401	626aa(서열번호 90)	3aa~626aa(2nt(ac)+3aa~626aa; 총 624aa) (아미노산 서열: 서열번호 91)	2nt(ac)+EQEALNS (아미노산 서열: 서열번호 92)
NM_203351	657aa	3~655aa	2nt(ac)+EQEALNS (아미노산 서열: 서열번호 92)

상기 'BCAS3 단백질 또는 그의 단편과 MAP3K3 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질'을 암호화하는 융합 유전자 (BCAS3-MAP3K3 융합 유전자)는 5'-말단에 상기한 바와 같은 BCAS3 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 MAP3K3 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 BCAS3-MAP3K3 융합 유전자는 5' 말단쪽에 NM_017679, NM_001099432 등의 첫번째 엑손에서 엑손 23까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002401, NM_203351 등의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 BCAS3-MAP3K3 융합 유전자는 5' 말단쪽에 NM_001099432의 110번째부터 2579번째까지의 뉴클레오타이드 서열 (서열번호 82)과 3' 말단쪽에 NM_002401의 324번째부터 2200번째까지의 뉴클레오타이드 서열(서열번호 88)이 연결된 융합 유전자(서열번호 93; 융합부위: 서열번호 94)일 수 있다.

상기 BCAS3-MAP3K3 융합 단백질은 N-말단쪽에 상기한 바와 같은 BCAS3 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 MAP3K3 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_017679, NM_001099432 등의 첫번째 엑손에서 엑손 23까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002401, NM_203351 등의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 93의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 95; 융합부위: 서열번호 96) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

KRAS (Ki-ras2 Kirsten rat sarcoma viral oncogene homolog) 단백질을 암호화하는 KRAS 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(p12.1)에 위치하며, KRAS 단백질은 이로부터 암호화되는 단백질이다. KRAS 단백질 또는 KRAS 단백질의 단편은 KRAS-CDH13 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, KRAS 유전자는 GenBank accession no. NM_004985, NM_033360 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, KRAS 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 KRAS 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 4(염색체 11 상의 위치((-) strand)를 기준으로 25378548-25378707 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 KRAS 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 KRAS 단백질에 대하여 아래의 표 26 및 27에 정리하였다:

표 26

KRAS 단백질의 단편을 암호화 하는 유전자

KRAS유전자(Accession No.)	KRAS 단백질의 암호화 부위-CDS	KRAS 단백질 단편의 암호화 부위: 엑손 기준	KRAS 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_004985	182~748(567bp)(서열번호 97)	첫번째 엑손~엑손 4까지의 부위	182~631(450bp)(서열번호 98)	chr12:[25378548 (엑손 4의 3' 말단)	acatcagcaaagacaagacag (서열번호 99)
NM_033360	182~751(570bp)	첫번째 엑손~엑손 4까지의 부위	182~631(450bp)	chr12:[25378548 (엑손 4의 3' 말단)	acatcagcaaagacaagacag (서열번호 99)

표 27

KRAS 단백질의 단편

KRAS 유전자(Accession No.)	KRAS 단백질의 Full size(a.a)	KRAS 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_004985	188aa(서열번호 100)	1~150aa(서열번호 101)	TSAKTRQ (서열번호 102)
NM_033360	189aa	1~150aa	TSAKTRQ (서열번호 102)

CDH13 (cadherin 13, H-cadherin) 단백질을 암호화 하는 CDH13 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 16(q23.3)에 위치하며, CDH13 단백질은 이로부터 암호화되는 단백질이다. CDH13 단백질 또는 CDH13 단백질의 단편은 KRAS-CDH13 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, CDH13 유전자는 GenBank accession no. NM_001257에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CDH13 단백질은 이 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 CDH13 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 5 (염색체 16 상의 위치((+) strand)를 기준으로 83158990-83159106 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 CDH13 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CDH13 단백질에 대하여 아래의 표 28 및 29에 정리하였다:

표 28

CDH13 단백질의 단편을 암호화 하는 유전자

CDH13 유전자(Accession No.)	CDH13 단백질의 암호화 부위-CDS	CDH13 단백질 단편의 암호화 부위: 엑손 기준	CDH13 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_001257	300~2441(2142bp)(서열번호 103)	엑손 5부터 마지막 엑손까지의 부위	666~2441(1776bp)(서열번호 104)	chr16:[83158990 (엑손 5의 5' 말단)	gatatatttaaatttgcaaga (서열번호 105)

표 29

CDH13 단백질의 단편

CDH13 유전자(Accession No.)	CDH13 단백질의 Full size(a.a)	CDH13 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_001257	713aa(서열번호 106)	123~713aa (591aa)(서열번호 107)	DIFKFAR(서열번호 108)

상기 'KRAS 단백질 또는 그의 단편과 CDH13 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질'을 암호화하는 융합 유전자 (KRAS-CDH13 융합 유전자)는 5'-말단에 상기한 바와 같은 KRAS 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 CDH13 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 KRAS-CDH13 융합 유전자는 5' 말단쪽에 NM_004985, NM_033360 등의 첫번째 엑손에서 엑손 4까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001257의 엑손 5부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 KRAS-CDH13 융합 유전자는 5' 말단쪽에 NM_004985의 182번째부터 631번째까지의 뉴클레오타이드 서열 (서열번호 98)과 3' 말단쪽에 NM_001257의 666번째부터 2441번째까지의 뉴클레오타이드 서열(서열번호 104)이 연결된 융합 유전자(서열번호 109; 융합부위: 서열번호 110)일 수 있다.

상기 KRAS-CDH13 융합 단백질은 N-말단쪽에 상기한 바와 같은 KRAS 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 CDH13 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_004985, NM_033360 등의 첫번째 엑손에서 엑손 4까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001257의 엑손 5부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 109의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 111; 융합부위: 서열번호 112) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

ZFYVE9 (zinc finger, FYVE domain containing 9) 단백질을 암호화 하는 ZFYVE9 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 1(p32.3)에 위치하며, ZFYVE9 단백질은 이로부터 암호화되는 단백질이다. ZFYVE9 단백질 또는 ZFYVE9 단백질의 단편은 ZFYVE9-CGA 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, ZFYVE9 유전자는 GenBank accession no. NM_007324, NM_004799 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, ZFYVE9 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 ZFYVE9 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 16(염색체 1 상의 위치((+) strand)를 기준으로 52803444-52803606 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 16의 3' 말단에 코돈을 이루지 못하는 2개의 뉴클레오타이드(gg)가 존재하는 형태일 수 있다. 구체예에서, 상기 ZFYVE9 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 ZFYVE9 단백질에 대하여 아래의 표 30 및 31에 정리하였다:

표 30

ZFYVE9 단백질의 단편을 암호화 하는 유전자

ZFYVE9 유전자(Accession No.)	ZFYVE9 단백질의 암호화 부위-CDS	ZFYVE9 단백질 단편의 암호화 부위: 엑손 기준	ZFYVE9 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_007324	173~4273(4101bp)(서열번호 113)	첫번째 엑손~엑손 16까지의 부위	173~3828(3654bp+2nt(gg); 총 3656bp)(서열번호 114)	chr1:52803606] (엑손 16의 3' 말단)	gacaagaacgttagcaaggg (서열번호 115)
NM_004799	173~4450(4278bp)	첫번째 엑손~엑손 16까지의 부위	173~4005(3833bp)	chr1:52803606] (엑손 16의 3' 말단)	gacaagaacgttagcaaggg (서열번호 115)

표 31

ZFYVE9 단백질의 단편

ZFYVE9유전자(Accession No.)	ZFYVE9 단백질의 Full size(a.a)	ZFYVE9 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_007324	1366aa(서열번호 116)	1~1218aa+2nt(gg)(아미노산 서열: 서열번호 117)	DKNVSK+2nt(gg)(아미노산 서열: 서열번호 118)
NM_004799	1425aa	1~1277aa+2nt	DKNVSK+2nt(gg)(아미노산 서열: 서열번호 118)

CGA (glycoprotein hormones, alpha polypeptide) 단백질을 암호화 하는 CGA 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q14.3)에 위치하며, CGA 단백질은 이로부터 암호화되는 단백질이다. CGA 단백질 또는 CGA 단백질의 단편은 ZFYVE9-CGA 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, CGA 유전자는 GenBank accession no. NM_000735에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CGA 단백질은 상기 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 CGA 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 2 (염색체 6 상의 위치((-) strand)를 기준으로 87797831-87797925 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 2의 5' 말단의 처음 시작하는 1개의 뉴클레오타이드(g)는 코돈을 이루지 못하는 형태일 수 있고, ZFYVE9 단백질의 단편과 융합시에 앞서 설명한 바와 같이 ZFYVE9 단백질의 단편에 추가로 포함된 2개의 뉴클레오타이드(gg)와 연결되어 코돈(ggg)을 이루어 하나의 아미노산(G)을 코딩할 수 있다. 구체예에서, 상기 CGA 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CGA 단백질에 대하여 아래의 표 32 및 33에 정리하였다:

표 32

CGA단백질의 단편을 암호화 하는 유전자

CGA 유전자(Accession No.)	CGA 단백질의 암호화 부위-CDS	CGA 단백질 단편의 암호화 부위: 엑손 기준	CGA 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_000735	143~493(351bp)(서열번호 119)	엑손2~ 마지막 엑손까지의 부위	5UTR+143~449(358bp)(서열번호 120)	Chr6:87797925](엑손2의 5' 말단)	gagcgcc (121)

표 33

CGA 단백질의 단편

CGA 단백질의 Full size(a.a)	CGA 단백질 단편 부위	Breakpoint 부위 아미노산 서열
116aa(서열번호 122)	116aa(서열번호 123)	UTR에서breakpoint 발생

상기 'ZFYVE9 단백질 또는 그의 단편과 CGA 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질'을 암호화하는 융합 유전자 (ZFYVE9-CGA 융합 유전자)는 5'-말단에 상기한 바와 같은 ZFYVE9 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 CGA 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 ZFYVE9-CGA 융합 유전자는 5' 말단쪽에 NM_007324, NM_004799 등의 첫번째 엑손에서 엑손 16까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_000735의 5UTR (7bp)을 포함하여 두번째 엑손에서 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 ZFYVE9-CGA 융합 유전자는 5' 말단쪽에 NM_007324의 173번째부터 3828번째까지의 뉴클레오타이드 서열 (서열번호 114)과 3' 말단쪽에 NM_000735의 136번째부터 493번째까지의 뉴클레오타이드 서열(서열번호 120)이 연결된 융합 유전자(서열번호 124; 융합부위: 서열번호 125)일 수 있다.

상기 ZFYVE9-CGA 융합 단백질은 N-말단쪽에 상기한 바와 같은 ZFYVE9 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 CGA 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_007324, NM_004799 등의 첫번째 엑손에서 엑손 16까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_000735의 5UTR (7bp)을 포함하여 두번째 엑손에서 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 124의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 126; 융합부위: 서열번호 127) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

ERBB2IP (erbb2 interacting protein) 단백질을 암호화 하는 ERBB2IP 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 5(q12.3)에 위치하며, ERBB2IP 단백질은 이로부터 암호화되는 단백질이다. ERBB2IP 단백질 또는 ERBB2IP 단백질의 단편은 ERBB2IP-MAST4 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, ERBB2IP 유전자는 GenBank accession no. NM_018695, NM_001006600 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, ERBB2IP 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 ERBB2IP 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 26(염색체 5 상의 위치((+) strand)를 기준으로 65372703-65372777 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 ERBB2IP 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 ERBB2IP 단백질에 대하여 아래의 표 34 및 35에 정리하였다:

표 34

ERBB2IP 단백질의 단편을 암호화 하는 유전자

ERBB2IP 유전자(Accession No.)	ERBB2IP 단백질의 암호화 부위-CDS	ERBB2IP 단백질 단편의 암호화 부위: 엑손 기준	ERBB2IP 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_001006600	311~4219(3909bp)(서열번호 128)	첫번째 엑손~엑손 26까지의 부위	311~4111(3801bp)(서열번호 129)	chr5:65372777] (엑손 26의 3' 말단)	cagccaggtgataaaattattcag (서열번호 130)
NM_018695	311~4426(4116bp)	첫번째 엑손~엑손 26까지의 부위	311~4318(4008bp)	chr5:65372777] (엑손 26의 3' 말단)	cagccaggtgataaaattattcag (서열번호 130)

표 35

ERBB2IP 단백질의 단편

ERBB2IP 유전자(Accession No.)	ERBB2IP 단백질의 Full size(a.a)	ERBB2IP 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_001006600	1302aa(서열번호 131)	1~1267aa(서열번호 132)	QPGDKIIQ(서열번호 133)
NM_018695	1371aa	1~1336aa	QPGDKIIQ(서열번호 133)

MAST4 (microtubule associated serine/threonine kinase family member4) 단백질을 암호화 하는 MAST4 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 5(q12.3)에 위치하며, MAST4 단백질은 이로부터 암호화되는 단백질이다. MAST4 단백질 또는 MAST4 단백질의 단편은 ERBB2IP-MAST4 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, MAST4 유전자는 GenBank accession no. NM_001164664, NM_015183등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MAST4 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 MAST4 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 13 (염색체 5 상의 위치((+) strand)를 기준으로 66400194-66400403 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 MAST4단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MAST4 단백질에 대하여 아래의 표 36 및 37에 정리하였다:

표 36

MAST4단백질의 단편을 암호화 하는 유전자

MAST4 유전자(Accession No.)	MAST4 단백질의 암호화 부위-CDS	MAST4 단백질 단편의 암호화 부위: 엑손 기준	MAST4 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_001164664	309~8180(7872bp)(서열번호 134)	엑손 13부터 마지막 엑손까지의 부위	1455~8180 (6726bp)(서열135)	chr5:[66400194 (엑손 13의 5' 말단)	gctacagctcagatggaagaacgt (서열번호 136)
NM_015183	69~7373bp(7065bp)	엑손 13부터 마지막 엑손까지의 부위	648~7373(6726bp)	chr5:[66400194 (엑손 13의 5' 말단)	gctacagctcagatggaagaacgt (서열번호 136)

표 37

MAST4 단백질의 단편

MAST4 유전자(Accession No.)	MAST4 단백질의 Full size(a.a)	MAST4 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_001164664	2623aa(서열번호 137)	383aa~2623aa (총 2241aa) (서열번호 138)	ATAQMEER (서열번호 139)
NM_015183	2623aa	383~2623aa(2241aa)	ATAQMEER (서열번호 139)

상기 'ERBB2IP 단백질 또는 그의 단편과 MAST4 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질'을 암호화하는 융합 유전자 (ERBB2IP-MAST4 융합 유전자)는 5'-말단에 상기한 바와 같은 ERBB2IP 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 MAST4 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 ERBB2IP-MAST4 융합 유전자는 5' 말단쪽에 NM_018695, NM_001006600 등의 첫번째 엑손에서 엑손 26까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001164664, NM_015183등의 엑손 13부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 ERBB2IP-MAST4 융합 유전자는 5' 말단쪽에 NM_001006600 의 311번째부터 4111번째까지의 뉴클레오타이드 서열 (서열번호 129)과 3' 말단쪽에 NM_001164664의 1455번째부터 8180번째까지의 뉴클레오타이드 서열(서열번호 135)이 연결된 융합 유전자(서열번호 140; 융합부위: 서열번호 141)일 수 있다.

상기 ERBB2IP-MAST4 융합 단백질은 N-말단쪽에 상기한 바와 같은 ERBB2IP 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 MAST4 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_018695, NM_001006600 등의 첫번째 엑손에서 엑손 26까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001164664, NM_015183등의 엑손 13부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 140의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 142; 융합부위: 서열번호 143) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

TPD52L1 (tumor protein D52-like1) 단백질을 암호화 하는 TPD52L1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q22.31)에 위치하며, TPD52L1 단백질은 이로부터 암호화되는 단백질이다. TPD52L1 단백질 또는 TPD52L1 단백질의 단편은 TPD52L1-TRMT11 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, TPD52L1 유전자는 GenBank accession no. NM_003287, NM_001003396, NM_001003397, NM_001003395 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TPD52L1 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 TPD52L1 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 5(염색체 6 상의 위치((+) strand)를 기준으로 125569428-125569529 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 5의 3' 말단에 코돈을 이루지 못하는 2개의 뉴클레오타이드(ag)가 존재하는 형태일 수 있다. 구체예에서, 상기 TPD52L1 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TPD52L1 단백질에 대하여 아래의 표 38 및 39에 정리하였다:

표 38

TPD52L1 단백질의 단편을 암호화 하는 유전자

TPD52L1유전자(Accession No.)	TPD52L1 단백질의 암호화 부위-CDS	TPD52L1 단백질 단편의 암호화 부위: 엑손 기준	TPD52L1 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_001003395	328~855(528bp)(서열번호 144)	첫번째 엑손~엑손 5까지의 부위	328~626(297bp+2nt(c); 총 299bp)(서열번호 145)	chr6:125569529] (엑손 5의 3' 말단)	tcagcaagaagttcggagacatgag (서열번호 146)
NM_001003396	220~654(435bp)		220~605(386bp)
NM_001003397	220~615(396bp)		220~605(386bp)
NM_003287	220~834(615bp)		220~605(386bp)

표 39

TPD52L1 단백질의 단편

TPD52L1유전자(Accession No.)	TPD52L1 단백질의 Full size(a.a)	TPD52L1 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_001003395	175aa(서열번호 147)	1~99aa+2nt(ag)(아미노산 서열: 서열번호 148)	SKKFGDM+2nt(ag)(아미노산 서열: 서열번호 149)
NM_001003396	144aa	1~128aa
NM_001003397	131aa	1~128aa
NM_003287	204aa	1~128aa

TRMT11 (tRNA methyl transferase11 homolog) 단백질을 암호화 하는 TRMT11 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q22.32)에 위치하며, TRMT11 단백질은 이로부터 암호화되는 단백질이다. TRMT11 단백질 또는 TRMT11 단백질의 단편은 TPD52L1-TRMT11 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, TRMT11 유전자는 GenBank accession no. NM_001031712에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TRMT11 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 TRMT11 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 12 (염색체 6 상의 위치((+) strand)를 기준으로 126342306-126342426 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 12의 5' 말단의 처음 시작하는 1개의 뉴클레오타이드(a)는 코돈을 이루지 못하는 형태일 수 있고, TPD52L1 단백질의 단편과 융합시에 앞서 설명한 바와 같이 TPD52L1 단백질의 단편에 추가로 포함된 2개의 뉴클레오타이드(ag)와 연결되어 코돈(aga)을 이루어 하나의 아미노산(R)을 코딩할 수 있다. 구체예에서, 상기 TRMT11단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TRMT11 단백질에 대하여 아래의 표 40 및 41에 정리하였다:

표 40

TRMT11 단백질의 단편을 암호화 하는 유전자

TRMT11 유전자(Accession No.)	TRMT11 단백질의 암호화 부위-CDS	TRMT11 단백질 단편의 암호화 부위: 엑손 기준	TRMT11 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_001031712	122~1513(1392bp)(서열번호 150)	엑손 12부터 마지막 엑손까지의 부위	1261~1513(1nt(a)+252bp; 총 1877bp)(서열번호 151)	chr6:[126342306 (엑손 12의 5' 말단)	atacactgaagagatggtgcct (서열번호 152)

표 41

TRMT11 단백질의 단편

TRMT11 유전자(Accession No.)	TRMT11 단백질의 Full size(a.a)	TRMT11 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_001031712	463aa(서열번호 153)	1nt(a)+381aa~463aa (총 83aa) (아미노산 서열: 서열번호 154)	1nt(a)+ YTEEMVP (아미노산 서열: 서열번호 155)

상기 'TPD52L1 단백질 또는 그의 단편과 TRMT11 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질'을 암호화하는 융합 유전자 (TPD52L1-TRMT11 융합 유전자)는 5'-말단에 상기한 바와 같은 TPD52L1 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 TRMT11 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 TPD52L1-TRMT11 융합 유전자는 5' 말단쪽에 NM_003287, NM_001003396, NM_001003397, NM_001003395 등의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001031712의 엑손 12부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 TPD52L1-TRMT11 융합 유전자는 5' 말단쪽에 NM_001003395의 328번째부터 626번째까지의 뉴클레오타이드 서열 (서열번호 145)과 3' 말단쪽에 NM_001031712의 1261번째부터 1513번째까지의 뉴클레오타이드 서열(서열번호 151)이 연결된 융합 유전자(서열번호 156; 융합부위: 서열번호 157)일 수 있다.

상기 TPD52L1-TRMT11 융합 단백질은 N-말단쪽에 상기한 바와 같은 TPD52L1 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 TRMT11 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_003287, NM_001003396, NM_001003397, NM_001003395 등의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001031712의 엑손 12부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 156의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 158; 융합부위: 서열번호 159) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

TXNRD1 (thioredoxin reductase1) 단백질을 암호화 하는 TXNRD1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q23.3)에 위치하며, TXNRD1 단백질은 이로부터 암호화되는 단백질이다. TXNRD1 단백질 또는 TXNRD1 단백질의 단편은 TXNRD1-GPR133 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, TXNRD1 유전자는 GenBank accession no. NM_003330, NM_001093771, NM_182729, NM_182743, NM_182742 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TXNRD1 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 TXNRD1 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 17(염색체 12 상의 위치((+) strand)를 기준으로 104732917-104733051 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 TXNRD1 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TXNRD1 단백질에 대하여 아래의 표 42 및 43에 정리하였다:

표 42

TXNRD1 단백질의 단편을 암호화 하는 유전자

TXNRD1 유전자(Accession No.)	TXNRD1 단백질의 암호화 부위-CDS	TXNRD1 단백질 단편의 암호화 부위: 엑손 기준	TXNRD1 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_003330	656~2311(1656bp)(서열번호 160)	첫번째 엑손~엑손 17까지의 부위	656~2242(1587bp)(서열번호 161)	chr12:104733051] (엑손 17의 3' 말단)	aatccaccctgtctgtgcagag (서열번호 162)
NM_001093771	25~1974(1950bp)		258~1905(1881bp)
NM_182729	527~2074(1548bp)		527~2005(1479bp)
NM_182743	465~1964(1500bp)		465~1895(1431bp)
NM_182742	702~2201(1500bp)		702~2132(1431bp)

표 43

TXNRD1 단백질의 단편

TXNRD1 유전자(Accession No.)	ERBB2IP 단백질의 Full size(a.a)	ERBB2IP 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_003330	551aa(서열번호 163)	1~529aa(서열번호 164)	IHPVCAE (서열번호 165)
NM_001093771	649aa	1~627aa
NM_182729	499aa	1~477aa
NM_182743	499aa	1~477aa
NM_182742	499aa	1~477aa

GPR133 (G protein-coupled receptor133) 단백질을 암호화 하는 GPR133 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q24.33)에 위치하며, GPR133 단백질은 이로부터 암호화되는 단백질이다. GPR133 단백질 또는 GPR133 단백질의 단편은 TXNRD1-GPR133 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, GPR133 유전자는 GenBank accession no. NM_198827에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, GPR133 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.

상기 GPR133 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 14 (염색체 12 상의 위치((+) strand)를 기준으로 131561346-131561419 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 GPR133단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 GPR133 단백질에 대하여 아래의 표 44 및 45에 정리하였다:

표 44

GPR133단백질의 단편을 암호화 하는 유전자

GPR133 유전자(Accession No.)	GPR133 단백질의 암호화 부위-CDS	GPR133 단백질 단편의 암호화 부위: 엑손 기준	GPR133 단백질 단편의 암호화 부위: cDNA 기준	염색체 상의 Break-point 위치	Break-point 부위 염기서열
NM_198827	560~3184(2625bp)(서열번호 166)	엑손 14부터 마지막 엑손까지의 부위	2033~3184 (11526bp)(서열167)	chr12:[131561346 (엑손 14의 5' 말단)	acacgtaagcagcac (서열번호 168)

표 45

GPR133 단백질의 단편

GPR133 유전자(Accession No.)	GPR133 단백질의 Full size(a.a)	GPR133 단백질 단편 부위	Breakpoint 부위 아미노산 서열
NM_198827	874aa(서열번호 169)	492aa~874aa (총 383aa) (서열번호 170)	TRKQHS (서열번호 171)

상기 'TXNRD1 단백질 또는 그의 단편과 GPR133 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질'을 암호화하는 융합 유전자 (TXNRD1-GPR133 융합 유전자)는 5'-말단에 상기한 바와 같은 TXNRD1 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 GPR133 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 TXNRD1-GPR133 융합 유전자는 5' 말단쪽에 NM_003330, NM_001093771, NM_182729, NM_182743, NM_182742 등의 첫번째 엑손에서 엑손 17까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_198827의 엑손 14부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 TXNRD1-GPR133 융합 유전자는 5' 말단쪽에 NM_003330의 656번째부터 2242번째까지의 뉴클레오타이드 서열 (서열번호 161)과 3' 말단쪽에 NM_198827의 2033번째부터 3184번째까지의 뉴클레오타이드 서열(서열번호 167)이 연결된 융합 유전자(서열번호 172; 융합부위: 서열번호 173)일 수 있다.

상기 TXNRD1-GPR133 융합 단백질은 N-말단쪽에 상기한 바와 같은 TXNRD1 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 GPR133 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_003330, NM_001093771, NM_182729, NM_182743, NM_182742 등의 첫번째 엑손에서 엑손 17까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_198827의 엑손 14부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 172의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 174; 융합부위: 서열번호 175) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.

본 명세서에 사용된 바로서, 첫 번째 엑손과 마지막 엑손은 엑손 번호와 무관하게 주어진 accession number의 염기서열에서 첫 번째 위치하는 엑손과 마지막에 위치하는 엑손을 각각 의미하며, 엑손 번호는 NCBI의 서열 정보에서 부여된 번호에 따른다.

한편, SCAF11 유전자의 5UTR부위가 PDGFRA 유전자 또는 이의 단편과 융합된 융합 유전자의 경우, PDGFRA 유전자 또는 이의 단편의 발현율이 현저하게 증가되며, 이러한 현상은 암 환자에서 특이적으로 관찰됨을 확인하였다. 따라서, 본 발명의 다른 예는 SCAF11 유전자의 5UTR부위 및 PDGFRA 유전자 또는 이의 단편이 융합된 폴리뉴클레오타이드 분자(SCAF11-PDGFRA 융합 유전자), 및 상기 폴리뉴클레오타이드 분자의 암 진단 마커로서의 용도를 제공한다.

SCAF11 (SR-related CTD-associated factor 11) 단백질을 암호화 하는 SCAF11 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q12)에 위치한다. SCAF11의 5UTR 부위는 SCAF11-PDGFRA 융합 유전자의 5' 말단쪽 융합 파트너이다. 구체예에서, SCAF11 유전자는 GenBank accession no. NM_004719에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, SCAF11의 5UTR 부위는 NM_004719에 제공되는 뉴클레오타이드 서열 중 1번째부터 266번째까지의 뉴클레오타이드 서열 (엑손 1에 해당; 염색체상 위치((-) strand)-chr12:46384136-46384401; 염색체상 breakpoint-chr12:[46384136; 서열번호 176; 융합 부위-서열번호 177)을 갖는 폴리뉴클레오타이드 분자일 수 있다.

PDGFRA (platelet-derived growth factor receptor, alpha polypeptide) 단백질을 암호화 하는 PDGFRA 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 4(q12)에 위치한다. PDGFRA 유전자 또는 유전자 단편은 SCAF11-PDGFRA 융합 유전자의 3' 말단쪽 융합 파트너이다. 구체예에서, PDGFRA 유전자는 GenBank accession no. NM_006206 에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, PDGFRA 융합 유전자의 단편은 NM_006206의 CDS 부위 (332번째부터 3601번째까지의 염기서열; 총길이 3270 bp)를 포함하는 것으로, 상기 CDS 부위의 5' 말단에 12bp의 5UTR 부위 (NM_006206의 120번째부터 331번째까지의 염기서열)를 추가로 포함하는 것일 수 있으며, 이는 NM_006206의 엑손 2(염색체상 위치((+) strand)-chr4:55124924-55124984; 염색체상 breakpoint-chr12:120180269])부터 마지막 엑손까지를 포함하는 유전자 단편으로 표현될 수 있다 (서열번호 178; 융합 부위-서열번호 179)을 갖는 폴리뉴클레오타이드 분자일 수 있다.

상기 SCAF11-PDGFRA 융합 유전자는 서열번호 180 (융합부위: 서열번호 181)의 뉴클레오타이드 서열을 갖는 것일 수 있다.

별다른 언급이 없는 한, 본 명세서에 기재된 DNA 분자를 시퀀싱하여 결정된 모든 뉴크레오타이드 서열들은 자동화된 DNA 시퀀서(예컨대, Applied Biosystems, Inc.에서 제조된 Model 373)를 사용하여 결정될 수 있고, 결정된 뉴클레오타이드 서열에 의하여 암호화되는 모든 아미노산 서열들은 자동화된 펩타이드 시퀀서를 사용하여 결정된 것이다. 이 자동화된 접근에 의하여 결정된 뉴클레오타이드 서열은 실제 서열과 비교하여 일부 에러를 포함할 수 있다. 예컨대, 자동에 의하여 결정된 뉴크레오타이드 서열들은 시퀀싱된 DNA 분자의 실제 뉴클레오타이드 서열과 전형적으로 약 90% 이상, 구체적으로 약 95% 이상, 보다 구체적으로 약 99% 이상, 더욱 구체적으로 약 99.9% 이상의 서열 상동성을 가질 수 있다. 실제 서열과 비교하여 결정된 뉴클레오타이드에서 하나의 삽입 또는 결손은 포함할 수 있으며, 이와 같은 삽입 또는 결손에 의하여 뉴클레오타이드 서열 번역시의 프레임 쉬프트가 야기되어, 암호화되는 아미노산 서열이 실제 아미노산 서열과 완전하게 다르게 될 수 있다.

본 발명에 따른 융합 단백질 및/또는 융합 유전자는 고형암, 구체적으로 폐암, 특히 폐선암과 같은 비소세포암(NSCLC) 환자에게서 특이적으로 발견되거나 발현되는 것으로 확인되었으므로, 상기 융합 단백질 및/또는 이를 암호화하는 융합 유전자 및/또는 SCAF11-PDGFRA 융합 유전자는 고형암, 구체적으로 폐암, 특히 폐선암과 같은 비소세포암(NSCLC)의 진단 마커로서 유용하다.

이에, 본 발명의 또 다른 예는 상기 융합 단백질에 특이적으로 결합하는 분자, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자 및/또는 상기 융합 유전자에 상응하는 mRNA(전사체)와 상호작용(예컨대, 결합)하는 물질을 포함하는 암 진단용 약학 조성물을 제공한다.

상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질 발현(또는 존재) 여부를 검출하기 위한 물질로서, 상기 융합 단백질 또는 상기 융합 단백질의 융합 부위(break point)의 아미노산 서열에 특이적으로 결합하는 항체, 압타머 등으로 이루어진 군에서 선택된 것일 수 있다.

또한, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 또는 이들 융합 유전자에 상응하는 mRNA와 상호작용하는 물질은 상기 융합유전자 또는 mRNA와 혼성화 가능한 핵산 분자일 수 있다. 예컨대, 상기 핵산 분자는 생물 시료 내의 상기 융합 유전자, 상기 융합 유전자의 융합 부위, 또는 상기 융합 유전자 또는 융합 부위에 상응하는 mRNA(발현 전사체)와 특이적으로 혼성화 가능한 안티센스 올리고뉴클레오타이드 (예컨대, siRNA, 마이크로RNA 등), 프로브(예컨대, 5 내지 100 bp, 5 내지 50bp, 5 내지 30bp, 또는 5 내지 25bp), 앱타머 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 다른 구체예에서, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 또는 이들 융합 유전자에 상응하는 mRNA 분자와 혼성화 가능한 핵산 분자는 상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개, 구체적으로 100 내지 200개의 염기로 이루어진 폴리뉴클레오타이드 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편의 양 말단에 인접하는 20 내지 100개, 구체적으로 25 내지 50개의 염기서열 또는 이와 상보적인 서열과 혼성화 가능한 20 내지 100bp, 또는 25 내지 50bp 길이의 프라이머쌍일 수 있다. 상기 '혼성화 가능하다'함은 검출 대상 염기서열과 완전히 상보적이거나, 80% 이상 (예컨대 80-100%), 구체적으로 90% 이상 (예컨대 90-100%) 상보적인 염기서열을 가져서 상기 검출 대상 유전자 또는 mRNA와 특이적으로 결합 가능함을 의미한다. 예컨대, 각 융합 유전자에 혼성 가능한 프라이머쌍을 아래의 표 46에 예시하였다.

표 46

융합 유전자	융합부위	Forward Primer Sequence	Reverse Primer Sequence
CCDC6-ROS1	서열번호 14	CCTGCAGGAAAAATTAGACCAG (SEQ ID NO: 182)	AGCTCAGCCAACTCTTTGTCTT(SEQ ID NO: 183)
SCAF11-PDGFRA	서열번호 181	CAGCGGAGTCAGTGTCCTAGAG(SEQ ID NO: 184)	TGAGAAGACAGCCTAAGACCAG(SEQ ID NO: 185)
FGFR2-CIT	서열번호 30	ACATGATGATGAGGGACTGTTG(SEQ ID NO: 186)	ACAGCTGTTACGAAGAGCATCA(SEQ ID NO: 187)
AXL-MBIP	서열번호 46	GCCTGACGAAATCCTCTATGTC(SEQ ID NO: 188)	CAAAATTCCCTGACGTTGTTTT(SEQ ID NO: 189)
APLP2-TNFSF11	서열번호 62	TGCTGAGAACAAAGATCGCTTA(SEQ ID NO: 190)	TGTCGGTGGCATTAATAGTGAG(SEQ ID NO: 191)
MAP4K3-PRKCE	서열번호 78	AGGAGGACTTCGAGCTGATTC(SEQ ID NO: 192)	ACGACCCTGAGAGATCGATGA(SEQ ID NO: 193)
BCAS3-MAP3K3	서열번호 94	CATCCCGTCCAGTCTCTGAT(SEQ ID NO: 194)	CTGCCTATTTGAGTGACCTGTG(SEQ ID NO: 195)
KRAS-CDH13	서열번호 110	GGAAATAAATGTGATTTGCCTTC(SEQ ID NO: 196)	AAGGCTGTCTCTGATTCTCTGG(SEQ ID NO: 197)
ZFYVE9-CGA	서열번호 125	ACTGCAGAGAACATGGATTCCT(SEQ ID NO: 198)	GAATGGAGAACATGCAGAAACA(SEQ ID NO: 199)
ERBB2IP-MAST4	서열번호 141	AACAAGGGTACAACCTGAAGGA(SEQ ID NO: 200)	TCAAGGAAGTATCGTGAGGTGA(SEQ ID NO: 201)
TPD52L1-TRMT11	서열번호 157	GAAAACACATGAAACCCTGAGTC(SEQ ID NO: 202)	ATGTGTGACTGGAAAGCTTCTG(SEQ ID NO: 203)
TXNRD1-GPR133	서열번호 173	TCCAAATGCTGGAGAAGTTACA(SEQ ID NO: 204)	AGTACACGAAGACTCGGTTGCT(SEQ ID NO: 205)

일 구체예에서, 상기 융합 단백질 또는 융합 유전자 또는 mRNA와 특이적으로 상호작용하는 물질은 자유 래디컬, 방사성-동위원소, 형광염료, 발색기질, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상의 면역화학적 표지 물질이 부착되거나, 상기 표지 물질과 함께 사용될 수 있다.

또 다른 예는 환자로부터 얻은 생물 시료에서 상기 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 및/또는 상기 융합 유전자에 상응하는 mRNA를 검출하는 단계를 포함하는 암 진단에 정보를 제공하는 방법을 제공한다.

상기 생물 시료에서 상기 융합 단백질, 융합 유전자, 및/또는 mRNA를 검출하는 단계는 i) 상기 생물 시료에 상기 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA로 이루어진 군에서 선택된 1종 이상과 상호작용하는 물질을 처리(첨가)하고 반응시키는 단계; 및 ii) 상기 얻어진 반응물을 검출하는 단계를 포함할 수 있다. 상기 단계 i) 이전에 생물 시료를 준비하는 단계를 추가로 포함할 수 있으며, 상기 생물 시료를 준비하는 단계는 환자로부터 생물 시료를 얻는(분리하는) 단계를 포함하는 것일 수 있다. 상기 단계 i)에서 상기 상호작용하는 물질은 상기 융합 단백질 (전부 또는 일부; 예컨대 융합 부위)에 특이적으로 결합하는 화합물, 항체, 앱타머, 및 상기 융합 유전자 및/또는 mRNA (전부 또는 일부; 예컨대 융합 부위)에 결합하는 핵산 분자 (예컨대, 프라이머, 프로브, 앱타머 등), 화합물 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 앞서 설명한 바와 같이, 이들 상호작용 하는 물질은 자유 래디컬, 방사성-동위원소, 형광염료, 발색기질, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상의 면역화학적 표지 물질이 부착되거나, 상기 표지 물질과 함께 사용될 수 있다. 상기 단계 ii)에서, 상기 반응물은 단계 i)에서 얻어진 상기 융합 단백질, 융합유전자, 및 mRNA로 이루어진 군에서 선택된 1종 이상과 이와 상호작용하는 물질이 상호작용(결합)하여 생성된 복합체(complex)일 수 있다. 상기 반응물을 검출하는 단계에서 반응물이 검출되면 상기 융합 단백질, 융합 유전자, 및/또는 mRNA이 존재하는 것으로 판단할 수 있다.

상기 암 진단에 정보를 제공하는 방법에 있어서, 생물 시료에서 상기 융합 단백질, 융합 유전자, 및/또는 mRNA의 존재가 확인되면, 상기 환자는 암(고형암), 구체적으로 폐암, 보다 구체적으로 비소세포폐암(NSCLC), 특히 폐선암 환자로 결정할 수 있다.

상기 융합 단백질, 융합 유전자, 및/또는 mRNA의 검출은 통상적인 단백질 또는 유전자 검출 방법에 의하여 수행될 수 있다.

예컨대, 상기 융합 단백질의 검출은 상기 융합 단백질과 상호작용하는 물질, 예컨대 특이적으로 결합하는 물질(예컨대, 항체, 압타머, 또는 화합물 등)를 이용하여 상기 융합 단백질과 상기 물질(예컨대, 항체 또는 압타머)과의 상호작용, 즉 복합체 형성을 검출하는 통상적인 에세이법, 예컨대, 면역크로마토그래피(Immunochromatography), 면역조직화학염색, 효소결합 면역흡착 분석(enzyme linked immunosorbent assay: ELISA), 방사선 면역측정법(radioimmunoassay: RIA), 효소 면역분석(enzyme immunoassay: EIA), 형광면역분석(Floresence immunoassay: FIA), 발광면역분석(luminescence immunoassay: LIA), 웨스턴블라팅(Western blotting) FACS 등에 의하여 검출할 수 있다.

통상적인 단백질 발현 검출 에세이법으로 면역분석 방법을 수행할 수 있다. 유용한 면역분석은 동종 면역분석 또는 이종 면역분석일 수 있다. 동종 분석에서 그 면역학적 반응은 종종 융합 단백질 특이적 시약 (예를 들어, 융합 단백질 특이적 항체), 그 표지된 분석체, 및/또는 분석 대상 생물 시료가 관련된다. 그 표지로부터 일어나는 신호는 그 표지된 분석체에 항체의 결합에 대하여 직접 또는 간접적으로 변형된다. 면역학적 반응 및 그것의 양의 검출 모두는 동종 용액에서 수행된다. 사용 가능한 면역화학적 표지들은 자유 래디컬, 방사성-동위원소, 형광염료, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.

본 명세서에 기재된 그 방법의 실행에 유용한 항체들은 침전과 같은 공지된 기술에 의하여 진단 분석에 적당한 고체 서포트(예를 들어 라텍스 또는 폴리스티렌과 같은 물질로 제조된 웰, 비드, 플레이트 또는 슬라이드)에 부착될 수 있다. 항체들 또는 다른 융합단백질 결합 시약들은, 공지된 기술에 따라, 방사성표지(예를 들어, ³⁵S, ¹²⁵I, ¹³¹I 등), 효소 표지(예를 들어 호스래디쉬 퍼옥시데이즈, 알칼라인 포스페테이즈, 등), 및 형광 표지들 (예를 들어 흐루르세인 등)과 같은 검출될 수 있는 표지 물질과 부착될 수 있다.

유동세포분석법(flow cytometry; FC)와 같은 세포-기반 분석, 면역-조직화학(IHC), 또는 면역형광법(IF)은 그러한 분석 포맷이 임상적으로 적합하고, 생체내에서 융합 단백질 내의 카이네이즈 폴리펩타이드 발현의 검출을 가능하게 하고 추출물을 덜기 위하여 예를 들어 종양 샘플로부터 얻어진 세포들 조작을 야기하는 활성에서 인위적인 변화의 위험성을 회피할 수 있기에 본 발명의 방법을 실행하는데 특히 바람직하다. 따라서 일부 바람직한 구체 예에서, 본 발명의 방법들은 유동세포분석법(flow cytometry; FC)와 같은 세포-기반 분석, 면역-조직화학(IHC), 또는 면역형광법(IF) 분석 포맷을 고안한다.

유동세포 분석법(FC)은 융합 단백질 내의 카이네이즈 활성을 저해하는 타겟된 약물의 처리 전, 처리 동안 및/또는 처리 후에 포유류 종양에서 융합 단백질 내의 카이네이즈 폴리펩타이드 발현을 결정하기 위하여 채택된 분석법일 수 있다. 예를 들어 골수 샘플로부터 유래한 종양 세포들은 그렇게 하는 것이 바람직하다면 암 세포 타입을 동정하기 위한 마커로 뿐만 아니라 융합 단백질 발현 및/또는 활성화에 대한 유동세포 분석법에 의하여 분석될 수 있다.

면역조직화학(IHC) 염색은 융합 단백질 내의 카이네이즈 활성을 저해하는 타겟된 약물로 처리 전, 처리 동안, 및/또는 처리 후에 포유류 암(예를 들어 NSCLC와 같은 고형암)에서 융합 단백질 내의 카이네이즈 단백질의 발현 및/또는 활성화 상태를 결정하기 위하여 채택된 분석법일 수 있다.

면역형광(IF) 분석은 융합 단백질 내의 카이네이즈 활성을 저해하는 타겟팅된 약물로 처리 전, 처리 동안, 및/또는 처리 후에 포유류 암에서 융합 단백질 내의 카이네이즈 폴리펩타이드의 발현 및/또는 활성화 상태를 결정하기 위하여 채택된 분석법일 수 있다.

이에 더하여, 효소-링크된 면역흡수 분석법(ELISA), 방사성-면역분석(RIA), 형광-활성화된 세포 소팅(FACS) 등을 포함하는 다른 여러 프로토콜들이 당업계에 공지되어 있으며, 융합 단백질 발현의 변경된 또는 비정상적인 레벨을 진단하는 방법도 사용 가능하다.

종양으로부터 유래된 세포들을 포함하는 생물 시료에서 발현된 융합 단백질의 검출/정량화를 위한 AQUA 펩타이드들은 표준 AQUA 분석에서 사용되고 제조될 수 있다. 따라서 본 발명의 방법들의 일부 바람직한 구체예에서, 융합 단백질 특이적 시약은 상술된 것과 같이 융합 단백질 또는 융합 접합점을 포함하는 펩타이드 서열에 해당하는 서열 중 동위원소 표지된 포스포펩타이드(AQUA 펩타이드)를 포함할 수 있다.

또한, 상기 융합 유전자 및/또는 이에 상응하는 mRNA의 검출은 상기 융합 유전자 또는 mRNA와 상호작용하는 물질, 예컨대 혼성화 가능한 핵산 분자 (예컨대, 프로브, 앱타머, 또는 프라이머 등)를 사용하는 통상적인 핵산 검출 방법, 예컨대 PCR(polymerase chain reaction), FISH(fluorescent in situ hybridization), UV 분광법(UV spectrometry), 크로마토그래피법, Warburg-Christian법, Schmidt-Thannhauser-Schneider법 등에 의하여 수행될 수 있으나, 이에 제한되는 것은 아니다. 한 구체예에서, 상기 융합 유전자 및/또는 이에 상응하는 mRNA의 검출은 대규모 병렬 염기서열 분석(massively parallel sequencing) 기술을 통한 전체-전사체(whole-transcriptome; RNA) 또는 전체-게놈(whole-genome; DNA) 시퀀싱의 통합 기술에 의하여 수행될 수 있다. 상기 핵산 분자 검출에 유용한 융합 유전자 또는 mRNA에 특이적인 시약(상호작용하는 물질)들은 생물 시료에서 융합 또는 트런케이트된 폴리펩타이드 발현 전사체와 직접 교잡하고 검출할 수 있는 siRNA, 올리고뉴크레오타이드 또는 DNA 프로브일 수 있다.

상기 환자는 인간을 포함하는 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류를 포함하는 포유류, 구체적으로 인간일 수 있다.

상기 생물 시료는 상기 환자로부터 분리된 세포(예컨대, 폐세포 등), 조직(예컨대, 폐조직 등), 체액(예컨대, 혈액 등) 등일 수 있다. 보다 구체적으로, 본 발명에서 유용한 생물 시료들은 융합 단백질의 발현에 의하여 특징화되는 암(고형암 또는 비고형암)이 존재하거나 발생된 포유류로부터 얻어질 수 있다. 일 구체예에서, 그 포유류는 인간이고 그 인간은 예를 들어 NSCLC와 같은 암의 치료 대상 환자일 수 있다. 그 인간 환자는 검출 대상 융합 단백질 내의 카이네이즈를 억제하는 치료제로 현재 치료 중이거나 또는 치료를 고려하는 환자일 수 있다. 본 발명에서 사용 적합한 생물 시료는 포유류 암으로부터 유래한(또는 분리된) 세포, 조직 또는 이들의 추출물을 포함하는 하는 것일 수 있다.

본 발명의 암 환자에서 특이적으로 발현하는 융합 단백질은 새로운 암 치료 타겟으로서의 사용될 수 있다.

따라서, 본 발명의 또 다른 예는 상기 융합 단백질의 억제제, SCAF11-PDGFRA 융합 유전자의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 유효성분으로 포함하는 암 예방 및/또는 치료용 약학 조성물을 제공한다.

다른 예는 상기 융합 단백질의 억제제, SCAF11-PDGFRA 융합 유전자의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상의 약학적 유효량을 암의 예방 및/또는 치료를 필요로 하는 환자에게 투여하는 단계를 포함하는 암의 예방 및/또는 치료 방법을 제공한다.

또 다른 예는 상기 융합 단백질의 억제제, SCAF11-PDGFRA 융합 유전자의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 포함하는 조성물의 암 예방 및/또는 치료를 위한 용도를 제공한다.

상기 억제제는 경구 또는 비경구로 투여할 수 있다. 비경구 투여인 경우에는 정맥내 주입, 피하 주입, 근육 주입, 복강 주입, 내피 투여, 국소 투여, 비내 투여, 폐내 투여 또는 직장내 투여 등으로 투여할 수 있다.

본 명세서에 있어서 "약학적 유효량"은 약물이 약학적으로 의미있는 효과를 나타낼 수 있는 양을 의미한다. 1회 투여를 위한 억제제의 약학적 유효량은 제제화 방법, 투여 방식, 환자의 연령, 체중, 성, 병적 상태, 음식, 투여 시간, 투여 간격, 투여 경로, 배설 속도 및 반응 감응성과 같은 요인들에 따라서 다양하게 처방될 수 있다.

상기 융합 단백질의 억제제는 상기 융합 단백질에 결합하여 그 기능을 상실시키거나 저하시키는 물질로서, 상기 융합 단백질에 대한 항체, 압타머, 또는 통상적인 키나제 저해제(티로신 키나제를 포함하는 융합유전자의 경우: CCDC6-ROS1, SCAF11-PDGFRA, FGFR2-CIT, AXL-MBIP, MAP4K3-PRKCE, BCAS3-MAP3K3, ERBB2IP-MAST4), 신호 전달 저해제 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 상기 융합 단백질을 암호화하는 융합 유전자 또는 이에 상응하는 mRNA의 억제제는 상기 DNA 분자에 결합하여, 융합 단백질로 발현하지 못하도록 하는 물질로서, 상기 DNA 분자에 특이적으로 결합하는 siRNA, shRNA, 마이크로RNA, 압타머 등으로 이루어진 군에서 선택된 1종 이상의 것일 수 있다.

상기 암 진단용 조성물, 암 진단에 정보를 제공하는 방법, 및 암의 예방 및/또는 치료용 조성물의 진단 또는 치료 대상이 되는 암은 모든 종류의 고형암일 수 있다. 예컨대 상기 고형암은 폐암, 간암, 대장암, 췌장암, 위암, 유방암, 난소암, 신장암, 갑성선암, 식도암, 전립선암, 뇌암 등일 수 있다. 구체예에서 상기 고형암은 폐암일 수 있으며, 보다 구체적으로 소세포폐암 (small cell lung cancer, SCLC), 또는 폐선암(lung adenocarcinoma), 편평세포폐암(Squamous cell lung carcinoma), 또는 대세포폐암 Large cell lung carcinoma)과 같은 비소세포폐암(non-small cell lung cancer, NSCLC)일 수 있고, 예컨대 폐선암일 수 있다.

또 다른 예는 상기 융합 단백질을 이용한 항암제 스크리닝 방법을 제공한다.

일 구체예에서, 상기 스크리닝 방법은,

상기 융합 단백질 및/또는 상기 SCAF11-PDGFRA 융합 유전자를 발현하는 세포에 후보 물질을 처리하는 단계; 및

상기 세포에서의 융합 단백질 및/또는 상기 융합 유전자의 발현 정도를 측정하는 단계를 포함하고,

상기 후보 물질이 처리된 세포에서의 융합 단백질 및/또는 상기 융합 유전자의 발현 정도가 상기 후보 물질 처리 전 또는 상기 후보 물질이 처리되지 않은 세포와 비교하여 감소한 경우, 상기 후보 물질을 항암제로 결정하는 것을 특징으로 하는 것일 수 있다. 상기 융합 단백질의 발현 정도는 융합 단백질의 수준을 측정하거나, 상기 융합 단백질을 암호화하는 융합 유전자 또는 상기 융합 유전자에 상응하는 mRNA의 수준을 측정하여 측정될 수 있다.

상기 항암제 스크리닝 방법은 상기 후보 물질을 처리하는 단계 이전에, 상기 후보 물질 처리 전 세포 내의 융합 단백질 및/또는 융합 유전자의 발현 정도를 측정하는 단계를 추가로 포함하여, 동일한 세포에서의 후보 물질 처리 후의 융합 단백질 및/또는 융합 유전자의 발현 정도가 후보 물질 처리 전의 융합 단백질 및/또는 융합 유전자의 발현 정도보다 감소한 경우, 상기 후보 물질을 항암제로 결정할 수 있다. 또 다른 예에서, 상기 항암제 스크리닝 방법은 상기 융합 단백질 및/또는 상기 융합 유전자를 발현하는 세포를 준비하고, 이들 세포 중 일부에 후보 화합물을 처리하고, 후보 화합물이 처리된 일부 세포와 후보 물질이 처리되지 않은 나머지 세포에서의 상기 융합 단백질 및/또는 융합 유전자의 발현 정도를 측정하는 단계를 포함하여, 후보 물질이 처리된 세포에서의 융합 단백질 및/또는 융합 유전자의 발현 정도가 후보 물질이 처리되지 않은 세포에서의 융합 단백질 및/또는 융합 유전자의 발현 정도보다 감소한 경우, 상기 후보 물질을 항암제로 결정할 수 있다.

상기 스크리닝 방법에서 사용되는 세포는 상기한 융합 단백질 중 1종 이상이 발현 및/또는 활성화되는 암 (예컨대, 스크리닝하고자 하는 항암제가 항암 활성을 보이기를 소망하는 암)으로부터 유래하는 세포, 상기 세포의 추출물, 또는 상기 세포를 통상의 방법으로 배양한 것을 포함할 수 있다.

상기 융합 단백질 및/또는 융합 유전자를 발현하는 세포는 앞서 설명한 바와 같은 암세포, 특히 고형암 세포, 구체적으로 폐암 세포, 보다 구체적으로 폐선암 세포일 수 있다.

상기 융합 단백질의 발현 수준의 측정은 통상적인 단백질 측정법인 면역크로마토그래피(Immunochromatography), 면역조직화학염색, 효소결합 면역흡착 분석(enzyme linked immunosorbent assay: ELISA), 방사선 면역측정법(radioimmunoassay: RIA), 효소 면역분석(enzyme immunoassay: EIA), 형광면역분석(Floresence immunoassay: FIA), 발광면역분석(luminescence immunoassay: LIA), 웨스턴블라팅(Western blotting), FACS 등에 의하여 수행할 수 있으나, 이에 제한되는 것은 아니다. 상기 융합 유전자 또는 mRNA의 수준은 통상적인 유전자 정량 방법, 예컨대, PCR, FISH, UV 분광법, 크로마토그래피법, Warburg-Christian법, Schmidt-Thannhauser-Schneider법 등에 의하여 측정될 수 있으나, 이에 제한되는 것은 아니다.

상기 후보 물질은 모든 천연 또는 합성 화합물을 포함하는 의미로, 일반 화합물, DNA, RNA, 단백질 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.

후보 물질이 융합 단백질에 의하여 특성화되는 종양의 진행을 저해하는지를 결정하기 위한 방법의 실행에 있어서, 포유류 이종이식 유래 세포들을 포함하는 생물 시료를 채택할 수 있다. 바람직한 이종이식(또는 이식 수용체)는 융합 단백질을 발현하는 인간 종양 세포 시료 또는 상기 세포들을 가지는 마우스와 같은 작은 포유류일 수 있다. 포유류 암 종양으로부터 유래한 세포들을 포함하는 생물학적 샘플에서 융합 단백질의 존재 또는 발현을 평가하는데 있어서, 그러한 전위 및/또는 융합 단백질이 발생하지 않는 세포를 대조군으로 채택할 수 있다. 바람직하게는 대조군 시료는 상기한 바와 같은 융합 단백질 발현이 존재하지 않는 동일 조직의 정상 세포 (예컨대 종양 주변의 정상 세포), 또는 상기 융합 단백질이 발현되지 아니하는 특정 암(예를 들어 NSCLC)에서 유래하는 암세포들을 포함할 수 있다.

상기 스크리닝 방법에 의하여 개발된 항암제의 치료 대상 암 종류는 상기한 바와 같다.

본 발명에서 제공되는 폐암, 특히 폐선암에서 특이적으로 발현하는 융합 단백질 및/또는 이를 암호화하는 DNA 분자/mRNA는 폐암 진단 마커 및 더 나아가 치료 타겟으로서 유용하다.

이하, 본 발명을 실시예에 의해 상세히 설명한다.

단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.

실시예 1: 암시료의 준비

서울대학병원 및 서울카톨릭성모병원에서 엽절제술(lobectomy)을 받은 환자로부터 얻은 일차 폐선암 수술 표본 200개를 수집하였다(서울대학병원: n=164; 2010년부터 20119월까지, 서울카톨릭성모병원: n=36; 2009년~2011년 동안 tissue bank에 기탁된 샘플들). 본 발명자들의 이전 연구(Ju YS et al.Genome Res. 2012 22:436-445)로부터 20명의 환자가 이 시험군에 포함되었다. 각각의 환자에 대하여, 진단, 성별, 암단계 및 흡연 상태를 기록하였다. 암환자 200명 중에서, 여성 및 비흡연자의 비율은 각각 54.5% (n=109) 및 58.0% (n=116) 이었다.

이전 보고된 방법(Ju YS et al.Genome Res. 2012 22:436-445)에 의하여, 200개의 폐선암 조직의 서브셋에서의 잘 알려진 3개의 핵심 돌연변이에 대한 스크리닝 유전자 시험을 수행하였다(EGFR 의 엑손 18-21은 PCR 및 Sanger sequencing (n=164)에 의하여 시험; KRAS의 exon 2는 PCR 및 Sanger sequencing (n=37)에 의하여 시험; EML4-ALK 융합 유전자는 형광 in-situ 혼성화(fluorescent in-situ hybridization)(FISH; n=163)에 의하여 시험; Supplementary Figure 1; Supplementary Table 1). 200개의 암조직 중에서 100개는 EGFR (n=99), KRAS (n=6) 및 EML4-ALK (n=7) 중 하나의 핵심 돌연변이에 대하여 양성이었다. 이들 돌연변이는 2개 샘플(1 EGFR ⁺ KRAS ⁺ 및 1 EGFR ⁺ EML4-ALK ⁺)을 제외하고 실질적으로 상호 배타적이었다. 나머지 90개에서의 핵심 돌연변이는 알려지지 않았다.

이들 90개 샘플을 RNA 시퀀싱의 타겟으로 하였다. RNA quality control(RNA Integrity Number(RIN) Standardization of RNA Quality Control: Agilent Tech.)을 통과하지 못한 3개의 샘플을 제외하고, 나머지 87개 폐선암 샘플로부터 mRNA 서열을 얻었다. 그리고 나서, 인접한 정상 폐조직의 전사체(transcriptome; n=77) 및 전체 엑솜(whole-exome; n=76) 시퀀싱을 수행하여 암조직 및 정상조직을 비교하였다 (Supplementary Table 1). 모든 시퀀싱 시험은 "Ju YS et al.Genome Res. 2012 22:436-445"에 기재된 방법에 따라서 수행하였다.

164개 샘플 (87개의 암조직 샘플 및 77개의 대응 정상 조직 샘플; Supplementary Table 2)로부터 14,038,673,860 paired-end 101bp-long reads를 생성하였다. 평균적으로, RNA 시퀀싱 처리량(throughputs)은 암조직 및 정상 조직에 대하여 각각 9.77 및 7.38 Gbp이었다. 76개 정상 조직의 전체-엑솜 시퀀싱에서, 타겟팅 부위에 대하여 paired-정상 조직당 32.96?read depth를 얻었다.

실시예 2: 융합 유전자 분석

그리고 난 후, 최근 몇몇 전이(transforming) 융합 유전자들이 핵심 돌연변이로서 폐선암에서 검출되고 있기 때문에, 융합 유전자 검출에 초점을 두었다. "Ju YS et al.Genome Res. 2012 22:436-445"에 기재된 유전자 융합 프로그램(GFP)을 이용하여, 87개 암조직 샘플로부터 45개의 인-프레임 융합 전사체를 동정하였다.

전사체 (transcriptome) 시퀀싱을 이용한 융합유전자 검출을 위하여, 약 300bp 길이의 cDNA 조각의 양쪽 말단 101bp씩을 차세대 서열 분석법(Ju YS et al.Genome Res. 2012 22:436-445)으로 서열을 규명하고, 양쪽 말단이 상이한 유전자 서열로 구성되어 있는 불일치 서열 (discordant read)을 찾아내었다. 또한 한쪽 말단 서열이 융합 유전자의 분점(breakpoint)으로부터 생성됨으로써 상이한 두 유전자 서열의 조합으로 되어있는 엑손-스패닝 서열 (exon-spanning read) 을 찾아내었다. 불일치 서열과 엑손-스패닝 서열은 모두 융합 유전자의 존재를 시사하는 서열이다. 불일치 서열과 엑손-스패닝 서열을 모두 가지고 있는 한쌍의 유전자를 최종 융합 유전자 후보로 선정하였고, 이 가운데 아미노산 서열 상 원래 유전자의 코돈 프레임이 유지되는 인-프레임 융합 유전자를 최종 폐암 융합 유전자로 선정하였다.

이들 45개 전사체의 융합된 유전자와 각 유전자가 위치하는 염색체와 각 유전자 간 거리를 아래의 표 47에 정리하였다.

표 47

Index	DonorGene	AcceptorGene	Chromosome(Donor;Acceptor)	Distance (Mb)
1	EML4	ALK	chr2;chr2	12.252
2	KIF5B	RET	chr10;chr10	11.227
2	KIF5B	RET	chr10;chr10	11.227
2	KIF5B	RET	chr10;chr10	11.227
2	KIF5B	RET	chr10;chr10	11.227
3	CD74	ROS1	chr5;chr6	Interchromosomal
4	SLC34A2	ROS1	chr4;chr6	Interchromosomal
5	CCDC6	ROS1	chr10;chr6	Interchromosomal
6	SCAF11	PDGFRA	chr12;chr4	Interchromosomal
7	FGFR2	CIT	chr10;chr12	Interchromosomal
8	AXL	MBIP	chr19;chr14	Interchromosomal
9	APLP2	TNFSF11	chr11;chr13	Interchromosomal
10	MAP4K3	PRKCE	chr2;chr2	6.215
11	BCAS3	MAP3K3	chr17;chr17	2.23
12	KRAS	CDH13	chr12;chr16	Interchromosomal
13	ZFYVE9	CGA	chr1;chr6	Interchromosomal
14	ERBB2IP	MAST4	chr5;chr5	0.515
15	TPD52L1	TRMT11	chr6;chr6	0.723
16	TXNRD1	GPR133	chr12;chr12	26.694
17	SRSF4	SNRNP40	chr1;chr1	2.224
18	EDA	MID1	chrX;chrX	57.984
19	HYOU1	C11orf93	chr11;chr11	7.736
20	SLC16A7	MUCL1	chr12;chr12	4.831
21	MIER2	ITGB1BP3	chr19;chr19	3.588
22	RBM14	FGF3	chr11;chr11	3.211
23	UBR4	ATP13A2	chr1;chr1	2.063
24	TTC19	ATPAF2	chr17;chr17	1.989
25	IGSF3	MAN1A2	chr1;chr1	0.7
26	XAF1	FAM64A	chr17;chr17	0.305
27	IL6ST	KDM1B	chr5;chr6	Interchromosomal
28	UBE2E1	ASCC3	chr3;chr6	Interchromosomal
29	XRCC1	MAL	chr19;chr2	Interchromosomal
30	BRWD1	CCDC46	chr21;chr17	Interchromosomal
31	SPTLC3	MAOA	chr20;chrX	Interchromosomal
32	UTRN	OS9	chr6;chr12	Interchromosomal
33	LOC100306951	NUP93	chr17;chr16	Interchromosomal
34	MGAT5	HNMT	chr2;chr2	3.515
35	MAP3K3	PECAM1	chr17;chr17	0.623
36	CMBL	C8orf38	chr5;chr8	Interchromosomal
37	ITGB1BP3	DNM2	chr19;chr19	6.886
38	LSM14A	SIPA1L3	chr19;chr19	3.677
39	RAB21	FRS2	chr12;chr12	2.175
40	ARHGEF16	TCTEX1D4	chr1;chr1	41.874
41	MMP14	H19	chr14;chr11	Interchromosomal
42	H19	CALR	chr11;chr19	Interchromosomal
43	SFTPB	DPYSL2	chr2;chr8	Interchromosomal
44	SFTPA2	SFTPB	chr10;chr2	Interchromosomal
45	FTL	SFTPA2	chr19;chr10	Interchromosomal

하기의 표 48에 상기 45개 전사체의 donor 부위의 절단 지점(전사체 기준으로 3'-말단 절단 지점), 절단 지점에 해당하는 아미노산 서열, 및 절단 지점이 위치하는 엑손을 각 유전자 (변형체 포함) 별로 나타내었다.

표 48

Index	Donor Breakpoint(RNA)	Donor protein sequence near breakpoint	Donor exon number
1	chr2:42522656]	TPGKGPK+1nt	EML4(NM_001145076,+strand),exon12(chr2:42522521-42522656;EML4(NM_019063,+strand),exon13(chr2:42522521-42522656;
2	chr10:[32317356	NNDVK	KIF5B(NM_004521,-strand),exon15(chr10:32317356-32317499;
2	chr10:[32306980	KVHKQ	KIF5B(NM_004521,-strand),exon23(chr10:32306980-32307084;
2	chr10:[32317356	NNDVK	KIF5B(NM_004521,-strand),exon15(chr10:32317356-32317499;
2	chr10:[32317356	NNDVK	KIF5B(NM_004521,-strand),exon15(chr10:32317356-32317499;
3	chr5:[149784243	DAPPK+1nt	CD74(NM_004355,-strand),exon6(chr5:149784243-149784330;CD74(NM_001025159,-strand),exon6(chr5:149784243-149784330;
4	chr4:25678324]	SREAQ+1nt	SLC34A2(NM_006424,+strand),exon13(chr4:25677757-25680366;SLC34A2(NM_001177998,+strand),exon13(chr4:25677757-25680366;SLC34A2(NM_001177999,+strand),exon13(chr4:25677757-25680366;
5	chr10:[61572393	AAQLQ+1nt	CCDC6(NM_005436,-strand),exon5(chr10:61572393-61572553;
6	chr12:[46384136	5UTR	SRSF2IP(NM_004719,-strand),exon1(chr12:46384136-46384401;
7	chr10:[123243212	LTLTTNE	FGFR2(NM_001144914,-strand),exon14(chr10:123243212-123243317;FGFR2(NM_001144916,-strand),exon14(chr10:123243212-123243317;FGFR2(NM_001144915,-strand),exon16(chr10:123243212-123243317;FGFR2(NM_001144917,-strand),exon15(chr10:123243212-123243317;FGFR2(NM_001144918,-strand),exon15(chr10:123243212-123243317;FGFR2(NM_022970,-strand),exon17(chr10:123243212-123243317;FGFR2(NM_000141,-strand),exon17(chr10:123243212-123243317;FGFR2(NM_001144913,-strand),exon16(chr10:123243212-123243317;FGFR2(NM_001144919,-strand),exon16(chr10:123243212-123243317;
8	chr19:41765701]	LTAAE	AXL(NM_021913,+strand),exon20(chr19:41765458-41767670;AXL(NM_001699,+strand),exon19(chr19:41765458-41767670;
9	chr11:130000061]	AAQMKSQ	APLP2(NM_001642,+strand),exon11(chr11:129999933-130000061;APLP2(NM_001142276,+strand),exon11(chr11:129999933-130000061;APLP2(NM_001142278,+strand),exon7(chr11:129999933-130000061;APLP2(NM_001142277,+strand),exon10(chr11:129999933-130000061;APLP2(NR_024516,+strand),exon8(chr11:129999933-130000061;APLP2(NR_024515,+strand),exon8(chr11:129999933-130000061;
10	chr2:[39664033	TYGDVYK	MAP4K3(NM_003618,-strand),exon1(chr2:39664033-39664219;
11	chr17:59161925]	TVIDAAS+1nt	BCAS3(NM_017679,+strand),exon22(chr17:59161828-59161925;BCAS3(NM_001099432,+strand),exon23(chr17:59161828-59161925;
12	chr12:[25378548	TSAKTRQ	KRAS(NM_004985,-strand),exon4(chr12:25378548-25378707;KRAS(NM_033360,-strand),exon4(chr12:25378548-25378707;
13	chr1:52803606]	DKNVSK+2nt	ZFYVE9(NM_007324,+strand),exon15(chr1:52803444-52803606;ZFYVE9(NM_004799,+strand),exon16(chr1:52803444-52803606;
14	chr5:65372777]	QPGDKIIQ	ERBB2IP(NM_018695,+strand),exon24(chr5:65372703-65372777;ERBB2IP(NM_001006600,+strand),exon23(chr5:65372703-65372777;
15	chr6:125569529]	SKKFGDM+2nt	TPD52L1(NM_003287,+strand),exon4(chr6:125569428-125569529;TPD52L1(NM_001003396,+strand),exon4(chr6:125569428-125569529;TPD52L1(NM_001003397,+strand),exon4(chr6:125569428-125569529;TPD52L1(NM_001003395,+strand),exon4(chr6:125569428-125569529;
16	chr12:104733051]	IHPVCAE	TXNRD1(NM_001093771,+strand),exon16(chr12:104732917-104733051;TXNRD1(NM_003330,+strand),exon14(chr12:104732917-104733051;TXNRD1(NM_182729,+strand),exon14(chr12:104732917-104733051;TXNRD1(NM_182743,+strand),exon13(chr12:104732917-104733051;TXNRD1(NM_182742,+strand),exon13(chr12:104732917-104733051;
17	chr1:[29485886	SRCSWQDLK	SRSF4(NM_005626,-strand),exon3(chr1:29485886-29485998;
18	chrX:68836548]	DSQDGHQ	EDA(NM_001005610,+strand),exon1(chrX:68835911-68836548;EDA(NM_001005613,+strand),exon1(chrX:68835911-68836548;EDA(NM_001399,+strand),exon1(chrX:68835911-68836548;EDA(NM_001005609,+strand),exon1(chrX:68835911-68836548;EDA(NM_001005612,+strand),exon1(chrX:68835911-68836548;
19	chr11:[118921747	SGVLSLDR	HYOU1(NM_006389,-strand),exon14(chr11:118921747-118921885;HYOU1(NM_001130991,-strand),exon14(chr11:118921747-118921885;
20	chr12:60098799]	LAVMYAG+1nt	SLC16A7(NM_004731,+strand),exon2(chr12:60098553-60098799;
21	chr19:[325635	LNRHCEK+1nt	MIER2(NM_017550,-strand),exon7(chr19:325635-325704;
22	chr11:66384528]	IECDVVK+1nt	RBM14(NM_006328,+strand),exon1(chr11:66384053-66384528;
23	chr1:[19523635	LSCLYA+1nt	UBR4(NM_020765,-strand),exon8(chr1:19523635-19523759;
24	chr17:15930016]	AAVLMHR+1nt	TTC19(NM_017775,+strand),exon9(chr17:15929854-15930016;
25	chr1:117156387]	VVNVQPT+1nt	IGSF3(NM_001542,-strand),exon4(chr1:117156387-117156797;IGSF3(NM_001007237,-strand),exon4(chr1:117156387-117156797;
26	chr17:6663920]	EQAQLGK+1nt	XAF1(NM_017523,+strand),exon4(chr17:6663725-6663920;XAF1(NM_199139,+strand),exon3(chr17:6663725-6663920;
27	chr5:[55290612	5UTR	IL6ST(NM_175767,-strand),exon1(chr5:55290612-55290821;IL6ST(NM_002184,-strand),exon1(chr5:55290612-55290821;IL6ST(NM_001190981,-strand),exon1(chr5:55290612-55290821;
28	chr3:23847579]	5UTR	UBE2E1(NM_003341,+strand),exon1(chr3:23847439-23847579;UBE2E1(NM_182666,+strand),exon1(chr3:23847439-23847579;
29	chr19:[44079062	TISVVLQ	XRCC1(NM_006297,-strand),exon2(chr19:44079062-44079154;
30	chr21:[40604103	WRKMDLR	BRWD1(NM_018963,-strand),exon25(chr21:40604103-40604210;BRWD1(NM_033656,-strand),exon25(chr21:40604103-40604210;
31	chr20:13074224]	IRIFKHN+1nt	SPTLC3(NM_018327,+strand),exon6(chr20:13074131-13074224;
32	chr6:144820563]	LDTEISWAK	UTRN(NM_007124,+strand),exon33(chr6:144820393-144820563;
33	chr17:1420387]	5UTR	LOC100306951(NR_028514,+strand),exon1(chr17:1420213-1420387;
34	chr2:135028121]	LEKINVA+1nt	MGAT5(NM_002410,+strand),exon2(chr2:135027957-135028121;
35	chr17:61723434]	EHNGER+2nt	MAP3K3(NM_002401,+strand),exon3(chr17:61723394-61723434;MAP3K3(NM_203351,+strand),exon4(chr17:61723394-61723434;
36	chr5:[10307737	5UTR	CMBL(NM_138809,-strand),exon1(chr5:10307737-10308168;
37	chr19:3942267]	ASQQDS+2nt	ITGB1BP3(NM_170678,+strand),exon8(chr19:3942081-3942412;
38	chr19:34663668]	NSTVALAK+1nt	LSM14A(NM_015578,+strand),exon1(chr19:34663352-34663668;LSM14A(NM_001114093,+strand),exon1(chr19:34663352-34663668;
39	chr12:72176438]	LFLDLCK+1nt	RAB21(NM_014999,+strand),exon6(chr12:72176350-72176438;
40	chr1:3392626]	QLDFSKVK	ARHGEF16(NM_014448,+strand),exon10(chr1:3392534-3392626;
41	chr14:23316426]	3UTR	MMP14(NM_004995,+strand),exon10(chr14:23314917-23316802;
42	chr11:[2018179	noncoding	H19(NR_002196,-strand),exon1(chr11:2017748-2019065;
43	chr2:[85885042	3UTR	SFTPB(NM_000542,-strand),exon12(chr2:85884441-85886805;SFTPB(NM_198843,-strand),exon12(chr2:85884441-85885978;
44	chr10:[81319068	GDPGPP+1nt	SFTPA2(NM_001098668,-strand),exon3(chr10:81319068-81319262;
45	chr19:49468806]	NYSTDVE	FTL(NM_000146,+strand),exon1(chr19:49468566-49468866;

하기의 표 49에 상기 45개 전사체의 acceptor 부위의 절단 지점(전사체 기준으로 5'-말단 절단 지점), 절단 지점에 해당하는 아미노산 서열, 및 절단 지점이 위치하는 엑손을 각 유전자 (변형체 포함) 별로 나타내었다.

표 49

Index	Acceptor Breakpoint(RNA)	Acceptor protein sequence near breakpoint	Acceptor exon number
1	chr2:29446394]	2nt+YRRKHQE	ALK(NM_004304,-strand),exon20(chr2:29446208-29446394;
2	chr10:[43612032	EDPKWEF	RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179;
2	chr10:[43612032	EDPKWEF	RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179;
2	chr10:[43612032	EDPKWEF	RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179;
2	chr10:[43612032	EDPKWEF	RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179;
3	chr6:117645578]	2nt+DFWIP	ROS1(NM_002944,-strand),exon34(chr6:117645495-117645578;
4	chr6:117650609]	2nt+GVPNK	ROS1(NM_002944,-strand),exon32(chr6:117650492-117650609;
5	chr6:117642557]	2nt+WHRRL	ROS1(NM_002944,-strand),exon35(chr6:117642422-117642557;
6	chr4:[55124924	5UTR, in-frame	PDGFRA(NM_006206,+strand),exon2(chr4:55124924-55124984;
7	chr12:120180269]	AHRDEIQ	CIT(NM_007174,-strand),exon23(chr12:120180216-120180269;
8	chr14:36783814]	IDRRI	MBIP(NM_016586,-strand),exon4(chr14:36783718-36783814;MBIP(NM_001144891,-strand),exon4(chr14:36783718-36783814;
9	chr13:[43174888	ELQHIVG	TNFSF11(NM_033012,+strand),exon5(chr13:43174888-43174933;TNFSF11(NM_003701,+strand),exon3(chr13:43174888-43174933;
10	chr2:[46070139	IDLEPEGR	PRKCE(NM_005400,+strand),exon2(chr2:46070139-46070202;
11	chr17:61710041]	2nt+EQEALNS	MAP3K3(NM_002401,+strand),exon2(chr17:61710041-61710162;MAP3K3(NM_203351,+strand),exon2(chr17:61710041-61710162;
12	chr16:[83158990	DIFKFAR	CDH13(NM_001257,+strand),exon4(chr16:83158990-83159106;
13	chr6:87797925]	5UTR, in-frame	CGA(NM_000735,-strand),exon2(chr6:87797831-87797925;
14	chr5:[66400194	ATAQMEER	MAST4(NM_001164664,+strand),exon10(chr5:66400194-66400403;MAST4(NM_015183,+strand),exon9(chr5:66400194-66400403;
15	chr6:[126342306	1nt+YTEEMVP	TRMT11(NM_001031712,+strand),exon12(chr6:126342306-126342426;
16	chr12:[131561346	TRKQHS	GPR133(NM_198827,+strand),exon14(chr12:131561346-131561419;
17	chr1:31744346]	VWDLRQN	SNRNP40(NM_004814,-strand),exon6(chr1:31744226-31744346;
18	chrX:10463731]	VNASRQE	MID1(NM_001193277,-strand),exon4(chrX:10463624-10463731;MID1(NM_000381,-strand),exon4(chrX:10463624-10463731;MID1(NM_033289,-strand),exon4(chrX:10463624-10463731;MID1(NM_001098624,-strand),exon4(chrX:10463624-10463731;MID1(NM_033290,-strand),exon4(chrX:10463624-10463731;MID1(NM_001193278,-strand),exon4(chrX:10463624-10463731;MID1(NM_001193279,-strand),exon3(chrX:10463624-10463731;MID1(NM_001193280,-strand),exon3(chrX:10463624-10463731;
19	chr11:[111175653	5 UTR	C11orf93(NM_001136105,+strand),exon3(chr11:111175653-111175707;
20	chr12:[55248900	2nt+NPTTAAPAD	MUCL1(NM_058173,+strand),exon2(chr12:55248900-55248941;
21	chr19:[3942081	2nt+YLDGMKS	ITGB1BP3(NM_170678,+strand),exon8(chr19:3942081-3942412;
22	chr11:69631191]	2nt+ILEITAV	FGF3(NM_005247,-strand),exon2(chr11:69631088-69631191;
23	chr1:17332273]	2nt+SSPLVG	ATP13A2(NM_001141973,-strand),exon2(chr1:17332179-17332273;ATP13A2(NM_022089,-strand),exon2(chr1:17332179-17332273;ATP13A2(NM_001141974,-strand),exon2(chr1:17332179-17332273;
24	chr17:17931973]	2nt+RKRFYQN	ATPAF2(NM_145691,-strand),exon2(chr17:17931929-17931973;
25	chr1:[118035769	2nt+HTSVGGLGD	MAN1A2(NM_006699,+strand),exon9(chr1:118035769-118035884;
26	chr17:[6348396	5UTR, in-frame	FAM64A(NM_001195228,+strand),exon2(chr17:6348396-6348724;FAM64A(NM_019013,+strand),exon2(chr17:6348396-6348724;
27	chr6:[18215238	KKHSVLM	KDM1B(NM_153042,+strand),exon16(chr6:18215238-18215360;
28	chr6:100966018]	AMLDVAAN	ASCC3(NM_006828,-strand),exon38(chr6:100965867-100966018;
29	chr2:[95713704	IFGGLVW	MAL(NM_022438,+strand),exon2(chr2:95713704-95713871;MAL(NM_002371,+strand),exon2(chr2:95713704-95713871;
30	chr17:63685336]	VLQDELE	CCDC46(NM_001037325,-strand),exon4(chr17:63685247-63685336;CCDC46(NM_145036,-strand),exon24(chr17:63685247-63685336;
31	chrX:[43542761	2nt+LSAAKLL	MAOA(NM_000240,+strand),exon2(chrX:43542761-43542855;
32	chr12:[58109543	FLCDEGA	OS9(NM_006812,+strand),exon6(chr12:58109543-58109753;OS9(NM_001017956,+strand),exon6(chr12:58109543-58109753;OS9(NM_001017957,+strand),exon6(chr12:58109543-58109753;OS9(NM_001017958,+strand),exon6(chr12:58109543-58109753;
33	chr16:[56870513	PGVIDKF	NUP93(NM_014669,+strand),exon17(chr16:56870513-56870629;
34	chr2:[138758488	2nt+EIDLQIL	HNMT(NM_006895,+strand),exon3(chr2:138758488-138758595;
35	chr17:62401205]	unidentified	PECAM1(NM_000442,-strand),exon1(chr17:62399864-62401205;
36	chr8:[96044223	5UTR	C8orf38(NM_152416,+strand),exon2(chr8:96044223-96044322;
37	chr19:[10870414	1nt+DFLPRGS	DNM2(NM_001190716,+strand),exon2(chr19:10870414-10870487;DNM2(NM_004945,+strand),exon2(chr19:10870414-10870487;DNM2(NM_001005361,+strand),exon2(chr19:10870414-10870487;DNM2(NM_001005362,+strand),exon2(chr19:10870414-10870487;DNM2(NM_001005360,+strand),exon2(chr19:10870414-10870487;
38	chr19:[38519729	5UTR	SIPA1L3(NM_015073,+strand),exon2(chr19:38519729-38519796;
39	chr12:[69924645	5UTR	FRS2(NM_006654,+strand),exon2(chr12:69924645-69924740;FRS2(NM_001042555,+strand),exon3(chr12:69924645-69924740;
40	chr1:45272510]	5UTR	TCTEX1D4(NM_001013632,-strand),exon1(chr1:45272456-45272957;
41	chr11:2018689]	noncoding	H19(NR_002196,-strand),exon1(chr11:2017748-2019065;
42	chr19:[13054527	AAEKQMK	CALR(NM_004343,+strand),exon9(chr19:13054527-13055304;
43	chr8:[26501052	1nt+SPPLSPD	DPYSL2(NM_001386,+strand),exon9(chr8:26500955-26501111;
44	chr2:85885494]	3UTR	SFTPB(NM_000542,-strand),exon12(chr2:85884441-85886805;SFTPB(NM_198843,-strand),exon12(chr2:85884441-85885978;
45	chr10:81316285]	3UTR	SFTPA2(NM_001098668,-strand),exon6(chr10:81315609-81317341;

이들 중에서, 22개 (48.9%)는 염색체내 융합(intra-chromosomal fusions)이었다. cDNA의 PCR 증폭 및 Sanger sequencing을 이용하여 30개의 선별된 융합 유전자 중에서 29개(1-29번)를 validating하였다 (표 50 참조).

표 50

	DonorGene	AcceptorGene	Forward Primer Name	Forward Primer Sequence	Reverse Primer Name	Reverse Primer Sequence
1	KIF5B	RET	GF1_KIF5B:RET_F	TAAGGAAATGACCAACCACCAG	GF1_KIF5B:RET_R	CCTTGACCACTTTTCCAAATTC
2	KRAS	CDH13	GF2_KRAS:CDH13_F	GGAAATAAATGTGATTTGCCTTC	GF2_KRAS:CDH13_R	AAGGCTGTCTCTGATTCTCTGG
3	APLP2	TNFSF11	GF3_APLP2:TNFSF11_F	TGCTGAGAACAAAGATCGCTTA	GF3_APLP2:TNFSF11_R	TGTCGGTGGCATTAATAGTGAG
4	ZFYVE9	CGA	GF4_ZFYVE9:CGA_F	ACTGCAGAGAACATGGATTCCT	GF4_ZFYVE9:CGA_R	GAATGGAGAACATGCAGAAACA
5	CCDC6	ROS1	GF5_CCDC6:ROS1_F	CCTGCAGGAAAAATTAGACCAG	GF5_CCDC6:ROS1_R	AGCTCAGCCAACTCTTTGTCTT
6	FGFR2	CIT	GF6_FGFR2:CIT_F	ACATGATGATGAGGGACTGTTG	GF6_FGFR2:CIT_R	ACAGCTGTTACGAAGAGCATCA
7	AXL	MBIP	GF7_AXL:MBIP_F	GCCTGACGAAATCCTCTATGTC	GF7_AXL:MBIP_R	CAAAATTCCCTGACGTTGTTTT
8	SCAF11	PDGFRA	GF8_SCAF11:PDGFRA_F	CAGCGGAGTCAGTGTCCTAGAG	GF8_SCAF11:PDGFRA_R	TGAGAAGACAGCCTAAGACCAG
9	CD74	ROS1	GF9_CD74:ROS1_F	GTCTTTGAGAGCTGGATGCAC	GF9_CD74:ROS1_R	AGCTCAGCCAACTCTTTGTCTT
10	SLC34A2	ROS1	GF10_SLC34A2:ROS1_F	ATGCCGTCGTCTCCAAGTTC	GF10_SLC34A2:ROS1_R	ATCTTCAGCTTTCTCCCACTGT
11	TXNRD1	GPR133	GF11_TXNRD1:GPR133_F	TCCAAATGCTGGAGAAGTTACA	GF11_TXNRD1:GPR133_R	AGTACACGAAGACTCGGTTGCT
12	EML4	ALK	GF12_EML4:ALK_F	GCCAAAATTTGTGCAGTGTTTA	GF12_EML4:ALK_R	GGAGCTTGCTCAGCTTGTACTC
13	HYOU1	C11orf93	GF13_HYOU1:C11orf93_F	CCAGAATCTGACCACAGTGAAG	GF13_HYOU1:C11orf93_R	AGAAGATGGTGCAACTGGGTCT
14	MAP4K3	PRKCE	GF14_MAP4K3:PRKCE_F	AGGAGGACTTCGAGCTGATTC	GF14_MAP4K3:PRKCE_R	ACGACCCTGAGAGATCGATGA
15	RBM14	FGF3	GF15_RBM14:FGF3_F	CCAAGGCCTCTTAATACTTGGA	GF15_RBM14:FGF3_R	CATAGAGTCGTCCCCTCTTGTT
16	BCAS3	MAP3K3	GF16_BCAS3:MAP3K3_F	CATCCCGTCCAGTCTCTGAT	GF16_BCAS3:MAP3K3_R	CTGCCTATTTGAGTGACCTGTG
17	SRSF4	SNRNP40	GF17_SRSF4:SNRNP40_F	GAAGTGGCCGAGATAAATATGG	GF17_SRSF4:SNRNP40_R	TAAACTCAGGCCAGTCACTGAA
18	UBR4	ATP13A2	GF18_UBR4:ATP13A2_F	ACCCTTTCTCTACCTGTGTTGG	GF18_UBR4:ATP13A2_R	AGCTGAGGGGATCTATTGATGT
19	TTC19	ATPAF2	GF19_TTC19:ATPAF2_F	CGCTTTGATGAGGCCTATATTT	GF19_TTC19:ATPAF2_R	CTGTGTGATGCTGACATTCTGA
20	TPD52L1	TRMT11	GF20_TPD52L1:TRMT11_F	GAAAACACATGAAACCCTGAGTC	GF20_TPD52L1:TRMT11_R	ATGTGTGACTGGAAAGCTTCTG
21	IGSF3	MAN1A2	GF21_IGSF3:MAN1A2_F	CTGACCAGGGCGAATTCTACT	GF21_IGSF3:MAN1A2_R	TCTTGCCTCATGGTCTGTTTTA
22	ERBB2IP	MAST4	GF22_ERBB2IP:MAST4_F	AACAAGGGTACAACCTGAAGGA	GF22_ERBB2IP:MAST4_R	TCAAGGAAGTATCGTGAGGTGA
23	XAF1	FAM64A	GF23_XAF1:FAM64A_F	GGAGCTCCACGAGTCCTACTGT	GF23_XAF1:FAM64A_R	AGAGGTCTCCTGATGGCTGAC
24	MIER2	ITGB1BP3	GF24_MIER2:ITGB1BP3_F	AGATCATGGTGGGACCTCAGT	GF24_MIER2:ITGB1BP3_R	AGCAGCGAGTTCTGAATGTCTT
25	SLC16A7	MUCL1	GF25_SLC16A7:MUCL1_F	GTGGTTGGAGCAGCTTTTATCT	GF25_SLC16A7:MUCL1_R	TCATCATCAGCAGGACCAGTAG
26	ITGB1BP3	DNM2	GF26_ITGB1BP3:DNM2_F	CCTGGAAGACATTCAGAACTCG	GF26_ITGB1BP3:DNM2_R	TTTGAGAAGATGAGCTGCAGAA
27	ARHGEF16	TCTEX1D4	GF27_ARHGEF16:TCTEX1D4_F	GCATGGAGCAGATGTACACG	GF27_ARHGEF16:TCTEX1D4_R	TGTGTTTTAGAACAAGTGGATCAGA
28	CMBL	C8orf38	GF29_CMBL:C8orf38_F	CTCTCCCAGGAGGCTACGACT	GF29_CMBL:C8orf38_R	TGAGCCAGTTCCACATTAAAGG
29	EDA	MID1	GF30_EDA:MID1_F	TGACGTTGTGCTGCTACCTAGA	GF30_EDA:MID1_R	ATCTGTCGTCTTTGCTGAATGA
30	H19	CALR	GF28_H19:CALR_F	CACCGCAATTCATTTAGTAGCA	GF28_H19:CALR_R	GCCTCTCTACAGCTCGTCCTT

실시예 3: 융합 유전자 확인

게놈 DNA 및 cDNA에 대한 Sanger sequencing 및 PCR 증폭에 의하여 상기 발견된 사항을 확인하였다.

RNeasy 미니 키트(Qiagen)를 사용하여 종양 샘플로부터 RNA를 추출하는데 사용하였다. DNA는 DNeasy 티슈 키트(Qiagen)를 사용하여 추출하였다. RT-PCR을 위하여, 첫째 가닥 cDNA는 올리고(dT)20을 가지는 SuperScript TM III 첫째 가닥 합성 시스템(Invitrogen)으로 2.5mg의 전체 RNA으로부터 합성하였다. 그 다음에 각 융합 유전자를 해당 프라이머 쌍(상기 표 50 참조)을 사용하여 증폭하였다. 각각의 프라이머 쌍 및 Taq DNA polymerase 하이 피델리티(Invitrogen)를 사용하여 PCR로 유전자 증폭을 수행하였다.

PCR 반응은 95 ℃에서 10분간, 95 ℃에서 30초간-62 ?에서 30초간-72 ?에서 30초간을 30 사이클, 및 최종적으로 72 ?에서 10 분간 수행하였다. 게놈 결실 검출용 PCR 및 Sanger sequencing 프라이머는 다음과 같다: 5'- AACAAGGGTACAACCTGAAGGA-3' 및 5'-TCAAGGAAGTATCGTGAGGTGA-3'. 융합 전사체용 프라이머는 다음과 같다: 5'-AACAAGGGTACAACCTGAAGGA-3' 및 5'-TCAAGGAAGTATCGTGAGGTGA-3'. 모든 Sanger sequencing 시험은 Macrogen Inc. 매뉴얼에 따라서 수행하였다 (http://www.macrogen.com).

실시예 5: 융합 단백질 저해제의 포유류 고형 종양의 성장 저해 확인 시험

본 발명에서 제안되는 융합 단백질들이 이러한 융합단백질을 발현하는 세포주 또는 종양에서 성장 및 생존을 추진하는 것을 확인하기 위하여, 그 세포들을 각 융합 단백질 내 카이네이즈 또는 다른 도메인의 저해제로 처리하였다. ?

융합단백질을 발현하는 세포의 세포수를 계산하고, 세포 성장 저해 분석은 제조업자가 제안하는 것에 따라 CellTiter 96 AQueous 원 용액 세포 증식 분석(Promega)으로 수행하였다. 간략하게 설명하면, 1000에서 5000 세포들을 프랫-바텀 96-웰 플레이트 상에 시딩하고 10% FBS를 가지는 완전 배지에서 성장시켰다. 24 시간 후, 그 세포 배지를 각각의 융항 단백질에 대한 저해 약제를 다양한 농도로 포함하는 10% FBS를 가지는 100㎕ 완전 성장 배지로 교체하고, 72 시간 동안 더 배양하였다. 각 약제 농도는 세포들의 세 동일한(triplicate) 웰에 적용하였다. 배양 종결 시기에서, 20 ㎕의 CellTiter 96 AQueous 원 용액은 각 웰에 첨가하고 그 플레이트는 1-4 시간 동안 배양하였다. 흡광도는 마이크로플레이트 리더를 사용하여 490nm에서 판독하였다. 성장 저해는 처리된 세포들 대비 처리된 세포들로부터 판독한 흡광도의 평균 ± SD 값으로 표현될 수 있다. 이와 같은 분석은 적어도 3회 반복하였다. 그러한 분석으로부터 융합 단백질들이 발현되는 인간 NSCLC 종양들의 서브세트의 성장 및 생존을 추진하는지를 확인하고, 그러한 세포들은 타겟된 저해제를 사용하여 융합 단백질 내 카이네이즈의 활성 또는 다른 도메인의 활성을 저해하여 저해될 수 있다는 것을 확인할 수 있을 것이다.

실시예 6: 융합 단백질의 형질전환된 포유류 세포주의 성장 및 생존 촉진 확인 시험

NIH 3T3 세포들을 각 융합 단백질의 코딩 cDNA를 포함하는 구조체로 형질전환시켜서 융합 단백질을 발현시킴으로써, 본 발명에서 제안된 융합 단백질의 발현이 정상세포를 암 표현형으로 형질전환시킬 수 있는지를 확인하였다. 간략하게 설명하면, 세포들을 10% 우태혈청(FBS) (Sigma) 및 1.0 ng/ml IL-3 (R&D Systems)을 가지는 RPMI-1640 배지(Invitrogen)에서 유지하였다. 레트로바이러스 상등액의 생성 및 트랜스팩션은 전에 알려진 것과 같이 수행하였다. NIH3T3 세포들은 pMXs-puro/융합 단백질 발현 벡터를 포함하는 레트로바이러스 상등액으로 트랜스덕션하고, puromycin(2ug/ml)에 대하여 선택하였다. 다음, 소프트 아가에서 성장하는 형질전환된 세포들의 능력을 측정하였다. 그러한 분석은 융합 단백질의 발현이 NIH3T3 세포를 형질전환할 수 있고, 이들 세포들을 융합 단백질에 의하여 소프트 아가상에서 생존 및 성장이 촉진됨을 확인할 수 있고, 형질전환된 세포들에서 이들 융합 단백질의 발현의 저해는 감소된 생존성 및 증가된 아팝토시스를 야기한다는 것을 나타낸다.

Claims

다음으로 이루어진 군에서 선택된 융합 단백질:

APLP2 (amyloid beta (A4) precursor-like protein 2) 단백질 또는 그의 단편과 C-말단에 TNFSF11 (tumor necrosis factor (ligand) superfamily, member 11) 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질;

MAP4K3 (mitogen-activated protein kinase kinase kinase kinase3) 단백질 또는 그의 단편과 C-말단에 PRKCE (protein kinase C, epsilon) 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질;

BCAS3 (breast carcinoma amplified sequence3) 단백질 또는 그의 단편과 C-말단에 MAP3K3 (mitogen activated protein kinase kinase kinase3) 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질;

N-말단에 KRAS (Ki-ras2 Kirsten rat sarcoma viral oncogene homolog) 단백질 또는 그의 단편과 C-말단에 CDH13 (cadherin 13, H-cadherin) 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질;

ZFYVE9 (zinc finger, FYVE domain containing 9) 단백질 또는 그의 단편과 C-말단에 CGA (glycoprotein hormones, alpha polypeptide) 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질;

N-말단에 ERBB2IP (Erbb2 interacting protein) 단백질 또는 그의 단편과 C-말단에 MAST4(Microtubule-associated serine/threonine-protein kinase 4) 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질;

TPD52L1 (tumor protein D52-like1) 단백질 또는 그의 단편과 C-말단에 (tRNA methyl transferase11 homolog) 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질;

TXNRD1 (thioredoxin reductase1) 단백질 또는 그의 단편과 C-말단에 GPR133 (G protein-coupled receptor 133) 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질; 및

상기 융합 단백질 1종 이상의 조합.
제1항에 있어서,

상기 APLP2-TNFSF11 융합 단백질에서, 상기 APLP2 단백질의 단편은 NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, 또는 NR_024515의 첫 번째 엑손부터 엑손 12까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 TNFSF11 단백질의 단편은 NM_033012 또는 NM_003701의 엑손 6부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,

상기 MAP4K3-PRKCE 융합 단백질에서, 상기 MAP4K3 단백질의 단편은 NM_003618의 엑손 1의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 PRKCE 단백질의 단편은 NM_005400의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,

상기 BCAS3-MAP3K3 융합 단백질에서, 상기 BCAS3 단백질의 단편은 NM_017679 또는 NM_001099432의 첫 번째 엑손에서 엑손 23까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 MAP3K3 단백질의 단편은 NM_002401 또는 NM_203351의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,

상기 KRAS-CDH13 융합 단백질에서, 상기 KRAS 단백질의 단편은 NM_004985 또는 NM_033360의 첫 번째 엑손부터 엑손 4까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 CDH13 단백질의 단편은 NM_001257의 엑손 5부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,

상기 ZFYVE9-CGA 융합 단백질에서, 상기 ZFYVE9 단백질의 단편은 NM_007324 또는 NM_004799의 첫 번째 엑손에서 엑손 16까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 CGA 단백질의 단편은 NM_000735의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,

상기 ERBB2IP-MAST4 융합 단백질에서, 상기 ERBB2IP 단백질의 단편은 NM_001006600 또는 NM_018695의 첫 번째 엑손부터 엑손 26까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 MAST4 단백질의 단편은 NM_001164664 또는 NM_015183의 엑손 13부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,

상기 TPD52L1-TRMT11 융합 단백질에서, 상기 TPD52L1 단백질의 단편은 NM_003287, NM_001003396, NM_001003397, 또는 NM_001003395의 첫 번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 TRMT11 단백질의 단편은 NM_001031712의 엑손 12부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,

상기 TXNRD1-GPR133 융합 단백질에서 상기 TXNRD1 단백질의 단편은 NM_003330, NM_001093771, NM_182729, NM_182743, 또는 NM_182742의 첫 번째 엑손에서 엑손 17까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 GPR133 단백질의 단편은 NM_198827의 엑손 14부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것인,

융합 단백질.
제1항에 있어서,

상기 APLP2-TNFSF11 융합 단백질은 5' 말단에 NM_001642의 158번째부터 1741번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_033012의 698번째부터 1264번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,

상기 MAP4K3-PRKCE 융합 단백질은 5' 말단에 NM_003618의 326번째부터 421번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_005400의 546번째부터 2411번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이며,

상기 BCAS3-MAP3K3 융합 단백질은 5' 말단에 NM_001099432의 110번째부터 2579번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002401의 324번째부터 2200번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,

상기 KRAS-CDH13 융합 단백질은 5' 말단에 NM_004985의 182번째부터 631번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001257의 666번째부터 2441번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이며,

상기 ZFYVE9-CGA 융합 단백질은 5' 말단에 NM_007324의 173번째부터 3828번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_000735의 136번째부터 493번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,

상기 ERBB2IP-MAST4 융합 단백질은 5' 말단에 NM_001006600 의 311번째부터 4111번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001164664의 1455번째부터 8180번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이며,

상기 TPD52L1-TRMT11 융합 단백질은 5' 말단에 NM_001003395의 328번째부터 626번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001031712의 122번째부터 1513번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,

상기 TXNRD1-GPR133 융합 단백질은 5' 말단에 NM_003330의 656번째부터 2242번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_198827의 2203번째부터 3184번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것인,

융합 단백질.
제3항에 있어서,

상기 융합 단백질은 서열번호 63, 79, 95, 111, 126, 142, 158, 및 174로 이루어진 군에서 선택된 아미노산 서열을 갖는 것인,

융합 단백질.
제1항 내지 제4항 중 어느 한 항의 융합 단백질을 암호화하는 융합 유전자.
제5항에 있어서,

상기 융합 유전자는 서열번호 61, 77, 93, 109, 124, 140, 156, 및 172로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인, 융합 유전자.
SCAF11 (SR-related CTD-associated factor 11) 유전자의 5UTR부위 및 PDGFRA (platelet-derived growth factor receptor, alpha polypeptide) 유전자 또는 그의 단편이 융합된 SCAF11-PDGFRA 융합 유전자.
제7항에 있어서,

상기 SCAF11 유전자의 5UTR부위는 NM_004719의 엑손 1의 뉴클레오타이드 서열을 갖는 것이고,

PDGFRA 유전자의 단편은 NM_006206의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열을 갖는 것인,

융합 유전자.
제7항에 있어서,

5' 말단에 NM_004719의 1번째부터 266번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_006206의 320번째부터 3601번째까지의 뉴클레오타이드 서열을 포함하는, 융합 유전자.
제9항에 있어서,

상기 융합 유전자는 서열번호 180의 뉴클레오타이드 서열을 갖는 것인,

융합 유전자.
제1항 내지 제4항 중 어느 한 항의 융합 단백질과 상호작용하는 물질, 및

상기 융합 단백질을 암호화하는 융합 유전자, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA와 상호작용하는 물질

로 이루어진 군에서 선택된 1종 이상을 포함하는,

암 진단용 조성물.
제11항에 있어서,

상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질에 결합하는 항체 및 압타머로 이루어진 군에서 선택된 1종 이상의 것이고,

상기 융합 유전자 또는 이에 상응하는 mRNA와 상호작용하는 물질은

상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개의 염기로 이루어진 폴리뉴클레오타이드 단편 또는 이에 상응하는 mRNA 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편 또는 mRNA 단편의 양 말단에 인접하는 20 내지 100개의 염기서열 또는 이의 상보적인 서열과 혼성화 가능한 프라이머쌍;

상기 융합 유전자 내의 융합 부위 또는 이에 상응하는mRNA 부위와 혼성화 가능한 5 내지 100 bp 길이의 안티센스 올리고뉴클레오타이드, 프로브, 및 앱타머

로 이루어진 군에서 선택된 1종 이상이고,

상기 융합 부위는 서열번호 62, 78, 94, 110, 126, 141, 157, 173 및 181로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인,

암 진단용 조성물.
제12항에 있어서,

상기 프라이머쌍은

서열번호 184 및 서열번호 185의 프라이머쌍;

서열번호 190 및 서열번호 191의 프라이머쌍;

서열번호 192 및 서열번호 193의 프라이머쌍;

서열번호 194 및 서열번호 195의 프라이머쌍;

서열번호 196 및 서열번호 197의 프라이머쌍;

서열번호 198 및 서열번호 199의 프라이머쌍;

서열번호 200 및 서열번호 201의 프라이머쌍;

서열번호 202 및 서열번호 203의 프라이머쌍; 및

서열번호 204 및 서열번호 205의 프라이머쌍

으로 이루어진 군에서 선택된 1종 이상인,

암 진단용 조성물.
제11항에 있어서, 상기 암은 고형암인, 암 진단용 조성물.
제14항에 있어서, 상기 암은 폐암인, 암 진단용 조성물.
제15항에 있어서, 상기 암은 비소세포성 폐암(NSCLC)인, 암 진단용 조성물.
환자로부터 분리된 생물학적 시료에서 제1항의 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, 제7항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA를 검출하는 단계를 포함하고,

상기 융합 단백질, 융합 유전자 또는 mRNA가 검출되면 상기 환자를 암 환자로 결정하는 것을 특징으로 하는,

암 진단 방법.
제17항에 있어서, 상기 검출하는 단계는,

상기 생물 시료에 상기 융합 단백질, 상기 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA로 이루어진 군에서 선택된 1종 이상과 상호작용하는 물질을 첨가하고 반응시키는 단계; 및

상기 얻어진 반응물을 검출하는 단계

를 포함하는 것인,

암 진단 방법.
제18항에 있어서,

상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질에 결합하는 항체 및 압타머로 이루어진 군에서 선택된 것이고,

상기 융합 단백질을 암호화하는 융합 유전자 또는 이에 상응하는 mRNA와 상호작용하는 물질은,

상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개의 염기로 이루어진 폴리뉴클레오타이드 단편 또는 이에 상응하는 mRNA 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편 또는 mRNA 단편의 양 말단에 인접하는 20 내지 100개의 염기서열 또는 이의 상보적인 서열과 혼성화 가능한 프라이머쌍;

상기 융합 유전자 내의 융합 부위 또는 이에 상응하는mRNA 부위와 혼성화 가능한 5 내지 100 bp 길이의 안티센스 올리고뉴클레오타이드, 프로브, 및 앱타머

로 이루어진 군에서 선택된 1종 이상이고,

상기 융합 부위는 서열번호 62, 78, 94, 110, 125, 141, 157, 173, 및 181로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인,

암 진단 방법.
제19항에 있어서,

상기 프라이머쌍은 서열번호 184 및 서열번호 185의 프라이머쌍;

서열번호 190 및 서열번호 191의 프라이머쌍;

서열번호 192 및 서열번호 193의 프라이머쌍;

서열번호 194 및 서열번호 195의 프라이머쌍;

서열번호 196 및 서열번호 197의 프라이머쌍;

서열번호 198 및 서열번호 199의 프라이머쌍;

서열번호 200 및 서열번호 201의 프라이머쌍;

서열번호 202 및 서열번호 203의 프라이머쌍; 및

서열번호 204 및 서열번호 205의 프라이머쌍

으로 이루어진 군에서 선택된 1종 이상인,

암 진단 방법.
제17항에 있어서, 상기 암은 고형암인, 암 진단 방법.
제21항에 있어서, 상기 암은 폐암인, 암 진단 방법.
제22항에 있어서, 상기 암은 비소세포성 폐암(NSCLC)인, 암 진단에 정보를 제공하는 방법.
암 진단 마커로 사용하기 위한 제1항 내지 제4항 중 어느 한 항의 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA.
암 진단에 사용하기 위한 제1항 내지 제4항 중 어느 한 항의 융합 단백질과 상호작용하는 물질, 및 상기 융합 단백질을 암호화하는 융합 유전자, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA와 상호작용하는 물질로 이루어진 군에서 선택된 1종 이상을 포함하는 조성물.
제25항에 있어서,

상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질에 결합하는 항체 및 압타머로 이루어진 군에서 선택된 것이고,

상기 융합 유전자 또는 이에 상응하는 mRNA와 상호작용하는 물질은

상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개의 염기로 이루어진 폴리뉴클레오타이드 단편 또는 이에 상응하는 mRNA 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편 또는 mRNA 단편의 양 말단에 인접하는 20 내지 100개의 염기서열 또는 이의 상보적인 서열과 혼성화 가능한 프라이머쌍;

상기 융합 유전자 내의 융합 부위 또는 이에 상응하는mRNA 부위와 혼성화 가능한 5 내지 100 bp 길이의 안티센스 올리고뉴클레오타이드, 프로브, 및 앱타머

로 이루어진 군에서 선택된 1종 이상이고,

상기 융합 부위는 서열번호 62, 78, 94, 110, 125, 141, 157, 173, 및 181로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인,

조성물.
제26항에 있어서,

상기 프라이머쌍은

서열번호 184 및 서열번호 185의 프라이머쌍;

서열번호 190 및 서열번호 191의 프라이머쌍;

서열번호 192 및 서열번호 193의 프라이머쌍;

서열번호 194 및 서열번호 195의 프라이머쌍;

서열번호 196 및 서열번호 197의 프라이머쌍;

서열번호 198 및 서열번호 199의 프라이머쌍;

서열번호 200 및 서열번호 201의 프라이머쌍;

서열번호 202 및 서열번호 203의 프라이머쌍; 및

서열번호 204 및 서열번호 205의 프라이머쌍

으로 이루어진 군에서 선택된 1종 이상인,

조성물.
제25항 내지 제27항 중 어느 한 항에 있어서, 상기 암은 고형암인, 조성물.
제28항에 있어서, 상기 암은 폐암인, 조성물.
제29항에 있어서, 상기 암은 비소세포성 폐암(NSCLC)인, 조성물.
제1항 내지 제4항 중 어느 한 항의 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, 또는 제7항 내지 제10항 중 어느 한 항의 융합 유전자를 포함하는 세포에 후보 물질을 처리하는 단계; 및

상기 세포에서의 상기 융합 단백질 또는 상기 융합 유전자의 수준을 측정하는 단계를 포함하고,

상기 후보 물질이 처리된 세포에서의 상기 융합 단백질 또는 상기 융합 유전자의 수준이 상기 후보 물질 처리 전 또는 상기 후보 물질이 처리되지 않은 세포와 비교하여 감소한 경우, 상기 후보 물질을 항암제로 결정하는 것을 특징으로 하는,

항암제 스크리닝 방법.
제1항 내지 제4항 중 어느 한 항의 융합 단백질의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 제7항 내지 제10항 중 어느 한 항의 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 유효성분으로 포함하는, 암 예방 또는 치료용 조성물.
제32항에 있어서,

상기 융합 단백질의 억제제는 상기 융합 단백질에 대한 항체, 압타머, 키나제 저해제, 및 신호 전달 저해제로 이루어진 군에서 선택된 1종 이상이고,

상기 융합 유전자 또는 mRNA의 억제제는 상기 융합 유전자 또는 mRNA에 특이적으로 결합하는 siRNA, shRNA, 마이크로 RNA, 및 압타머로 이루어진 군에서 선택된 1종 이상인, 암 예방 또는 치료용 조성물.
제1항의 융합 단백질의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 제7항의 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 암의 예방 또는 치료를 필요로 하는 환자에게 투여하는 단계를 포함하는, 암 예방 또는 치료 방법.
제34항에 있어서,

상기 융합 단백질의 억제제는 상기 융합 단백질에 대한 항체, 압타머, 키나제 저해제, 및 신호 전달 저해제로 이루어진 군에서 선택된 1종 이상이고,

상기 융합 유전자 또는 mRNA의 억제제는 상기 융합 유전자 또는 mRNA에 특이적으로 결합하는 siRNA, shRNA, 마이크로 RNA, 및 압타머로 이루어진 군에서 선택된 1종 이상인, 암 예방 또는 치료 방법.
암의 예방 또는 치료에 사용하기 위한 제1항 내지 제4항 중 어느 한 항의 융합 단백질의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 포함하는 조성물.
제37항에 있어서,

상기 융합 단백질의 억제제는 상기 융합 단백질에 대한 항체, 압타머, 키나제 저해제, 및 신호 전달 저해제로 이루어진 군에서 선택된 1종 이상이고,

상기 융합 유전자 또는 mRNA의 억제제는 상기 융합 유전자 또는 mRNA에 특이적으로 결합하는 siRNA, shRNA, 마이크로 RNA, 및 압타머로 이루어진 군에서 선택된 1종 이상인, 조성물.