WO2014038884A1 - 융합 단백질 및 이를 포함하는 암 진단용 조성물 - Google Patents

융합 단백질 및 이를 포함하는 암 진단용 조성물 Download PDF

Info

Publication number
WO2014038884A1
WO2014038884A1 PCT/KR2013/008066 KR2013008066W WO2014038884A1 WO 2014038884 A1 WO2014038884 A1 WO 2014038884A1 KR 2013008066 W KR2013008066 W KR 2013008066W WO 2014038884 A1 WO2014038884 A1 WO 2014038884A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
fusion
seq
fragment
exon
Prior art date
Application number
PCT/KR2013/008066
Other languages
English (en)
French (fr)
Inventor
서정선
김영태
주영석
김은희
강진형
Original Assignee
주식회사 마크로젠
서울대학교산학협력단
가톨릭대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020120099611A external-priority patent/KR20140033617A/ko
Priority claimed from KR1020120099620A external-priority patent/KR20140033622A/ko
Priority claimed from KR1020120099622A external-priority patent/KR20140033286A/ko
Priority claimed from KR1020120099619A external-priority patent/KR20140033621A/ko
Priority claimed from KR1020120099613A external-priority patent/KR20140033619A/ko
Priority claimed from KR1020120099618A external-priority patent/KR20140033620A/ko
Priority claimed from KR1020120099621A external-priority patent/KR20140033623A/ko
Priority claimed from KR1020120099612A external-priority patent/KR20140033618A/ko
Priority claimed from KR1020120099617A external-priority patent/KR20140033285A/ko
Application filed by 주식회사 마크로젠, 서울대학교산학협력단, 가톨릭대학교 산학협력단 filed Critical 주식회사 마크로젠
Publication of WO2014038884A1 publication Critical patent/WO2014038884A1/ko

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4711Alzheimer's disease; Amyloid plaque core protein
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4747Apoptosis related proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/59Follicle-stimulating hormone [FSH]; Chorionic gonadotropins, e.g. HCG; Luteinising hormone [LH]; Thyroid-stimulating hormone [TSH]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70575NGF/TNF-superfamily, e.g. CD70, CD95L, CD153, CD154
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/72Receptors; Cell surface antigens; Cell surface determinants for hormones
    • C07K14/723G protein coupled receptor, e.g. TSHR-thyrotropin-receptor, LH/hCG receptor, FSH receptor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/82Translation products from oncogenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells

Abstract

융합 단백질의 암 진단 마커 및/또는 치료 타겟으로서의 용도와 관련된 것으로, 서로 다른 두 개의 단백질 단편이 융합된 융합 단백질, 상기 융합 단백질과 상호작용하는 물질을 포함하는 암 진단용 조성물, 이를 이용하여 암 진단에 정보를 제공하는 방법, 상기 융합 단백질의 억제제를 포함하는 암 예방 및/또는 치료용 조성물, 및 융합 단백질을 이용한 암 치료제 스크리닝 방법이 제공된다.

Description

융합 단백질 및 이를 포함하는 암 진단용 조성물
융합 단백질의 암 진단 마커 및/또는 치료 타겟으로서의 용도와 관련된 것으로, 융합 단백질, 상기 융합 단백질과 상호작용하는 물질을 포함하는 암 진단용 조성물, 이를 이용하여 암 진단에 정보를 제공하는 방법, 상기 융합 단백질의 억제제를 포함하는 암 예방 및/또는 치료용 조성물, 및 융합 단백질을 이용한 항암제 스크리닝 방법에 관한 것이다.
폐암은 인간에게 있어서 가장 흔하게 발병하는 암 중 하나이며, 세계적으로 암 관련 사망의 주된 원인이 되고 있다. 저선량 컴퓨터 단층촬영 스크리닝 기법이 도입되면서 초기 진단 비율이 높아지고 있지만, 폐암은 여전히 예후가 매우 좋지 않은 치명적인 질병이다. 폐암은 조직병리학적 관점에서 다음과 같이 분류될 수 있다: 폐선암은 비흡연자 또는 소량 흡연자 및 여성 환자에서도 빈번하게 발생하는 가장 흔한 유형이다. 과거 10년 동안, 폐선암은 폐암 연구의 중심이 되어 왔으며, 본 발명에서의 폐선암에 대한 이해는 병리학, 분자생물학, 유전학, 방사선학 및 임상 치료를 포함하는 모든 측면에서 진전된 것이다.
특히, 수반되는 주요한 유전적 변형(alterations)과 신호 경로의 이해의 진전은 기본적인 유전적 변화에 기초한 폐선암의 재분류를 제안한다. 핵심 돌연변이(driver mutations)라 불리는 이러한 유전적 변형을 갖는 암세포들은 이러한 변형을 갖지 않는 세포들과 비교하여 생존 및 성장에 있어서 이점을 갖는다. 핵심 돌연변이는 카이네이즈와 같은 신호화 단백질을 암호화하는 유전자에 발생하며, 이는 종양 발생을 개시하고 유지하는 구성적으로 활성이 있는 생존 신호를 발생시킬 수 있다. 현재, 폐선암에 있어서 약 10개의 핵심 돌연변이가 알려져 있으며, 이들 변형을 타겟팅하는 몇몇 약물이 최근 시험에서 주목할만한 성과를 보이는 것으로 보고되어 있다. 예컨대, 상피성장인자(EGFR) 타이로신 카이네이즈 억제제인 게피티닙(gefitinib)은 반응 응답률이 약 70%정도이며, EGFR-활성화 변이를 갖는 환자가 10개월 동안 종양 진행 없이 생존할 수 있도록 하였으며, 이러한 결과는 최근의 임상시험 중인 백금 기반 이중 화학요법 (platinum-based doublet chemotherapy)보다 우수한 효과이다. 역형성림프종 카이네이즈(anaplastic lymphoma kinase; ALK) 및 MET 타이로신 카이네이즈에 대한 이중 억제제인 크리조티닙(Crizotinib)은 ALK 융합 유전자를 포함하는 폐암 환자에 효과가 있는 것으로 입증되었다. 이와 같은 중추적인 연구들로부터, 폐선암의 치료 전략은 조직 기반 접근에서 핵심 돌연변이 관련 치료법으로 옮겨가고 있다. 최근 많은 연구에도 불구하고, 폐선암의 약 40%의 분자 수준 조종자(driver)가 아직 밝혀지지 않고 있다. 흥미롭게, 몇몇 핵심 돌연변이의 발생 빈도는 민족간 상당한 차이가 있으며, 따라서 폐암의 새로운 신약 타겟(druggable targets) 및 표적 치료를 개발하기 위하여 광범위한 유전적 연구가 필요한 것으로 나타났다.
이에 본 발명자들은 인간 고형 종양, 특히 폐암에서 특이적으로 서로 다른 두 개의 단백질의 전부 또는 일부가 융합된 형태의 융합 단백질의 발현 및/또는 이를 암호화하는 유전자의 존재가 관찰됨을 확인하여 본 발명을 완성하였다.
따라서, 본 발명의 일례는 다음으로 이루어진 군에서 선택되는 융합 단백질을 제공한다:
APLP2 단백질 또는 그의 단편과 TNFSF11 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질;
MAP4K3 단백질 또는 그의 단편과 PRKCE 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질;
BCAS3 단백질 또는 그의 단편과 MAP3K3 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질;
KRAS 단백질 또는 그의 단편과 CDH13 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질;
ZFYVE9 단백질 또는 그의 단편과 CGA 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질;
ERBB2IP 단백질 또는 그의 단편과 MAST4 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질;
TPD52L1 단백질 또는 그의 단편과 TRMT11 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질; 및
TXNRD1 단백질 또는 그의 단편과 GPR133 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질.
다른 예는 NM_004719의 엑손 1의 뉴클레오타이드 서열로 이루어진 SCAF11의 5UTR 부위와 NM_006206의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열로 이루어진 PDGFRA 유전자 단편이 융합된 SCAF11-PDGFRA 융합 유전자를 제공한다.
또 다른 예는 상기 융합 단백질을 암호화하는 융합 유전자를 제공한다.
상기 융합 단백질 또는 융합 유전자는 암 진단 마커로 사용 가능하다.
또 다른 예는 상기 융합 단백질 및/또는 상기 융합 단백질을 암호화하는 융합 유전자 및/또는 SCAF11-PDGFRA 융합 유전자 및/또는 상기 융합 유전자에 상응하는 mRNA와 상호작용하는 물질을 포함하는 암 진단용 약학 조성물을 제공한다.
또 다른 예는 환자로부터 얻은 생물 시료에서 상기 융합 단백질 및/또는 상기 융합 단백질을 암호화하는 융합 유전자 및/또는 SCAF11-PDGFRA 융합 유전자 및/또는 상기 융합 유전자에 상응하는 mRNA를 검출하는 단계를 포함하는 암 진단 방법 또는 암 진단에 정보를 제공하는 방법을 제공한다.
또 다른 예는 상기 융합 단백질 억제제 및/또는 상기 융합 단백질을 암호화하는 융합 유전자의 억제제 및/또는 SCAF11-PDGFRA 융합 유전자의 억제제, 및/또는 상기 융합 유전자에 상응하는 mRNA의 억제제를 유효성분으로 포함하는 암 예방 및/또는 치료용 약학 조성물을 제공한다.
또 다른 예는 상기 융합 단백질 억제제 및/또는 상기 융합 단백질을 암호화하는 융합 유전자의 억제제 및/또는 SCAF11-PDGFRA 융합 유전자의 억제제, 및/또는 상기 융합 유전자에 상응하는 mRNA의 억제제를 암의 예방 또는 치료를 필요로 하는 환자에게 투여하는 단계를 포함하는, 암 예방 또는 치료 방법을 제공한다.
또 다른 예는 상기 융합 단백질 억제제 및/또는 상기 융합 단백질을 암호화하는 융합 유전자의 억제제 및/또는 SCAF11-PDGFRA 융합 유전자의 억제제, 및/또는 상기 융합 유전자에 상응하는 mRNA의 억제제를 포함하는 조성물의 암의 예방 또는 치료에 사용하기 위한 용도를 제공한다.
또 다른 예는 상기 융합 단백질 또는 SCAF11-PDGFRA 융합 유전자를 발현하는 세포에 후보 물질을 처리하여 융합 단백질 발현 수준을 측정하는 단계를 포함하고, 상기 후보 물질을 처리하기 전 또는 후보 물질을 처리하지 않은 세포와 비교하여 상기 융합 단백질 또는 융합 유전자의 발현 수준이 감소한 경우, 상기 후보물질을 항암제로 선택하는 것을 특징으로 하는, 항암제 스크리닝 방법을 제공한다.
암 환자에게 적절하게 표적화된 요법을 적용하기 위하여 암의 분자적 특성을 이해하는 것이 중요하다. 유전자 발현, 점돌연변이, 융합 유전자, 대체적 스플라이싱(alternative splicing) 등의 암의 전반적인 유전적 기초를 이해하기 위한 효과적인 수단 중 하나로 대규모의 parallel RNA sequencing을 들 수 있다.
이에, 본 발명자들은 대표적인 고형암인 폐암을 대상으로 연구하였다. 구체적으로, 한국인 환자로부터 얻은 200개의 폐선암 수술 표본에서 유전적 변형을 광범위하게 조사하였으며, 이 중에서 87개는 대응하는 인접 정상 조직 샘플에 대한 전사체 시퀀싱(transciptome sequencing)(n=77) 및 전체 엑솜 시퀀싱(whole-exome sequencing)(n=76)과 조합된 전사체 시퀀싱에 의하여 분석하여, 폐암에 특이적인 융합단백질을 확인하여 본 발명을 완성하였다. 전사체 시퀀싱은, 체세포 점돌연변이 뿐 아니라 융합 유전자 및 대체적 스플라이싱(alternative splicing)과 같은 이상 RNA 변이체를 시험할 수 있기 때문에, 암에서의 핵심 돌연변이를 검출하는 적합한 방법이다. 유전자 기술의 진전에 의하여 암의 광범위한 게놈 분석이 가능해졌지만, 본 발명은 RNA 시퀀싱을 사용한 최초의 대규모 폐선암 연구이다.
보다 구체적으로, 한국인 환자로부터 얻어진 87개의 외과 수술 표본의 전사체(transcriptome)를, 77개의 인접하는 정상 조직의 엑솜(exome) 및 RNA 시퀀싱 결과와 조합하여 분석하였다. 유전자 발현 양상은 흡연자로부터 얻은 암조직에서 보다 강한 변태(perturbation)를 나타낸다. 또한, EGFR, KRAS, NRAS, BRAF, PIK3CA, METCTNNB1와 같은 transforming gene들에서의 체세포 돌연변이를 확인하였다. EGFR 돌연변이 빈도는 한국인 환자에게서 극단적으로 높게(~60%) 나타났으며, 이는 아시아인들에서 우세한 EGFR의 반수체형(haplotype)에 의하여 설명될 수 있다. 본 발명자들은 ALK, RET, ROS1 및 다른 타이로신 카이네이즈 유전자들(FGFR2, PDGFRAAXL 등)을 포함하는 30개 키메릭 전사체를 동정하였으며, 이들은 폐암에서의 핵심 돌연변이(driver mutation)일 가능성이 매우 높을 것으로 보인다.
상기 연구 결과, 암(예컨대, 비소세포성 폐암, NSCLC) 환자의 수술 표본에서 상기 수술 표본과 동일한 조직 내의 주변 정상 조직 샘플에서는 발견되지 않고 암 조직에서 특이적으로 발현되는 변이로서 동일한 염색체 또는 상이한 염색체에 위치하는 두 유전자가 융합된 융합 유전자 및/또는 상기 융합 유전자가 발현되어 생성된 융합 단백질이 존재함을 확인하였다.
본 발명에서 확인된 암 조직 (예컨대 폐암 조직)에서 특이적으로 존재하는 융합 유전자를 다음의 표 1에 정리하였다:
표 1
Donor Gene Acceptor Gene Chromosome (Donor;Acceptor) Distance (Mb)
1 CCDC6 ROS1 chr10(q21.2);chr6(q22.1) Interchromosomal
2 SCAF11 PDGFRA chr12(q12);chr4(q12) Interchromosomal
3 FGFR2 CIT chr10(q26.13);chr12(q24.23) Interchromosomal
4 AXL MBIP chr19(q13.2);chr14(q13.3) Interchromosomal
5 APLP2 TNFSF11 chr11(q24.3);chr13(q14.11) Interchromosomal
6 MAP4K3 PRKCE chr2(p22.1);chr2(p21) 6.215
7 BCAS3 MAP3K3 chr17(q23.2); chr17(q23.3) 2.23
8 KRAS CDH13 chr12(p12.1);chr16(q23.3) Interchromosomal
9 ZFYVE9 CGA chr1(p32.3);chr6(q14.3) Interchromosomal
10 ERBB2IP MAST4 chr5(q12.3);chr5(q12.3) 0.515
11 TPD52L1 TRMT11 chr6(q22.31); chr6(q22.32) 0.723
12 TXNRD1 GPR133 chr12(q23.3);chr12(q24.33) 26.694
상기 표 1에 기재된 융합 유전자는 암 조직에 특이적으로 관찰되는 것으로 확인되었으므로, 상기 융합 유전자 및/또는 상기 융합 단백질은 암 진단을 위한 바이오마커 및 암 치료를 위한 타겟으로서 유용하다.
이에, 본 발명의 일례는,
CCDC6 단백질 또는 그의 단편과 ROS1 단백질 또는 그의 단편이 융합된 CCDC6-ROS1융합 단백질;
FGFR2 단백질 또는 그의 단편과 CIT 단백질 또는 그의 단편이 융합된 FGFR2-CIT 융합 단백질;
AXL 단백질 또는 그의 단편과 MBIP 단백질 또는 그의 단편이 융합된 AXL-MBIP 융합 단백질;
APLP2 단백질 또는 그의 단편과 TNFSF11 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질;
MAP4K3 단백질 또는 그의 단편과 PRKCE 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질;
BCAS3 단백질 또는 그의 단편과 MAP3K3 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질;
KRAS 단백질 또는 그의 단편과 CDH13 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질;
ZFYVE9 단백질 또는 그의 단편과 CGA 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질;
ERBB2IP 단백질 또는 그의 단편과 MAST4 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질;
TPD52L1 단백질 또는 그의 단편과 TRMT11 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질; 및
TXNRD1 단백질 또는 그의 단편과 GPR133 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질
로 이루어진 군에서 선택된 융합 단백질을 제공된다.
다른 예는 상기 융합 단백질을 암호화하는 융합 유전자(폴리뉴클레오타이드 분자)를 제공한다.
상기 융합 단백질 및/또는 이를 암호화하는 융합 유전자는 암의 진단 마커로서 유용하게 사용될 수 있다.
이하 상기 융합 파트너와 융합 단백질을 보다 상세히 설명한다. 본 명세서에 있어서 융합 파트너인 단백질 단편들의 절단점 (break point; 또는 융합부위)은 이들을 암호화하는 유전자의 엑손을 기준으로 설명되며, 상기 단편의 N-말단 (C-말단 융합 파트너의 경우) 또는 C-말단(N-말단 융합 파트너의 경우) 마지막에 포함되는 엑손과 절단되어 제거되는 엑손 사이의 인트론 부위 중 어느 지점에서 절단되어도 암호화되는 단백질 단편의 아미노산 서열에는 영향을 미치지 않게 되므로, 실제 절단되는 지점은 상기 인트론 부위 중 어느 지점이어도 무방하다.
CCDC6(coiled-coil domain containing 6) 단백질을 암호화 하는 CCDC6 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 10(q21.2)에 위치하며, 이로부터 암호화되는 CCDC6 단백질은 총 아미노산 길이가 474aa인 단백질이다. CCDC6 단백질 또는 CCDC6 단백질의 단편은 CCDC6-ROS1융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, CCDC6 유전자는 GenBank accession no. NM_005436에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CCDC6 단백질은 NM_005436에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 CCDC6 단백질의 단편은 NM_005436의 첫 번째 엑손(exon)부터 엑손 5(exon 5)(염색체 10 상의 위치((-) strand)를 기준으로 61572393-61572553 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 5의 3' 말단에 코돈을 이루지 못하는 1개의 뉴클레오타이드(c)가 존재하는 형태일 수 있다. 구체예에서, 상기 CCDC6 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CCDC6 단백질에 대하여 아래의 표 2 및 3에 정리하였다:
표 2 CCDC6 단백질의 단편을 암호화 하는 유전자
CCDC6유전자(Accession No.) CCDC6 단백질의 암호화 부위-CDS CCDC6 단백질 단편의 암호화 부위: 엑손 기준 CCDC6 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_005436 233~1657(1425bp)(서열번호 1) 첫번째 엑손~엑손 5까지의 부위 233~1079(846bp+1nt(c); 총 847bp)(서열번호 2) chr10:[61572393 (엑손 5의 3' 말단) gctgctcagttacagc(서열번호 3)
표 3 CCDC6 단백질의 단편
CCDC6 단백질의 Full size(a.a) CCDC6 단백질 단편 부위 Breakpoint 부위 아미노산 서열
474aa(서열번호 4) 1~282aa+1nt(c)(아미노산 서열: 서열번호 5) AAQLQ+1nt(c)(아미노산 서열: 서열번호 6)
ROS1(receptor tyrosine kinase 1) 단백질을 암호화 하는 ROS1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q22.1)에 위치하며, 이로부터 암호화되는 ROS1 단백질은 총 아미노산 길이가 2347aa인 단백질이다. ROS1 단백질 또는 ROS1 단백질의 단편은 CCDC6-ROS1융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, 상기 ROS1 유전자는 GenBank accession no. NM_002944에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, 상기 ROS1 단백질은 NM_002944에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 ROS1 단백질의 단편은 NM_002944의 엑손 35(염색체 6 상의 위치((-) strand)를 기준으로 117642422-117642557 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 35의 5' 말단의 처음 시작하는 2개의 뉴클레오타이드(tc)는 코돈을 이루지 못하는 형태일 수 있고, CCDC6 단백질의 단편과 융합시에 앞서 설명한 바와 같이 CCDC6 단백질의 단편에 추가로 포함된 1개의 뉴클레오타이드(c)와 연결되어 코돈(ctc)을 이루어 하나의 아미노산(L)을 코딩할 수 있다. 구체예에서, 상기 ROS1 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 ROS1 단백질에 대하여 아래의 표 4 및 5에 정리하였다:
표 4 ROS1 단백질의 단편을 암호화 하는 유전자
ROS1유전자(Accession No.) ROS1 단백질의 암호화 부위-CDS ROS1 단백질 단편의 암호화 부위: 엑손 기준 ROS1 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_002944 200~7243(7044bp)(서열번호 7) 엑손 35~마지막 엑손까지의 부위 5841~7243(2nt(tc)+1401bp; 총 1403bp)(서열번호 8) chr6:117642557] (엑손 35의 5' 말단) tctggcatagaagatta(서열번호 9)
표 5 ROS1 단백질의 단편
ROS1 단백질의 Full size(a.a) ROS1단백질 단편 부위 Breakpoint 부위 아미노산 서열
2347aa(서열번호 10) 1882~2347aa2nt(tc)+ 1882~2347aa (466aa) (아미노산 서열: 서열번호 11) 2nt(tc)+WHRRL(아미노산 서열: 서열번호 12)
상기 'CCDC6 단백질 또는 그의 단편과 ROS1 단백질 또는 그의 단편이 융합된 CCDC6-ROS1융합 단백질'을 암호화하는 융합 유전자 (CCDC6-ROS1융합 유전자)는 5'-말단에 상기한 바와 같은 CCDC6 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 ROS1 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 CCDC6-ROS1융합 유전자는 5' 말단쪽에 NM_005436의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002944의 엑손 35부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 CCDC6-ROS1융합 유전자는 5' 말단쪽에 NM_005436의 233번째부터 1079번째까지의 뉴클레오타이드 서열 (서열번호 2)과 3' 말단쪽에 NM_002944의 5841번째부터 7243번째까지의 뉴클레오타이드 서열(서열번호 8)이 연결된 융합 유전자(서열번호 13; 융합부위: 서열번호 14)일 수 있다.
상기 CCDC6-ROS1융합 단백질은 N-말단쪽에 상기한 바와 같은 CCDC6 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 ROS1 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_005436의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002944의 엑손 35부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 13의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 15; 융합부위: 서열번호 16) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
FGFR2 (fibroblast growth factor receptor 2) 단백질을 암호화 하는 FGFR2 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 10(q26.13)에 위치하며, FGFR2 단백질은 이로부터 암호화되는 단백질이다. FGFR2 단백질 또는 FGFR2 단백질의 단편은 FGFR2-CIT융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, FGFR2 유전자는 GenBank accession no. NM_001144914, NM_001144916, NM_001144915, NM_001144917, NM_001144918, NM_022970, NM_000141, NM_001144913, NM_001144919 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, FGFR2 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 FGFR2 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손(exon)부터 엑손 19(염색체 10 상의 위치((-) strand)를 기준으로 123243212-123243317 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 FGFR2 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 FGFR2 단백질에 대하여 아래의 표 6 및 7에 정리하였다:
표 6 FGFR2 단백질의 단편을 암호화 하는 유전자
FGFR2유전자(Accession No.) FGFR2 단백질의 암호화 부위-CDS FGFR2 단백질 단편의 암호화 부위: 엑손 기준 FGFR2 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_001144914 151~2280(2130bp)(서열번호 17) 첫번째 엑손~엑손 19까지의 부위 151~2115(1965bp)(서열번호 18) chr10:[123243212 (엑손 19의 3' 말단) ctcactctcacaaccaatgag (서열번호 19)
NM_001144916 442~2562(2121bp) 442~2397(1956bp)
NM_001144915 320~2443(2124bp) 320~2353(2034bp)
NM_001144917 648~2765 (2118bp) 648~2600(1953bp)
NM_001144918 648~2762(2115bp) 648~2597(1950bp)
NM_022970 648~3116(2469bp) 648~2951(2304bp)
NM_000141 648~3113(2466bp) 648~2948(2301bp)
NM_001144913 151~2460(1813bp) 151~2454(2304bp)
NM_001144919 648~2690(2043bp) 648~2648(2001bp)
표 7 FGFR2 단백질의 단편
FGFR2유전자(Accession No.) FGFR2 단백질의 Full size(a.a) FGFR2 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_001144914 709aa(서열번호 20) 1~655aa(서열번호 21) LTLTTNE(서열번호 22)
NM_001144916 706aa 1~652aa
NM_001144915 707aa 1~678aa
NM_001144917 705aa 1~651aa
NM_001144918 704aa 1~650aa
NM_022970 822aa 1~768aa
NM_000141 821aa 1~767aa
NM_001144913 769aa 1~768aa
NM_001144919 680aa 1~679aa
CIT [citron (rho-interacting, serine/threonine kinase 21)] 단백질을 암호화 하는 CIT 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q24.23)에 위치하며, CIT 단백질은 이로부터 암호화되는 총길이 2027aa의 단백질이다. CIT 단백질 또는 CIT 단백질의 단편은 FGFR2-CIT융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, CIT 유전자는 GenBank accession no. NM_007174에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CIT 단백질은 상기 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 CIT 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 24 (염색체 12 상의 위치((-) strand)를 기준으로 120180216-12018026 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 CIT 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CIT 단백질에 대하여 아래의 표 8 및 9에 정리하였다:
표 8 CIT 단백질의 단편을 암호화 하는 유전자
CIT 유전자(Accession No.) CIT 단백질의 암호화 부위-CDS CIT 단백질 단편의 암호화 부위: 엑손 기준 CIT 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_007174 57~6140(6084bp)(서열번호 23) 엑손 24~마지막 엑손까지의 부위 2835~6140(3306bp)(서열번호 24) chr12:120180269] (엑손 24의 5' 말단) gcacatagagatgaaatccag(서열번호 25)
표 9 CIT 단백질의 단편
CIT 단백질의 Full size(a.a) CIT 단백질 단편 부위 Breakpoint 부위 아미노산 서열
2027aa(서열번호 26) 927~2027aa (1101aa) (서열번호 27) AHRDEIQ(서열번호 28)
상기 'FGFR2 단백질 또는 그의 단편과 CIT 단백질 또는 그의 단편이 융합된 FGFR2-CIT 융합 단백질'을 암호화하는 융합 유전자 (FGFR2-CIT 융합 유전자)는 5'-말단에 상기한 바와 같은 FGFR2 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 CIT 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 FGFR2-CIT 융합 유전자는 5' 말단쪽에 NM_001144914, NM_001144916, NM_001144915, NM_001144917, NM_001144918, NM_022970, NM_000141, NM_001144913, 또는 NM_001144919의 첫번째 엑손에서 엑손 19까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_007174의 엑손 24부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 예컨대, 상기 FGFR2-CIT 융합 유전자는 5' 말단쪽에 NM_001144914의 151번째부터 2115번째까지의 뉴클레오타이드 서열 (서열번호 18)과 3' 말단쪽에 NM_007174의 2835번째부터 6140번째까지의 뉴클레오타이드 서열(서열번호 24)이 연결된 융합 유전자(서열번호 29; 융합부위: 서열번호 30)일 수 있다 (23a 및 23b 참조).
상기 FGFR2-CIT 융합 단백질은 N-말단쪽에 상기한 바와 같은 FGFR2 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 CIT 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_001144914, NM_001144916, NM_001144915, NM_001144917, NM_001144918, NM_022970, NM_000141, NM_001144913, 또는 NM_001144919의 첫번째 엑손에서 엑손 19까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_007174의 엑손 24부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 29의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 31; 융합부위: 서열번호 32) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
AXL (AXL receptor tyrosine kinase) 단백질을 암호화 하는 AXL 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 19(q13.2)에 위치하며, AXL 단백질은 상기 AXL 유전자로부터 암호화된다. AXL 단백질 또는 AXL 단백질의 단편은 AXL-MBIP 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, AXL 유전자는 GenBank accession no. NM_021913, NM_001699 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, AXL 단백질은 NM_021913, NM_001699 등에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 AXL 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손(exon)부터 엑손 20(염색체 19 상의 위치((+) strand)를 기준으로 41765458-41767670 염기 부위) 중의 244번째 뉴클레오타이드까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 AXL 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 AXL 단백질에 대하여 아래의 표 10 및 11에 정리하였다:
표 10 AXL 단백질의 단편을 암호화 하는 유전자
AXL 유전자(Accession No.) AXL 단백질의 암호화 부위-CDS AXL 단백질 단편의 암호화 부위: 엑손 기준 AXL 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_021913 191~2875(2685bp)(서열번호 33) 첫번째 엑손~엑손 20 중의 244번째 뉴클레오타이드까지의 부위 191~2767 (2577bp)(서열번호 34) chr19:41765701]엑손 20 중의 244번째 뉴클레오타이드의 3 위치 ctcactgcggctgag (서열번호 35)
NM_001699 191~2848(2658bp) 191~2740(2550bp)
표 11 AXL 단백질의 단편
AXL 유전자(Accession No.) AXL 단백질의 Full size(a.a) AXL 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_021913 894aa(서열번호 36) 1~859aa(서열번호 37) LTAAE(서열번호 38)
NM_001699 885aa 1~850aa
MBIP (MAP3K12 binding inhibitory protein 1) 단백질을 암호화 하는 MBIP 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 14(q13.3)에 위치하며, MBIP 단백질은 상기 MBIP 유전자로부터 암호화된다. MBIP 단백질 또는 MBIP 단백질의 단편은 AXL-MBIP 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, MBIP 유전자는 GenBank accession no. NM_016586, NM_001144891 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MBIP 단백질은 NM_016586, NM_001144891 등에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 MBIP 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 4(염색체 14 상의 위치((-) strand)를 기준으로 36783718-36783814 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 MBIP 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MBIP 단백질에 대하여 아래의 표 12 및 13에 정리하였다:
표 12 MBIP 단백질의 단편을 암호화 하는 유전자
MBIP 유전자(Accession No.) MBIP 단백질의 암호화 부위-CDS MBIP 단백질 단편의 암호화 부위: 엑손 기준 MBIP 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_016586 89~1123(1035bp)(서열번호 39) 엑손 4부터 마지막 엑손까지의 부위 563~1123 (561bp)(서열번호 40) chr14:36783814](엑손 4의 5' 말단) attgacagacgaata (서열번호 41)
NM_001144891 89~1120(1032bp) 563~1120(558bp)
표 13 MBIP 단백질의 단편
MBIP 유전자(Accession No.) MBIP 단백질의 Full size(a.a) MBIP 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_016586 344aa(서열번호 42) 159~344aa (186aa)(서열번호 43) IDRRI(서열번호 44)
NM_001144891 343aa 159~343aa(185aa)
상기 'AXL 단백질 또는 그의 단편과 MBIP 단백질 또는 그의 단편이 융합된 AXL-MBIP 융합 단백질'을 암호화하는 융합 유전자 (AXL-MBIP 융합 유전자)는 5'-말단에 상기한 바와 같은 AXL 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 MBIP 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 AXL-MBIP 융합 유전자는 5' 말단쪽에 NM_021913, NM_001699 등의 첫번째 엑손에서 엑손 20 중의 244번째 뉴클레오타이드까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_016586, NM_001144891 등의 엑손 4부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 AXL-MBIP 융합 유전자는 5' 말단쪽에 NM_021913의 191번째부터 2767번째까지의 뉴클레오타이드 서열 (서열번호 34)과 3' 말단쪽에 NM_016586의 563번째부터 1123번째까지의 뉴클레오타이드 서열(서열번호 40)이 연결된 융합 유전자(서열번호 45; 융합부위: 서열번호 46)일 수 있다.
상기 AXL-MBIP 융합 단백질은 N-말단쪽에 상기한 바와 같은 AXL 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 MBIP 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대, 5' 말단쪽에 NM_021913, NM_001699 등의 첫번째 엑손에서 엑손 20의 244번째 뉴클레오타이드까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_016586, NM_001144891 등의 엑손 4부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 45의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 47; 융합부위: 서열번호 48) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
APLP2 (amyloid beta (A4) precursor-like protein 2) 단백질을 암호화 하는 APLP2 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 11(q24.3)에 위치하며, APLP2 단백질은 이로부터 암호화되는 단백질이다. APLP2 단백질 또는 APLP2 단백질의 단편은 APLP2-TNFSF11융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, APLP2 유전자는 GenBank accession no. NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, NR_024515 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, APLP2 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 APLP2 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손(exon)부터 엑손 12(염색체 11 상의 위치((+) strand)를 기준으로 129999933-130000061 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 APLP2 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 APLP2 단백질에 대하여 아래의 표 14 및 15에 정리하였다:
표 14 APLP2 단백질의 단편을 암호화 하는 유전자
APLP2유전자(Accession No.) APLP2 단백질의 암호화 부위-CDS APLP2 단백질 단편의 암호화 부위: 엑손 기준 APLP2 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_001642 158~2449(2292bp)(서열번호 49) 첫번째 엑손~엑손 12까지의 부위 158~1741(1584bp)(서열번호 50) chr11:130000061] (엑손 12의 3' 말단) gcggcccagatgaaatcccag (서열번호 51)
NM_001142276 158~2413(2256bp) 158~1741(1584bp)
NM_001142278 158~1726(1569bp) 158~1054(896bp)
NM_001142277 158~2245(2088bp) 158~1573(1416bp)
표 15 APLP2 단백질의 단편
APLP2유전자(Accession No.) APLP2 단백질의 Full size(a.a) APLP2 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_001642 763aa(서열번호 52) 1~528aa(서열번호 53) AAQMKSQ(서열번호 54)
NM_001142276 751aa 1~528aa
NM_001142278 522aa 1~299aa
NM_001142277 695aa 1~472aa
TNFSF11 (tumor necrosis factor (ligand) superfamily, member 11) 단백질을 암호화 하는 TNFSF11 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 13(q14.11)에 위치하며, TNFSF11 단백질은 이로부터 암호화되는 단백질이다. TNFSF11 단백질 또는 TNFSF11 단백질의 단편은 APLP2-TNFSF11융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, TNFSF11 유전자는 GenBank accession no. NM_033012, NM_003701 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TNFSF11단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 TNFSF11단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 6 (염색체 13 상의 위치((+) strand)를 기준으로 43174888-43174933 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 TNFSF11단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TNFSF11 단백질에 대하여 아래의 표 16 및 17에 정리하였다:
표 16 TNFSF11단백질의 단편을 암호화 하는 유전자
TNFSF11유전자(Accession No.) TNFSF11 단백질의 암호화 부위-CDS TNFSF11 단백질 단편의 암호화 부위: 엑손 기준 TNFSF11 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_033012 530~1264(735bp)(서열번호 55) 엑손 6부터 마지막 엑손까지의 부위 698~1264(567bp)(서열번호 56) chr13:[43174888 (엑손 6의 5' 말단) gaattacaacatatcgttgga (서열번호 57)
NM_003701 150~1122(973bp) 537~2198(1662bp)
표 17 TNFSF11단백질의 단편
TNFSF11유전자(Accession No.) TNFSF11 단백질의 Full size(a.a) TNFSF11 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_033012 244aa(서열번호 58) 57~244aa (188aa)(서열번호 59) ELQHIVG(서열번호 60)
NM_003701 315aa 130~315(186aa)
상기 'APLP2 단백질 또는 그의 단편과 TNFSF11 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질'을 암호화하는 융합 유전자 (APLP2-TNFSF11 융합 유전자)는 5'-말단에 상기한 바와 같은 APLP2 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 TNFSF11 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 APLP2-TNFSF11 융합 유전자는 5' 말단쪽에 NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, NR_024515 등의 첫번째 엑손에서 엑손 12까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_033012, NM_003701 등의 엑손 6부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 APLP2-TNFSF11 융합 유전자는 5' 말단쪽에 NM_001642의 158번째부터 1741번째까지의 뉴클레오타이드 서열 (서열번호 50)과 3' 말단쪽에 NM_033012의 698번째부터 1264번째까지의 뉴클레오타이드 서열(서열번호 56)이 연결된 융합 유전자(서열번호 61; 융합부위: 서열번호 62)일 수 있다.
상기 APLP2-TNFSF11 융합 단백질은 N-말단쪽에 상기한 바와 같은 APLP2 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 TNFSF11 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, NR_024515 등의 첫번째 엑손에서 엑손 12까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_033012, NM_003701 등의 엑손 6부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 61의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 63; 융합부위: 서열번호 64) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
MAP4K3 (mitogen-activated protein kinase kinase kinase kinase3) 단백질을 암호화 하는 MAP4K3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 2(p22.1)에 위치하며, 이로부터 암호화되는 MAP4K3 단백질은 총 아미노산 길이가 894aa인 단백질이다. MAP4K3 단백질 또는 MAP4K3 단백질의 단편은 MAP4K3-PRKCE 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, MAP4K3 유전자는 GenBank accession no. NM_003618에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MAP4K3 단백질은 NM_003618에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 MAP4K3 단백질의 단편은 NM_003618의 엑손 1 (염색체 2 상의 위치((-) strand)를 기준으로 39664033-39664219 염기 부위)의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 포함하는 것일 수 있다. 구체예에서, 상기 MAP4K3 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MAP4K3 단백질에 대하여 아래의 표 18 및 19에 정리하였다:
표 18 MAP4K3 단백질의 단편을 암호화 하는 유전자
MAP4K3 유전자(Accession No.) MAP4K3 단백질의 암호화 부위-CDS MAP4K3 단백질 단편의 암호화 부위: 엑손 기준 MAP4K3 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_003618 326~3010(2685bp)(서열번호 65) 엑손 1 부위 326~421(96bp)(서열번호 66) chr2:[39664033 (엑손 1의 3' 말단) acctacggcgacgtctacaag (서열번호 67)
표 19 MAP4K3 단백질의 단편
MAP4K3 단백질의 Full size(a.a) MAP4K3 단백질 단편 부위 Breakpoint 부위 아미노산 서열
894aa(서열번호 68) 1~32aa(서열번호 69) TYGDVYK(서열번호 70)
PRKCE (protein kinase C, epsilon) 단백질을 암호화 하는 PRKCE 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 2(p21)에 위치하며, 이로부터 암호화되는 PRKCE 단백질은 총 아미노산 길이가 737aa인 단백질이다. PRKCE 단백질 또는 PRKCE 단백질의 단편은 MAP4K3-PRKCE 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, 상기 PRKCE 유전자는 GenBank accession no. NM_005400에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, 상기 PRKCE 단백질은 NM_005400에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 PRKCE 단백질의 단편은 NM_005400의 엑손 2(염색체 2 상의 위치((+) strand)를 기준으로 46070139-46070202 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열일 수 있다. 구체예에서, 상기 PRKCE 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 PRKCE 단백질에 대하여 아래의 표 20 및 21에 정리하였다:
표 20 PRKCE 단백질의 단편을 암호화 하는 유전자
PRKCE 유전자(Accession No.) PRKCE 단백질의 암호화 부위-CDS PRKCE 단백질 단편의 암호화 부위: 엑손 기준 PRKCE 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_005400 198~2411(2214bp)(서열번호 71) 엑손 2~마지막 엑손까지의 부위 546~2411(1866bp)(서열번호 72 chr2:[46070139 (엑손 2의 5' 말단) attgatctggagccagaaggaaga(서열번호 73)
표 21 PRKCE 단백질의 단편
PRKCE 단백질의 Full size(a.a) PRKCE 단백질 단편 부위 Breakpoint 부위 아미노산 서열
737aa(서열번호 74) 117~737aa (621aa) (서열번호 75) IDLEPEGR(서열번호 76)
상기 'MAP4K3 단백질 또는 그의 단편과 PRKCE 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질'을 암호화하는 융합 유전자 (MAP4K3-PRKCE 융합 유전자)는 5'-말단에 상기한 바와 같은 MAP4K3 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 PRKCE 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 MAP4K3-PRKCE 융합 유전자는 5' 말단쪽에 NM_003618의 엑손 1의 뉴클레오타이드 서열과 3' 말단쪽에 NM_005400의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 MAP4K3-PRKCE 융합 유전자는 5' 말단쪽에 NM_003618의 326번째부터 421번째까지의 뉴클레오타이드 서열 (서열번호 66)과 3' 말단쪽에 NM_005400의 546번째부터 2411번째까지의 뉴클레오타이드 서열(서열번호 72)이 연결된 융합 유전자(서열번호 77; 융합부위: 서열번호 78)일 수 있다.
상기 MAP4K3-PRKCE 융합 단백질은 N-말단쪽에 상기한 바와 같은 MAP4K3 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 PRKCE 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_003618의 엑손 1의 뉴클레오타이드 서열과 3' 말단쪽에 NM_005400의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 77의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 79; 융합부위: 서열번호 80) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
BCAS3 (breast carcinoma amplified sequence3) 단백질을 암호화 하는 BCAS3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 17(q23.2)에 위치하며, BCAS3 단백질은 이로부터 암호화되는 단백질이다. BCAS3 단백질 또는 BCAS3 단백질의 단편은 BCAS3-MAP3K3 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, BCAS3 유전자는 GenBank accession no. NM_017679, NM_001099432 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, BCAS3 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 BCAS3 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 23(염색체 17 상의 위치((+) strand)를 기준으로 59161828-59161925 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 23의 3' 말단에 코돈을 이루지 못하는 1개의 뉴클레오타이드(g)가 존재하는 형태일 수 있다. 구체예에서, 상기 BCAS3 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 BCAS3 단백질에 대하여 아래의 표 22 및 23에 정리하였다:
표 22 BCAS3 단백질의 단편을 암호화 하는 유전자
BCAS3유전자(Accession No.) BCAS3 단백질의 암호화 부위-CDS BCAS3 단백질 단편의 암호화 부위: 엑손 기준 BCAS3 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_001099432 110~2896(2787bp)(서열번호 81) 첫번째 엑손~엑손 23까지의 부위 110~2579(2469bp+1nt(c); 총 2470bp)(서열번호 82) chr17:59161925] (엑손 23의 3' 말단) acagtgattgatgctgcctcag (서열번호 83)
NM_017679 110~2851(2742bp) 110~2534(2454bp)
표 23 BCAS3 단백질의 단편
BCAS3유전자(Accession No.) BCAS3 단백질의 Full size(a.a) BCAS3 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_001099432 928aa(서열번호 84) 1~823aa+1nt(g)(아미노산 서열: 서열번호 85) TVIDAAS+1nt(g)(아미노산 서열: 서열번호 86)
NM_017679 913aa 1~808aa
MAP3K3 (mitogen activated protein kinase kinase kinase3) 단백질을 암호화 하는 MAP3K3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 17(q23.3)에 위치하며, MAP3K3 단백질은 이로부터 암호화되는 단백질이다. MAP3K3 단백질 또는 MAP3K3 단백질의 단편은 BCAS3-MAP3K3 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, MAP3K3 유전자는 GenBank accession no. NM_002401, NM_203351 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MAP3K3 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 MAP3K3 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 2 (염색체 17 상의 위치((+) strand)를 기준으로 61710041-61710162 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 2의 5' 말단의 처음 시작하는 2개의 뉴클레오타이드(ac)는 코돈을 이루지 못하는 형태일 수 있고, BCAS3 단백질의 단편과 융합시에 앞서 설명한 바와 같이 BCAS3 단백질의 단편에 추가로 포함된 1개의 뉴클레오타이드(g)와 연결되어 코돈(gac)을 이루어 하나의 아미노산(D)을 코딩할 수 있다. 구체예에서, 상기 MAP3K3단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MAP3K3 단백질에 대하여 아래의 표 24 및 25에 정리하였다:
표 24 MAP3K3단백질의 단편을 암호화 하는 유전자
MAP3K3 유전자(Accession No.) MAP3K3 단백질의 암호화 부위-CDS MAP3K3 단백질 단편의 암호화 부위: 엑손 기준 MAP3K3 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_002401 320~2200(1881bp)(서열번호 87) 엑손 2부터 마지막 엑손까지의 부위 324~2200(2nt(ac)+1875bp; 총 1877bp)(서열번호 88) chr17:61710041] (엑손 2의 5' 말단) acgaacaggaggcattgaactca (서열번호 89)
NM_203351 320~2293(1974bp) 324~2293(1970bp)
표 25 MAP3K3 단백질의 단편
MAP3K3 유전자(Accession No.) MAP3K3 단백질의 Full size(a.a) MAP3K3 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_002401 626aa(서열번호 90) 3aa~626aa(2nt(ac)+3aa~626aa; 총 624aa) (아미노산 서열: 서열번호 91) 2nt(ac)+EQEALNS (아미노산 서열: 서열번호 92)
NM_203351 657aa 3~655aa
상기 'BCAS3 단백질 또는 그의 단편과 MAP3K3 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질'을 암호화하는 융합 유전자 (BCAS3-MAP3K3 융합 유전자)는 5'-말단에 상기한 바와 같은 BCAS3 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 MAP3K3 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 BCAS3-MAP3K3 융합 유전자는 5' 말단쪽에 NM_017679, NM_001099432 등의 첫번째 엑손에서 엑손 23까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002401, NM_203351 등의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 BCAS3-MAP3K3 융합 유전자는 5' 말단쪽에 NM_001099432의 110번째부터 2579번째까지의 뉴클레오타이드 서열 (서열번호 82)과 3' 말단쪽에 NM_002401의 324번째부터 2200번째까지의 뉴클레오타이드 서열(서열번호 88)이 연결된 융합 유전자(서열번호 93; 융합부위: 서열번호 94)일 수 있다.
상기 BCAS3-MAP3K3 융합 단백질은 N-말단쪽에 상기한 바와 같은 BCAS3 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 MAP3K3 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_017679, NM_001099432 등의 첫번째 엑손에서 엑손 23까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002401, NM_203351 등의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 93의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 95; 융합부위: 서열번호 96) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
KRAS (Ki-ras2 Kirsten rat sarcoma viral oncogene homolog) 단백질을 암호화하는 KRAS 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(p12.1)에 위치하며, KRAS 단백질은 이로부터 암호화되는 단백질이다. KRAS 단백질 또는 KRAS 단백질의 단편은 KRAS-CDH13 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, KRAS 유전자는 GenBank accession no. NM_004985, NM_033360 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, KRAS 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 KRAS 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 4(염색체 11 상의 위치((-) strand)를 기준으로 25378548-25378707 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 KRAS 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 KRAS 단백질에 대하여 아래의 표 26 및 27에 정리하였다:
표 26 KRAS 단백질의 단편을 암호화 하는 유전자
KRAS유전자(Accession No.) KRAS 단백질의 암호화 부위-CDS KRAS 단백질 단편의 암호화 부위: 엑손 기준 KRAS 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_004985 182~748(567bp)(서열번호 97) 첫번째 엑손~엑손 4까지의 부위 182~631(450bp)(서열번호 98) chr12:[25378548 (엑손 4의 3' 말단) acatcagcaaagacaagacag (서열번호 99)
NM_033360 182~751(570bp) 182~631(450bp)
표 27 KRAS 단백질의 단편
KRAS 유전자(Accession No.) KRAS 단백질의 Full size(a.a) KRAS 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_004985 188aa(서열번호 100) 1~150aa(서열번호 101) TSAKTRQ (서열번호 102)
NM_033360 189aa 1~150aa
CDH13 (cadherin 13, H-cadherin) 단백질을 암호화 하는 CDH13 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 16(q23.3)에 위치하며, CDH13 단백질은 이로부터 암호화되는 단백질이다. CDH13 단백질 또는 CDH13 단백질의 단편은 KRAS-CDH13 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, CDH13 유전자는 GenBank accession no. NM_001257에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CDH13 단백질은 이 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 CDH13 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 5 (염색체 16 상의 위치((+) strand)를 기준으로 83158990-83159106 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 CDH13 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CDH13 단백질에 대하여 아래의 표 28 및 29에 정리하였다:
표 28 CDH13 단백질의 단편을 암호화 하는 유전자
CDH13 유전자(Accession No.) CDH13 단백질의 암호화 부위-CDS CDH13 단백질 단편의 암호화 부위: 엑손 기준 CDH13 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_001257 300~2441(2142bp)(서열번호 103) 엑손 5부터 마지막 엑손까지의 부위 666~2441(1776bp)(서열번호 104) chr16:[83158990 (엑손 5의 5' 말단) gatatatttaaatttgcaaga (서열번호 105)
표 29 CDH13 단백질의 단편
CDH13 유전자(Accession No.) CDH13 단백질의 Full size(a.a) CDH13 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_001257 713aa(서열번호 106) 123~713aa (591aa)(서열번호 107) DIFKFAR(서열번호 108)
상기 'KRAS 단백질 또는 그의 단편과 CDH13 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질'을 암호화하는 융합 유전자 (KRAS-CDH13 융합 유전자)는 5'-말단에 상기한 바와 같은 KRAS 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 CDH13 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 KRAS-CDH13 융합 유전자는 5' 말단쪽에 NM_004985, NM_033360 등의 첫번째 엑손에서 엑손 4까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001257의 엑손 5부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 KRAS-CDH13 융합 유전자는 5' 말단쪽에 NM_004985의 182번째부터 631번째까지의 뉴클레오타이드 서열 (서열번호 98)과 3' 말단쪽에 NM_001257의 666번째부터 2441번째까지의 뉴클레오타이드 서열(서열번호 104)이 연결된 융합 유전자(서열번호 109; 융합부위: 서열번호 110)일 수 있다.
상기 KRAS-CDH13 융합 단백질은 N-말단쪽에 상기한 바와 같은 KRAS 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 CDH13 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_004985, NM_033360 등의 첫번째 엑손에서 엑손 4까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001257의 엑손 5부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 109의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 111; 융합부위: 서열번호 112) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
ZFYVE9 (zinc finger, FYVE domain containing 9) 단백질을 암호화 하는 ZFYVE9 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 1(p32.3)에 위치하며, ZFYVE9 단백질은 이로부터 암호화되는 단백질이다. ZFYVE9 단백질 또는 ZFYVE9 단백질의 단편은 ZFYVE9-CGA 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, ZFYVE9 유전자는 GenBank accession no. NM_007324, NM_004799 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, ZFYVE9 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 ZFYVE9 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 16(염색체 1 상의 위치((+) strand)를 기준으로 52803444-52803606 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 16의 3' 말단에 코돈을 이루지 못하는 2개의 뉴클레오타이드(gg)가 존재하는 형태일 수 있다. 구체예에서, 상기 ZFYVE9 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 ZFYVE9 단백질에 대하여 아래의 표 30 및 31에 정리하였다:
표 30 ZFYVE9 단백질의 단편을 암호화 하는 유전자
ZFYVE9 유전자(Accession No.) ZFYVE9 단백질의 암호화 부위-CDS ZFYVE9 단백질 단편의 암호화 부위: 엑손 기준 ZFYVE9 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_007324 173~4273(4101bp)(서열번호 113) 첫번째 엑손~엑손 16까지의 부위 173~3828(3654bp+2nt(gg); 총 3656bp)(서열번호 114) chr1:52803606] (엑손 16의 3' 말단) gacaagaacgttagcaaggg (서열번호 115)
NM_004799 173~4450(4278bp) 173~4005(3833bp)
표 31 ZFYVE9 단백질의 단편
ZFYVE9유전자(Accession No.) ZFYVE9 단백질의 Full size(a.a) ZFYVE9 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_007324 1366aa(서열번호 116) 1~1218aa+2nt(gg)(아미노산 서열: 서열번호 117) DKNVSK+2nt(gg)(아미노산 서열: 서열번호 118)
NM_004799 1425aa 1~1277aa+2nt
CGA (glycoprotein hormones, alpha polypeptide) 단백질을 암호화 하는 CGA 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q14.3)에 위치하며, CGA 단백질은 이로부터 암호화되는 단백질이다. CGA 단백질 또는 CGA 단백질의 단편은 ZFYVE9-CGA 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, CGA 유전자는 GenBank accession no. NM_000735에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CGA 단백질은 상기 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 CGA 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 2 (염색체 6 상의 위치((-) strand)를 기준으로 87797831-87797925 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 2의 5' 말단의 처음 시작하는 1개의 뉴클레오타이드(g)는 코돈을 이루지 못하는 형태일 수 있고, ZFYVE9 단백질의 단편과 융합시에 앞서 설명한 바와 같이 ZFYVE9 단백질의 단편에 추가로 포함된 2개의 뉴클레오타이드(gg)와 연결되어 코돈(ggg)을 이루어 하나의 아미노산(G)을 코딩할 수 있다. 구체예에서, 상기 CGA 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CGA 단백질에 대하여 아래의 표 32 및 33에 정리하였다:
표 32 CGA단백질의 단편을 암호화 하는 유전자
CGA 유전자(Accession No.) CGA 단백질의 암호화 부위-CDS CGA 단백질 단편의 암호화 부위: 엑손 기준 CGA 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_000735 143~493(351bp)(서열번호 119) 엑손2~ 마지막 엑손까지의 부위 5UTR+143~449(358bp)(서열번호 120) Chr6:87797925](엑손2의 5' 말단) gagcgcc (121)
표 33 CGA 단백질의 단편
CGA 단백질의 Full size(a.a) CGA 단백질 단편 부위 Breakpoint 부위 아미노산 서열
116aa(서열번호 122) 116aa(서열번호 123) UTR에서breakpoint 발생
상기 'ZFYVE9 단백질 또는 그의 단편과 CGA 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질'을 암호화하는 융합 유전자 (ZFYVE9-CGA 융합 유전자)는 5'-말단에 상기한 바와 같은 ZFYVE9 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 CGA 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 ZFYVE9-CGA 융합 유전자는 5' 말단쪽에 NM_007324, NM_004799 등의 첫번째 엑손에서 엑손 16까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_000735의 5UTR (7bp)을 포함하여 두번째 엑손에서 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 ZFYVE9-CGA 융합 유전자는 5' 말단쪽에 NM_007324의 173번째부터 3828번째까지의 뉴클레오타이드 서열 (서열번호 114)과 3' 말단쪽에 NM_000735의 136번째부터 493번째까지의 뉴클레오타이드 서열(서열번호 120)이 연결된 융합 유전자(서열번호 124; 융합부위: 서열번호 125)일 수 있다.
상기 ZFYVE9-CGA 융합 단백질은 N-말단쪽에 상기한 바와 같은 ZFYVE9 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 CGA 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_007324, NM_004799 등의 첫번째 엑손에서 엑손 16까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_000735의 5UTR (7bp)을 포함하여 두번째 엑손에서 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 124의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 126; 융합부위: 서열번호 127) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
ERBB2IP (erbb2 interacting protein) 단백질을 암호화 하는 ERBB2IP 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 5(q12.3)에 위치하며, ERBB2IP 단백질은 이로부터 암호화되는 단백질이다. ERBB2IP 단백질 또는 ERBB2IP 단백질의 단편은 ERBB2IP-MAST4 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, ERBB2IP 유전자는 GenBank accession no. NM_018695, NM_001006600 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, ERBB2IP 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 ERBB2IP 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 26(염색체 5 상의 위치((+) strand)를 기준으로 65372703-65372777 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 ERBB2IP 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 ERBB2IP 단백질에 대하여 아래의 표 34 및 35에 정리하였다:
표 34 ERBB2IP 단백질의 단편을 암호화 하는 유전자
ERBB2IP 유전자(Accession No.) ERBB2IP 단백질의 암호화 부위-CDS ERBB2IP 단백질 단편의 암호화 부위: 엑손 기준 ERBB2IP 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_001006600 311~4219(3909bp)(서열번호 128) 첫번째 엑손~엑손 26까지의 부위 311~4111(3801bp)(서열번호 129) chr5:65372777] (엑손 26의 3' 말단) cagccaggtgataaaattattcag (서열번호 130)
NM_018695 311~4426(4116bp) 311~4318(4008bp)
표 35 ERBB2IP 단백질의 단편
ERBB2IP 유전자(Accession No.) ERBB2IP 단백질의 Full size(a.a) ERBB2IP 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_001006600 1302aa(서열번호 131) 1~1267aa(서열번호 132) QPGDKIIQ(서열번호 133)
NM_018695 1371aa 1~1336aa
MAST4 (microtubule associated serine/threonine kinase family member4) 단백질을 암호화 하는 MAST4 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 5(q12.3)에 위치하며, MAST4 단백질은 이로부터 암호화되는 단백질이다. MAST4 단백질 또는 MAST4 단백질의 단편은 ERBB2IP-MAST4 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, MAST4 유전자는 GenBank accession no. NM_001164664, NM_015183등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MAST4 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 MAST4 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 13 (염색체 5 상의 위치((+) strand)를 기준으로 66400194-66400403 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 MAST4단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MAST4 단백질에 대하여 아래의 표 36 및 37에 정리하였다:
표 36 MAST4단백질의 단편을 암호화 하는 유전자
MAST4 유전자(Accession No.) MAST4 단백질의 암호화 부위-CDS MAST4 단백질 단편의 암호화 부위: 엑손 기준 MAST4 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_001164664 309~8180(7872bp)(서열번호 134) 엑손 13부터 마지막 엑손까지의 부위 1455~8180 (6726bp)(서열135) chr5:[66400194 (엑손 13의 5' 말단) gctacagctcagatggaagaacgt (서열번호 136)
NM_015183 69~7373bp(7065bp) 648~7373(6726bp)
표 37 MAST4 단백질의 단편
MAST4 유전자(Accession No.) MAST4 단백질의 Full size(a.a) MAST4 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_001164664 2623aa(서열번호 137) 383aa~2623aa (총 2241aa) (서열번호 138) ATAQMEER (서열번호 139)
NM_015183 2623aa 383~2623aa(2241aa)
상기 'ERBB2IP 단백질 또는 그의 단편과 MAST4 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질'을 암호화하는 융합 유전자 (ERBB2IP-MAST4 융합 유전자)는 5'-말단에 상기한 바와 같은 ERBB2IP 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 MAST4 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 ERBB2IP-MAST4 융합 유전자는 5' 말단쪽에 NM_018695, NM_001006600 등의 첫번째 엑손에서 엑손 26까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001164664, NM_015183등의 엑손 13부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 ERBB2IP-MAST4 융합 유전자는 5' 말단쪽에 NM_001006600 의 311번째부터 4111번째까지의 뉴클레오타이드 서열 (서열번호 129)과 3' 말단쪽에 NM_001164664의 1455번째부터 8180번째까지의 뉴클레오타이드 서열(서열번호 135)이 연결된 융합 유전자(서열번호 140; 융합부위: 서열번호 141)일 수 있다.
상기 ERBB2IP-MAST4 융합 단백질은 N-말단쪽에 상기한 바와 같은 ERBB2IP 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 MAST4 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_018695, NM_001006600 등의 첫번째 엑손에서 엑손 26까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001164664, NM_015183등의 엑손 13부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 140의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 142; 융합부위: 서열번호 143) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
TPD52L1 (tumor protein D52-like1) 단백질을 암호화 하는 TPD52L1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q22.31)에 위치하며, TPD52L1 단백질은 이로부터 암호화되는 단백질이다. TPD52L1 단백질 또는 TPD52L1 단백질의 단편은 TPD52L1-TRMT11 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, TPD52L1 유전자는 GenBank accession no. NM_003287, NM_001003396, NM_001003397, NM_001003395 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TPD52L1 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 TPD52L1 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 5(염색체 6 상의 위치((+) strand)를 기준으로 125569428-125569529 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 5의 3' 말단에 코돈을 이루지 못하는 2개의 뉴클레오타이드(ag)가 존재하는 형태일 수 있다. 구체예에서, 상기 TPD52L1 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TPD52L1 단백질에 대하여 아래의 표 38 및 39에 정리하였다:
표 38 TPD52L1 단백질의 단편을 암호화 하는 유전자
TPD52L1유전자(Accession No.) TPD52L1 단백질의 암호화 부위-CDS TPD52L1 단백질 단편의 암호화 부위: 엑손 기준 TPD52L1 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_001003395 328~855(528bp)(서열번호 144) 첫번째 엑손~엑손 5까지의 부위 328~626(297bp+2nt(c); 총 299bp)(서열번호 145) chr6:125569529] (엑손 5의 3' 말단) tcagcaagaagttcggagacatgag (서열번호 146)
NM_001003396 220~654(435bp) 220~605(386bp)
NM_001003397 220~615(396bp) 220~605(386bp)
NM_003287 220~834(615bp) 220~605(386bp)
표 39 TPD52L1 단백질의 단편
TPD52L1유전자(Accession No.) TPD52L1 단백질의 Full size(a.a) TPD52L1 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_001003395 175aa(서열번호 147) 1~99aa+2nt(ag)(아미노산 서열: 서열번호 148) SKKFGDM+2nt(ag)(아미노산 서열: 서열번호 149)
NM_001003396 144aa 1~128aa
NM_001003397 131aa 1~128aa
NM_003287 204aa 1~128aa
TRMT11 (tRNA methyl transferase11 homolog) 단백질을 암호화 하는 TRMT11 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q22.32)에 위치하며, TRMT11 단백질은 이로부터 암호화되는 단백질이다. TRMT11 단백질 또는 TRMT11 단백질의 단편은 TPD52L1-TRMT11 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, TRMT11 유전자는 GenBank accession no. NM_001031712에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TRMT11 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 TRMT11 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 12 (염색체 6 상의 위치((+) strand)를 기준으로 126342306-126342426 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 12의 5' 말단의 처음 시작하는 1개의 뉴클레오타이드(a)는 코돈을 이루지 못하는 형태일 수 있고, TPD52L1 단백질의 단편과 융합시에 앞서 설명한 바와 같이 TPD52L1 단백질의 단편에 추가로 포함된 2개의 뉴클레오타이드(ag)와 연결되어 코돈(aga)을 이루어 하나의 아미노산(R)을 코딩할 수 있다. 구체예에서, 상기 TRMT11단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TRMT11 단백질에 대하여 아래의 표 40 및 41에 정리하였다:
표 40 TRMT11 단백질의 단편을 암호화 하는 유전자
TRMT11 유전자(Accession No.) TRMT11 단백질의 암호화 부위-CDS TRMT11 단백질 단편의 암호화 부위: 엑손 기준 TRMT11 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_001031712 122~1513(1392bp)(서열번호 150) 엑손 12부터 마지막 엑손까지의 부위 1261~1513(1nt(a)+252bp; 총 1877bp)(서열번호 151) chr6:[126342306 (엑손 12의 5' 말단) atacactgaagagatggtgcct (서열번호 152)
표 41 TRMT11 단백질의 단편
TRMT11 유전자(Accession No.) TRMT11 단백질의 Full size(a.a) TRMT11 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_001031712 463aa(서열번호 153) 1nt(a)+381aa~463aa (총 83aa) (아미노산 서열: 서열번호 154) 1nt(a)+ YTEEMVP (아미노산 서열: 서열번호 155)
상기 'TPD52L1 단백질 또는 그의 단편과 TRMT11 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질'을 암호화하는 융합 유전자 (TPD52L1-TRMT11 융합 유전자)는 5'-말단에 상기한 바와 같은 TPD52L1 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 TRMT11 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 TPD52L1-TRMT11 융합 유전자는 5' 말단쪽에 NM_003287, NM_001003396, NM_001003397, NM_001003395 등의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001031712의 엑손 12부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 TPD52L1-TRMT11 융합 유전자는 5' 말단쪽에 NM_001003395의 328번째부터 626번째까지의 뉴클레오타이드 서열 (서열번호 145)과 3' 말단쪽에 NM_001031712의 1261번째부터 1513번째까지의 뉴클레오타이드 서열(서열번호 151)이 연결된 융합 유전자(서열번호 156; 융합부위: 서열번호 157)일 수 있다.
상기 TPD52L1-TRMT11 융합 단백질은 N-말단쪽에 상기한 바와 같은 TPD52L1 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 TRMT11 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_003287, NM_001003396, NM_001003397, NM_001003395 등의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001031712의 엑손 12부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 156의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 158; 융합부위: 서열번호 159) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
TXNRD1 (thioredoxin reductase1) 단백질을 암호화 하는 TXNRD1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q23.3)에 위치하며, TXNRD1 단백질은 이로부터 암호화되는 단백질이다. TXNRD1 단백질 또는 TXNRD1 단백질의 단편은 TXNRD1-GPR133 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, TXNRD1 유전자는 GenBank accession no. NM_003330, NM_001093771, NM_182729, NM_182743, NM_182742 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TXNRD1 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 TXNRD1 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 17(염색체 12 상의 위치((+) strand)를 기준으로 104732917-104733051 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 TXNRD1 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TXNRD1 단백질에 대하여 아래의 표 42 및 43에 정리하였다:
표 42 TXNRD1 단백질의 단편을 암호화 하는 유전자
TXNRD1 유전자(Accession No.) TXNRD1 단백질의 암호화 부위-CDS TXNRD1 단백질 단편의 암호화 부위: 엑손 기준 TXNRD1 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_003330 656~2311(1656bp)(서열번호 160) 첫번째 엑손~엑손 17까지의 부위 656~2242(1587bp)(서열번호 161) chr12:104733051] (엑손 17의 3' 말단) aatccaccctgtctgtgcagag (서열번호 162)
NM_001093771 25~1974(1950bp) 258~1905(1881bp)
NM_182729 527~2074(1548bp) 527~2005(1479bp)
NM_182743 465~1964(1500bp) 465~1895(1431bp)
NM_182742 702~2201(1500bp) 702~2132(1431bp)
표 43 TXNRD1 단백질의 단편
TXNRD1 유전자(Accession No.) ERBB2IP 단백질의 Full size(a.a) ERBB2IP 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_003330 551aa(서열번호 163) 1~529aa(서열번호 164) IHPVCAE (서열번호 165)
NM_001093771 649aa 1~627aa
NM_182729 499aa 1~477aa
NM_182743 499aa 1~477aa
NM_182742 499aa 1~477aa
GPR133 (G protein-coupled receptor133) 단백질을 암호화 하는 GPR133 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q24.33)에 위치하며, GPR133 단백질은 이로부터 암호화되는 단백질이다. GPR133 단백질 또는 GPR133 단백질의 단편은 TXNRD1-GPR133 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, GPR133 유전자는 GenBank accession no. NM_198827에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, GPR133 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 GPR133 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 14 (염색체 12 상의 위치((+) strand)를 기준으로 131561346-131561419 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 GPR133단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 GPR133 단백질에 대하여 아래의 표 44 및 45에 정리하였다:
표 44 GPR133단백질의 단편을 암호화 하는 유전자
GPR133 유전자(Accession No.) GPR133 단백질의 암호화 부위-CDS GPR133 단백질 단편의 암호화 부위: 엑손 기준 GPR133 단백질 단편의 암호화 부위: cDNA 기준 염색체 상의 Break-point 위치 Break-point 부위 염기서열
NM_198827 560~3184(2625bp)(서열번호 166) 엑손 14부터 마지막 엑손까지의 부위 2033~3184 (11526bp)(서열167) chr12:[131561346 (엑손 14의 5' 말단) acacgtaagcagcac (서열번호 168)
표 45 GPR133 단백질의 단편
GPR133 유전자(Accession No.) GPR133 단백질의 Full size(a.a) GPR133 단백질 단편 부위 Breakpoint 부위 아미노산 서열
NM_198827 874aa(서열번호 169) 492aa~874aa (총 383aa) (서열번호 170) TRKQHS (서열번호 171)
상기 'TXNRD1 단백질 또는 그의 단편과 GPR133 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질'을 암호화하는 융합 유전자 (TXNRD1-GPR133 융합 유전자)는 5'-말단에 상기한 바와 같은 TXNRD1 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 GPR133 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 TXNRD1-GPR133 융합 유전자는 5' 말단쪽에 NM_003330, NM_001093771, NM_182729, NM_182743, NM_182742 등의 첫번째 엑손에서 엑손 17까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_198827의 엑손 14부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 TXNRD1-GPR133 융합 유전자는 5' 말단쪽에 NM_003330의 656번째부터 2242번째까지의 뉴클레오타이드 서열 (서열번호 161)과 3' 말단쪽에 NM_198827의 2033번째부터 3184번째까지의 뉴클레오타이드 서열(서열번호 167)이 연결된 융합 유전자(서열번호 172; 융합부위: 서열번호 173)일 수 있다.
상기 TXNRD1-GPR133 융합 단백질은 N-말단쪽에 상기한 바와 같은 TXNRD1 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 GPR133 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_003330, NM_001093771, NM_182729, NM_182743, NM_182742 등의 첫번째 엑손에서 엑손 17까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_198827의 엑손 14부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 172의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 174; 융합부위: 서열번호 175) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
본 명세서에 사용된 바로서, 첫 번째 엑손과 마지막 엑손은 엑손 번호와 무관하게 주어진 accession number의 염기서열에서 첫 번째 위치하는 엑손과 마지막에 위치하는 엑손을 각각 의미하며, 엑손 번호는 NCBI의 서열 정보에서 부여된 번호에 따른다.
한편, SCAF11 유전자의 5UTR부위가 PDGFRA 유전자 또는 이의 단편과 융합된 융합 유전자의 경우, PDGFRA 유전자 또는 이의 단편의 발현율이 현저하게 증가되며, 이러한 현상은 암 환자에서 특이적으로 관찰됨을 확인하였다. 따라서, 본 발명의 다른 예는 SCAF11 유전자의 5UTR부위 및 PDGFRA 유전자 또는 이의 단편이 융합된 폴리뉴클레오타이드 분자(SCAF11-PDGFRA 융합 유전자), 및 상기 폴리뉴클레오타이드 분자의 암 진단 마커로서의 용도를 제공한다.
SCAF11 (SR-related CTD-associated factor 11) 단백질을 암호화 하는 SCAF11 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q12)에 위치한다. SCAF11의 5UTR 부위는 SCAF11-PDGFRA 융합 유전자의 5' 말단쪽 융합 파트너이다. 구체예에서, SCAF11 유전자는 GenBank accession no. NM_004719에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, SCAF11의 5UTR 부위는 NM_004719에 제공되는 뉴클레오타이드 서열 중 1번째부터 266번째까지의 뉴클레오타이드 서열 (엑손 1에 해당; 염색체상 위치((-) strand)-chr12:46384136-46384401; 염색체상 breakpoint-chr12:[46384136; 서열번호 176; 융합 부위-서열번호 177)을 갖는 폴리뉴클레오타이드 분자일 수 있다.
PDGFRA (platelet-derived growth factor receptor, alpha polypeptide) 단백질을 암호화 하는 PDGFRA 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 4(q12)에 위치한다. PDGFRA 유전자 또는 유전자 단편은 SCAF11-PDGFRA 융합 유전자의 3' 말단쪽 융합 파트너이다. 구체예에서, PDGFRA 유전자는 GenBank accession no. NM_006206 에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, PDGFRA 융합 유전자의 단편은 NM_006206의 CDS 부위 (332번째부터 3601번째까지의 염기서열; 총길이 3270 bp)를 포함하는 것으로, 상기 CDS 부위의 5' 말단에 12bp의 5UTR 부위 (NM_006206의 120번째부터 331번째까지의 염기서열)를 추가로 포함하는 것일 수 있으며, 이는 NM_006206의 엑손 2(염색체상 위치((+) strand)-chr4:55124924-55124984; 염색체상 breakpoint-chr12:120180269])부터 마지막 엑손까지를 포함하는 유전자 단편으로 표현될 수 있다 (서열번호 178; 융합 부위-서열번호 179)을 갖는 폴리뉴클레오타이드 분자일 수 있다.
상기 SCAF11-PDGFRA 융합 유전자는 서열번호 180 (융합부위: 서열번호 181)의 뉴클레오타이드 서열을 갖는 것일 수 있다.
별다른 언급이 없는 한, 본 명세서에 기재된 DNA 분자를 시퀀싱하여 결정된 모든 뉴크레오타이드 서열들은 자동화된 DNA 시퀀서(예컨대, Applied Biosystems, Inc.에서 제조된 Model 373)를 사용하여 결정될 수 있고, 결정된 뉴클레오타이드 서열에 의하여 암호화되는 모든 아미노산 서열들은 자동화된 펩타이드 시퀀서를 사용하여 결정된 것이다. 이 자동화된 접근에 의하여 결정된 뉴클레오타이드 서열은 실제 서열과 비교하여 일부 에러를 포함할 수 있다. 예컨대, 자동에 의하여 결정된 뉴크레오타이드 서열들은 시퀀싱된 DNA 분자의 실제 뉴클레오타이드 서열과 전형적으로 약 90% 이상, 구체적으로 약 95% 이상, 보다 구체적으로 약 99% 이상, 더욱 구체적으로 약 99.9% 이상의 서열 상동성을 가질 수 있다. 실제 서열과 비교하여 결정된 뉴클레오타이드에서 하나의 삽입 또는 결손은 포함할 수 있으며, 이와 같은 삽입 또는 결손에 의하여 뉴클레오타이드 서열 번역시의 프레임 쉬프트가 야기되어, 암호화되는 아미노산 서열이 실제 아미노산 서열과 완전하게 다르게 될 수 있다.
본 발명에 따른 융합 단백질 및/또는 융합 유전자는 고형암, 구체적으로 폐암, 특히 폐선암과 같은 비소세포암(NSCLC) 환자에게서 특이적으로 발견되거나 발현되는 것으로 확인되었으므로, 상기 융합 단백질 및/또는 이를 암호화하는 융합 유전자 및/또는 SCAF11-PDGFRA 융합 유전자는 고형암, 구체적으로 폐암, 특히 폐선암과 같은 비소세포암(NSCLC)의 진단 마커로서 유용하다.
이에, 본 발명의 또 다른 예는 상기 융합 단백질에 특이적으로 결합하는 분자, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자 및/또는 상기 융합 유전자에 상응하는 mRNA(전사체)와 상호작용(예컨대, 결합)하는 물질을 포함하는 암 진단용 약학 조성물을 제공한다.
상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질 발현(또는 존재) 여부를 검출하기 위한 물질로서, 상기 융합 단백질 또는 상기 융합 단백질의 융합 부위(break point)의 아미노산 서열에 특이적으로 결합하는 항체, 압타머 등으로 이루어진 군에서 선택된 것일 수 있다.
또한, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 또는 이들 융합 유전자에 상응하는 mRNA와 상호작용하는 물질은 상기 융합유전자 또는 mRNA와 혼성화 가능한 핵산 분자일 수 있다. 예컨대, 상기 핵산 분자는 생물 시료 내의 상기 융합 유전자, 상기 융합 유전자의 융합 부위, 또는 상기 융합 유전자 또는 융합 부위에 상응하는 mRNA(발현 전사체)와 특이적으로 혼성화 가능한 안티센스 올리고뉴클레오타이드 (예컨대, siRNA, 마이크로RNA 등), 프로브(예컨대, 5 내지 100 bp, 5 내지 50bp, 5 내지 30bp, 또는 5 내지 25bp), 앱타머 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 다른 구체예에서, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 또는 이들 융합 유전자에 상응하는 mRNA 분자와 혼성화 가능한 핵산 분자는 상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개, 구체적으로 100 내지 200개의 염기로 이루어진 폴리뉴클레오타이드 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편의 양 말단에 인접하는 20 내지 100개, 구체적으로 25 내지 50개의 염기서열 또는 이와 상보적인 서열과 혼성화 가능한 20 내지 100bp, 또는 25 내지 50bp 길이의 프라이머쌍일 수 있다. 상기 '혼성화 가능하다'함은 검출 대상 염기서열과 완전히 상보적이거나, 80% 이상 (예컨대 80-100%), 구체적으로 90% 이상 (예컨대 90-100%) 상보적인 염기서열을 가져서 상기 검출 대상 유전자 또는 mRNA와 특이적으로 결합 가능함을 의미한다. 예컨대, 각 융합 유전자에 혼성 가능한 프라이머쌍을 아래의 표 46에 예시하였다.
표 46
융합 유전자 융합부위 Forward Primer Sequence Reverse Primer Sequence
CCDC6-ROS1 서열번호 14 CCTGCAGGAAAAATTAGACCAG (SEQ ID NO: 182) AGCTCAGCCAACTCTTTGTCTT(SEQ ID NO: 183)
SCAF11-PDGFRA 서열번호 181 CAGCGGAGTCAGTGTCCTAGAG(SEQ ID NO: 184) TGAGAAGACAGCCTAAGACCAG(SEQ ID NO: 185)
FGFR2-CIT 서열번호 30 ACATGATGATGAGGGACTGTTG(SEQ ID NO: 186) ACAGCTGTTACGAAGAGCATCA(SEQ ID NO: 187)
AXL-MBIP 서열번호 46 GCCTGACGAAATCCTCTATGTC(SEQ ID NO: 188) CAAAATTCCCTGACGTTGTTTT(SEQ ID NO: 189)
APLP2-TNFSF11 서열번호 62 TGCTGAGAACAAAGATCGCTTA(SEQ ID NO: 190) TGTCGGTGGCATTAATAGTGAG(SEQ ID NO: 191)
MAP4K3-PRKCE 서열번호 78 AGGAGGACTTCGAGCTGATTC(SEQ ID NO: 192) ACGACCCTGAGAGATCGATGA(SEQ ID NO: 193)
BCAS3-MAP3K3 서열번호 94 CATCCCGTCCAGTCTCTGAT(SEQ ID NO: 194) CTGCCTATTTGAGTGACCTGTG(SEQ ID NO: 195)
KRAS-CDH13 서열번호 110 GGAAATAAATGTGATTTGCCTTC(SEQ ID NO: 196) AAGGCTGTCTCTGATTCTCTGG(SEQ ID NO: 197)
ZFYVE9-CGA 서열번호 125 ACTGCAGAGAACATGGATTCCT(SEQ ID NO: 198) GAATGGAGAACATGCAGAAACA(SEQ ID NO: 199)
ERBB2IP-MAST4 서열번호 141 AACAAGGGTACAACCTGAAGGA(SEQ ID NO: 200) TCAAGGAAGTATCGTGAGGTGA(SEQ ID NO: 201)
TPD52L1-TRMT11 서열번호 157 GAAAACACATGAAACCCTGAGTC(SEQ ID NO: 202) ATGTGTGACTGGAAAGCTTCTG(SEQ ID NO: 203)
TXNRD1-GPR133 서열번호 173 TCCAAATGCTGGAGAAGTTACA(SEQ ID NO: 204) AGTACACGAAGACTCGGTTGCT(SEQ ID NO: 205)
일 구체예에서, 상기 융합 단백질 또는 융합 유전자 또는 mRNA와 특이적으로 상호작용하는 물질은 자유 래디컬, 방사성-동위원소, 형광염료, 발색기질, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상의 면역화학적 표지 물질이 부착되거나, 상기 표지 물질과 함께 사용될 수 있다.
또 다른 예는 환자로부터 얻은 생물 시료에서 상기 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 및/또는 상기 융합 유전자에 상응하는 mRNA를 검출하는 단계를 포함하는 암 진단에 정보를 제공하는 방법을 제공한다.
상기 생물 시료에서 상기 융합 단백질, 융합 유전자, 및/또는 mRNA를 검출하는 단계는 i) 상기 생물 시료에 상기 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA로 이루어진 군에서 선택된 1종 이상과 상호작용하는 물질을 처리(첨가)하고 반응시키는 단계; 및 ii) 상기 얻어진 반응물을 검출하는 단계를 포함할 수 있다. 상기 단계 i) 이전에 생물 시료를 준비하는 단계를 추가로 포함할 수 있으며, 상기 생물 시료를 준비하는 단계는 환자로부터 생물 시료를 얻는(분리하는) 단계를 포함하는 것일 수 있다. 상기 단계 i)에서 상기 상호작용하는 물질은 상기 융합 단백질 (전부 또는 일부; 예컨대 융합 부위)에 특이적으로 결합하는 화합물, 항체, 앱타머, 및 상기 융합 유전자 및/또는 mRNA (전부 또는 일부; 예컨대 융합 부위)에 결합하는 핵산 분자 (예컨대, 프라이머, 프로브, 앱타머 등), 화합물 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 앞서 설명한 바와 같이, 이들 상호작용 하는 물질은 자유 래디컬, 방사성-동위원소, 형광염료, 발색기질, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상의 면역화학적 표지 물질이 부착되거나, 상기 표지 물질과 함께 사용될 수 있다. 상기 단계 ii)에서, 상기 반응물은 단계 i)에서 얻어진 상기 융합 단백질, 융합유전자, 및 mRNA로 이루어진 군에서 선택된 1종 이상과 이와 상호작용하는 물질이 상호작용(결합)하여 생성된 복합체(complex)일 수 있다. 상기 반응물을 검출하는 단계에서 반응물이 검출되면 상기 융합 단백질, 융합 유전자, 및/또는 mRNA이 존재하는 것으로 판단할 수 있다.
상기 암 진단에 정보를 제공하는 방법에 있어서, 생물 시료에서 상기 융합 단백질, 융합 유전자, 및/또는 mRNA의 존재가 확인되면, 상기 환자는 암(고형암), 구체적으로 폐암, 보다 구체적으로 비소세포폐암(NSCLC), 특히 폐선암 환자로 결정할 수 있다.
상기 융합 단백질, 융합 유전자, 및/또는 mRNA의 검출은 통상적인 단백질 또는 유전자 검출 방법에 의하여 수행될 수 있다.
예컨대, 상기 융합 단백질의 검출은 상기 융합 단백질과 상호작용하는 물질, 예컨대 특이적으로 결합하는 물질(예컨대, 항체, 압타머, 또는 화합물 등)를 이용하여 상기 융합 단백질과 상기 물질(예컨대, 항체 또는 압타머)과의 상호작용, 즉 복합체 형성을 검출하는 통상적인 에세이법, 예컨대, 면역크로마토그래피(Immunochromatography), 면역조직화학염색, 효소결합 면역흡착 분석(enzyme linked immunosorbent assay: ELISA), 방사선 면역측정법(radioimmunoassay: RIA), 효소 면역분석(enzyme immunoassay: EIA), 형광면역분석(Floresence immunoassay: FIA), 발광면역분석(luminescence immunoassay: LIA), 웨스턴블라팅(Western blotting) FACS 등에 의하여 검출할 수 있다.
통상적인 단백질 발현 검출 에세이법으로 면역분석 방법을 수행할 수 있다. 유용한 면역분석은 동종 면역분석 또는 이종 면역분석일 수 있다. 동종 분석에서 그 면역학적 반응은 종종 융합 단백질 특이적 시약 (예를 들어, 융합 단백질 특이적 항체), 그 표지된 분석체, 및/또는 분석 대상 생물 시료가 관련된다. 그 표지로부터 일어나는 신호는 그 표지된 분석체에 항체의 결합에 대하여 직접 또는 간접적으로 변형된다. 면역학적 반응 및 그것의 양의 검출 모두는 동종 용액에서 수행된다. 사용 가능한 면역화학적 표지들은 자유 래디컬, 방사성-동위원소, 형광염료, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.
본 명세서에 기재된 그 방법의 실행에 유용한 항체들은 침전과 같은 공지된 기술에 의하여 진단 분석에 적당한 고체 서포트(예를 들어 라텍스 또는 폴리스티렌과 같은 물질로 제조된 웰, 비드, 플레이트 또는 슬라이드)에 부착될 수 있다. 항체들 또는 다른 융합단백질 결합 시약들은, 공지된 기술에 따라, 방사성표지(예를 들어, 35S, 125I, 131I 등), 효소 표지(예를 들어 호스래디쉬 퍼옥시데이즈, 알칼라인 포스페테이즈, 등), 및 형광 표지들 (예를 들어 흐루르세인 등)과 같은 검출될 수 있는 표지 물질과 부착될 수 있다.
유동세포분석법(flow cytometry; FC)와 같은 세포-기반 분석, 면역-조직화학(IHC), 또는 면역형광법(IF)은 그러한 분석 포맷이 임상적으로 적합하고, 생체내에서 융합 단백질 내의 카이네이즈 폴리펩타이드 발현의 검출을 가능하게 하고 추출물을 덜기 위하여 예를 들어 종양 샘플로부터 얻어진 세포들 조작을 야기하는 활성에서 인위적인 변화의 위험성을 회피할 수 있기에 본 발명의 방법을 실행하는데 특히 바람직하다. 따라서 일부 바람직한 구체 예에서, 본 발명의 방법들은 유동세포분석법(flow cytometry; FC)와 같은 세포-기반 분석, 면역-조직화학(IHC), 또는 면역형광법(IF) 분석 포맷을 고안한다.
유동세포 분석법(FC)은 융합 단백질 내의 카이네이즈 활성을 저해하는 타겟된 약물의 처리 전, 처리 동안 및/또는 처리 후에 포유류 종양에서 융합 단백질 내의 카이네이즈 폴리펩타이드 발현을 결정하기 위하여 채택된 분석법일 수 있다. 예를 들어 골수 샘플로부터 유래한 종양 세포들은 그렇게 하는 것이 바람직하다면 암 세포 타입을 동정하기 위한 마커로 뿐만 아니라 융합 단백질 발현 및/또는 활성화에 대한 유동세포 분석법에 의하여 분석될 수 있다.
면역조직화학(IHC) 염색은 융합 단백질 내의 카이네이즈 활성을 저해하는 타겟된 약물로 처리 전, 처리 동안, 및/또는 처리 후에 포유류 암(예를 들어 NSCLC와 같은 고형암)에서 융합 단백질 내의 카이네이즈 단백질의 발현 및/또는 활성화 상태를 결정하기 위하여 채택된 분석법일 수 있다.
면역형광(IF) 분석은 융합 단백질 내의 카이네이즈 활성을 저해하는 타겟팅된 약물로 처리 전, 처리 동안, 및/또는 처리 후에 포유류 암에서 융합 단백질 내의 카이네이즈 폴리펩타이드의 발현 및/또는 활성화 상태를 결정하기 위하여 채택된 분석법일 수 있다.
이에 더하여, 효소-링크된 면역흡수 분석법(ELISA), 방사성-면역분석(RIA), 형광-활성화된 세포 소팅(FACS) 등을 포함하는 다른 여러 프로토콜들이 당업계에 공지되어 있으며, 융합 단백질 발현의 변경된 또는 비정상적인 레벨을 진단하는 방법도 사용 가능하다.
종양으로부터 유래된 세포들을 포함하는 생물 시료에서 발현된 융합 단백질의 검출/정량화를 위한 AQUA 펩타이드들은 표준 AQUA 분석에서 사용되고 제조될 수 있다. 따라서 본 발명의 방법들의 일부 바람직한 구체예에서, 융합 단백질 특이적 시약은 상술된 것과 같이 융합 단백질 또는 융합 접합점을 포함하는 펩타이드 서열에 해당하는 서열 중 동위원소 표지된 포스포펩타이드(AQUA 펩타이드)를 포함할 수 있다.
또한, 상기 융합 유전자 및/또는 이에 상응하는 mRNA의 검출은 상기 융합 유전자 또는 mRNA와 상호작용하는 물질, 예컨대 혼성화 가능한 핵산 분자 (예컨대, 프로브, 앱타머, 또는 프라이머 등)를 사용하는 통상적인 핵산 검출 방법, 예컨대 PCR(polymerase chain reaction), FISH(fluorescent in situ hybridization), UV 분광법(UV spectrometry), 크로마토그래피법, Warburg-Christian법, Schmidt-Thannhauser-Schneider법 등에 의하여 수행될 수 있으나, 이에 제한되는 것은 아니다. 한 구체예에서, 상기 융합 유전자 및/또는 이에 상응하는 mRNA의 검출은 대규모 병렬 염기서열 분석(massively parallel sequencing) 기술을 통한 전체-전사체(whole-transcriptome; RNA) 또는 전체-게놈(whole-genome; DNA) 시퀀싱의 통합 기술에 의하여 수행될 수 있다. 상기 핵산 분자 검출에 유용한 융합 유전자 또는 mRNA에 특이적인 시약(상호작용하는 물질)들은 생물 시료에서 융합 또는 트런케이트된 폴리펩타이드 발현 전사체와 직접 교잡하고 검출할 수 있는 siRNA, 올리고뉴크레오타이드 또는 DNA 프로브일 수 있다.
상기 환자는 인간을 포함하는 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류를 포함하는 포유류, 구체적으로 인간일 수 있다.
상기 생물 시료는 상기 환자로부터 분리된 세포(예컨대, 폐세포 등), 조직(예컨대, 폐조직 등), 체액(예컨대, 혈액 등) 등일 수 있다. 보다 구체적으로, 본 발명에서 유용한 생물 시료들은 융합 단백질의 발현에 의하여 특징화되는 암(고형암 또는 비고형암)이 존재하거나 발생된 포유류로부터 얻어질 수 있다. 일 구체예에서, 그 포유류는 인간이고 그 인간은 예를 들어 NSCLC와 같은 암의 치료 대상 환자일 수 있다. 그 인간 환자는 검출 대상 융합 단백질 내의 카이네이즈를 억제하는 치료제로 현재 치료 중이거나 또는 치료를 고려하는 환자일 수 있다. 본 발명에서 사용 적합한 생물 시료는 포유류 암으로부터 유래한(또는 분리된) 세포, 조직 또는 이들의 추출물을 포함하는 하는 것일 수 있다.
본 발명의 암 환자에서 특이적으로 발현하는 융합 단백질은 새로운 암 치료 타겟으로서의 사용될 수 있다.
따라서, 본 발명의 또 다른 예는 상기 융합 단백질의 억제제, SCAF11-PDGFRA 융합 유전자의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 유효성분으로 포함하는 암 예방 및/또는 치료용 약학 조성물을 제공한다.
다른 예는 상기 융합 단백질의 억제제, SCAF11-PDGFRA 융합 유전자의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상의 약학적 유효량을 암의 예방 및/또는 치료를 필요로 하는 환자에게 투여하는 단계를 포함하는 암의 예방 및/또는 치료 방법을 제공한다.
또 다른 예는 상기 융합 단백질의 억제제, SCAF11-PDGFRA 융합 유전자의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 포함하는 조성물의 암 예방 및/또는 치료를 위한 용도를 제공한다.
상기 환자는 인간을 포함하는 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류를 포함하는 포유류, 구체적으로 인간일 수 있다.
상기 억제제는 경구 또는 비경구로 투여할 수 있다. 비경구 투여인 경우에는 정맥내 주입, 피하 주입, 근육 주입, 복강 주입, 내피 투여, 국소 투여, 비내 투여, 폐내 투여 또는 직장내 투여 등으로 투여할 수 있다.
본 명세서에 있어서 "약학적 유효량"은 약물이 약학적으로 의미있는 효과를 나타낼 수 있는 양을 의미한다. 1회 투여를 위한 억제제의 약학적 유효량은 제제화 방법, 투여 방식, 환자의 연령, 체중, 성, 병적 상태, 음식, 투여 시간, 투여 간격, 투여 경로, 배설 속도 및 반응 감응성과 같은 요인들에 따라서 다양하게 처방될 수 있다.
상기 융합 단백질의 억제제는 상기 융합 단백질에 결합하여 그 기능을 상실시키거나 저하시키는 물질로서, 상기 융합 단백질에 대한 항체, 압타머, 또는 통상적인 키나제 저해제(티로신 키나제를 포함하는 융합유전자의 경우: CCDC6-ROS1, SCAF11-PDGFRA, FGFR2-CIT, AXL-MBIP, MAP4K3-PRKCE, BCAS3-MAP3K3, ERBB2IP-MAST4), 신호 전달 저해제 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 상기 융합 단백질을 암호화하는 융합 유전자 또는 이에 상응하는 mRNA의 억제제는 상기 DNA 분자에 결합하여, 융합 단백질로 발현하지 못하도록 하는 물질로서, 상기 DNA 분자에 특이적으로 결합하는 siRNA, shRNA, 마이크로RNA, 압타머 등으로 이루어진 군에서 선택된 1종 이상의 것일 수 있다.
상기 암 진단용 조성물, 암 진단에 정보를 제공하는 방법, 및 암의 예방 및/또는 치료용 조성물의 진단 또는 치료 대상이 되는 암은 모든 종류의 고형암일 수 있다. 예컨대 상기 고형암은 폐암, 간암, 대장암, 췌장암, 위암, 유방암, 난소암, 신장암, 갑성선암, 식도암, 전립선암, 뇌암 등일 수 있다. 구체예에서 상기 고형암은 폐암일 수 있으며, 보다 구체적으로 소세포폐암 (small cell lung cancer, SCLC), 또는 폐선암(lung adenocarcinoma), 편평세포폐암(Squamous cell lung carcinoma), 또는 대세포폐암 Large cell lung carcinoma)과 같은 비소세포폐암(non-small cell lung cancer, NSCLC)일 수 있고, 예컨대 폐선암일 수 있다.
또 다른 예는 상기 융합 단백질을 이용한 항암제 스크리닝 방법을 제공한다.
일 구체예에서, 상기 스크리닝 방법은,
상기 융합 단백질 및/또는 상기 SCAF11-PDGFRA 융합 유전자를 발현하는 세포에 후보 물질을 처리하는 단계; 및
상기 세포에서의 융합 단백질 및/또는 상기 융합 유전자의 발현 정도를 측정하는 단계를 포함하고,
상기 후보 물질이 처리된 세포에서의 융합 단백질 및/또는 상기 융합 유전자의 발현 정도가 상기 후보 물질 처리 전 또는 상기 후보 물질이 처리되지 않은 세포와 비교하여 감소한 경우, 상기 후보 물질을 항암제로 결정하는 것을 특징으로 하는 것일 수 있다. 상기 융합 단백질의 발현 정도는 융합 단백질의 수준을 측정하거나, 상기 융합 단백질을 암호화하는 융합 유전자 또는 상기 융합 유전자에 상응하는 mRNA의 수준을 측정하여 측정될 수 있다.
상기 항암제 스크리닝 방법은 상기 후보 물질을 처리하는 단계 이전에, 상기 후보 물질 처리 전 세포 내의 융합 단백질 및/또는 융합 유전자의 발현 정도를 측정하는 단계를 추가로 포함하여, 동일한 세포에서의 후보 물질 처리 후의 융합 단백질 및/또는 융합 유전자의 발현 정도가 후보 물질 처리 전의 융합 단백질 및/또는 융합 유전자의 발현 정도보다 감소한 경우, 상기 후보 물질을 항암제로 결정할 수 있다. 또 다른 예에서, 상기 항암제 스크리닝 방법은 상기 융합 단백질 및/또는 상기 융합 유전자를 발현하는 세포를 준비하고, 이들 세포 중 일부에 후보 화합물을 처리하고, 후보 화합물이 처리된 일부 세포와 후보 물질이 처리되지 않은 나머지 세포에서의 상기 융합 단백질 및/또는 융합 유전자의 발현 정도를 측정하는 단계를 포함하여, 후보 물질이 처리된 세포에서의 융합 단백질 및/또는 융합 유전자의 발현 정도가 후보 물질이 처리되지 않은 세포에서의 융합 단백질 및/또는 융합 유전자의 발현 정도보다 감소한 경우, 상기 후보 물질을 항암제로 결정할 수 있다.
상기 스크리닝 방법에서 사용되는 세포는 상기한 융합 단백질 중 1종 이상이 발현 및/또는 활성화되는 암 (예컨대, 스크리닝하고자 하는 항암제가 항암 활성을 보이기를 소망하는 암)으로부터 유래하는 세포, 상기 세포의 추출물, 또는 상기 세포를 통상의 방법으로 배양한 것을 포함할 수 있다.
상기 융합 단백질 및/또는 융합 유전자를 발현하는 세포는 앞서 설명한 바와 같은 암세포, 특히 고형암 세포, 구체적으로 폐암 세포, 보다 구체적으로 폐선암 세포일 수 있다.
상기 융합 단백질의 발현 수준의 측정은 통상적인 단백질 측정법인 면역크로마토그래피(Immunochromatography), 면역조직화학염색, 효소결합 면역흡착 분석(enzyme linked immunosorbent assay: ELISA), 방사선 면역측정법(radioimmunoassay: RIA), 효소 면역분석(enzyme immunoassay: EIA), 형광면역분석(Floresence immunoassay: FIA), 발광면역분석(luminescence immunoassay: LIA), 웨스턴블라팅(Western blotting), FACS 등에 의하여 수행할 수 있으나, 이에 제한되는 것은 아니다. 상기 융합 유전자 또는 mRNA의 수준은 통상적인 유전자 정량 방법, 예컨대, PCR, FISH, UV 분광법, 크로마토그래피법, Warburg-Christian법, Schmidt-Thannhauser-Schneider법 등에 의하여 측정될 수 있으나, 이에 제한되는 것은 아니다.
상기 후보 물질은 모든 천연 또는 합성 화합물을 포함하는 의미로, 일반 화합물, DNA, RNA, 단백질 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.
후보 물질이 융합 단백질에 의하여 특성화되는 종양의 진행을 저해하는지를 결정하기 위한 방법의 실행에 있어서, 포유류 이종이식 유래 세포들을 포함하는 생물 시료를 채택할 수 있다. 바람직한 이종이식(또는 이식 수용체)는 융합 단백질을 발현하는 인간 종양 세포 시료 또는 상기 세포들을 가지는 마우스와 같은 작은 포유류일 수 있다. 포유류 암 종양으로부터 유래한 세포들을 포함하는 생물학적 샘플에서 융합 단백질의 존재 또는 발현을 평가하는데 있어서, 그러한 전위 및/또는 융합 단백질이 발생하지 않는 세포를 대조군으로 채택할 수 있다. 바람직하게는 대조군 시료는 상기한 바와 같은 융합 단백질 발현이 존재하지 않는 동일 조직의 정상 세포 (예컨대 종양 주변의 정상 세포), 또는 상기 융합 단백질이 발현되지 아니하는 특정 암(예를 들어 NSCLC)에서 유래하는 암세포들을 포함할 수 있다.
상기 스크리닝 방법에 의하여 개발된 항암제의 치료 대상 암 종류는 상기한 바와 같다.
본 발명에서 제공되는 폐암, 특히 폐선암에서 특이적으로 발현하는 융합 단백질 및/또는 이를 암호화하는 DNA 분자/mRNA는 폐암 진단 마커 및 더 나아가 치료 타겟으로서 유용하다.
이하, 본 발명을 실시예에 의해 상세히 설명한다.
단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.
실시예 1: 암시료의 준비
서울대학병원 및 서울카톨릭성모병원에서 엽절제술(lobectomy)을 받은 환자로부터 얻은 일차 폐선암 수술 표본 200개를 수집하였다(서울대학병원: n=164; 2010년부터 20119월까지, 서울카톨릭성모병원: n=36; 2009년~2011년 동안 tissue bank에 기탁된 샘플들). 본 발명자들의 이전 연구(Ju YS et al.Genome Res. 2012 22:436-445)로부터 20명의 환자가 이 시험군에 포함되었다. 각각의 환자에 대하여, 진단, 성별, 암단계 및 흡연 상태를 기록하였다. 암환자 200명 중에서, 여성 및 비흡연자의 비율은 각각 54.5% (n=109) 및 58.0% (n=116) 이었다.
이전 보고된 방법(Ju YS et al.Genome Res. 2012 22:436-445)에 의하여, 200개의 폐선암 조직의 서브셋에서의 잘 알려진 3개의 핵심 돌연변이에 대한 스크리닝 유전자 시험을 수행하였다(EGFR 의 엑손 18-21은 PCR 및 Sanger sequencing (n=164)에 의하여 시험; KRAS의 exon 2는 PCR 및 Sanger sequencing (n=37)에 의하여 시험; EML4-ALK 융합 유전자는 형광 in-situ 혼성화(fluorescent in-situ hybridization)(FISH; n=163)에 의하여 시험; Supplementary Figure 1; Supplementary Table 1). 200개의 암조직 중에서 100개는 EGFR (n=99), KRAS (n=6) 및 EML4-ALK (n=7) 중 하나의 핵심 돌연변이에 대하여 양성이었다. 이들 돌연변이는 2개 샘플(1 EGFR + KRAS + 및 1 EGFR + EML4-ALK +)을 제외하고 실질적으로 상호 배타적이었다. 나머지 90개에서의 핵심 돌연변이는 알려지지 않았다.
이들 90개 샘플을 RNA 시퀀싱의 타겟으로 하였다. RNA quality control(RNA Integrity Number(RIN) Standardization of RNA Quality Control: Agilent Tech.)을 통과하지 못한 3개의 샘플을 제외하고, 나머지 87개 폐선암 샘플로부터 mRNA 서열을 얻었다. 그리고 나서, 인접한 정상 폐조직의 전사체(transcriptome; n=77) 및 전체 엑솜(whole-exome; n=76) 시퀀싱을 수행하여 암조직 및 정상조직을 비교하였다 (Supplementary Table 1). 모든 시퀀싱 시험은 "Ju YS et al.Genome Res. 2012 22:436-445"에 기재된 방법에 따라서 수행하였다.
164개 샘플 (87개의 암조직 샘플 및 77개의 대응 정상 조직 샘플; Supplementary Table 2)로부터 14,038,673,860 paired-end 101bp-long reads를 생성하였다. 평균적으로, RNA 시퀀싱 처리량(throughputs)은 암조직 및 정상 조직에 대하여 각각 9.77 및 7.38 Gbp이었다. 76개 정상 조직의 전체-엑솜 시퀀싱에서, 타겟팅 부위에 대하여 paired-정상 조직당 32.96?read depth를 얻었다.
실시예 2: 융합 유전자 분석
그리고 난 후, 최근 몇몇 전이(transforming) 융합 유전자들이 핵심 돌연변이로서 폐선암에서 검출되고 있기 때문에, 융합 유전자 검출에 초점을 두었다. "Ju YS et al.Genome Res. 2012 22:436-445"에 기재된 유전자 융합 프로그램(GFP)을 이용하여, 87개 암조직 샘플로부터 45개의 인-프레임 융합 전사체를 동정하였다.
전사체 (transcriptome) 시퀀싱을 이용한 융합유전자 검출을 위하여, 약 300bp 길이의 cDNA 조각의 양쪽 말단 101bp씩을 차세대 서열 분석법(Ju YS et al.Genome Res. 2012 22:436-445)으로 서열을 규명하고, 양쪽 말단이 상이한 유전자 서열로 구성되어 있는 불일치 서열 (discordant read)을 찾아내었다. 또한 한쪽 말단 서열이 융합 유전자의 분점(breakpoint)으로부터 생성됨으로써 상이한 두 유전자 서열의 조합으로 되어있는 엑손-스패닝 서열 (exon-spanning read) 을 찾아내었다. 불일치 서열과 엑손-스패닝 서열은 모두 융합 유전자의 존재를 시사하는 서열이다. 불일치 서열과 엑손-스패닝 서열을 모두 가지고 있는 한쌍의 유전자를 최종 융합 유전자 후보로 선정하였고, 이 가운데 아미노산 서열 상 원래 유전자의 코돈 프레임이 유지되는 인-프레임 융합 유전자를 최종 폐암 융합 유전자로 선정하였다.
이들 45개 전사체의 융합된 유전자와 각 유전자가 위치하는 염색체와 각 유전자 간 거리를 아래의 표 47에 정리하였다.
표 47
Index DonorGene AcceptorGene Chromosome(Donor;Acceptor) Distance (Mb)
1 EML4 ALK chr2;chr2 12.252
2 KIF5B RET chr10;chr10 11.227
2 KIF5B RET chr10;chr10 11.227
2 KIF5B RET chr10;chr10 11.227
2 KIF5B RET chr10;chr10 11.227
3 CD74 ROS1 chr5;chr6 Interchromosomal
4 SLC34A2 ROS1 chr4;chr6 Interchromosomal
5 CCDC6 ROS1 chr10;chr6 Interchromosomal
6 SCAF11 PDGFRA chr12;chr4 Interchromosomal
7 FGFR2 CIT chr10;chr12 Interchromosomal
8 AXL MBIP chr19;chr14 Interchromosomal
9 APLP2 TNFSF11 chr11;chr13 Interchromosomal
10 MAP4K3 PRKCE chr2;chr2 6.215
11 BCAS3 MAP3K3 chr17;chr17 2.23
12 KRAS CDH13 chr12;chr16 Interchromosomal
13 ZFYVE9 CGA chr1;chr6 Interchromosomal
14 ERBB2IP MAST4 chr5;chr5 0.515
15 TPD52L1 TRMT11 chr6;chr6 0.723
16 TXNRD1 GPR133 chr12;chr12 26.694
17 SRSF4 SNRNP40 chr1;chr1 2.224
18 EDA MID1 chrX;chrX 57.984
19 HYOU1 C11orf93 chr11;chr11 7.736
20 SLC16A7 MUCL1 chr12;chr12 4.831
21 MIER2 ITGB1BP3 chr19;chr19 3.588
22 RBM14 FGF3 chr11;chr11 3.211
23 UBR4 ATP13A2 chr1;chr1 2.063
24 TTC19 ATPAF2 chr17;chr17 1.989
25 IGSF3 MAN1A2 chr1;chr1 0.7
26 XAF1 FAM64A chr17;chr17 0.305
27 IL6ST KDM1B chr5;chr6 Interchromosomal
28 UBE2E1 ASCC3 chr3;chr6 Interchromosomal
29 XRCC1 MAL chr19;chr2 Interchromosomal
30 BRWD1 CCDC46 chr21;chr17 Interchromosomal
31 SPTLC3 MAOA chr20;chrX Interchromosomal
32 UTRN OS9 chr6;chr12 Interchromosomal
33 LOC100306951 NUP93 chr17;chr16 Interchromosomal
34 MGAT5 HNMT chr2;chr2 3.515
35 MAP3K3 PECAM1 chr17;chr17 0.623
36 CMBL C8orf38 chr5;chr8 Interchromosomal
37 ITGB1BP3 DNM2 chr19;chr19 6.886
38 LSM14A SIPA1L3 chr19;chr19 3.677
39 RAB21 FRS2 chr12;chr12 2.175
40 ARHGEF16 TCTEX1D4 chr1;chr1 41.874
41 MMP14 H19 chr14;chr11 Interchromosomal
42 H19 CALR chr11;chr19 Interchromosomal
43 SFTPB DPYSL2 chr2;chr8 Interchromosomal
44 SFTPA2 SFTPB chr10;chr2 Interchromosomal
45 FTL SFTPA2 chr19;chr10 Interchromosomal
하기의 표 48에 상기 45개 전사체의 donor 부위의 절단 지점(전사체 기준으로 3'-말단 절단 지점), 절단 지점에 해당하는 아미노산 서열, 및 절단 지점이 위치하는 엑손을 각 유전자 (변형체 포함) 별로 나타내었다.
표 48
Index Donor Breakpoint(RNA) Donor protein sequence near breakpoint Donor exon number
1 chr2:42522656] TPGKGPK+1nt EML4(NM_001145076,+strand),exon12(chr2:42522521-42522656;EML4(NM_019063,+strand),exon13(chr2:42522521-42522656;
2 chr10:[32317356 NNDVK KIF5B(NM_004521,-strand),exon15(chr10:32317356-32317499;
2 chr10:[32306980 KVHKQ KIF5B(NM_004521,-strand),exon23(chr10:32306980-32307084;
2 chr10:[32317356 NNDVK KIF5B(NM_004521,-strand),exon15(chr10:32317356-32317499;
2 chr10:[32317356 NNDVK KIF5B(NM_004521,-strand),exon15(chr10:32317356-32317499;
3 chr5:[149784243 DAPPK+1nt CD74(NM_004355,-strand),exon6(chr5:149784243-149784330;CD74(NM_001025159,-strand),exon6(chr5:149784243-149784330;
4 chr4:25678324] SREAQ+1nt SLC34A2(NM_006424,+strand),exon13(chr4:25677757-25680366;SLC34A2(NM_001177998,+strand),exon13(chr4:25677757-25680366;SLC34A2(NM_001177999,+strand),exon13(chr4:25677757-25680366;
5 chr10:[61572393 AAQLQ+1nt CCDC6(NM_005436,-strand),exon5(chr10:61572393-61572553;
6 chr12:[46384136 5UTR SRSF2IP(NM_004719,-strand),exon1(chr12:46384136-46384401;
7 chr10:[123243212 LTLTTNE FGFR2(NM_001144914,-strand),exon14(chr10:123243212-123243317;FGFR2(NM_001144916,-strand),exon14(chr10:123243212-123243317;FGFR2(NM_001144915,-strand),exon16(chr10:123243212-123243317;FGFR2(NM_001144917,-strand),exon15(chr10:123243212-123243317;FGFR2(NM_001144918,-strand),exon15(chr10:123243212-123243317;FGFR2(NM_022970,-strand),exon17(chr10:123243212-123243317;FGFR2(NM_000141,-strand),exon17(chr10:123243212-123243317;FGFR2(NM_001144913,-strand),exon16(chr10:123243212-123243317;FGFR2(NM_001144919,-strand),exon16(chr10:123243212-123243317;
8 chr19:41765701] LTAAE AXL(NM_021913,+strand),exon20(chr19:41765458-41767670;AXL(NM_001699,+strand),exon19(chr19:41765458-41767670;
9 chr11:130000061] AAQMKSQ APLP2(NM_001642,+strand),exon11(chr11:129999933-130000061;APLP2(NM_001142276,+strand),exon11(chr11:129999933-130000061;APLP2(NM_001142278,+strand),exon7(chr11:129999933-130000061;APLP2(NM_001142277,+strand),exon10(chr11:129999933-130000061;APLP2(NR_024516,+strand),exon8(chr11:129999933-130000061;APLP2(NR_024515,+strand),exon8(chr11:129999933-130000061;
10 chr2:[39664033 TYGDVYK MAP4K3(NM_003618,-strand),exon1(chr2:39664033-39664219;
11 chr17:59161925] TVIDAAS+1nt BCAS3(NM_017679,+strand),exon22(chr17:59161828-59161925;BCAS3(NM_001099432,+strand),exon23(chr17:59161828-59161925;
12 chr12:[25378548 TSAKTRQ KRAS(NM_004985,-strand),exon4(chr12:25378548-25378707;KRAS(NM_033360,-strand),exon4(chr12:25378548-25378707;
13 chr1:52803606] DKNVSK+2nt ZFYVE9(NM_007324,+strand),exon15(chr1:52803444-52803606;ZFYVE9(NM_004799,+strand),exon16(chr1:52803444-52803606;
14 chr5:65372777] QPGDKIIQ ERBB2IP(NM_018695,+strand),exon24(chr5:65372703-65372777;ERBB2IP(NM_001006600,+strand),exon23(chr5:65372703-65372777;
15 chr6:125569529] SKKFGDM+2nt TPD52L1(NM_003287,+strand),exon4(chr6:125569428-125569529;TPD52L1(NM_001003396,+strand),exon4(chr6:125569428-125569529;TPD52L1(NM_001003397,+strand),exon4(chr6:125569428-125569529;TPD52L1(NM_001003395,+strand),exon4(chr6:125569428-125569529;
16 chr12:104733051] IHPVCAE TXNRD1(NM_001093771,+strand),exon16(chr12:104732917-104733051;TXNRD1(NM_003330,+strand),exon14(chr12:104732917-104733051;TXNRD1(NM_182729,+strand),exon14(chr12:104732917-104733051;TXNRD1(NM_182743,+strand),exon13(chr12:104732917-104733051;TXNRD1(NM_182742,+strand),exon13(chr12:104732917-104733051;
17 chr1:[29485886 SRCSWQDLK SRSF4(NM_005626,-strand),exon3(chr1:29485886-29485998;
18 chrX:68836548] DSQDGHQ EDA(NM_001005610,+strand),exon1(chrX:68835911-68836548;EDA(NM_001005613,+strand),exon1(chrX:68835911-68836548;EDA(NM_001399,+strand),exon1(chrX:68835911-68836548;EDA(NM_001005609,+strand),exon1(chrX:68835911-68836548;EDA(NM_001005612,+strand),exon1(chrX:68835911-68836548;
19 chr11:[118921747 SGVLSLDR HYOU1(NM_006389,-strand),exon14(chr11:118921747-118921885;HYOU1(NM_001130991,-strand),exon14(chr11:118921747-118921885;
20 chr12:60098799] LAVMYAG+1nt SLC16A7(NM_004731,+strand),exon2(chr12:60098553-60098799;
21 chr19:[325635 LNRHCEK+1nt MIER2(NM_017550,-strand),exon7(chr19:325635-325704;
22 chr11:66384528] IECDVVK+1nt RBM14(NM_006328,+strand),exon1(chr11:66384053-66384528;
23 chr1:[19523635 LSCLYA+1nt UBR4(NM_020765,-strand),exon8(chr1:19523635-19523759;
24 chr17:15930016] AAVLMHR+1nt TTC19(NM_017775,+strand),exon9(chr17:15929854-15930016;
25 chr1:117156387] VVNVQPT+1nt IGSF3(NM_001542,-strand),exon4(chr1:117156387-117156797;IGSF3(NM_001007237,-strand),exon4(chr1:117156387-117156797;
26 chr17:6663920] EQAQLGK+1nt XAF1(NM_017523,+strand),exon4(chr17:6663725-6663920;XAF1(NM_199139,+strand),exon3(chr17:6663725-6663920;
27 chr5:[55290612 5UTR IL6ST(NM_175767,-strand),exon1(chr5:55290612-55290821;IL6ST(NM_002184,-strand),exon1(chr5:55290612-55290821;IL6ST(NM_001190981,-strand),exon1(chr5:55290612-55290821;
28 chr3:23847579] 5UTR UBE2E1(NM_003341,+strand),exon1(chr3:23847439-23847579;UBE2E1(NM_182666,+strand),exon1(chr3:23847439-23847579;
29 chr19:[44079062 TISVVLQ XRCC1(NM_006297,-strand),exon2(chr19:44079062-44079154;
30 chr21:[40604103 WRKMDLR BRWD1(NM_018963,-strand),exon25(chr21:40604103-40604210;BRWD1(NM_033656,-strand),exon25(chr21:40604103-40604210;
31 chr20:13074224] IRIFKHN+1nt SPTLC3(NM_018327,+strand),exon6(chr20:13074131-13074224;
32 chr6:144820563] LDTEISWAK UTRN(NM_007124,+strand),exon33(chr6:144820393-144820563;
33 chr17:1420387] 5UTR LOC100306951(NR_028514,+strand),exon1(chr17:1420213-1420387;
34 chr2:135028121] LEKINVA+1nt MGAT5(NM_002410,+strand),exon2(chr2:135027957-135028121;
35 chr17:61723434] EHNGER+2nt MAP3K3(NM_002401,+strand),exon3(chr17:61723394-61723434;MAP3K3(NM_203351,+strand),exon4(chr17:61723394-61723434;
36 chr5:[10307737 5UTR CMBL(NM_138809,-strand),exon1(chr5:10307737-10308168;
37 chr19:3942267] ASQQDS+2nt ITGB1BP3(NM_170678,+strand),exon8(chr19:3942081-3942412;
38 chr19:34663668] NSTVALAK+1nt LSM14A(NM_015578,+strand),exon1(chr19:34663352-34663668;LSM14A(NM_001114093,+strand),exon1(chr19:34663352-34663668;
39 chr12:72176438] LFLDLCK+1nt RAB21(NM_014999,+strand),exon6(chr12:72176350-72176438;
40 chr1:3392626] QLDFSKVK ARHGEF16(NM_014448,+strand),exon10(chr1:3392534-3392626;
41 chr14:23316426] 3UTR MMP14(NM_004995,+strand),exon10(chr14:23314917-23316802;
42 chr11:[2018179 noncoding H19(NR_002196,-strand),exon1(chr11:2017748-2019065;
43 chr2:[85885042 3UTR SFTPB(NM_000542,-strand),exon12(chr2:85884441-85886805;SFTPB(NM_198843,-strand),exon12(chr2:85884441-85885978;
44 chr10:[81319068 GDPGPP+1nt SFTPA2(NM_001098668,-strand),exon3(chr10:81319068-81319262;
45 chr19:49468806] NYSTDVE FTL(NM_000146,+strand),exon1(chr19:49468566-49468866;
하기의 표 49에 상기 45개 전사체의 acceptor 부위의 절단 지점(전사체 기준으로 5'-말단 절단 지점), 절단 지점에 해당하는 아미노산 서열, 및 절단 지점이 위치하는 엑손을 각 유전자 (변형체 포함) 별로 나타내었다.
표 49
Index Acceptor Breakpoint(RNA) Acceptor protein sequence near breakpoint Acceptor exon number
1 chr2:29446394] 2nt+YRRKHQE ALK(NM_004304,-strand),exon20(chr2:29446208-29446394;
2 chr10:[43612032 EDPKWEF RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179;
2 chr10:[43612032 EDPKWEF RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179;
2 chr10:[43612032 EDPKWEF RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179;
2 chr10:[43612032 EDPKWEF RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179;
3 chr6:117645578] 2nt+DFWIP ROS1(NM_002944,-strand),exon34(chr6:117645495-117645578;
4 chr6:117650609] 2nt+GVPNK ROS1(NM_002944,-strand),exon32(chr6:117650492-117650609;
5 chr6:117642557] 2nt+WHRRL ROS1(NM_002944,-strand),exon35(chr6:117642422-117642557;
6 chr4:[55124924 5UTR, in-frame PDGFRA(NM_006206,+strand),exon2(chr4:55124924-55124984;
7 chr12:120180269] AHRDEIQ CIT(NM_007174,-strand),exon23(chr12:120180216-120180269;
8 chr14:36783814] IDRRI MBIP(NM_016586,-strand),exon4(chr14:36783718-36783814;MBIP(NM_001144891,-strand),exon4(chr14:36783718-36783814;
9 chr13:[43174888 ELQHIVG TNFSF11(NM_033012,+strand),exon5(chr13:43174888-43174933;TNFSF11(NM_003701,+strand),exon3(chr13:43174888-43174933;
10 chr2:[46070139 IDLEPEGR PRKCE(NM_005400,+strand),exon2(chr2:46070139-46070202;
11 chr17:61710041] 2nt+EQEALNS MAP3K3(NM_002401,+strand),exon2(chr17:61710041-61710162;MAP3K3(NM_203351,+strand),exon2(chr17:61710041-61710162;
12 chr16:[83158990 DIFKFAR CDH13(NM_001257,+strand),exon4(chr16:83158990-83159106;
13 chr6:87797925] 5UTR, in-frame CGA(NM_000735,-strand),exon2(chr6:87797831-87797925;
14 chr5:[66400194 ATAQMEER MAST4(NM_001164664,+strand),exon10(chr5:66400194-66400403;MAST4(NM_015183,+strand),exon9(chr5:66400194-66400403;
15 chr6:[126342306 1nt+YTEEMVP TRMT11(NM_001031712,+strand),exon12(chr6:126342306-126342426;
16 chr12:[131561346 TRKQHS GPR133(NM_198827,+strand),exon14(chr12:131561346-131561419;
17 chr1:31744346] VWDLRQN SNRNP40(NM_004814,-strand),exon6(chr1:31744226-31744346;
18 chrX:10463731] VNASRQE MID1(NM_001193277,-strand),exon4(chrX:10463624-10463731;MID1(NM_000381,-strand),exon4(chrX:10463624-10463731;MID1(NM_033289,-strand),exon4(chrX:10463624-10463731;MID1(NM_001098624,-strand),exon4(chrX:10463624-10463731;MID1(NM_033290,-strand),exon4(chrX:10463624-10463731;MID1(NM_001193278,-strand),exon4(chrX:10463624-10463731;MID1(NM_001193279,-strand),exon3(chrX:10463624-10463731;MID1(NM_001193280,-strand),exon3(chrX:10463624-10463731;
19 chr11:[111175653 5 UTR C11orf93(NM_001136105,+strand),exon3(chr11:111175653-111175707;
20 chr12:[55248900 2nt+NPTTAAPAD MUCL1(NM_058173,+strand),exon2(chr12:55248900-55248941;
21 chr19:[3942081 2nt+YLDGMKS ITGB1BP3(NM_170678,+strand),exon8(chr19:3942081-3942412;
22 chr11:69631191] 2nt+ILEITAV FGF3(NM_005247,-strand),exon2(chr11:69631088-69631191;
23 chr1:17332273] 2nt+SSPLVG ATP13A2(NM_001141973,-strand),exon2(chr1:17332179-17332273;ATP13A2(NM_022089,-strand),exon2(chr1:17332179-17332273;ATP13A2(NM_001141974,-strand),exon2(chr1:17332179-17332273;
24 chr17:17931973] 2nt+RKRFYQN ATPAF2(NM_145691,-strand),exon2(chr17:17931929-17931973;
25 chr1:[118035769 2nt+HTSVGGLGD MAN1A2(NM_006699,+strand),exon9(chr1:118035769-118035884;
26 chr17:[6348396 5UTR, in-frame FAM64A(NM_001195228,+strand),exon2(chr17:6348396-6348724;FAM64A(NM_019013,+strand),exon2(chr17:6348396-6348724;
27 chr6:[18215238 KKHSVLM KDM1B(NM_153042,+strand),exon16(chr6:18215238-18215360;
28 chr6:100966018] AMLDVAAN ASCC3(NM_006828,-strand),exon38(chr6:100965867-100966018;
29 chr2:[95713704 IFGGLVW MAL(NM_022438,+strand),exon2(chr2:95713704-95713871;MAL(NM_002371,+strand),exon2(chr2:95713704-95713871;
30 chr17:63685336] VLQDELE CCDC46(NM_001037325,-strand),exon4(chr17:63685247-63685336;CCDC46(NM_145036,-strand),exon24(chr17:63685247-63685336;
31 chrX:[43542761 2nt+LSAAKLL MAOA(NM_000240,+strand),exon2(chrX:43542761-43542855;
32 chr12:[58109543 FLCDEGA OS9(NM_006812,+strand),exon6(chr12:58109543-58109753;OS9(NM_001017956,+strand),exon6(chr12:58109543-58109753;OS9(NM_001017957,+strand),exon6(chr12:58109543-58109753;OS9(NM_001017958,+strand),exon6(chr12:58109543-58109753;
33 chr16:[56870513 PGVIDKF NUP93(NM_014669,+strand),exon17(chr16:56870513-56870629;
34 chr2:[138758488 2nt+EIDLQIL HNMT(NM_006895,+strand),exon3(chr2:138758488-138758595;
35 chr17:62401205] unidentified PECAM1(NM_000442,-strand),exon1(chr17:62399864-62401205;
36 chr8:[96044223 5UTR C8orf38(NM_152416,+strand),exon2(chr8:96044223-96044322;
37 chr19:[10870414 1nt+DFLPRGS DNM2(NM_001190716,+strand),exon2(chr19:10870414-10870487;DNM2(NM_004945,+strand),exon2(chr19:10870414-10870487;DNM2(NM_001005361,+strand),exon2(chr19:10870414-10870487;DNM2(NM_001005362,+strand),exon2(chr19:10870414-10870487;DNM2(NM_001005360,+strand),exon2(chr19:10870414-10870487;
38 chr19:[38519729 5UTR SIPA1L3(NM_015073,+strand),exon2(chr19:38519729-38519796;
39 chr12:[69924645 5UTR FRS2(NM_006654,+strand),exon2(chr12:69924645-69924740;FRS2(NM_001042555,+strand),exon3(chr12:69924645-69924740;
40 chr1:45272510] 5UTR TCTEX1D4(NM_001013632,-strand),exon1(chr1:45272456-45272957;
41 chr11:2018689] noncoding H19(NR_002196,-strand),exon1(chr11:2017748-2019065;
42 chr19:[13054527 AAEKQMK CALR(NM_004343,+strand),exon9(chr19:13054527-13055304;
43 chr8:[26501052 1nt+SPPLSPD DPYSL2(NM_001386,+strand),exon9(chr8:26500955-26501111;
44 chr2:85885494] 3UTR SFTPB(NM_000542,-strand),exon12(chr2:85884441-85886805;SFTPB(NM_198843,-strand),exon12(chr2:85884441-85885978;
45 chr10:81316285] 3UTR SFTPA2(NM_001098668,-strand),exon6(chr10:81315609-81317341;
이들 중에서, 22개 (48.9%)는 염색체내 융합(intra-chromosomal fusions)이었다. cDNA의 PCR 증폭 및 Sanger sequencing을 이용하여 30개의 선별된 융합 유전자 중에서 29개(1-29번)를 validating하였다 (표 50 참조).
표 50
DonorGene AcceptorGene Forward Primer Name Forward Primer Sequence Reverse Primer Name Reverse Primer Sequence
1 KIF5B RET GF1_KIF5B:RET_F TAAGGAAATGACCAACCACCAG GF1_KIF5B:RET_R CCTTGACCACTTTTCCAAATTC
2 KRAS CDH13 GF2_KRAS:CDH13_F GGAAATAAATGTGATTTGCCTTC GF2_KRAS:CDH13_R AAGGCTGTCTCTGATTCTCTGG
3 APLP2 TNFSF11 GF3_APLP2:TNFSF11_F TGCTGAGAACAAAGATCGCTTA GF3_APLP2:TNFSF11_R TGTCGGTGGCATTAATAGTGAG
4 ZFYVE9 CGA GF4_ZFYVE9:CGA_F ACTGCAGAGAACATGGATTCCT GF4_ZFYVE9:CGA_R GAATGGAGAACATGCAGAAACA
5 CCDC6 ROS1 GF5_CCDC6:ROS1_F CCTGCAGGAAAAATTAGACCAG GF5_CCDC6:ROS1_R AGCTCAGCCAACTCTTTGTCTT
6 FGFR2 CIT GF6_FGFR2:CIT_F ACATGATGATGAGGGACTGTTG GF6_FGFR2:CIT_R ACAGCTGTTACGAAGAGCATCA
7 AXL MBIP GF7_AXL:MBIP_F GCCTGACGAAATCCTCTATGTC GF7_AXL:MBIP_R CAAAATTCCCTGACGTTGTTTT
8 SCAF11 PDGFRA GF8_SCAF11:PDGFRA_F CAGCGGAGTCAGTGTCCTAGAG GF8_SCAF11:PDGFRA_R TGAGAAGACAGCCTAAGACCAG
9 CD74 ROS1 GF9_CD74:ROS1_F GTCTTTGAGAGCTGGATGCAC GF9_CD74:ROS1_R AGCTCAGCCAACTCTTTGTCTT
10 SLC34A2 ROS1 GF10_SLC34A2:ROS1_F ATGCCGTCGTCTCCAAGTTC GF10_SLC34A2:ROS1_R ATCTTCAGCTTTCTCCCACTGT
11 TXNRD1 GPR133 GF11_TXNRD1:GPR133_F TCCAAATGCTGGAGAAGTTACA GF11_TXNRD1:GPR133_R AGTACACGAAGACTCGGTTGCT
12 EML4 ALK GF12_EML4:ALK_F GCCAAAATTTGTGCAGTGTTTA GF12_EML4:ALK_R GGAGCTTGCTCAGCTTGTACTC
13 HYOU1 C11orf93 GF13_HYOU1:C11orf93_F CCAGAATCTGACCACAGTGAAG GF13_HYOU1:C11orf93_R AGAAGATGGTGCAACTGGGTCT
14 MAP4K3 PRKCE GF14_MAP4K3:PRKCE_F AGGAGGACTTCGAGCTGATTC GF14_MAP4K3:PRKCE_R ACGACCCTGAGAGATCGATGA
15 RBM14 FGF3 GF15_RBM14:FGF3_F CCAAGGCCTCTTAATACTTGGA GF15_RBM14:FGF3_R CATAGAGTCGTCCCCTCTTGTT
16 BCAS3 MAP3K3 GF16_BCAS3:MAP3K3_F CATCCCGTCCAGTCTCTGAT GF16_BCAS3:MAP3K3_R CTGCCTATTTGAGTGACCTGTG
17 SRSF4 SNRNP40 GF17_SRSF4:SNRNP40_F GAAGTGGCCGAGATAAATATGG GF17_SRSF4:SNRNP40_R TAAACTCAGGCCAGTCACTGAA
18 UBR4 ATP13A2 GF18_UBR4:ATP13A2_F ACCCTTTCTCTACCTGTGTTGG GF18_UBR4:ATP13A2_R AGCTGAGGGGATCTATTGATGT
19 TTC19 ATPAF2 GF19_TTC19:ATPAF2_F CGCTTTGATGAGGCCTATATTT GF19_TTC19:ATPAF2_R CTGTGTGATGCTGACATTCTGA
20 TPD52L1 TRMT11 GF20_TPD52L1:TRMT11_F GAAAACACATGAAACCCTGAGTC GF20_TPD52L1:TRMT11_R ATGTGTGACTGGAAAGCTTCTG
21 IGSF3 MAN1A2 GF21_IGSF3:MAN1A2_F CTGACCAGGGCGAATTCTACT GF21_IGSF3:MAN1A2_R TCTTGCCTCATGGTCTGTTTTA
22 ERBB2IP MAST4 GF22_ERBB2IP:MAST4_F AACAAGGGTACAACCTGAAGGA GF22_ERBB2IP:MAST4_R TCAAGGAAGTATCGTGAGGTGA
23 XAF1 FAM64A GF23_XAF1:FAM64A_F GGAGCTCCACGAGTCCTACTGT GF23_XAF1:FAM64A_R AGAGGTCTCCTGATGGCTGAC
24 MIER2 ITGB1BP3 GF24_MIER2:ITGB1BP3_F AGATCATGGTGGGACCTCAGT GF24_MIER2:ITGB1BP3_R AGCAGCGAGTTCTGAATGTCTT
25 SLC16A7 MUCL1 GF25_SLC16A7:MUCL1_F GTGGTTGGAGCAGCTTTTATCT GF25_SLC16A7:MUCL1_R TCATCATCAGCAGGACCAGTAG
26 ITGB1BP3 DNM2 GF26_ITGB1BP3:DNM2_F CCTGGAAGACATTCAGAACTCG GF26_ITGB1BP3:DNM2_R TTTGAGAAGATGAGCTGCAGAA
27 ARHGEF16 TCTEX1D4 GF27_ARHGEF16:TCTEX1D4_F GCATGGAGCAGATGTACACG GF27_ARHGEF16:TCTEX1D4_R TGTGTTTTAGAACAAGTGGATCAGA
28 CMBL C8orf38 GF29_CMBL:C8orf38_F CTCTCCCAGGAGGCTACGACT GF29_CMBL:C8orf38_R TGAGCCAGTTCCACATTAAAGG
29 EDA MID1 GF30_EDA:MID1_F TGACGTTGTGCTGCTACCTAGA GF30_EDA:MID1_R ATCTGTCGTCTTTGCTGAATGA
30 H19 CALR GF28_H19:CALR_F CACCGCAATTCATTTAGTAGCA GF28_H19:CALR_R GCCTCTCTACAGCTCGTCCTT
실시예 3: 융합 유전자 확인
게놈 DNA 및 cDNA에 대한 Sanger sequencing 및 PCR 증폭에 의하여 상기 발견된 사항을 확인하였다.
RNeasy 미니 키트(Qiagen)를 사용하여 종양 샘플로부터 RNA를 추출하는데 사용하였다. DNA는 DNeasy 티슈 키트(Qiagen)를 사용하여 추출하였다. RT-PCR을 위하여, 첫째 가닥 cDNA는 올리고(dT)20을 가지는 SuperScript TM III 첫째 가닥 합성 시스템(Invitrogen)으로 2.5mg의 전체 RNA으로부터 합성하였다. 그 다음에 각 융합 유전자를 해당 프라이머 쌍(상기 표 50 참조)을 사용하여 증폭하였다. 각각의 프라이머 쌍 및 Taq DNA polymerase 하이 피델리티(Invitrogen)를 사용하여 PCR로 유전자 증폭을 수행하였다.
PCR 반응은 95 ℃에서 10분간, 95 ℃에서 30초간-62 ?에서 30초간-72 ?에서 30초간을 30 사이클, 및 최종적으로 72 ?에서 10 분간 수행하였다. 게놈 결실 검출용 PCR 및 Sanger sequencing 프라이머는 다음과 같다: 5'- AACAAGGGTACAACCTGAAGGA-3' 및 5'-TCAAGGAAGTATCGTGAGGTGA-3'. 융합 전사체용 프라이머는 다음과 같다: 5'-AACAAGGGTACAACCTGAAGGA-3' 및 5'-TCAAGGAAGTATCGTGAGGTGA-3'. 모든 Sanger sequencing 시험은 Macrogen Inc. 매뉴얼에 따라서 수행하였다 (http://www.macrogen.com).
실시예 5: 융합 단백질 저해제의 포유류 고형 종양의 성장 저해 확인 시험
본 발명에서 제안되는 융합 단백질들이 이러한 융합단백질을 발현하는 세포주 또는 종양에서 성장 및 생존을 추진하는 것을 확인하기 위하여, 그 세포들을 각 융합 단백질 내 카이네이즈 또는 다른 도메인의 저해제로 처리하였다. ?
융합단백질을 발현하는 세포의 세포수를 계산하고, 세포 성장 저해 분석은 제조업자가 제안하는 것에 따라 CellTiter 96 AQueous 원 용액 세포 증식 분석(Promega)으로 수행하였다. 간략하게 설명하면, 1000에서 5000 세포들을 프랫-바텀 96-웰 플레이트 상에 시딩하고 10% FBS를 가지는 완전 배지에서 성장시켰다. 24 시간 후, 그 세포 배지를 각각의 융항 단백질에 대한 저해 약제를 다양한 농도로 포함하는 10% FBS를 가지는 100㎕ 완전 성장 배지로 교체하고, 72 시간 동안 더 배양하였다. 각 약제 농도는 세포들의 세 동일한(triplicate) 웰에 적용하였다. 배양 종결 시기에서, 20 ㎕의 CellTiter 96 AQueous 원 용액은 각 웰에 첨가하고 그 플레이트는 1-4 시간 동안 배양하였다. 흡광도는 마이크로플레이트 리더를 사용하여 490nm에서 판독하였다. 성장 저해는 처리된 세포들 대비 처리된 세포들로부터 판독한 흡광도의 평균 ± SD 값으로 표현될 수 있다. 이와 같은 분석은 적어도 3회 반복하였다. 그러한 분석으로부터 융합 단백질들이 발현되는 인간 NSCLC 종양들의 서브세트의 성장 및 생존을 추진하는지를 확인하고, 그러한 세포들은 타겟된 저해제를 사용하여 융합 단백질 내 카이네이즈의 활성 또는 다른 도메인의 활성을 저해하여 저해될 수 있다는 것을 확인할 수 있을 것이다.
실시예 6: 융합 단백질의 형질전환된 포유류 세포주의 성장 및 생존 촉진 확인 시험
NIH 3T3 세포들을 각 융합 단백질의 코딩 cDNA를 포함하는 구조체로 형질전환시켜서 융합 단백질을 발현시킴으로써, 본 발명에서 제안된 융합 단백질의 발현이 정상세포를 암 표현형으로 형질전환시킬 수 있는지를 확인하였다. 간략하게 설명하면, 세포들을 10% 우태혈청(FBS) (Sigma) 및 1.0 ng/ml IL-3 (R&D Systems)을 가지는 RPMI-1640 배지(Invitrogen)에서 유지하였다. 레트로바이러스 상등액의 생성 및 트랜스팩션은 전에 알려진 것과 같이 수행하였다. NIH3T3 세포들은 pMXs-puro/융합 단백질 발현 벡터를 포함하는 레트로바이러스 상등액으로 트랜스덕션하고, puromycin(2ug/ml)에 대하여 선택하였다. 다음, 소프트 아가에서 성장하는 형질전환된 세포들의 능력을 측정하였다. 그러한 분석은 융합 단백질의 발현이 NIH3T3 세포를 형질전환할 수 있고, 이들 세포들을 융합 단백질에 의하여 소프트 아가상에서 생존 및 성장이 촉진됨을 확인할 수 있고, 형질전환된 세포들에서 이들 융합 단백질의 발현의 저해는 감소된 생존성 및 증가된 아팝토시스를 야기한다는 것을 나타낸다.

Claims (37)

  1. 다음으로 이루어진 군에서 선택된 융합 단백질:
    APLP2 (amyloid beta (A4) precursor-like protein 2) 단백질 또는 그의 단편과 C-말단에 TNFSF11 (tumor necrosis factor (ligand) superfamily, member 11) 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질;
    MAP4K3 (mitogen-activated protein kinase kinase kinase kinase3) 단백질 또는 그의 단편과 C-말단에 PRKCE (protein kinase C, epsilon) 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질;
    BCAS3 (breast carcinoma amplified sequence3) 단백질 또는 그의 단편과 C-말단에 MAP3K3 (mitogen activated protein kinase kinase kinase3) 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질;
    N-말단에 KRAS (Ki-ras2 Kirsten rat sarcoma viral oncogene homolog) 단백질 또는 그의 단편과 C-말단에 CDH13 (cadherin 13, H-cadherin) 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질;
    ZFYVE9 (zinc finger, FYVE domain containing 9) 단백질 또는 그의 단편과 C-말단에 CGA (glycoprotein hormones, alpha polypeptide) 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질;
    N-말단에 ERBB2IP (Erbb2 interacting protein) 단백질 또는 그의 단편과 C-말단에 MAST4(Microtubule-associated serine/threonine-protein kinase 4) 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질;
    TPD52L1 (tumor protein D52-like1) 단백질 또는 그의 단편과 C-말단에 (tRNA methyl transferase11 homolog) 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질;
    TXNRD1 (thioredoxin reductase1) 단백질 또는 그의 단편과 C-말단에 GPR133 (G protein-coupled receptor 133) 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질; 및
    상기 융합 단백질 1종 이상의 조합.
  2. 제1항에 있어서,
    상기 APLP2-TNFSF11 융합 단백질에서, 상기 APLP2 단백질의 단편은 NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, 또는 NR_024515의 첫 번째 엑손부터 엑손 12까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 TNFSF11 단백질의 단편은 NM_033012 또는 NM_003701의 엑손 6부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,
    상기 MAP4K3-PRKCE 융합 단백질에서, 상기 MAP4K3 단백질의 단편은 NM_003618의 엑손 1의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 PRKCE 단백질의 단편은 NM_005400의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,
    상기 BCAS3-MAP3K3 융합 단백질에서, 상기 BCAS3 단백질의 단편은 NM_017679 또는 NM_001099432의 첫 번째 엑손에서 엑손 23까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 MAP3K3 단백질의 단편은 NM_002401 또는 NM_203351의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,
    상기 KRAS-CDH13 융합 단백질에서, 상기 KRAS 단백질의 단편은 NM_004985 또는 NM_033360의 첫 번째 엑손부터 엑손 4까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 CDH13 단백질의 단편은 NM_001257의 엑손 5부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,
    상기 ZFYVE9-CGA 융합 단백질에서, 상기 ZFYVE9 단백질의 단편은 NM_007324 또는 NM_004799의 첫 번째 엑손에서 엑손 16까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 CGA 단백질의 단편은 NM_000735의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,
    상기 ERBB2IP-MAST4 융합 단백질에서, 상기 ERBB2IP 단백질의 단편은 NM_001006600 또는 NM_018695의 첫 번째 엑손부터 엑손 26까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 MAST4 단백질의 단편은 NM_001164664 또는 NM_015183의 엑손 13부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,
    상기 TPD52L1-TRMT11 융합 단백질에서, 상기 TPD52L1 단백질의 단편은 NM_003287, NM_001003396, NM_001003397, 또는 NM_001003395의 첫 번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 TRMT11 단백질의 단편은 NM_001031712의 엑손 12부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,
    상기 TXNRD1-GPR133 융합 단백질에서 상기 TXNRD1 단백질의 단편은 NM_003330, NM_001093771, NM_182729, NM_182743, 또는 NM_182742의 첫 번째 엑손에서 엑손 17까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 GPR133 단백질의 단편은 NM_198827의 엑손 14부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것인,
    융합 단백질.
  3. 제1항에 있어서,
    상기 APLP2-TNFSF11 융합 단백질은 5' 말단에 NM_001642의 158번째부터 1741번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_033012의 698번째부터 1264번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,
    상기 MAP4K3-PRKCE 융합 단백질은 5' 말단에 NM_003618의 326번째부터 421번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_005400의 546번째부터 2411번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이며,
    상기 BCAS3-MAP3K3 융합 단백질은 5' 말단에 NM_001099432의 110번째부터 2579번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002401의 324번째부터 2200번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,
    상기 KRAS-CDH13 융합 단백질은 5' 말단에 NM_004985의 182번째부터 631번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001257의 666번째부터 2441번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이며,
    상기 ZFYVE9-CGA 융합 단백질은 5' 말단에 NM_007324의 173번째부터 3828번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_000735의 136번째부터 493번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,
    상기 ERBB2IP-MAST4 융합 단백질은 5' 말단에 NM_001006600 의 311번째부터 4111번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001164664의 1455번째부터 8180번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이며,
    상기 TPD52L1-TRMT11 융합 단백질은 5' 말단에 NM_001003395의 328번째부터 626번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001031712의 122번째부터 1513번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,
    상기 TXNRD1-GPR133 융합 단백질은 5' 말단에 NM_003330의 656번째부터 2242번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_198827의 2203번째부터 3184번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것인,
    융합 단백질.
  4. 제3항에 있어서,
    상기 융합 단백질은 서열번호 63, 79, 95, 111, 126, 142, 158, 및 174로 이루어진 군에서 선택된 아미노산 서열을 갖는 것인,
    융합 단백질.
  5. 제1항 내지 제4항 중 어느 한 항의 융합 단백질을 암호화하는 융합 유전자.
  6. 제5항에 있어서,
    상기 융합 유전자는 서열번호 61, 77, 93, 109, 124, 140, 156, 및 172로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인, 융합 유전자.
  7. SCAF11 (SR-related CTD-associated factor 11) 유전자의 5UTR부위 및 PDGFRA (platelet-derived growth factor receptor, alpha polypeptide) 유전자 또는 그의 단편이 융합된 SCAF11-PDGFRA 융합 유전자.
  8. 제7항에 있어서,
    상기 SCAF11 유전자의 5UTR부위는 NM_004719의 엑손 1의 뉴클레오타이드 서열을 갖는 것이고,
    PDGFRA 유전자의 단편은 NM_006206의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열을 갖는 것인,
    융합 유전자.
  9. 제7항에 있어서,
    5' 말단에 NM_004719의 1번째부터 266번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_006206의 320번째부터 3601번째까지의 뉴클레오타이드 서열을 포함하는, 융합 유전자.
  10. 제9항에 있어서,
    상기 융합 유전자는 서열번호 180의 뉴클레오타이드 서열을 갖는 것인,
    융합 유전자.
  11. 제1항 내지 제4항 중 어느 한 항의 융합 단백질과 상호작용하는 물질, 및
    상기 융합 단백질을 암호화하는 융합 유전자, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA와 상호작용하는 물질
    로 이루어진 군에서 선택된 1종 이상을 포함하는,
    암 진단용 조성물.
  12. 제11항에 있어서,
    상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질에 결합하는 항체 및 압타머로 이루어진 군에서 선택된 1종 이상의 것이고,
    상기 융합 유전자 또는 이에 상응하는 mRNA와 상호작용하는 물질은
    상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개의 염기로 이루어진 폴리뉴클레오타이드 단편 또는 이에 상응하는 mRNA 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편 또는 mRNA 단편의 양 말단에 인접하는 20 내지 100개의 염기서열 또는 이의 상보적인 서열과 혼성화 가능한 프라이머쌍;
    상기 융합 유전자 내의 융합 부위 또는 이에 상응하는mRNA 부위와 혼성화 가능한 5 내지 100 bp 길이의 안티센스 올리고뉴클레오타이드, 프로브, 및 앱타머
    로 이루어진 군에서 선택된 1종 이상이고,
    상기 융합 부위는 서열번호 62, 78, 94, 110, 126, 141, 157, 173 및 181로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인,
    암 진단용 조성물.
  13. 제12항에 있어서,
    상기 프라이머쌍은
    서열번호 184 및 서열번호 185의 프라이머쌍;
    서열번호 190 및 서열번호 191의 프라이머쌍;
    서열번호 192 및 서열번호 193의 프라이머쌍;
    서열번호 194 및 서열번호 195의 프라이머쌍;
    서열번호 196 및 서열번호 197의 프라이머쌍;
    서열번호 198 및 서열번호 199의 프라이머쌍;
    서열번호 200 및 서열번호 201의 프라이머쌍;
    서열번호 202 및 서열번호 203의 프라이머쌍; 및
    서열번호 204 및 서열번호 205의 프라이머쌍
    으로 이루어진 군에서 선택된 1종 이상인,
    암 진단용 조성물.
  14. 제11항에 있어서, 상기 암은 고형암인, 암 진단용 조성물.
  15. 제14항에 있어서, 상기 암은 폐암인, 암 진단용 조성물.
  16. 제15항에 있어서, 상기 암은 비소세포성 폐암(NSCLC)인, 암 진단용 조성물.
  17. 환자로부터 분리된 생물학적 시료에서 제1항의 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, 제7항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA를 검출하는 단계를 포함하고,
    상기 융합 단백질, 융합 유전자 또는 mRNA가 검출되면 상기 환자를 암 환자로 결정하는 것을 특징으로 하는,
    암 진단 방법.
  18. 제17항에 있어서, 상기 검출하는 단계는,
    상기 생물 시료에 상기 융합 단백질, 상기 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA로 이루어진 군에서 선택된 1종 이상과 상호작용하는 물질을 첨가하고 반응시키는 단계; 및
    상기 얻어진 반응물을 검출하는 단계
    를 포함하는 것인,
    암 진단 방법.
  19. 제18항에 있어서,
    상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질에 결합하는 항체 및 압타머로 이루어진 군에서 선택된 것이고,
    상기 융합 단백질을 암호화하는 융합 유전자 또는 이에 상응하는 mRNA와 상호작용하는 물질은,
    상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개의 염기로 이루어진 폴리뉴클레오타이드 단편 또는 이에 상응하는 mRNA 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편 또는 mRNA 단편의 양 말단에 인접하는 20 내지 100개의 염기서열 또는 이의 상보적인 서열과 혼성화 가능한 프라이머쌍;
    상기 융합 유전자 내의 융합 부위 또는 이에 상응하는mRNA 부위와 혼성화 가능한 5 내지 100 bp 길이의 안티센스 올리고뉴클레오타이드, 프로브, 및 앱타머
    로 이루어진 군에서 선택된 1종 이상이고,
    상기 융합 부위는 서열번호 62, 78, 94, 110, 125, 141, 157, 173, 및 181로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인,
    암 진단 방법.
  20. 제19항에 있어서,
    상기 프라이머쌍은 서열번호 184 및 서열번호 185의 프라이머쌍;
    서열번호 190 및 서열번호 191의 프라이머쌍;
    서열번호 192 및 서열번호 193의 프라이머쌍;
    서열번호 194 및 서열번호 195의 프라이머쌍;
    서열번호 196 및 서열번호 197의 프라이머쌍;
    서열번호 198 및 서열번호 199의 프라이머쌍;
    서열번호 200 및 서열번호 201의 프라이머쌍;
    서열번호 202 및 서열번호 203의 프라이머쌍; 및
    서열번호 204 및 서열번호 205의 프라이머쌍
    으로 이루어진 군에서 선택된 1종 이상인,
    암 진단 방법.
  21. 제17항에 있어서, 상기 암은 고형암인, 암 진단 방법.
  22. 제21항에 있어서, 상기 암은 폐암인, 암 진단 방법.
  23. 제22항에 있어서, 상기 암은 비소세포성 폐암(NSCLC)인, 암 진단에 정보를 제공하는 방법.
  24. 암 진단 마커로 사용하기 위한 제1항 내지 제4항 중 어느 한 항의 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA.
  25. 암 진단에 사용하기 위한 제1항 내지 제4항 중 어느 한 항의 융합 단백질과 상호작용하는 물질, 및 상기 융합 단백질을 암호화하는 융합 유전자, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA와 상호작용하는 물질로 이루어진 군에서 선택된 1종 이상을 포함하는 조성물.
  26. 제25항에 있어서,
    상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질에 결합하는 항체 및 압타머로 이루어진 군에서 선택된 것이고,
    상기 융합 유전자 또는 이에 상응하는 mRNA와 상호작용하는 물질은
    상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개의 염기로 이루어진 폴리뉴클레오타이드 단편 또는 이에 상응하는 mRNA 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편 또는 mRNA 단편의 양 말단에 인접하는 20 내지 100개의 염기서열 또는 이의 상보적인 서열과 혼성화 가능한 프라이머쌍;
    상기 융합 유전자 내의 융합 부위 또는 이에 상응하는mRNA 부위와 혼성화 가능한 5 내지 100 bp 길이의 안티센스 올리고뉴클레오타이드, 프로브, 및 앱타머
    로 이루어진 군에서 선택된 1종 이상이고,
    상기 융합 부위는 서열번호 62, 78, 94, 110, 125, 141, 157, 173, 및 181로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인,
    조성물.
  27. 제26항에 있어서,
    상기 프라이머쌍은
    서열번호 184 및 서열번호 185의 프라이머쌍;
    서열번호 190 및 서열번호 191의 프라이머쌍;
    서열번호 192 및 서열번호 193의 프라이머쌍;
    서열번호 194 및 서열번호 195의 프라이머쌍;
    서열번호 196 및 서열번호 197의 프라이머쌍;
    서열번호 198 및 서열번호 199의 프라이머쌍;
    서열번호 200 및 서열번호 201의 프라이머쌍;
    서열번호 202 및 서열번호 203의 프라이머쌍; 및
    서열번호 204 및 서열번호 205의 프라이머쌍
    으로 이루어진 군에서 선택된 1종 이상인,
    조성물.
  28. 제25항 내지 제27항 중 어느 한 항에 있어서, 상기 암은 고형암인, 조성물.
  29. 제28항에 있어서, 상기 암은 폐암인, 조성물.
  30. 제29항에 있어서, 상기 암은 비소세포성 폐암(NSCLC)인, 조성물.
  31. 제1항 내지 제4항 중 어느 한 항의 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, 또는 제7항 내지 제10항 중 어느 한 항의 융합 유전자를 포함하는 세포에 후보 물질을 처리하는 단계; 및
    상기 세포에서의 상기 융합 단백질 또는 상기 융합 유전자의 수준을 측정하는 단계를 포함하고,
    상기 후보 물질이 처리된 세포에서의 상기 융합 단백질 또는 상기 융합 유전자의 수준이 상기 후보 물질 처리 전 또는 상기 후보 물질이 처리되지 않은 세포와 비교하여 감소한 경우, 상기 후보 물질을 항암제로 결정하는 것을 특징으로 하는,
    항암제 스크리닝 방법.
  32. 제1항 내지 제4항 중 어느 한 항의 융합 단백질의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 제7항 내지 제10항 중 어느 한 항의 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 유효성분으로 포함하는, 암 예방 또는 치료용 조성물.
  33. 제32항에 있어서,
    상기 융합 단백질의 억제제는 상기 융합 단백질에 대한 항체, 압타머, 키나제 저해제, 및 신호 전달 저해제로 이루어진 군에서 선택된 1종 이상이고,
    상기 융합 유전자 또는 mRNA의 억제제는 상기 융합 유전자 또는 mRNA에 특이적으로 결합하는 siRNA, shRNA, 마이크로 RNA, 및 압타머로 이루어진 군에서 선택된 1종 이상인, 암 예방 또는 치료용 조성물.
  34. 제1항의 융합 단백질의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 제7항의 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 암의 예방 또는 치료를 필요로 하는 환자에게 투여하는 단계를 포함하는, 암 예방 또는 치료 방법.
  35. 제34항에 있어서,
    상기 융합 단백질의 억제제는 상기 융합 단백질에 대한 항체, 압타머, 키나제 저해제, 및 신호 전달 저해제로 이루어진 군에서 선택된 1종 이상이고,
    상기 융합 유전자 또는 mRNA의 억제제는 상기 융합 유전자 또는 mRNA에 특이적으로 결합하는 siRNA, shRNA, 마이크로 RNA, 및 압타머로 이루어진 군에서 선택된 1종 이상인, 암 예방 또는 치료 방법.
  36. 암의 예방 또는 치료에 사용하기 위한 제1항 내지 제4항 중 어느 한 항의 융합 단백질의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 포함하는 조성물.
  37. 제37항에 있어서,
    상기 융합 단백질의 억제제는 상기 융합 단백질에 대한 항체, 압타머, 키나제 저해제, 및 신호 전달 저해제로 이루어진 군에서 선택된 1종 이상이고,
    상기 융합 유전자 또는 mRNA의 억제제는 상기 융합 유전자 또는 mRNA에 특이적으로 결합하는 siRNA, shRNA, 마이크로 RNA, 및 압타머로 이루어진 군에서 선택된 1종 이상인, 조성물.
PCT/KR2013/008066 2012-09-07 2013-09-06 융합 단백질 및 이를 포함하는 암 진단용 조성물 WO2014038884A1 (ko)

Applications Claiming Priority (18)

Application Number Priority Date Filing Date Title
KR1020120099611A KR20140033617A (ko) 2012-09-07 2012-09-07 Kras를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
KR10-2012-0099619 2012-09-07
KR1020120099620A KR20140033622A (ko) 2012-09-07 2012-09-07 Map3k3를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
KR10-2012-0099617 2012-09-07
KR1020120099622A KR20140033286A (ko) 2012-09-07 2012-09-07 Mast4를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
KR10-2012-0099621 2012-09-07
KR10-2012-0099612 2012-09-07
KR1020120099619A KR20140033621A (ko) 2012-09-07 2012-09-07 Map4k3를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
KR10-2012-0099618 2012-09-07
KR1020120099613A KR20140033619A (ko) 2012-09-07 2012-09-07 Zfyve9를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
KR10-2012-0099622 2012-09-07
KR10-2012-0099620 2012-09-07
KR10-2012-0099613 2012-09-07
KR1020120099618A KR20140033620A (ko) 2012-09-07 2012-09-07 Txnrd1을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
KR1020120099621A KR20140033623A (ko) 2012-09-07 2012-09-07 Tpd52l1을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
KR1020120099612A KR20140033618A (ko) 2012-09-07 2012-09-07 Aplp2를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
KR1020120099617A KR20140033285A (ko) 2012-09-07 2012-09-07 Pdgfra를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
KR10-2012-0099611 2012-09-07

Publications (1)

Publication Number Publication Date
WO2014038884A1 true WO2014038884A1 (ko) 2014-03-13

Family

ID=50237417

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2013/008066 WO2014038884A1 (ko) 2012-09-07 2013-09-06 융합 단백질 및 이를 포함하는 암 진단용 조성물

Country Status (1)

Country Link
WO (1) WO2014038884A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016081450A1 (en) * 2014-11-18 2016-05-26 Blueprint Medicines Corporation Prkacb fusions

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100130527A1 (en) * 2008-11-18 2010-05-27 Lehrer Raphael Individualized cancer treatment
EP2327798A1 (en) * 2004-05-14 2011-06-01 Rosetta Genomics Ltd MicroRNAs and uses thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2327798A1 (en) * 2004-05-14 2011-06-01 Rosetta Genomics Ltd MicroRNAs and uses thereof
US20100130527A1 (en) * 2008-11-18 2010-05-27 Lehrer Raphael Individualized cancer treatment

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DIRNHOFER, STEPHAN ET AL.: "Selective expression of trophoblastic hormones by lung carcinoma: neurendocrine tumors exclusively produce human chorionic gonadotropin a- subunit (hCG a)", HUMAN PATHOLOGY, vol. 31, no. 9, August 2000 (2000-08-01), pages 966 - 972 *
JU, YOUNG SEOK ET AL.: "A transforming KIF5B and RET gene fusion in lung adenocarcinoma revealed from whole-genome and transcriptome sequencing", GENOME RESEARCH, vol. 22, no. 3, March 2012 (2012-03-01), pages 436 - 445 *
MCDERMOTT, ULTAN ET AL.: "Ligand-dependent platelet-derived growth factor receptor (PDGFR)-a activation sensitizes rare lung cancer and sarcoma cells to PDGFR kinase inhibitors", CANCER RESEARCH, vol. 69, no. 9, May 2009 (2009-05-01), pages 3937 - 3946 *
RIELY, GREGORY J. ET AL.: "KRAS mutations in non-small cell lung cancer", PROCEEDINGS OF THE AMERICAN THORACIC SOCIETY, vol. 6, no. 2, April 2009 (2009-04-01), pages 201 - 205 *
SEO, JEONG-SUN ET AL.: "The transcriptional landscape and mutational profile of lung adenocarcinoma", GENOME RESEARCH, vol. 22, no. 11, 13 September 2012 (2012-09-13), pages 2109 - 2119 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016081450A1 (en) * 2014-11-18 2016-05-26 Blueprint Medicines Corporation Prkacb fusions

Similar Documents

Publication Publication Date Title
WO2016036172A1 (ko) 단백질 키나제 억제제에 대한 감수성 예측용 바이오 마커 및 이의 용도
US20160333418A1 (en) Activin Inhibitor Response Prediction and Uses for Treatment
US20090191548A1 (en) Methods and nucleic acids for the analysis of gene expression associated with tissue classification
JP2002534055A (ja) ヒト遺伝子および遺伝子発現産物v
WO2012014795A1 (ja) 新規ret融合体の検出法
WO2014038890A1 (ko) Axl을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
JP2011254830A (ja) 結腸癌に関するポリヌクレオチド
WO2016018088A1 (ko) Met 저해제에 대한 감수성 예측용 신규한 바이오 마커 및 이의 용도
LEE et al. Functional characterization of WT1 binding sites within the human vitamin D receptor gene promoter
Brenner et al. Translocations in epithelial cancers
Abdel‐Rahman et al. Somatic FGF9 mutations in colorectal and endometrial carcinomas associated with membranous β‐catenin
Ahmed et al. A murine Zic3 transcript with a premature termination codon evades nonsense-mediated decay during axis formation
WO2015108328A1 (ko) 대장암 마커로서의 신규 ntrk1 융합유전자 및 이의 용도
WO2014038884A1 (ko) 융합 단백질 및 이를 포함하는 암 진단용 조성물
WO2014038888A1 (ko) Ros1을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
WO2014038887A1 (ko) Fgfr2을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물
Perez Jurado et al. The human calcitonin receptor gene (CALCR) at 7q21. 3 is outside the deletion associated with the Williams syndrome
US20170334966A1 (en) Anti-tumor antibody-tumor suppressor fusion protein compositions and methods of use for the treatment of cancer
WO2023219447A1 (ko) 세포외 소포체 유래 mirna를 검출하는 제제를 포함하는 난소암 진단용 조성물
WO2023068404A1 (ko) Eml4-alk 양성 비소세포폐암 환자의 치료 약물 선택을 위한 정보 제공 방법 및 alk 저해제 내성 비소세포폐암 치료용 조성물
WO2011118967A2 (ko) 간세포암종의 예후 진단용 단일 염기 다형성
Charest The ROS1 Receptor Family
Vaidya Role of DNA methylation in WNT5A promoter B expression in osteosarcoma cells
Gherardi Myc-mediated control of gene transcription in cancer cells
WO2001070982A2 (en) Brca-1 regulators and methods of use

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13835440

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13835440

Country of ref document: EP

Kind code of ref document: A1