WO2014038884A1 - 융합 단백질 및 이를 포함하는 암 진단용 조성물 - Google Patents
융합 단백질 및 이를 포함하는 암 진단용 조성물 Download PDFInfo
- Publication number
- WO2014038884A1 WO2014038884A1 PCT/KR2013/008066 KR2013008066W WO2014038884A1 WO 2014038884 A1 WO2014038884 A1 WO 2014038884A1 KR 2013008066 W KR2013008066 W KR 2013008066W WO 2014038884 A1 WO2014038884 A1 WO 2014038884A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- protein
- fusion
- seq
- fragment
- exon
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57484—Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4711—Alzheimer's disease; Amyloid plaque core protein
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4747—Apoptosis related proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/59—Follicle-stimulating hormone [FSH]; Chorionic gonadotropins, e.g. HCG; Luteinising hormone [LH]; Thyroid-stimulating hormone [TSH]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70575—NGF/TNF-superfamily, e.g. CD70, CD95L, CD153, CD154
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/72—Receptors; Cell surface antigens; Cell surface determinants for hormones
- C07K14/723—G protein coupled receptor, e.g. TSHR-thyrotropin-receptor, LH/hCG receptor, FSH receptor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/82—Translation products from oncogenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0036—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/10—Screening for compounds of potential therapeutic value involving cells
Abstract
융합 단백질의 암 진단 마커 및/또는 치료 타겟으로서의 용도와 관련된 것으로, 서로 다른 두 개의 단백질 단편이 융합된 융합 단백질, 상기 융합 단백질과 상호작용하는 물질을 포함하는 암 진단용 조성물, 이를 이용하여 암 진단에 정보를 제공하는 방법, 상기 융합 단백질의 억제제를 포함하는 암 예방 및/또는 치료용 조성물, 및 융합 단백질을 이용한 암 치료제 스크리닝 방법이 제공된다.
Description
융합 단백질의 암 진단 마커 및/또는 치료 타겟으로서의 용도와 관련된 것으로, 융합 단백질, 상기 융합 단백질과 상호작용하는 물질을 포함하는 암 진단용 조성물, 이를 이용하여 암 진단에 정보를 제공하는 방법, 상기 융합 단백질의 억제제를 포함하는 암 예방 및/또는 치료용 조성물, 및 융합 단백질을 이용한 항암제 스크리닝 방법에 관한 것이다.
폐암은 인간에게 있어서 가장 흔하게 발병하는 암 중 하나이며, 세계적으로 암 관련 사망의 주된 원인이 되고 있다. 저선량 컴퓨터 단층촬영 스크리닝 기법이 도입되면서 초기 진단 비율이 높아지고 있지만, 폐암은 여전히 예후가 매우 좋지 않은 치명적인 질병이다. 폐암은 조직병리학적 관점에서 다음과 같이 분류될 수 있다: 폐선암은 비흡연자 또는 소량 흡연자 및 여성 환자에서도 빈번하게 발생하는 가장 흔한 유형이다. 과거 10년 동안, 폐선암은 폐암 연구의 중심이 되어 왔으며, 본 발명에서의 폐선암에 대한 이해는 병리학, 분자생물학, 유전학, 방사선학 및 임상 치료를 포함하는 모든 측면에서 진전된 것이다.
특히, 수반되는 주요한 유전적 변형(alterations)과 신호 경로의 이해의 진전은 기본적인 유전적 변화에 기초한 폐선암의 재분류를 제안한다. 핵심 돌연변이(driver mutations)라 불리는 이러한 유전적 변형을 갖는 암세포들은 이러한 변형을 갖지 않는 세포들과 비교하여 생존 및 성장에 있어서 이점을 갖는다. 핵심 돌연변이는 카이네이즈와 같은 신호화 단백질을 암호화하는 유전자에 발생하며, 이는 종양 발생을 개시하고 유지하는 구성적으로 활성이 있는 생존 신호를 발생시킬 수 있다. 현재, 폐선암에 있어서 약 10개의 핵심 돌연변이가 알려져 있으며, 이들 변형을 타겟팅하는 몇몇 약물이 최근 시험에서 주목할만한 성과를 보이는 것으로 보고되어 있다. 예컨대, 상피성장인자(EGFR) 타이로신 카이네이즈 억제제인 게피티닙(gefitinib)은 반응 응답률이 약 70%정도이며, EGFR-활성화 변이를 갖는 환자가 10개월 동안 종양 진행 없이 생존할 수 있도록 하였으며, 이러한 결과는 최근의 임상시험 중인 백금 기반 이중 화학요법 (platinum-based doublet chemotherapy)보다 우수한 효과이다. 역형성림프종 카이네이즈(anaplastic lymphoma kinase; ALK) 및 MET 타이로신 카이네이즈에 대한 이중 억제제인 크리조티닙(Crizotinib)은 ALK 융합 유전자를 포함하는 폐암 환자에 효과가 있는 것으로 입증되었다. 이와 같은 중추적인 연구들로부터, 폐선암의 치료 전략은 조직 기반 접근에서 핵심 돌연변이 관련 치료법으로 옮겨가고 있다. 최근 많은 연구에도 불구하고, 폐선암의 약 40%의 분자 수준 조종자(driver)가 아직 밝혀지지 않고 있다. 흥미롭게, 몇몇 핵심 돌연변이의 발생 빈도는 민족간 상당한 차이가 있으며, 따라서 폐암의 새로운 신약 타겟(druggable targets) 및 표적 치료를 개발하기 위하여 광범위한 유전적 연구가 필요한 것으로 나타났다.
이에 본 발명자들은 인간 고형 종양, 특히 폐암에서 특이적으로 서로 다른 두 개의 단백질의 전부 또는 일부가 융합된 형태의 융합 단백질의 발현 및/또는 이를 암호화하는 유전자의 존재가 관찰됨을 확인하여 본 발명을 완성하였다.
따라서, 본 발명의 일례는 다음으로 이루어진 군에서 선택되는 융합 단백질을 제공한다:
APLP2 단백질 또는 그의 단편과 TNFSF11 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질;
MAP4K3 단백질 또는 그의 단편과 PRKCE 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질;
BCAS3 단백질 또는 그의 단편과 MAP3K3 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질;
KRAS 단백질 또는 그의 단편과 CDH13 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질;
ZFYVE9 단백질 또는 그의 단편과 CGA 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질;
ERBB2IP 단백질 또는 그의 단편과 MAST4 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질;
TPD52L1 단백질 또는 그의 단편과 TRMT11 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질; 및
TXNRD1 단백질 또는 그의 단편과 GPR133 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질.
다른 예는 NM_004719의 엑손 1의 뉴클레오타이드 서열로 이루어진 SCAF11의 5UTR 부위와 NM_006206의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열로 이루어진 PDGFRA 유전자 단편이 융합된 SCAF11-PDGFRA 융합 유전자를 제공한다.
또 다른 예는 상기 융합 단백질을 암호화하는 융합 유전자를 제공한다.
상기 융합 단백질 또는 융합 유전자는 암 진단 마커로 사용 가능하다.
또 다른 예는 상기 융합 단백질 및/또는 상기 융합 단백질을 암호화하는 융합 유전자 및/또는 SCAF11-PDGFRA 융합 유전자 및/또는 상기 융합 유전자에 상응하는 mRNA와 상호작용하는 물질을 포함하는 암 진단용 약학 조성물을 제공한다.
또 다른 예는 환자로부터 얻은 생물 시료에서 상기 융합 단백질 및/또는 상기 융합 단백질을 암호화하는 융합 유전자 및/또는 SCAF11-PDGFRA 융합 유전자 및/또는 상기 융합 유전자에 상응하는 mRNA를 검출하는 단계를 포함하는 암 진단 방법 또는 암 진단에 정보를 제공하는 방법을 제공한다.
또 다른 예는 상기 융합 단백질 억제제 및/또는 상기 융합 단백질을 암호화하는 융합 유전자의 억제제 및/또는 SCAF11-PDGFRA 융합 유전자의 억제제, 및/또는 상기 융합 유전자에 상응하는 mRNA의 억제제를 유효성분으로 포함하는 암 예방 및/또는 치료용 약학 조성물을 제공한다.
또 다른 예는 상기 융합 단백질 억제제 및/또는 상기 융합 단백질을 암호화하는 융합 유전자의 억제제 및/또는 SCAF11-PDGFRA 융합 유전자의 억제제, 및/또는 상기 융합 유전자에 상응하는 mRNA의 억제제를 암의 예방 또는 치료를 필요로 하는 환자에게 투여하는 단계를 포함하는, 암 예방 또는 치료 방법을 제공한다.
또 다른 예는 상기 융합 단백질 억제제 및/또는 상기 융합 단백질을 암호화하는 융합 유전자의 억제제 및/또는 SCAF11-PDGFRA 융합 유전자의 억제제, 및/또는 상기 융합 유전자에 상응하는 mRNA의 억제제를 포함하는 조성물의 암의 예방 또는 치료에 사용하기 위한 용도를 제공한다.
또 다른 예는 상기 융합 단백질 또는 SCAF11-PDGFRA 융합 유전자를 발현하는 세포에 후보 물질을 처리하여 융합 단백질 발현 수준을 측정하는 단계를 포함하고, 상기 후보 물질을 처리하기 전 또는 후보 물질을 처리하지 않은 세포와 비교하여 상기 융합 단백질 또는 융합 유전자의 발현 수준이 감소한 경우, 상기 후보물질을 항암제로 선택하는 것을 특징으로 하는, 항암제 스크리닝 방법을 제공한다.
암 환자에게 적절하게 표적화된 요법을 적용하기 위하여 암의 분자적 특성을 이해하는 것이 중요하다. 유전자 발현, 점돌연변이, 융합 유전자, 대체적 스플라이싱(alternative splicing) 등의 암의 전반적인 유전적 기초를 이해하기 위한 효과적인 수단 중 하나로 대규모의 parallel RNA sequencing을 들 수 있다.
이에, 본 발명자들은 대표적인 고형암인 폐암을 대상으로 연구하였다. 구체적으로, 한국인 환자로부터 얻은 200개의 폐선암 수술 표본에서 유전적 변형을 광범위하게 조사하였으며, 이 중에서 87개는 대응하는 인접 정상 조직 샘플에 대한 전사체 시퀀싱(transciptome sequencing)(n=77) 및 전체 엑솜 시퀀싱(whole-exome sequencing)(n=76)과 조합된 전사체 시퀀싱에 의하여 분석하여, 폐암에 특이적인 융합단백질을 확인하여 본 발명을 완성하였다. 전사체 시퀀싱은, 체세포 점돌연변이 뿐 아니라 융합 유전자 및 대체적 스플라이싱(alternative splicing)과 같은 이상 RNA 변이체를 시험할 수 있기 때문에, 암에서의 핵심 돌연변이를 검출하는 적합한 방법이다. 유전자 기술의 진전에 의하여 암의 광범위한 게놈 분석이 가능해졌지만, 본 발명은 RNA 시퀀싱을 사용한 최초의 대규모 폐선암 연구이다.
보다 구체적으로, 한국인 환자로부터 얻어진 87개의 외과 수술 표본의 전사체(transcriptome)를, 77개의 인접하는 정상 조직의 엑솜(exome) 및 RNA 시퀀싱 결과와 조합하여 분석하였다. 유전자 발현 양상은 흡연자로부터 얻은 암조직에서 보다 강한 변태(perturbation)를 나타낸다. 또한, EGFR, KRAS, NRAS, BRAF, PIK3CA, MET 및 CTNNB1와 같은 transforming gene들에서의 체세포 돌연변이를 확인하였다. EGFR 돌연변이 빈도는 한국인 환자에게서 극단적으로 높게(~60%) 나타났으며, 이는 아시아인들에서 우세한 EGFR의 반수체형(haplotype)에 의하여 설명될 수 있다. 본 발명자들은 ALK, RET, ROS1 및 다른 타이로신 카이네이즈 유전자들(FGFR2, PDGFRA 및 AXL 등)을 포함하는 30개 키메릭 전사체를 동정하였으며, 이들은 폐암에서의 핵심 돌연변이(driver mutation)일 가능성이 매우 높을 것으로 보인다.
상기 연구 결과, 암(예컨대, 비소세포성 폐암, NSCLC) 환자의 수술 표본에서 상기 수술 표본과 동일한 조직 내의 주변 정상 조직 샘플에서는 발견되지 않고 암 조직에서 특이적으로 발현되는 변이로서 동일한 염색체 또는 상이한 염색체에 위치하는 두 유전자가 융합된 융합 유전자 및/또는 상기 융합 유전자가 발현되어 생성된 융합 단백질이 존재함을 확인하였다.
본 발명에서 확인된 암 조직 (예컨대 폐암 조직)에서 특이적으로 존재하는 융합 유전자를 다음의 표 1에 정리하였다:
표 1
Donor Gene | Acceptor Gene | Chromosome (Donor;Acceptor) | Distance (Mb) | |
1 | CCDC6 | ROS1 | chr10(q21.2);chr6(q22.1) | Interchromosomal |
2 | SCAF11 | PDGFRA | chr12(q12);chr4(q12) | Interchromosomal |
3 | FGFR2 | CIT | chr10(q26.13);chr12(q24.23) | Interchromosomal |
4 | AXL | MBIP | chr19(q13.2);chr14(q13.3) | Interchromosomal |
5 | APLP2 | TNFSF11 | chr11(q24.3);chr13(q14.11) | Interchromosomal |
6 | MAP4K3 | PRKCE | chr2(p22.1);chr2(p21) | 6.215 |
7 | BCAS3 | MAP3K3 | chr17(q23.2); chr17(q23.3) | 2.23 |
8 | KRAS | CDH13 | chr12(p12.1);chr16(q23.3) | Interchromosomal |
9 | ZFYVE9 | CGA | chr1(p32.3);chr6(q14.3) | Interchromosomal |
10 | ERBB2IP | MAST4 | chr5(q12.3);chr5(q12.3) | 0.515 |
11 | TPD52L1 | TRMT11 | chr6(q22.31); chr6(q22.32) | 0.723 |
12 | TXNRD1 | GPR133 | chr12(q23.3);chr12(q24.33) | 26.694 |
상기 표 1에 기재된 융합 유전자는 암 조직에 특이적으로 관찰되는 것으로 확인되었으므로, 상기 융합 유전자 및/또는 상기 융합 단백질은 암 진단을 위한 바이오마커 및 암 치료를 위한 타겟으로서 유용하다.
이에, 본 발명의 일례는,
CCDC6 단백질 또는 그의 단편과 ROS1 단백질 또는 그의 단편이 융합된 CCDC6-ROS1융합 단백질;
FGFR2 단백질 또는 그의 단편과 CIT 단백질 또는 그의 단편이 융합된 FGFR2-CIT 융합 단백질;
AXL 단백질 또는 그의 단편과 MBIP 단백질 또는 그의 단편이 융합된 AXL-MBIP 융합 단백질;
APLP2 단백질 또는 그의 단편과 TNFSF11 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질;
MAP4K3 단백질 또는 그의 단편과 PRKCE 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질;
BCAS3 단백질 또는 그의 단편과 MAP3K3 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질;
KRAS 단백질 또는 그의 단편과 CDH13 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질;
ZFYVE9 단백질 또는 그의 단편과 CGA 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질;
ERBB2IP 단백질 또는 그의 단편과 MAST4 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질;
TPD52L1 단백질 또는 그의 단편과 TRMT11 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질; 및
TXNRD1 단백질 또는 그의 단편과 GPR133 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질
로 이루어진 군에서 선택된 융합 단백질을 제공된다.
다른 예는 상기 융합 단백질을 암호화하는 융합 유전자(폴리뉴클레오타이드 분자)를 제공한다.
상기 융합 단백질 및/또는 이를 암호화하는 융합 유전자는 암의 진단 마커로서 유용하게 사용될 수 있다.
이하 상기 융합 파트너와 융합 단백질을 보다 상세히 설명한다. 본 명세서에 있어서 융합 파트너인 단백질 단편들의 절단점 (break point; 또는 융합부위)은 이들을 암호화하는 유전자의 엑손을 기준으로 설명되며, 상기 단편의 N-말단 (C-말단 융합 파트너의 경우) 또는 C-말단(N-말단 융합 파트너의 경우) 마지막에 포함되는 엑손과 절단되어 제거되는 엑손 사이의 인트론 부위 중 어느 지점에서 절단되어도 암호화되는 단백질 단편의 아미노산 서열에는 영향을 미치지 않게 되므로, 실제 절단되는 지점은 상기 인트론 부위 중 어느 지점이어도 무방하다.
CCDC6(coiled-coil domain containing 6) 단백질을 암호화 하는 CCDC6 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 10(q21.2)에 위치하며, 이로부터 암호화되는 CCDC6 단백질은 총 아미노산 길이가 474aa인 단백질이다. CCDC6 단백질 또는 CCDC6 단백질의 단편은 CCDC6-ROS1융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, CCDC6 유전자는 GenBank accession no. NM_005436에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CCDC6 단백질은 NM_005436에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 CCDC6 단백질의 단편은 NM_005436의 첫 번째 엑손(exon)부터 엑손 5(exon 5)(염색체 10 상의 위치((-) strand)를 기준으로 61572393-61572553 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 5의 3' 말단에 코돈을 이루지 못하는 1개의 뉴클레오타이드(c)가 존재하는 형태일 수 있다. 구체예에서, 상기 CCDC6 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CCDC6 단백질에 대하여 아래의 표 2 및 3에 정리하였다:
표 2 CCDC6 단백질의 단편을 암호화 하는 유전자
CCDC6유전자(Accession No.) | CCDC6 단백질의 암호화 부위-CDS | CCDC6 단백질 단편의 암호화 부위: 엑손 기준 | CCDC6 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_005436 | 233~1657(1425bp)(서열번호 1) | 첫번째 엑손~엑손 5까지의 부위 | 233~1079(846bp+1nt(c); 총 847bp)(서열번호 2) | chr10:[61572393 (엑손 5의 3' 말단) | gctgctcagttacagc(서열번호 3) |
표 3 CCDC6 단백질의 단편
CCDC6 단백질의 Full size(a.a) | CCDC6 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
474aa(서열번호 4) | 1~282aa+1nt(c)(아미노산 서열: 서열번호 5) | AAQLQ+1nt(c)(아미노산 서열: 서열번호 6) |
ROS1(receptor tyrosine kinase 1) 단백질을 암호화 하는 ROS1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q22.1)에 위치하며, 이로부터 암호화되는 ROS1 단백질은 총 아미노산 길이가 2347aa인 단백질이다. ROS1 단백질 또는 ROS1 단백질의 단편은 CCDC6-ROS1융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, 상기 ROS1 유전자는 GenBank accession no. NM_002944에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, 상기 ROS1 단백질은 NM_002944에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 ROS1 단백질의 단편은 NM_002944의 엑손 35(염색체 6 상의 위치((-) strand)를 기준으로 117642422-117642557 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 35의 5' 말단의 처음 시작하는 2개의 뉴클레오타이드(tc)는 코돈을 이루지 못하는 형태일 수 있고, CCDC6 단백질의 단편과 융합시에 앞서 설명한 바와 같이 CCDC6 단백질의 단편에 추가로 포함된 1개의 뉴클레오타이드(c)와 연결되어 코돈(ctc)을 이루어 하나의 아미노산(L)을 코딩할 수 있다. 구체예에서, 상기 ROS1 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 ROS1 단백질에 대하여 아래의 표 4 및 5에 정리하였다:
표 4 ROS1 단백질의 단편을 암호화 하는 유전자
ROS1유전자(Accession No.) | ROS1 단백질의 암호화 부위-CDS | ROS1 단백질 단편의 암호화 부위: 엑손 기준 | ROS1 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_002944 | 200~7243(7044bp)(서열번호 7) | 엑손 35~마지막 엑손까지의 부위 | 5841~7243(2nt(tc)+1401bp; 총 1403bp)(서열번호 8) | chr6:117642557] (엑손 35의 5' 말단) | tctggcatagaagatta(서열번호 9) |
표 5 ROS1 단백질의 단편
ROS1 단백질의 Full size(a.a) | ROS1단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
2347aa(서열번호 10) | 1882~2347aa2nt(tc)+ 1882~2347aa (466aa) (아미노산 서열: 서열번호 11) | 2nt(tc)+WHRRL(아미노산 서열: 서열번호 12) |
상기 'CCDC6 단백질 또는 그의 단편과 ROS1 단백질 또는 그의 단편이 융합된 CCDC6-ROS1융합 단백질'을 암호화하는 융합 유전자 (CCDC6-ROS1융합 유전자)는 5'-말단에 상기한 바와 같은 CCDC6 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 ROS1 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 CCDC6-ROS1융합 유전자는 5' 말단쪽에 NM_005436의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002944의 엑손 35부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 CCDC6-ROS1융합 유전자는 5' 말단쪽에 NM_005436의 233번째부터 1079번째까지의 뉴클레오타이드 서열 (서열번호 2)과 3' 말단쪽에 NM_002944의 5841번째부터 7243번째까지의 뉴클레오타이드 서열(서열번호 8)이 연결된 융합 유전자(서열번호 13; 융합부위: 서열번호 14)일 수 있다.
상기 CCDC6-ROS1융합 단백질은 N-말단쪽에 상기한 바와 같은 CCDC6 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 ROS1 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_005436의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002944의 엑손 35부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 13의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 15; 융합부위: 서열번호 16) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
FGFR2 (fibroblast growth factor receptor 2) 단백질을 암호화 하는 FGFR2 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 10(q26.13)에 위치하며, FGFR2 단백질은 이로부터 암호화되는 단백질이다. FGFR2 단백질 또는 FGFR2 단백질의 단편은 FGFR2-CIT융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, FGFR2 유전자는 GenBank accession no. NM_001144914, NM_001144916, NM_001144915, NM_001144917, NM_001144918, NM_022970, NM_000141, NM_001144913, NM_001144919 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, FGFR2 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 FGFR2 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손(exon)부터 엑손 19(염색체 10 상의 위치((-) strand)를 기준으로 123243212-123243317 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 FGFR2 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 FGFR2 단백질에 대하여 아래의 표 6 및 7에 정리하였다:
표 6 FGFR2 단백질의 단편을 암호화 하는 유전자
FGFR2유전자(Accession No.) | FGFR2 단백질의 암호화 부위-CDS | FGFR2 단백질 단편의 암호화 부위: 엑손 기준 | FGFR2 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_001144914 | 151~2280(2130bp)(서열번호 17) | 첫번째 엑손~엑손 19까지의 부위 | 151~2115(1965bp)(서열번호 18) | chr10:[123243212 (엑손 19의 3' 말단) | ctcactctcacaaccaatgag (서열번호 19) |
NM_001144916 | 442~2562(2121bp) | 442~2397(1956bp) | |||
NM_001144915 | 320~2443(2124bp) | 320~2353(2034bp) | |||
NM_001144917 | 648~2765 (2118bp) | 648~2600(1953bp) | |||
NM_001144918 | 648~2762(2115bp) | 648~2597(1950bp) | |||
NM_022970 | 648~3116(2469bp) | 648~2951(2304bp) | |||
NM_000141 | 648~3113(2466bp) | 648~2948(2301bp) | |||
NM_001144913 | 151~2460(1813bp) | 151~2454(2304bp) | |||
NM_001144919 | 648~2690(2043bp) | 648~2648(2001bp) |
표 7 FGFR2 단백질의 단편
FGFR2유전자(Accession No.) | FGFR2 단백질의 Full size(a.a) | FGFR2 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_001144914 | 709aa(서열번호 20) | 1~655aa(서열번호 21) | LTLTTNE(서열번호 22) |
NM_001144916 | 706aa | 1~652aa | |
NM_001144915 | 707aa | 1~678aa | |
NM_001144917 | 705aa | 1~651aa | |
NM_001144918 | 704aa | 1~650aa | |
NM_022970 | 822aa | 1~768aa | |
NM_000141 | 821aa | 1~767aa | |
NM_001144913 | 769aa | 1~768aa | |
NM_001144919 | 680aa | 1~679aa |
CIT [citron (rho-interacting, serine/threonine kinase 21)] 단백질을 암호화 하는 CIT 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q24.23)에 위치하며, CIT 단백질은 이로부터 암호화되는 총길이 2027aa의 단백질이다. CIT 단백질 또는 CIT 단백질의 단편은 FGFR2-CIT융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, CIT 유전자는 GenBank accession no. NM_007174에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CIT 단백질은 상기 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 CIT 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 24 (염색체 12 상의 위치((-) strand)를 기준으로 120180216-12018026 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 CIT 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CIT 단백질에 대하여 아래의 표 8 및 9에 정리하였다:
표 8 CIT 단백질의 단편을 암호화 하는 유전자
CIT 유전자(Accession No.) | CIT 단백질의 암호화 부위-CDS | CIT 단백질 단편의 암호화 부위: 엑손 기준 | CIT 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_007174 | 57~6140(6084bp)(서열번호 23) | 엑손 24~마지막 엑손까지의 부위 | 2835~6140(3306bp)(서열번호 24) | chr12:120180269] (엑손 24의 5' 말단) | gcacatagagatgaaatccag(서열번호 25) |
표 9 CIT 단백질의 단편
CIT 단백질의 Full size(a.a) | CIT 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
2027aa(서열번호 26) | 927~2027aa (1101aa) (서열번호 27) | AHRDEIQ(서열번호 28) |
상기 'FGFR2 단백질 또는 그의 단편과 CIT 단백질 또는 그의 단편이 융합된 FGFR2-CIT 융합 단백질'을 암호화하는 융합 유전자 (FGFR2-CIT 융합 유전자)는 5'-말단에 상기한 바와 같은 FGFR2 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 CIT 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 FGFR2-CIT 융합 유전자는 5' 말단쪽에 NM_001144914, NM_001144916, NM_001144915, NM_001144917, NM_001144918, NM_022970, NM_000141, NM_001144913, 또는 NM_001144919의 첫번째 엑손에서 엑손 19까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_007174의 엑손 24부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 예컨대, 상기 FGFR2-CIT 융합 유전자는 5' 말단쪽에 NM_001144914의 151번째부터 2115번째까지의 뉴클레오타이드 서열 (서열번호 18)과 3' 말단쪽에 NM_007174의 2835번째부터 6140번째까지의 뉴클레오타이드 서열(서열번호 24)이 연결된 융합 유전자(서열번호 29; 융합부위: 서열번호 30)일 수 있다 (23a 및 23b 참조).
상기 FGFR2-CIT 융합 단백질은 N-말단쪽에 상기한 바와 같은 FGFR2 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 CIT 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_001144914, NM_001144916, NM_001144915, NM_001144917, NM_001144918, NM_022970, NM_000141, NM_001144913, 또는 NM_001144919의 첫번째 엑손에서 엑손 19까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_007174의 엑손 24부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 29의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 31; 융합부위: 서열번호 32) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
AXL (AXL receptor tyrosine kinase) 단백질을 암호화 하는 AXL 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 19(q13.2)에 위치하며, AXL 단백질은 상기 AXL 유전자로부터 암호화된다. AXL 단백질 또는 AXL 단백질의 단편은 AXL-MBIP 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, AXL 유전자는 GenBank accession no. NM_021913, NM_001699 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, AXL 단백질은 NM_021913, NM_001699 등에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 AXL 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손(exon)부터 엑손 20(염색체 19 상의 위치((+) strand)를 기준으로 41765458-41767670 염기 부위) 중의 244번째 뉴클레오타이드까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 AXL 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 AXL 단백질에 대하여 아래의 표 10 및 11에 정리하였다:
표 10 AXL 단백질의 단편을 암호화 하는 유전자
AXL 유전자(Accession No.) | AXL 단백질의 암호화 부위-CDS | AXL 단백질 단편의 암호화 부위: 엑손 기준 | AXL 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_021913 | 191~2875(2685bp)(서열번호 33) | 첫번째 엑손~엑손 20 중의 244번째 뉴클레오타이드까지의 부위 | 191~2767 (2577bp)(서열번호 34) | chr19:41765701]엑손 20 중의 244번째 뉴클레오타이드의 3 위치 | ctcactgcggctgag (서열번호 35) |
NM_001699 | 191~2848(2658bp) | 191~2740(2550bp) |
표 11 AXL 단백질의 단편
AXL 유전자(Accession No.) | AXL 단백질의 Full size(a.a) | AXL 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_021913 | 894aa(서열번호 36) | 1~859aa(서열번호 37) | LTAAE(서열번호 38) |
NM_001699 | 885aa | 1~850aa |
MBIP (MAP3K12 binding inhibitory protein 1) 단백질을 암호화 하는 MBIP 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 14(q13.3)에 위치하며, MBIP 단백질은 상기 MBIP 유전자로부터 암호화된다. MBIP 단백질 또는 MBIP 단백질의 단편은 AXL-MBIP 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, MBIP 유전자는 GenBank accession no. NM_016586, NM_001144891 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MBIP 단백질은 NM_016586, NM_001144891 등에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 MBIP 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 4(염색체 14 상의 위치((-) strand)를 기준으로 36783718-36783814 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 MBIP 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MBIP 단백질에 대하여 아래의 표 12 및 13에 정리하였다:
표 12 MBIP 단백질의 단편을 암호화 하는 유전자
MBIP 유전자(Accession No.) | MBIP 단백질의 암호화 부위-CDS | MBIP 단백질 단편의 암호화 부위: 엑손 기준 | MBIP 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_016586 | 89~1123(1035bp)(서열번호 39) | 엑손 4부터 마지막 엑손까지의 부위 | 563~1123 (561bp)(서열번호 40) | chr14:36783814](엑손 4의 5' 말단) | attgacagacgaata (서열번호 41) |
NM_001144891 | 89~1120(1032bp) | 563~1120(558bp) |
표 13 MBIP 단백질의 단편
MBIP 유전자(Accession No.) | MBIP 단백질의 Full size(a.a) | MBIP 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_016586 | 344aa(서열번호 42) | 159~344aa (186aa)(서열번호 43) | IDRRI(서열번호 44) |
NM_001144891 | 343aa | 159~343aa(185aa) |
상기 'AXL 단백질 또는 그의 단편과 MBIP 단백질 또는 그의 단편이 융합된 AXL-MBIP 융합 단백질'을 암호화하는 융합 유전자 (AXL-MBIP 융합 유전자)는 5'-말단에 상기한 바와 같은 AXL 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 MBIP 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 AXL-MBIP 융합 유전자는 5' 말단쪽에 NM_021913, NM_001699 등의 첫번째 엑손에서 엑손 20 중의 244번째 뉴클레오타이드까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_016586, NM_001144891 등의 엑손 4부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 AXL-MBIP 융합 유전자는 5' 말단쪽에 NM_021913의 191번째부터 2767번째까지의 뉴클레오타이드 서열 (서열번호 34)과 3' 말단쪽에 NM_016586의 563번째부터 1123번째까지의 뉴클레오타이드 서열(서열번호 40)이 연결된 융합 유전자(서열번호 45; 융합부위: 서열번호 46)일 수 있다.
상기 AXL-MBIP 융합 단백질은 N-말단쪽에 상기한 바와 같은 AXL 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 MBIP 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대, 5' 말단쪽에 NM_021913, NM_001699 등의 첫번째 엑손에서 엑손 20의 244번째 뉴클레오타이드까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_016586, NM_001144891 등의 엑손 4부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 45의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 47; 융합부위: 서열번호 48) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
APLP2 (amyloid beta (A4) precursor-like protein 2) 단백질을 암호화 하는 APLP2 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 11(q24.3)에 위치하며, APLP2 단백질은 이로부터 암호화되는 단백질이다. APLP2 단백질 또는 APLP2 단백질의 단편은 APLP2-TNFSF11융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, APLP2 유전자는 GenBank accession no. NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, NR_024515 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, APLP2 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 APLP2 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손(exon)부터 엑손 12(염색체 11 상의 위치((+) strand)를 기준으로 129999933-130000061 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 APLP2 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 APLP2 단백질에 대하여 아래의 표 14 및 15에 정리하였다:
표 14 APLP2 단백질의 단편을 암호화 하는 유전자
APLP2유전자(Accession No.) | APLP2 단백질의 암호화 부위-CDS | APLP2 단백질 단편의 암호화 부위: 엑손 기준 | APLP2 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_001642 | 158~2449(2292bp)(서열번호 49) | 첫번째 엑손~엑손 12까지의 부위 | 158~1741(1584bp)(서열번호 50) | chr11:130000061] (엑손 12의 3' 말단) | gcggcccagatgaaatcccag (서열번호 51) |
NM_001142276 | 158~2413(2256bp) | 158~1741(1584bp) | |||
NM_001142278 | 158~1726(1569bp) | 158~1054(896bp) | |||
NM_001142277 | 158~2245(2088bp) | 158~1573(1416bp) |
표 15 APLP2 단백질의 단편
APLP2유전자(Accession No.) | APLP2 단백질의 Full size(a.a) | APLP2 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_001642 | 763aa(서열번호 52) | 1~528aa(서열번호 53) | AAQMKSQ(서열번호 54) |
NM_001142276 | 751aa | 1~528aa | |
NM_001142278 | 522aa | 1~299aa | |
NM_001142277 | 695aa | 1~472aa |
TNFSF11 (tumor necrosis factor (ligand) superfamily, member 11) 단백질을 암호화 하는 TNFSF11 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 13(q14.11)에 위치하며, TNFSF11 단백질은 이로부터 암호화되는 단백질이다. TNFSF11 단백질 또는 TNFSF11 단백질의 단편은 APLP2-TNFSF11융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, TNFSF11 유전자는 GenBank accession no. NM_033012, NM_003701 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TNFSF11단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 TNFSF11단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 6 (염색체 13 상의 위치((+) strand)를 기준으로 43174888-43174933 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 TNFSF11단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TNFSF11 단백질에 대하여 아래의 표 16 및 17에 정리하였다:
표 16 TNFSF11단백질의 단편을 암호화 하는 유전자
TNFSF11유전자(Accession No.) | TNFSF11 단백질의 암호화 부위-CDS | TNFSF11 단백질 단편의 암호화 부위: 엑손 기준 | TNFSF11 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_033012 | 530~1264(735bp)(서열번호 55) | 엑손 6부터 마지막 엑손까지의 부위 | 698~1264(567bp)(서열번호 56) | chr13:[43174888 (엑손 6의 5' 말단) | gaattacaacatatcgttgga (서열번호 57) |
NM_003701 | 150~1122(973bp) | 537~2198(1662bp) |
표 17 TNFSF11단백질의 단편
TNFSF11유전자(Accession No.) | TNFSF11 단백질의 Full size(a.a) | TNFSF11 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_033012 | 244aa(서열번호 58) | 57~244aa (188aa)(서열번호 59) | ELQHIVG(서열번호 60) |
NM_003701 | 315aa | 130~315(186aa) |
상기 'APLP2 단백질 또는 그의 단편과 TNFSF11 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질'을 암호화하는 융합 유전자 (APLP2-TNFSF11 융합 유전자)는 5'-말단에 상기한 바와 같은 APLP2 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 TNFSF11 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 APLP2-TNFSF11 융합 유전자는 5' 말단쪽에 NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, NR_024515 등의 첫번째 엑손에서 엑손 12까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_033012, NM_003701 등의 엑손 6부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 APLP2-TNFSF11 융합 유전자는 5' 말단쪽에 NM_001642의 158번째부터 1741번째까지의 뉴클레오타이드 서열 (서열번호 50)과 3' 말단쪽에 NM_033012의 698번째부터 1264번째까지의 뉴클레오타이드 서열(서열번호 56)이 연결된 융합 유전자(서열번호 61; 융합부위: 서열번호 62)일 수 있다.
상기 APLP2-TNFSF11 융합 단백질은 N-말단쪽에 상기한 바와 같은 APLP2 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 TNFSF11 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, NR_024515 등의 첫번째 엑손에서 엑손 12까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_033012, NM_003701 등의 엑손 6부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 61의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 63; 융합부위: 서열번호 64) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
MAP4K3 (mitogen-activated protein kinase kinase kinase kinase3) 단백질을 암호화 하는 MAP4K3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 2(p22.1)에 위치하며, 이로부터 암호화되는 MAP4K3 단백질은 총 아미노산 길이가 894aa인 단백질이다. MAP4K3 단백질 또는 MAP4K3 단백질의 단편은 MAP4K3-PRKCE 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, MAP4K3 유전자는 GenBank accession no. NM_003618에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MAP4K3 단백질은 NM_003618에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 MAP4K3 단백질의 단편은 NM_003618의 엑손 1 (염색체 2 상의 위치((-) strand)를 기준으로 39664033-39664219 염기 부위)의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 포함하는 것일 수 있다. 구체예에서, 상기 MAP4K3 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MAP4K3 단백질에 대하여 아래의 표 18 및 19에 정리하였다:
표 18 MAP4K3 단백질의 단편을 암호화 하는 유전자
MAP4K3 유전자(Accession No.) | MAP4K3 단백질의 암호화 부위-CDS | MAP4K3 단백질 단편의 암호화 부위: 엑손 기준 | MAP4K3 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_003618 | 326~3010(2685bp)(서열번호 65) | 엑손 1 부위 | 326~421(96bp)(서열번호 66) | chr2:[39664033 (엑손 1의 3' 말단) | acctacggcgacgtctacaag (서열번호 67) |
표 19 MAP4K3 단백질의 단편
MAP4K3 단백질의 Full size(a.a) | MAP4K3 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
894aa(서열번호 68) | 1~32aa(서열번호 69) | TYGDVYK(서열번호 70) |
PRKCE (protein kinase C, epsilon) 단백질을 암호화 하는 PRKCE 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 2(p21)에 위치하며, 이로부터 암호화되는 PRKCE 단백질은 총 아미노산 길이가 737aa인 단백질이다. PRKCE 단백질 또는 PRKCE 단백질의 단편은 MAP4K3-PRKCE 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, 상기 PRKCE 유전자는 GenBank accession no. NM_005400에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, 상기 PRKCE 단백질은 NM_005400에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 PRKCE 단백질의 단편은 NM_005400의 엑손 2(염색체 2 상의 위치((+) strand)를 기준으로 46070139-46070202 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열일 수 있다. 구체예에서, 상기 PRKCE 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 PRKCE 단백질에 대하여 아래의 표 20 및 21에 정리하였다:
표 20 PRKCE 단백질의 단편을 암호화 하는 유전자
PRKCE 유전자(Accession No.) | PRKCE 단백질의 암호화 부위-CDS | PRKCE 단백질 단편의 암호화 부위: 엑손 기준 | PRKCE 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_005400 | 198~2411(2214bp)(서열번호 71) | 엑손 2~마지막 엑손까지의 부위 | 546~2411(1866bp)(서열번호 72 | chr2:[46070139 (엑손 2의 5' 말단) | attgatctggagccagaaggaaga(서열번호 73) |
표 21 PRKCE 단백질의 단편
PRKCE 단백질의 Full size(a.a) | PRKCE 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
737aa(서열번호 74) | 117~737aa (621aa) (서열번호 75) | IDLEPEGR(서열번호 76) |
상기 'MAP4K3 단백질 또는 그의 단편과 PRKCE 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질'을 암호화하는 융합 유전자 (MAP4K3-PRKCE 융합 유전자)는 5'-말단에 상기한 바와 같은 MAP4K3 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 PRKCE 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 MAP4K3-PRKCE 융합 유전자는 5' 말단쪽에 NM_003618의 엑손 1의 뉴클레오타이드 서열과 3' 말단쪽에 NM_005400의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 MAP4K3-PRKCE 융합 유전자는 5' 말단쪽에 NM_003618의 326번째부터 421번째까지의 뉴클레오타이드 서열 (서열번호 66)과 3' 말단쪽에 NM_005400의 546번째부터 2411번째까지의 뉴클레오타이드 서열(서열번호 72)이 연결된 융합 유전자(서열번호 77; 융합부위: 서열번호 78)일 수 있다.
상기 MAP4K3-PRKCE 융합 단백질은 N-말단쪽에 상기한 바와 같은 MAP4K3 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 PRKCE 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_003618의 엑손 1의 뉴클레오타이드 서열과 3' 말단쪽에 NM_005400의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 77의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 79; 융합부위: 서열번호 80) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
BCAS3 (breast carcinoma amplified sequence3) 단백질을 암호화 하는 BCAS3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 17(q23.2)에 위치하며, BCAS3 단백질은 이로부터 암호화되는 단백질이다. BCAS3 단백질 또는 BCAS3 단백질의 단편은 BCAS3-MAP3K3 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, BCAS3 유전자는 GenBank accession no. NM_017679, NM_001099432 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, BCAS3 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 BCAS3 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 23(염색체 17 상의 위치((+) strand)를 기준으로 59161828-59161925 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 23의 3' 말단에 코돈을 이루지 못하는 1개의 뉴클레오타이드(g)가 존재하는 형태일 수 있다. 구체예에서, 상기 BCAS3 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 BCAS3 단백질에 대하여 아래의 표 22 및 23에 정리하였다:
표 22 BCAS3 단백질의 단편을 암호화 하는 유전자
BCAS3유전자(Accession No.) | BCAS3 단백질의 암호화 부위-CDS | BCAS3 단백질 단편의 암호화 부위: 엑손 기준 | BCAS3 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_001099432 | 110~2896(2787bp)(서열번호 81) | 첫번째 엑손~엑손 23까지의 부위 | 110~2579(2469bp+1nt(c); 총 2470bp)(서열번호 82) | chr17:59161925] (엑손 23의 3' 말단) | acagtgattgatgctgcctcag (서열번호 83) |
NM_017679 | 110~2851(2742bp) | 110~2534(2454bp) |
표 23 BCAS3 단백질의 단편
BCAS3유전자(Accession No.) | BCAS3 단백질의 Full size(a.a) | BCAS3 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_001099432 | 928aa(서열번호 84) | 1~823aa+1nt(g)(아미노산 서열: 서열번호 85) | TVIDAAS+1nt(g)(아미노산 서열: 서열번호 86) |
NM_017679 | 913aa | 1~808aa |
MAP3K3 (mitogen activated protein kinase kinase kinase3) 단백질을 암호화 하는 MAP3K3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 17(q23.3)에 위치하며, MAP3K3 단백질은 이로부터 암호화되는 단백질이다. MAP3K3 단백질 또는 MAP3K3 단백질의 단편은 BCAS3-MAP3K3 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, MAP3K3 유전자는 GenBank accession no. NM_002401, NM_203351 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MAP3K3 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 MAP3K3 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 2 (염색체 17 상의 위치((+) strand)를 기준으로 61710041-61710162 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 2의 5' 말단의 처음 시작하는 2개의 뉴클레오타이드(ac)는 코돈을 이루지 못하는 형태일 수 있고, BCAS3 단백질의 단편과 융합시에 앞서 설명한 바와 같이 BCAS3 단백질의 단편에 추가로 포함된 1개의 뉴클레오타이드(g)와 연결되어 코돈(gac)을 이루어 하나의 아미노산(D)을 코딩할 수 있다. 구체예에서, 상기 MAP3K3단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MAP3K3 단백질에 대하여 아래의 표 24 및 25에 정리하였다:
표 24 MAP3K3단백질의 단편을 암호화 하는 유전자
MAP3K3 유전자(Accession No.) | MAP3K3 단백질의 암호화 부위-CDS | MAP3K3 단백질 단편의 암호화 부위: 엑손 기준 | MAP3K3 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_002401 | 320~2200(1881bp)(서열번호 87) | 엑손 2부터 마지막 엑손까지의 부위 | 324~2200(2nt(ac)+1875bp; 총 1877bp)(서열번호 88) | chr17:61710041] (엑손 2의 5' 말단) | acgaacaggaggcattgaactca (서열번호 89) |
NM_203351 | 320~2293(1974bp) | 324~2293(1970bp) |
표 25 MAP3K3 단백질의 단편
MAP3K3 유전자(Accession No.) | MAP3K3 단백질의 Full size(a.a) | MAP3K3 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_002401 | 626aa(서열번호 90) | 3aa~626aa(2nt(ac)+3aa~626aa; 총 624aa) (아미노산 서열: 서열번호 91) | 2nt(ac)+EQEALNS (아미노산 서열: 서열번호 92) |
NM_203351 | 657aa | 3~655aa |
상기 'BCAS3 단백질 또는 그의 단편과 MAP3K3 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질'을 암호화하는 융합 유전자 (BCAS3-MAP3K3 융합 유전자)는 5'-말단에 상기한 바와 같은 BCAS3 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 MAP3K3 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 BCAS3-MAP3K3 융합 유전자는 5' 말단쪽에 NM_017679, NM_001099432 등의 첫번째 엑손에서 엑손 23까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002401, NM_203351 등의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 BCAS3-MAP3K3 융합 유전자는 5' 말단쪽에 NM_001099432의 110번째부터 2579번째까지의 뉴클레오타이드 서열 (서열번호 82)과 3' 말단쪽에 NM_002401의 324번째부터 2200번째까지의 뉴클레오타이드 서열(서열번호 88)이 연결된 융합 유전자(서열번호 93; 융합부위: 서열번호 94)일 수 있다.
상기 BCAS3-MAP3K3 융합 단백질은 N-말단쪽에 상기한 바와 같은 BCAS3 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 MAP3K3 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_017679, NM_001099432 등의 첫번째 엑손에서 엑손 23까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002401, NM_203351 등의 엑손 2부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 93의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 95; 융합부위: 서열번호 96) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
KRAS (Ki-ras2 Kirsten rat sarcoma viral oncogene homolog) 단백질을 암호화하는 KRAS 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(p12.1)에 위치하며, KRAS 단백질은 이로부터 암호화되는 단백질이다. KRAS 단백질 또는 KRAS 단백질의 단편은 KRAS-CDH13 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, KRAS 유전자는 GenBank accession no. NM_004985, NM_033360 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, KRAS 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 KRAS 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 4(염색체 11 상의 위치((-) strand)를 기준으로 25378548-25378707 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 KRAS 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 KRAS 단백질에 대하여 아래의 표 26 및 27에 정리하였다:
표 26 KRAS 단백질의 단편을 암호화 하는 유전자
KRAS유전자(Accession No.) | KRAS 단백질의 암호화 부위-CDS | KRAS 단백질 단편의 암호화 부위: 엑손 기준 | KRAS 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_004985 | 182~748(567bp)(서열번호 97) | 첫번째 엑손~엑손 4까지의 부위 | 182~631(450bp)(서열번호 98) | chr12:[25378548 (엑손 4의 3' 말단) | acatcagcaaagacaagacag (서열번호 99) |
NM_033360 | 182~751(570bp) | 182~631(450bp) |
표 27 KRAS 단백질의 단편
KRAS 유전자(Accession No.) | KRAS 단백질의 Full size(a.a) | KRAS 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_004985 | 188aa(서열번호 100) | 1~150aa(서열번호 101) | TSAKTRQ (서열번호 102) |
NM_033360 | 189aa | 1~150aa |
CDH13 (cadherin 13, H-cadherin) 단백질을 암호화 하는 CDH13 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 16(q23.3)에 위치하며, CDH13 단백질은 이로부터 암호화되는 단백질이다. CDH13 단백질 또는 CDH13 단백질의 단편은 KRAS-CDH13 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, CDH13 유전자는 GenBank accession no. NM_001257에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CDH13 단백질은 이 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 CDH13 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 5 (염색체 16 상의 위치((+) strand)를 기준으로 83158990-83159106 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 CDH13 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CDH13 단백질에 대하여 아래의 표 28 및 29에 정리하였다:
표 28 CDH13 단백질의 단편을 암호화 하는 유전자
CDH13 유전자(Accession No.) | CDH13 단백질의 암호화 부위-CDS | CDH13 단백질 단편의 암호화 부위: 엑손 기준 | CDH13 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_001257 | 300~2441(2142bp)(서열번호 103) | 엑손 5부터 마지막 엑손까지의 부위 | 666~2441(1776bp)(서열번호 104) | chr16:[83158990 (엑손 5의 5' 말단) | gatatatttaaatttgcaaga (서열번호 105) |
표 29 CDH13 단백질의 단편
CDH13 유전자(Accession No.) | CDH13 단백질의 Full size(a.a) | CDH13 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_001257 | 713aa(서열번호 106) | 123~713aa (591aa)(서열번호 107) | DIFKFAR(서열번호 108) |
상기 'KRAS 단백질 또는 그의 단편과 CDH13 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질'을 암호화하는 융합 유전자 (KRAS-CDH13 융합 유전자)는 5'-말단에 상기한 바와 같은 KRAS 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 CDH13 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 KRAS-CDH13 융합 유전자는 5' 말단쪽에 NM_004985, NM_033360 등의 첫번째 엑손에서 엑손 4까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001257의 엑손 5부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 KRAS-CDH13 융합 유전자는 5' 말단쪽에 NM_004985의 182번째부터 631번째까지의 뉴클레오타이드 서열 (서열번호 98)과 3' 말단쪽에 NM_001257의 666번째부터 2441번째까지의 뉴클레오타이드 서열(서열번호 104)이 연결된 융합 유전자(서열번호 109; 융합부위: 서열번호 110)일 수 있다.
상기 KRAS-CDH13 융합 단백질은 N-말단쪽에 상기한 바와 같은 KRAS 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 CDH13 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_004985, NM_033360 등의 첫번째 엑손에서 엑손 4까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001257의 엑손 5부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 109의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 111; 융합부위: 서열번호 112) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
ZFYVE9 (zinc finger, FYVE domain containing 9) 단백질을 암호화 하는 ZFYVE9 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 1(p32.3)에 위치하며, ZFYVE9 단백질은 이로부터 암호화되는 단백질이다. ZFYVE9 단백질 또는 ZFYVE9 단백질의 단편은 ZFYVE9-CGA 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, ZFYVE9 유전자는 GenBank accession no. NM_007324, NM_004799 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, ZFYVE9 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 ZFYVE9 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 16(염색체 1 상의 위치((+) strand)를 기준으로 52803444-52803606 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 16의 3' 말단에 코돈을 이루지 못하는 2개의 뉴클레오타이드(gg)가 존재하는 형태일 수 있다. 구체예에서, 상기 ZFYVE9 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 ZFYVE9 단백질에 대하여 아래의 표 30 및 31에 정리하였다:
표 30 ZFYVE9 단백질의 단편을 암호화 하는 유전자
ZFYVE9 유전자(Accession No.) | ZFYVE9 단백질의 암호화 부위-CDS | ZFYVE9 단백질 단편의 암호화 부위: 엑손 기준 | ZFYVE9 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_007324 | 173~4273(4101bp)(서열번호 113) | 첫번째 엑손~엑손 16까지의 부위 | 173~3828(3654bp+2nt(gg); 총 3656bp)(서열번호 114) | chr1:52803606] (엑손 16의 3' 말단) | gacaagaacgttagcaaggg (서열번호 115) |
NM_004799 | 173~4450(4278bp) | 173~4005(3833bp) |
표 31 ZFYVE9 단백질의 단편
ZFYVE9유전자(Accession No.) | ZFYVE9 단백질의 Full size(a.a) | ZFYVE9 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_007324 | 1366aa(서열번호 116) | 1~1218aa+2nt(gg)(아미노산 서열: 서열번호 117) | DKNVSK+2nt(gg)(아미노산 서열: 서열번호 118) |
NM_004799 | 1425aa | 1~1277aa+2nt |
CGA (glycoprotein hormones, alpha polypeptide) 단백질을 암호화 하는 CGA 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q14.3)에 위치하며, CGA 단백질은 이로부터 암호화되는 단백질이다. CGA 단백질 또는 CGA 단백질의 단편은 ZFYVE9-CGA 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, CGA 유전자는 GenBank accession no. NM_000735에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, CGA 단백질은 상기 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 CGA 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 2 (염색체 6 상의 위치((-) strand)를 기준으로 87797831-87797925 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 2의 5' 말단의 처음 시작하는 1개의 뉴클레오타이드(g)는 코돈을 이루지 못하는 형태일 수 있고, ZFYVE9 단백질의 단편과 융합시에 앞서 설명한 바와 같이 ZFYVE9 단백질의 단편에 추가로 포함된 2개의 뉴클레오타이드(gg)와 연결되어 코돈(ggg)을 이루어 하나의 아미노산(G)을 코딩할 수 있다. 구체예에서, 상기 CGA 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 CGA 단백질에 대하여 아래의 표 32 및 33에 정리하였다:
표 32 CGA단백질의 단편을 암호화 하는 유전자
CGA 유전자(Accession No.) | CGA 단백질의 암호화 부위-CDS | CGA 단백질 단편의 암호화 부위: 엑손 기준 | CGA 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_000735 | 143~493(351bp)(서열번호 119) | 엑손2~ 마지막 엑손까지의 부위 | 5UTR+143~449(358bp)(서열번호 120) | Chr6:87797925](엑손2의 5' 말단) | gagcgcc (121) |
표 33 CGA 단백질의 단편
CGA 단백질의 Full size(a.a) | CGA 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
116aa(서열번호 122) | 116aa(서열번호 123) | UTR에서breakpoint 발생 |
상기 'ZFYVE9 단백질 또는 그의 단편과 CGA 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질'을 암호화하는 융합 유전자 (ZFYVE9-CGA 융합 유전자)는 5'-말단에 상기한 바와 같은 ZFYVE9 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 CGA 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 ZFYVE9-CGA 융합 유전자는 5' 말단쪽에 NM_007324, NM_004799 등의 첫번째 엑손에서 엑손 16까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_000735의 5UTR (7bp)을 포함하여 두번째 엑손에서 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 ZFYVE9-CGA 융합 유전자는 5' 말단쪽에 NM_007324의 173번째부터 3828번째까지의 뉴클레오타이드 서열 (서열번호 114)과 3' 말단쪽에 NM_000735의 136번째부터 493번째까지의 뉴클레오타이드 서열(서열번호 120)이 연결된 융합 유전자(서열번호 124; 융합부위: 서열번호 125)일 수 있다.
상기 ZFYVE9-CGA 융합 단백질은 N-말단쪽에 상기한 바와 같은 ZFYVE9 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 CGA 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_007324, NM_004799 등의 첫번째 엑손에서 엑손 16까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_000735의 5UTR (7bp)을 포함하여 두번째 엑손에서 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 124의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 126; 융합부위: 서열번호 127) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
ERBB2IP (erbb2 interacting protein) 단백질을 암호화 하는 ERBB2IP 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 5(q12.3)에 위치하며, ERBB2IP 단백질은 이로부터 암호화되는 단백질이다. ERBB2IP 단백질 또는 ERBB2IP 단백질의 단편은 ERBB2IP-MAST4 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, ERBB2IP 유전자는 GenBank accession no. NM_018695, NM_001006600 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, ERBB2IP 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 ERBB2IP 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 26(염색체 5 상의 위치((+) strand)를 기준으로 65372703-65372777 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 ERBB2IP 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 ERBB2IP 단백질에 대하여 아래의 표 34 및 35에 정리하였다:
표 34 ERBB2IP 단백질의 단편을 암호화 하는 유전자
ERBB2IP 유전자(Accession No.) | ERBB2IP 단백질의 암호화 부위-CDS | ERBB2IP 단백질 단편의 암호화 부위: 엑손 기준 | ERBB2IP 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_001006600 | 311~4219(3909bp)(서열번호 128) | 첫번째 엑손~엑손 26까지의 부위 | 311~4111(3801bp)(서열번호 129) | chr5:65372777] (엑손 26의 3' 말단) | cagccaggtgataaaattattcag (서열번호 130) |
NM_018695 | 311~4426(4116bp) | 311~4318(4008bp) |
표 35 ERBB2IP 단백질의 단편
ERBB2IP 유전자(Accession No.) | ERBB2IP 단백질의 Full size(a.a) | ERBB2IP 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_001006600 | 1302aa(서열번호 131) | 1~1267aa(서열번호 132) | QPGDKIIQ(서열번호 133) |
NM_018695 | 1371aa | 1~1336aa |
MAST4 (microtubule associated serine/threonine kinase family member4) 단백질을 암호화 하는 MAST4 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 5(q12.3)에 위치하며, MAST4 단백질은 이로부터 암호화되는 단백질이다. MAST4 단백질 또는 MAST4 단백질의 단편은 ERBB2IP-MAST4 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, MAST4 유전자는 GenBank accession no. NM_001164664, NM_015183등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, MAST4 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 MAST4 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 13 (염색체 5 상의 위치((+) strand)를 기준으로 66400194-66400403 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 MAST4단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 MAST4 단백질에 대하여 아래의 표 36 및 37에 정리하였다:
표 36 MAST4단백질의 단편을 암호화 하는 유전자
MAST4 유전자(Accession No.) | MAST4 단백질의 암호화 부위-CDS | MAST4 단백질 단편의 암호화 부위: 엑손 기준 | MAST4 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_001164664 | 309~8180(7872bp)(서열번호 134) | 엑손 13부터 마지막 엑손까지의 부위 | 1455~8180 (6726bp)(서열135) | chr5:[66400194 (엑손 13의 5' 말단) | gctacagctcagatggaagaacgt (서열번호 136) |
NM_015183 | 69~7373bp(7065bp) | 648~7373(6726bp) |
표 37 MAST4 단백질의 단편
MAST4 유전자(Accession No.) | MAST4 단백질의 Full size(a.a) | MAST4 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_001164664 | 2623aa(서열번호 137) | 383aa~2623aa (총 2241aa) (서열번호 138) | ATAQMEER (서열번호 139) |
NM_015183 | 2623aa | 383~2623aa(2241aa) |
상기 'ERBB2IP 단백질 또는 그의 단편과 MAST4 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질'을 암호화하는 융합 유전자 (ERBB2IP-MAST4 융합 유전자)는 5'-말단에 상기한 바와 같은 ERBB2IP 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 MAST4 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 ERBB2IP-MAST4 융합 유전자는 5' 말단쪽에 NM_018695, NM_001006600 등의 첫번째 엑손에서 엑손 26까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001164664, NM_015183등의 엑손 13부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 ERBB2IP-MAST4 융합 유전자는 5' 말단쪽에 NM_001006600 의 311번째부터 4111번째까지의 뉴클레오타이드 서열 (서열번호 129)과 3' 말단쪽에 NM_001164664의 1455번째부터 8180번째까지의 뉴클레오타이드 서열(서열번호 135)이 연결된 융합 유전자(서열번호 140; 융합부위: 서열번호 141)일 수 있다.
상기 ERBB2IP-MAST4 융합 단백질은 N-말단쪽에 상기한 바와 같은 ERBB2IP 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 MAST4 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_018695, NM_001006600 등의 첫번째 엑손에서 엑손 26까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001164664, NM_015183등의 엑손 13부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 140의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 142; 융합부위: 서열번호 143) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
TPD52L1 (tumor protein D52-like1) 단백질을 암호화 하는 TPD52L1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q22.31)에 위치하며, TPD52L1 단백질은 이로부터 암호화되는 단백질이다. TPD52L1 단백질 또는 TPD52L1 단백질의 단편은 TPD52L1-TRMT11 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, TPD52L1 유전자는 GenBank accession no. NM_003287, NM_001003396, NM_001003397, NM_001003395 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TPD52L1 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 TPD52L1 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 5(염색체 6 상의 위치((+) strand)를 기준으로 125569428-125569529 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 5의 3' 말단에 코돈을 이루지 못하는 2개의 뉴클레오타이드(ag)가 존재하는 형태일 수 있다. 구체예에서, 상기 TPD52L1 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TPD52L1 단백질에 대하여 아래의 표 38 및 39에 정리하였다:
표 38 TPD52L1 단백질의 단편을 암호화 하는 유전자
TPD52L1유전자(Accession No.) | TPD52L1 단백질의 암호화 부위-CDS | TPD52L1 단백질 단편의 암호화 부위: 엑손 기준 | TPD52L1 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_001003395 | 328~855(528bp)(서열번호 144) | 첫번째 엑손~엑손 5까지의 부위 | 328~626(297bp+2nt(c); 총 299bp)(서열번호 145) | chr6:125569529] (엑손 5의 3' 말단) | tcagcaagaagttcggagacatgag (서열번호 146) |
NM_001003396 | 220~654(435bp) | 220~605(386bp) | |||
NM_001003397 | 220~615(396bp) | 220~605(386bp) | |||
NM_003287 | 220~834(615bp) | 220~605(386bp) |
표 39 TPD52L1 단백질의 단편
TPD52L1유전자(Accession No.) | TPD52L1 단백질의 Full size(a.a) | TPD52L1 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_001003395 | 175aa(서열번호 147) | 1~99aa+2nt(ag)(아미노산 서열: 서열번호 148) | SKKFGDM+2nt(ag)(아미노산 서열: 서열번호 149) |
NM_001003396 | 144aa | 1~128aa | |
NM_001003397 | 131aa | 1~128aa | |
NM_003287 | 204aa | 1~128aa |
TRMT11 (tRNA methyl transferase11 homolog) 단백질을 암호화 하는 TRMT11 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 6(q22.32)에 위치하며, TRMT11 단백질은 이로부터 암호화되는 단백질이다. TRMT11 단백질 또는 TRMT11 단백질의 단편은 TPD52L1-TRMT11 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, TRMT11 유전자는 GenBank accession no. NM_001031712에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TRMT11 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 TRMT11 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 12 (염색체 6 상의 위치((+) strand)를 기준으로 126342306-126342426 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이 때, 엑손 12의 5' 말단의 처음 시작하는 1개의 뉴클레오타이드(a)는 코돈을 이루지 못하는 형태일 수 있고, TPD52L1 단백질의 단편과 융합시에 앞서 설명한 바와 같이 TPD52L1 단백질의 단편에 추가로 포함된 2개의 뉴클레오타이드(ag)와 연결되어 코돈(aga)을 이루어 하나의 아미노산(R)을 코딩할 수 있다. 구체예에서, 상기 TRMT11단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TRMT11 단백질에 대하여 아래의 표 40 및 41에 정리하였다:
표 40 TRMT11 단백질의 단편을 암호화 하는 유전자
TRMT11 유전자(Accession No.) | TRMT11 단백질의 암호화 부위-CDS | TRMT11 단백질 단편의 암호화 부위: 엑손 기준 | TRMT11 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_001031712 | 122~1513(1392bp)(서열번호 150) | 엑손 12부터 마지막 엑손까지의 부위 | 1261~1513(1nt(a)+252bp; 총 1877bp)(서열번호 151) | chr6:[126342306 (엑손 12의 5' 말단) | atacactgaagagatggtgcct (서열번호 152) |
표 41 TRMT11 단백질의 단편
TRMT11 유전자(Accession No.) | TRMT11 단백질의 Full size(a.a) | TRMT11 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_001031712 | 463aa(서열번호 153) | 1nt(a)+381aa~463aa (총 83aa) (아미노산 서열: 서열번호 154) | 1nt(a)+ YTEEMVP (아미노산 서열: 서열번호 155) |
상기 'TPD52L1 단백질 또는 그의 단편과 TRMT11 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질'을 암호화하는 융합 유전자 (TPD52L1-TRMT11 융합 유전자)는 5'-말단에 상기한 바와 같은 TPD52L1 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 TRMT11 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 TPD52L1-TRMT11 융합 유전자는 5' 말단쪽에 NM_003287, NM_001003396, NM_001003397, NM_001003395 등의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001031712의 엑손 12부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 TPD52L1-TRMT11 융합 유전자는 5' 말단쪽에 NM_001003395의 328번째부터 626번째까지의 뉴클레오타이드 서열 (서열번호 145)과 3' 말단쪽에 NM_001031712의 1261번째부터 1513번째까지의 뉴클레오타이드 서열(서열번호 151)이 연결된 융합 유전자(서열번호 156; 융합부위: 서열번호 157)일 수 있다.
상기 TPD52L1-TRMT11 융합 단백질은 N-말단쪽에 상기한 바와 같은 TPD52L1 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 TRMT11 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_003287, NM_001003396, NM_001003397, NM_001003395 등의 첫번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001031712의 엑손 12부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 156의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 158; 융합부위: 서열번호 159) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
TXNRD1 (thioredoxin reductase1) 단백질을 암호화 하는 TXNRD1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q23.3)에 위치하며, TXNRD1 단백질은 이로부터 암호화되는 단백질이다. TXNRD1 단백질 또는 TXNRD1 단백질의 단편은 TXNRD1-GPR133 융합 단백질의 N-말단쪽 융합 파트너이다. 구체예에서, TXNRD1 유전자는 GenBank accession no. NM_003330, NM_001093771, NM_182729, NM_182743, NM_182742 등에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, TXNRD1 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 TXNRD1 단백질의 단편은 상기 뉴클레오타이드 서열의 첫 번째 엑손부터 엑손 17(염색체 12 상의 위치((+) strand)를 기준으로 104732917-104733051 염기 부위)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 TXNRD1 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TXNRD1 단백질에 대하여 아래의 표 42 및 43에 정리하였다:
표 42 TXNRD1 단백질의 단편을 암호화 하는 유전자
TXNRD1 유전자(Accession No.) | TXNRD1 단백질의 암호화 부위-CDS | TXNRD1 단백질 단편의 암호화 부위: 엑손 기준 | TXNRD1 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_003330 | 656~2311(1656bp)(서열번호 160) | 첫번째 엑손~엑손 17까지의 부위 | 656~2242(1587bp)(서열번호 161) | chr12:104733051] (엑손 17의 3' 말단) | aatccaccctgtctgtgcagag (서열번호 162) |
NM_001093771 | 25~1974(1950bp) | 258~1905(1881bp) | |||
NM_182729 | 527~2074(1548bp) | 527~2005(1479bp) | |||
NM_182743 | 465~1964(1500bp) | 465~1895(1431bp) | |||
NM_182742 | 702~2201(1500bp) | 702~2132(1431bp) |
표 43 TXNRD1 단백질의 단편
TXNRD1 유전자(Accession No.) | ERBB2IP 단백질의 Full size(a.a) | ERBB2IP 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_003330 | 551aa(서열번호 163) | 1~529aa(서열번호 164) | IHPVCAE (서열번호 165) |
NM_001093771 | 649aa | 1~627aa | |
NM_182729 | 499aa | 1~477aa | |
NM_182743 | 499aa | 1~477aa | |
NM_182742 | 499aa | 1~477aa |
GPR133 (G protein-coupled receptor133) 단백질을 암호화 하는 GPR133 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q24.33)에 위치하며, GPR133 단백질은 이로부터 암호화되는 단백질이다. GPR133 단백질 또는 GPR133 단백질의 단편은 TXNRD1-GPR133 융합 단백질의 C-말단쪽 융합 파트너이다. 구체예에서, GPR133 유전자는 GenBank accession no. NM_198827에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, GPR133 단백질은 이들 뉴클레오타이드 서열 중 어느 하나에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다.
상기 GPR133 단백질의 단편은 상기 뉴클레오타이드 서열의 엑손 14 (염색체 12 상의 위치((+) strand)를 기준으로 131561346-131561419 염기 부위)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 구체예에서, 상기 GPR133단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 GPR133 단백질에 대하여 아래의 표 44 및 45에 정리하였다:
표 44 GPR133단백질의 단편을 암호화 하는 유전자
GPR133 유전자(Accession No.) | GPR133 단백질의 암호화 부위-CDS | GPR133 단백질 단편의 암호화 부위: 엑손 기준 | GPR133 단백질 단편의 암호화 부위: cDNA 기준 | 염색체 상의 Break-point 위치 | Break-point 부위 염기서열 |
NM_198827 | 560~3184(2625bp)(서열번호 166) | 엑손 14부터 마지막 엑손까지의 부위 | 2033~3184 (11526bp)(서열167) | chr12:[131561346 (엑손 14의 5' 말단) | acacgtaagcagcac (서열번호 168) |
표 45 GPR133 단백질의 단편
GPR133 유전자(Accession No.) | GPR133 단백질의 Full size(a.a) | GPR133 단백질 단편 부위 | Breakpoint 부위 아미노산 서열 |
NM_198827 | 874aa(서열번호 169) | 492aa~874aa (총 383aa) (서열번호 170) | TRKQHS (서열번호 171) |
상기 'TXNRD1 단백질 또는 그의 단편과 GPR133 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질'을 암호화하는 융합 유전자 (TXNRD1-GPR133 융합 유전자)는 5'-말단에 상기한 바와 같은 TXNRD1 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자 및 3'-말단에 상기한 바와 같은 GPR133 단백질 또는 그의 단편을 암호화하는 폴리뉴클레오타이드 분자를 포함하는 것일 수 있다. 구체예에서, 상기 TXNRD1-GPR133 융합 유전자는 5' 말단쪽에 NM_003330, NM_001093771, NM_182729, NM_182743, NM_182742 등의 첫번째 엑손에서 엑손 17까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_198827의 엑손 14부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자일 수 있다. 보다 구체적으로, 상기 TXNRD1-GPR133 융합 유전자는 5' 말단쪽에 NM_003330의 656번째부터 2242번째까지의 뉴클레오타이드 서열 (서열번호 161)과 3' 말단쪽에 NM_198827의 2033번째부터 3184번째까지의 뉴클레오타이드 서열(서열번호 167)이 연결된 융합 유전자(서열번호 172; 융합부위: 서열번호 173)일 수 있다.
상기 TXNRD1-GPR133 융합 단백질은 N-말단쪽에 상기한 바와 같은 TXNRD1 단백질 또는 단편과, C-말단쪽에 상기한 바와 같은 GPR133 단백질 또는 단편이 연결된 융합 단백질로서, 예컨대 5' 말단쪽에 NM_003330, NM_001093771, NM_182729, NM_182743, NM_182742 등의 첫번째 엑손에서 엑손 17까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_198827의 엑손 14부터 마지막 엑손까지 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 구체예에서, 서열번호 172의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열(서열번호 174; 융합부위: 서열번호 175) 또는 상기 서열과 적어도 90% 이상, 구체적으로 95% 이상, 보다 구체적으로 99% 이상의 서열 상동성을 갖는 폴리펩타이드 분자일 수 있다.
본 명세서에 사용된 바로서, 첫 번째 엑손과 마지막 엑손은 엑손 번호와 무관하게 주어진 accession number의 염기서열에서 첫 번째 위치하는 엑손과 마지막에 위치하는 엑손을 각각 의미하며, 엑손 번호는 NCBI의 서열 정보에서 부여된 번호에 따른다.
한편, SCAF11 유전자의 5UTR부위가 PDGFRA 유전자 또는 이의 단편과 융합된 융합 유전자의 경우, PDGFRA 유전자 또는 이의 단편의 발현율이 현저하게 증가되며, 이러한 현상은 암 환자에서 특이적으로 관찰됨을 확인하였다. 따라서, 본 발명의 다른 예는 SCAF11 유전자의 5UTR부위 및 PDGFRA 유전자 또는 이의 단편이 융합된 폴리뉴클레오타이드 분자(SCAF11-PDGFRA 융합 유전자), 및 상기 폴리뉴클레오타이드 분자의 암 진단 마커로서의 용도를 제공한다.
SCAF11 (SR-related CTD-associated factor 11) 단백질을 암호화 하는 SCAF11 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 12(q12)에 위치한다. SCAF11의 5UTR 부위는 SCAF11-PDGFRA 융합 유전자의 5' 말단쪽 융합 파트너이다. 구체예에서, SCAF11 유전자는 GenBank accession no. NM_004719에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, SCAF11의 5UTR 부위는 NM_004719에 제공되는 뉴클레오타이드 서열 중 1번째부터 266번째까지의 뉴클레오타이드 서열 (엑손 1에 해당; 염색체상 위치((-) strand)-chr12:46384136-46384401; 염색체상 breakpoint-chr12:[46384136; 서열번호 176; 융합 부위-서열번호 177)을 갖는 폴리뉴클레오타이드 분자일 수 있다.
PDGFRA (platelet-derived growth factor receptor, alpha polypeptide) 단백질을 암호화 하는 PDGFRA 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 4(q12)에 위치한다. PDGFRA 유전자 또는 유전자 단편은 SCAF11-PDGFRA 융합 유전자의 3' 말단쪽 융합 파트너이다. 구체예에서, PDGFRA 유전자는 GenBank accession no. NM_006206 에 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, PDGFRA 융합 유전자의 단편은 NM_006206의 CDS 부위 (332번째부터 3601번째까지의 염기서열; 총길이 3270 bp)를 포함하는 것으로, 상기 CDS 부위의 5' 말단에 12bp의 5UTR 부위 (NM_006206의 120번째부터 331번째까지의 염기서열)를 추가로 포함하는 것일 수 있으며, 이는 NM_006206의 엑손 2(염색체상 위치((+) strand)-chr4:55124924-55124984; 염색체상 breakpoint-chr12:120180269])부터 마지막 엑손까지를 포함하는 유전자 단편으로 표현될 수 있다 (서열번호 178; 융합 부위-서열번호 179)을 갖는 폴리뉴클레오타이드 분자일 수 있다.
상기 SCAF11-PDGFRA 융합 유전자는 서열번호 180 (융합부위: 서열번호 181)의 뉴클레오타이드 서열을 갖는 것일 수 있다.
별다른 언급이 없는 한, 본 명세서에 기재된 DNA 분자를 시퀀싱하여 결정된 모든 뉴크레오타이드 서열들은 자동화된 DNA 시퀀서(예컨대, Applied Biosystems, Inc.에서 제조된 Model 373)를 사용하여 결정될 수 있고, 결정된 뉴클레오타이드 서열에 의하여 암호화되는 모든 아미노산 서열들은 자동화된 펩타이드 시퀀서를 사용하여 결정된 것이다. 이 자동화된 접근에 의하여 결정된 뉴클레오타이드 서열은 실제 서열과 비교하여 일부 에러를 포함할 수 있다. 예컨대, 자동에 의하여 결정된 뉴크레오타이드 서열들은 시퀀싱된 DNA 분자의 실제 뉴클레오타이드 서열과 전형적으로 약 90% 이상, 구체적으로 약 95% 이상, 보다 구체적으로 약 99% 이상, 더욱 구체적으로 약 99.9% 이상의 서열 상동성을 가질 수 있다. 실제 서열과 비교하여 결정된 뉴클레오타이드에서 하나의 삽입 또는 결손은 포함할 수 있으며, 이와 같은 삽입 또는 결손에 의하여 뉴클레오타이드 서열 번역시의 프레임 쉬프트가 야기되어, 암호화되는 아미노산 서열이 실제 아미노산 서열과 완전하게 다르게 될 수 있다.
본 발명에 따른 융합 단백질 및/또는 융합 유전자는 고형암, 구체적으로 폐암, 특히 폐선암과 같은 비소세포암(NSCLC) 환자에게서 특이적으로 발견되거나 발현되는 것으로 확인되었으므로, 상기 융합 단백질 및/또는 이를 암호화하는 융합 유전자 및/또는 SCAF11-PDGFRA 융합 유전자는 고형암, 구체적으로 폐암, 특히 폐선암과 같은 비소세포암(NSCLC)의 진단 마커로서 유용하다.
이에, 본 발명의 또 다른 예는 상기 융합 단백질에 특이적으로 결합하는 분자, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자 및/또는 상기 융합 유전자에 상응하는 mRNA(전사체)와 상호작용(예컨대, 결합)하는 물질을 포함하는 암 진단용 약학 조성물을 제공한다.
상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질 발현(또는 존재) 여부를 검출하기 위한 물질로서, 상기 융합 단백질 또는 상기 융합 단백질의 융합 부위(break point)의 아미노산 서열에 특이적으로 결합하는 항체, 압타머 등으로 이루어진 군에서 선택된 것일 수 있다.
또한, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 또는 이들 융합 유전자에 상응하는 mRNA와 상호작용하는 물질은 상기 융합유전자 또는 mRNA와 혼성화 가능한 핵산 분자일 수 있다. 예컨대, 상기 핵산 분자는 생물 시료 내의 상기 융합 유전자, 상기 융합 유전자의 융합 부위, 또는 상기 융합 유전자 또는 융합 부위에 상응하는 mRNA(발현 전사체)와 특이적으로 혼성화 가능한 안티센스 올리고뉴클레오타이드 (예컨대, siRNA, 마이크로RNA 등), 프로브(예컨대, 5 내지 100 bp, 5 내지 50bp, 5 내지 30bp, 또는 5 내지 25bp), 앱타머 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 다른 구체예에서, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 또는 이들 융합 유전자에 상응하는 mRNA 분자와 혼성화 가능한 핵산 분자는 상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개, 구체적으로 100 내지 200개의 염기로 이루어진 폴리뉴클레오타이드 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편의 양 말단에 인접하는 20 내지 100개, 구체적으로 25 내지 50개의 염기서열 또는 이와 상보적인 서열과 혼성화 가능한 20 내지 100bp, 또는 25 내지 50bp 길이의 프라이머쌍일 수 있다. 상기 '혼성화 가능하다'함은 검출 대상 염기서열과 완전히 상보적이거나, 80% 이상 (예컨대 80-100%), 구체적으로 90% 이상 (예컨대 90-100%) 상보적인 염기서열을 가져서 상기 검출 대상 유전자 또는 mRNA와 특이적으로 결합 가능함을 의미한다. 예컨대, 각 융합 유전자에 혼성 가능한 프라이머쌍을 아래의 표 46에 예시하였다.
표 46
융합 유전자 | 융합부위 | Forward Primer Sequence | Reverse Primer Sequence |
CCDC6-ROS1 | 서열번호 14 | CCTGCAGGAAAAATTAGACCAG (SEQ ID NO: 182) | AGCTCAGCCAACTCTTTGTCTT(SEQ ID NO: 183) |
SCAF11-PDGFRA | 서열번호 181 | CAGCGGAGTCAGTGTCCTAGAG(SEQ ID NO: 184) | TGAGAAGACAGCCTAAGACCAG(SEQ ID NO: 185) |
FGFR2-CIT | 서열번호 30 | ACATGATGATGAGGGACTGTTG(SEQ ID NO: 186) | ACAGCTGTTACGAAGAGCATCA(SEQ ID NO: 187) |
AXL-MBIP | 서열번호 46 | GCCTGACGAAATCCTCTATGTC(SEQ ID NO: 188) | CAAAATTCCCTGACGTTGTTTT(SEQ ID NO: 189) |
APLP2-TNFSF11 | 서열번호 62 | TGCTGAGAACAAAGATCGCTTA(SEQ ID NO: 190) | TGTCGGTGGCATTAATAGTGAG(SEQ ID NO: 191) |
MAP4K3-PRKCE | 서열번호 78 | AGGAGGACTTCGAGCTGATTC(SEQ ID NO: 192) | ACGACCCTGAGAGATCGATGA(SEQ ID NO: 193) |
BCAS3-MAP3K3 | 서열번호 94 | CATCCCGTCCAGTCTCTGAT(SEQ ID NO: 194) | CTGCCTATTTGAGTGACCTGTG(SEQ ID NO: 195) |
KRAS-CDH13 | 서열번호 110 | GGAAATAAATGTGATTTGCCTTC(SEQ ID NO: 196) | AAGGCTGTCTCTGATTCTCTGG(SEQ ID NO: 197) |
ZFYVE9-CGA | 서열번호 125 | ACTGCAGAGAACATGGATTCCT(SEQ ID NO: 198) | GAATGGAGAACATGCAGAAACA(SEQ ID NO: 199) |
ERBB2IP-MAST4 | 서열번호 141 | AACAAGGGTACAACCTGAAGGA(SEQ ID NO: 200) | TCAAGGAAGTATCGTGAGGTGA(SEQ ID NO: 201) |
TPD52L1-TRMT11 | 서열번호 157 | GAAAACACATGAAACCCTGAGTC(SEQ ID NO: 202) | ATGTGTGACTGGAAAGCTTCTG(SEQ ID NO: 203) |
TXNRD1-GPR133 | 서열번호 173 | TCCAAATGCTGGAGAAGTTACA(SEQ ID NO: 204) | AGTACACGAAGACTCGGTTGCT(SEQ ID NO: 205) |
일 구체예에서, 상기 융합 단백질 또는 융합 유전자 또는 mRNA와 특이적으로 상호작용하는 물질은 자유 래디컬, 방사성-동위원소, 형광염료, 발색기질, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상의 면역화학적 표지 물질이 부착되거나, 상기 표지 물질과 함께 사용될 수 있다.
또 다른 예는 환자로부터 얻은 생물 시료에서 상기 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 및/또는 상기 융합 유전자에 상응하는 mRNA를 검출하는 단계를 포함하는 암 진단에 정보를 제공하는 방법을 제공한다.
상기 생물 시료에서 상기 융합 단백질, 융합 유전자, 및/또는 mRNA를 검출하는 단계는 i) 상기 생물 시료에 상기 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, SCAF11-PDGFRA 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA로 이루어진 군에서 선택된 1종 이상과 상호작용하는 물질을 처리(첨가)하고 반응시키는 단계; 및 ii) 상기 얻어진 반응물을 검출하는 단계를 포함할 수 있다. 상기 단계 i) 이전에 생물 시료를 준비하는 단계를 추가로 포함할 수 있으며, 상기 생물 시료를 준비하는 단계는 환자로부터 생물 시료를 얻는(분리하는) 단계를 포함하는 것일 수 있다. 상기 단계 i)에서 상기 상호작용하는 물질은 상기 융합 단백질 (전부 또는 일부; 예컨대 융합 부위)에 특이적으로 결합하는 화합물, 항체, 앱타머, 및 상기 융합 유전자 및/또는 mRNA (전부 또는 일부; 예컨대 융합 부위)에 결합하는 핵산 분자 (예컨대, 프라이머, 프로브, 앱타머 등), 화합물 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 앞서 설명한 바와 같이, 이들 상호작용 하는 물질은 자유 래디컬, 방사성-동위원소, 형광염료, 발색기질, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상의 면역화학적 표지 물질이 부착되거나, 상기 표지 물질과 함께 사용될 수 있다. 상기 단계 ii)에서, 상기 반응물은 단계 i)에서 얻어진 상기 융합 단백질, 융합유전자, 및 mRNA로 이루어진 군에서 선택된 1종 이상과 이와 상호작용하는 물질이 상호작용(결합)하여 생성된 복합체(complex)일 수 있다. 상기 반응물을 검출하는 단계에서 반응물이 검출되면 상기 융합 단백질, 융합 유전자, 및/또는 mRNA이 존재하는 것으로 판단할 수 있다.
상기 암 진단에 정보를 제공하는 방법에 있어서, 생물 시료에서 상기 융합 단백질, 융합 유전자, 및/또는 mRNA의 존재가 확인되면, 상기 환자는 암(고형암), 구체적으로 폐암, 보다 구체적으로 비소세포폐암(NSCLC), 특히 폐선암 환자로 결정할 수 있다.
상기 융합 단백질, 융합 유전자, 및/또는 mRNA의 검출은 통상적인 단백질 또는 유전자 검출 방법에 의하여 수행될 수 있다.
예컨대, 상기 융합 단백질의 검출은 상기 융합 단백질과 상호작용하는 물질, 예컨대 특이적으로 결합하는 물질(예컨대, 항체, 압타머, 또는 화합물 등)를 이용하여 상기 융합 단백질과 상기 물질(예컨대, 항체 또는 압타머)과의 상호작용, 즉 복합체 형성을 검출하는 통상적인 에세이법, 예컨대, 면역크로마토그래피(Immunochromatography), 면역조직화학염색, 효소결합 면역흡착 분석(enzyme linked immunosorbent assay: ELISA), 방사선 면역측정법(radioimmunoassay: RIA), 효소 면역분석(enzyme immunoassay: EIA), 형광면역분석(Floresence immunoassay: FIA), 발광면역분석(luminescence immunoassay: LIA), 웨스턴블라팅(Western blotting) FACS 등에 의하여 검출할 수 있다.
통상적인 단백질 발현 검출 에세이법으로 면역분석 방법을 수행할 수 있다. 유용한 면역분석은 동종 면역분석 또는 이종 면역분석일 수 있다. 동종 분석에서 그 면역학적 반응은 종종 융합 단백질 특이적 시약 (예를 들어, 융합 단백질 특이적 항체), 그 표지된 분석체, 및/또는 분석 대상 생물 시료가 관련된다. 그 표지로부터 일어나는 신호는 그 표지된 분석체에 항체의 결합에 대하여 직접 또는 간접적으로 변형된다. 면역학적 반응 및 그것의 양의 검출 모두는 동종 용액에서 수행된다. 사용 가능한 면역화학적 표지들은 자유 래디컬, 방사성-동위원소, 형광염료, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.
본 명세서에 기재된 그 방법의 실행에 유용한 항체들은 침전과 같은 공지된 기술에 의하여 진단 분석에 적당한 고체 서포트(예를 들어 라텍스 또는 폴리스티렌과 같은 물질로 제조된 웰, 비드, 플레이트 또는 슬라이드)에 부착될 수 있다. 항체들 또는 다른 융합단백질 결합 시약들은, 공지된 기술에 따라, 방사성표지(예를 들어, 35S, 125I, 131I 등), 효소 표지(예를 들어 호스래디쉬 퍼옥시데이즈, 알칼라인 포스페테이즈, 등), 및 형광 표지들 (예를 들어 흐루르세인 등)과 같은 검출될 수 있는 표지 물질과 부착될 수 있다.
유동세포분석법(flow cytometry; FC)와 같은 세포-기반 분석, 면역-조직화학(IHC), 또는 면역형광법(IF)은 그러한 분석 포맷이 임상적으로 적합하고, 생체내에서 융합 단백질 내의 카이네이즈 폴리펩타이드 발현의 검출을 가능하게 하고 추출물을 덜기 위하여 예를 들어 종양 샘플로부터 얻어진 세포들 조작을 야기하는 활성에서 인위적인 변화의 위험성을 회피할 수 있기에 본 발명의 방법을 실행하는데 특히 바람직하다. 따라서 일부 바람직한 구체 예에서, 본 발명의 방법들은 유동세포분석법(flow cytometry; FC)와 같은 세포-기반 분석, 면역-조직화학(IHC), 또는 면역형광법(IF) 분석 포맷을 고안한다.
유동세포 분석법(FC)은 융합 단백질 내의 카이네이즈 활성을 저해하는 타겟된 약물의 처리 전, 처리 동안 및/또는 처리 후에 포유류 종양에서 융합 단백질 내의 카이네이즈 폴리펩타이드 발현을 결정하기 위하여 채택된 분석법일 수 있다. 예를 들어 골수 샘플로부터 유래한 종양 세포들은 그렇게 하는 것이 바람직하다면 암 세포 타입을 동정하기 위한 마커로 뿐만 아니라 융합 단백질 발현 및/또는 활성화에 대한 유동세포 분석법에 의하여 분석될 수 있다.
면역조직화학(IHC) 염색은 융합 단백질 내의 카이네이즈 활성을 저해하는 타겟된 약물로 처리 전, 처리 동안, 및/또는 처리 후에 포유류 암(예를 들어 NSCLC와 같은 고형암)에서 융합 단백질 내의 카이네이즈 단백질의 발현 및/또는 활성화 상태를 결정하기 위하여 채택된 분석법일 수 있다.
면역형광(IF) 분석은 융합 단백질 내의 카이네이즈 활성을 저해하는 타겟팅된 약물로 처리 전, 처리 동안, 및/또는 처리 후에 포유류 암에서 융합 단백질 내의 카이네이즈 폴리펩타이드의 발현 및/또는 활성화 상태를 결정하기 위하여 채택된 분석법일 수 있다.
이에 더하여, 효소-링크된 면역흡수 분석법(ELISA), 방사성-면역분석(RIA), 형광-활성화된 세포 소팅(FACS) 등을 포함하는 다른 여러 프로토콜들이 당업계에 공지되어 있으며, 융합 단백질 발현의 변경된 또는 비정상적인 레벨을 진단하는 방법도 사용 가능하다.
종양으로부터 유래된 세포들을 포함하는 생물 시료에서 발현된 융합 단백질의 검출/정량화를 위한 AQUA 펩타이드들은 표준 AQUA 분석에서 사용되고 제조될 수 있다. 따라서 본 발명의 방법들의 일부 바람직한 구체예에서, 융합 단백질 특이적 시약은 상술된 것과 같이 융합 단백질 또는 융합 접합점을 포함하는 펩타이드 서열에 해당하는 서열 중 동위원소 표지된 포스포펩타이드(AQUA 펩타이드)를 포함할 수 있다.
또한, 상기 융합 유전자 및/또는 이에 상응하는 mRNA의 검출은 상기 융합 유전자 또는 mRNA와 상호작용하는 물질, 예컨대 혼성화 가능한 핵산 분자 (예컨대, 프로브, 앱타머, 또는 프라이머 등)를 사용하는 통상적인 핵산 검출 방법, 예컨대 PCR(polymerase chain reaction), FISH(fluorescent in situ hybridization), UV 분광법(UV spectrometry), 크로마토그래피법, Warburg-Christian법, Schmidt-Thannhauser-Schneider법 등에 의하여 수행될 수 있으나, 이에 제한되는 것은 아니다. 한 구체예에서, 상기 융합 유전자 및/또는 이에 상응하는 mRNA의 검출은 대규모 병렬 염기서열 분석(massively parallel sequencing) 기술을 통한 전체-전사체(whole-transcriptome; RNA) 또는 전체-게놈(whole-genome; DNA) 시퀀싱의 통합 기술에 의하여 수행될 수 있다. 상기 핵산 분자 검출에 유용한 융합 유전자 또는 mRNA에 특이적인 시약(상호작용하는 물질)들은 생물 시료에서 융합 또는 트런케이트된 폴리펩타이드 발현 전사체와 직접 교잡하고 검출할 수 있는 siRNA, 올리고뉴크레오타이드 또는 DNA 프로브일 수 있다.
상기 환자는 인간을 포함하는 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류를 포함하는 포유류, 구체적으로 인간일 수 있다.
상기 생물 시료는 상기 환자로부터 분리된 세포(예컨대, 폐세포 등), 조직(예컨대, 폐조직 등), 체액(예컨대, 혈액 등) 등일 수 있다. 보다 구체적으로, 본 발명에서 유용한 생물 시료들은 융합 단백질의 발현에 의하여 특징화되는 암(고형암 또는 비고형암)이 존재하거나 발생된 포유류로부터 얻어질 수 있다. 일 구체예에서, 그 포유류는 인간이고 그 인간은 예를 들어 NSCLC와 같은 암의 치료 대상 환자일 수 있다. 그 인간 환자는 검출 대상 융합 단백질 내의 카이네이즈를 억제하는 치료제로 현재 치료 중이거나 또는 치료를 고려하는 환자일 수 있다. 본 발명에서 사용 적합한 생물 시료는 포유류 암으로부터 유래한(또는 분리된) 세포, 조직 또는 이들의 추출물을 포함하는 하는 것일 수 있다.
본 발명의 암 환자에서 특이적으로 발현하는 융합 단백질은 새로운 암 치료 타겟으로서의 사용될 수 있다.
따라서, 본 발명의 또 다른 예는 상기 융합 단백질의 억제제, SCAF11-PDGFRA 융합 유전자의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 유효성분으로 포함하는 암 예방 및/또는 치료용 약학 조성물을 제공한다.
다른 예는 상기 융합 단백질의 억제제, SCAF11-PDGFRA 융합 유전자의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상의 약학적 유효량을 암의 예방 및/또는 치료를 필요로 하는 환자에게 투여하는 단계를 포함하는 암의 예방 및/또는 치료 방법을 제공한다.
또 다른 예는 상기 융합 단백질의 억제제, SCAF11-PDGFRA 융합 유전자의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 포함하는 조성물의 암 예방 및/또는 치료를 위한 용도를 제공한다.
상기 환자는 인간을 포함하는 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류를 포함하는 포유류, 구체적으로 인간일 수 있다.
상기 억제제는 경구 또는 비경구로 투여할 수 있다. 비경구 투여인 경우에는 정맥내 주입, 피하 주입, 근육 주입, 복강 주입, 내피 투여, 국소 투여, 비내 투여, 폐내 투여 또는 직장내 투여 등으로 투여할 수 있다.
본 명세서에 있어서 "약학적 유효량"은 약물이 약학적으로 의미있는 효과를 나타낼 수 있는 양을 의미한다. 1회 투여를 위한 억제제의 약학적 유효량은 제제화 방법, 투여 방식, 환자의 연령, 체중, 성, 병적 상태, 음식, 투여 시간, 투여 간격, 투여 경로, 배설 속도 및 반응 감응성과 같은 요인들에 따라서 다양하게 처방될 수 있다.
상기 융합 단백질의 억제제는 상기 융합 단백질에 결합하여 그 기능을 상실시키거나 저하시키는 물질로서, 상기 융합 단백질에 대한 항체, 압타머, 또는 통상적인 키나제 저해제(티로신 키나제를 포함하는 융합유전자의 경우: CCDC6-ROS1, SCAF11-PDGFRA, FGFR2-CIT, AXL-MBIP, MAP4K3-PRKCE, BCAS3-MAP3K3, ERBB2IP-MAST4), 신호 전달 저해제 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 상기 융합 단백질을 암호화하는 융합 유전자 또는 이에 상응하는 mRNA의 억제제는 상기 DNA 분자에 결합하여, 융합 단백질로 발현하지 못하도록 하는 물질로서, 상기 DNA 분자에 특이적으로 결합하는 siRNA, shRNA, 마이크로RNA, 압타머 등으로 이루어진 군에서 선택된 1종 이상의 것일 수 있다.
상기 암 진단용 조성물, 암 진단에 정보를 제공하는 방법, 및 암의 예방 및/또는 치료용 조성물의 진단 또는 치료 대상이 되는 암은 모든 종류의 고형암일 수 있다. 예컨대 상기 고형암은 폐암, 간암, 대장암, 췌장암, 위암, 유방암, 난소암, 신장암, 갑성선암, 식도암, 전립선암, 뇌암 등일 수 있다. 구체예에서 상기 고형암은 폐암일 수 있으며, 보다 구체적으로 소세포폐암 (small cell lung cancer, SCLC), 또는 폐선암(lung adenocarcinoma), 편평세포폐암(Squamous cell lung carcinoma), 또는 대세포폐암 Large cell lung carcinoma)과 같은 비소세포폐암(non-small cell lung cancer, NSCLC)일 수 있고, 예컨대 폐선암일 수 있다.
또 다른 예는 상기 융합 단백질을 이용한 항암제 스크리닝 방법을 제공한다.
일 구체예에서, 상기 스크리닝 방법은,
상기 융합 단백질 및/또는 상기 SCAF11-PDGFRA 융합 유전자를 발현하는 세포에 후보 물질을 처리하는 단계; 및
상기 세포에서의 융합 단백질 및/또는 상기 융합 유전자의 발현 정도를 측정하는 단계를 포함하고,
상기 후보 물질이 처리된 세포에서의 융합 단백질 및/또는 상기 융합 유전자의 발현 정도가 상기 후보 물질 처리 전 또는 상기 후보 물질이 처리되지 않은 세포와 비교하여 감소한 경우, 상기 후보 물질을 항암제로 결정하는 것을 특징으로 하는 것일 수 있다. 상기 융합 단백질의 발현 정도는 융합 단백질의 수준을 측정하거나, 상기 융합 단백질을 암호화하는 융합 유전자 또는 상기 융합 유전자에 상응하는 mRNA의 수준을 측정하여 측정될 수 있다.
상기 항암제 스크리닝 방법은 상기 후보 물질을 처리하는 단계 이전에, 상기 후보 물질 처리 전 세포 내의 융합 단백질 및/또는 융합 유전자의 발현 정도를 측정하는 단계를 추가로 포함하여, 동일한 세포에서의 후보 물질 처리 후의 융합 단백질 및/또는 융합 유전자의 발현 정도가 후보 물질 처리 전의 융합 단백질 및/또는 융합 유전자의 발현 정도보다 감소한 경우, 상기 후보 물질을 항암제로 결정할 수 있다. 또 다른 예에서, 상기 항암제 스크리닝 방법은 상기 융합 단백질 및/또는 상기 융합 유전자를 발현하는 세포를 준비하고, 이들 세포 중 일부에 후보 화합물을 처리하고, 후보 화합물이 처리된 일부 세포와 후보 물질이 처리되지 않은 나머지 세포에서의 상기 융합 단백질 및/또는 융합 유전자의 발현 정도를 측정하는 단계를 포함하여, 후보 물질이 처리된 세포에서의 융합 단백질 및/또는 융합 유전자의 발현 정도가 후보 물질이 처리되지 않은 세포에서의 융합 단백질 및/또는 융합 유전자의 발현 정도보다 감소한 경우, 상기 후보 물질을 항암제로 결정할 수 있다.
상기 스크리닝 방법에서 사용되는 세포는 상기한 융합 단백질 중 1종 이상이 발현 및/또는 활성화되는 암 (예컨대, 스크리닝하고자 하는 항암제가 항암 활성을 보이기를 소망하는 암)으로부터 유래하는 세포, 상기 세포의 추출물, 또는 상기 세포를 통상의 방법으로 배양한 것을 포함할 수 있다.
상기 융합 단백질 및/또는 융합 유전자를 발현하는 세포는 앞서 설명한 바와 같은 암세포, 특히 고형암 세포, 구체적으로 폐암 세포, 보다 구체적으로 폐선암 세포일 수 있다.
상기 융합 단백질의 발현 수준의 측정은 통상적인 단백질 측정법인 면역크로마토그래피(Immunochromatography), 면역조직화학염색, 효소결합 면역흡착 분석(enzyme linked immunosorbent assay: ELISA), 방사선 면역측정법(radioimmunoassay: RIA), 효소 면역분석(enzyme immunoassay: EIA), 형광면역분석(Floresence immunoassay: FIA), 발광면역분석(luminescence immunoassay: LIA), 웨스턴블라팅(Western blotting), FACS 등에 의하여 수행할 수 있으나, 이에 제한되는 것은 아니다. 상기 융합 유전자 또는 mRNA의 수준은 통상적인 유전자 정량 방법, 예컨대, PCR, FISH, UV 분광법, 크로마토그래피법, Warburg-Christian법, Schmidt-Thannhauser-Schneider법 등에 의하여 측정될 수 있으나, 이에 제한되는 것은 아니다.
상기 후보 물질은 모든 천연 또는 합성 화합물을 포함하는 의미로, 일반 화합물, DNA, RNA, 단백질 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.
후보 물질이 융합 단백질에 의하여 특성화되는 종양의 진행을 저해하는지를 결정하기 위한 방법의 실행에 있어서, 포유류 이종이식 유래 세포들을 포함하는 생물 시료를 채택할 수 있다. 바람직한 이종이식(또는 이식 수용체)는 융합 단백질을 발현하는 인간 종양 세포 시료 또는 상기 세포들을 가지는 마우스와 같은 작은 포유류일 수 있다. 포유류 암 종양으로부터 유래한 세포들을 포함하는 생물학적 샘플에서 융합 단백질의 존재 또는 발현을 평가하는데 있어서, 그러한 전위 및/또는 융합 단백질이 발생하지 않는 세포를 대조군으로 채택할 수 있다. 바람직하게는 대조군 시료는 상기한 바와 같은 융합 단백질 발현이 존재하지 않는 동일 조직의 정상 세포 (예컨대 종양 주변의 정상 세포), 또는 상기 융합 단백질이 발현되지 아니하는 특정 암(예를 들어 NSCLC)에서 유래하는 암세포들을 포함할 수 있다.
상기 스크리닝 방법에 의하여 개발된 항암제의 치료 대상 암 종류는 상기한 바와 같다.
본 발명에서 제공되는 폐암, 특히 폐선암에서 특이적으로 발현하는 융합 단백질 및/또는 이를 암호화하는 DNA 분자/mRNA는 폐암 진단 마커 및 더 나아가 치료 타겟으로서 유용하다.
이하, 본 발명을 실시예에 의해 상세히 설명한다.
단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.
실시예 1: 암시료의 준비
서울대학병원 및 서울카톨릭성모병원에서 엽절제술(lobectomy)을 받은 환자로부터 얻은 일차 폐선암 수술 표본 200개를 수집하였다(서울대학병원: n=164; 2010년부터 20119월까지, 서울카톨릭성모병원: n=36; 2009년~2011년 동안 tissue bank에 기탁된 샘플들). 본 발명자들의 이전 연구(Ju YS et al.Genome Res. 2012 22:436-445)로부터 20명의 환자가 이 시험군에 포함되었다. 각각의 환자에 대하여, 진단, 성별, 암단계 및 흡연 상태를 기록하였다. 암환자 200명 중에서, 여성 및 비흡연자의 비율은 각각 54.5% (n=109) 및 58.0% (n=116) 이었다.
이전 보고된 방법(Ju YS et al.Genome Res. 2012 22:436-445)에 의하여, 200개의 폐선암 조직의 서브셋에서의 잘 알려진 3개의 핵심 돌연변이에 대한 스크리닝 유전자 시험을 수행하였다(EGFR 의 엑손 18-21은 PCR 및 Sanger sequencing (n=164)에 의하여 시험; KRAS의 exon 2는 PCR 및 Sanger sequencing (n=37)에 의하여 시험; EML4-ALK 융합 유전자는 형광 in-situ 혼성화(fluorescent in-situ hybridization)(FISH; n=163)에 의하여 시험; Supplementary Figure 1; Supplementary Table 1). 200개의 암조직 중에서 100개는 EGFR (n=99), KRAS (n=6) 및 EML4-ALK (n=7) 중 하나의 핵심 돌연변이에 대하여 양성이었다. 이들 돌연변이는 2개 샘플(1 EGFR
+
KRAS
+ 및 1 EGFR
+
EML4-ALK
+)을 제외하고 실질적으로 상호 배타적이었다. 나머지 90개에서의 핵심 돌연변이는 알려지지 않았다.
이들 90개 샘플을 RNA 시퀀싱의 타겟으로 하였다. RNA quality control(RNA Integrity Number(RIN) Standardization of RNA Quality Control: Agilent Tech.)을 통과하지 못한 3개의 샘플을 제외하고, 나머지 87개 폐선암 샘플로부터 mRNA 서열을 얻었다. 그리고 나서, 인접한 정상 폐조직의 전사체(transcriptome; n=77) 및 전체 엑솜(whole-exome; n=76) 시퀀싱을 수행하여 암조직 및 정상조직을 비교하였다 (Supplementary Table 1). 모든 시퀀싱 시험은 "Ju YS et al.Genome Res. 2012 22:436-445"에 기재된 방법에 따라서 수행하였다.
164개 샘플 (87개의 암조직 샘플 및 77개의 대응 정상 조직 샘플; Supplementary Table 2)로부터 14,038,673,860 paired-end 101bp-long reads를 생성하였다. 평균적으로, RNA 시퀀싱 처리량(throughputs)은 암조직 및 정상 조직에 대하여 각각 9.77 및 7.38 Gbp이었다. 76개 정상 조직의 전체-엑솜 시퀀싱에서, 타겟팅 부위에 대하여 paired-정상 조직당 32.96?read depth를 얻었다.
실시예 2: 융합 유전자 분석
그리고 난 후, 최근 몇몇 전이(transforming) 융합 유전자들이 핵심 돌연변이로서 폐선암에서 검출되고 있기 때문에, 융합 유전자 검출에 초점을 두었다. "Ju YS et al.Genome Res. 2012 22:436-445"에 기재된 유전자 융합 프로그램(GFP)을 이용하여, 87개 암조직 샘플로부터 45개의 인-프레임 융합 전사체를 동정하였다.
전사체 (transcriptome) 시퀀싱을 이용한 융합유전자 검출을 위하여, 약 300bp 길이의 cDNA 조각의 양쪽 말단 101bp씩을 차세대 서열 분석법(Ju YS et al.Genome Res. 2012 22:436-445)으로 서열을 규명하고, 양쪽 말단이 상이한 유전자 서열로 구성되어 있는 불일치 서열 (discordant read)을 찾아내었다. 또한 한쪽 말단 서열이 융합 유전자의 분점(breakpoint)으로부터 생성됨으로써 상이한 두 유전자 서열의 조합으로 되어있는 엑손-스패닝 서열 (exon-spanning read) 을 찾아내었다. 불일치 서열과 엑손-스패닝 서열은 모두 융합 유전자의 존재를 시사하는 서열이다. 불일치 서열과 엑손-스패닝 서열을 모두 가지고 있는 한쌍의 유전자를 최종 융합 유전자 후보로 선정하였고, 이 가운데 아미노산 서열 상 원래 유전자의 코돈 프레임이 유지되는 인-프레임 융합 유전자를 최종 폐암 융합 유전자로 선정하였다.
이들 45개 전사체의 융합된 유전자와 각 유전자가 위치하는 염색체와 각 유전자 간 거리를 아래의 표 47에 정리하였다.
표 47
Index | DonorGene | AcceptorGene | Chromosome(Donor;Acceptor) | Distance (Mb) |
1 | EML4 | ALK | chr2;chr2 | 12.252 |
2 | KIF5B | RET | chr10;chr10 | 11.227 |
2 | KIF5B | RET | chr10;chr10 | 11.227 |
2 | KIF5B | RET | chr10;chr10 | 11.227 |
2 | KIF5B | RET | chr10;chr10 | 11.227 |
3 | CD74 | ROS1 | chr5;chr6 | Interchromosomal |
4 | SLC34A2 | ROS1 | chr4;chr6 | Interchromosomal |
5 | CCDC6 | ROS1 | chr10;chr6 | Interchromosomal |
6 | SCAF11 | PDGFRA | chr12;chr4 | Interchromosomal |
7 | FGFR2 | CIT | chr10;chr12 | Interchromosomal |
8 | AXL | MBIP | chr19;chr14 | Interchromosomal |
9 | APLP2 | TNFSF11 | chr11;chr13 | Interchromosomal |
10 | MAP4K3 | PRKCE | chr2;chr2 | 6.215 |
11 | BCAS3 | MAP3K3 | chr17;chr17 | 2.23 |
12 | KRAS | CDH13 | chr12;chr16 | Interchromosomal |
13 | ZFYVE9 | CGA | chr1;chr6 | Interchromosomal |
14 | ERBB2IP | MAST4 | chr5;chr5 | 0.515 |
15 | TPD52L1 | TRMT11 | chr6;chr6 | 0.723 |
16 | TXNRD1 | GPR133 | chr12;chr12 | 26.694 |
17 | SRSF4 | SNRNP40 | chr1;chr1 | 2.224 |
18 | EDA | MID1 | chrX;chrX | 57.984 |
19 | HYOU1 | C11orf93 | chr11;chr11 | 7.736 |
20 | SLC16A7 | MUCL1 | chr12;chr12 | 4.831 |
21 | MIER2 | ITGB1BP3 | chr19;chr19 | 3.588 |
22 | RBM14 | FGF3 | chr11;chr11 | 3.211 |
23 | UBR4 | ATP13A2 | chr1;chr1 | 2.063 |
24 | TTC19 | ATPAF2 | chr17;chr17 | 1.989 |
25 | IGSF3 | MAN1A2 | chr1;chr1 | 0.7 |
26 | XAF1 | FAM64A | chr17;chr17 | 0.305 |
27 | IL6ST | KDM1B | chr5;chr6 | Interchromosomal |
28 | UBE2E1 | ASCC3 | chr3;chr6 | Interchromosomal |
29 | XRCC1 | MAL | chr19;chr2 | Interchromosomal |
30 | BRWD1 | CCDC46 | chr21;chr17 | Interchromosomal |
31 | SPTLC3 | MAOA | chr20;chrX | Interchromosomal |
32 | UTRN | OS9 | chr6;chr12 | Interchromosomal |
33 | LOC100306951 | NUP93 | chr17;chr16 | Interchromosomal |
34 | MGAT5 | HNMT | chr2;chr2 | 3.515 |
35 | MAP3K3 | PECAM1 | chr17;chr17 | 0.623 |
36 | CMBL | C8orf38 | chr5;chr8 | Interchromosomal |
37 | ITGB1BP3 | DNM2 | chr19;chr19 | 6.886 |
38 | LSM14A | SIPA1L3 | chr19;chr19 | 3.677 |
39 | RAB21 | FRS2 | chr12;chr12 | 2.175 |
40 | ARHGEF16 | TCTEX1D4 | chr1;chr1 | 41.874 |
41 | MMP14 | H19 | chr14;chr11 | Interchromosomal |
42 | H19 | CALR | chr11;chr19 | Interchromosomal |
43 | SFTPB | DPYSL2 | chr2;chr8 | Interchromosomal |
44 | SFTPA2 | SFTPB | chr10;chr2 | Interchromosomal |
45 | FTL | SFTPA2 | chr19;chr10 | Interchromosomal |
하기의 표 48에 상기 45개 전사체의 donor 부위의 절단 지점(전사체 기준으로 3'-말단 절단 지점), 절단 지점에 해당하는 아미노산 서열, 및 절단 지점이 위치하는 엑손을 각 유전자 (변형체 포함) 별로 나타내었다.
표 48
Index | Donor Breakpoint(RNA) | Donor protein sequence near breakpoint | Donor exon number |
1 | chr2:42522656] | TPGKGPK+1nt | EML4(NM_001145076,+strand),exon12(chr2:42522521-42522656;EML4(NM_019063,+strand),exon13(chr2:42522521-42522656; |
2 | chr10:[32317356 | NNDVK | KIF5B(NM_004521,-strand),exon15(chr10:32317356-32317499; |
2 | chr10:[32306980 | KVHKQ | KIF5B(NM_004521,-strand),exon23(chr10:32306980-32307084; |
2 | chr10:[32317356 | NNDVK | KIF5B(NM_004521,-strand),exon15(chr10:32317356-32317499; |
2 | chr10:[32317356 | NNDVK | KIF5B(NM_004521,-strand),exon15(chr10:32317356-32317499; |
3 | chr5:[149784243 | DAPPK+1nt | CD74(NM_004355,-strand),exon6(chr5:149784243-149784330;CD74(NM_001025159,-strand),exon6(chr5:149784243-149784330; |
4 | chr4:25678324] | SREAQ+1nt | SLC34A2(NM_006424,+strand),exon13(chr4:25677757-25680366;SLC34A2(NM_001177998,+strand),exon13(chr4:25677757-25680366;SLC34A2(NM_001177999,+strand),exon13(chr4:25677757-25680366; |
5 | chr10:[61572393 | AAQLQ+1nt | CCDC6(NM_005436,-strand),exon5(chr10:61572393-61572553; |
6 | chr12:[46384136 | 5UTR | SRSF2IP(NM_004719,-strand),exon1(chr12:46384136-46384401; |
7 | chr10:[123243212 | LTLTTNE | FGFR2(NM_001144914,-strand),exon14(chr10:123243212-123243317;FGFR2(NM_001144916,-strand),exon14(chr10:123243212-123243317;FGFR2(NM_001144915,-strand),exon16(chr10:123243212-123243317;FGFR2(NM_001144917,-strand),exon15(chr10:123243212-123243317;FGFR2(NM_001144918,-strand),exon15(chr10:123243212-123243317;FGFR2(NM_022970,-strand),exon17(chr10:123243212-123243317;FGFR2(NM_000141,-strand),exon17(chr10:123243212-123243317;FGFR2(NM_001144913,-strand),exon16(chr10:123243212-123243317;FGFR2(NM_001144919,-strand),exon16(chr10:123243212-123243317; |
8 | chr19:41765701] | LTAAE | AXL(NM_021913,+strand),exon20(chr19:41765458-41767670;AXL(NM_001699,+strand),exon19(chr19:41765458-41767670; |
9 | chr11:130000061] | AAQMKSQ | APLP2(NM_001642,+strand),exon11(chr11:129999933-130000061;APLP2(NM_001142276,+strand),exon11(chr11:129999933-130000061;APLP2(NM_001142278,+strand),exon7(chr11:129999933-130000061;APLP2(NM_001142277,+strand),exon10(chr11:129999933-130000061;APLP2(NR_024516,+strand),exon8(chr11:129999933-130000061;APLP2(NR_024515,+strand),exon8(chr11:129999933-130000061; |
10 | chr2:[39664033 | TYGDVYK | MAP4K3(NM_003618,-strand),exon1(chr2:39664033-39664219; |
11 | chr17:59161925] | TVIDAAS+1nt | BCAS3(NM_017679,+strand),exon22(chr17:59161828-59161925;BCAS3(NM_001099432,+strand),exon23(chr17:59161828-59161925; |
12 | chr12:[25378548 | TSAKTRQ | KRAS(NM_004985,-strand),exon4(chr12:25378548-25378707;KRAS(NM_033360,-strand),exon4(chr12:25378548-25378707; |
13 | chr1:52803606] | DKNVSK+2nt | ZFYVE9(NM_007324,+strand),exon15(chr1:52803444-52803606;ZFYVE9(NM_004799,+strand),exon16(chr1:52803444-52803606; |
14 | chr5:65372777] | QPGDKIIQ | ERBB2IP(NM_018695,+strand),exon24(chr5:65372703-65372777;ERBB2IP(NM_001006600,+strand),exon23(chr5:65372703-65372777; |
15 | chr6:125569529] | SKKFGDM+2nt | TPD52L1(NM_003287,+strand),exon4(chr6:125569428-125569529;TPD52L1(NM_001003396,+strand),exon4(chr6:125569428-125569529;TPD52L1(NM_001003397,+strand),exon4(chr6:125569428-125569529;TPD52L1(NM_001003395,+strand),exon4(chr6:125569428-125569529; |
16 | chr12:104733051] | IHPVCAE | TXNRD1(NM_001093771,+strand),exon16(chr12:104732917-104733051;TXNRD1(NM_003330,+strand),exon14(chr12:104732917-104733051;TXNRD1(NM_182729,+strand),exon14(chr12:104732917-104733051;TXNRD1(NM_182743,+strand),exon13(chr12:104732917-104733051;TXNRD1(NM_182742,+strand),exon13(chr12:104732917-104733051; |
17 | chr1:[29485886 | SRCSWQDLK | SRSF4(NM_005626,-strand),exon3(chr1:29485886-29485998; |
18 | chrX:68836548] | DSQDGHQ | EDA(NM_001005610,+strand),exon1(chrX:68835911-68836548;EDA(NM_001005613,+strand),exon1(chrX:68835911-68836548;EDA(NM_001399,+strand),exon1(chrX:68835911-68836548;EDA(NM_001005609,+strand),exon1(chrX:68835911-68836548;EDA(NM_001005612,+strand),exon1(chrX:68835911-68836548; |
19 | chr11:[118921747 | SGVLSLDR | HYOU1(NM_006389,-strand),exon14(chr11:118921747-118921885;HYOU1(NM_001130991,-strand),exon14(chr11:118921747-118921885; |
20 | chr12:60098799] | LAVMYAG+1nt | SLC16A7(NM_004731,+strand),exon2(chr12:60098553-60098799; |
21 | chr19:[325635 | LNRHCEK+1nt | MIER2(NM_017550,-strand),exon7(chr19:325635-325704; |
22 | chr11:66384528] | IECDVVK+1nt | RBM14(NM_006328,+strand),exon1(chr11:66384053-66384528; |
23 | chr1:[19523635 | LSCLYA+1nt | UBR4(NM_020765,-strand),exon8(chr1:19523635-19523759; |
24 | chr17:15930016] | AAVLMHR+1nt | TTC19(NM_017775,+strand),exon9(chr17:15929854-15930016; |
25 | chr1:117156387] | VVNVQPT+1nt | IGSF3(NM_001542,-strand),exon4(chr1:117156387-117156797;IGSF3(NM_001007237,-strand),exon4(chr1:117156387-117156797; |
26 | chr17:6663920] | EQAQLGK+1nt | XAF1(NM_017523,+strand),exon4(chr17:6663725-6663920;XAF1(NM_199139,+strand),exon3(chr17:6663725-6663920; |
27 | chr5:[55290612 | 5UTR | IL6ST(NM_175767,-strand),exon1(chr5:55290612-55290821;IL6ST(NM_002184,-strand),exon1(chr5:55290612-55290821;IL6ST(NM_001190981,-strand),exon1(chr5:55290612-55290821; |
28 | chr3:23847579] | 5UTR | UBE2E1(NM_003341,+strand),exon1(chr3:23847439-23847579;UBE2E1(NM_182666,+strand),exon1(chr3:23847439-23847579; |
29 | chr19:[44079062 | TISVVLQ | XRCC1(NM_006297,-strand),exon2(chr19:44079062-44079154; |
30 | chr21:[40604103 | WRKMDLR | BRWD1(NM_018963,-strand),exon25(chr21:40604103-40604210;BRWD1(NM_033656,-strand),exon25(chr21:40604103-40604210; |
31 | chr20:13074224] | IRIFKHN+1nt | SPTLC3(NM_018327,+strand),exon6(chr20:13074131-13074224; |
32 | chr6:144820563] | LDTEISWAK | UTRN(NM_007124,+strand),exon33(chr6:144820393-144820563; |
33 | chr17:1420387] | 5UTR | LOC100306951(NR_028514,+strand),exon1(chr17:1420213-1420387; |
34 | chr2:135028121] | LEKINVA+1nt | MGAT5(NM_002410,+strand),exon2(chr2:135027957-135028121; |
35 | chr17:61723434] | EHNGER+2nt | MAP3K3(NM_002401,+strand),exon3(chr17:61723394-61723434;MAP3K3(NM_203351,+strand),exon4(chr17:61723394-61723434; |
36 | chr5:[10307737 | 5UTR | CMBL(NM_138809,-strand),exon1(chr5:10307737-10308168; |
37 | chr19:3942267] | ASQQDS+2nt | ITGB1BP3(NM_170678,+strand),exon8(chr19:3942081-3942412; |
38 | chr19:34663668] | NSTVALAK+1nt | LSM14A(NM_015578,+strand),exon1(chr19:34663352-34663668;LSM14A(NM_001114093,+strand),exon1(chr19:34663352-34663668; |
39 | chr12:72176438] | LFLDLCK+1nt | RAB21(NM_014999,+strand),exon6(chr12:72176350-72176438; |
40 | chr1:3392626] | QLDFSKVK | ARHGEF16(NM_014448,+strand),exon10(chr1:3392534-3392626; |
41 | chr14:23316426] | 3UTR | MMP14(NM_004995,+strand),exon10(chr14:23314917-23316802; |
42 | chr11:[2018179 | noncoding | H19(NR_002196,-strand),exon1(chr11:2017748-2019065; |
43 | chr2:[85885042 | 3UTR | SFTPB(NM_000542,-strand),exon12(chr2:85884441-85886805;SFTPB(NM_198843,-strand),exon12(chr2:85884441-85885978; |
44 | chr10:[81319068 | GDPGPP+1nt | SFTPA2(NM_001098668,-strand),exon3(chr10:81319068-81319262; |
45 | chr19:49468806] | NYSTDVE | FTL(NM_000146,+strand),exon1(chr19:49468566-49468866; |
하기의 표 49에 상기 45개 전사체의 acceptor 부위의 절단 지점(전사체 기준으로 5'-말단 절단 지점), 절단 지점에 해당하는 아미노산 서열, 및 절단 지점이 위치하는 엑손을 각 유전자 (변형체 포함) 별로 나타내었다.
표 49
Index | Acceptor Breakpoint(RNA) | Acceptor protein sequence near breakpoint | Acceptor exon number |
1 | chr2:29446394] | 2nt+YRRKHQE | ALK(NM_004304,-strand),exon20(chr2:29446208-29446394; |
2 | chr10:[43612032 | EDPKWEF | RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179; |
2 | chr10:[43612032 | EDPKWEF | RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179; |
2 | chr10:[43612032 | EDPKWEF | RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179; |
2 | chr10:[43612032 | EDPKWEF | RET(NM_020630,+strand),exon12(chr10:43612032-43612179;RET(NM_020975,+strand),exon12(chr10:43612032-43612179; |
3 | chr6:117645578] | 2nt+DFWIP | ROS1(NM_002944,-strand),exon34(chr6:117645495-117645578; |
4 | chr6:117650609] | 2nt+GVPNK | ROS1(NM_002944,-strand),exon32(chr6:117650492-117650609; |
5 | chr6:117642557] | 2nt+WHRRL | ROS1(NM_002944,-strand),exon35(chr6:117642422-117642557; |
6 | chr4:[55124924 | 5UTR, in-frame | PDGFRA(NM_006206,+strand),exon2(chr4:55124924-55124984; |
7 | chr12:120180269] | AHRDEIQ | CIT(NM_007174,-strand),exon23(chr12:120180216-120180269; |
8 | chr14:36783814] | IDRRI | MBIP(NM_016586,-strand),exon4(chr14:36783718-36783814;MBIP(NM_001144891,-strand),exon4(chr14:36783718-36783814; |
9 | chr13:[43174888 | ELQHIVG | TNFSF11(NM_033012,+strand),exon5(chr13:43174888-43174933;TNFSF11(NM_003701,+strand),exon3(chr13:43174888-43174933; |
10 | chr2:[46070139 | IDLEPEGR | PRKCE(NM_005400,+strand),exon2(chr2:46070139-46070202; |
11 | chr17:61710041] | 2nt+EQEALNS | MAP3K3(NM_002401,+strand),exon2(chr17:61710041-61710162;MAP3K3(NM_203351,+strand),exon2(chr17:61710041-61710162; |
12 | chr16:[83158990 | DIFKFAR | CDH13(NM_001257,+strand),exon4(chr16:83158990-83159106; |
13 | chr6:87797925] | 5UTR, in-frame | CGA(NM_000735,-strand),exon2(chr6:87797831-87797925; |
14 | chr5:[66400194 | ATAQMEER | MAST4(NM_001164664,+strand),exon10(chr5:66400194-66400403;MAST4(NM_015183,+strand),exon9(chr5:66400194-66400403; |
15 | chr6:[126342306 | 1nt+YTEEMVP | TRMT11(NM_001031712,+strand),exon12(chr6:126342306-126342426; |
16 | chr12:[131561346 | TRKQHS | GPR133(NM_198827,+strand),exon14(chr12:131561346-131561419; |
17 | chr1:31744346] | VWDLRQN | SNRNP40(NM_004814,-strand),exon6(chr1:31744226-31744346; |
18 | chrX:10463731] | VNASRQE | MID1(NM_001193277,-strand),exon4(chrX:10463624-10463731;MID1(NM_000381,-strand),exon4(chrX:10463624-10463731;MID1(NM_033289,-strand),exon4(chrX:10463624-10463731;MID1(NM_001098624,-strand),exon4(chrX:10463624-10463731;MID1(NM_033290,-strand),exon4(chrX:10463624-10463731;MID1(NM_001193278,-strand),exon4(chrX:10463624-10463731;MID1(NM_001193279,-strand),exon3(chrX:10463624-10463731;MID1(NM_001193280,-strand),exon3(chrX:10463624-10463731; |
19 | chr11:[111175653 | 5 UTR | C11orf93(NM_001136105,+strand),exon3(chr11:111175653-111175707; |
20 | chr12:[55248900 | 2nt+NPTTAAPAD | MUCL1(NM_058173,+strand),exon2(chr12:55248900-55248941; |
21 | chr19:[3942081 | 2nt+YLDGMKS | ITGB1BP3(NM_170678,+strand),exon8(chr19:3942081-3942412; |
22 | chr11:69631191] | 2nt+ILEITAV | FGF3(NM_005247,-strand),exon2(chr11:69631088-69631191; |
23 | chr1:17332273] | 2nt+SSPLVG | ATP13A2(NM_001141973,-strand),exon2(chr1:17332179-17332273;ATP13A2(NM_022089,-strand),exon2(chr1:17332179-17332273;ATP13A2(NM_001141974,-strand),exon2(chr1:17332179-17332273; |
24 | chr17:17931973] | 2nt+RKRFYQN | ATPAF2(NM_145691,-strand),exon2(chr17:17931929-17931973; |
25 | chr1:[118035769 | 2nt+HTSVGGLGD | MAN1A2(NM_006699,+strand),exon9(chr1:118035769-118035884; |
26 | chr17:[6348396 | 5UTR, in-frame | FAM64A(NM_001195228,+strand),exon2(chr17:6348396-6348724;FAM64A(NM_019013,+strand),exon2(chr17:6348396-6348724; |
27 | chr6:[18215238 | KKHSVLM | KDM1B(NM_153042,+strand),exon16(chr6:18215238-18215360; |
28 | chr6:100966018] | AMLDVAAN | ASCC3(NM_006828,-strand),exon38(chr6:100965867-100966018; |
29 | chr2:[95713704 | IFGGLVW | MAL(NM_022438,+strand),exon2(chr2:95713704-95713871;MAL(NM_002371,+strand),exon2(chr2:95713704-95713871; |
30 | chr17:63685336] | VLQDELE | CCDC46(NM_001037325,-strand),exon4(chr17:63685247-63685336;CCDC46(NM_145036,-strand),exon24(chr17:63685247-63685336; |
31 | chrX:[43542761 | 2nt+LSAAKLL | MAOA(NM_000240,+strand),exon2(chrX:43542761-43542855; |
32 | chr12:[58109543 | FLCDEGA | OS9(NM_006812,+strand),exon6(chr12:58109543-58109753;OS9(NM_001017956,+strand),exon6(chr12:58109543-58109753;OS9(NM_001017957,+strand),exon6(chr12:58109543-58109753;OS9(NM_001017958,+strand),exon6(chr12:58109543-58109753; |
33 | chr16:[56870513 | PGVIDKF | NUP93(NM_014669,+strand),exon17(chr16:56870513-56870629; |
34 | chr2:[138758488 | 2nt+EIDLQIL | HNMT(NM_006895,+strand),exon3(chr2:138758488-138758595; |
35 | chr17:62401205] | unidentified | PECAM1(NM_000442,-strand),exon1(chr17:62399864-62401205; |
36 | chr8:[96044223 | 5UTR | C8orf38(NM_152416,+strand),exon2(chr8:96044223-96044322; |
37 | chr19:[10870414 | 1nt+DFLPRGS | DNM2(NM_001190716,+strand),exon2(chr19:10870414-10870487;DNM2(NM_004945,+strand),exon2(chr19:10870414-10870487;DNM2(NM_001005361,+strand),exon2(chr19:10870414-10870487;DNM2(NM_001005362,+strand),exon2(chr19:10870414-10870487;DNM2(NM_001005360,+strand),exon2(chr19:10870414-10870487; |
38 | chr19:[38519729 | 5UTR | SIPA1L3(NM_015073,+strand),exon2(chr19:38519729-38519796; |
39 | chr12:[69924645 | 5UTR | FRS2(NM_006654,+strand),exon2(chr12:69924645-69924740;FRS2(NM_001042555,+strand),exon3(chr12:69924645-69924740; |
40 | chr1:45272510] | 5UTR | TCTEX1D4(NM_001013632,-strand),exon1(chr1:45272456-45272957; |
41 | chr11:2018689] | noncoding | H19(NR_002196,-strand),exon1(chr11:2017748-2019065; |
42 | chr19:[13054527 | AAEKQMK | CALR(NM_004343,+strand),exon9(chr19:13054527-13055304; |
43 | chr8:[26501052 | 1nt+SPPLSPD | DPYSL2(NM_001386,+strand),exon9(chr8:26500955-26501111; |
44 | chr2:85885494] | 3UTR | SFTPB(NM_000542,-strand),exon12(chr2:85884441-85886805;SFTPB(NM_198843,-strand),exon12(chr2:85884441-85885978; |
45 | chr10:81316285] | 3UTR | SFTPA2(NM_001098668,-strand),exon6(chr10:81315609-81317341; |
이들 중에서, 22개 (48.9%)는 염색체내 융합(intra-chromosomal fusions)이었다. cDNA의 PCR 증폭 및 Sanger sequencing을 이용하여 30개의 선별된 융합 유전자 중에서 29개(1-29번)를 validating하였다 (표 50 참조).
표 50
DonorGene | AcceptorGene | Forward Primer Name | Forward Primer Sequence | Reverse Primer Name | Reverse Primer Sequence | |
1 | KIF5B | RET | GF1_KIF5B:RET_F | TAAGGAAATGACCAACCACCAG | GF1_KIF5B:RET_R | CCTTGACCACTTTTCCAAATTC |
2 | KRAS | CDH13 | GF2_KRAS:CDH13_F | GGAAATAAATGTGATTTGCCTTC | GF2_KRAS:CDH13_R | AAGGCTGTCTCTGATTCTCTGG |
3 | APLP2 | TNFSF11 | GF3_APLP2:TNFSF11_F | TGCTGAGAACAAAGATCGCTTA | GF3_APLP2:TNFSF11_R | TGTCGGTGGCATTAATAGTGAG |
4 | ZFYVE9 | CGA | GF4_ZFYVE9:CGA_F | ACTGCAGAGAACATGGATTCCT | GF4_ZFYVE9:CGA_R | GAATGGAGAACATGCAGAAACA |
5 | CCDC6 | ROS1 | GF5_CCDC6:ROS1_F | CCTGCAGGAAAAATTAGACCAG | GF5_CCDC6:ROS1_R | AGCTCAGCCAACTCTTTGTCTT |
6 | FGFR2 | CIT | GF6_FGFR2:CIT_F | ACATGATGATGAGGGACTGTTG | GF6_FGFR2:CIT_R | ACAGCTGTTACGAAGAGCATCA |
7 | AXL | MBIP | GF7_AXL:MBIP_F | GCCTGACGAAATCCTCTATGTC | GF7_AXL:MBIP_R | CAAAATTCCCTGACGTTGTTTT |
8 | SCAF11 | PDGFRA | GF8_SCAF11:PDGFRA_F | CAGCGGAGTCAGTGTCCTAGAG | GF8_SCAF11:PDGFRA_R | TGAGAAGACAGCCTAAGACCAG |
9 | CD74 | ROS1 | GF9_CD74:ROS1_F | GTCTTTGAGAGCTGGATGCAC | GF9_CD74:ROS1_R | AGCTCAGCCAACTCTTTGTCTT |
10 | SLC34A2 | ROS1 | GF10_SLC34A2:ROS1_F | ATGCCGTCGTCTCCAAGTTC | GF10_SLC34A2:ROS1_R | ATCTTCAGCTTTCTCCCACTGT |
11 | TXNRD1 | GPR133 | GF11_TXNRD1:GPR133_F | TCCAAATGCTGGAGAAGTTACA | GF11_TXNRD1:GPR133_R | AGTACACGAAGACTCGGTTGCT |
12 | EML4 | ALK | GF12_EML4:ALK_F | GCCAAAATTTGTGCAGTGTTTA | GF12_EML4:ALK_R | GGAGCTTGCTCAGCTTGTACTC |
13 | HYOU1 | C11orf93 | GF13_HYOU1:C11orf93_F | CCAGAATCTGACCACAGTGAAG | GF13_HYOU1:C11orf93_R | AGAAGATGGTGCAACTGGGTCT |
14 | MAP4K3 | PRKCE | GF14_MAP4K3:PRKCE_F | AGGAGGACTTCGAGCTGATTC | GF14_MAP4K3:PRKCE_R | ACGACCCTGAGAGATCGATGA |
15 | RBM14 | FGF3 | GF15_RBM14:FGF3_F | CCAAGGCCTCTTAATACTTGGA | GF15_RBM14:FGF3_R | CATAGAGTCGTCCCCTCTTGTT |
16 | BCAS3 | MAP3K3 | GF16_BCAS3:MAP3K3_F | CATCCCGTCCAGTCTCTGAT | GF16_BCAS3:MAP3K3_R | CTGCCTATTTGAGTGACCTGTG |
17 | SRSF4 | SNRNP40 | GF17_SRSF4:SNRNP40_F | GAAGTGGCCGAGATAAATATGG | GF17_SRSF4:SNRNP40_R | TAAACTCAGGCCAGTCACTGAA |
18 | UBR4 | ATP13A2 | GF18_UBR4:ATP13A2_F | ACCCTTTCTCTACCTGTGTTGG | GF18_UBR4:ATP13A2_R | AGCTGAGGGGATCTATTGATGT |
19 | TTC19 | ATPAF2 | GF19_TTC19:ATPAF2_F | CGCTTTGATGAGGCCTATATTT | GF19_TTC19:ATPAF2_R | CTGTGTGATGCTGACATTCTGA |
20 | TPD52L1 | TRMT11 | GF20_TPD52L1:TRMT11_F | GAAAACACATGAAACCCTGAGTC | GF20_TPD52L1:TRMT11_R | ATGTGTGACTGGAAAGCTTCTG |
21 | IGSF3 | MAN1A2 | GF21_IGSF3:MAN1A2_F | CTGACCAGGGCGAATTCTACT | GF21_IGSF3:MAN1A2_R | TCTTGCCTCATGGTCTGTTTTA |
22 | ERBB2IP | MAST4 | GF22_ERBB2IP:MAST4_F | AACAAGGGTACAACCTGAAGGA | GF22_ERBB2IP:MAST4_R | TCAAGGAAGTATCGTGAGGTGA |
23 | XAF1 | FAM64A | GF23_XAF1:FAM64A_F | GGAGCTCCACGAGTCCTACTGT | GF23_XAF1:FAM64A_R | AGAGGTCTCCTGATGGCTGAC |
24 | MIER2 | ITGB1BP3 | GF24_MIER2:ITGB1BP3_F | AGATCATGGTGGGACCTCAGT | GF24_MIER2:ITGB1BP3_R | AGCAGCGAGTTCTGAATGTCTT |
25 | SLC16A7 | MUCL1 | GF25_SLC16A7:MUCL1_F | GTGGTTGGAGCAGCTTTTATCT | GF25_SLC16A7:MUCL1_R | TCATCATCAGCAGGACCAGTAG |
26 | ITGB1BP3 | DNM2 | GF26_ITGB1BP3:DNM2_F | CCTGGAAGACATTCAGAACTCG | GF26_ITGB1BP3:DNM2_R | TTTGAGAAGATGAGCTGCAGAA |
27 | ARHGEF16 | TCTEX1D4 | GF27_ARHGEF16:TCTEX1D4_F | GCATGGAGCAGATGTACACG | GF27_ARHGEF16:TCTEX1D4_R | TGTGTTTTAGAACAAGTGGATCAGA |
28 | CMBL | C8orf38 | GF29_CMBL:C8orf38_F | CTCTCCCAGGAGGCTACGACT | GF29_CMBL:C8orf38_R | TGAGCCAGTTCCACATTAAAGG |
29 | EDA | MID1 | GF30_EDA:MID1_F | TGACGTTGTGCTGCTACCTAGA | GF30_EDA:MID1_R | ATCTGTCGTCTTTGCTGAATGA |
30 | H19 | CALR | GF28_H19:CALR_F | CACCGCAATTCATTTAGTAGCA | GF28_H19:CALR_R | GCCTCTCTACAGCTCGTCCTT |
실시예 3: 융합 유전자 확인
게놈 DNA 및 cDNA에 대한 Sanger sequencing 및 PCR 증폭에 의하여 상기 발견된 사항을 확인하였다.
RNeasy 미니 키트(Qiagen)를 사용하여 종양 샘플로부터 RNA를 추출하는데 사용하였다. DNA는 DNeasy 티슈 키트(Qiagen)를 사용하여 추출하였다. RT-PCR을 위하여, 첫째 가닥 cDNA는 올리고(dT)20을 가지는 SuperScript TM III 첫째 가닥 합성 시스템(Invitrogen)으로 2.5mg의 전체 RNA으로부터 합성하였다. 그 다음에 각 융합 유전자를 해당 프라이머 쌍(상기 표 50 참조)을 사용하여 증폭하였다. 각각의 프라이머 쌍 및 Taq DNA polymerase 하이 피델리티(Invitrogen)를 사용하여 PCR로 유전자 증폭을 수행하였다.
PCR 반응은 95 ℃에서 10분간, 95 ℃에서 30초간-62 ?에서 30초간-72 ?에서 30초간을 30 사이클, 및 최종적으로 72 ?에서 10 분간 수행하였다. 게놈 결실 검출용 PCR 및 Sanger sequencing 프라이머는 다음과 같다: 5'- AACAAGGGTACAACCTGAAGGA-3' 및 5'-TCAAGGAAGTATCGTGAGGTGA-3'. 융합 전사체용 프라이머는 다음과 같다: 5'-AACAAGGGTACAACCTGAAGGA-3' 및 5'-TCAAGGAAGTATCGTGAGGTGA-3'. 모든 Sanger sequencing 시험은 Macrogen Inc. 매뉴얼에 따라서 수행하였다 (http://www.macrogen.com).
실시예 5: 융합 단백질 저해제의 포유류 고형 종양의 성장 저해 확인 시험
본 발명에서 제안되는 융합 단백질들이 이러한 융합단백질을 발현하는 세포주 또는 종양에서 성장 및 생존을 추진하는 것을 확인하기 위하여, 그 세포들을 각 융합 단백질 내 카이네이즈 또는 다른 도메인의 저해제로 처리하였다. ?
융합단백질을 발현하는 세포의 세포수를 계산하고, 세포 성장 저해 분석은 제조업자가 제안하는 것에 따라 CellTiter 96 AQueous 원 용액 세포 증식 분석(Promega)으로 수행하였다. 간략하게 설명하면, 1000에서 5000 세포들을 프랫-바텀 96-웰 플레이트 상에 시딩하고 10% FBS를 가지는 완전 배지에서 성장시켰다. 24 시간 후, 그 세포 배지를 각각의 융항 단백질에 대한 저해 약제를 다양한 농도로 포함하는 10% FBS를 가지는 100㎕ 완전 성장 배지로 교체하고, 72 시간 동안 더 배양하였다. 각 약제 농도는 세포들의 세 동일한(triplicate) 웰에 적용하였다. 배양 종결 시기에서, 20 ㎕의 CellTiter 96 AQueous 원 용액은 각 웰에 첨가하고 그 플레이트는 1-4 시간 동안 배양하였다. 흡광도는 마이크로플레이트 리더를 사용하여 490nm에서 판독하였다. 성장 저해는 처리된 세포들 대비 처리된 세포들로부터 판독한 흡광도의 평균 ± SD 값으로 표현될 수 있다. 이와 같은 분석은 적어도 3회 반복하였다. 그러한 분석으로부터 융합 단백질들이 발현되는 인간 NSCLC 종양들의 서브세트의 성장 및 생존을 추진하는지를 확인하고, 그러한 세포들은 타겟된 저해제를 사용하여 융합 단백질 내 카이네이즈의 활성 또는 다른 도메인의 활성을 저해하여 저해될 수 있다는 것을 확인할 수 있을 것이다.
실시예 6: 융합 단백질의 형질전환된 포유류 세포주의 성장 및 생존 촉진 확인 시험
NIH 3T3 세포들을 각 융합 단백질의 코딩 cDNA를 포함하는 구조체로 형질전환시켜서 융합 단백질을 발현시킴으로써, 본 발명에서 제안된 융합 단백질의 발현이 정상세포를 암 표현형으로 형질전환시킬 수 있는지를 확인하였다. 간략하게 설명하면, 세포들을 10% 우태혈청(FBS) (Sigma) 및 1.0 ng/ml IL-3 (R&D Systems)을 가지는 RPMI-1640 배지(Invitrogen)에서 유지하였다. 레트로바이러스 상등액의 생성 및 트랜스팩션은 전에 알려진 것과 같이 수행하였다. NIH3T3 세포들은 pMXs-puro/융합 단백질 발현 벡터를 포함하는 레트로바이러스 상등액으로 트랜스덕션하고, puromycin(2ug/ml)에 대하여 선택하였다. 다음, 소프트 아가에서 성장하는 형질전환된 세포들의 능력을 측정하였다. 그러한 분석은 융합 단백질의 발현이 NIH3T3 세포를 형질전환할 수 있고, 이들 세포들을 융합 단백질에 의하여 소프트 아가상에서 생존 및 성장이 촉진됨을 확인할 수 있고, 형질전환된 세포들에서 이들 융합 단백질의 발현의 저해는 감소된 생존성 및 증가된 아팝토시스를 야기한다는 것을 나타낸다.
Claims (37)
- 다음으로 이루어진 군에서 선택된 융합 단백질:APLP2 (amyloid beta (A4) precursor-like protein 2) 단백질 또는 그의 단편과 C-말단에 TNFSF11 (tumor necrosis factor (ligand) superfamily, member 11) 단백질 또는 그의 단편이 융합된 APLP2-TNFSF11 융합 단백질;MAP4K3 (mitogen-activated protein kinase kinase kinase kinase3) 단백질 또는 그의 단편과 C-말단에 PRKCE (protein kinase C, epsilon) 단백질 또는 그의 단편이 융합된 MAP4K3-PRKCE 융합 단백질;BCAS3 (breast carcinoma amplified sequence3) 단백질 또는 그의 단편과 C-말단에 MAP3K3 (mitogen activated protein kinase kinase kinase3) 단백질 또는 그의 단편이 융합된 BCAS3-MAP3K3 융합 단백질;N-말단에 KRAS (Ki-ras2 Kirsten rat sarcoma viral oncogene homolog) 단백질 또는 그의 단편과 C-말단에 CDH13 (cadherin 13, H-cadherin) 단백질 또는 그의 단편이 융합된 KRAS-CDH13 융합 단백질;ZFYVE9 (zinc finger, FYVE domain containing 9) 단백질 또는 그의 단편과 C-말단에 CGA (glycoprotein hormones, alpha polypeptide) 단백질 또는 그의 단편이 융합된 ZFYVE9-CGA 융합 단백질;N-말단에 ERBB2IP (Erbb2 interacting protein) 단백질 또는 그의 단편과 C-말단에 MAST4(Microtubule-associated serine/threonine-protein kinase 4) 단백질 또는 그의 단편이 융합된 ERBB2IP-MAST4 융합 단백질;TPD52L1 (tumor protein D52-like1) 단백질 또는 그의 단편과 C-말단에 (tRNA methyl transferase11 homolog) 단백질 또는 그의 단편이 융합된 TPD52L1-TRMT11 융합 단백질;TXNRD1 (thioredoxin reductase1) 단백질 또는 그의 단편과 C-말단에 GPR133 (G protein-coupled receptor 133) 단백질 또는 그의 단편이 융합된 TXNRD1-GPR133 융합 단백질; 및상기 융합 단백질 1종 이상의 조합.
- 제1항에 있어서,상기 APLP2-TNFSF11 융합 단백질에서, 상기 APLP2 단백질의 단편은 NM_001642, NM_001142276, NM_001142278, NM_001142277, NR_024516, 또는 NR_024515의 첫 번째 엑손부터 엑손 12까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 TNFSF11 단백질의 단편은 NM_033012 또는 NM_003701의 엑손 6부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,상기 MAP4K3-PRKCE 융합 단백질에서, 상기 MAP4K3 단백질의 단편은 NM_003618의 엑손 1의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 PRKCE 단백질의 단편은 NM_005400의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,상기 BCAS3-MAP3K3 융합 단백질에서, 상기 BCAS3 단백질의 단편은 NM_017679 또는 NM_001099432의 첫 번째 엑손에서 엑손 23까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 MAP3K3 단백질의 단편은 NM_002401 또는 NM_203351의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,상기 KRAS-CDH13 융합 단백질에서, 상기 KRAS 단백질의 단편은 NM_004985 또는 NM_033360의 첫 번째 엑손부터 엑손 4까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 CDH13 단백질의 단편은 NM_001257의 엑손 5부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,상기 ZFYVE9-CGA 융합 단백질에서, 상기 ZFYVE9 단백질의 단편은 NM_007324 또는 NM_004799의 첫 번째 엑손에서 엑손 16까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 CGA 단백질의 단편은 NM_000735의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,상기 ERBB2IP-MAST4 융합 단백질에서, 상기 ERBB2IP 단백질의 단편은 NM_001006600 또는 NM_018695의 첫 번째 엑손부터 엑손 26까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 MAST4 단백질의 단편은 NM_001164664 또는 NM_015183의 엑손 13부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,상기 TPD52L1-TRMT11 융합 단백질에서, 상기 TPD52L1 단백질의 단편은 NM_003287, NM_001003396, NM_001003397, 또는 NM_001003395의 첫 번째 엑손에서 엑손 5까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 TRMT11 단백질의 단편은 NM_001031712의 엑손 12부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이며,상기 TXNRD1-GPR133 융합 단백질에서 상기 TXNRD1 단백질의 단편은 NM_003330, NM_001093771, NM_182729, NM_182743, 또는 NM_182742의 첫 번째 엑손에서 엑손 17까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것이고, 상기 GPR133 단백질의 단편은 NM_198827의 엑손 14부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것인,융합 단백질.
- 제1항에 있어서,상기 APLP2-TNFSF11 융합 단백질은 5' 말단에 NM_001642의 158번째부터 1741번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_033012의 698번째부터 1264번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,상기 MAP4K3-PRKCE 융합 단백질은 5' 말단에 NM_003618의 326번째부터 421번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_005400의 546번째부터 2411번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이며,상기 BCAS3-MAP3K3 융합 단백질은 5' 말단에 NM_001099432의 110번째부터 2579번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_002401의 324번째부터 2200번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,상기 KRAS-CDH13 융합 단백질은 5' 말단에 NM_004985의 182번째부터 631번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001257의 666번째부터 2441번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이며,상기 ZFYVE9-CGA 융합 단백질은 5' 말단에 NM_007324의 173번째부터 3828번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_000735의 136번째부터 493번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,상기 ERBB2IP-MAST4 융합 단백질은 5' 말단에 NM_001006600 의 311번째부터 4111번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001164664의 1455번째부터 8180번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이며,상기 TPD52L1-TRMT11 융합 단백질은 5' 말단에 NM_001003395의 328번째부터 626번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_001031712의 122번째부터 1513번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것이고,상기 TXNRD1-GPR133 융합 단백질은 5' 말단에 NM_003330의 656번째부터 2242번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_198827의 2203번째부터 3184번째까지의 뉴클레오타이드 서열이 연결된 융합 유전자에 의하여 암호화되는 것인,융합 단백질.
- 제3항에 있어서,상기 융합 단백질은 서열번호 63, 79, 95, 111, 126, 142, 158, 및 174로 이루어진 군에서 선택된 아미노산 서열을 갖는 것인,융합 단백질.
- 제1항 내지 제4항 중 어느 한 항의 융합 단백질을 암호화하는 융합 유전자.
- 제5항에 있어서,상기 융합 유전자는 서열번호 61, 77, 93, 109, 124, 140, 156, 및 172로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인, 융합 유전자.
- SCAF11 (SR-related CTD-associated factor 11) 유전자의 5UTR부위 및 PDGFRA (platelet-derived growth factor receptor, alpha polypeptide) 유전자 또는 그의 단편이 융합된 SCAF11-PDGFRA 융합 유전자.
- 제7항에 있어서,상기 SCAF11 유전자의 5UTR부위는 NM_004719의 엑손 1의 뉴클레오타이드 서열을 갖는 것이고,PDGFRA 유전자의 단편은 NM_006206의 엑손 2부터 마지막 엑손까지의 뉴클레오타이드 서열을 갖는 것인,융합 유전자.
- 제7항에 있어서,5' 말단에 NM_004719의 1번째부터 266번째까지의 뉴클레오타이드 서열과 3' 말단쪽에 NM_006206의 320번째부터 3601번째까지의 뉴클레오타이드 서열을 포함하는, 융합 유전자.
- 제9항에 있어서,상기 융합 유전자는 서열번호 180의 뉴클레오타이드 서열을 갖는 것인,융합 유전자.
- 제1항 내지 제4항 중 어느 한 항의 융합 단백질과 상호작용하는 물질, 및상기 융합 단백질을 암호화하는 융합 유전자, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA와 상호작용하는 물질로 이루어진 군에서 선택된 1종 이상을 포함하는,암 진단용 조성물.
- 제11항에 있어서,상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질에 결합하는 항체 및 압타머로 이루어진 군에서 선택된 1종 이상의 것이고,상기 융합 유전자 또는 이에 상응하는 mRNA와 상호작용하는 물질은상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개의 염기로 이루어진 폴리뉴클레오타이드 단편 또는 이에 상응하는 mRNA 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편 또는 mRNA 단편의 양 말단에 인접하는 20 내지 100개의 염기서열 또는 이의 상보적인 서열과 혼성화 가능한 프라이머쌍;상기 융합 유전자 내의 융합 부위 또는 이에 상응하는mRNA 부위와 혼성화 가능한 5 내지 100 bp 길이의 안티센스 올리고뉴클레오타이드, 프로브, 및 앱타머로 이루어진 군에서 선택된 1종 이상이고,상기 융합 부위는 서열번호 62, 78, 94, 110, 126, 141, 157, 173 및 181로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인,암 진단용 조성물.
- 제12항에 있어서,상기 프라이머쌍은서열번호 184 및 서열번호 185의 프라이머쌍;서열번호 190 및 서열번호 191의 프라이머쌍;서열번호 192 및 서열번호 193의 프라이머쌍;서열번호 194 및 서열번호 195의 프라이머쌍;서열번호 196 및 서열번호 197의 프라이머쌍;서열번호 198 및 서열번호 199의 프라이머쌍;서열번호 200 및 서열번호 201의 프라이머쌍;서열번호 202 및 서열번호 203의 프라이머쌍; 및서열번호 204 및 서열번호 205의 프라이머쌍으로 이루어진 군에서 선택된 1종 이상인,암 진단용 조성물.
- 제11항에 있어서, 상기 암은 고형암인, 암 진단용 조성물.
- 제14항에 있어서, 상기 암은 폐암인, 암 진단용 조성물.
- 제15항에 있어서, 상기 암은 비소세포성 폐암(NSCLC)인, 암 진단용 조성물.
- 환자로부터 분리된 생물학적 시료에서 제1항의 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, 제7항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA를 검출하는 단계를 포함하고,상기 융합 단백질, 융합 유전자 또는 mRNA가 검출되면 상기 환자를 암 환자로 결정하는 것을 특징으로 하는,암 진단 방법.
- 제17항에 있어서, 상기 검출하는 단계는,상기 생물 시료에 상기 융합 단백질, 상기 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA로 이루어진 군에서 선택된 1종 이상과 상호작용하는 물질을 첨가하고 반응시키는 단계; 및상기 얻어진 반응물을 검출하는 단계를 포함하는 것인,암 진단 방법.
- 제18항에 있어서,상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질에 결합하는 항체 및 압타머로 이루어진 군에서 선택된 것이고,상기 융합 단백질을 암호화하는 융합 유전자 또는 이에 상응하는 mRNA와 상호작용하는 물질은,상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개의 염기로 이루어진 폴리뉴클레오타이드 단편 또는 이에 상응하는 mRNA 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편 또는 mRNA 단편의 양 말단에 인접하는 20 내지 100개의 염기서열 또는 이의 상보적인 서열과 혼성화 가능한 프라이머쌍;상기 융합 유전자 내의 융합 부위 또는 이에 상응하는mRNA 부위와 혼성화 가능한 5 내지 100 bp 길이의 안티센스 올리고뉴클레오타이드, 프로브, 및 앱타머로 이루어진 군에서 선택된 1종 이상이고,상기 융합 부위는 서열번호 62, 78, 94, 110, 125, 141, 157, 173, 및 181로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인,암 진단 방법.
- 제19항에 있어서,상기 프라이머쌍은 서열번호 184 및 서열번호 185의 프라이머쌍;서열번호 190 및 서열번호 191의 프라이머쌍;서열번호 192 및 서열번호 193의 프라이머쌍;서열번호 194 및 서열번호 195의 프라이머쌍;서열번호 196 및 서열번호 197의 프라이머쌍;서열번호 198 및 서열번호 199의 프라이머쌍;서열번호 200 및 서열번호 201의 프라이머쌍;서열번호 202 및 서열번호 203의 프라이머쌍; 및서열번호 204 및 서열번호 205의 프라이머쌍으로 이루어진 군에서 선택된 1종 이상인,암 진단 방법.
- 제17항에 있어서, 상기 암은 고형암인, 암 진단 방법.
- 제21항에 있어서, 상기 암은 폐암인, 암 진단 방법.
- 제22항에 있어서, 상기 암은 비소세포성 폐암(NSCLC)인, 암 진단에 정보를 제공하는 방법.
- 암 진단 마커로 사용하기 위한 제1항 내지 제4항 중 어느 한 항의 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA.
- 암 진단에 사용하기 위한 제1항 내지 제4항 중 어느 한 항의 융합 단백질과 상호작용하는 물질, 및 상기 융합 단백질을 암호화하는 융합 유전자, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 또는 상기 융합 유전자에 상응하는 mRNA와 상호작용하는 물질로 이루어진 군에서 선택된 1종 이상을 포함하는 조성물.
- 제25항에 있어서,상기 융합 단백질과 상호작용하는 물질은 상기 융합 단백질에 결합하는 항체 및 압타머로 이루어진 군에서 선택된 것이고,상기 융합 유전자 또는 이에 상응하는 mRNA와 상호작용하는 물질은상기 융합 유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개의 염기로 이루어진 폴리뉴클레오타이드 단편 또는 이에 상응하는 mRNA 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편 또는 mRNA 단편의 양 말단에 인접하는 20 내지 100개의 염기서열 또는 이의 상보적인 서열과 혼성화 가능한 프라이머쌍;상기 융합 유전자 내의 융합 부위 또는 이에 상응하는mRNA 부위와 혼성화 가능한 5 내지 100 bp 길이의 안티센스 올리고뉴클레오타이드, 프로브, 및 앱타머로 이루어진 군에서 선택된 1종 이상이고,상기 융합 부위는 서열번호 62, 78, 94, 110, 125, 141, 157, 173, 및 181로 이루어진 군에서 선택된 뉴클레오타이드 서열을 갖는 것인,조성물.
- 제26항에 있어서,상기 프라이머쌍은서열번호 184 및 서열번호 185의 프라이머쌍;서열번호 190 및 서열번호 191의 프라이머쌍;서열번호 192 및 서열번호 193의 프라이머쌍;서열번호 194 및 서열번호 195의 프라이머쌍;서열번호 196 및 서열번호 197의 프라이머쌍;서열번호 198 및 서열번호 199의 프라이머쌍;서열번호 200 및 서열번호 201의 프라이머쌍;서열번호 202 및 서열번호 203의 프라이머쌍; 및서열번호 204 및 서열번호 205의 프라이머쌍으로 이루어진 군에서 선택된 1종 이상인,조성물.
- 제25항 내지 제27항 중 어느 한 항에 있어서, 상기 암은 고형암인, 조성물.
- 제28항에 있어서, 상기 암은 폐암인, 조성물.
- 제29항에 있어서, 상기 암은 비소세포성 폐암(NSCLC)인, 조성물.
- 제1항 내지 제4항 중 어느 한 항의 융합 단백질, 상기 융합 단백질을 암호화하는 융합 유전자, 또는 제7항 내지 제10항 중 어느 한 항의 융합 유전자를 포함하는 세포에 후보 물질을 처리하는 단계; 및상기 세포에서의 상기 융합 단백질 또는 상기 융합 유전자의 수준을 측정하는 단계를 포함하고,상기 후보 물질이 처리된 세포에서의 상기 융합 단백질 또는 상기 융합 유전자의 수준이 상기 후보 물질 처리 전 또는 상기 후보 물질이 처리되지 않은 세포와 비교하여 감소한 경우, 상기 후보 물질을 항암제로 결정하는 것을 특징으로 하는,항암제 스크리닝 방법.
- 제1항 내지 제4항 중 어느 한 항의 융합 단백질의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 제7항 내지 제10항 중 어느 한 항의 융합 유전자의 억제제, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 유효성분으로 포함하는, 암 예방 또는 치료용 조성물.
- 제32항에 있어서,상기 융합 단백질의 억제제는 상기 융합 단백질에 대한 항체, 압타머, 키나제 저해제, 및 신호 전달 저해제로 이루어진 군에서 선택된 1종 이상이고,상기 융합 유전자 또는 mRNA의 억제제는 상기 융합 유전자 또는 mRNA에 특이적으로 결합하는 siRNA, shRNA, 마이크로 RNA, 및 압타머로 이루어진 군에서 선택된 1종 이상인, 암 예방 또는 치료용 조성물.
- 제1항의 융합 단백질의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 제7항의 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 암의 예방 또는 치료를 필요로 하는 환자에게 투여하는 단계를 포함하는, 암 예방 또는 치료 방법.
- 제34항에 있어서,상기 융합 단백질의 억제제는 상기 융합 단백질에 대한 항체, 압타머, 키나제 저해제, 및 신호 전달 저해제로 이루어진 군에서 선택된 1종 이상이고,상기 융합 유전자 또는 mRNA의 억제제는 상기 융합 유전자 또는 mRNA에 특이적으로 결합하는 siRNA, shRNA, 마이크로 RNA, 및 압타머로 이루어진 군에서 선택된 1종 이상인, 암 예방 또는 치료 방법.
- 암의 예방 또는 치료에 사용하기 위한 제1항 내지 제4항 중 어느 한 항의 융합 단백질의 억제제, 상기 융합 단백질을 암호화하는 융합 유전자의 억제제, 제7항 내지 제10항 중 어느 한 항의 융합 유전자, 및 상기 융합 유전자에 상응하는 mRNA의 억제제로 이루어진 군에서 선택된 1종 이상을 포함하는 조성물.
- 제37항에 있어서,상기 융합 단백질의 억제제는 상기 융합 단백질에 대한 항체, 압타머, 키나제 저해제, 및 신호 전달 저해제로 이루어진 군에서 선택된 1종 이상이고,상기 융합 유전자 또는 mRNA의 억제제는 상기 융합 유전자 또는 mRNA에 특이적으로 결합하는 siRNA, shRNA, 마이크로 RNA, 및 압타머로 이루어진 군에서 선택된 1종 이상인, 조성물.
Applications Claiming Priority (18)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120099611A KR20140033617A (ko) | 2012-09-07 | 2012-09-07 | Kras를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
KR10-2012-0099619 | 2012-09-07 | ||
KR1020120099620A KR20140033622A (ko) | 2012-09-07 | 2012-09-07 | Map3k3를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
KR10-2012-0099617 | 2012-09-07 | ||
KR1020120099622A KR20140033286A (ko) | 2012-09-07 | 2012-09-07 | Mast4를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
KR10-2012-0099621 | 2012-09-07 | ||
KR10-2012-0099612 | 2012-09-07 | ||
KR1020120099619A KR20140033621A (ko) | 2012-09-07 | 2012-09-07 | Map4k3를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
KR10-2012-0099618 | 2012-09-07 | ||
KR1020120099613A KR20140033619A (ko) | 2012-09-07 | 2012-09-07 | Zfyve9를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
KR10-2012-0099622 | 2012-09-07 | ||
KR10-2012-0099620 | 2012-09-07 | ||
KR10-2012-0099613 | 2012-09-07 | ||
KR1020120099618A KR20140033620A (ko) | 2012-09-07 | 2012-09-07 | Txnrd1을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
KR1020120099621A KR20140033623A (ko) | 2012-09-07 | 2012-09-07 | Tpd52l1을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
KR1020120099612A KR20140033618A (ko) | 2012-09-07 | 2012-09-07 | Aplp2를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
KR1020120099617A KR20140033285A (ko) | 2012-09-07 | 2012-09-07 | Pdgfra를 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
KR10-2012-0099611 | 2012-09-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2014038884A1 true WO2014038884A1 (ko) | 2014-03-13 |
Family
ID=50237417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2013/008066 WO2014038884A1 (ko) | 2012-09-07 | 2013-09-06 | 융합 단백질 및 이를 포함하는 암 진단용 조성물 |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2014038884A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016081450A1 (en) * | 2014-11-18 | 2016-05-26 | Blueprint Medicines Corporation | Prkacb fusions |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100130527A1 (en) * | 2008-11-18 | 2010-05-27 | Lehrer Raphael | Individualized cancer treatment |
EP2327798A1 (en) * | 2004-05-14 | 2011-06-01 | Rosetta Genomics Ltd | MicroRNAs and uses thereof |
-
2013
- 2013-09-06 WO PCT/KR2013/008066 patent/WO2014038884A1/ko active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2327798A1 (en) * | 2004-05-14 | 2011-06-01 | Rosetta Genomics Ltd | MicroRNAs and uses thereof |
US20100130527A1 (en) * | 2008-11-18 | 2010-05-27 | Lehrer Raphael | Individualized cancer treatment |
Non-Patent Citations (5)
Title |
---|
DIRNHOFER, STEPHAN ET AL.: "Selective expression of trophoblastic hormones by lung carcinoma: neurendocrine tumors exclusively produce human chorionic gonadotropin a- subunit (hCG a)", HUMAN PATHOLOGY, vol. 31, no. 9, August 2000 (2000-08-01), pages 966 - 972 * |
JU, YOUNG SEOK ET AL.: "A transforming KIF5B and RET gene fusion in lung adenocarcinoma revealed from whole-genome and transcriptome sequencing", GENOME RESEARCH, vol. 22, no. 3, March 2012 (2012-03-01), pages 436 - 445 * |
MCDERMOTT, ULTAN ET AL.: "Ligand-dependent platelet-derived growth factor receptor (PDGFR)-a activation sensitizes rare lung cancer and sarcoma cells to PDGFR kinase inhibitors", CANCER RESEARCH, vol. 69, no. 9, May 2009 (2009-05-01), pages 3937 - 3946 * |
RIELY, GREGORY J. ET AL.: "KRAS mutations in non-small cell lung cancer", PROCEEDINGS OF THE AMERICAN THORACIC SOCIETY, vol. 6, no. 2, April 2009 (2009-04-01), pages 201 - 205 * |
SEO, JEONG-SUN ET AL.: "The transcriptional landscape and mutational profile of lung adenocarcinoma", GENOME RESEARCH, vol. 22, no. 11, 13 September 2012 (2012-09-13), pages 2109 - 2119 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016081450A1 (en) * | 2014-11-18 | 2016-05-26 | Blueprint Medicines Corporation | Prkacb fusions |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2016036172A1 (ko) | 단백질 키나제 억제제에 대한 감수성 예측용 바이오 마커 및 이의 용도 | |
US20160333418A1 (en) | Activin Inhibitor Response Prediction and Uses for Treatment | |
US20090191548A1 (en) | Methods and nucleic acids for the analysis of gene expression associated with tissue classification | |
JP2002534055A (ja) | ヒト遺伝子および遺伝子発現産物v | |
WO2012014795A1 (ja) | 新規ret融合体の検出法 | |
WO2014038890A1 (ko) | Axl을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 | |
JP2011254830A (ja) | 結腸癌に関するポリヌクレオチド | |
WO2016018088A1 (ko) | Met 저해제에 대한 감수성 예측용 신규한 바이오 마커 및 이의 용도 | |
LEE et al. | Functional characterization of WT1 binding sites within the human vitamin D receptor gene promoter | |
Brenner et al. | Translocations in epithelial cancers | |
Abdel‐Rahman et al. | Somatic FGF9 mutations in colorectal and endometrial carcinomas associated with membranous β‐catenin | |
Ahmed et al. | A murine Zic3 transcript with a premature termination codon evades nonsense-mediated decay during axis formation | |
WO2015108328A1 (ko) | 대장암 마커로서의 신규 ntrk1 융합유전자 및 이의 용도 | |
WO2014038884A1 (ko) | 융합 단백질 및 이를 포함하는 암 진단용 조성물 | |
WO2014038888A1 (ko) | Ros1을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 | |
WO2014038887A1 (ko) | Fgfr2을 포함하는 융합 단백질 및 이를 포함하는 암 진단용 조성물 | |
Perez Jurado et al. | The human calcitonin receptor gene (CALCR) at 7q21. 3 is outside the deletion associated with the Williams syndrome | |
US20170334966A1 (en) | Anti-tumor antibody-tumor suppressor fusion protein compositions and methods of use for the treatment of cancer | |
WO2023219447A1 (ko) | 세포외 소포체 유래 mirna를 검출하는 제제를 포함하는 난소암 진단용 조성물 | |
WO2023068404A1 (ko) | Eml4-alk 양성 비소세포폐암 환자의 치료 약물 선택을 위한 정보 제공 방법 및 alk 저해제 내성 비소세포폐암 치료용 조성물 | |
WO2011118967A2 (ko) | 간세포암종의 예후 진단용 단일 염기 다형성 | |
Charest | The ROS1 Receptor Family | |
Vaidya | Role of DNA methylation in WNT5A promoter B expression in osteosarcoma cells | |
Gherardi | Myc-mediated control of gene transcription in cancer cells | |
WO2001070982A2 (en) | Brca-1 regulators and methods of use |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 13835440 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 13835440 Country of ref document: EP Kind code of ref document: A1 |