KR101625139B1 - Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 - Google Patents

Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 Download PDF

Info

Publication number
KR101625139B1
KR101625139B1 KR1020147013826A KR20147013826A KR101625139B1 KR 101625139 B1 KR101625139 B1 KR 101625139B1 KR 1020147013826 A KR1020147013826 A KR 1020147013826A KR 20147013826 A KR20147013826 A KR 20147013826A KR 101625139 B1 KR101625139 B1 KR 101625139B1
Authority
KR
South Korea
Prior art keywords
glu
leu
lys
kif5b
ret
Prior art date
Application number
KR1020147013826A
Other languages
English (en)
Other versions
KR20140092846A (ko
Inventor
주영석
서정선
김은희
Original Assignee
주식회사 마크로젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 마크로젠 filed Critical 주식회사 마크로젠
Publication of KR20140092846A publication Critical patent/KR20140092846A/ko
Application granted granted Critical
Publication of KR101625139B1 publication Critical patent/KR101625139B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/96Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/205Aptamer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

본 발명을 N-말단 위치에 N-말단 도메인으로서 융합파트너과 C-말단 위치에 C-말단 도메인으로서 RET 단백질을 포함하는 융합단백질, 상기 융합단백질을 암호화하는 융합유전자, 및 상기 융합단백질 또는 융합유전자의 암 진단 마커로의 용도를 제공한다.

Description

RET 단백질의 C-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도{Fusion protein comprising C-terminal domain of RET protein and use thereof as a diagnosing marker}
본 발명은 N-말단 위치에 N-말단 도메인으로서 융합파트너(fusion partner)와 C-말단 위치에 C-말단 도메인으로서 RET 단백질(re-arranged during transfection proteain)을 포함하는 융합단백질, 상기 융합단백질을 암호화하는 융합유전자, 및 상기 융합단백질 또는 융합유전자의 암 진단 마커로서의 용도를 제공한다.
폐암은 암으로 인한 사망에 있어서 가장 많은 사망자를 발생시키고 있다. 세계적으로 매년 1.38만명의 사망자를 발생시키고 있다. 종례의 화학치료요법을 사용하더라도, 진행기의 폐암환자의 중간생존기간은 진단 당시로부터 1년이 채 되지 않는다. 흡연은 서방국가에서 폐암의 주요한 위험 요소로 잘 알려져 있으며, 모든 폐암의 85% 내지 90%는 흡연으로 인하여 발생한다. 그러나, 세계 폐암환자의 약 25%는 비흡연자이다. 특히, 아시아 국가의 데이터를 살펴보면, 전체 폐암의 70~80%는 비소세포암(Non-Small Cell Lung Cancer, NSCLC)이 차지하고 있으며, 이러한 비소세포암의 30~40%는 비흡연자가 차지하고 있다. 이러한 비소세포암에서 가장 많이 발견되는 조직학적 형태는 선암종(adenocarcinoma)이다 (~70%).
비흡연자의 폐암 발병은 유전적 및 후생적 변화에 기인하기보다는, 하나의 체세포 돌연변이 (somatic mutation) 가 일어남에 따라 발생하게 되는 경우가 많다. 지난 몇 년 동안 비소세포암에서 EGFR, KRAS, 및 ALK 유전자(일반적으로 '삼중표지자 (the triple-markers)'로 불림)의 체세포 돌연변이들이 보고되었다. 우선적으로 비흡연자 및 아시아인의 비소세포암과 연관이 있는 EGFR의 타이로신 키나아제(tyrosine kinase) 도메인의 돌연변이는 재피티닙(Gefitinib)과 같은 EGFR 표적치료에 민감하다. KRAS에 존재하는 미스센스 돌연변이(missense mutation)는 폐선암종(lung adenocarcinoma)에 걸린 흡연자에게서 흔하게 발견되며, EGFR 억제제에 대한 저항성을 가진다.
비록 몇몇의 유전자 돌연변이가 보고되고 있지만, 대부분의 폐암환자의 암 유전체(genome)에서는 아무것도 발견되지 않았다. 비소세포암의 40%이상은 알려지지 않은 유전적 사건에 의해서 발병하는바, 폐암을 진단하는 더욱 효과적인 유전자 마커의 발견이 필요하다.
본 발명은 융합파트너의 N-말단 도메인 및 RET 단백질의 C-말단 도메인을 필수적으로 포함하는 융합단백질을 제공한다. 또한, KIF5B단백질의 N-말단 도메인과 RET 단백질 C-말단 도메인을 필수적으로 포함하는 KIF5B-RET 융합단백질을 제공한다.
본 발명의 다른 일구현예는, 상기 융합단백질을 암호화하는 융합유전자를 제공한다.
본 발명의 다른 일구현예는, 상기 융합유전자를 포함하는 재조합 백터를 제공한다.
본 발명의 다른 일구현예는, 하기와 같은 방법의 폐암 진단방법을 제공한다:
10번 염색체상 역위 또는 전좌를 포함하는 RET-관련 재배열, 다른 단백질과 융합된 RET 단백질이 포함된 융합단백질, 융합단백질을 암호화하는 융합유전자, 및 암에 걸리지 않은 개별 대상으로부터 얻어진 표준 시료에 비하여 RET 과발현으로 이루어진 군에서 선택된 1종 이상의 것을 대상으로부터 얻어진 시험 시료에서 탐지하는 방법, 또는 상기 군으로부터 선택된 1종 이상이 시료에서 탐지될 때 상기 대상을 폐암 환자로 결정하는 방법.
다른 일구현예는, KIF5B-RET 융합단백질을 폐암 진단마커로 이용하는 용도를 제공한다.
다른 일구현예는, 융합단백질 또는 융합유전자를 검출하는 화합물을 포함하는, 폐암 진단용 조성물을 제공한다.
다른 일구현예는, 1종 이상의 융합단백질의 억제제, 1종 이상의 융합단백질을 암호화하는 융합유전자의 억제제, 1종 이상의 RET 암호화 유전자의 억제제, 또는 그들의 결합을 치료적으로 효과적인 양만큼 환자에게 투여하는 단계를 포함하는, 폐암을 예방 또는 치료하는 방법을 제공한다.
다른 일구현예는, 1종 이상의 융합단백질의 억제제, 1종 이상의 융합단백질을 암호화하는 융합유전자의 억제제, 1종 이상의 RET 단백질을 암호화하는 유전자의 억제제, 또는 이들의 조합을 포함하는, 폐암 예방 또는 치료용 조성물을 활성성분으로서 제공한다.
다른 일구현예는, 1종 이상의 융합단백질의 억제제, 1종 이상의 융합단백질을 암호화하는 융합유전자의 억제제, 1종 이상의 RET 단백질을 암호화하는 유전자의 억제제, 또는 이들의 조합을 포함하는 조성물의, 폐암 예방 또는 치료 용도를 제공한다.
또 다른 일구현예는, 하기의 폐암에 대한 항암제를 스크리닝하는 방법을 제공한다: 융합단백질을 발현하는 세포에 시료 화합물을 처리하고; 융합단백질의 세포 내 발현 수준을 측정하여, 시료 화합물을 처리한 세포에서 융합단백질 발현 수준이, 시료 화합물을 처리하기 전의 세포, 또는 처리하지 않은 세포들에 비하여 낮아진 경우, 당해 시료 화합물을 폐암에 대한 항암제 후보물질로 결정한다.
본 발명자들은 폐선암종 환자의 염색체 역위에 의해 발생한 융합유전자를 동정하여, 본 발명을 완성하였다. 융합유전자는 어린이와 비흡연자 폐선암종 환자에게서도 발견되었으며, 이들의 암은 종례 알려진 삼중 표지자(EGFR, KRAS, 및 ALK 유전자)에 대해서는 음성반응을 보인다. 따라서, 본 발명의 융합유전자는 폐암의 효과적인 마커로 기대되며, 상기 융합유전자는 종례에 알려진 삼중 표지자가 기능을 하지 못하는 경우에도 마커의 기능을 수행할 수 있다.
일 실시예는 암세포에서 특징적으로 발견되는 융합유전자 및 상기 융합유전자에 의해 암호화되는 융합단백질을 제공한다.
특히, 융합파트너의 N-말단 도메인 및 RET 단백질의 C-말단 도메인을 포함하는 융합단백질을 제공한다. 융합파트너의 N-말단 도메인은 융합단백질의 N-말단에 위치 할 수 있으며, RET 단백질의 C-말단 도메인은 융합단백질의 C-말단에 위치할 수 있다. 본 발명은 RET 단백질을 포함하는 융합단백질의 존재는 폐암을 포함하는 암의 진행과 관계 있음을 발견하였다.
융합파트너는 융합단백질의 N-말단에 위치하고 있는 KIF5B 단백질의 N-말단 도메인일 수 있으며, 이러한 경우, 융합단백질은 N-말단 위치에 N-말단 도메인으로서 KIF5B 단백질과, C-말단 위치에 C-말단 도메인으로서 RET 단백질을 포함하는, KIF5B-RET 단백질을 대표할 수 있다.
다른 일구현예는 융합단백질을 암호화하는 융합유전자를 제공하며, 상기 융합유전자는 5'말단에 위치한 융합파트너의 N-말단 도메인을 암호화하는 유전자, 및 3'말단에 위치한 RET 단백질의 C-말단 도메인을 암호화하는 유전자를 포함할 수 있다. 구체적인 실시예에서, 융합단백질이 KIF5B-RET 단백질인 경우, 융합유전자는 아마도 KIF5B-RET 유전자로 대표되며. 상기 KIF5B-RET 유전자는 5'말단에 위치한 KIF5B의 N-말단 도메인을 암호화하는 유전자 및 3'말단에 위치한 RET 단백질의 C-말단 도메인을 암호화하는 유전자를 포함 할 수 있다.
다른 일구현예는 융합유전자 및 선택적으로 융합유전자에 작동 가능하게 연결된 전사요소(예: 프로모터와 같은)를 포함하는 발현 벡터를 제공한다. 또 다른 실험예는 발현 벡터에 의해 형질 전환된 세포를 제공한다.
RET 단백질은 막관통 수용체 타이로신 키나아제(transmembrane receptor tyrosine kinase)이다. RET은, 세포 외 영역(Cadherin 유사 도메인을 포함), 막관통 도메인, 및 타이로신 키나아제 도메인을 포함하는 세포 내 영역으로 구성되어 있다. RET 단백질이 글리아세포 유래 신경영양인자(glial derived neurotrophic factor, GDNF)같은 공동수용체와 리간드에 결합함으로써 이량화(dimerization) 될 때, 상기 RET 단백질은 자기인산화(auto-phosphorylation)에 의해 활성화되고, 하위 신호(downstream signaling) 전달을 자극한다. RET의 하위 신호 전달계(downstream signaling cascade)는 세포의 생존(survival)/세포사멸(apoptosis), 증식(proliferation), 분화(differentiation), 및 전이(migration)를 조절하는 MAPK(mitogen-activated protein kinase)경로이다. RET의 정상 발현은 신경발달에 중요하지만, 조직들의 분화에서는 활성화되지 않음이 알려져 있다.
RET 단백질은 인간을 포함하는 포유류로부터 유래할 수 있다. 인간 RET 단백질을 암호화하는 인간 RET 유전자는 10번 염색체상에 위치해있으며(10q11.2), 종류에 따라 19 내지 21개의 엑손을 포함하고 있다. 인간 RET 단백질은 NCBI(기탁번호 NM_020630 또는 NM_020975)로 대표되는 인간 RET 유전자로부터 암호화될 수 있다.
RET 단백질의 C-말단 도메인은 RET 유전자의, 예를 들어 NM_020630 또는 NM_020975의, 12번째 엑손부터 마지막 엑손의, 예를 들어 20번째 엑손, 폴리뉴클레오타이드로부터 암호화되는 아미노산 서열을 포함할 수 있다. RET 단백질의 C-말단 도메인은, 12번째 엑손의 시작위치부터(예를 들어, NM_020975에 의해 암호화되는 RET 단백질의 713번째 자리), NM_020630 또는 NM_020975에 의해 암호화되는 RET 단백질의 C-말단을 향하여, 적어도 약 300개의 연속적인 아미노산을 포함할 수 있다. 예를 들어, RET 단백질의 C-말단 도메인은, 12번째 엑손의 시작위치부터(예를 들어, 713번째 자리), NM_020630(19개의 엑손) 또는 NM_020975(20개의 엑손)에 의해 암호화되는 RET 단백질의 C-말단을 향하여, 연속적인 약 300 내지 450개의 아미노산, 연속적인 약 300 내지 420개의 아미노산, 또는 연속적인 약 300 내지 402개의 아미노산을 포함할 수 있다.
Kinesin-1 중쇄라고도 불리는 KIF5B 단백질은 KIF5B 유전자에 의해서 암호화 된다. KIF5B 단백질은 인간을 포함하는 포유류로부터 유래될 수 있다. 인간 KIF5B 단백질을 암호화하는 인간의 KIF5B 유전자는 10번 염색체(10q11.22) 상에 위치해 있으며, 26개의 엑손을 포함하고 있다. 인간 KIF5B 단백질은 인간 NCBI, 기탁번호 NM_004521로 대표되는 KIF5B 유전자에 의해 암호화된다.
KIF5B 단백질의 N-말단 도메인은 KIF5B 유전자(예를 들어, NM_004521) 의 폴리뉴클레오타이드의 1번째 엑손부터 16번째 엑손, 1번째 엑손부터 15번째 엑손, 또는 1번째 엑손부터 23번째 엑손으로부터 암호화된 아미노산 서열을 포함하고 있다. KIF5B 단백질의 N-말단 도메인은 NM_004521에 의해 암호화되는 KIF5B 단백질의 1번째 위치부터 적어도 약 329개의 연속적인 아미노산을 포함하고 있다. KIF5B 단백질의 N-말단 도메인은 NM_004521에 의해 암호화되는 KIF5B 단백질의 329번째 위치의 아미노산부터 시작되는 2 이상의 이중나선 도메인을 더 포함할 수 있다. 예를 들어, 2개의 이중나선 도메인은 NM_004521(서열번호 21)에 의해 암호화되는 KIF5B 단백질의 329번째 내지 638번째 위치의 아미노산 서열을 더 가질 수 있다. KIF5B 단백질의 N-말단 도메인은 NM_004521에 의해 암호화되는 KIF5B 단백질의 1번째 위치부터, 연속적인 약 329 내지 900개의 아미노산, 연속적인 약 329 내지 700개의 아미노산, 연속적인 약 329 내지 650개의 아미노산, 또는 연속적인 약 329 내지 638개의 아미노산을 포함할 수 있다.
융합단백질에서, 융합은 융합점(fusion point) 또는 절단점(breakpoint)으로 불리우는, KIF5B 유전자의 16번째 엑손과 RET 유전자의 12번째 엑손 사이에서 일어난다. "융합영역(fusion region)"이라는 용어는 융합점 주변의 폴리뉴클레오타이드 단편(약 ~30개의 뉴클레오타이드로 이루어짐) 또는 폴리펩티드 단편(약 ~30개의 아미노산으로 이루어짐)을 의미한다.
본 발명에서 사용되는 엑손의 번호는, NCBI에 위치한 엑손의 번호에 따라 번호를 붙였다.
일 예에서, 융합단백질 KIF5B-RET은 서열번호 3, 7, 11 또는 15의 아미노산 서열을 가질 수 있으며, 서열번호 3의 629번째부터 648번째까지의 위치, 서열번호 7의 629번째부터 648번째까지의 위치, 서열번호 11의 566번째부터 585번째까지의 위치, 및 서열번호 15의 839번째부터 858번째까지의 위치의 폴리펩티드 단편은 융합단백질 KIF5B-RET의 융합영역일 수 있다. 상기 융합단백질 KIF5B-RET의 융합영역은 서열번호 4, 8, 12 또는 16의 아미노산 서열을 가질 수 있다. 상기 KIF5B-RET 융합단백질을 암호화하는 KIF5B-RET 융합유전자는 서열번호 1, 5, 9 또는 13의 뉴클레오타이드 서열을 가질 수 있으며, 서열번호 1의 1885번째부터 1944번째까지의 위치, 서열번호 5의 1885번째부터 1944번째까지의 위치, 서열번호 9의 1696번째부터 1755번째까지의 위치, 및 서열번호 13의 2515번째부터 2574번째까지의 위치의 폴리뉴클레오타이드는, 융합유전자 KIF5B-RET의 융합영역 일 수 있다. 융합유전자 KIF5B-RET의 융합영역은 서열번호 2, 6, 10 또는 14의 뉴클레오타이드 서열을 가질 수 있다. 상기 융합유전자, 융합단백질, 및 융합영역들은 도 27 내지 34에 나타내었다.
DNA 분자들의 뉴클레오타이드 서열, 및 DNA 분자들에 의해 암호화되는 아미노산 서열은, 자동화 DNA 서열분석기 또는 자동화 펩티드 서열분석기에 의해 결정될 수 있다. 자동 서열분석 방법에 의해 결정된 뉴클레오타이드 서열 또는 아미노산 서열은, 실제서열과 비교하였을 때 부분적인 오류를 가지고 있을 수 있다. 일반적으로, 자동 서열분석에 의해 결정된 서열은 실제서열과 비교하여, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 또는 적어도 약 99.9%의 동일성(sequence identity)을 가지고 있다. 따라서, 융합단백질, 융합유전자, 또는 융합영역은 서열번호 1 내지 17의 서열과 비교하여 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 또는 적어도 약 99.9%의 동일성을 가지는 아미노산 서열 또는 뉴클레오타이드 서열을 가지고 있을 수 있다.
융합단백질과 융합유전자는 암 영역에서 특이적으로 존재하고, 암 영역 주변의 다른 영역에서는 존재하지 않음이 확인되었는바, 이는 융합단백질 및/또는 융합유전자는 고형암, 특히 폐암과 같은 암의 바이오마커로서 용도로 사용될 수 있음을 시사한다. 더욱이, 10번 염색체상에서 역위나 전좌를 포함하는 RET-관련 염색체의 재배열 또는 RET의 과발현은 암세포, 특히 폐암세포에서도 발견된다.
또한, 또 다른 실험예는 대상으로부터 얻어진 시험 시료에서, 하기의 군으로부터 적어도 1종이상을 탐지하는 것을 포함한, 암을 진단하는 방법 또는 암 진단용 정보를 제공하는 방법을 제공한다:
역위 또는 전좌를 포함하는, 10번 염색체에서 RET-관련 염색체의 재배열;
융합파트너의 N-말단 도메인 및 RET 단백질 C-말단 도메인을 포함하는 융합단백질;
융합단백질을 암호화하는 융합유전자; 및
폐암이 걸리지 않은 개인으로부터 얻어진 표준시료와 비교하여 RET의 과발현,
상기 군으로부터 적어도 1종 이상이 시험 시료에서 탐지된 때, 대상을 암환자로 결정한다.
RET-관련 염색체의 재배열은 융합단백질 또는 융합유전자의 형성에 의한 결과일수 있다. 예를 들어, RET-관련 염색체의 재배열은, 10번 염색체상의 역위일 수 있다. 상기 10번 염색체상의 역위는, 10번 염색체상의 역위영역과 혼성화(상보적 결합) 가능한 폴리뉴클레오타이드(프로브) 및/또는 10번 염색체상의 역위를 탐지 가능한 프라이머쌍, 예를 들어, 10번 염색체상의 역위영역을 포함한 연속적인 100 내지 200개의 뉴클레오타이드를 가지고 있는 폴리뉴클레오타이드 단편 생성이 가능한 폴리뉴클레오타이드 단편을 이용하여 탐지할 수 있다. 예를 들어, 10번 염색체상의 역위는 5'-CAGAATTTCACAAGGAGGGAAG-3'(서열번호 18) 및 5'-CAGGACCTCTGACTACAGTGGA-3'(서열번호 19)로 구성된 프라이머쌍을 이용하여 탐지할 수 있다.
융합단백질 및 융합유전자는 전술한 바와 같다.
구체적인 실시예에서, 융합단백질은, 융합단백질, 융합유전자, 또는 융합유전자에 해당하는 mRNA의 존재의 검출로부터 탐지될 수 있다.
융합단백질의 존재는, 융합단백질과 융합단백질에 특이적으로 결합하는 물질(예를 들어, 항체 또는 앱타머) 사이의 상호작용을 측정하는 일반적 분석방법에 의해 탐지될 수 있다. 이러한 일반적 분석방법으로는 면역크로마토그래피(immunochromatography), 면역조직화학적 염색법(immunohistochemical staining), 효소면역항체법(Enzyme liked immunosorbent assay, ELISA), 방사면역측정법(radioimmunoassay, RIA), 효소면역분석법(enzyme immunoassay, EIA), 형광면역측정법(florescence immunoassay, FIA), 섬광면역측정법(luminescence immunoassay, LIA), 웨스턴 블로팅(western blotting), 및 형광 활성화 세포선택장치(fluorescence activated cell sorter, FACS) 등과 같은 방법이 있다.
또한, 융합유전자 또는 mRNA의 존재는, 융합유전자 또는 mRNA와 혼성화(상보적 결합) 가능한 폴리뉴클레오타이드를 이용한, PCR, FISH(fluorescent in situ hybridization) 등과 같은 일반적인 분석 방법에 의해 검출될 수 있다. 융합유전자는 대규모 병렬 서열분석법(massive parallel sequencing) 기술을 통한, 전장-전사체(RNA) 및/또는 전장-유전체(DNA) 서열분석 병합 기술을 이용하여 탐지 및/또는 검증될 수 있다. 융합유전자 또는 mRNA와 혼성화 가능한 폴리뉴클레오타이드는 siRNA, 올리고뉴클레오타이드, DNA 프로브, 또는 DNA 프라이머일 수 있으며, 상기 siRNA, 올리고뉴클레오타이드, DNA 프로브, 또는 DNA 프라이머는 시험 시료에서, 융합된 또는 절단된, 유전자 또는 전사체와의 혼성화를 통해서 융합유전자 또는 mRNA를 검출할 수 있다.
융합유전자가, KIF5B-RET 융합단백질을 암호화하는 융합유전자 KIF5B-RET일때, 융합유전자 KIF5B-RET는, 서열번호 2, 6, 10 또는 14의 융합영역과 혼성화(상보적 결합) 가능한 폴리뉴클레오타이드(프로브) 및/또는, 서열번호 1, 5, 9 또는 13에서 각각 서열번호 2, 6, 10 또는 14의 융합영역을 포함하는, 연속적인 100 내지 200개의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드 단편을 생성할 수 있는 프라이머쌍을 이용하여 탐지할 수 있다. 예를 들어, 융합유전자 KIF5B-RET은 5'-GTGAAACGTTGCAAGCAGTTAG-3'(KIF5B; 서열번호 20)과 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21)로 이루어진 프라이머쌍, 또는 5'-TAAGGAAATGACCAACCACCAG-3'(KIF5B; 서열번호 22)과 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21)로 이루어진 프라이머쌍을 이용하여 탐지될 수 있다. 또한, 융합단백질 KIF5B-RET은 융합단백질의 KIF5B-RET의 융합영역에 특이적으로 결합하는 항체 또는 앱타머를 이용하여 탐지할 수 있다. 예를 들어, 융합단백질의 융합영역은 서열번호 4, 8, 12 또는 16의 아미노산 서열을 가질 수 있다.
상기 "융합영역(또는 역위영역)과 혼성화 가능한"이란 용어는, 상보적 서열 또는 상보적 서열의 융합영역(또는 역위영역)과 90% 이상의 동일성을 가지는 서열을 의미할 수 있다.
또 다른 실험예는, 서열번호 2, 6, 10 또는 14의 융합영역과 혼성화 가능한 폴리뉴클레오타이드, 서열번호 1, 5, 9 또는 13의 서열에 각각 서열번호 2, 6, 10 또는 14의 융합영역을 포함하는 연속적인 100 내지 200개의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드 단편을 생성할 수 있는 프라이머쌍, 10번 염색체상의 역위영역과 혼성화 가능한 폴리뉴클레오타이드, 10번 염색체상의 역위영역을 포함하는 100 내지 200개의 연속적인 뉴클레오타이드를 포함한 폴리뉴클레오디트 단편을 만들 수 있는 프라이머쌍, 및 서열번호 4, 8, 12 또는 16의 융합영역에 결합하는 항체 또는 앱타머로 이루어진 군에서 선택된 1 이상을 포함하는 암 진단용 조성물을 제공한다.
예를 들어, 프라이머쌍은 융합단백질을 암호화하는 KIF5B-RET 융합유전자를 탐지하기 위한 5'-GTGAAACGTTGCAAGCAGTTAG-3'(KIF5B; 서열번호 20)과 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21)로 이루어진 프라이머쌍, 또는 10번 염색체상의 역위를 탐지하기 위한 5'-TAAGGAAATGACCAACCACCAG-3'(KIF5B; 서열번호 22)과 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21)로 이루어진 프라이머쌍, 또는 5'-CAGAATTTCACAAGGAGGGAAG-3'(서열번호 18)와 5'-CAGGACCTCTGACTACAGTGGA-3'(서열번호 19)로 이루어진 프라미어쌍으로 이루어진 군에서 선택된 적어도 1종 이상의 프라미어쌍이다.
또 다른 실험예는 융합단백질 및/또는 융합유전자의 암 진단 용도를 제공한다.
환자는 임의의 포유류, 예를 들어, 인간 또는 원숭이와 같은 영장류, 마우스(mouse) 또는 랫(rat)과 같은 설치류 일 수 있으며, 특히 인간일 수 있다.
시험 시료는 환자(예를 들어 인간)로부터 분리된 세포(예를 들어 폐세포), 조직(예를 들어 폐조직), 또는 체액(예를 들어 혈액)일 수 있다. 환자는 키나아제 억제제를 처방받았거나, 처방받을 예정이다. 시험 시료는 인간의 암세포, 또는 인간의 암세포 추출물로부터 유래된 세포를 포함할 수 있다.
융합단백질 및/또는 융합유전자는 암치료를 위한 표적으로 작용할 수 있다.
따라서, 또 다른 실험예는, 적어도 1종 이상의 융합단백질의 억제제, 적어도 1종 이상의 융합단백질을 암호화하는 융합유전자의 억제제, 적어도 1종 이상의 RET 암호화 유전자의 억제제, 또는 그들의 결합을 환자에게 약학적으로(치료적으로) 효과적인 양의 투여 단계를 포함하는, 암 예방 및/또는 치료를 위한 방법을 제공한다. 상기 방법은 투여 단계 이전에 예방 및/또는 치료가 필요한 환자를 동정하는 단계를 더욱 포함할 수 있다.
또 다른 실험예는 암의 예방 및/또는 치료를 위해, 적어도 1종 이상의 융합단백질의 억제제, 적어도 1종 이상의 융합단백질을 암호화하는 융합유전자의 저해체, 적어도 1종 이상의 RET 암호화 유전자의 억제제, 또는 그들의 결합을 포함한 조성물을 제공한다.
또 다른 실험예는 융합단백질의 억제제, 융합단백질을 암호화하는 융합유전자의 저해체, RET 암호화 유전자의 억제제, 또는 그들의 결합을 암 예방 및/또는 치료를 위한 용도를 제공한다.
KIF5B-RET 융합단백질 억제제는 융합단백질에 특이적으로 결합하는 앱타머; 융합단백질에 특이적으로 결합하는 항체; 및 키나아제 억제제(예를 들어, 소라페닙 (sorafenib)(4-[4-[[4-chloro-3-(trifluoromethyl)phenyl]carbamoylamino]phenoxy]-N-methyl-pyridine-2-carboxamide), 카보잔티닙(Cabozantinib)(N-(4-((6,7-Dimethoxyquinolin-4-yl)oxy)phenyl)-N-(4-fluorophenyl)cyclopropane-1,1-dicarboxamide) 등)로 이루어진 군에서 선택된 1종 이상 일 수 있다. 융합유전자 또는 RET 암호화 유전자 억제제는, 융합유전자 또는 RET 암호화 유전자에 특이적으로 결합 가능한 siRNA, shRNA, miRNA, 및 앱타머로 이루어진 군에서 선택된 1종 이상 일 수 있다.
본 발명에서, 암은 어떠한 고형암, 예를 들어, 폐암, 간암, 대장암, 췌장암, 위암, 유방암, 난소암, 신장암, 갑상선암, 식도암, 전립선암, 또는 뇌종양일 수 있다. 구체적인 실시예에서 암은 폐암, 특히 소세포폐암(small cell lung carcinoma) 또는 폐선암종, 편평상피폐암(squamous cell lung carcinoma), 또는 대세포폐암(large cell lung carcinoma)와 같은 비소세포폐암일 수 있다.
더욱이, 또 다른 실험예는 다음을 포함하는 항암제 스크리닝 방법을 제공한다:
융합단백질을 발현하는 세포에 시료화합물을 접촉시키고; 및 세포 내 융합단백질의 발현 수준을 측정하는 단계를 포함하며,
상기 시료 화합물을 처리한 세포 내 융합단백질의 발현 수준이, 시료 화합물을 처리하기 전의 세포 또는 시료 화합물을 처리하지 않은 세포의 융합단백질 발현 수준에 비해 감소한 경우, 상기 시료 화합물을 항암제 후보물질로 결정한다.
상기 항암제 스크리닝 방법은, 시료화합물을 접촉시키는 단계 이전에, 세포내 융합단백질의 발현 수준 측정 단계를 더욱 포함할 수 있다. 이 경우, 시료 화합물을 처리한 후 융합단백질 발현 수준이, 시료 화합물을 처리하기 전의 세포에 융합단백질 발현 수준에 비해 감소한 경우, 시료 화합물을 항암제 후보물질로 결정할 수 있다. 또 다른 항암제 스크리닝 방법은, 융합단백질을 발현하는 세포를 제공하는 단계, 및 시료화합물을 제공된 세포의 일부에 접촉시키는 단계를 포함할 수 있다. 시료 화합물을 처리한 세포의 융합단백질 발현 수준이, 시료 화합물을 처리하지 않은 세포에 비해 감소한 경우, 시료 화합물을 항암제의 후보물질로 결정할 수 있다.
상기 스크리닝 방법에서 사용되는 세포는, 융합유전자 또는 융합단백질이 발현 및/또는 활성화된, 암세포, 세포 추출물, 또는 세포 배양으로부터 유래된 것 일수 있다. 상기 기술한 바와 같이, 상기 암세포는 고형암세포, 특히 폐암, 예를 들어 폐선암종과 같은 비소세포폐암세포 일 수 있다.
융합단백질 발현 수준은 면역크로마토그래피(immunochromatography), 면역조직화학적 염색법(immunohistochemical staining), 효소면역항체법(enzyme liked immunosorbent assay, ELISA), 방사면역측정법(radioimmunoassay, RIA), 효소면역분석법(enzyme immunoassay, EIA), 형광면역측정법(florescence immunoassay, FIA), 섬광면역측정법(luminescence immunoassay, LIA), 웨스턴 블로팅(western blotting), 및 형광 활성화 세포선택장치(fluorescence activated cell sorter, FACS) 와 같은 일반적인 분석방법을 통하여 탐지될 수 있다.
시료 화합물은 어떠한 천연화합물 또는 합성화합물일 수 있다. 예를 들면, 일반적인 화합물, DNA, RNA, 단백질, 및 이와 같은 화합물로 이루어진 군에서 1종 이상 선택된 것 일수 있다.
본 발명은 폐선암종 환자의 염색체 역위에 의해 발생한 융합유전자를 동정하였으며, 융합유전자는 어린이와 비흡연자 폐선암종 환자에게서도 발견되었으며, 이들의 암은 종례 알려진 삼중 표지자(EGFR, KRAS, 및 ALK 유전자)에 대해서는 음성반응을 보인다. 따라서, 본 발명의 융합유전자는 폐암의 효과적인 마커로 기대되며, 상기 융합유전자는 종례에 알려진 삼중 표지자가 기능을 하지 못하는 경우에도 마커의 기능을 수행할 수 있다.
도 1은 환자(AK55)의 CT-유도 생체검사(CT-guided biopsy)를 통해 얻어진 원발성 폐암조직의 파라핀 절편의 100배율 현미경 사진이다.
도 2는 환자(AK55)의 CT-유도 생체검사(CT-guided biopsy)를 통해 얻어진 원발성 폐암조직의 파라핀 절편의 400배율 현미경 사진이다.
도 3은 원발성 폐암 조직의 CK7에 대한 면역조직화학적 분석결과를 보여주는 현미경 사진이다.
도 4는 원발성 폐암 조직의 TTF1에 대한 면역조직화학적 분석결과를 보여주는 현미경 사진이다.
도 5는 원발성 폐암 조직의 CK20에 대한 면역조직화학적 분석결과를 보여주는 현미경 사진이다.
도 6은 폐암 전사체 서열분석을 통해 동정된 융합유전자의 그래픽 표현을 보여준다.
도 7은 KIF5B-RET 융합유전자를 개략적으로 보여준다.
도 8은 각 RET 엑손의, RNA 발현 수준을 보여주는 그래프이다.
도 9는 암 유전체의 대규모 병렬 서열분석법(massive parallel sequencing)을 통한 10번 염색체상에서 10.6Mb 길이의 역위를 개략적으로 보여준다.
도 10은 KIF5B-RET 융합유전자 확인을 위한 AK55의 RNA PCR 증폭 결과를 보여준다.
도 11은 KIF5B-RET 융합유전자 확인을 위한 AK55의 DNA PCR 증폭 결과를 보여준다.
도 12 RNA 확인을 위한 생어 서열분석법(Sanger sequencing)을 통한 역위 절단점 탐지 결과를 보여준다.
도 13 DNA 확인을 위한 생어 서열분석법(Sanger sequencing)을 통한 역위 절단점 탐지 결과를 보여준다.
도 14는 KIF5B-RET 융합단백질의 기능적 도메인을 개략적으로 보여준다.
도 15는 PHYRE2 알고리즘을 통해 예측한 KIF5B-RET 융합단백질의 삼차원구조를 보여준다.
도 16은 환자(AK55)로부터 얻은 폐암(골전이)에서 KIF5B-RET 발현의 면역조직화학적 분석결과의 현미경 사진을 보여준다 (x400).
도 17은 다른 폐선암종(lung adenocarcinoma)에서의 RET 발현 분석결과를 보여주는 그래프이다.
도 18은 간 전이에서의 유전자 발현 네트워크 분석결과를 보여준다.
도 19은 정상세포 (A)와 폐암세포 (B)의 FISH 분석결과를 보여준다.
도 20은 NIH3T3 세포주에서 KIF5B-RET 융합단백질 발현을 보여주는 웨스턴 블로팅 결과이다.
도 21은 KIF5B-RET 융합유전자로 형질 전환된 NIH3T3 세포주의 콜로니 형성 능력을 보여준다.
도 22은 키나아제 억제제, 카보잔티닙(Cabozantinib)을 처리한 상태에서의 KIF5B-RET 융합유전자로 형질 전환된 NIH3T3 세포주에서의 단백질 발현 수준을 보여준다.
도 23은 키나아제 억제제, 카보잔티닙(Cabozantinib)을 처리한 상태에서의 KIF5B-RET 융합단백질 발현 세포의 세포성장률을 보여주는 그래프이다.
도 24는 간전이성 폐암(AK55) 및 삼중표지자 음성인 폐선암종(LC_S2)의 겔 전기영동 이미지이다.
도 25는 이중음성 폐선암종(LC_S6)의 겔 전기영동 이미지이다.
도 25B는 LC_S6의 생어 서열분석법을 이용한 KIF5B-RET 융합유전자의 절단점 동정 결과이다.
도 26은 AK55, LC_S2 및 LC_S6의 KIF5B-RET 융합 전사체를 개략적으로 보여준다.
도 27은 KIF5B-RET 융합유전자 및 NM_020975으로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 뉴클레오타이드 서열을 보여준다.
도 28은 KIF5B-RET 융합단백질 및 NM_020975로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 아미노산 서열을 보여준다.
도 29은 KIF5B-RET 융합유전자 및 NM_020630로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 뉴클레오타이드 서열을 보여준다.
도 30은 KIF5B-RET 융합단백질 및 NM_020630로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 아미노산 서열을 보여준다.
도 31은 LC_S2로부터 얻은 KIF5B-RET변종 융합유전자의, 뉴클레오타이드 서열 및 융합영역을 보여준다.
도 32는 LC_S2로부터 얻은 KIF5B-RET변종 융합단백질의, 아미노산 서열 및 융합영역을 보여준다.
도 33은 LC_S6로부터 얻은 KIF5B-RET변종 융합유전자의, 뉴클레오타이드 서열 및 융합영역을 보여준다.
도 34는 LC_S6로부터 얻은 KIF5B-RET변종 융합단백질의, 아미노산 서열 및 융합영역을 보여준다.
이하, 본 발명을 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명이 하기 실시예에 의해 한정되는 것은 아니다.
실시예 1: 시료 준비단계
실시예에서 사용된 모든 프로토콜들은 서울성모병원(승인번호 KC11OISI0603)의 임상시험심사위원회에 의해 승인된 것이다. 파라핀 함몰 조직들(Paraffin-embedded tissues)은 AK55 환자의 원발성 폐암 및 골전이 암으로부터 얻어졌다. 또한, AK55의 간전이성 암의 생검(biopsy)을 통해 얻어진 냉동조직도 이용할 수 있었다. 또한, AK55의 정맥혈을 채취하였다. AK55 환자의 폐암, 골전이암, 간전이암, 및 혈액으로부터 유전체 DNA를 추출하였다. 더욱이, AK55 환자의 냉동된 간전이암에서 RNA를 추출하였다. 그리고, 본원발명에 참고로 인용된 "Ju YS, Kim JI, Kim S, et al., Nat Genet 2011,"에서와 같이 전체 RNA로부터 cDNA를 합성하였다.
AK55 환자(폐선암종 및 다발성 전이를 가진 33세의 남자 환자)는 33세까지는 건강하였으나, 도 1과 도 2에 보이는 바와 같이 폐의 우상엽에 덜 분화된 선암(adenocarcinoma)이 발달하고 있었다. 도 1과 도 2는 CT-유도 생체검사(헤마톡시린 및 에오신 염색)를 통해 얻어진 원발성 폐암 조직의 파라핀 절편 현미경사진이다(도 1: x100; 도 2: x400). 암조직에서, 덜 분화된 종양 세포 둥지들이 결합조직형성기질(desmoplastic stroma)에 존재하였다. 게다가, 암세포는 불룩한 세포질과 큰 다형성 핵을 가지고 있었다.
PET(positron emission tomography)을 통하여, 간과 다수의 뼈에서도 전이가 발견되었다. 병리학적 진단을 위하여, 그는 원발성 폐암의 CT 유도 생체검사(CT-guided biopsy)뿐만 아니라 간전이성암의 초음파 유도 생체검사(ultrasound-guided biopsy)도 하였다. AK55 환자는 조부모 세대부터 암 가족력은 없었으며, 그는 흡연한 적이 없었다. 진단 1주일 후, 그는 경추(cervical bone)로의 전이로 인하여 목 골절을 당했으며, 때문에 C7 경추체 제거술(corpectomy)을 받았다. 병리학 연구들에서, 그의 폐선암종은, 알려진 EGFR, KRAS, 및 ALK 돌연변이들에 대하여 음성반응을 보였다. CK7, CK20, 및 TTF1에 대한 면역조직화학적 분석결과들은 폐선암종과 일치하였다(도 3 내지 도 5; CK7 양성 (도 3), TTF1 양성 (도 4), CK20 음성 (도 5)).
도 3 내지 도 5는 원발성 폐암 조직(도 3; CK7; 도 4: TTF1; 도 5: CK20)의 면역조직화학적 결과를 보여주는 현미경 사진이다. 이러한 분석들은 경추로 전이된 종양에서 수행되었다. CK7과 TTF1는 양성이었으나, CK20는 음성이었다. 결과들은 원발성 폐선암종이 이 암의 기원일 가능성을 높게 보여준다.
실시예 2: 전장 유전체 분석
상기 실시예 1에서의 방법과 같이, AK55 환자로부터 얻어진 각각 시료의 유전체변종(Genomic variants)들은 단일염기변이(single nucleotide variation, SNV), 짧은 삽입(short insertion) 과 결실(삽입결실, indel), 및 대량 결실(large deletions) 로, 본원발명에 참고로 인용된 "Ju YS, Kim JI, Kim S, et al., Nat Genet 2011"와 "Kim JI, Ju YS, Park H, et al., Nature 2009;460:1011-5"에서 에서 서술된 바와 같이, 전장-유전체 서열분석법(whole-genome sequencing)의 수정된 기준을 이용하여 분류되었다. 그리고 나서, 암조직에서의 상기 유전체변종들을 암-관련 체세포 돌연변이들을 동정하기 위해 혈액 내의 유전체와 비교하였다. DNA 및 RNA 서열 데이터 또한 본원발명에 참고로 인용된 "Ju YS, Kim JI, Kim S, et al., Nat Genet 2011,"에서 서술한 방법으로 분석하였다.
원발성 폐암의 DNA는 파라핀 함몰 조직에 있는 적은 양의 DNA로부터 추출되기 때문에, 분석을 위한 ?은-리드 중복(short-read redundancy)이 너무 높았다. 따라서, 주요 비교들은 간전이와 혈액의 서열 사이에서 이루어졌다. 서열분석 실험들은, Illumina의 표준방법, 및 본원발명에 참고로 인용된 "Ju YS, Kim JI, Kim S, et al., Nat Genet 2011"와 "Kim JI, Ju YS, Park H, et al., Nature 2009;460:1011-5"에서 서술된 방법을 이용하여 수행하였다.
서열 라이브러리(sequencing library)들은 Illumina Inc.의 표준프로토콜에 따라 만들었다. 서열분석의 높은 처리량을 위해, 파라핀 함몰 골전이로부터의 유전체 DNA(DNA 농도가 너무 낮아서, 발명자의 기준에 충족되지 않았고 서열 라이브러리 구축을 하기에는 부적합)를 제외한 시료들은 Illumina HiSeq2000와 Genome Analyzer IIx를 이용하여 서열분석하였다. AK55 환자의 암(간전이) 및 정상조직(혈액) 의 전장-유전체 딥 시퀀싱(whole-genome deep sequencing)으로부터, 발명자들은 각각 47.77x과 28.27x의 평균 리드-깊이(read-depth)를 얻었다. 표 1은 얻어진 결과를 보여준다. 폐암환자 AK55의 서열 분석 통계 요약를 표 1에 나타냈다.
분석 조직 출처 대량 병렬 서열분석법 검증
나란한
리드의 수
리드
길이
(bp)
처리량
(Gbp)
리드
깊이
(배)
PCR 및 생어 서열분석법
유전체 혈액 신선(Fresh) 392,194,564 103 80.79 28.27 있음
폐암 파라핀 함몰 274,909,815 103 56.63 19.81 있음
간전이 냉동 362,530,401 101 136.55 47.77 있음
293,140,533 108
골전이 파라핀 함몰 - - - - 있음
전사체 간전이 냉동 89,682,934 101, 68 15.16 - 있음
전장-유전체 범위는 고르게 분포되어 있었다 (중심 소체(centromeric) 또는 말단 소립(telomerec) 영역에서의 정상 '스파이크들(spikes)' 제외). 이것은 암조직에서 이수성의 증거가 없음을 보여준다(도 6). 도 6은 폐암의 전사체 서열분석에서 동정된 융합유전자의 시각적 표현을 보여준다. 염색체 내부, 및 염색체 간의 융합유전자는 중간층에서 관찰된다. 선의 두께는 증거의 양(스패닝 리드(spanning reads)들의 수) 을 보여준다. KIF5B-RET 융합유전자는 빨간색으로 표시되었다. 염색체 이데오그램(ideograms)은 바깥층에서 보여진다. 암 전장 유전체 서열분석의 범위는 1번째 중간층에서 보여진다. 이러한 결과는, 암 유전체는 광범위한 염색체의 이수성을 가지고 있지 않음을 시사한다. 히트맵(Heatmap)을 이용한 유전자의 발현 수준은 2번째 중간층에서 보여진다.
암 전장-유전체 서열에서, 우리는 OMIM(Online Mendelian Inheritance in Man) 및 SNPedia에 보관되어 알려진 어떠한 암 관련 체세포 점 돌연변이(somatic point mutations)도 찾을 수 없었다. 암과 혈액 간의 SNVs, 삽입결실, 및 CNVs(copy number variants)의 비교에서는 발암가능성이 있는 암 관련 유전자에서의 어떠한 눈에 띄는 돌연변이도 찾을 수 없었다.
실시예 3: 융합유전자 분석
융합유전자를 검출하기 위해, 전사체 서열분석(transcriptome sequencing), 다른 유전자와 나란히 있는 리드(read)의 끝에 존재하는 디스코던트 리드 (discordant read)들, 및 키메릭 전사체들(chimeric transcripts)의 융합 절단점을 가로질러 있는 엑손-스패닝 리드(exon-spanning read)들을 사용하였다. 최종 융합유전자 후보들을 위해, 상응하는 유전체의 재배열, 즉 역위, 전좌 및 대량결실, 을 전장 유전체 서열분석 데이터를 통해서 조사하였다.
전사체 데이터가 분석되었으며, 많은 암들은 병원성 염색체의 전좌 또는 역위에 의한 융합유전자에 의해서 유래되는 것으로 알려져 있기 때문에 발명자들은 융합유전자를 찾아내는데 초점을 맞추었다.
융합유전자들을 찾아내기 위해, 각각 약 300bp 길이의 cDNA단편들의 끝을 101bp까지 차세대염기서열분석(next generation sequencing)을 통하여 서열분석 하였다(Ju YS et al., Genome Res. 2012 22:436-445). 서열 데이터로부터, 우리는 다른 염색체들에 정렬되어있는 서열에 양끝에 있는 디스코던트 리드의 존재를 조사하였다. 게다가, 각 끝 서열의 하나는 융합유전자의 절단점으로부터 만들어졌으며, 엑손-스패닝 리드들의 존재도 조사하였다. 디스코던트 리드 및 엑손-스패닝 리드들은 융합유전자의 존재를 나타낸다. 디스코던트 리드와 엑손-스패닝 리드를 모두 가진 유전자를 폐암 융합유전자라고 정하였다.
AK55에서 동정 된 융합유전자 중 선택된 것 (52개 중 20개)에 대해서 융합유전자의 확인 방법을 표 2 및 도 6에 나타냈다.
카테고리 공여 유전자 수용 유전자 염색체 거리
(Mb)
디스코던트 리드의 수 스패닝 리드의 수 전장-유전체 서열 내의 증거
염색체 내
KIF5B RET 10 10.580 34 60 있음
(역위)
KIF5B KIAA1462 10 1.970 4 4 -
EEF1DP3 FRY 13 0.133 3 5 -
RPS6KB1 TMEM49 17 0.097 4 31 -
HACL1 COLQ 3 0.075 3 4 -
TMEM56 RWDD3 1 0.073 4 11 -
FAM18B2 CDRT4 17 0.065 4 29 -
CTBS GNG5 1 0.065 6 27 -
METTL10 FAM53B 10 0.054 2 4 -
AZGP1 GJC3 7 0.048 5 15 -
NKX2-1 SFTA3 14 0.046 3 7 -
ADSL SGSM3 22 0.036 5 6 -
ART4 C12orf69 12 0.034 3 4 -
LOC100131434 IDS X 0.031 2 11 -
LOC100130093 SNAP47 1 0.030 2 2 -
C15orf57 MRPL42P5 15 0.025 2 7 -
MIA2 CTAGE5 14 0.024 30 102 -
SH3D20 ARHGAP27 17 0.024 2 10 -
RBM14 RBM4 11 0.023 16 24 -
염색체 간
RSPO1 HP 16;1 - 2 3 -
이들 중, 94.2%(n=49)는 인접한 유전자(< 135 Kb) 사이의 염색체 간 융합이었고, 이것은 발암에서 어떠한 기능적 역할을 가지고 있지 않을 것이다(표 2). 또한, 1.9%(n=1) 는 염색체 내 융합이었지만, 이것은 간에서 높게 발현되는 유전자인 합토글로빈(haptoglobin, HP)에 의하여 발생한 것이다. 비록 상기 융합유전자의 존재는 생물학적으로 유전자의 분자적 기능과 관련하여 흥미롭지만, 이것이 종양형성을 한다고 생각되지는 않는다. 남은 3.8% (n=2) 는 KIF5B-RET와 KIAA1462-KIF5B 융합유전자였고, 이들의 염색체 내 융합은 떨어져 있는 유전자(>~2Mb) 사이에서 발생하였다. 이 결과에 의해 KIAA1462-KIF5B는 제외되었다. 왜냐하면 KIAA1462-KIF5B의 발현 수준이 낮고, KIAA1462은 분자 기능이 알려지지 않은 가상의 단백질이기 때문이다. KIF5B-RET 융합을 제외하고는, 우리는 융합유전자 후보들 내에서 염색체의 재배열(예를 들어, 대량 결실, 역위, 또는 전좌)에 해당하는 것을 찾을 수 없었다.
RET는 타이로신 키나아제 원암유전자(proto-oncogene)로 잘 알려져 있기 때문에, 최종 융합유전자인 KIF5B-RET는 특별히 흥미가 있다. 또한, 상기 융합유전자는 인간의 암에서는 보고된 바가 없다. 게다가, 그것은 신규한 것으로 간주된다. 이 유전자 융합 사건의 특성은 RNA 서열분석 데이터를 이용하여 더욱 확인되었다. 융합유전자는 높게 발현되었고, 34개의 디스코던트페어드-엔드 리드들과 60개의 퓨전-정션(fusion-junction)을 가로지르는 스패닝 리드들에 의해 입증되었다(표 2 및 도 7). 도 7은 KIF5B-RET 융합유전자를 개략적으로 보여준다. 전사체 서열분석에서, 34개의 디스코던트페어드-엔드(discordantpaired-end) 리드들과 60개의 엑손-정션 (exon-junction) 을 가로지르는 스패닝 리드들이 동정되었다. 이러한 리드들의 존재는 융합유전자의 강력한 증거이다. 디스코던트페어드-엔드 리드는 말단서열이 다른 유전자와 정렬된 리드로 정의하였다. 스패닝 리드는 예측된 융합 전사체의 정션을 가로질러 정렬된 말단서열을 가진 리드를 말한다. 상기 분석에서, 융합은 KIF5B의 16번째 엑손과 RET의 12번째 엑손 사이에서 일어났다.
이러한 데이터들은 KIF5B의 16번째 엑손의 끝과 RET 원암유전자의 12번째 엑손의 시작이 합쳐짐을 보여준다. 발현 프로파일은 암조직에서 RET의 1번째 내지 12번째 엑손은 발현되지 않음을 보여주며(도 8), 이것은 암에서의 대부분의 RET 발현은 그대로의 RET 유전자보다 융합유전자에서 일어남을 보여준다. 도 8은 각각의 RET 엑손의 RNA발현 수준을 보여주는 그래프이다. RET 발현은 12번째 엑손, 즉 융합유전자의 정션의 아래쪽에서 관찰되었다. 이것은 모든 RET 발현은 정상 RET 유전자 보다 KIF5B-RET 융합유전자로부터 유래되었음을 제시한다.
KIF5B과 RET는 각기 10p11.22와 10q11.21에 10.6Mb만큼 떨어져서 존재한다. 두 유전자들을 암호화하는 가닥이 다르기 때문에, 융합유전자를 만들어지기 위해서는 10.6 Mb 길이의 역위가 일어나야 한다 (도 9). 도 9는 10번 대규모 병렬 서열분석법(massive parallel sequencing)을 통한 암 유전체의 염색체에서의 10.6 Mb 길이의 역위를 개략적으로 보여준다. 이러한 역위는 KIF5B-RET 융합유전자의 원인이다. KIF5B는 일반적으로 자신의 유니버셜 프로모터와 함께 발현된다. 역위가 일어난 후, 상기 프로모터는 KIF5B-RET 융합유전자의 글로벌 발현을 활성화한다.
상기 유전체의 역위는 암에서 역위(간전이에 8개의 리드; 원발성 폐암에 1개의 리드)를 뒷받침하는 리드의 검출을 통해 확인되었다. 그러나, 혈액 조직의 전체 유전체 서열분석에서는 상응하는 염색체의 재배열이 없었다.
상기 결과는 유전체의 DNA와 cDNA를 PCR 증폭과 생어 서열분석법을 통한 분석을 이용하여 더욱 입증되었다. PCR 반응은 95℃에서 10분 동안, 95℃에서 30초 동안 30 싸이클, 62℃에서 10초 동안, 72℃에서 10초 동안, 마지막으로 72℃에서 10분 동안 수행하였다. 유전체의 역위를 위한 PCR 및 생어 서열분석법 프라이머는 5'-CAGAATTTCACAAGGAGGGAAG-3'(서열번호 18)와 5'-CAGGACCTCTGACTACAGTGGA-3'(서열번호 19)였다. 융합 전사체를 위한 프라이머는 5'-GTGAAACGTTGCAAGCAGTTAG-3'(서열번호 20)와 5'-CCTTGACCACTTTTCCAAATTC-3'(서열번호 21)이다. 모든 생어 서열분석법(Sanger sequencing) 실험은 Macrogen Inc.(http://www.macrogen.com)에서 실시하였다.
AK55 환자(폐암, 뼈와 간에 전이)의 3가지 암관련 조직은 정상 혈액을 제외한 모두가 PCR 생성물은 역위의 결과임을 보여준다 (도 10 및 도 11). 도 10 및 도 11은 AK55 환자로부터 얻어진 RNA(도 10)와 DNA(도 11)의 KIF5B-RET 융합유전자 확인을 위한 PCR 증폭결과이다. RNA 및 DNA에서의 KIF5B-RET 융합유전자의 확인은 상기 기술된 역위에 특이적인 프라이머를 이용한 PCR 증폭 및 및 전기영동을 통해 수행되었다. 융합유전자 환자의 암 조직의 RNA와 DNA에서만 발견되었다.
이들 결과물의 생어 서열분석은 뉴클레오타이드 분해를 가진 역위의 절단점을 찾음으로써 융합 전사체를 검증하였다 (인간 위탁 유전체 빌드 36.3 (human reference genome build 36.3)의 chr10:32, 351, 306-42, 931, 601). 도 12와 13은 RNA (도 12) 와 DNA (도 13) 의 검증을 위한 생어 서열분석법을 통한 역위 절단점의 탐지결과들을 보여준다. 융합유전자는 생어 서열분석법을 이용하여 성공적으로 확인되었다. 유전체에 있는 역위 절단점은 또한 싱글-뉴클레오타이드 레졸루션(single-nucleotide resolution)으로 확인되었다. 유전체의 절단점들은 KIF5B와 RET의 인트론(intron)에 위치하고 있다. 절단점(인간 위탁 유전체 빌드 36.3의 chr10:42,931,604)으로부터 2개의 염기 다운스트림(downdtream)에, 1-bp 결실이 만들어졌으며, 이는 NHEJ(error-prone non-homologous end joining)가, 이중가닥 DNA의 절단 이후에 발생한 상기 역위로부터 기인하였을 수 있음을 제시한다.
흥미롭게도, 단일 염기쌍 결실은 절단점(chr10:42,931,604)에서 2bp 인접한 곳에서 동정되었으며, 이는 에러-프론(error-prone) DNA 수선 메커니즘, 즉 NHEJ, 이 이중가닥 DNA의 절단 이후에 발생한 상기 역위로부터 기인하였을 수 있음을 제시한다. 이에 더하여, G-quadruplex(non-B DNA) 구조는 RET에 존재하는, 깨지기 쉬우며 염색체의 전좌의 근원으로 알려진 절단점의, ~100 bp 업스트림(upstream) 에 있을 것으로 예상된다.
실시예 4: KIF5B - RET 융합 키나아제의 기능성 평가
RET 종양 유전자는 막관통 수용체 타이로신 키나아제(transmembrane receptor tyrosine kinase)이다. RET은 세포 외 영역(Cadherin-like 도메인을 포함하고 있음), 막관통 도메인 및 타이로신 키나아제 도메인을 포함하는 세포 내 영역으로 구성되어있다 (도 14). 도 14는 KIF5B-RET 융합단백질의 기능적인 도메인을 개략적으로 보여준다. 융합단백질은 KIF5B의 638 N-말단 잔기들 및 RET의 402 C-말단 잔기들로 구성되어 있다. 융합유전자는 이중나선 도메인을 포함하여 단백질 타이로신 키나아제 도메인을 가지고 있다. 이중나선 도메인은 자기인산화에 의해 발암성 단백질 타이로신 키나아제 도메인(oncogenic protein tyrosine kinase domain)을 활성화시킬 수 있는 동종이량화(homo-dimerization)를 유발한다.
RET이 GDNF와 같은 공동수용체나 리간드에 결합에 의하여 이량화 될 때, 자기인산화에 의해 활성화되고, 하부 신호 전달을 자극한다. RET 원암유전자의 하위 신호 전달계(downstream signaling cascade)는 세포 생존/세포사멸, 증식, 분화, 및 전이를 조절하는 MAPK 경로이다. RET의 정상발현은 신경발달에 중요하나, 분화된 조직들에서는 활성화되지 않음이 알려져 있다.
KIF5B는 미세소관의존성 모터(microtubule-based motor) 단백질이며, 보편적으로 KIF5B의 활성화 프로모터에 의해 발현되고, 진핵세포 내의 세포 소기관의 수송에 참여한다. KIF5B의 이중나선 도메인은 자신의 움직임에 필수적인 동종 이량화를 유도한다.
도 15는 PHYRE2 알고리즘을 이용해 예측한 KIF5B-RET 융합단백질의 삼차원구조를 보여준다. 융합단백질의 N-말단 및 C-말단은 빨간색과 파란색으로 표시되었다. 각기 단백질 3D 모델링은 KIF5B-RET 융합유전자의 단백질 서열을 이용한 PHYRE2 소프트웨어로 수행되었다 (http://www.sbg.bio.ic.ac.uk/phyre2/).
이와 마찬가지로, KIF5B-RET 융합유전자는 높게 발현될 것이며, 그리고 나서 KIF5B에 의해 번역된 후에 이량화될 것이다 (도 14 및 15). 그런 다음, 이량화된 RET 단백질 타이로신 키나아제 도메인은 비정상적으로 자극될 것이며, 이에 따라 발암 경로의 자극이 촉진된다. 면역조직화학적 분석은 RET의 타이로신 키나아제 도메인은 폐암 조직에서 높게 발현되었음을 보여준다 (도 16). 도 16은 환자(AK55)의 폐암(골전이)에서의 KIF5B-RET 발현을 면역조직화학적 분석한 결과를 보여주는 현미경 사진이다 (x400). 단백질이 종양세포에서 독점적으로 관찰된 것은, KIF5B-RET 융합단백질은 암에서 중요한 역할을 수행함을 의미한다.
실시예 5: 다른 폐암 시료들에서의 RET 과발현 빈도 평가
RET의 발암성 효과는 PTC/RET 융합단백질의 형성을 주도하는, 다양한 종류의 염색체의 전좌와 역위가 있는, 갑상선유두상암(papillary thyroid carcinoma, PTC)에서 처음으로 확인되었다. 특정의 점 돌연변이 역시 발성 내분비종양증(multiple endocrine neoplasia, MEN) 2A와 2B 타입에서 드라이버(driver)로서 보고되었다. 또한, 활성화된 RET이 전립선암, 췌장암, 악성 흑색종에서 관찰되었다. 상기 RET의 종양생성능력 또한 RET 형질 전환된 쥐 연구에서 다양한 종류의 악성종양을 만들어냄에 따라 뒷받침된다. 그러나, 상기 RET 유전자는 종례의 폐암에서는 강조되지 않았다.
폐선암종에서의 RET 과발현 빈도는 데이터베이스에 보관되어있는 종례 마이크로 어레이 데이터를 이용하여 평가하였다. 특별히, 일반적인 폐선암종(lung adenocarcinoma)에서의 RET 과발현을 조사하기 위하여, 우리는 데이터베이스(유전자 발현 Omnibus: http://www.ncbi.nlm.nih.gov/geo/와 The Cancer Genome Atlas (TCGA) : http://cancergenome.nih.gov/)에 보관되어있는 폐선암종의 발현 프로파일을 분석하였다.
10개의 선암종 세포주(GemmA, Li C, SugiyamY, et al., BMC Cancer 2006;6:174)의 발현 프로파일은 두개의 시료에서 RET이 높게 발현되었음을 보여준다. 반면에, RET은 본 데이터 세트의 10개의 소세포암 세포주와 9개의 편평세포암종(squamous cell carcinoma) 세포주에서 활성화되지 않았다. 우리는 원발성 폐암에서의 RET 원암유전자 발현을 프로파일한 3개의 연구를 더 발견하였다. 첫 번째 연구의 데이터 세트에서(Ding L, Getz G, Wheeler DA, et al., Nature 2008;455:1069-75), 75개중 6개의 종양(8%)에서 RET이 과발현하였다. 또 다른 데이터 세트(Kuner R, Muley T, Meister M, et al., Lung Cancer 2009;63:32-8)는 40개중 5개의 시료(12.5%)에서 RET 활성을 보여주었다. 마지막으로, The Cancer Genome Atlas(TCGA) 데이터 세트는 32개중 3개의 시료(9.4%; 도 17)에서 RET 과발현을 보여주었다. 도 17은 다른 폐선암종에서 RET 발현 분석결과를 보여주는 그래프이다. TCGA(The Cancer Genome Atlas)에 기탁 되어있는 32개의 발현 마이크로어레이 데이터를 분석하였다. 이들 중 3개의 시료는 명백한 RET 과발현을 보여주며, 이것은 폐선암종에서의 과발현 빈도는 약 10%임을 제시한다.
이와 함께, 상기 결과는 폐선암종에서 RET 과발현 빈도는 ~10%임을 제시한다.
도 18은 간전이에서의 유전자 발현 네트워크 분석결과를 보여준다. 네트워크 분석은 MiMI plugin(http://mimiplugin.ncibi.org/)과 함께 Cytoscape(http://www.cytoscape.org/)를 이용하여 수행되었다. 암에서 유전자들이 과발현되어지는 것은 네트워크로 매핑되었으며, 마디 크기는 상대적인 발현에 비례한다. 주요한 기능기들은 표지 되었으며, 기능적으로 중요한 유전자들은 빨간색으로 표지 되었다.
실시예 6: FISH 분석을 통한 KIF5B - RET 융합유전자의 동정
RET 재배열을 동정하기 위하여, FISH를 AK55 세포주와 대조군으로서 정상세포에, RET을 위해 브레이크-어파트 프로브(break-apart probe)를 이용하여 수행하였다. 슬라이드들은 Citrisolve(Fisher Scientific, Pittsburgh, PA)에 15분 동안 침지시키고, 제트 공기로 건조시킨 후, 다시 루골 용액(Lugol solution)에 5분간 침지시켰다. 그 다음, 2.5% 티오시안산나트륨(sodium thiocyanate)에 30초 동안 침지시켰다. 그 다음, 슬라이드들을 citrate/citric acid 용액(pH 6.0) 10 mmol/L에 위치시키고, 5분간 높은 설정에서 마이크로웨이브(microwave)하고, 이어서 37℃에서 15 내지 45분 동안 0.4% 펩신 용액(pepsin A/0.9% sodium chloride at pH 1.5)에서 마이크로웨이브한다. 10마이크로리터의 FISH 시약(7ul LSI buf-fer [Vysis, Downers Grove, IL], 3ul 프로브)을 각각의 슬라이드에 넣은 후, 슬라이드들에 커버슬라이드를 씌운다, Hybrite(Vysis)에서 녹는점 80℃에서 5분간 변성시키고, 습도 챔버(humidified chamber) 안에서 37℃에서 12시간 동안 인큐베이팅하였다. 슬라이드들을 2Xsaline sodium citrate/0.1% NP40(US Biological, Swampscott, MA)으로 70℃에서 2분간 세척한 후, DAPI(4,6-diamidino-2-phenyl indole dihydrochloride)와 대조하였다. 세포들은 마이크로스코피스트(micros-copist)에 의해 적절한 필터 세트가 장착된 형광현미경을 이용하여 분석되었다. 염색체 역위, 즉 추론된 염색체의 재배열은 KIF5B-RET 융합에 책임이 있다. 얻어진 FISH 결과는 도 19에서 보여지며, 빨강색과 녹색 프로브의, KIF5B-RET 융합 양성 종양에 측면(flank) RET 전좌 사이트 분열을 보여준다 (화살표).
실시예 7: KIF5B - RET 융합유전자로 형질 전환된 포유류 세포의 세포 성장률 및 생존력 실험
NIH 3T3 세포들을 KIF5B-RET 융합단백질을 암호화하고 KIF5B-RET 융합단백질을 발현시키는 cDNA가 포함 된 컨스트럭트(construct)로 형질전환시킴으로써, KIF5B-RET 융합단백질의 발현이 정상세포를 종양세포로 변환시키는데 기여하는지 아닌지 여부는 확실해졌다. NIH3T3 세포(ATCC/ ATCC Number CRL-1658)는 10 %(v/v) fetal bovine serum (FBS; Gibco BRL), 페니실린, 및 스트렙토마이신이 포함된 DMEM 배지(Gibco BRL)에서 보관되었다. 레트로바이러스의 상청액 준비와 형질전환은 CELL BIOLABs로부터 구입한 Platinum Retrovirus Expression System이 제공하는 프로토콜에 따라 수행되었다. NIH3T3 세포는 pMXs-puro/Fusion 단백질 발현 벡터를 포함한 레트로바이러스의 상청액을 통해 형질도입하고, 그 다음 형질도입된 세포를 퓨로마이신(2ug/ml)을 이용하여 선별하였다. 세포주로부터의 모든 세포용해물 은 SDS-PAGE 수행 후, PVDF(polyvinylidine difluoride) 멤브레인 위에 블로팅을 하였다. 블롯팅은 0.1% 트윈 20과 5% BSA이 포함된 TBS로 차단되었고, anti-RET (#3223, Cell signaling, USA), anti-phospho-RET (Tyr905) (#3221, Cell signaling, USA), 및 anti-actin(A5441, Sigma-Aldrich, USA)으로 탐색하였다. 0.1% 트윈 20이 포함된 TBS로 세척 후, 맴브레인은 겨자무과산화효소 (horseradish peroxidase) 결합된 anti-mouse 또는 anit-rabbit 2차 항체와 함께 인큐베이트하였고, ECL (enhanced chemiluminescence reagent; Pierce, #34080) 을 처리하였다. 얻어진 결과는 도 20에 나타내었으며, 선별된 NIH3T3 세포들이 안정적으로 KIF5B-RET 융합유전자로 형질 전환되었음을 웨스턴 블로팅을 통해 나타낸다.
FBS가 포함되거나 또는 FBS가 포함되지 않은 배지에서, NIH3T3 부모세대 세포와 KIF5B-RETa를 발현하는 NIH3T3 안정된 세포주, 또는 KIF5B-RETc 융합유전자(NIH3T3/KIF5B-RETa, NIH3T3/KIF5B-RETc) 세포의 성장률을 측정하고, 각각을 비교하였다. NIH3T3 세포와 NIH3T3/KIF5B-RET 세포는 FBS가 포함된 배지와 FBS가 포함되지 않은 배지에서 각각 24시간 동안 배양하였다. 그 후 얻어진 이미지들을 도 21에 나타내었다. 도 21에서 보이듯이, 형질 전환되지 않은 NIH3T3 세포들의 성장률은 FBS가 포함되지 않은 배지에서 억제되었으나, KIF5B-RET 융합유전자로 형질 전환된 NIH3T3 세포는 FBS가 포함되지 않은 배지에서도 성장하고, 콜로니를 잘 형성하였다. 상기 결과는 KIF5B-RET 융합단백질의 발현은 NIH3T3 세포의 특성을 변하게 하였고, KIF5B-RET 융합유전자로 형질 전환된 세포들은 KIF5B-RET 융합단백질 덕분에 심지어 FBS가 부족한 배지 같은 비정상조건에서도 생존과 성장 가능함을 보여준다.
실시예 8: 융합단백질 억제제( 카보잔티닙 ( Cabozantinib ))에 의한 포유류 고형암 세포 성장 저해 시험.
융합단백질이 융합단백질을 발현하는 세포주(또는 종양세포)의 성장 및 생존을 자극하는지에 대한 효과를 확인하기 위해서, 세포주에 키나아제에 대한 저해제 또는 융합단백질에 포함된 다른 도메인에 대한 저해제를 처리하였다.
특별이, KIF5B-RET로 형질 전환된 NIH3T3 세포(NIH3T3 /KIF5B-RET)(실시예 7)에, 도 22에서 보이듯이, 카보잔티닙(Cabozantinib)(4 Chem, 한국)을 다양한 농도에서 2일 동안 처리하였다. 그리고 RET, phospho-RET, 및 액틴(actin)의 발현수준(대조군)을 상응하는 항체들을 이용한 면역블로팅을 통하여 측정하였다. anti-RET 및 anti-phospho-RET(Tyr905) 항체들은 각각 Cell Signaling Technology(#3223, #3221)로부터 입수하였다. anti-actin 항체는 Sigma Aldrich(#A5441)로부터 입수하였다.
얻어진 결과들은 도 22에 나타내었으며, RET의 활성화된 형태인 phospho-RET의 발현이 카보잔티닙(Cabozantinib)의 농도에 따라 감소함을 보여준다. 상기 결과는 RET 단백질이 융합단백질 형질 전환된 세포에서 비정상적으로 활성화되었음을 나타내며, 융합단백질 형질 전환된 세포의 성장은 키나아제 억제제를 처리함으로써 저해될 수 있음을 보여준다.
세포 성장 저해에 대한 정량적 분석을 위해서, 융합단백질을 발현하는 세포의 수를 세어보았고, 세포 성장 저해는 제조자가 제공한 프로토콜에 따라 WST-1 solution cell proliferation assay(Roche)를 이용하여 분석하였다. KIF5B-RET로 형질 전환된 NIH3T3 세포들을 대략 1000 내지 5000개를 96-well 플레이트에 시드(seed)하고, 10% (v/v) FBS가 공급된 완전배지(DMEM, Gibco)에서 배양하였다. 24시간이 지난 후, 도 23에서 보듯이 배지를 10% (v/v) FBS와 100 nM 농도의 카보잔티닙(Cabozantinib)이 포함된 완전 성장 배지 100㎕로 교체한 후, 세포들을 72시간 동안 더 배양하였다. 세포 배양 마지막에, 각각의 well에 WST-1 용액을 10 ㎕첨가하고, 1 내지 3시간 더 배양을 실시하였다. 450nm에서의 흡광도를 마이크로플레이트리더(microplate reader)를 이용하여 측정하였다. 성장 저해는 카보잔티닙 (Cabozantinib)을 처리한 세포와 처리하지 않은 세포에서 측정된 흡광률의 평균 ±SD 값을 비교하여 평가하였다. 분석은 3회 실시하였으며, 얻어진 결과들은 도 23에 나타내었다. 도 23에서 보여지듯이, KIF5B-RET 융합단백질은 세포 성장률 증가와 인간 종양 세포 (NSCLC 등) 의 세포생존에 기여하였고, 융합단백질 저해제는 세포생존 감소 및 세포사멸 증가로 이어질 가능성이 있다.
실시예 9: 다른 환자들에서 KIF5B - RET 융합유전자의 검출
다른 원발성 폐선암종에서도 KIF5B-RET 융합유전자가 역시 존재함을 보여주기 위해서, 추가적으로 3중음성(EGFR, KRAS, 및 EML4-ALK에 음성) 원발성 폐선암종의 전사체를 대규모 병렬 서열분석법을 이용하여 분석하였다. 추가된 시료는 LC_S2(폐선암종 3A기 진단을 받은 62세 남자 환자)로 명명하였다. LC_S2시료를 실시예 1에서의 방법으로 준비하였다. KIF5B-RET 융합 전사체들이 LC_S2에서 발견되었다. 표 3에서 보는 바와 같이 LC_S2에 있는 12번째 엑손에서, RET이 AK55에서와 마찬가지로 높게 발현되었다. exon-by-exon RET 발현을 표 3에 나타냈다.
Figure 112014048448131-pct00001
KIF5B은 통상적으로 분화된 조직에서 발현되기 때문에, KIF5B-RET 융합유전자는 이러한 폐암 조직(AK55와 LC_S2)에 존재하는 KIF5B 활성 프로모터에 의하여 발현될 수 있다. 상기 LC_S2에 존재하는 융합 전사체는 cDNA PCR을 이용하여 검증하였다.
AK55와 LC_S2로부터 얻어진 검증 데이터를 도 24에 나타내었다. 도 24는 KIF5B-RET 융합 전사체를 대상으로 한 cDNA PCR 및 AK55의 간전이성 폐암과 추가적으로 3중음성 폐선암종(LC_S2)에서의 겔전기영동의 분석결과를 보여준다. AK55(서열번호 1) 및 LC_S2(서열번호 9)로부터온 cDNA는 융합 전사체의 명백한 증거를 보여준다. AK55의 융합 전사체는 LC_S2(엑손 15)의 엑손과 비교하여 KIF5B(엑손 16)의 엑손을 1개 이상 더 포함하고 있기 때문에, AK55의 PCR 생성물의 길이는 LC_S2의 PCR 생성물의 길이보다 길었다.
또한, KIF5B-RET 융합유전자는 이중음성(병리학 연구에서 EGFR과 EML4-ALK는 음성; KRAS 돌연변이 상태는 알 수 없음) 원발성 폐선암종(LC_S6)(폐선암종 1A기 진단을 받은 58세 남자환자)의 cDNA PCR을 이용하여 더 평가하였다. LC_S2의 시료는 상기 실시예 1에서의 방법으로 준비하였다. LC_S2의 융합 전사체는 cDNA PCR을 사용하여 검증하여, LC_S6는 KIF5B-RET 융합유전자(서열번호 13)를 보여줌을 확인하였다 (도 25). 도 25는 KIF5B-RET 융합 전사체를 목표로 한 cDNA PCR과 이중음성 폐선암종(LC_S6)의 겔전기영동을 이용한 확인 결과를 보여준다. LC_S6 융합 전사체의 명백한 증거를 보여준다. LC_S6에서의 융합 전사체는 AK55와 비교하여 7개 이상의 KIF5B(엑손 17 내지 23) 엑손을 포함하고 있음을 보여준다.
LC_S6의 융합유전자 절단점을 생어 서열분석법을 이용하여 동정하였고, 얻어진 결과는 도 25b에 나타내었다.
도 24, 25a, 및 25b와 관련된 검증들은 PCR 증폭 및 유전체 DNA와 cDNA 생어 서열분석법을 이용하여 수행하였다. PCR은 95℃에서 10분 동안; 95℃에서 30초 동안 30싸이클, 62℃에서 10초 동안, 그리고 72℃에서 10초 동안; 마지막으로, 72℃에서 10분 동안 실시하였다. AK55 유전체의 역위를 위한 PCR과 생어 서열분석법의 프라이머는 5'-CAGAATTTCACAAGGAGGGAAG-3'(KIF5B; 서열번호 18)와 5'-CAGGACCTCTGACTACAGTG GA-3'(RET; 서열번호 19)이었다. 융합 전사체를 위한 프라이머는 5'-GTGAAACGTTGCAAGCAGTTAG-3'(KIF5B; 서열번호 20; AK55 및 LC_S6를 위한)와 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21; 또는 AK55, LC_S2, 및 LC_S6)를 사용하였다. 복제 연구에서 cDNA PCR을 위해, 다른 KIF5B 프라이머(5'-TAAGGAAATGACCAACCACCAG-3'(서열번호 22)가 LC_S2를 위해 사용되었다. 왜냐하면, LC_S2에서의 KIF5B 융합 절단점은 AK55의 절단점과 다르기 때문이다. 모든 생어 서열분석 실험들은 Macrogen Inc.(http://www.macrogen.com)에서 수행되었다.
종합적으로, 복제 연구에서 우리는 2개의 원발성 폐선암종에서의 KIF5BRET 융합유전자(LC_S2 및 LC_S6) 사례를 더 분석하였다. 이러한 결과들은 KIF5B-RET 융합이 드문 것이 아니며, 융합 전사체가 일반적으로 원발성 폐선암종에 존재함을 명백하게 보여준다. 또한, 다른 암조직에서 동일한 비기능적 융합유전자를 찾는 것은 매우 어렵기 때문에, 이러한 결과들은 KIF5B-RET 융합유전자의 발현은 폐암에서 중요한 기능적 영향을 가진다는 간접적인 증거를 제공한다.
흥미롭게도 LC_S2와 LC_S6에서 RET의 엑손 12는 AK55에서와 같이 KIF5B의 엑손 16을 대신하여 엑손 15(LC_S2) 및 엑손 23(LC_S6)과 결합하였다. 도 26은 AK55(서열번호 1), LC_S2(서열번호 9), 및 LC_S6(서열번호 13)의 KIF5B-RET 융합 전사체를 개략적으로 보여준다. 각각의 직사각형은 KIF5B 유전자(파랑) 및 RET 유전자(빨강) 의 엑손을 나타낸다.
상기 결과는 KIF5B에 DNA 이중가닥의 깨짐(break)은 원발성 폐암들 중에서 일치하지 않을 수 있음을 제시한다. 그러나, 그것의 양 시료들(융합유전자 안의 이중나선 도메인의 길이는 LC_S2의 경우 247개의 아미노산이고, LC_S6 520개의 아미노산이었다)에서 이중나선 도메인들은 KIF5B-RET 키메릭 종양 유전자에서 잘 보존되어있기 때문에, 이량화 활성도는 아마도 AK55(310 아미노산)와 비교하여 크게 다른지는 않을 것이다.
폐선암종 시료들(AK55, LC_S2, 및 LC_S6)에서 얻어진 KIF5B-RET 융합유전자와 KIF5B-RET 융합단백질은 표 4에 요약하였다:
KIF5B (NM_004521) RET (NM_020975) 크기
AK55 뉴클레오타이드 1914 nt 1209 nt 3123 nt
아미노산 638 a.a 402 a.a 1040 a.a
엑손 1-16 exon 12-20 exon 25 exon
LC-S2 뉴클레오타이드 1725 nt 1209 nt 2934 nt
아미노산 575 a.a 402 a.a 977 a.a
엑손 1-15 exon 12-20 exon 24 exon
LC-S6 뉴클레오타이드 2544 nt 1209 nt 3753 nt
아미노산 848 a.a 402 a.a 1250 a.a
엑손 1-23 exon 12-20 exon 32 exon
<110> MACROGEN INC. <120> Fusion protein comprising C-terminal domain of RET protein and use thereof as a diagnosing marker <130> DPP20141043KR <150> US61/553,483 <151> 2011-10-31 <150> US13/663,565 <151> 2012-10-30 <160> 22 <170> KopatentIn 1.71 <210> 1 <211> 3123 <212> DNA <213> Artificial Sequence <220> <223> KIF5B-RETa fusion gene wherein the KIF5B domain is derived from NM_020975 <400> 1 atggcggacc tggccgagtg caacatcaaa gtgatgtgtc gcttcagacc tctcaacgag 60 tctgaagtga accgcggcga caagtacatc gccaagtttc agggagaaga cacggtcgtg 120 atcgcgtcca agccttatgc atttgatcgg gtgttccagt caagcacatc tcaagagcaa 180 gtgtataatg actgtgcaaa gaagattgtt aaagatgtac ttgaaggata taatggaaca 240 atatttgcat atggacaaac atcctctggg aagacacaca caatggaggg taaacttcat 300 gatccagaag gcatgggaat tattccaaga atagtgcaag atatttttaa ttatatttac 360 tccatggatg aaaatttgga atttcatatt aaggtttcat attttgaaat atatttggat 420 aagataaggg acctgttaga tgtttcaaag accaaccttt cagttcatga agacaaaaac 480 cgagttccct atgtaaaggg gtgcacagag cgttttgtat gtagtccaga tgaagttatg 540 gataccatag atgaaggaaa atccaacaga catgtagcag ttacaaatat gaatgaacat 600 agctctagga gtcacagtat atttcttatt aatgtcaaac aagagaacac acaaacggaa 660 caaaagctga gtggaaaact ttatctggtt gatttagctg gtagtgaaaa ggttagtaaa 720 actggagctg aaggtgctgt gctggatgaa gctaaaaaca tcaacaagtc actttctgct 780 cttggaaatg ttatttctgc tttggctgag ggtagtacat atgttccata tcgagatagt 840 aaaatgacaa gaatccttca agattcatta ggtggcaact gtagaaccac tattgtaatt 900 tgctgctctc catcatcata caatgagtct gaaacaaaat ctacactctt atttggccaa 960 agggccaaaa caattaagaa cacagtttgt gtcaatgtgg agttaactgc agaacagtgg 1020 aaaaagaagt atgaaaaaga aaaagaaaaa aataagatcc tgcggaacac tattcagtgg 1080 cttgaaaatg agctcaacag atggcgtaat ggggagacgg tgcctattga tgaacagttt 1140 gacaaagaga aagccaactt ggaagctttc acagtggata aagatattac tcttaccaat 1200 gataaaccag caaccgcaat tggagttata ggaaatttta ctgatgctga aagaagaaag 1260 tgtgaagaag aaattgctaa attatacaaa cagcttgatg acaaggatga agaaattaac 1320 cagcaaagtc aactggtaga gaaactgaag acgcaaatgt tggatcagga ggagcttttg 1380 gcatctacca gaagggatca agacaatatg caagctgagc tgaatcgcct tcaagcagaa 1440 aatgatgcct ctaaagaaga agtgaaagaa gttttacagg ccctagaaga acttgctgtc 1500 aattatgatc agaagtctca ggaagttgaa gacaaaacta aggaatatga attgcttagt 1560 gatgaattga atcagaaatc ggcaacttta gcgagtatag atgctgagct tcagaaactt 1620 aaggaaatga ccaaccacca gaaaaaacga gcagctgaga tgatggcatc tttactaaaa 1680 gaccttgcag aaataggaat tgctgtggga aataatgatg taaagcagcc tgagggaact 1740 ggcatgatag atgaagagtt cactgttgca agactctaca ttagcaaaat gaagtcagaa 1800 gtaaaaacca tggtgaaacg ttgcaagcag ttagaaagca cacaaactga gagcaacaaa 1860 aaaatggaag aaaatgaaaa ggagttagca gcatgtcagc ttcgtatctc tcaagaggat 1920 ccaaagtggg aattccctcg gaagaacttg gttcttggaa aaactctagg agaaggcgaa 1980 tttggaaaag tggtcaaggc aacggccttc catctgaaag gcagagcagg gtacaccacg 2040 gtggccgtga agatgctgaa agagaacgcc tccccgagtg agctgcgaga cctgctgtca 2100 gagttcaacg tcctgaagca ggtcaaccac ccacatgtca tcaaattgta tggggcctgc 2160 agccaggatg gcccgctcct cctcatcgtg gagtacgcca aatacggctc cctgcggggc 2220 ttcctccgcg agagccgcaa agtggggcct ggctacctgg gcagtggagg cagccgcaac 2280 tccagctccc tggaccaccc ggatgagcgg gccctcacca tgggcgacct catctcattt 2340 gcctggcaga tctcacaggg gatgcagtat ctggccgaga tgaagctcgt tcatcgggac 2400 ttggcagcca gaaacatcct ggtagctgag gggcggaaga tgaagatttc ggatttcggc 2460 ttgtcccgag atgtttatga agaggattcc tacgtgaaga ggagccaggg tcggattcca 2520 gttaaatgga tggcaattga atcccttttt gatcatatct acaccacgca aagtgatgta 2580 tggtcttttg gtgtcctgct gtgggagatc gtgaccctag ggggaaaccc ctatcctggg 2640 attcctcctg agcggctctt caaccttctg aagaccggcc accggatgga gaggccagac 2700 aactgcagcg aggagatgta ccgcctgatg ctgcaatgct ggaagcagga gccggacaaa 2760 aggccggtgt ttgcggacat cagcaaagac ctggagaaga tgatggttaa gaggagagac 2820 tacttggacc ttgcggcgtc cactccatct gactccctga tttatgacga cggcctctca 2880 gaggaggaga caccgctggt ggactgtaat aatgcccccc tccctcgagc cctcccttcc 2940 acatggattg aaaacaaact ctatggcatg tcagacccga actggcctgg agagagtcct 3000 gtaccactca cgagagctga tggcactaac actgggtttc caagatatcc aaatgatagt 3060 gtatatgcta actggatgct ttcaccctca gcggcaaaat taatggacac gtttgatagt 3120 taa 3123 <210> 2 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Fusion region of KIF5B-RETa fusion gene wherein the KIF5B domain is derived from NM_020975 <400> 2 tgtcagcttc gtatctctca agaggatcca aagtgggaat tc 42 <210> 3 <211> 1040 <212> PRT <213> Artificial Sequence <220> <223> KIF5B-RETa fusion protein wherein the KIF5B domain is derived from NM_020975 <400> 3 Met Ala Asp Leu Ala Glu Cys Asn Ile Lys Val Met Cys Arg Phe Arg 1 5 10 15 Pro Leu Asn Glu Ser Glu Val Asn Arg Gly Asp Lys Tyr Ile Ala Lys 20 25 30 Phe Gln Gly Glu Asp Thr Val Val Ile Ala Ser Lys Pro Tyr Ala Phe 35 40 45 Asp Arg Val Phe Gln Ser Ser Thr Ser Gln Glu Gln Val Tyr Asn Asp 50 55 60 Cys Ala Lys Lys Ile Val Lys Asp Val Leu Glu Gly Tyr Asn Gly Thr 65 70 75 80 Ile Phe Ala Tyr Gly Gln Thr Ser Ser Gly Lys Thr His Thr Met Glu 85 90 95 Gly Lys Leu His Asp Pro Glu Gly Met Gly Ile Ile Pro Arg Ile Val 100 105 110 Gln Asp Ile Phe Asn Tyr Ile Tyr Ser Met Asp Glu Asn Leu Glu Phe 115 120 125 His Ile Lys Val Ser Tyr Phe Glu Ile Tyr Leu Asp Lys Ile Arg Asp 130 135 140 Leu Leu Asp Val Ser Lys Thr Asn Leu Ser Val His Glu Asp Lys Asn 145 150 155 160 Arg Val Pro Tyr Val Lys Gly Cys Thr Glu Arg Phe Val Cys Ser Pro 165 170 175 Asp Glu Val Met Asp Thr Ile Asp Glu Gly Lys Ser Asn Arg His Val 180 185 190 Ala Val Thr Asn Met Asn Glu His Ser Ser Arg Ser His Ser Ile Phe 195 200 205 Leu Ile Asn Val Lys Gln Glu Asn Thr Gln Thr Glu Gln Lys Leu Ser 210 215 220 Gly Lys Leu Tyr Leu Val Asp Leu Ala Gly Ser Glu Lys Val Ser Lys 225 230 235 240 Thr Gly Ala Glu Gly Ala Val Leu Asp Glu Ala Lys Asn Ile Asn Lys 245 250 255 Ser Leu Ser Ala Leu Gly Asn Val Ile Ser Ala Leu Ala Glu Gly Ser 260 265 270 Thr Tyr Val Pro Tyr Arg Asp Ser Lys Met Thr Arg Ile Leu Gln Asp 275 280 285 Ser Leu Gly Gly Asn Cys Arg Thr Thr Ile Val Ile Cys Cys Ser Pro 290 295 300 Ser Ser Tyr Asn Glu Ser Glu Thr Lys Ser Thr Leu Leu Phe Gly Gln 305 310 315 320 Arg Ala Lys Thr Ile Lys Asn Thr Val Cys Val Asn Val Glu Leu Thr 325 330 335 Ala Glu Gln Trp Lys Lys Lys Tyr Glu Lys Glu Lys Glu Lys Asn Lys 340 345 350 Ile Leu Arg Asn Thr Ile Gln Trp Leu Glu Asn Glu Leu Asn Arg Trp 355 360 365 Arg Asn Gly Glu Thr Val Pro Ile Asp Glu Gln Phe Asp Lys Glu Lys 370 375 380 Ala Asn Leu Glu Ala Phe Thr Val Asp Lys Asp Ile Thr Leu Thr Asn 385 390 395 400 Asp Lys Pro Ala Thr Ala Ile Gly Val Ile Gly Asn Phe Thr Asp Ala 405 410 415 Glu Arg Arg Lys Cys Glu Glu Glu Ile Ala Lys Leu Tyr Lys Gln Leu 420 425 430 Asp Asp Lys Asp Glu Glu Ile Asn Gln Gln Ser Gln Leu Val Glu Lys 435 440 445 Leu Lys Thr Gln Met Leu Asp Gln Glu Glu Leu Leu Ala Ser Thr Arg 450 455 460 Arg Asp Gln Asp Asn Met Gln Ala Glu Leu Asn Arg Leu Gln Ala Glu 465 470 475 480 Asn Asp Ala Ser Lys Glu Glu Val Lys Glu Val Leu Gln Ala Leu Glu 485 490 495 Glu Leu Ala Val Asn Tyr Asp Gln Lys Ser Gln Glu Val Glu Asp Lys 500 505 510 Thr Lys Glu Tyr Glu Leu Leu Ser Asp Glu Leu Asn Gln Lys Ser Ala 515 520 525 Thr Leu Ala Ser Ile Asp Ala Glu Leu Gln Lys Leu Lys Glu Met Thr 530 535 540 Asn His Gln Lys Lys Arg Ala Ala Glu Met Met Ala Ser Leu Leu Lys 545 550 555 560 Asp Leu Ala Glu Ile Gly Ile Ala Val Gly Asn Asn Asp Val Lys Gln 565 570 575 Pro Glu Gly Thr Gly Met Ile Asp Glu Glu Phe Thr Val Ala Arg Leu 580 585 590 Tyr Ile Ser Lys Met Lys Ser Glu Val Lys Thr Met Val Lys Arg Cys 595 600 605 Lys Gln Leu Glu Ser Thr Gln Thr Glu Ser Asn Lys Lys Met Glu Glu 610 615 620 Asn Glu Lys Glu Leu Ala Ala Cys Gln Leu Arg Ile Ser Gln Glu Asp 625 630 635 640 Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu 645 650 655 Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu 660 665 670 Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys Glu 675 680 685 Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val 690 695 700 Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys 705 710 715 720 Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly 725 730 735 Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr 740 745 750 Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp 755 760 765 Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile 770 775 780 Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp 785 790 795 800 Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile 805 810 815 Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val 820 825 830 Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu Ser 835 840 845 Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe Gly 850 855 860 Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly 865 870 875 880 Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met 885 890 895 Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln 900 905 910 Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile Ser 915 920 925 Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu 930 935 940 Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser 945 950 955 960 Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg 965 970 975 Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser Asp 980 985 990 Pro Asn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp Gly 995 1000 1005 Thr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala Asn 1010 1015 1020 Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp Ser 1025 1030 1035 1040 <210> 4 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Fusion region of KIF5B-RETa fusion protein wherein the KIF5B domain is derived from NM_020975 <400> 4 Cys Gln Leu Arg Ile Ser Gln Glu Asp Pro Lys Trp Glu Phe 1 5 10 <210> 5 <211> 2997 <212> DNA <213> Artificial Sequence <220> <223> KIF5B-RETc fusion gene wherein the KIF5B domain is derived from NM_020630 <400> 5 atggcggacc tggccgagtg caacatcaaa gtgatgtgtc gcttcagacc tctcaacgag 60 tctgaagtga accgcggcga caagtacatc gccaagtttc agggagaaga cacggtcgtg 120 atcgcgtcca agccttatgc atttgatcgg gtgttccagt caagcacatc tcaagagcaa 180 gtgtataatg actgtgcaaa gaagattgtt aaagatgtac ttgaaggata taatggaaca 240 atatttgcat atggacaaac atcctctggg aagacacaca caatggaggg taaacttcat 300 gatccagaag gcatgggaat tattccaaga atagtgcaag atatttttaa ttatatttac 360 tccatggatg aaaatttgga atttcatatt aaggtttcat attttgaaat atatttggat 420 aagataaggg acctgttaga tgtttcaaag accaaccttt cagttcatga agacaaaaac 480 cgagttccct atgtaaaggg gtgcacagag cgttttgtat gtagtccaga tgaagttatg 540 gataccatag atgaaggaaa atccaacaga catgtagcag ttacaaatat gaatgaacat 600 agctctagga gtcacagtat atttcttatt aatgtcaaac aagagaacac acaaacggaa 660 caaaagctga gtggaaaact ttatctggtt gatttagctg gtagtgaaaa ggttagtaaa 720 actggagctg aaggtgctgt gctggatgaa gctaaaaaca tcaacaagtc actttctgct 780 cttggaaatg ttatttctgc tttggctgag ggtagtacat atgttccata tcgagatagt 840 aaaatgacaa gaatccttca agattcatta ggtggcaact gtagaaccac tattgtaatt 900 tgctgctctc catcatcata caatgagtct gaaacaaaat ctacactctt atttggccaa 960 agggccaaaa caattaagaa cacagtttgt gtcaatgtgg agttaactgc agaacagtgg 1020 aaaaagaagt atgaaaaaga aaaagaaaaa aataagatcc tgcggaacac tattcagtgg 1080 cttgaaaatg agctcaacag atggcgtaat ggggagacgg tgcctattga tgaacagttt 1140 gacaaagaga aagccaactt ggaagctttc acagtggata aagatattac tcttaccaat 1200 gataaaccag caaccgcaat tggagttata ggaaatttta ctgatgctga aagaagaaag 1260 tgtgaagaag aaattgctaa attatacaaa cagcttgatg acaaggatga agaaattaac 1320 cagcaaagtc aactggtaga gaaactgaag acgcaaatgt tggatcagga ggagcttttg 1380 gcatctacca gaagggatca agacaatatg caagctgagc tgaatcgcct tcaagcagaa 1440 aatgatgcct ctaaagaaga agtgaaagaa gttttacagg ccctagaaga acttgctgtc 1500 aattatgatc agaagtctca ggaagttgaa gacaaaacta aggaatatga attgcttagt 1560 gatgaattga atcagaaatc ggcaacttta gcgagtatag atgctgagct tcagaaactt 1620 aaggaaatga ccaaccacca gaaaaaacga gcagctgaga tgatggcatc tttactaaaa 1680 gaccttgcag aaataggaat tgctgtggga aataatgatg taaagcagcc tgagggaact 1740 ggcatgatag atgaagagtt cactgttgca agactctaca ttagcaaaat gaagtcagaa 1800 gtaaaaacca tggtgaaacg ttgcaagcag ttagaaagca cacaaactga gagcaacaaa 1860 aaaatggaag aaaatgaaaa ggagttagca gcatgtcagc ttcgtatctc tcaagaggat 1920 ccaaagtggg aattccctcg gaagaacttg gttcttggaa aaactctagg agaaggcgaa 1980 tttggaaaag tggtcaaggc aacggccttc catctgaaag gcagagcagg gtacaccacg 2040 gtggccgtga agatgctgaa agagaacgcc tccccgagtg agcttcgaga cctgctgtca 2100 gagttcaacg tcctgaagca ggtcaaccac ccacatgtca tcaaattgta tggggcctgc 2160 agccaggatg gcccgctcct cctcatcgtg gagtacgcca aatacggctc cctgcggggc 2220 ttcctccgcg agagccgcaa agtggggcct ggctacctgg gcagtggagg cagccgcaac 2280 tccagctccc tggaccaccc ggatgagcgg gccctcacca tgggcgacct catctcattt 2340 gcctggcaga tctcacaggg gatgcagtat ctggccgaga tgaagctcgt tcatcgggac 2400 ttggcagcca gaaacatcct ggtagctgag gggcggaaga tgaagatttc ggatttcggc 2460 ttgtcccgag atgtttatga agaggattcc tacgtgaaga ggagccaggg tcggattcca 2520 gttaaatgga tggcaattga atcccttttt gatcatatct acaccacgca aagtgatgta 2580 tggtcttttg gtgtcctgct gtgggagatc gtgaccctag ggggaaaccc ctatcctggg 2640 attcctcctg agcggctctt caaccttctg aagaccggcc accggatgga gaggccagac 2700 aactgcagcg aggagatgta ccgcctgatg ctgcaatgct ggaagcagga gccggacaaa 2760 aggccggtgt ttgcggacat cagcaaagac ctggagaaga tgatggttaa gaggagagac 2820 tacttggacc ttgcggcgtc cactccatct gactccctga tttatgacga cggcctctca 2880 gaggaggaga caccgctggt ggactgtaat aatgcccccc tccctcgagc cctcccttcc 2940 acatggattg aaaacaaact ctatggtaga atttcccatg catttactag attctag 2997 <210> 6 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Fusion region of KIF5B-RETc fusion gene wherein the KIF5B domain is derived from NM_020630 <400> 6 tgtcagcttc gtatctctca agaggatcca aagtgggaat tc 42 <210> 7 <211> 998 <212> PRT <213> Artificial Sequence <220> <223> KIF5B-RETc fusion protein wherein the KIF5B domain is derived from NM_020630 <400> 7 Met Ala Asp Leu Ala Glu Cys Asn Ile Lys Val Met Cys Arg Phe Arg 1 5 10 15 Pro Leu Asn Glu Ser Glu Val Asn Arg Gly Asp Lys Tyr Ile Ala Lys 20 25 30 Phe Gln Gly Glu Asp Thr Val Val Ile Ala Ser Lys Pro Tyr Ala Phe 35 40 45 Asp Arg Val Phe Gln Ser Ser Thr Ser Gln Glu Gln Val Tyr Asn Asp 50 55 60 Cys Ala Lys Lys Ile Val Lys Asp Val Leu Glu Gly Tyr Asn Gly Thr 65 70 75 80 Ile Phe Ala Tyr Gly Gln Thr Ser Ser Gly Lys Thr His Thr Met Glu 85 90 95 Gly Lys Leu His Asp Pro Glu Gly Met Gly Ile Ile Pro Arg Ile Val 100 105 110 Gln Asp Ile Phe Asn Tyr Ile Tyr Ser Met Asp Glu Asn Leu Glu Phe 115 120 125 His Ile Lys Val Ser Tyr Phe Glu Ile Tyr Leu Asp Lys Ile Arg Asp 130 135 140 Leu Leu Asp Val Ser Lys Thr Asn Leu Ser Val His Glu Asp Lys Asn 145 150 155 160 Arg Val Pro Tyr Val Lys Gly Cys Thr Glu Arg Phe Val Cys Ser Pro 165 170 175 Asp Glu Val Met Asp Thr Ile Asp Glu Gly Lys Ser Asn Arg His Val 180 185 190 Ala Val Thr Asn Met Asn Glu His Ser Ser Arg Ser His Ser Ile Phe 195 200 205 Leu Ile Asn Val Lys Gln Glu Asn Thr Gln Thr Glu Gln Lys Leu Ser 210 215 220 Gly Lys Leu Tyr Leu Val Asp Leu Ala Gly Ser Glu Lys Val Ser Lys 225 230 235 240 Thr Gly Ala Glu Gly Ala Val Leu Asp Glu Ala Lys Asn Ile Asn Lys 245 250 255 Ser Leu Ser Ala Leu Gly Asn Val Ile Ser Ala Leu Ala Glu Gly Ser 260 265 270 Thr Tyr Val Pro Tyr Arg Asp Ser Lys Met Thr Arg Ile Leu Gln Asp 275 280 285 Ser Leu Gly Gly Asn Cys Arg Thr Thr Ile Val Ile Cys Cys Ser Pro 290 295 300 Ser Ser Tyr Asn Glu Ser Glu Thr Lys Ser Thr Leu Leu Phe Gly Gln 305 310 315 320 Arg Ala Lys Thr Ile Lys Asn Thr Val Cys Val Asn Val Glu Leu Thr 325 330 335 Ala Glu Gln Trp Lys Lys Lys Tyr Glu Lys Glu Lys Glu Lys Asn Lys 340 345 350 Ile Leu Arg Asn Thr Ile Gln Trp Leu Glu Asn Glu Leu Asn Arg Trp 355 360 365 Arg Asn Gly Glu Thr Val Pro Ile Asp Glu Gln Phe Asp Lys Glu Lys 370 375 380 Ala Asn Leu Glu Ala Phe Thr Val Asp Lys Asp Ile Thr Leu Thr Asn 385 390 395 400 Asp Lys Pro Ala Thr Ala Ile Gly Val Ile Gly Asn Phe Thr Asp Ala 405 410 415 Glu Arg Arg Lys Cys Glu Glu Glu Ile Ala Lys Leu Tyr Lys Gln Leu 420 425 430 Asp Asp Lys Asp Glu Glu Ile Asn Gln Gln Ser Gln Leu Val Glu Lys 435 440 445 Leu Lys Thr Gln Met Leu Asp Gln Glu Glu Leu Leu Ala Ser Thr Arg 450 455 460 Arg Asp Gln Asp Asn Met Gln Ala Glu Leu Asn Arg Leu Gln Ala Glu 465 470 475 480 Asn Asp Ala Ser Lys Glu Glu Val Lys Glu Val Leu Gln Ala Leu Glu 485 490 495 Glu Leu Ala Val Asn Tyr Asp Gln Lys Ser Gln Glu Val Glu Asp Lys 500 505 510 Thr Lys Glu Tyr Glu Leu Leu Ser Asp Glu Leu Asn Gln Lys Ser Ala 515 520 525 Thr Leu Ala Ser Ile Asp Ala Glu Leu Gln Lys Leu Lys Glu Met Thr 530 535 540 Asn His Gln Lys Lys Arg Ala Ala Glu Met Met Ala Ser Leu Leu Lys 545 550 555 560 Asp Leu Ala Glu Ile Gly Ile Ala Val Gly Asn Asn Asp Val Lys Gln 565 570 575 Pro Glu Gly Thr Gly Met Ile Asp Glu Glu Phe Thr Val Ala Arg Leu 580 585 590 Tyr Ile Ser Lys Met Lys Ser Glu Val Lys Thr Met Val Lys Arg Cys 595 600 605 Lys Gln Leu Glu Ser Thr Gln Thr Glu Ser Asn Lys Lys Met Glu Glu 610 615 620 Asn Glu Lys Glu Leu Ala Ala Cys Gln Leu Arg Ile Ser Gln Glu Asp 625 630 635 640 Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu 645 650 655 Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu 660 665 670 Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys Glu 675 680 685 Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val 690 695 700 Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys 705 710 715 720 Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly 725 730 735 Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr 740 745 750 Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp 755 760 765 Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile 770 775 780 Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp 785 790 795 800 Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile 805 810 815 Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val 820 825 830 Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu Ser 835 840 845 Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe Gly 850 855 860 Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly 865 870 875 880 Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met 885 890 895 Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln 900 905 910 Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile Ser 915 920 925 Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu 930 935 940 Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser 945 950 955 960 Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg 965 970 975 Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Arg Ile Ser 980 985 990 His Ala Phe Thr Arg Phe 995 <210> 8 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Fusion region of KIF5B-RETc fusion protein wherein the KIF5B domain is derived from NM_020630 <400> 8 Cys Gln Leu Arg Ile Ser Gln Glu Asp Pro Lys Trp Glu Phe 1 5 10 <210> 9 <211> 2934 <212> DNA <213> Artificial Sequence <220> <223> KIF5B-RETa variant (LC-S2) fusion gene <400> 9 atggcggacc tggccgagtg caacatcaaa gtgatgtgtc gcttcagacc tctcaacgag 60 tctgaagtga accgcggcga caagtacatc gccaagtttc agggagaaga cacggtcgtg 120 atcgcgtcca agccttatgc atttgatcgg gtgttccagt caagcacatc tcaagagcaa 180 gtgtataatg actgtgcaaa gaagattgtt aaagatgtac ttgaaggata taatggaaca 240 atatttgcat atggacaaac atcctctggg aagacacaca caatggaggg taaacttcat 300 gatccagaag gcatgggaat tattccaaga atagtgcaag atatttttaa ttatatttac 360 tccatggatg aaaatttgga atttcatatt aaggtttcat attttgaaat atatttggat 420 aagataaggg acctgttaga tgtttcaaag accaaccttt cagttcatga agacaaaaac 480 cgagttccct atgtaaaggg gtgcacagag cgttttgtat gtagtccaga tgaagttatg 540 gataccatag atgaaggaaa atccaacaga catgtagcag ttacaaatat gaatgaacat 600 agctctagga gtcacagtat atttcttatt aatgtcaaac aagagaacac acaaacggaa 660 caaaagctga gtggaaaact ttatctggtt gatttagctg gtagtgaaaa ggttagtaaa 720 actggagctg aaggtgctgt gctggatgaa gctaaaaaca tcaacaagtc actttctgct 780 cttggaaatg ttatttctgc tttggctgag ggtagtacat atgttccata tcgagatagt 840 aaaatgacaa gaatccttca agattcatta ggtggcaact gtagaaccac tattgtaatt 900 tgctgctctc catcatcata caatgagtct gaaacaaaat ctacactctt atttggccaa 960 agggccaaaa caattaagaa cacagtttgt gtcaatgtgg agttaactgc agaacagtgg 1020 aaaaagaagt atgaaaaaga aaaagaaaaa aataagatcc tgcggaacac tattcagtgg 1080 cttgaaaatg agctcaacag atggcgtaat ggggagacgg tgcctattga tgaacagttt 1140 gacaaagaga aagccaactt ggaagctttc acagtggata aagatattac tcttaccaat 1200 gataaaccag caaccgcaat tggagttata ggaaatttta ctgatgctga aagaagaaag 1260 tgtgaagaag aaattgctaa attatacaaa cagcttgatg acaaggatga agaaattaac 1320 cagcaaagtc aactggtaga gaaactgaag acgcaaatgt tggatcagga ggagcttttg 1380 gcatctacca gaagggatca agacaatatg caagctgagc tgaatcgcct tcaagcagaa 1440 aatgatgcct ctaaagaaga agtgaaagaa gttttacagg ccctagaaga acttgctgtc 1500 aattatgatc agaagtctca ggaagttgaa gacaaaacta aggaatatga attgcttagt 1560 gatgaattga atcagaaatc ggcaacttta gcgagtatag atgctgagct tcagaaactt 1620 aaggaaatga ccaaccacca gaaaaaacga gcagctgaga tgatggcatc tttactaaaa 1680 gaccttgcag aaataggaat tgctgtggga aataatgatg taaaggagga tccaaagtgg 1740 gaattccctc ggaagaactt ggttcttgga aaaactctag gagaaggcga atttggaaaa 1800 gtggtcaagg caacggcctt ccatctgaaa ggcagagcag ggtacaccac ggtggccgtg 1860 aagatgctga aagagaacgc ctccccgagt gagctgcgag acctgctgtc agagttcaac 1920 gtcctgaagc aggtcaacca cccacatgtc atcaaattgt atggggcctg cagccaggat 1980 ggcccgctcc tcctcatcgt ggagtacgcc aaatacggct ccctgcgggg cttcctccgc 2040 gagagccgca aagtggggcc tggctacctg ggcagtggag gcagccgcaa ctccagctcc 2100 ctggaccacc cggatgagcg ggccctcacc atgggcgacc tcatctcatt tgcctggcag 2160 atctcacagg ggatgcagta tctggccgag atgaagctcg ttcatcggga cttggcagcc 2220 agaaacatcc tggtagctga ggggcggaag atgaagattt cggatttcgg cttgtcccga 2280 gatgtttatg aagaggattc ctacgtgaag aggagccagg gtcggattcc agttaaatgg 2340 atggcaattg aatccctttt tgatcatatc tacaccacgc aaagtgatgt atggtctttt 2400 ggtgtcctgc tgtgggagat cgtgacccta gggggaaacc cctatcctgg gattcctcct 2460 gagcggctct tcaaccttct gaagaccggc caccggatgg agaggccaga caactgcagc 2520 gaggagatgt accgcctgat gctgcaatgc tggaagcagg agccggacaa aaggccggtg 2580 tttgcggaca tcagcaaaga cctggagaag atgatggtta agaggagaga ctacttggac 2640 cttgcggcgt ccactccatc tgactccctg atttatgacg acggcctctc agaggaggag 2700 acaccgctgg tggactgtaa taatgccccc ctccctcgag ccctcccttc cacatggatt 2760 gaaaacaaac tctatggcat gtcagacccg aactggcctg gagagagtcc tgtaccactc 2820 acgagagctg atggcactaa cactgggttt ccaagatatc caaatgatag tgtatatgct 2880 aactggatgc tttcaccctc agcggcaaaa ttaatggaca cgtttgatag ttaa 2934 <210> 10 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Fusion region of KIF5B-RETa variant (LC-S2) fusion gene <400> 10 gtgggaaata atgatgtaaa ggaggatcca aagtgggaat tc 42 <210> 11 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> KIF5B-RETa variant (LC-S2) fusion protein <400> 11 Met Ala Asp Leu Ala Glu Cys Asn Ile Lys Val Met Cys Arg Phe Arg 1 5 10 15 Pro Leu Asn Glu Ser Glu Val Asn Arg Gly Asp Lys Tyr Ile Ala Lys 20 25 30 Phe Gln Gly Glu Asp Thr Val Val Ile Ala Ser Lys Pro Tyr Ala Phe 35 40 45 Asp Arg Val Phe Gln Ser Ser Thr Ser Gln Glu Gln Val Tyr Asn Asp 50 55 60 Cys Ala Lys Lys Ile Val Lys Asp Val Leu Glu Gly Tyr Asn Gly Thr 65 70 75 80 Ile Phe Ala Tyr Gly Gln Thr Ser Ser Gly Lys Thr His Thr Met Glu 85 90 95 Gly Lys Leu His Asp Pro Glu Gly Met Gly Ile Ile Pro Arg Ile Val 100 105 110 Gln Asp Ile Phe Asn Tyr Ile Tyr Ser Met Asp Glu Asn Leu Glu Phe 115 120 125 His Ile Lys Val Ser Tyr Phe Glu Ile Tyr Leu Asp Lys Ile Arg Asp 130 135 140 Leu Leu Asp Val Ser Lys Thr Asn Leu Ser Val His Glu Asp Lys Asn 145 150 155 160 Arg Val Pro Tyr Val Lys Gly Cys Thr Glu Arg Phe Val Cys Ser Pro 165 170 175 Asp Glu Val Met Asp Thr Ile Asp Glu Gly Lys Ser Asn Arg His Val 180 185 190 Ala Val Thr Asn Met Asn Glu His Ser Ser Arg Ser His Ser Ile Phe 195 200 205 Leu Ile Asn Val Lys Gln Glu Asn Thr Gln Thr Glu Gln Lys Leu Ser 210 215 220 Gly Lys Leu Tyr Leu Val Asp Leu Ala Gly Ser Glu Lys Val Ser Lys 225 230 235 240 Thr Gly Ala Glu Gly Ala Val Leu Asp Glu Ala Lys Asn Ile Asn Lys 245 250 255 Ser Leu Ser Ala Leu Gly Asn Val Ile Ser Ala Leu Ala Glu Gly Ser 260 265 270 Thr Tyr Val Pro Tyr Arg Asp Ser Lys Met Thr Arg Ile Leu Gln Asp 275 280 285 Ser Leu Gly Gly Asn Cys Arg Thr Thr Ile Val Ile Cys Cys Ser Pro 290 295 300 Ser Ser Tyr Asn Glu Ser Glu Thr Lys Ser Thr Leu Leu Phe Gly Gln 305 310 315 320 Arg Ala Lys Thr Ile Lys Asn Thr Val Cys Val Asn Val Glu Leu Thr 325 330 335 Ala Glu Gln Trp Lys Lys Lys Tyr Glu Lys Glu Lys Glu Lys Asn Lys 340 345 350 Ile Leu Arg Asn Thr Ile Gln Trp Leu Glu Asn Glu Leu Asn Arg Trp 355 360 365 Arg Asn Gly Glu Thr Val Pro Ile Asp Glu Gln Phe Asp Lys Glu Lys 370 375 380 Ala Asn Leu Glu Ala Phe Thr Val Asp Lys Asp Ile Thr Leu Thr Asn 385 390 395 400 Asp Lys Pro Ala Thr Ala Ile Gly Val Ile Gly Asn Phe Thr Asp Ala 405 410 415 Glu Arg Arg Lys Cys Glu Glu Glu Ile Ala Lys Leu Tyr Lys Gln Leu 420 425 430 Asp Asp Lys Asp Glu Glu Ile Asn Gln Gln Ser Gln Leu Val Glu Lys 435 440 445 Leu Lys Thr Gln Met Leu Asp Gln Glu Glu Leu Leu Ala Ser Thr Arg 450 455 460 Arg Asp Gln Asp Asn Met Gln Ala Glu Leu Asn Arg Leu Gln Ala Glu 465 470 475 480 Asn Asp Ala Ser Lys Glu Glu Val Lys Glu Val Leu Gln Ala Leu Glu 485 490 495 Glu Leu Ala Val Asn Tyr Asp Gln Lys Ser Gln Glu Val Glu Asp Lys 500 505 510 Thr Lys Glu Tyr Glu Leu Leu Ser Asp Glu Leu Asn Gln Lys Ser Ala 515 520 525 Thr Leu Ala Ser Ile Asp Ala Glu Leu Gln Lys Leu Lys Glu Met Thr 530 535 540 Asn His Gln Lys Lys Arg Ala Ala Glu Met Met Ala Ser Leu Leu Lys 545 550 555 560 Asp Leu Ala Glu Ile Gly Ile Ala Val Gly Asn Asn Asp Val Lys Glu 565 570 575 Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr 580 585 590 Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His 595 600 605 Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys 610 615 620 Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn 625 630 635 640 Val Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala 645 650 655 Cys Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr 660 665 670 Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly 675 680 685 Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro 690 695 700 Asp Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln 705 710 715 720 Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg 725 730 735 Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys 740 745 750 Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr 755 760 765 Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu 770 775 780 Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe 785 790 795 800 Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro 805 810 815 Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg 820 825 830 Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu 835 840 845 Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile 850 855 860 Ser Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp 865 870 875 880 Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu 885 890 895 Ser Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro 900 905 910 Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser 915 920 925 Asp Pro Asn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp 930 935 940 Gly Thr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala 945 950 955 960 Asn Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp 965 970 975 Ser <210> 12 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Fusion region of KIF5B-RETa variant (LC-S2) fusion protein <400> 12 Val Gly Asn Asn Asp Val Lys Glu Asp Pro Lys Trp Glu Phe 1 5 10 <210> 13 <211> 3753 <212> DNA <213> Artificial Sequence <220> <223> KIF5B-RETa variant (LC-S6) fusion gene <400> 13 atggcggacc tggccgagtg caacatcaaa gtgatgtgtc gcttcagacc tctcaacgag 60 tctgaagtga accgcggcga caagtacatc gccaagtttc agggagaaga cacggtcgtg 120 atcgcgtcca agccttatgc atttgatcgg gtgttccagt caagcacatc tcaagagcaa 180 gtgtataatg actgtgcaaa gaagattgtt aaagatgtac ttgaaggata taatggaaca 240 atatttgcat atggacaaac atcctctggg aagacacaca caatggaggg taaacttcat 300 gatccagaag gcatgggaat tattccaaga atagtgcaag atatttttaa ttatatttac 360 tccatggatg aaaatttgga atttcatatt aaggtttcat attttgaaat atatttggat 420 aagataaggg acctgttaga tgtttcaaag accaaccttt cagttcatga agacaaaaac 480 cgagttccct atgtaaaggg gtgcacagag cgttttgtat gtagtccaga tgaagttatg 540 gataccatag atgaaggaaa atccaacaga catgtagcag ttacaaatat gaatgaacat 600 agctctagga gtcacagtat atttcttatt aatgtcaaac aagagaacac acaaacggaa 660 caaaagctga gtggaaaact ttatctggtt gatttagctg gtagtgaaaa ggttagtaaa 720 actggagctg aaggtgctgt gctggatgaa gctaaaaaca tcaacaagtc actttctgct 780 cttggaaatg ttatttctgc tttggctgag ggtagtacat atgttccata tcgagatagt 840 aaaatgacaa gaatccttca agattcatta ggtggcaact gtagaaccac tattgtaatt 900 tgctgctctc catcatcata caatgagtct gaaacaaaat ctacactctt atttggccaa 960 agggccaaaa caattaagaa cacagtttgt gtcaatgtgg agttaactgc agaacagtgg 1020 aaaaagaagt atgaaaaaga aaaagaaaaa aataagatcc tgcggaacac tattcagtgg 1080 cttgaaaatg agctcaacag atggcgtaat ggggagacgg tgcctattga tgaacagttt 1140 gacaaagaga aagccaactt ggaagctttc acagtggata aagatattac tcttaccaat 1200 gataaaccag caaccgcaat tggagttata ggaaatttta ctgatgctga aagaagaaag 1260 tgtgaagaag aaattgctaa attatacaaa cagcttgatg acaaggatga agaaattaac 1320 cagcaaagtc aactggtaga gaaactgaag acgcaaatgt tggatcagga ggagcttttg 1380 gcatctacca gaagggatca agacaatatg caagctgagc tgaatcgcct tcaagcagaa 1440 aatgatgcct ctaaagaaga agtgaaagaa gttttacagg ccctagaaga acttgctgtc 1500 aattatgatc agaagtctca ggaagttgaa gacaaaacta aggaatatga attgcttagt 1560 gatgaattga atcagaaatc ggcaacttta gcgagtatag atgctgagct tcagaaactt 1620 aaggaaatga ccaaccacca gaaaaaacga gcagctgaga tgatggcatc tttactaaaa 1680 gaccttgcag aaataggaat tgctgtggga aataatgatg taaagcagcc tgagggaact 1740 ggcatgatag atgaagagtt cactgttgca agactctaca ttagcaaaat gaagtcagaa 1800 gtaaaaacca tggtgaaacg ttgcaagcag ttagaaagca cacaaactga gagcaacaaa 1860 aaaatggaag aaaatgaaaa ggagttagca gcatgtcagc ttcgtatctc tcaacatgaa 1920 gccaaaatca agtcattgac tgaatacctt caaaatgtgg aacaaaagaa aagacagttg 1980 gaggaatctg tcgatgccct cagtgaagaa ctagtccagc ttcgagcaca agagaaagtc 2040 catgaaatgg aaaaggagca cttaaataag gttcagactg caaatgaagt taagcaagct 2100 gttgaacagc agatccagag ccatagagaa actcatcaaa aacagatcag tagtttgaga 2160 gatgaagtag aagcaaaagc aaaacttatt actgatcttc aagaccaaaa ccagaaaatg 2220 atgttagagc aggaacgtct aagagtagaa catgagaagt tgaaagccac agatcaggaa 2280 aagagcagaa aactacatga acttacggtt atgcaagata gacgagaaca agcaagacaa 2340 gacttgaagg gtttggaaga gacagtggca aaagaacttc agactttaca caacctgcgc 2400 aaactctttg ttcaggacct ggctacaaga gttaaaaaga gtgctgagat tgattctgat 2460 gacaccggag gcagcgctgc tcagaagcaa aaaatctcct ttcttgaaaa taatcttgaa 2520 cagctcacta aagtgcacaa acaggaggat ccaaagtggg aattccctcg gaagaacttg 2580 gttcttggaa aaactctagg agaaggcgaa tttggaaaag tggtcaaggc aacggccttc 2640 catctgaaag gcagagcagg gtacaccacg gtggccgtga agatgctgaa agagaacgcc 2700 tccccgagtg agctgcgaga cctgctgtca gagttcaacg tcctgaagca ggtcaaccac 2760 ccacatgtca tcaaattgta tggggcctgc agccaggatg gcccgctcct cctcatcgtg 2820 gagtacgcca aatacggctc cctgcggggc ttcctccgcg agagccgcaa agtggggcct 2880 ggctacctgg gcagtggagg cagccgcaac tccagctccc tggaccaccc ggatgagcgg 2940 gccctcacca tgggcgacct catctcattt gcctggcaga tctcacaggg gatgcagtat 3000 ctggccgaga tgaagctcgt tcatcgggac ttggcagcca gaaacatcct ggtagctgag 3060 gggcggaaga tgaagatttc ggatttcggc ttgtcccgag atgtttatga agaggattcc 3120 tacgtgaaga ggagccaggg tcggattcca gttaaatgga tggcaattga atcccttttt 3180 gatcatatct acaccacgca aagtgatgta tggtcttttg gtgtcctgct gtgggagatc 3240 gtgaccctag ggggaaaccc ctatcctggg attcctcctg agcggctctt caaccttctg 3300 aagaccggcc accggatgga gaggccagac aactgcagcg aggagatgta ccgcctgatg 3360 ctgcaatgct ggaagcagga gccggacaaa aggccggtgt ttgcggacat cagcaaagac 3420 ctggagaaga tgatggttaa gaggagagac tacttggacc ttgcggcgtc cactccatct 3480 gactccctga tttatgacga cggcctctca gaggaggaga caccgctggt ggactgtaat 3540 aatgcccccc tccctcgagc cctcccttcc acatggattg aaaacaaact ctatggcatg 3600 tcagacccga actggcctgg agagagtcct gtaccactca cgagagctga tggcactaac 3660 actgggtttc caagatatcc aaatgatagt gtatatgcta actggatgct ttcaccctca 3720 gcggcaaaat taatggacac gtttgatagt taa 3753 <210> 14 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Fusion region of KIF5B-RETa variant (LC-S6) fusion gene <400> 14 ctcactaaag tgcacaaaca ggaggatcca aagtgggaat tc 42 <210> 15 <211> 1250 <212> PRT <213> Artificial Sequence <220> <223> KIF5B-RETa variant (LC-S6) fusion protein <400> 15 Met Ala Asp Leu Ala Glu Cys Asn Ile Lys Val Met Cys Arg Phe Arg 1 5 10 15 Pro Leu Asn Glu Ser Glu Val Asn Arg Gly Asp Lys Tyr Ile Ala Lys 20 25 30 Phe Gln Gly Glu Asp Thr Val Val Ile Ala Ser Lys Pro Tyr Ala Phe 35 40 45 Asp Arg Val Phe Gln Ser Ser Thr Ser Gln Glu Gln Val Tyr Asn Asp 50 55 60 Cys Ala Lys Lys Ile Val Lys Asp Val Leu Glu Gly Tyr Asn Gly Thr 65 70 75 80 Ile Phe Ala Tyr Gly Gln Thr Ser Ser Gly Lys Thr His Thr Met Glu 85 90 95 Gly Lys Leu His Asp Pro Glu Gly Met Gly Ile Ile Pro Arg Ile Val 100 105 110 Gln Asp Ile Phe Asn Tyr Ile Tyr Ser Met Asp Glu Asn Leu Glu Phe 115 120 125 His Ile Lys Val Ser Tyr Phe Glu Ile Tyr Leu Asp Lys Ile Arg Asp 130 135 140 Leu Leu Asp Val Ser Lys Thr Asn Leu Ser Val His Glu Asp Lys Asn 145 150 155 160 Arg Val Pro Tyr Val Lys Gly Cys Thr Glu Arg Phe Val Cys Ser Pro 165 170 175 Asp Glu Val Met Asp Thr Ile Asp Glu Gly Lys Ser Asn Arg His Val 180 185 190 Ala Val Thr Asn Met Asn Glu His Ser Ser Arg Ser His Ser Ile Phe 195 200 205 Leu Ile Asn Val Lys Gln Glu Asn Thr Gln Thr Glu Gln Lys Leu Ser 210 215 220 Gly Lys Leu Tyr Leu Val Asp Leu Ala Gly Ser Glu Lys Val Ser Lys 225 230 235 240 Thr Gly Ala Glu Gly Ala Val Leu Asp Glu Ala Lys Asn Ile Asn Lys 245 250 255 Ser Leu Ser Ala Leu Gly Asn Val Ile Ser Ala Leu Ala Glu Gly Ser 260 265 270 Thr Tyr Val Pro Tyr Arg Asp Ser Lys Met Thr Arg Ile Leu Gln Asp 275 280 285 Ser Leu Gly Gly Asn Cys Arg Thr Thr Ile Val Ile Cys Cys Ser Pro 290 295 300 Ser Ser Tyr Asn Glu Ser Glu Thr Lys Ser Thr Leu Leu Phe Gly Gln 305 310 315 320 Arg Ala Lys Thr Ile Lys Asn Thr Val Cys Val Asn Val Glu Leu Thr 325 330 335 Ala Glu Gln Trp Lys Lys Lys Tyr Glu Lys Glu Lys Glu Lys Asn Lys 340 345 350 Ile Leu Arg Asn Thr Ile Gln Trp Leu Glu Asn Glu Leu Asn Arg Trp 355 360 365 Arg Asn Gly Glu Thr Val Pro Ile Asp Glu Gln Phe Asp Lys Glu Lys 370 375 380 Ala Asn Leu Glu Ala Phe Thr Val Asp Lys Asp Ile Thr Leu Thr Asn 385 390 395 400 Asp Lys Pro Ala Thr Ala Ile Gly Val Ile Gly Asn Phe Thr Asp Ala 405 410 415 Glu Arg Arg Lys Cys Glu Glu Glu Ile Ala Lys Leu Tyr Lys Gln Leu 420 425 430 Asp Asp Lys Asp Glu Glu Ile Asn Gln Gln Ser Gln Leu Val Glu Lys 435 440 445 Leu Lys Thr Gln Met Leu Asp Gln Glu Glu Leu Leu Ala Ser Thr Arg 450 455 460 Arg Asp Gln Asp Asn Met Gln Ala Glu Leu Asn Arg Leu Gln Ala Glu 465 470 475 480 Asn Asp Ala Ser Lys Glu Glu Val Lys Glu Val Leu Gln Ala Leu Glu 485 490 495 Glu Leu Ala Val Asn Tyr Asp Gln Lys Ser Gln Glu Val Glu Asp Lys 500 505 510 Thr Lys Glu Tyr Glu Leu Leu Ser Asp Glu Leu Asn Gln Lys Ser Ala 515 520 525 Thr Leu Ala Ser Ile Asp Ala Glu Leu Gln Lys Leu Lys Glu Met Thr 530 535 540 Asn His Gln Lys Lys Arg Ala Ala Glu Met Met Ala Ser Leu Leu Lys 545 550 555 560 Asp Leu Ala Glu Ile Gly Ile Ala Val Gly Asn Asn Asp Val Lys Gln 565 570 575 Pro Glu Gly Thr Gly Met Ile Asp Glu Glu Phe Thr Val Ala Arg Leu 580 585 590 Tyr Ile Ser Lys Met Lys Ser Glu Val Lys Thr Met Val Lys Arg Cys 595 600 605 Lys Gln Leu Glu Ser Thr Gln Thr Glu Ser Asn Lys Lys Met Glu Glu 610 615 620 Asn Glu Lys Glu Leu Ala Ala Cys Gln Leu Arg Ile Ser Gln His Glu 625 630 635 640 Ala Lys Ile Lys Ser Leu Thr Glu Tyr Leu Gln Asn Val Glu Gln Lys 645 650 655 Lys Arg Gln Leu Glu Glu Ser Val Asp Ala Leu Ser Glu Glu Leu Val 660 665 670 Gln Leu Arg Ala Gln Glu Lys Val His Glu Met Glu Lys Glu His Leu 675 680 685 Asn Lys Val Gln Thr Ala Asn Glu Val Lys Gln Ala Val Glu Gln Gln 690 695 700 Ile Gln Ser His Arg Glu Thr His Gln Lys Gln Ile Ser Ser Leu Arg 705 710 715 720 Asp Glu Val Glu Ala Lys Ala Lys Leu Ile Thr Asp Leu Gln Asp Gln 725 730 735 Asn Gln Lys Met Met Leu Glu Gln Glu Arg Leu Arg Val Glu His Glu 740 745 750 Lys Leu Lys Ala Thr Asp Gln Glu Lys Ser Arg Lys Leu His Glu Leu 755 760 765 Thr Val Met Gln Asp Arg Arg Glu Gln Ala Arg Gln Asp Leu Lys Gly 770 775 780 Leu Glu Glu Thr Val Ala Lys Glu Leu Gln Thr Leu His Asn Leu Arg 785 790 795 800 Lys Leu Phe Val Gln Asp Leu Ala Thr Arg Val Lys Lys Ser Ala Glu 805 810 815 Ile Asp Ser Asp Asp Thr Gly Gly Ser Ala Ala Gln Lys Gln Lys Ile 820 825 830 Ser Phe Leu Glu Asn Asn Leu Glu Gln Leu Thr Lys Val His Lys Gln 835 840 845 Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys 850 855 860 Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe 865 870 875 880 His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu 885 890 895 Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe 900 905 910 Asn Val Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly 915 920 925 Ala Cys Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys 930 935 940 Tyr Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro 945 950 955 960 Gly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His 965 970 975 Pro Asp Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp 980 985 990 Gln Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His 995 1000 1005 Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met 1010 1015 1020 Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser 1025 1030 1035 1040 Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile 1045 1050 1055 Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser 1060 1065 1070 Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr 1075 1080 1085 Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His 1090 1095 1100 Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met 1105 1110 1115 1120 Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp 1125 1130 1135 Ile Ser Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu 1140 1145 1150 Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly 1155 1160 1165 Leu Ser Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu 1170 1175 1180 Pro Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met 1185 1190 1195 1200 Ser Asp Pro Asn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala 1205 1210 1215 Asp Gly Thr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr 1220 1225 1230 Ala Asn Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe 1235 1240 1245 Asp Ser 1250 <210> 16 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Fusion region of KIF5B-RETa variant (LC-S6) fusion protein <400> 16 Leu Thr Lys Val His Lys Gln Glu Asp Pro Lys Trp Glu Phe 1 5 10 <210> 17 <211> 310 <212> PRT <213> Artificial Sequence <220> <223> coiled coil domain of KIF5B protein encoded by NM_004521 <400> 17 Val Cys Val Asn Val Glu Leu Thr Ala Glu Gln Trp Lys Lys Lys Tyr 1 5 10 15 Glu Lys Glu Lys Glu Lys Asn Lys Ile Leu Arg Asn Thr Ile Gln Trp 20 25 30 Leu Glu Asn Glu Leu Asn Arg Trp Arg Asn Gly Glu Thr Val Pro Ile 35 40 45 Asp Glu Gln Phe Asp Lys Glu Lys Ala Asn Leu Glu Ala Phe Thr Val 50 55 60 Asp Lys Asp Ile Thr Leu Thr Asn Asp Lys Pro Ala Thr Ala Ile Gly 65 70 75 80 Val Ile Gly Asn Phe Thr Asp Ala Glu Arg Arg Lys Cys Glu Glu Glu 85 90 95 Ile Ala Lys Leu Tyr Lys Gln Leu Asp Asp Lys Asp Glu Glu Ile Asn 100 105 110 Gln Gln Ser Gln Leu Val Glu Lys Leu Lys Thr Gln Met Leu Asp Gln 115 120 125 Glu Glu Leu Leu Ala Ser Thr Arg Arg Asp Gln Asp Asn Met Gln Ala 130 135 140 Glu Leu Asn Arg Leu Gln Ala Glu Asn Asp Ala Ser Lys Glu Glu Val 145 150 155 160 Lys Glu Val Leu Gln Ala Leu Glu Glu Leu Ala Val Asn Tyr Asp Gln 165 170 175 Lys Ser Gln Glu Val Glu Asp Lys Thr Lys Glu Tyr Glu Leu Leu Ser 180 185 190 Asp Glu Leu Asn Gln Lys Ser Ala Thr Leu Ala Ser Ile Asp Ala Glu 195 200 205 Leu Gln Lys Leu Lys Glu Met Thr Asn His Gln Lys Lys Arg Ala Ala 210 215 220 Glu Met Met Ala Ser Leu Leu Lys Asp Leu Ala Glu Ile Gly Ile Ala 225 230 235 240 Val Gly Asn Asn Asp Val Lys Gln Pro Glu Gly Thr Gly Met Ile Asp 245 250 255 Glu Glu Phe Thr Val Ala Arg Leu Tyr Ile Ser Lys Met Lys Ser Glu 260 265 270 Val Lys Thr Met Val Lys Arg Cys Lys Gln Leu Glu Ser Thr Gln Thr 275 280 285 Glu Ser Asn Lys Lys Met Glu Glu Asn Glu Lys Glu Leu Ala Ala Cys 290 295 300 Gln Leu Arg Ile Ser Gln 305 310 <210> 18 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer for detecting the inversion of Chromosome 10 <400> 18 cagaatttca caaggaggga ag 22 <210> 19 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer for detecting the inversion of Chromosome 10 <400> 19 caggacctct gactacagtg ga 22 <210> 20 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> KIF5B primer for detecting the fusion gene KIF5B-RET derived from AK55 and LC_S6 <400> 20 gtgaaacgtt gcaagcagtt ag 22 <210> 21 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> RET primer for detecting the fusion gene KIF5B-RET <400> 21 ccttgaccac ttttccaaat tc 22 <210> 22 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> KIF5B primer for detecting the fusion protein KIF5B-RET derived from LC_S2 <400> 22 taaggaaatg accaaccacc ag 22

Claims (22)

  1. N-말단 위치에 N-말단 도메인으로서 KIF5B 단백질 및 C-말단 위치에 C-말단 도메인으로서 RET 단백질(re-arranged during transfection proteain)을 필수적으로 포함하는, KIF5B-RET 융합단백질.
  2. 삭제
  3. 제1항에 있어서, 상기 N-말단 도메인으로서 KIF5B 단백질은, NM_004521의 폴리뉴클레오타이드에 의해 암호화되는 KIF5B 단백질의 1번째 아미노산부터 329번째 아미노산의 연속적인 적어도 329개 아미노산을 필수적으로 포함하는 것인, KIF5B-RET 융합단백질.
  4. 제1항에 있어서, 상기 N-말단 도메인으로서 KIF5B 단백질은, KIF5B 단백질의 329번째 아미노산부터 시작되는 2개 이상의 KIF5B 코일 도메인을 추가로 포함하는 것인, KIF5B-RET 융합단백질.
  5. 제1항에 있어서, 상기 N-말단 도메인으로서 KIF5B 단백질은, NM_004521의 폴리뉴클레오타이드의 1번째 엑손부터 16번째 엑손의 폴리뉴클레오타이드, 1번째 엑손부터 15번째 엑손의 폴리뉴클레오타이드, 또는 1번째 엑손부터 23번째 엑손의 폴리뉴클레오타이드에 의해 암호화되는 아미노산 서열을 필수적으로 포함하는 것인, KIF5B-RET 융합단백질.
  6. 제1항에 있어서, 상기 C-말단 도메인의로서 RET 단백질은, NM_020630 또는 NM_020975의 폴리뉴클레오타이드의 12번째 엑손의 1번째 아미노산부터 시작되어, NM_020630 또는 NM_020975의 폴리뉴클레오타이드에 의해 암호화되는 RET 단백질의 C-말단을 향하여, 연속적인 300개 이상의 아미노산을 필수적으로 포함하는 것인, KIF5B-RET 융합단백질.
  7. 제1항에 있어서, 상기 C-말단 도메인으로서 RET 단백질은, NM_020630 또는 NM_020975의 12번째 엑손의 시작점에 해당하는 아미노산부터 시작되어, NM_020630 또는 NM_020975의 폴리뉴클레오타이드에 의해 암호화되는 RET 단백질의 C-말단을 향하여, 연속적인 300 내지 450개의 아미노산을 필수적으로 포함하는 것인, KIF5B-RET 융합단백질.
  8. 제1항에 있어서, 상기 융합단백질은 서열번호 3, 7, 11 또는 15의 아미노산 서열로 이루어진 것인, KIF5B-RET 융합단백질.
  9. 제1항 및 제3항 내지 제8항 중 어느 한 항에 따른 KIF5B-RET 융합단백질을 암호화하는 융합유전자.
  10. 제9항에 있어서, 상기 융합유전자는 서열번호 1, 5, 9 또는 13의 뉴클레오타이드 서열로 이루어진 것인, 융합유전자.
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 제1항 및 제3항 내지 제8항 중 어느 한 항에 따른 KIF5B-RET 융합단백질을 발현하는 세포에 시료 화합물을 접촉시키는 단계; 및
    세포 내 KIF5B-RET 융합단백질의 발현 수준을 측정하는 단계를 포함하며,
    상기 시료 화합물을 처리한 세포 내 KIF5B-RET 융합단백질의 발현 수준이, 시료 화합물을 처리하기 전의 세포 또는 시료 화합물을 처리하지 않은 세포의 KIF5B-RET 융합단백질 발현 수준에 비해 감소한 경우, 상기 시료 화합물을 항암제 후보물질로 결정하는 것인,
    항암제의 스크리닝 방법.
KR1020147013826A 2011-10-31 2012-10-31 Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 KR101625139B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161553483P 2011-10-31 2011-10-31
US61/553,483 2011-10-31
US13/663,565 2012-10-30
US13/663,565 US10023855B2 (en) 2011-10-31 2012-10-30 Fusion protein comprising C-terminal domain of RET protein and use thereof as a diagnosing marker
PCT/KR2012/009056 WO2013066047A1 (en) 2011-10-31 2012-10-31 Fusion protein comprising c-terminal domain of ret protein and use thereof as a diagnosing marker

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020167010433A Division KR101660235B1 (ko) 2011-10-31 2012-10-31 Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도

Publications (2)

Publication Number Publication Date
KR20140092846A KR20140092846A (ko) 2014-07-24
KR101625139B1 true KR101625139B1 (ko) 2016-05-31

Family

ID=48192340

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020167010433A KR101660235B1 (ko) 2011-10-31 2012-10-31 Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도
KR1020147013826A KR101625139B1 (ko) 2011-10-31 2012-10-31 Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020167010433A KR101660235B1 (ko) 2011-10-31 2012-10-31 Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도

Country Status (5)

Country Link
US (1) US10023855B2 (ko)
EP (1) EP2773673B1 (ko)
JP (1) JP6389124B2 (ko)
KR (2) KR101660235B1 (ko)
WO (1) WO2013066047A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG2014012728A (en) 2011-08-23 2014-06-27 Foundation Medicine Inc Novel kif5b-ret fusion molecules and uses thereof
CN114129566A (zh) * 2012-09-07 2022-03-04 埃克塞里艾克西斯公司 用于治疗肺腺癌的met、vegfr和ret的抑制剂
MY170904A (en) 2012-09-25 2019-09-13 Chugai Pharmaceutical Co Ltd Ret inhibitor
US10202365B2 (en) 2015-02-06 2019-02-12 Blueprint Medicines Corporation 2-(pyridin-3-yl)-pyrimidine derivatives as RET inhibitors
NZ742351A (en) 2015-11-02 2023-03-31 Blueprint Medicines Corp Inhibitors of ret
WO2017161269A1 (en) 2016-03-17 2017-09-21 Blueprint Medicines Corporation Inhibitors of ret receptor tyrosine kinases
US10227329B2 (en) 2016-07-22 2019-03-12 Blueprint Medicines Corporation Compounds useful for treating disorders related to RET
SG11202001212SA (en) * 2017-08-21 2020-03-30 Taiho Pharmaceutical Co Ltd Fusion protein of dctn1 protein with ret protein
CA3096043A1 (en) 2018-04-03 2019-10-10 Blueprint Medicines Corporation Ret inhibitor for use in treating cancer having a ret alteration

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130137111A1 (en) * 2010-07-26 2013-05-30 Astellas Pharma Inc. Detection method of novel ret fusion

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997044356A2 (en) 1996-05-08 1997-11-27 Biogen, Inc. RET LIGAND (RetL) FOR STIMULATING NEURAL AND RENAL GROWTH
AU2001281136A1 (en) 2000-08-04 2002-02-18 Board Of Regents, The University Of Texas System Detection and diagnosis of smoking related cancers
US20070212689A1 (en) 2003-10-30 2007-09-13 Bianchi Diana W Prenatal Diagnosis Using Cell-Free Fetal DNA in Amniotic Fluid
CA2624221A1 (en) 2005-10-24 2007-05-03 Takeda Pharmaceutical Company Limited Preventives/remedies for cancer
EP2067039A2 (en) 2006-09-12 2009-06-10 Novartis Forschungsstiftung, Zweigniederlassung Friedrich Miescher Institute for Biomedical Research Non-neuroendocrine cancer therapy
JP6032616B2 (ja) 2011-08-04 2016-11-30 国立研究開発法人国立がん研究センター Kif5b遺伝子とret遺伝子との融合遺伝子、並びに該融合遺伝子を標的としたがん治療の有効性を判定する方法
SG2014012728A (en) * 2011-08-23 2014-06-27 Foundation Medicine Inc Novel kif5b-ret fusion molecules and uses thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130137111A1 (en) * 2010-07-26 2013-05-30 Astellas Pharma Inc. Detection method of novel ret fusion

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Chmielecki J., et al., 38(20):pp.6985-6996 (2010. 6.29.)*
Takeuchi K., et al., KIF5B-ALK, Clin Cancer Res 15(9):pp. 3143-3149 (2009. 5. 1.)*
Tanizaki J., et al., British Journal of Cancer 105:pp.807-813 (2011. 8.16.)*

Also Published As

Publication number Publication date
WO2013066047A1 (en) 2013-05-10
EP2773673A1 (en) 2014-09-10
EP2773673B1 (en) 2019-12-04
JP6389124B2 (ja) 2018-09-12
KR20160052751A (ko) 2016-05-12
US10023855B2 (en) 2018-07-17
US20130116280A1 (en) 2013-05-09
KR20140092846A (ko) 2014-07-24
EP2773673A4 (en) 2015-03-18
KR101660235B1 (ko) 2016-09-27
JP2015504299A (ja) 2015-02-12

Similar Documents

Publication Publication Date Title
KR101625139B1 (ko) Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도
US11920138B2 (en) Fusion proteins and methods thereof
JP6871869B2 (ja) 新規融合体及びその検出法
JP7037836B2 (ja) タンパク質キナーゼ阻害剤に対する感受性予測用バイオマーカー及びその用途
AU2013337277B2 (en) Novel NTRK1 fusion molecules and uses thereof
KR20150038267A (ko) 융합 단백질 및 그의 방법
WO2015064621A1 (ja) 新規融合体及びその検出法
JPWO2012014795A1 (ja) 新規ret融合体の検出法
US8962808B2 (en) EGFR-related polypeptides and methods of use
ES2684548T3 (es) Proteína de fusión que comprende AXL y composición para tratar el cáncer que comprende la misma
JP6858563B2 (ja) Braf変異検出によるegfr阻害剤の効果予測
CN110191897A (zh) 用于预防暴露于诱导p38活化的癌症治疗的受试者的转移的治疗
EP3778644A2 (en) Fgfr-tacc fusion proteins and methods thereof
WO2013113942A2 (en) Novel fusion genes in lung cancer
WO2017122816A1 (ja) 新規融合体及びその検出法
JP6806440B2 (ja) 新規融合体及びその検出法
Golenar Oncogenic Activity of Met Receptor Tyrosine Kinase Exon 14 Deletion Variant
US20190062846A1 (en) Compositions and methods for screening pediatric gliomas and methods of treatment thereof

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
A107 Divisional application of patent
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190515

Year of fee payment: 4