KR101625139B1 - Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 - Google Patents
Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 Download PDFInfo
- Publication number
- KR101625139B1 KR101625139B1 KR1020147013826A KR20147013826A KR101625139B1 KR 101625139 B1 KR101625139 B1 KR 101625139B1 KR 1020147013826 A KR1020147013826 A KR 1020147013826A KR 20147013826 A KR20147013826 A KR 20147013826A KR 101625139 B1 KR101625139 B1 KR 101625139B1
- Authority
- KR
- South Korea
- Prior art keywords
- glu
- leu
- lys
- kif5b
- ret
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/96—Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57407—Specifically defined cancers
- G01N33/57423—Specifically defined cancers of lung
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/03—Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/205—Aptamer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Biophysics (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- General Physics & Mathematics (AREA)
- Food Science & Technology (AREA)
- Cell Biology (AREA)
- Veterinary Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
본 발명을 N-말단 위치에 N-말단 도메인으로서 융합파트너과 C-말단 위치에 C-말단 도메인으로서 RET 단백질을 포함하는 융합단백질, 상기 융합단백질을 암호화하는 융합유전자, 및 상기 융합단백질 또는 융합유전자의 암 진단 마커로의 용도를 제공한다.
Description
본 발명은 N-말단 위치에 N-말단 도메인으로서 융합파트너(fusion partner)와 C-말단 위치에 C-말단 도메인으로서 RET 단백질(re-arranged during transfection proteain)을 포함하는 융합단백질, 상기 융합단백질을 암호화하는 융합유전자, 및 상기 융합단백질 또는 융합유전자의 암 진단 마커로서의 용도를 제공한다.
폐암은 암으로 인한 사망에 있어서 가장 많은 사망자를 발생시키고 있다. 세계적으로 매년 1.38만명의 사망자를 발생시키고 있다. 종례의 화학치료요법을 사용하더라도, 진행기의 폐암환자의 중간생존기간은 진단 당시로부터 1년이 채 되지 않는다. 흡연은 서방국가에서 폐암의 주요한 위험 요소로 잘 알려져 있으며, 모든 폐암의 85% 내지 90%는 흡연으로 인하여 발생한다. 그러나, 세계 폐암환자의 약 25%는 비흡연자이다. 특히, 아시아 국가의 데이터를 살펴보면, 전체 폐암의 70~80%는 비소세포암(Non-Small Cell Lung Cancer, NSCLC)이 차지하고 있으며, 이러한 비소세포암의 30~40%는 비흡연자가 차지하고 있다. 이러한 비소세포암에서 가장 많이 발견되는 조직학적 형태는 선암종(adenocarcinoma)이다 (~70%).
비흡연자의 폐암 발병은 유전적 및 후생적 변화에 기인하기보다는, 하나의 체세포 돌연변이 (somatic mutation) 가 일어남에 따라 발생하게 되는 경우가 많다. 지난 몇 년 동안 비소세포암에서 EGFR, KRAS, 및 ALK 유전자(일반적으로 '삼중표지자 (the triple-markers)'로 불림)의 체세포 돌연변이들이 보고되었다. 우선적으로 비흡연자 및 아시아인의 비소세포암과 연관이 있는 EGFR의 타이로신 키나아제(tyrosine kinase) 도메인의 돌연변이는 재피티닙(Gefitinib)과 같은 EGFR 표적치료에 민감하다. KRAS에 존재하는 미스센스 돌연변이(missense mutation)는 폐선암종(lung adenocarcinoma)에 걸린 흡연자에게서 흔하게 발견되며, EGFR 억제제에 대한 저항성을 가진다.
비록 몇몇의 유전자 돌연변이가 보고되고 있지만, 대부분의 폐암환자의 암 유전체(genome)에서는 아무것도 발견되지 않았다. 비소세포암의 40%이상은 알려지지 않은 유전적 사건에 의해서 발병하는바, 폐암을 진단하는 더욱 효과적인 유전자 마커의 발견이 필요하다.
본 발명은 융합파트너의 N-말단 도메인 및 RET 단백질의 C-말단 도메인을 필수적으로 포함하는 융합단백질을 제공한다. 또한, KIF5B단백질의 N-말단 도메인과 RET 단백질 C-말단 도메인을 필수적으로 포함하는 KIF5B-RET 융합단백질을 제공한다.
본 발명의 다른 일구현예는, 상기 융합단백질을 암호화하는 융합유전자를 제공한다.
본 발명의 다른 일구현예는, 상기 융합유전자를 포함하는 재조합 백터를 제공한다.
본 발명의 다른 일구현예는, 하기와 같은 방법의 폐암 진단방법을 제공한다:
10번 염색체상 역위 또는 전좌를 포함하는 RET-관련 재배열, 다른 단백질과 융합된 RET 단백질이 포함된 융합단백질, 융합단백질을 암호화하는 융합유전자, 및 암에 걸리지 않은 개별 대상으로부터 얻어진 표준 시료에 비하여 RET 과발현으로 이루어진 군에서 선택된 1종 이상의 것을 대상으로부터 얻어진 시험 시료에서 탐지하는 방법, 또는 상기 군으로부터 선택된 1종 이상이 시료에서 탐지될 때 상기 대상을 폐암 환자로 결정하는 방법.
다른 일구현예는, KIF5B-RET 융합단백질을 폐암 진단마커로 이용하는 용도를 제공한다.
다른 일구현예는, 융합단백질 또는 융합유전자를 검출하는 화합물을 포함하는, 폐암 진단용 조성물을 제공한다.
다른 일구현예는, 1종 이상의 융합단백질의 억제제, 1종 이상의 융합단백질을 암호화하는 융합유전자의 억제제, 1종 이상의 RET 암호화 유전자의 억제제, 또는 그들의 결합을 치료적으로 효과적인 양만큼 환자에게 투여하는 단계를 포함하는, 폐암을 예방 또는 치료하는 방법을 제공한다.
다른 일구현예는, 1종 이상의 융합단백질의 억제제, 1종 이상의 융합단백질을 암호화하는 융합유전자의 억제제, 1종 이상의 RET 단백질을 암호화하는 유전자의 억제제, 또는 이들의 조합을 포함하는, 폐암 예방 또는 치료용 조성물을 활성성분으로서 제공한다.
다른 일구현예는, 1종 이상의 융합단백질의 억제제, 1종 이상의 융합단백질을 암호화하는 융합유전자의 억제제, 1종 이상의 RET 단백질을 암호화하는 유전자의 억제제, 또는 이들의 조합을 포함하는 조성물의, 폐암 예방 또는 치료 용도를 제공한다.
또 다른 일구현예는, 하기의 폐암에 대한 항암제를 스크리닝하는 방법을 제공한다: 융합단백질을 발현하는 세포에 시료 화합물을 처리하고; 융합단백질의 세포 내 발현 수준을 측정하여, 시료 화합물을 처리한 세포에서 융합단백질 발현 수준이, 시료 화합물을 처리하기 전의 세포, 또는 처리하지 않은 세포들에 비하여 낮아진 경우, 당해 시료 화합물을 폐암에 대한 항암제 후보물질로 결정한다.
본 발명자들은 폐선암종 환자의 염색체 역위에 의해 발생한 융합유전자를 동정하여, 본 발명을 완성하였다. 융합유전자는 어린이와 비흡연자 폐선암종 환자에게서도 발견되었으며, 이들의 암은 종례 알려진 삼중 표지자(EGFR, KRAS, 및 ALK 유전자)에 대해서는 음성반응을 보인다. 따라서, 본 발명의 융합유전자는 폐암의 효과적인 마커로 기대되며, 상기 융합유전자는 종례에 알려진 삼중 표지자가 기능을 하지 못하는 경우에도 마커의 기능을 수행할 수 있다.
일 실시예는 암세포에서 특징적으로 발견되는 융합유전자 및 상기 융합유전자에 의해 암호화되는 융합단백질을 제공한다.
특히, 융합파트너의 N-말단 도메인 및 RET 단백질의 C-말단 도메인을 포함하는 융합단백질을 제공한다. 융합파트너의 N-말단 도메인은 융합단백질의 N-말단에 위치 할 수 있으며, RET 단백질의 C-말단 도메인은 융합단백질의 C-말단에 위치할 수 있다. 본 발명은 RET 단백질을 포함하는 융합단백질의 존재는 폐암을 포함하는 암의 진행과 관계 있음을 발견하였다.
융합파트너는 융합단백질의 N-말단에 위치하고 있는 KIF5B 단백질의 N-말단 도메인일 수 있으며, 이러한 경우, 융합단백질은 N-말단 위치에 N-말단 도메인으로서 KIF5B 단백질과, C-말단 위치에 C-말단 도메인으로서 RET 단백질을 포함하는, KIF5B-RET 단백질을 대표할 수 있다.
다른 일구현예는 융합단백질을 암호화하는 융합유전자를 제공하며, 상기 융합유전자는 5'말단에 위치한 융합파트너의 N-말단 도메인을 암호화하는 유전자, 및 3'말단에 위치한 RET 단백질의 C-말단 도메인을 암호화하는 유전자를 포함할 수 있다. 구체적인 실시예에서, 융합단백질이 KIF5B-RET 단백질인 경우, 융합유전자는 아마도 KIF5B-RET 유전자로 대표되며. 상기 KIF5B-RET 유전자는 5'말단에 위치한 KIF5B의 N-말단 도메인을 암호화하는 유전자 및 3'말단에 위치한 RET 단백질의 C-말단 도메인을 암호화하는 유전자를 포함 할 수 있다.
다른 일구현예는 융합유전자 및 선택적으로 융합유전자에 작동 가능하게 연결된 전사요소(예: 프로모터와 같은)를 포함하는 발현 벡터를 제공한다. 또 다른 실험예는 발현 벡터에 의해 형질 전환된 세포를 제공한다.
RET 단백질은 막관통 수용체 타이로신 키나아제(transmembrane receptor tyrosine kinase)이다. RET은, 세포 외 영역(Cadherin 유사 도메인을 포함), 막관통 도메인, 및 타이로신 키나아제 도메인을 포함하는 세포 내 영역으로 구성되어 있다. RET 단백질이 글리아세포 유래 신경영양인자(glial derived neurotrophic factor, GDNF)같은 공동수용체와 리간드에 결합함으로써 이량화(dimerization) 될 때, 상기 RET 단백질은 자기인산화(auto-phosphorylation)에 의해 활성화되고, 하위 신호(downstream signaling) 전달을 자극한다. RET의 하위 신호 전달계(downstream signaling cascade)는 세포의 생존(survival)/세포사멸(apoptosis), 증식(proliferation), 분화(differentiation), 및 전이(migration)를 조절하는 MAPK(mitogen-activated protein kinase)경로이다. RET의 정상 발현은 신경발달에 중요하지만, 조직들의 분화에서는 활성화되지 않음이 알려져 있다.
RET 단백질은 인간을 포함하는 포유류로부터 유래할 수 있다. 인간 RET 단백질을 암호화하는 인간 RET 유전자는 10번 염색체상에 위치해있으며(10q11.2), 종류에 따라 19 내지 21개의 엑손을 포함하고 있다. 인간 RET 단백질은 NCBI(기탁번호 NM_020630 또는 NM_020975)로 대표되는 인간 RET 유전자로부터 암호화될 수 있다.
RET 단백질의 C-말단 도메인은 RET 유전자의, 예를 들어 NM_020630 또는 NM_020975의, 12번째 엑손부터 마지막 엑손의, 예를 들어 20번째 엑손, 폴리뉴클레오타이드로부터 암호화되는 아미노산 서열을 포함할 수 있다. RET 단백질의 C-말단 도메인은, 12번째 엑손의 시작위치부터(예를 들어, NM_020975에 의해 암호화되는 RET 단백질의 713번째 자리), NM_020630 또는 NM_020975에 의해 암호화되는 RET 단백질의 C-말단을 향하여, 적어도 약 300개의 연속적인 아미노산을 포함할 수 있다. 예를 들어, RET 단백질의 C-말단 도메인은, 12번째 엑손의 시작위치부터(예를 들어, 713번째 자리), NM_020630(19개의 엑손) 또는 NM_020975(20개의 엑손)에 의해 암호화되는 RET 단백질의 C-말단을 향하여, 연속적인 약 300 내지 450개의 아미노산, 연속적인 약 300 내지 420개의 아미노산, 또는 연속적인 약 300 내지 402개의 아미노산을 포함할 수 있다.
Kinesin-1 중쇄라고도 불리는 KIF5B 단백질은 KIF5B 유전자에 의해서 암호화 된다. KIF5B 단백질은 인간을 포함하는 포유류로부터 유래될 수 있다. 인간 KIF5B 단백질을 암호화하는 인간의 KIF5B 유전자는 10번 염색체(10q11.22) 상에 위치해 있으며, 26개의 엑손을 포함하고 있다. 인간 KIF5B 단백질은 인간 NCBI, 기탁번호 NM_004521로 대표되는 KIF5B 유전자에 의해 암호화된다.
KIF5B 단백질의 N-말단 도메인은 KIF5B 유전자(예를 들어, NM_004521) 의 폴리뉴클레오타이드의 1번째 엑손부터 16번째 엑손, 1번째 엑손부터 15번째 엑손, 또는 1번째 엑손부터 23번째 엑손으로부터 암호화된 아미노산 서열을 포함하고 있다. KIF5B 단백질의 N-말단 도메인은 NM_004521에 의해 암호화되는 KIF5B 단백질의 1번째 위치부터 적어도 약 329개의 연속적인 아미노산을 포함하고 있다. KIF5B 단백질의 N-말단 도메인은 NM_004521에 의해 암호화되는 KIF5B 단백질의 329번째 위치의 아미노산부터 시작되는 2 이상의 이중나선 도메인을 더 포함할 수 있다. 예를 들어, 2개의 이중나선 도메인은 NM_004521(서열번호 21)에 의해 암호화되는 KIF5B 단백질의 329번째 내지 638번째 위치의 아미노산 서열을 더 가질 수 있다. KIF5B 단백질의 N-말단 도메인은 NM_004521에 의해 암호화되는 KIF5B 단백질의 1번째 위치부터, 연속적인 약 329 내지 900개의 아미노산, 연속적인 약 329 내지 700개의 아미노산, 연속적인 약 329 내지 650개의 아미노산, 또는 연속적인 약 329 내지 638개의 아미노산을 포함할 수 있다.
융합단백질에서, 융합은 융합점(fusion point) 또는 절단점(breakpoint)으로 불리우는, KIF5B 유전자의 16번째 엑손과 RET 유전자의 12번째 엑손 사이에서 일어난다. "융합영역(fusion region)"이라는 용어는 융합점 주변의 폴리뉴클레오타이드 단편(약 ~30개의 뉴클레오타이드로 이루어짐) 또는 폴리펩티드 단편(약 ~30개의 아미노산으로 이루어짐)을 의미한다.
본 발명에서 사용되는 엑손의 번호는, NCBI에 위치한 엑손의 번호에 따라 번호를 붙였다.
일 예에서, 융합단백질 KIF5B-RET은 서열번호 3, 7, 11 또는 15의 아미노산 서열을 가질 수 있으며, 서열번호 3의 629번째부터 648번째까지의 위치, 서열번호 7의 629번째부터 648번째까지의 위치, 서열번호 11의 566번째부터 585번째까지의 위치, 및 서열번호 15의 839번째부터 858번째까지의 위치의 폴리펩티드 단편은 융합단백질 KIF5B-RET의 융합영역일 수 있다. 상기 융합단백질 KIF5B-RET의 융합영역은 서열번호 4, 8, 12 또는 16의 아미노산 서열을 가질 수 있다. 상기 KIF5B-RET 융합단백질을 암호화하는 KIF5B-RET 융합유전자는 서열번호 1, 5, 9 또는 13의 뉴클레오타이드 서열을 가질 수 있으며, 서열번호 1의 1885번째부터 1944번째까지의 위치, 서열번호 5의 1885번째부터 1944번째까지의 위치, 서열번호 9의 1696번째부터 1755번째까지의 위치, 및 서열번호 13의 2515번째부터 2574번째까지의 위치의 폴리뉴클레오타이드는, 융합유전자 KIF5B-RET의 융합영역 일 수 있다. 융합유전자 KIF5B-RET의 융합영역은 서열번호 2, 6, 10 또는 14의 뉴클레오타이드 서열을 가질 수 있다. 상기 융합유전자, 융합단백질, 및 융합영역들은 도 27 내지 34에 나타내었다.
DNA 분자들의 뉴클레오타이드 서열, 및 DNA 분자들에 의해 암호화되는 아미노산 서열은, 자동화 DNA 서열분석기 또는 자동화 펩티드 서열분석기에 의해 결정될 수 있다. 자동 서열분석 방법에 의해 결정된 뉴클레오타이드 서열 또는 아미노산 서열은, 실제서열과 비교하였을 때 부분적인 오류를 가지고 있을 수 있다. 일반적으로, 자동 서열분석에 의해 결정된 서열은 실제서열과 비교하여, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 또는 적어도 약 99.9%의 동일성(sequence identity)을 가지고 있다. 따라서, 융합단백질, 융합유전자, 또는 융합영역은 서열번호 1 내지 17의 서열과 비교하여 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 또는 적어도 약 99.9%의 동일성을 가지는 아미노산 서열 또는 뉴클레오타이드 서열을 가지고 있을 수 있다.
융합단백질과 융합유전자는 암 영역에서 특이적으로 존재하고, 암 영역 주변의 다른 영역에서는 존재하지 않음이 확인되었는바, 이는 융합단백질 및/또는 융합유전자는 고형암, 특히 폐암과 같은 암의 바이오마커로서 용도로 사용될 수 있음을 시사한다. 더욱이, 10번 염색체상에서 역위나 전좌를 포함하는 RET-관련 염색체의 재배열 또는 RET의 과발현은 암세포, 특히 폐암세포에서도 발견된다.
또한, 또 다른 실험예는 대상으로부터 얻어진 시험 시료에서, 하기의 군으로부터 적어도 1종이상을 탐지하는 것을 포함한, 암을 진단하는 방법 또는 암 진단용 정보를 제공하는 방법을 제공한다:
역위 또는 전좌를 포함하는, 10번 염색체에서 RET-관련 염색체의 재배열;
융합파트너의 N-말단 도메인 및 RET 단백질 C-말단 도메인을 포함하는 융합단백질;
융합단백질을 암호화하는 융합유전자; 및
폐암이 걸리지 않은 개인으로부터 얻어진 표준시료와 비교하여 RET의 과발현,
상기 군으로부터 적어도 1종 이상이 시험 시료에서 탐지된 때, 대상을 암환자로 결정한다.
RET-관련 염색체의 재배열은 융합단백질 또는 융합유전자의 형성에 의한 결과일수 있다. 예를 들어, RET-관련 염색체의 재배열은, 10번 염색체상의 역위일 수 있다. 상기 10번 염색체상의 역위는, 10번 염색체상의 역위영역과 혼성화(상보적 결합) 가능한 폴리뉴클레오타이드(프로브) 및/또는 10번 염색체상의 역위를 탐지 가능한 프라이머쌍, 예를 들어, 10번 염색체상의 역위영역을 포함한 연속적인 100 내지 200개의 뉴클레오타이드를 가지고 있는 폴리뉴클레오타이드 단편 생성이 가능한 폴리뉴클레오타이드 단편을 이용하여 탐지할 수 있다. 예를 들어, 10번 염색체상의 역위는 5'-CAGAATTTCACAAGGAGGGAAG-3'(서열번호 18) 및 5'-CAGGACCTCTGACTACAGTGGA-3'(서열번호 19)로 구성된 프라이머쌍을 이용하여 탐지할 수 있다.
융합단백질 및 융합유전자는 전술한 바와 같다.
구체적인 실시예에서, 융합단백질은, 융합단백질, 융합유전자, 또는 융합유전자에 해당하는 mRNA의 존재의 검출로부터 탐지될 수 있다.
융합단백질의 존재는, 융합단백질과 융합단백질에 특이적으로 결합하는 물질(예를 들어, 항체 또는 앱타머) 사이의 상호작용을 측정하는 일반적 분석방법에 의해 탐지될 수 있다. 이러한 일반적 분석방법으로는 면역크로마토그래피(immunochromatography), 면역조직화학적 염색법(immunohistochemical staining), 효소면역항체법(Enzyme liked immunosorbent assay, ELISA), 방사면역측정법(radioimmunoassay, RIA), 효소면역분석법(enzyme immunoassay, EIA), 형광면역측정법(florescence immunoassay, FIA), 섬광면역측정법(luminescence immunoassay, LIA), 웨스턴 블로팅(western blotting), 및 형광 활성화 세포선택장치(fluorescence activated cell sorter, FACS) 등과 같은 방법이 있다.
또한, 융합유전자 또는 mRNA의 존재는, 융합유전자 또는 mRNA와 혼성화(상보적 결합) 가능한 폴리뉴클레오타이드를 이용한, PCR, FISH(fluorescent in situ hybridization) 등과 같은 일반적인 분석 방법에 의해 검출될 수 있다. 융합유전자는 대규모 병렬 서열분석법(massive parallel sequencing) 기술을 통한, 전장-전사체(RNA) 및/또는 전장-유전체(DNA) 서열분석 병합 기술을 이용하여 탐지 및/또는 검증될 수 있다. 융합유전자 또는 mRNA와 혼성화 가능한 폴리뉴클레오타이드는 siRNA, 올리고뉴클레오타이드, DNA 프로브, 또는 DNA 프라이머일 수 있으며, 상기 siRNA, 올리고뉴클레오타이드, DNA 프로브, 또는 DNA 프라이머는 시험 시료에서, 융합된 또는 절단된, 유전자 또는 전사체와의 혼성화를 통해서 융합유전자 또는 mRNA를 검출할 수 있다.
융합유전자가, KIF5B-RET 융합단백질을 암호화하는 융합유전자 KIF5B-RET일때, 융합유전자 KIF5B-RET는, 서열번호 2, 6, 10 또는 14의 융합영역과 혼성화(상보적 결합) 가능한 폴리뉴클레오타이드(프로브) 및/또는, 서열번호 1, 5, 9 또는 13에서 각각 서열번호 2, 6, 10 또는 14의 융합영역을 포함하는, 연속적인 100 내지 200개의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드 단편을 생성할 수 있는 프라이머쌍을 이용하여 탐지할 수 있다. 예를 들어, 융합유전자 KIF5B-RET은 5'-GTGAAACGTTGCAAGCAGTTAG-3'(KIF5B; 서열번호 20)과 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21)로 이루어진 프라이머쌍, 또는 5'-TAAGGAAATGACCAACCACCAG-3'(KIF5B; 서열번호 22)과 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21)로 이루어진 프라이머쌍을 이용하여 탐지될 수 있다. 또한, 융합단백질 KIF5B-RET은 융합단백질의 KIF5B-RET의 융합영역에 특이적으로 결합하는 항체 또는 앱타머를 이용하여 탐지할 수 있다. 예를 들어, 융합단백질의 융합영역은 서열번호 4, 8, 12 또는 16의 아미노산 서열을 가질 수 있다.
상기 "융합영역(또는 역위영역)과 혼성화 가능한"이란 용어는, 상보적 서열 또는 상보적 서열의 융합영역(또는 역위영역)과 90% 이상의 동일성을 가지는 서열을 의미할 수 있다.
또 다른 실험예는, 서열번호 2, 6, 10 또는 14의 융합영역과 혼성화 가능한 폴리뉴클레오타이드, 서열번호 1, 5, 9 또는 13의 서열에 각각 서열번호 2, 6, 10 또는 14의 융합영역을 포함하는 연속적인 100 내지 200개의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드 단편을 생성할 수 있는 프라이머쌍, 10번 염색체상의 역위영역과 혼성화 가능한 폴리뉴클레오타이드, 10번 염색체상의 역위영역을 포함하는 100 내지 200개의 연속적인 뉴클레오타이드를 포함한 폴리뉴클레오디트 단편을 만들 수 있는 프라이머쌍, 및 서열번호 4, 8, 12 또는 16의 융합영역에 결합하는 항체 또는 앱타머로 이루어진 군에서 선택된 1 이상을 포함하는 암 진단용 조성물을 제공한다.
예를 들어, 프라이머쌍은 융합단백질을 암호화하는 KIF5B-RET 융합유전자를 탐지하기 위한 5'-GTGAAACGTTGCAAGCAGTTAG-3'(KIF5B; 서열번호 20)과 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21)로 이루어진 프라이머쌍, 또는 10번 염색체상의 역위를 탐지하기 위한 5'-TAAGGAAATGACCAACCACCAG-3'(KIF5B; 서열번호 22)과 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21)로 이루어진 프라이머쌍, 또는 5'-CAGAATTTCACAAGGAGGGAAG-3'(서열번호 18)와 5'-CAGGACCTCTGACTACAGTGGA-3'(서열번호 19)로 이루어진 프라미어쌍으로 이루어진 군에서 선택된 적어도 1종 이상의 프라미어쌍이다.
또 다른 실험예는 융합단백질 및/또는 융합유전자의 암 진단 용도를 제공한다.
환자는 임의의 포유류, 예를 들어, 인간 또는 원숭이와 같은 영장류, 마우스(mouse) 또는 랫(rat)과 같은 설치류 일 수 있으며, 특히 인간일 수 있다.
시험 시료는 환자(예를 들어 인간)로부터 분리된 세포(예를 들어 폐세포), 조직(예를 들어 폐조직), 또는 체액(예를 들어 혈액)일 수 있다. 환자는 키나아제 억제제를 처방받았거나, 처방받을 예정이다. 시험 시료는 인간의 암세포, 또는 인간의 암세포 추출물로부터 유래된 세포를 포함할 수 있다.
융합단백질 및/또는 융합유전자는 암치료를 위한 표적으로 작용할 수 있다.
따라서, 또 다른 실험예는, 적어도 1종 이상의 융합단백질의 억제제, 적어도 1종 이상의 융합단백질을 암호화하는 융합유전자의 억제제, 적어도 1종 이상의 RET 암호화 유전자의 억제제, 또는 그들의 결합을 환자에게 약학적으로(치료적으로) 효과적인 양의 투여 단계를 포함하는, 암 예방 및/또는 치료를 위한 방법을 제공한다. 상기 방법은 투여 단계 이전에 예방 및/또는 치료가 필요한 환자를 동정하는 단계를 더욱 포함할 수 있다.
또 다른 실험예는 암의 예방 및/또는 치료를 위해, 적어도 1종 이상의 융합단백질의 억제제, 적어도 1종 이상의 융합단백질을 암호화하는 융합유전자의 저해체, 적어도 1종 이상의 RET 암호화 유전자의 억제제, 또는 그들의 결합을 포함한 조성물을 제공한다.
또 다른 실험예는 융합단백질의 억제제, 융합단백질을 암호화하는 융합유전자의 저해체, RET 암호화 유전자의 억제제, 또는 그들의 결합을 암 예방 및/또는 치료를 위한 용도를 제공한다.
KIF5B-RET 융합단백질 억제제는 융합단백질에 특이적으로 결합하는 앱타머; 융합단백질에 특이적으로 결합하는 항체; 및 키나아제 억제제(예를 들어, 소라페닙 (sorafenib)(4-[4-[[4-chloro-3-(trifluoromethyl)phenyl]carbamoylamino]phenoxy]-N-methyl-pyridine-2-carboxamide), 카보잔티닙(Cabozantinib)(N-(4-((6,7-Dimethoxyquinolin-4-yl)oxy)phenyl)-N-(4-fluorophenyl)cyclopropane-1,1-dicarboxamide) 등)로 이루어진 군에서 선택된 1종 이상 일 수 있다. 융합유전자 또는 RET 암호화 유전자 억제제는, 융합유전자 또는 RET 암호화 유전자에 특이적으로 결합 가능한 siRNA, shRNA, miRNA, 및 앱타머로 이루어진 군에서 선택된 1종 이상 일 수 있다.
본 발명에서, 암은 어떠한 고형암, 예를 들어, 폐암, 간암, 대장암, 췌장암, 위암, 유방암, 난소암, 신장암, 갑상선암, 식도암, 전립선암, 또는 뇌종양일 수 있다. 구체적인 실시예에서 암은 폐암, 특히 소세포폐암(small cell lung carcinoma) 또는 폐선암종, 편평상피폐암(squamous cell lung carcinoma), 또는 대세포폐암(large cell lung carcinoma)와 같은 비소세포폐암일 수 있다.
더욱이, 또 다른 실험예는 다음을 포함하는 항암제 스크리닝 방법을 제공한다:
융합단백질을 발현하는 세포에 시료화합물을 접촉시키고; 및 세포 내 융합단백질의 발현 수준을 측정하는 단계를 포함하며,
상기 시료 화합물을 처리한 세포 내 융합단백질의 발현 수준이, 시료 화합물을 처리하기 전의 세포 또는 시료 화합물을 처리하지 않은 세포의 융합단백질 발현 수준에 비해 감소한 경우, 상기 시료 화합물을 항암제 후보물질로 결정한다.
상기 항암제 스크리닝 방법은, 시료화합물을 접촉시키는 단계 이전에, 세포내 융합단백질의 발현 수준 측정 단계를 더욱 포함할 수 있다. 이 경우, 시료 화합물을 처리한 후 융합단백질 발현 수준이, 시료 화합물을 처리하기 전의 세포에 융합단백질 발현 수준에 비해 감소한 경우, 시료 화합물을 항암제 후보물질로 결정할 수 있다. 또 다른 항암제 스크리닝 방법은, 융합단백질을 발현하는 세포를 제공하는 단계, 및 시료화합물을 제공된 세포의 일부에 접촉시키는 단계를 포함할 수 있다. 시료 화합물을 처리한 세포의 융합단백질 발현 수준이, 시료 화합물을 처리하지 않은 세포에 비해 감소한 경우, 시료 화합물을 항암제의 후보물질로 결정할 수 있다.
상기 스크리닝 방법에서 사용되는 세포는, 융합유전자 또는 융합단백질이 발현 및/또는 활성화된, 암세포, 세포 추출물, 또는 세포 배양으로부터 유래된 것 일수 있다. 상기 기술한 바와 같이, 상기 암세포는 고형암세포, 특히 폐암, 예를 들어 폐선암종과 같은 비소세포폐암세포 일 수 있다.
융합단백질 발현 수준은 면역크로마토그래피(immunochromatography), 면역조직화학적 염색법(immunohistochemical staining), 효소면역항체법(enzyme liked immunosorbent assay, ELISA), 방사면역측정법(radioimmunoassay, RIA), 효소면역분석법(enzyme immunoassay, EIA), 형광면역측정법(florescence immunoassay, FIA), 섬광면역측정법(luminescence immunoassay, LIA), 웨스턴 블로팅(western blotting), 및 형광 활성화 세포선택장치(fluorescence activated cell sorter, FACS) 와 같은 일반적인 분석방법을 통하여 탐지될 수 있다.
시료 화합물은 어떠한 천연화합물 또는 합성화합물일 수 있다. 예를 들면, 일반적인 화합물, DNA, RNA, 단백질, 및 이와 같은 화합물로 이루어진 군에서 1종 이상 선택된 것 일수 있다.
본 발명은 폐선암종 환자의 염색체 역위에 의해 발생한 융합유전자를 동정하였으며, 융합유전자는 어린이와 비흡연자 폐선암종 환자에게서도 발견되었으며, 이들의 암은 종례 알려진 삼중 표지자(EGFR, KRAS, 및 ALK 유전자)에 대해서는 음성반응을 보인다. 따라서, 본 발명의 융합유전자는 폐암의 효과적인 마커로 기대되며, 상기 융합유전자는 종례에 알려진 삼중 표지자가 기능을 하지 못하는 경우에도 마커의 기능을 수행할 수 있다.
도 1은 환자(AK55)의 CT-유도 생체검사(CT-guided biopsy)를 통해 얻어진 원발성 폐암조직의 파라핀 절편의 100배율 현미경 사진이다.
도 2는 환자(AK55)의 CT-유도 생체검사(CT-guided biopsy)를 통해 얻어진 원발성 폐암조직의 파라핀 절편의 400배율 현미경 사진이다.
도 3은 원발성 폐암 조직의 CK7에 대한 면역조직화학적 분석결과를 보여주는 현미경 사진이다.
도 4는 원발성 폐암 조직의 TTF1에 대한 면역조직화학적 분석결과를 보여주는 현미경 사진이다.
도 5는 원발성 폐암 조직의 CK20에 대한 면역조직화학적 분석결과를 보여주는 현미경 사진이다.
도 6은 폐암 전사체 서열분석을 통해 동정된 융합유전자의 그래픽 표현을 보여준다.
도 7은 KIF5B-RET 융합유전자를 개략적으로 보여준다.
도 8은 각 RET 엑손의, RNA 발현 수준을 보여주는 그래프이다.
도 9는 암 유전체의 대규모 병렬 서열분석법(massive parallel sequencing)을 통한 10번 염색체상에서 10.6Mb 길이의 역위를 개략적으로 보여준다.
도 10은 KIF5B-RET 융합유전자 확인을 위한 AK55의 RNA PCR 증폭 결과를 보여준다.
도 11은 KIF5B-RET 융합유전자 확인을 위한 AK55의 DNA PCR 증폭 결과를 보여준다.
도 12 RNA 확인을 위한 생어 서열분석법(Sanger sequencing)을 통한 역위 절단점 탐지 결과를 보여준다.
도 13 DNA 확인을 위한 생어 서열분석법(Sanger sequencing)을 통한 역위 절단점 탐지 결과를 보여준다.
도 14는 KIF5B-RET 융합단백질의 기능적 도메인을 개략적으로 보여준다.
도 15는 PHYRE2 알고리즘을 통해 예측한 KIF5B-RET 융합단백질의 삼차원구조를 보여준다.
도 16은 환자(AK55)로부터 얻은 폐암(골전이)에서 KIF5B-RET 발현의 면역조직화학적 분석결과의 현미경 사진을 보여준다 (x400).
도 17은 다른 폐선암종(lung adenocarcinoma)에서의 RET 발현 분석결과를 보여주는 그래프이다.
도 18은 간 전이에서의 유전자 발현 네트워크 분석결과를 보여준다.
도 19은 정상세포 (A)와 폐암세포 (B)의 FISH 분석결과를 보여준다.
도 20은 NIH3T3 세포주에서 KIF5B-RET 융합단백질 발현을 보여주는 웨스턴 블로팅 결과이다.
도 21은 KIF5B-RET 융합유전자로 형질 전환된 NIH3T3 세포주의 콜로니 형성 능력을 보여준다.
도 22은 키나아제 억제제, 카보잔티닙(Cabozantinib)을 처리한 상태에서의 KIF5B-RET 융합유전자로 형질 전환된 NIH3T3 세포주에서의 단백질 발현 수준을 보여준다.
도 23은 키나아제 억제제, 카보잔티닙(Cabozantinib)을 처리한 상태에서의 KIF5B-RET 융합단백질 발현 세포의 세포성장률을 보여주는 그래프이다.
도 24는 간전이성 폐암(AK55) 및 삼중표지자 음성인 폐선암종(LC_S2)의 겔 전기영동 이미지이다.
도 25는 이중음성 폐선암종(LC_S6)의 겔 전기영동 이미지이다.
도 25B는 LC_S6의 생어 서열분석법을 이용한 KIF5B-RET 융합유전자의 절단점 동정 결과이다.
도 26은 AK55, LC_S2 및 LC_S6의 KIF5B-RET 융합 전사체를 개략적으로 보여준다.
도 27은 KIF5B-RET 융합유전자 및 NM_020975으로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 뉴클레오타이드 서열을 보여준다.
도 28은 KIF5B-RET 융합단백질 및 NM_020975로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 아미노산 서열을 보여준다.
도 29은 KIF5B-RET 융합유전자 및 NM_020630로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 뉴클레오타이드 서열을 보여준다.
도 30은 KIF5B-RET 융합단백질 및 NM_020630로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 아미노산 서열을 보여준다.
도 31은 LC_S2로부터 얻은 KIF5B-RET변종 융합유전자의, 뉴클레오타이드 서열 및 융합영역을 보여준다.
도 32는 LC_S2로부터 얻은 KIF5B-RET변종 융합단백질의, 아미노산 서열 및 융합영역을 보여준다.
도 33은 LC_S6로부터 얻은 KIF5B-RET변종 융합유전자의, 뉴클레오타이드 서열 및 융합영역을 보여준다.
도 34는 LC_S6로부터 얻은 KIF5B-RET변종 융합단백질의, 아미노산 서열 및 융합영역을 보여준다.
도 2는 환자(AK55)의 CT-유도 생체검사(CT-guided biopsy)를 통해 얻어진 원발성 폐암조직의 파라핀 절편의 400배율 현미경 사진이다.
도 3은 원발성 폐암 조직의 CK7에 대한 면역조직화학적 분석결과를 보여주는 현미경 사진이다.
도 4는 원발성 폐암 조직의 TTF1에 대한 면역조직화학적 분석결과를 보여주는 현미경 사진이다.
도 5는 원발성 폐암 조직의 CK20에 대한 면역조직화학적 분석결과를 보여주는 현미경 사진이다.
도 6은 폐암 전사체 서열분석을 통해 동정된 융합유전자의 그래픽 표현을 보여준다.
도 7은 KIF5B-RET 융합유전자를 개략적으로 보여준다.
도 8은 각 RET 엑손의, RNA 발현 수준을 보여주는 그래프이다.
도 9는 암 유전체의 대규모 병렬 서열분석법(massive parallel sequencing)을 통한 10번 염색체상에서 10.6Mb 길이의 역위를 개략적으로 보여준다.
도 10은 KIF5B-RET 융합유전자 확인을 위한 AK55의 RNA PCR 증폭 결과를 보여준다.
도 11은 KIF5B-RET 융합유전자 확인을 위한 AK55의 DNA PCR 증폭 결과를 보여준다.
도 12 RNA 확인을 위한 생어 서열분석법(Sanger sequencing)을 통한 역위 절단점 탐지 결과를 보여준다.
도 13 DNA 확인을 위한 생어 서열분석법(Sanger sequencing)을 통한 역위 절단점 탐지 결과를 보여준다.
도 14는 KIF5B-RET 융합단백질의 기능적 도메인을 개략적으로 보여준다.
도 15는 PHYRE2 알고리즘을 통해 예측한 KIF5B-RET 융합단백질의 삼차원구조를 보여준다.
도 16은 환자(AK55)로부터 얻은 폐암(골전이)에서 KIF5B-RET 발현의 면역조직화학적 분석결과의 현미경 사진을 보여준다 (x400).
도 17은 다른 폐선암종(lung adenocarcinoma)에서의 RET 발현 분석결과를 보여주는 그래프이다.
도 18은 간 전이에서의 유전자 발현 네트워크 분석결과를 보여준다.
도 19은 정상세포 (A)와 폐암세포 (B)의 FISH 분석결과를 보여준다.
도 20은 NIH3T3 세포주에서 KIF5B-RET 융합단백질 발현을 보여주는 웨스턴 블로팅 결과이다.
도 21은 KIF5B-RET 융합유전자로 형질 전환된 NIH3T3 세포주의 콜로니 형성 능력을 보여준다.
도 22은 키나아제 억제제, 카보잔티닙(Cabozantinib)을 처리한 상태에서의 KIF5B-RET 융합유전자로 형질 전환된 NIH3T3 세포주에서의 단백질 발현 수준을 보여준다.
도 23은 키나아제 억제제, 카보잔티닙(Cabozantinib)을 처리한 상태에서의 KIF5B-RET 융합단백질 발현 세포의 세포성장률을 보여주는 그래프이다.
도 24는 간전이성 폐암(AK55) 및 삼중표지자 음성인 폐선암종(LC_S2)의 겔 전기영동 이미지이다.
도 25는 이중음성 폐선암종(LC_S6)의 겔 전기영동 이미지이다.
도 25B는 LC_S6의 생어 서열분석법을 이용한 KIF5B-RET 융합유전자의 절단점 동정 결과이다.
도 26은 AK55, LC_S2 및 LC_S6의 KIF5B-RET 융합 전사체를 개략적으로 보여준다.
도 27은 KIF5B-RET 융합유전자 및 NM_020975으로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 뉴클레오타이드 서열을 보여준다.
도 28은 KIF5B-RET 융합단백질 및 NM_020975로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 아미노산 서열을 보여준다.
도 29은 KIF5B-RET 융합유전자 및 NM_020630로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 뉴클레오타이드 서열을 보여준다.
도 30은 KIF5B-RET 융합단백질 및 NM_020630로부터 유래한 KIF5B 도메인을 포함하는 융합영역의 아미노산 서열을 보여준다.
도 31은 LC_S2로부터 얻은 KIF5B-RET변종 융합유전자의, 뉴클레오타이드 서열 및 융합영역을 보여준다.
도 32는 LC_S2로부터 얻은 KIF5B-RET변종 융합단백질의, 아미노산 서열 및 융합영역을 보여준다.
도 33은 LC_S6로부터 얻은 KIF5B-RET변종 융합유전자의, 뉴클레오타이드 서열 및 융합영역을 보여준다.
도 34는 LC_S6로부터 얻은 KIF5B-RET변종 융합단백질의, 아미노산 서열 및 융합영역을 보여준다.
이하, 본 발명을 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명이 하기 실시예에 의해 한정되는 것은 아니다.
실시예
1: 시료 준비단계
실시예에서 사용된 모든 프로토콜들은 서울성모병원(승인번호 KC11OISI0603)의 임상시험심사위원회에 의해 승인된 것이다. 파라핀 함몰 조직들(Paraffin-embedded tissues)은 AK55 환자의 원발성 폐암 및 골전이 암으로부터 얻어졌다. 또한, AK55의 간전이성 암의 생검(biopsy)을 통해 얻어진 냉동조직도 이용할 수 있었다. 또한, AK55의 정맥혈을 채취하였다. AK55 환자의 폐암, 골전이암, 간전이암, 및 혈액으로부터 유전체 DNA를 추출하였다. 더욱이, AK55 환자의 냉동된 간전이암에서 RNA를 추출하였다. 그리고, 본원발명에 참고로 인용된 "Ju YS, Kim JI, Kim S, et al., Nat Genet 2011,"에서와 같이 전체 RNA로부터 cDNA를 합성하였다.
AK55 환자(폐선암종 및 다발성 전이를 가진 33세의 남자 환자)는 33세까지는 건강하였으나, 도 1과 도 2에 보이는 바와 같이 폐의 우상엽에 덜 분화된 선암(adenocarcinoma)이 발달하고 있었다. 도 1과 도 2는 CT-유도 생체검사(헤마톡시린 및 에오신 염색)를 통해 얻어진 원발성 폐암 조직의 파라핀 절편 현미경사진이다(도 1: x100; 도 2: x400). 암조직에서, 덜 분화된 종양 세포 둥지들이 결합조직형성기질(desmoplastic stroma)에 존재하였다. 게다가, 암세포는 불룩한 세포질과 큰 다형성 핵을 가지고 있었다.
PET(positron emission tomography)을 통하여, 간과 다수의 뼈에서도 전이가 발견되었다. 병리학적 진단을 위하여, 그는 원발성 폐암의 CT 유도 생체검사(CT-guided biopsy)뿐만 아니라 간전이성암의 초음파 유도 생체검사(ultrasound-guided biopsy)도 하였다. AK55 환자는 조부모 세대부터 암 가족력은 없었으며, 그는 흡연한 적이 없었다. 진단 1주일 후, 그는 경추(cervical bone)로의 전이로 인하여 목 골절을 당했으며, 때문에 C7 경추체 제거술(corpectomy)을 받았다. 병리학 연구들에서, 그의 폐선암종은, 알려진 EGFR, KRAS, 및 ALK 돌연변이들에 대하여 음성반응을 보였다. CK7, CK20, 및 TTF1에 대한 면역조직화학적 분석결과들은 폐선암종과 일치하였다(도 3 내지 도 5; CK7 양성 (도 3), TTF1 양성 (도 4), CK20 음성 (도 5)).
도 3 내지 도 5는 원발성 폐암 조직(도 3; CK7; 도 4: TTF1; 도 5: CK20)의 면역조직화학적 결과를 보여주는 현미경 사진이다. 이러한 분석들은 경추로 전이된 종양에서 수행되었다. CK7과 TTF1는 양성이었으나, CK20는 음성이었다. 결과들은 원발성 폐선암종이 이 암의 기원일 가능성을 높게 보여준다.
실시예
2: 전장 유전체 분석
상기 실시예 1에서의 방법과 같이, AK55 환자로부터 얻어진 각각 시료의 유전체변종(Genomic variants)들은 단일염기변이(single nucleotide variation, SNV), 짧은 삽입(short insertion) 과 결실(삽입결실, indel), 및 대량 결실(large deletions) 로, 본원발명에 참고로 인용된 "Ju YS, Kim JI, Kim S, et al., Nat Genet 2011"와 "Kim JI, Ju YS, Park H, et al., Nature 2009;460:1011-5"에서 에서 서술된 바와 같이, 전장-유전체 서열분석법(whole-genome sequencing)의 수정된 기준을 이용하여 분류되었다. 그리고 나서, 암조직에서의 상기 유전체변종들을 암-관련 체세포 돌연변이들을 동정하기 위해 혈액 내의 유전체와 비교하였다. DNA 및 RNA 서열 데이터 또한 본원발명에 참고로 인용된 "Ju YS, Kim JI, Kim S, et al., Nat Genet 2011,"에서 서술한 방법으로 분석하였다.
원발성 폐암의 DNA는 파라핀 함몰 조직에 있는 적은 양의 DNA로부터 추출되기 때문에, 분석을 위한 ?은-리드 중복(short-read redundancy)이 너무 높았다. 따라서, 주요 비교들은 간전이와 혈액의 서열 사이에서 이루어졌다. 서열분석 실험들은, Illumina의 표준방법, 및 본원발명에 참고로 인용된 "Ju YS, Kim JI, Kim S, et al., Nat Genet 2011"와 "Kim JI, Ju YS, Park H, et al., Nature 2009;460:1011-5"에서 서술된 방법을 이용하여 수행하였다.
서열 라이브러리(sequencing library)들은 Illumina Inc.의 표준프로토콜에 따라 만들었다. 서열분석의 높은 처리량을 위해, 파라핀 함몰 골전이로부터의 유전체 DNA(DNA 농도가 너무 낮아서, 발명자의 기준에 충족되지 않았고 서열 라이브러리 구축을 하기에는 부적합)를 제외한 시료들은 Illumina HiSeq2000와 Genome Analyzer IIx를 이용하여 서열분석하였다. AK55 환자의 암(간전이) 및 정상조직(혈액) 의 전장-유전체 딥 시퀀싱(whole-genome deep sequencing)으로부터, 발명자들은 각각 47.77x과 28.27x의 평균 리드-깊이(read-depth)를 얻었다. 표 1은 얻어진 결과를 보여준다. 폐암환자 AK55의 서열 분석 통계 요약를 표 1에 나타냈다.
분석 | 조직 | 출처 | 대량 병렬 서열분석법 | 검증 | |||
나란한 리드의 수 |
리드 길이 (bp) |
처리량 (Gbp) |
리드 깊이 (배) |
PCR 및 생어 서열분석법 | |||
유전체 | 혈액 | 신선(Fresh) | 392,194,564 | 103 | 80.79 | 28.27 | 있음 |
폐암 | 파라핀 함몰 | 274,909,815 | 103 | 56.63 | 19.81 | 있음 | |
간전이 | 냉동 | 362,530,401 | 101 | 136.55 | 47.77 | 있음 | |
293,140,533 | 108 | ||||||
골전이 | 파라핀 함몰 | - | - | - | - | 있음 | |
전사체 | 간전이 | 냉동 | 89,682,934 | 101, 68 | 15.16 | - | 있음 |
전장-유전체 범위는 고르게 분포되어 있었다 (중심 소체(centromeric) 또는 말단 소립(telomerec) 영역에서의 정상 '스파이크들(spikes)' 제외). 이것은 암조직에서 이수성의 증거가 없음을 보여준다(도 6). 도 6은 폐암의 전사체 서열분석에서 동정된 융합유전자의 시각적 표현을 보여준다. 염색체 내부, 및 염색체 간의 융합유전자는 중간층에서 관찰된다. 선의 두께는 증거의 양(스패닝 리드(spanning reads)들의 수) 을 보여준다. KIF5B-RET 융합유전자는 빨간색으로 표시되었다. 염색체 이데오그램(ideograms)은 바깥층에서 보여진다. 암 전장 유전체 서열분석의 범위는 1번째 중간층에서 보여진다. 이러한 결과는, 암 유전체는 광범위한 염색체의 이수성을 가지고 있지 않음을 시사한다. 히트맵(Heatmap)을 이용한 유전자의 발현 수준은 2번째 중간층에서 보여진다.
암 전장-유전체 서열에서, 우리는 OMIM(Online Mendelian Inheritance in Man) 및 SNPedia에 보관되어 알려진 어떠한 암 관련 체세포 점 돌연변이(somatic point mutations)도 찾을 수 없었다. 암과 혈액 간의 SNVs, 삽입결실, 및 CNVs(copy number variants)의 비교에서는 발암가능성이 있는 암 관련 유전자에서의 어떠한 눈에 띄는 돌연변이도 찾을 수 없었다.
실시예
3: 융합유전자 분석
융합유전자를 검출하기 위해, 전사체 서열분석(transcriptome sequencing), 다른 유전자와 나란히 있는 리드(read)의 끝에 존재하는 디스코던트 리드 (discordant read)들, 및 키메릭 전사체들(chimeric transcripts)의 융합 절단점을 가로질러 있는 엑손-스패닝 리드(exon-spanning read)들을 사용하였다. 최종 융합유전자 후보들을 위해, 상응하는 유전체의 재배열, 즉 역위, 전좌 및 대량결실, 을 전장 유전체 서열분석 데이터를 통해서 조사하였다.
전사체 데이터가 분석되었으며, 많은 암들은 병원성 염색체의 전좌 또는 역위에 의한 융합유전자에 의해서 유래되는 것으로 알려져 있기 때문에 발명자들은 융합유전자를 찾아내는데 초점을 맞추었다.
융합유전자들을 찾아내기 위해, 각각 약 300bp 길이의 cDNA단편들의 끝을 101bp까지 차세대염기서열분석(next generation sequencing)을 통하여 서열분석 하였다(Ju YS et al., Genome Res. 2012 22:436-445). 서열 데이터로부터, 우리는 다른 염색체들에 정렬되어있는 서열에 양끝에 있는 디스코던트 리드의 존재를 조사하였다. 게다가, 각 끝 서열의 하나는 융합유전자의 절단점으로부터 만들어졌으며, 엑손-스패닝 리드들의 존재도 조사하였다. 디스코던트 리드 및 엑손-스패닝 리드들은 융합유전자의 존재를 나타낸다. 디스코던트 리드와 엑손-스패닝 리드를 모두 가진 유전자를 폐암 융합유전자라고 정하였다.
AK55에서 동정 된 융합유전자 중 선택된 것 (52개 중 20개)에 대해서 융합유전자의 확인 방법을 표 2 및 도 6에 나타냈다.
카테고리 | 공여 유전자 | 수용 유전자 | 염색체 | 거리 (Mb) |
디스코던트 리드의 수 | 스패닝 리드의 수 | 전장-유전체 서열 내의 증거 |
염색체 내 | |||||||
KIF5B | RET | 10 | 10.580 | 34 | 60 | 있음 (역위) |
|
KIF5B | KIAA1462 | 10 | 1.970 | 4 | 4 | - | |
EEF1DP3 | FRY | 13 | 0.133 | 3 | 5 | - | |
RPS6KB1 | TMEM49 | 17 | 0.097 | 4 | 31 | - | |
HACL1 | COLQ | 3 | 0.075 | 3 | 4 | - | |
TMEM56 | RWDD3 | 1 | 0.073 | 4 | 11 | - | |
FAM18B2 | CDRT4 | 17 | 0.065 | 4 | 29 | - | |
CTBS | GNG5 | 1 | 0.065 | 6 | 27 | - | |
METTL10 | FAM53B | 10 | 0.054 | 2 | 4 | - | |
AZGP1 | GJC3 | 7 | 0.048 | 5 | 15 | - | |
NKX2-1 | SFTA3 | 14 | 0.046 | 3 | 7 | - | |
ADSL | SGSM3 | 22 | 0.036 | 5 | 6 | - | |
ART4 | C12orf69 | 12 | 0.034 | 3 | 4 | - | |
LOC100131434 | IDS | X | 0.031 | 2 | 11 | - | |
LOC100130093 | SNAP47 | 1 | 0.030 | 2 | 2 | - | |
C15orf57 | MRPL42P5 | 15 | 0.025 | 2 | 7 | - | |
MIA2 | CTAGE5 | 14 | 0.024 | 30 | 102 | - | |
SH3D20 | ARHGAP27 | 17 | 0.024 | 2 | 10 | - | |
RBM14 | RBM4 | 11 | 0.023 | 16 | 24 | - | |
염색체 간 | |||||||
RSPO1 | HP | 16;1 | - | 2 | 3 | - |
이들 중, 94.2%(n=49)는 인접한 유전자(< 135 Kb) 사이의 염색체 간 융합이었고, 이것은 발암에서 어떠한 기능적 역할을 가지고 있지 않을 것이다(표 2). 또한, 1.9%(n=1) 는 염색체 내 융합이었지만, 이것은 간에서 높게 발현되는 유전자인 합토글로빈(haptoglobin, HP)에 의하여 발생한 것이다. 비록 상기 융합유전자의 존재는 생물학적으로 유전자의 분자적 기능과 관련하여 흥미롭지만, 이것이 종양형성을 한다고 생각되지는 않는다. 남은 3.8% (n=2) 는 KIF5B-RET와 KIAA1462-KIF5B 융합유전자였고, 이들의 염색체 내 융합은 떨어져 있는 유전자(>~2Mb) 사이에서 발생하였다. 이 결과에 의해 KIAA1462-KIF5B는 제외되었다. 왜냐하면 KIAA1462-KIF5B의 발현 수준이 낮고, KIAA1462은 분자 기능이 알려지지 않은 가상의 단백질이기 때문이다. KIF5B-RET 융합을 제외하고는, 우리는 융합유전자 후보들 내에서 염색체의 재배열(예를 들어, 대량 결실, 역위, 또는 전좌)에 해당하는 것을 찾을 수 없었다.
RET는 타이로신 키나아제 원암유전자(proto-oncogene)로 잘 알려져 있기 때문에, 최종 융합유전자인 KIF5B-RET는 특별히 흥미가 있다. 또한, 상기 융합유전자는 인간의 암에서는 보고된 바가 없다. 게다가, 그것은 신규한 것으로 간주된다. 이 유전자 융합 사건의 특성은 RNA 서열분석 데이터를 이용하여 더욱 확인되었다. 융합유전자는 높게 발현되었고, 34개의 디스코던트페어드-엔드 리드들과 60개의 퓨전-정션(fusion-junction)을 가로지르는 스패닝 리드들에 의해 입증되었다(표 2 및 도 7). 도 7은 KIF5B-RET 융합유전자를 개략적으로 보여준다. 전사체 서열분석에서, 34개의 디스코던트페어드-엔드(discordantpaired-end) 리드들과 60개의 엑손-정션 (exon-junction) 을 가로지르는 스패닝 리드들이 동정되었다. 이러한 리드들의 존재는 융합유전자의 강력한 증거이다. 디스코던트페어드-엔드 리드는 말단서열이 다른 유전자와 정렬된 리드로 정의하였다. 스패닝 리드는 예측된 융합 전사체의 정션을 가로질러 정렬된 말단서열을 가진 리드를 말한다. 상기 분석에서, 융합은 KIF5B의 16번째 엑손과 RET의 12번째 엑손 사이에서 일어났다.
이러한 데이터들은 KIF5B의 16번째 엑손의 끝과 RET 원암유전자의 12번째 엑손의 시작이 합쳐짐을 보여준다. 발현 프로파일은 암조직에서 RET의 1번째 내지 12번째 엑손은 발현되지 않음을 보여주며(도 8), 이것은 암에서의 대부분의 RET 발현은 그대로의 RET 유전자보다 융합유전자에서 일어남을 보여준다. 도 8은 각각의 RET 엑손의 RNA발현 수준을 보여주는 그래프이다. RET 발현은 12번째 엑손, 즉 융합유전자의 정션의 아래쪽에서 관찰되었다. 이것은 모든 RET 발현은 정상 RET 유전자 보다 KIF5B-RET 융합유전자로부터 유래되었음을 제시한다.
KIF5B과 RET는 각기 10p11.22와 10q11.21에 10.6Mb만큼 떨어져서 존재한다. 두 유전자들을 암호화하는 가닥이 다르기 때문에, 융합유전자를 만들어지기 위해서는 10.6 Mb 길이의 역위가 일어나야 한다 (도 9). 도 9는 10번 대규모 병렬 서열분석법(massive parallel sequencing)을 통한 암 유전체의 염색체에서의 10.6 Mb 길이의 역위를 개략적으로 보여준다. 이러한 역위는 KIF5B-RET 융합유전자의 원인이다. KIF5B는 일반적으로 자신의 유니버셜 프로모터와 함께 발현된다. 역위가 일어난 후, 상기 프로모터는 KIF5B-RET 융합유전자의 글로벌 발현을 활성화한다.
상기 유전체의 역위는 암에서 역위(간전이에 8개의 리드; 원발성 폐암에 1개의 리드)를 뒷받침하는 리드의 검출을 통해 확인되었다. 그러나, 혈액 조직의 전체 유전체 서열분석에서는 상응하는 염색체의 재배열이 없었다.
상기 결과는 유전체의 DNA와 cDNA를 PCR 증폭과 생어 서열분석법을 통한 분석을 이용하여 더욱 입증되었다. PCR 반응은 95℃에서 10분 동안, 95℃에서 30초 동안 30 싸이클, 62℃에서 10초 동안, 72℃에서 10초 동안, 마지막으로 72℃에서 10분 동안 수행하였다. 유전체의 역위를 위한 PCR 및 생어 서열분석법 프라이머는 5'-CAGAATTTCACAAGGAGGGAAG-3'(서열번호 18)와 5'-CAGGACCTCTGACTACAGTGGA-3'(서열번호 19)였다. 융합 전사체를 위한 프라이머는 5'-GTGAAACGTTGCAAGCAGTTAG-3'(서열번호 20)와 5'-CCTTGACCACTTTTCCAAATTC-3'(서열번호 21)이다. 모든 생어 서열분석법(Sanger sequencing) 실험은 Macrogen Inc.(http://www.macrogen.com)에서 실시하였다.
AK55 환자(폐암, 뼈와 간에 전이)의 3가지 암관련 조직은 정상 혈액을 제외한 모두가 PCR 생성물은 역위의 결과임을 보여준다 (도 10 및 도 11). 도 10 및 도 11은 AK55 환자로부터 얻어진 RNA(도 10)와 DNA(도 11)의 KIF5B-RET 융합유전자 확인을 위한 PCR 증폭결과이다. RNA 및 DNA에서의 KIF5B-RET 융합유전자의 확인은 상기 기술된 역위에 특이적인 프라이머를 이용한 PCR 증폭 및 및 전기영동을 통해 수행되었다. 융합유전자 환자의 암 조직의 RNA와 DNA에서만 발견되었다.
이들 결과물의 생어 서열분석은 뉴클레오타이드 분해를 가진 역위의 절단점을 찾음으로써 융합 전사체를 검증하였다 (인간 위탁 유전체 빌드 36.3 (human reference genome build 36.3)의 chr10:32, 351, 306-42, 931, 601). 도 12와 13은 RNA (도 12) 와 DNA (도 13) 의 검증을 위한 생어 서열분석법을 통한 역위 절단점의 탐지결과들을 보여준다. 융합유전자는 생어 서열분석법을 이용하여 성공적으로 확인되었다. 유전체에 있는 역위 절단점은 또한 싱글-뉴클레오타이드 레졸루션(single-nucleotide resolution)으로 확인되었다. 유전체의 절단점들은 KIF5B와 RET의 인트론(intron)에 위치하고 있다. 절단점(인간 위탁 유전체 빌드 36.3의 chr10:42,931,604)으로부터 2개의 염기 다운스트림(downdtream)에, 1-bp 결실이 만들어졌으며, 이는 NHEJ(error-prone non-homologous end joining)가, 이중가닥 DNA의 절단 이후에 발생한 상기 역위로부터 기인하였을 수 있음을 제시한다.
흥미롭게도, 단일 염기쌍 결실은 절단점(chr10:42,931,604)에서 2bp 인접한 곳에서 동정되었으며, 이는 에러-프론(error-prone) DNA 수선 메커니즘, 즉 NHEJ, 이 이중가닥 DNA의 절단 이후에 발생한 상기 역위로부터 기인하였을 수 있음을 제시한다. 이에 더하여, G-quadruplex(non-B DNA) 구조는 RET에 존재하는, 깨지기 쉬우며 염색체의 전좌의 근원으로 알려진 절단점의, ~100 bp 업스트림(upstream) 에 있을 것으로 예상된다.
실시예
4:
KIF5B
-
RET
융합
키나아제의
기능성 평가
RET 종양 유전자는 막관통 수용체 타이로신 키나아제(transmembrane receptor tyrosine kinase)이다. RET은 세포 외 영역(Cadherin-like 도메인을 포함하고 있음), 막관통 도메인 및 타이로신 키나아제 도메인을 포함하는 세포 내 영역으로 구성되어있다 (도 14). 도 14는 KIF5B-RET 융합단백질의 기능적인 도메인을 개략적으로 보여준다. 융합단백질은 KIF5B의 638 N-말단 잔기들 및 RET의 402 C-말단 잔기들로 구성되어 있다. 융합유전자는 이중나선 도메인을 포함하여 단백질 타이로신 키나아제 도메인을 가지고 있다. 이중나선 도메인은 자기인산화에 의해 발암성 단백질 타이로신 키나아제 도메인(oncogenic protein tyrosine kinase domain)을 활성화시킬 수 있는 동종이량화(homo-dimerization)를 유발한다.
RET이 GDNF와 같은 공동수용체나 리간드에 결합에 의하여 이량화 될 때, 자기인산화에 의해 활성화되고, 하부 신호 전달을 자극한다. RET 원암유전자의 하위 신호 전달계(downstream signaling cascade)는 세포 생존/세포사멸, 증식, 분화, 및 전이를 조절하는 MAPK 경로이다. RET의 정상발현은 신경발달에 중요하나, 분화된 조직들에서는 활성화되지 않음이 알려져 있다.
KIF5B는 미세소관의존성 모터(microtubule-based motor) 단백질이며, 보편적으로 KIF5B의 활성화 프로모터에 의해 발현되고, 진핵세포 내의 세포 소기관의 수송에 참여한다. KIF5B의 이중나선 도메인은 자신의 움직임에 필수적인 동종 이량화를 유도한다.
도 15는 PHYRE2 알고리즘을 이용해 예측한 KIF5B-RET 융합단백질의 삼차원구조를 보여준다. 융합단백질의 N-말단 및 C-말단은 빨간색과 파란색으로 표시되었다. 각기 단백질 3D 모델링은 KIF5B-RET 융합유전자의 단백질 서열을 이용한 PHYRE2 소프트웨어로 수행되었다 (http://www.sbg.bio.ic.ac.uk/phyre2/).
이와 마찬가지로, KIF5B-RET 융합유전자는 높게 발현될 것이며, 그리고 나서 KIF5B에 의해 번역된 후에 이량화될 것이다 (도 14 및 15). 그런 다음, 이량화된 RET 단백질 타이로신 키나아제 도메인은 비정상적으로 자극될 것이며, 이에 따라 발암 경로의 자극이 촉진된다. 면역조직화학적 분석은 RET의 타이로신 키나아제 도메인은 폐암 조직에서 높게 발현되었음을 보여준다 (도 16). 도 16은 환자(AK55)의 폐암(골전이)에서의 KIF5B-RET 발현을 면역조직화학적 분석한 결과를 보여주는 현미경 사진이다 (x400). 단백질이 종양세포에서 독점적으로 관찰된 것은, KIF5B-RET 융합단백질은 암에서 중요한 역할을 수행함을 의미한다.
실시예
5: 다른 폐암 시료들에서의
RET
과발현 빈도 평가
RET의 발암성 효과는 PTC/RET 융합단백질의 형성을 주도하는, 다양한 종류의 염색체의 전좌와 역위가 있는, 갑상선유두상암(papillary thyroid carcinoma, PTC)에서 처음으로 확인되었다. 특정의 점 돌연변이 역시 발성 내분비종양증(multiple endocrine neoplasia, MEN) 2A와 2B 타입에서 드라이버(driver)로서 보고되었다. 또한, 활성화된 RET이 전립선암, 췌장암, 악성 흑색종에서 관찰되었다. 상기 RET의 종양생성능력 또한 RET 형질 전환된 쥐 연구에서 다양한 종류의 악성종양을 만들어냄에 따라 뒷받침된다. 그러나, 상기 RET 유전자는 종례의 폐암에서는 강조되지 않았다.
폐선암종에서의 RET 과발현 빈도는 데이터베이스에 보관되어있는 종례 마이크로 어레이 데이터를 이용하여 평가하였다. 특별히, 일반적인 폐선암종(lung adenocarcinoma)에서의 RET 과발현을 조사하기 위하여, 우리는 데이터베이스(유전자 발현 Omnibus: http://www.ncbi.nlm.nih.gov/geo/와 The Cancer Genome Atlas (TCGA) : http://cancergenome.nih.gov/)에 보관되어있는 폐선암종의 발현 프로파일을 분석하였다.
10개의 선암종 세포주(GemmA, Li C, SugiyamY, et al., BMC Cancer 2006;6:174)의 발현 프로파일은 두개의 시료에서 RET이 높게 발현되었음을 보여준다. 반면에, RET은 본 데이터 세트의 10개의 소세포암 세포주와 9개의 편평세포암종(squamous cell carcinoma) 세포주에서 활성화되지 않았다. 우리는 원발성 폐암에서의 RET 원암유전자 발현을 프로파일한 3개의 연구를 더 발견하였다. 첫 번째 연구의 데이터 세트에서(Ding L, Getz G, Wheeler DA, et al., Nature 2008;455:1069-75), 75개중 6개의 종양(8%)에서 RET이 과발현하였다. 또 다른 데이터 세트(Kuner R, Muley T, Meister M, et al., Lung Cancer 2009;63:32-8)는 40개중 5개의 시료(12.5%)에서 RET 활성을 보여주었다. 마지막으로, The Cancer Genome Atlas(TCGA) 데이터 세트는 32개중 3개의 시료(9.4%; 도 17)에서 RET 과발현을 보여주었다. 도 17은 다른 폐선암종에서 RET 발현 분석결과를 보여주는 그래프이다. TCGA(The Cancer Genome Atlas)에 기탁 되어있는 32개의 발현 마이크로어레이 데이터를 분석하였다. 이들 중 3개의 시료는 명백한 RET 과발현을 보여주며, 이것은 폐선암종에서의 과발현 빈도는 약 10%임을 제시한다.
이와 함께, 상기 결과는 폐선암종에서 RET 과발현 빈도는 ~10%임을 제시한다.
도 18은 간전이에서의 유전자 발현 네트워크 분석결과를 보여준다. 네트워크 분석은 MiMI plugin(http://mimiplugin.ncibi.org/)과 함께 Cytoscape(http://www.cytoscape.org/)를 이용하여 수행되었다. 암에서 유전자들이 과발현되어지는 것은 네트워크로 매핑되었으며, 마디 크기는 상대적인 발현에 비례한다. 주요한 기능기들은 표지 되었으며, 기능적으로 중요한 유전자들은 빨간색으로 표지 되었다.
실시예
6:
FISH
분석을 통한
KIF5B
-
RET
융합유전자의 동정
RET 재배열을 동정하기 위하여, FISH를 AK55 세포주와 대조군으로서 정상세포에, RET을 위해 브레이크-어파트 프로브(break-apart probe)를 이용하여 수행하였다. 슬라이드들은 Citrisolve(Fisher Scientific, Pittsburgh, PA)에 15분 동안 침지시키고, 제트 공기로 건조시킨 후, 다시 루골 용액(Lugol solution)에 5분간 침지시켰다. 그 다음, 2.5% 티오시안산나트륨(sodium thiocyanate)에 30초 동안 침지시켰다. 그 다음, 슬라이드들을 citrate/citric acid 용액(pH 6.0) 10 mmol/L에 위치시키고, 5분간 높은 설정에서 마이크로웨이브(microwave)하고, 이어서 37℃에서 15 내지 45분 동안 0.4% 펩신 용액(pepsin A/0.9% sodium chloride at pH 1.5)에서 마이크로웨이브한다. 10마이크로리터의 FISH 시약(7ul LSI buf-fer [Vysis, Downers Grove, IL], 3ul 프로브)을 각각의 슬라이드에 넣은 후, 슬라이드들에 커버슬라이드를 씌운다, Hybrite(Vysis)에서 녹는점 80℃에서 5분간 변성시키고, 습도 챔버(humidified chamber) 안에서 37℃에서 12시간 동안 인큐베이팅하였다. 슬라이드들을 2Xsaline sodium citrate/0.1% NP40(US Biological, Swampscott, MA)으로 70℃에서 2분간 세척한 후, DAPI(4,6-diamidino-2-phenyl indole dihydrochloride)와 대조하였다. 세포들은 마이크로스코피스트(micros-copist)에 의해 적절한 필터 세트가 장착된 형광현미경을 이용하여 분석되었다. 염색체 역위, 즉 추론된 염색체의 재배열은 KIF5B-RET 융합에 책임이 있다. 얻어진 FISH 결과는 도 19에서 보여지며, 빨강색과 녹색 프로브의, KIF5B-RET 융합 양성 종양에 측면(flank) RET 전좌 사이트 분열을 보여준다 (화살표).
실시예
7:
KIF5B
-
RET
융합유전자로 형질 전환된 포유류 세포의 세포 성장률 및 생존력 실험
NIH 3T3 세포들을 KIF5B-RET 융합단백질을 암호화하고 KIF5B-RET 융합단백질을 발현시키는 cDNA가 포함 된 컨스트럭트(construct)로 형질전환시킴으로써, KIF5B-RET 융합단백질의 발현이 정상세포를 종양세포로 변환시키는데 기여하는지 아닌지 여부는 확실해졌다. NIH3T3 세포(ATCC/ ATCC Number CRL-1658)는 10 %(v/v) fetal bovine serum (FBS; Gibco BRL), 페니실린, 및 스트렙토마이신이 포함된 DMEM 배지(Gibco BRL)에서 보관되었다. 레트로바이러스의 상청액 준비와 형질전환은 CELL BIOLABs로부터 구입한 Platinum Retrovirus Expression System이 제공하는 프로토콜에 따라 수행되었다. NIH3T3 세포는 pMXs-puro/Fusion 단백질 발현 벡터를 포함한 레트로바이러스의 상청액을 통해 형질도입하고, 그 다음 형질도입된 세포를 퓨로마이신(2ug/ml)을 이용하여 선별하였다. 세포주로부터의 모든 세포용해물 은 SDS-PAGE 수행 후, PVDF(polyvinylidine difluoride) 멤브레인 위에 블로팅을 하였다. 블롯팅은 0.1% 트윈 20과 5% BSA이 포함된 TBS로 차단되었고, anti-RET (#3223, Cell signaling, USA), anti-phospho-RET (Tyr905) (#3221, Cell signaling, USA), 및 anti-actin(A5441, Sigma-Aldrich, USA)으로 탐색하였다. 0.1% 트윈 20이 포함된 TBS로 세척 후, 맴브레인은 겨자무과산화효소 (horseradish peroxidase) 결합된 anti-mouse 또는 anit-rabbit 2차 항체와 함께 인큐베이트하였고, ECL (enhanced chemiluminescence reagent; Pierce, #34080) 을 처리하였다. 얻어진 결과는 도 20에 나타내었으며, 선별된 NIH3T3 세포들이 안정적으로 KIF5B-RET 융합유전자로 형질 전환되었음을 웨스턴 블로팅을 통해 나타낸다.
FBS가 포함되거나 또는 FBS가 포함되지 않은 배지에서, NIH3T3 부모세대 세포와 KIF5B-RETa를 발현하는 NIH3T3 안정된 세포주, 또는 KIF5B-RETc 융합유전자(NIH3T3/KIF5B-RETa, NIH3T3/KIF5B-RETc) 세포의 성장률을 측정하고, 각각을 비교하였다. NIH3T3 세포와 NIH3T3/KIF5B-RET 세포는 FBS가 포함된 배지와 FBS가 포함되지 않은 배지에서 각각 24시간 동안 배양하였다. 그 후 얻어진 이미지들을 도 21에 나타내었다. 도 21에서 보이듯이, 형질 전환되지 않은 NIH3T3 세포들의 성장률은 FBS가 포함되지 않은 배지에서 억제되었으나, KIF5B-RET 융합유전자로 형질 전환된 NIH3T3 세포는 FBS가 포함되지 않은 배지에서도 성장하고, 콜로니를 잘 형성하였다. 상기 결과는 KIF5B-RET 융합단백질의 발현은 NIH3T3 세포의 특성을 변하게 하였고, KIF5B-RET 융합유전자로 형질 전환된 세포들은 KIF5B-RET 융합단백질 덕분에 심지어 FBS가 부족한 배지 같은 비정상조건에서도 생존과 성장 가능함을 보여준다.
실시예
8:
융합단백질
억제제(
카보잔티닙
(
Cabozantinib
))에 의한 포유류
고형암
세포 성장 저해 시험.
융합단백질이 융합단백질을 발현하는 세포주(또는 종양세포)의 성장 및 생존을 자극하는지에 대한 효과를 확인하기 위해서, 세포주에 키나아제에 대한 저해제 또는 융합단백질에 포함된 다른 도메인에 대한 저해제를 처리하였다.
특별이, KIF5B-RET로 형질 전환된 NIH3T3 세포(NIH3T3 /KIF5B-RET)(실시예 7)에, 도 22에서 보이듯이, 카보잔티닙(Cabozantinib)(4 Chem, 한국)을 다양한 농도에서 2일 동안 처리하였다. 그리고 RET, phospho-RET, 및 액틴(actin)의 발현수준(대조군)을 상응하는 항체들을 이용한 면역블로팅을 통하여 측정하였다. anti-RET 및 anti-phospho-RET(Tyr905) 항체들은 각각 Cell Signaling Technology(#3223, #3221)로부터 입수하였다. anti-actin 항체는 Sigma Aldrich(#A5441)로부터 입수하였다.
얻어진 결과들은 도 22에 나타내었으며, RET의 활성화된 형태인 phospho-RET의 발현이 카보잔티닙(Cabozantinib)의 농도에 따라 감소함을 보여준다. 상기 결과는 RET 단백질이 융합단백질 형질 전환된 세포에서 비정상적으로 활성화되었음을 나타내며, 융합단백질 형질 전환된 세포의 성장은 키나아제 억제제를 처리함으로써 저해될 수 있음을 보여준다.
세포 성장 저해에 대한 정량적 분석을 위해서, 융합단백질을 발현하는 세포의 수를 세어보았고, 세포 성장 저해는 제조자가 제공한 프로토콜에 따라 WST-1 solution cell proliferation assay(Roche)를 이용하여 분석하였다. KIF5B-RET로 형질 전환된 NIH3T3 세포들을 대략 1000 내지 5000개를 96-well 플레이트에 시드(seed)하고, 10% (v/v) FBS가 공급된 완전배지(DMEM, Gibco)에서 배양하였다. 24시간이 지난 후, 도 23에서 보듯이 배지를 10% (v/v) FBS와 100 nM 농도의 카보잔티닙(Cabozantinib)이 포함된 완전 성장 배지 100㎕로 교체한 후, 세포들을 72시간 동안 더 배양하였다. 세포 배양 마지막에, 각각의 well에 WST-1 용액을 10 ㎕첨가하고, 1 내지 3시간 더 배양을 실시하였다. 450nm에서의 흡광도를 마이크로플레이트리더(microplate reader)를 이용하여 측정하였다. 성장 저해는 카보잔티닙 (Cabozantinib)을 처리한 세포와 처리하지 않은 세포에서 측정된 흡광률의 평균 ±SD 값을 비교하여 평가하였다. 분석은 3회 실시하였으며, 얻어진 결과들은 도 23에 나타내었다. 도 23에서 보여지듯이, KIF5B-RET 융합단백질은 세포 성장률 증가와 인간 종양 세포 (NSCLC 등) 의 세포생존에 기여하였고, 융합단백질 저해제는 세포생존 감소 및 세포사멸 증가로 이어질 가능성이 있다.
실시예
9: 다른 환자들에서
KIF5B
-
RET
융합유전자의 검출
다른 원발성 폐선암종에서도 KIF5B-RET 융합유전자가 역시 존재함을 보여주기 위해서, 추가적으로 3중음성(EGFR, KRAS, 및 EML4-ALK에 음성) 원발성 폐선암종의 전사체를 대규모 병렬 서열분석법을 이용하여 분석하였다. 추가된 시료는 LC_S2(폐선암종 3A기 진단을 받은 62세 남자 환자)로 명명하였다. LC_S2시료를 실시예 1에서의 방법으로 준비하였다. KIF5B-RET 융합 전사체들이 LC_S2에서 발견되었다. 표 3에서 보는 바와 같이 LC_S2에 있는 12번째 엑손에서, RET이 AK55에서와 마찬가지로 높게 발현되었다. exon-by-exon RET 발현을 표 3에 나타냈다.
KIF5B은 통상적으로 분화된 조직에서 발현되기 때문에, KIF5B-RET 융합유전자는 이러한 폐암 조직(AK55와 LC_S2)에 존재하는 KIF5B 활성 프로모터에 의하여 발현될 수 있다. 상기 LC_S2에 존재하는 융합 전사체는 cDNA PCR을 이용하여 검증하였다.
AK55와 LC_S2로부터 얻어진 검증 데이터를 도 24에 나타내었다. 도 24는 KIF5B-RET 융합 전사체를 대상으로 한 cDNA PCR 및 AK55의 간전이성 폐암과 추가적으로 3중음성 폐선암종(LC_S2)에서의 겔전기영동의 분석결과를 보여준다. AK55(서열번호 1) 및 LC_S2(서열번호 9)로부터온 cDNA는 융합 전사체의 명백한 증거를 보여준다. AK55의 융합 전사체는 LC_S2(엑손 15)의 엑손과 비교하여 KIF5B(엑손 16)의 엑손을 1개 이상 더 포함하고 있기 때문에, AK55의 PCR 생성물의 길이는 LC_S2의 PCR 생성물의 길이보다 길었다.
또한, KIF5B-RET 융합유전자는 이중음성(병리학 연구에서 EGFR과 EML4-ALK는 음성; KRAS 돌연변이 상태는 알 수 없음) 원발성 폐선암종(LC_S6)(폐선암종 1A기 진단을 받은 58세 남자환자)의 cDNA PCR을 이용하여 더 평가하였다. LC_S2의 시료는 상기 실시예 1에서의 방법으로 준비하였다. LC_S2의 융합 전사체는 cDNA PCR을 사용하여 검증하여, LC_S6는 KIF5B-RET 융합유전자(서열번호 13)를 보여줌을 확인하였다 (도 25). 도 25는 KIF5B-RET 융합 전사체를 목표로 한 cDNA PCR과 이중음성 폐선암종(LC_S6)의 겔전기영동을 이용한 확인 결과를 보여준다. LC_S6 융합 전사체의 명백한 증거를 보여준다. LC_S6에서의 융합 전사체는 AK55와 비교하여 7개 이상의 KIF5B(엑손 17 내지 23) 엑손을 포함하고 있음을 보여준다.
LC_S6의 융합유전자 절단점을 생어 서열분석법을 이용하여 동정하였고, 얻어진 결과는 도 25b에 나타내었다.
도 24, 25a, 및 25b와 관련된 검증들은 PCR 증폭 및 유전체 DNA와 cDNA 생어 서열분석법을 이용하여 수행하였다. PCR은 95℃에서 10분 동안; 95℃에서 30초 동안 30싸이클, 62℃에서 10초 동안, 그리고 72℃에서 10초 동안; 마지막으로, 72℃에서 10분 동안 실시하였다. AK55 유전체의 역위를 위한 PCR과 생어 서열분석법의 프라이머는 5'-CAGAATTTCACAAGGAGGGAAG-3'(KIF5B; 서열번호 18)와 5'-CAGGACCTCTGACTACAGTG GA-3'(RET; 서열번호 19)이었다. 융합 전사체를 위한 프라이머는 5'-GTGAAACGTTGCAAGCAGTTAG-3'(KIF5B; 서열번호 20; AK55 및 LC_S6를 위한)와 5'-CCTTGACCACTTTTCCAAATTC-3'(RET; 서열번호 21; 또는 AK55, LC_S2, 및 LC_S6)를 사용하였다. 복제 연구에서 cDNA PCR을 위해, 다른 KIF5B 프라이머(5'-TAAGGAAATGACCAACCACCAG-3'(서열번호 22)가 LC_S2를 위해 사용되었다. 왜냐하면, LC_S2에서의 KIF5B 융합 절단점은 AK55의 절단점과 다르기 때문이다. 모든 생어 서열분석 실험들은 Macrogen Inc.(http://www.macrogen.com)에서 수행되었다.
종합적으로, 복제 연구에서 우리는 2개의 원발성 폐선암종에서의 KIF5BRET 융합유전자(LC_S2 및 LC_S6) 사례를 더 분석하였다. 이러한 결과들은 KIF5B-RET 융합이 드문 것이 아니며, 융합 전사체가 일반적으로 원발성 폐선암종에 존재함을 명백하게 보여준다. 또한, 다른 암조직에서 동일한 비기능적 융합유전자를 찾는 것은 매우 어렵기 때문에, 이러한 결과들은 KIF5B-RET 융합유전자의 발현은 폐암에서 중요한 기능적 영향을 가진다는 간접적인 증거를 제공한다.
흥미롭게도 LC_S2와 LC_S6에서 RET의 엑손 12는 AK55에서와 같이 KIF5B의 엑손 16을 대신하여 엑손 15(LC_S2) 및 엑손 23(LC_S6)과 결합하였다. 도 26은 AK55(서열번호 1), LC_S2(서열번호 9), 및 LC_S6(서열번호 13)의 KIF5B-RET 융합 전사체를 개략적으로 보여준다. 각각의 직사각형은 KIF5B 유전자(파랑) 및 RET 유전자(빨강) 의 엑손을 나타낸다.
상기 결과는 KIF5B에 DNA 이중가닥의 깨짐(break)은 원발성 폐암들 중에서 일치하지 않을 수 있음을 제시한다. 그러나, 그것의 양 시료들(융합유전자 안의 이중나선 도메인의 길이는 LC_S2의 경우 247개의 아미노산이고, LC_S6 520개의 아미노산이었다)에서 이중나선 도메인들은 KIF5B-RET 키메릭 종양 유전자에서 잘 보존되어있기 때문에, 이량화 활성도는 아마도 AK55(310 아미노산)와 비교하여 크게 다른지는 않을 것이다.
폐선암종 시료들(AK55, LC_S2, 및 LC_S6)에서 얻어진 KIF5B-RET 융합유전자와 KIF5B-RET 융합단백질은 표 4에 요약하였다:
KIF5B (NM_004521) | RET (NM_020975) | 크기 | ||
AK55 | 뉴클레오타이드 | 1914 nt | 1209 nt | 3123 nt |
아미노산 | 638 a.a | 402 a.a | 1040 a.a | |
엑손 | 1-16 exon | 12-20 exon | 25 exon | |
LC-S2 | 뉴클레오타이드 | 1725 nt | 1209 nt | 2934 nt |
아미노산 | 575 a.a | 402 a.a | 977 a.a | |
엑손 | 1-15 exon | 12-20 exon | 24 exon | |
LC-S6 | 뉴클레오타이드 | 2544 nt | 1209 nt | 3753 nt |
아미노산 | 848 a.a | 402 a.a | 1250 a.a | |
엑손 | 1-23 exon | 12-20 exon | 32 exon |
<110> MACROGEN INC.
<120> Fusion protein comprising C-terminal domain of RET protein and
use thereof as a diagnosing marker
<130> DPP20141043KR
<150> US61/553,483
<151> 2011-10-31
<150> US13/663,565
<151> 2012-10-30
<160> 22
<170> KopatentIn 1.71
<210> 1
<211> 3123
<212> DNA
<213> Artificial Sequence
<220>
<223> KIF5B-RETa fusion gene wherein the KIF5B domain is derived from
NM_020975
<400> 1
atggcggacc tggccgagtg caacatcaaa gtgatgtgtc gcttcagacc tctcaacgag 60
tctgaagtga accgcggcga caagtacatc gccaagtttc agggagaaga cacggtcgtg 120
atcgcgtcca agccttatgc atttgatcgg gtgttccagt caagcacatc tcaagagcaa 180
gtgtataatg actgtgcaaa gaagattgtt aaagatgtac ttgaaggata taatggaaca 240
atatttgcat atggacaaac atcctctggg aagacacaca caatggaggg taaacttcat 300
gatccagaag gcatgggaat tattccaaga atagtgcaag atatttttaa ttatatttac 360
tccatggatg aaaatttgga atttcatatt aaggtttcat attttgaaat atatttggat 420
aagataaggg acctgttaga tgtttcaaag accaaccttt cagttcatga agacaaaaac 480
cgagttccct atgtaaaggg gtgcacagag cgttttgtat gtagtccaga tgaagttatg 540
gataccatag atgaaggaaa atccaacaga catgtagcag ttacaaatat gaatgaacat 600
agctctagga gtcacagtat atttcttatt aatgtcaaac aagagaacac acaaacggaa 660
caaaagctga gtggaaaact ttatctggtt gatttagctg gtagtgaaaa ggttagtaaa 720
actggagctg aaggtgctgt gctggatgaa gctaaaaaca tcaacaagtc actttctgct 780
cttggaaatg ttatttctgc tttggctgag ggtagtacat atgttccata tcgagatagt 840
aaaatgacaa gaatccttca agattcatta ggtggcaact gtagaaccac tattgtaatt 900
tgctgctctc catcatcata caatgagtct gaaacaaaat ctacactctt atttggccaa 960
agggccaaaa caattaagaa cacagtttgt gtcaatgtgg agttaactgc agaacagtgg 1020
aaaaagaagt atgaaaaaga aaaagaaaaa aataagatcc tgcggaacac tattcagtgg 1080
cttgaaaatg agctcaacag atggcgtaat ggggagacgg tgcctattga tgaacagttt 1140
gacaaagaga aagccaactt ggaagctttc acagtggata aagatattac tcttaccaat 1200
gataaaccag caaccgcaat tggagttata ggaaatttta ctgatgctga aagaagaaag 1260
tgtgaagaag aaattgctaa attatacaaa cagcttgatg acaaggatga agaaattaac 1320
cagcaaagtc aactggtaga gaaactgaag acgcaaatgt tggatcagga ggagcttttg 1380
gcatctacca gaagggatca agacaatatg caagctgagc tgaatcgcct tcaagcagaa 1440
aatgatgcct ctaaagaaga agtgaaagaa gttttacagg ccctagaaga acttgctgtc 1500
aattatgatc agaagtctca ggaagttgaa gacaaaacta aggaatatga attgcttagt 1560
gatgaattga atcagaaatc ggcaacttta gcgagtatag atgctgagct tcagaaactt 1620
aaggaaatga ccaaccacca gaaaaaacga gcagctgaga tgatggcatc tttactaaaa 1680
gaccttgcag aaataggaat tgctgtggga aataatgatg taaagcagcc tgagggaact 1740
ggcatgatag atgaagagtt cactgttgca agactctaca ttagcaaaat gaagtcagaa 1800
gtaaaaacca tggtgaaacg ttgcaagcag ttagaaagca cacaaactga gagcaacaaa 1860
aaaatggaag aaaatgaaaa ggagttagca gcatgtcagc ttcgtatctc tcaagaggat 1920
ccaaagtggg aattccctcg gaagaacttg gttcttggaa aaactctagg agaaggcgaa 1980
tttggaaaag tggtcaaggc aacggccttc catctgaaag gcagagcagg gtacaccacg 2040
gtggccgtga agatgctgaa agagaacgcc tccccgagtg agctgcgaga cctgctgtca 2100
gagttcaacg tcctgaagca ggtcaaccac ccacatgtca tcaaattgta tggggcctgc 2160
agccaggatg gcccgctcct cctcatcgtg gagtacgcca aatacggctc cctgcggggc 2220
ttcctccgcg agagccgcaa agtggggcct ggctacctgg gcagtggagg cagccgcaac 2280
tccagctccc tggaccaccc ggatgagcgg gccctcacca tgggcgacct catctcattt 2340
gcctggcaga tctcacaggg gatgcagtat ctggccgaga tgaagctcgt tcatcgggac 2400
ttggcagcca gaaacatcct ggtagctgag gggcggaaga tgaagatttc ggatttcggc 2460
ttgtcccgag atgtttatga agaggattcc tacgtgaaga ggagccaggg tcggattcca 2520
gttaaatgga tggcaattga atcccttttt gatcatatct acaccacgca aagtgatgta 2580
tggtcttttg gtgtcctgct gtgggagatc gtgaccctag ggggaaaccc ctatcctggg 2640
attcctcctg agcggctctt caaccttctg aagaccggcc accggatgga gaggccagac 2700
aactgcagcg aggagatgta ccgcctgatg ctgcaatgct ggaagcagga gccggacaaa 2760
aggccggtgt ttgcggacat cagcaaagac ctggagaaga tgatggttaa gaggagagac 2820
tacttggacc ttgcggcgtc cactccatct gactccctga tttatgacga cggcctctca 2880
gaggaggaga caccgctggt ggactgtaat aatgcccccc tccctcgagc cctcccttcc 2940
acatggattg aaaacaaact ctatggcatg tcagacccga actggcctgg agagagtcct 3000
gtaccactca cgagagctga tggcactaac actgggtttc caagatatcc aaatgatagt 3060
gtatatgcta actggatgct ttcaccctca gcggcaaaat taatggacac gtttgatagt 3120
taa 3123
<210> 2
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Fusion region of KIF5B-RETa fusion gene wherein the KIF5B domain
is derived from NM_020975
<400> 2
tgtcagcttc gtatctctca agaggatcca aagtgggaat tc 42
<210> 3
<211> 1040
<212> PRT
<213> Artificial Sequence
<220>
<223> KIF5B-RETa fusion protein wherein the KIF5B domain is derived
from NM_020975
<400> 3
Met Ala Asp Leu Ala Glu Cys Asn Ile Lys Val Met Cys Arg Phe Arg
1 5 10 15
Pro Leu Asn Glu Ser Glu Val Asn Arg Gly Asp Lys Tyr Ile Ala Lys
20 25 30
Phe Gln Gly Glu Asp Thr Val Val Ile Ala Ser Lys Pro Tyr Ala Phe
35 40 45
Asp Arg Val Phe Gln Ser Ser Thr Ser Gln Glu Gln Val Tyr Asn Asp
50 55 60
Cys Ala Lys Lys Ile Val Lys Asp Val Leu Glu Gly Tyr Asn Gly Thr
65 70 75 80
Ile Phe Ala Tyr Gly Gln Thr Ser Ser Gly Lys Thr His Thr Met Glu
85 90 95
Gly Lys Leu His Asp Pro Glu Gly Met Gly Ile Ile Pro Arg Ile Val
100 105 110
Gln Asp Ile Phe Asn Tyr Ile Tyr Ser Met Asp Glu Asn Leu Glu Phe
115 120 125
His Ile Lys Val Ser Tyr Phe Glu Ile Tyr Leu Asp Lys Ile Arg Asp
130 135 140
Leu Leu Asp Val Ser Lys Thr Asn Leu Ser Val His Glu Asp Lys Asn
145 150 155 160
Arg Val Pro Tyr Val Lys Gly Cys Thr Glu Arg Phe Val Cys Ser Pro
165 170 175
Asp Glu Val Met Asp Thr Ile Asp Glu Gly Lys Ser Asn Arg His Val
180 185 190
Ala Val Thr Asn Met Asn Glu His Ser Ser Arg Ser His Ser Ile Phe
195 200 205
Leu Ile Asn Val Lys Gln Glu Asn Thr Gln Thr Glu Gln Lys Leu Ser
210 215 220
Gly Lys Leu Tyr Leu Val Asp Leu Ala Gly Ser Glu Lys Val Ser Lys
225 230 235 240
Thr Gly Ala Glu Gly Ala Val Leu Asp Glu Ala Lys Asn Ile Asn Lys
245 250 255
Ser Leu Ser Ala Leu Gly Asn Val Ile Ser Ala Leu Ala Glu Gly Ser
260 265 270
Thr Tyr Val Pro Tyr Arg Asp Ser Lys Met Thr Arg Ile Leu Gln Asp
275 280 285
Ser Leu Gly Gly Asn Cys Arg Thr Thr Ile Val Ile Cys Cys Ser Pro
290 295 300
Ser Ser Tyr Asn Glu Ser Glu Thr Lys Ser Thr Leu Leu Phe Gly Gln
305 310 315 320
Arg Ala Lys Thr Ile Lys Asn Thr Val Cys Val Asn Val Glu Leu Thr
325 330 335
Ala Glu Gln Trp Lys Lys Lys Tyr Glu Lys Glu Lys Glu Lys Asn Lys
340 345 350
Ile Leu Arg Asn Thr Ile Gln Trp Leu Glu Asn Glu Leu Asn Arg Trp
355 360 365
Arg Asn Gly Glu Thr Val Pro Ile Asp Glu Gln Phe Asp Lys Glu Lys
370 375 380
Ala Asn Leu Glu Ala Phe Thr Val Asp Lys Asp Ile Thr Leu Thr Asn
385 390 395 400
Asp Lys Pro Ala Thr Ala Ile Gly Val Ile Gly Asn Phe Thr Asp Ala
405 410 415
Glu Arg Arg Lys Cys Glu Glu Glu Ile Ala Lys Leu Tyr Lys Gln Leu
420 425 430
Asp Asp Lys Asp Glu Glu Ile Asn Gln Gln Ser Gln Leu Val Glu Lys
435 440 445
Leu Lys Thr Gln Met Leu Asp Gln Glu Glu Leu Leu Ala Ser Thr Arg
450 455 460
Arg Asp Gln Asp Asn Met Gln Ala Glu Leu Asn Arg Leu Gln Ala Glu
465 470 475 480
Asn Asp Ala Ser Lys Glu Glu Val Lys Glu Val Leu Gln Ala Leu Glu
485 490 495
Glu Leu Ala Val Asn Tyr Asp Gln Lys Ser Gln Glu Val Glu Asp Lys
500 505 510
Thr Lys Glu Tyr Glu Leu Leu Ser Asp Glu Leu Asn Gln Lys Ser Ala
515 520 525
Thr Leu Ala Ser Ile Asp Ala Glu Leu Gln Lys Leu Lys Glu Met Thr
530 535 540
Asn His Gln Lys Lys Arg Ala Ala Glu Met Met Ala Ser Leu Leu Lys
545 550 555 560
Asp Leu Ala Glu Ile Gly Ile Ala Val Gly Asn Asn Asp Val Lys Gln
565 570 575
Pro Glu Gly Thr Gly Met Ile Asp Glu Glu Phe Thr Val Ala Arg Leu
580 585 590
Tyr Ile Ser Lys Met Lys Ser Glu Val Lys Thr Met Val Lys Arg Cys
595 600 605
Lys Gln Leu Glu Ser Thr Gln Thr Glu Ser Asn Lys Lys Met Glu Glu
610 615 620
Asn Glu Lys Glu Leu Ala Ala Cys Gln Leu Arg Ile Ser Gln Glu Asp
625 630 635 640
Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu
645 650 655
Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu
660 665 670
Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys Glu
675 680 685
Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val
690 695 700
Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys
705 710 715 720
Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly
725 730 735
Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr
740 745 750
Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp
755 760 765
Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile
770 775 780
Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp
785 790 795 800
Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile
805 810 815
Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val
820 825 830
Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu Ser
835 840 845
Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe Gly
850 855 860
Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly
865 870 875 880
Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met
885 890 895
Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln
900 905 910
Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile Ser
915 920 925
Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu
930 935 940
Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser
945 950 955 960
Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg
965 970 975
Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser Asp
980 985 990
Pro Asn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp Gly
995 1000 1005
Thr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala Asn
1010 1015 1020
Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp Ser
1025 1030 1035 1040
<210> 4
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion region of KIF5B-RETa fusion protein wherein the KIF5B
domain is derived from NM_020975
<400> 4
Cys Gln Leu Arg Ile Ser Gln Glu Asp Pro Lys Trp Glu Phe
1 5 10
<210> 5
<211> 2997
<212> DNA
<213> Artificial Sequence
<220>
<223> KIF5B-RETc fusion gene wherein the KIF5B domain is derived from
NM_020630
<400> 5
atggcggacc tggccgagtg caacatcaaa gtgatgtgtc gcttcagacc tctcaacgag 60
tctgaagtga accgcggcga caagtacatc gccaagtttc agggagaaga cacggtcgtg 120
atcgcgtcca agccttatgc atttgatcgg gtgttccagt caagcacatc tcaagagcaa 180
gtgtataatg actgtgcaaa gaagattgtt aaagatgtac ttgaaggata taatggaaca 240
atatttgcat atggacaaac atcctctggg aagacacaca caatggaggg taaacttcat 300
gatccagaag gcatgggaat tattccaaga atagtgcaag atatttttaa ttatatttac 360
tccatggatg aaaatttgga atttcatatt aaggtttcat attttgaaat atatttggat 420
aagataaggg acctgttaga tgtttcaaag accaaccttt cagttcatga agacaaaaac 480
cgagttccct atgtaaaggg gtgcacagag cgttttgtat gtagtccaga tgaagttatg 540
gataccatag atgaaggaaa atccaacaga catgtagcag ttacaaatat gaatgaacat 600
agctctagga gtcacagtat atttcttatt aatgtcaaac aagagaacac acaaacggaa 660
caaaagctga gtggaaaact ttatctggtt gatttagctg gtagtgaaaa ggttagtaaa 720
actggagctg aaggtgctgt gctggatgaa gctaaaaaca tcaacaagtc actttctgct 780
cttggaaatg ttatttctgc tttggctgag ggtagtacat atgttccata tcgagatagt 840
aaaatgacaa gaatccttca agattcatta ggtggcaact gtagaaccac tattgtaatt 900
tgctgctctc catcatcata caatgagtct gaaacaaaat ctacactctt atttggccaa 960
agggccaaaa caattaagaa cacagtttgt gtcaatgtgg agttaactgc agaacagtgg 1020
aaaaagaagt atgaaaaaga aaaagaaaaa aataagatcc tgcggaacac tattcagtgg 1080
cttgaaaatg agctcaacag atggcgtaat ggggagacgg tgcctattga tgaacagttt 1140
gacaaagaga aagccaactt ggaagctttc acagtggata aagatattac tcttaccaat 1200
gataaaccag caaccgcaat tggagttata ggaaatttta ctgatgctga aagaagaaag 1260
tgtgaagaag aaattgctaa attatacaaa cagcttgatg acaaggatga agaaattaac 1320
cagcaaagtc aactggtaga gaaactgaag acgcaaatgt tggatcagga ggagcttttg 1380
gcatctacca gaagggatca agacaatatg caagctgagc tgaatcgcct tcaagcagaa 1440
aatgatgcct ctaaagaaga agtgaaagaa gttttacagg ccctagaaga acttgctgtc 1500
aattatgatc agaagtctca ggaagttgaa gacaaaacta aggaatatga attgcttagt 1560
gatgaattga atcagaaatc ggcaacttta gcgagtatag atgctgagct tcagaaactt 1620
aaggaaatga ccaaccacca gaaaaaacga gcagctgaga tgatggcatc tttactaaaa 1680
gaccttgcag aaataggaat tgctgtggga aataatgatg taaagcagcc tgagggaact 1740
ggcatgatag atgaagagtt cactgttgca agactctaca ttagcaaaat gaagtcagaa 1800
gtaaaaacca tggtgaaacg ttgcaagcag ttagaaagca cacaaactga gagcaacaaa 1860
aaaatggaag aaaatgaaaa ggagttagca gcatgtcagc ttcgtatctc tcaagaggat 1920
ccaaagtggg aattccctcg gaagaacttg gttcttggaa aaactctagg agaaggcgaa 1980
tttggaaaag tggtcaaggc aacggccttc catctgaaag gcagagcagg gtacaccacg 2040
gtggccgtga agatgctgaa agagaacgcc tccccgagtg agcttcgaga cctgctgtca 2100
gagttcaacg tcctgaagca ggtcaaccac ccacatgtca tcaaattgta tggggcctgc 2160
agccaggatg gcccgctcct cctcatcgtg gagtacgcca aatacggctc cctgcggggc 2220
ttcctccgcg agagccgcaa agtggggcct ggctacctgg gcagtggagg cagccgcaac 2280
tccagctccc tggaccaccc ggatgagcgg gccctcacca tgggcgacct catctcattt 2340
gcctggcaga tctcacaggg gatgcagtat ctggccgaga tgaagctcgt tcatcgggac 2400
ttggcagcca gaaacatcct ggtagctgag gggcggaaga tgaagatttc ggatttcggc 2460
ttgtcccgag atgtttatga agaggattcc tacgtgaaga ggagccaggg tcggattcca 2520
gttaaatgga tggcaattga atcccttttt gatcatatct acaccacgca aagtgatgta 2580
tggtcttttg gtgtcctgct gtgggagatc gtgaccctag ggggaaaccc ctatcctggg 2640
attcctcctg agcggctctt caaccttctg aagaccggcc accggatgga gaggccagac 2700
aactgcagcg aggagatgta ccgcctgatg ctgcaatgct ggaagcagga gccggacaaa 2760
aggccggtgt ttgcggacat cagcaaagac ctggagaaga tgatggttaa gaggagagac 2820
tacttggacc ttgcggcgtc cactccatct gactccctga tttatgacga cggcctctca 2880
gaggaggaga caccgctggt ggactgtaat aatgcccccc tccctcgagc cctcccttcc 2940
acatggattg aaaacaaact ctatggtaga atttcccatg catttactag attctag 2997
<210> 6
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Fusion region of KIF5B-RETc fusion gene wherein the KIF5B domain
is derived from NM_020630
<400> 6
tgtcagcttc gtatctctca agaggatcca aagtgggaat tc 42
<210> 7
<211> 998
<212> PRT
<213> Artificial Sequence
<220>
<223> KIF5B-RETc fusion protein wherein the KIF5B domain is derived
from NM_020630
<400> 7
Met Ala Asp Leu Ala Glu Cys Asn Ile Lys Val Met Cys Arg Phe Arg
1 5 10 15
Pro Leu Asn Glu Ser Glu Val Asn Arg Gly Asp Lys Tyr Ile Ala Lys
20 25 30
Phe Gln Gly Glu Asp Thr Val Val Ile Ala Ser Lys Pro Tyr Ala Phe
35 40 45
Asp Arg Val Phe Gln Ser Ser Thr Ser Gln Glu Gln Val Tyr Asn Asp
50 55 60
Cys Ala Lys Lys Ile Val Lys Asp Val Leu Glu Gly Tyr Asn Gly Thr
65 70 75 80
Ile Phe Ala Tyr Gly Gln Thr Ser Ser Gly Lys Thr His Thr Met Glu
85 90 95
Gly Lys Leu His Asp Pro Glu Gly Met Gly Ile Ile Pro Arg Ile Val
100 105 110
Gln Asp Ile Phe Asn Tyr Ile Tyr Ser Met Asp Glu Asn Leu Glu Phe
115 120 125
His Ile Lys Val Ser Tyr Phe Glu Ile Tyr Leu Asp Lys Ile Arg Asp
130 135 140
Leu Leu Asp Val Ser Lys Thr Asn Leu Ser Val His Glu Asp Lys Asn
145 150 155 160
Arg Val Pro Tyr Val Lys Gly Cys Thr Glu Arg Phe Val Cys Ser Pro
165 170 175
Asp Glu Val Met Asp Thr Ile Asp Glu Gly Lys Ser Asn Arg His Val
180 185 190
Ala Val Thr Asn Met Asn Glu His Ser Ser Arg Ser His Ser Ile Phe
195 200 205
Leu Ile Asn Val Lys Gln Glu Asn Thr Gln Thr Glu Gln Lys Leu Ser
210 215 220
Gly Lys Leu Tyr Leu Val Asp Leu Ala Gly Ser Glu Lys Val Ser Lys
225 230 235 240
Thr Gly Ala Glu Gly Ala Val Leu Asp Glu Ala Lys Asn Ile Asn Lys
245 250 255
Ser Leu Ser Ala Leu Gly Asn Val Ile Ser Ala Leu Ala Glu Gly Ser
260 265 270
Thr Tyr Val Pro Tyr Arg Asp Ser Lys Met Thr Arg Ile Leu Gln Asp
275 280 285
Ser Leu Gly Gly Asn Cys Arg Thr Thr Ile Val Ile Cys Cys Ser Pro
290 295 300
Ser Ser Tyr Asn Glu Ser Glu Thr Lys Ser Thr Leu Leu Phe Gly Gln
305 310 315 320
Arg Ala Lys Thr Ile Lys Asn Thr Val Cys Val Asn Val Glu Leu Thr
325 330 335
Ala Glu Gln Trp Lys Lys Lys Tyr Glu Lys Glu Lys Glu Lys Asn Lys
340 345 350
Ile Leu Arg Asn Thr Ile Gln Trp Leu Glu Asn Glu Leu Asn Arg Trp
355 360 365
Arg Asn Gly Glu Thr Val Pro Ile Asp Glu Gln Phe Asp Lys Glu Lys
370 375 380
Ala Asn Leu Glu Ala Phe Thr Val Asp Lys Asp Ile Thr Leu Thr Asn
385 390 395 400
Asp Lys Pro Ala Thr Ala Ile Gly Val Ile Gly Asn Phe Thr Asp Ala
405 410 415
Glu Arg Arg Lys Cys Glu Glu Glu Ile Ala Lys Leu Tyr Lys Gln Leu
420 425 430
Asp Asp Lys Asp Glu Glu Ile Asn Gln Gln Ser Gln Leu Val Glu Lys
435 440 445
Leu Lys Thr Gln Met Leu Asp Gln Glu Glu Leu Leu Ala Ser Thr Arg
450 455 460
Arg Asp Gln Asp Asn Met Gln Ala Glu Leu Asn Arg Leu Gln Ala Glu
465 470 475 480
Asn Asp Ala Ser Lys Glu Glu Val Lys Glu Val Leu Gln Ala Leu Glu
485 490 495
Glu Leu Ala Val Asn Tyr Asp Gln Lys Ser Gln Glu Val Glu Asp Lys
500 505 510
Thr Lys Glu Tyr Glu Leu Leu Ser Asp Glu Leu Asn Gln Lys Ser Ala
515 520 525
Thr Leu Ala Ser Ile Asp Ala Glu Leu Gln Lys Leu Lys Glu Met Thr
530 535 540
Asn His Gln Lys Lys Arg Ala Ala Glu Met Met Ala Ser Leu Leu Lys
545 550 555 560
Asp Leu Ala Glu Ile Gly Ile Ala Val Gly Asn Asn Asp Val Lys Gln
565 570 575
Pro Glu Gly Thr Gly Met Ile Asp Glu Glu Phe Thr Val Ala Arg Leu
580 585 590
Tyr Ile Ser Lys Met Lys Ser Glu Val Lys Thr Met Val Lys Arg Cys
595 600 605
Lys Gln Leu Glu Ser Thr Gln Thr Glu Ser Asn Lys Lys Met Glu Glu
610 615 620
Asn Glu Lys Glu Leu Ala Ala Cys Gln Leu Arg Ile Ser Gln Glu Asp
625 630 635 640
Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr Leu
645 650 655
Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His Leu
660 665 670
Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys Glu
675 680 685
Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn Val
690 695 700
Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala Cys
705 710 715 720
Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr Gly
725 730 735
Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly Tyr
740 745 750
Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro Asp
755 760 765
Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln Ile
770 775 780
Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg Asp
785 790 795 800
Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys Ile
805 810 815
Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr Val
820 825 830
Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu Ser
835 840 845
Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe Gly
850 855 860
Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro Gly
865 870 875 880
Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg Met
885 890 895
Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu Gln
900 905 910
Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile Ser
915 920 925
Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp Leu
930 935 940
Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu Ser
945 950 955 960
Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro Arg
965 970 975
Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Arg Ile Ser
980 985 990
His Ala Phe Thr Arg Phe
995
<210> 8
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion region of KIF5B-RETc fusion protein wherein the KIF5B
domain is derived from NM_020630
<400> 8
Cys Gln Leu Arg Ile Ser Gln Glu Asp Pro Lys Trp Glu Phe
1 5 10
<210> 9
<211> 2934
<212> DNA
<213> Artificial Sequence
<220>
<223> KIF5B-RETa variant (LC-S2) fusion gene
<400> 9
atggcggacc tggccgagtg caacatcaaa gtgatgtgtc gcttcagacc tctcaacgag 60
tctgaagtga accgcggcga caagtacatc gccaagtttc agggagaaga cacggtcgtg 120
atcgcgtcca agccttatgc atttgatcgg gtgttccagt caagcacatc tcaagagcaa 180
gtgtataatg actgtgcaaa gaagattgtt aaagatgtac ttgaaggata taatggaaca 240
atatttgcat atggacaaac atcctctggg aagacacaca caatggaggg taaacttcat 300
gatccagaag gcatgggaat tattccaaga atagtgcaag atatttttaa ttatatttac 360
tccatggatg aaaatttgga atttcatatt aaggtttcat attttgaaat atatttggat 420
aagataaggg acctgttaga tgtttcaaag accaaccttt cagttcatga agacaaaaac 480
cgagttccct atgtaaaggg gtgcacagag cgttttgtat gtagtccaga tgaagttatg 540
gataccatag atgaaggaaa atccaacaga catgtagcag ttacaaatat gaatgaacat 600
agctctagga gtcacagtat atttcttatt aatgtcaaac aagagaacac acaaacggaa 660
caaaagctga gtggaaaact ttatctggtt gatttagctg gtagtgaaaa ggttagtaaa 720
actggagctg aaggtgctgt gctggatgaa gctaaaaaca tcaacaagtc actttctgct 780
cttggaaatg ttatttctgc tttggctgag ggtagtacat atgttccata tcgagatagt 840
aaaatgacaa gaatccttca agattcatta ggtggcaact gtagaaccac tattgtaatt 900
tgctgctctc catcatcata caatgagtct gaaacaaaat ctacactctt atttggccaa 960
agggccaaaa caattaagaa cacagtttgt gtcaatgtgg agttaactgc agaacagtgg 1020
aaaaagaagt atgaaaaaga aaaagaaaaa aataagatcc tgcggaacac tattcagtgg 1080
cttgaaaatg agctcaacag atggcgtaat ggggagacgg tgcctattga tgaacagttt 1140
gacaaagaga aagccaactt ggaagctttc acagtggata aagatattac tcttaccaat 1200
gataaaccag caaccgcaat tggagttata ggaaatttta ctgatgctga aagaagaaag 1260
tgtgaagaag aaattgctaa attatacaaa cagcttgatg acaaggatga agaaattaac 1320
cagcaaagtc aactggtaga gaaactgaag acgcaaatgt tggatcagga ggagcttttg 1380
gcatctacca gaagggatca agacaatatg caagctgagc tgaatcgcct tcaagcagaa 1440
aatgatgcct ctaaagaaga agtgaaagaa gttttacagg ccctagaaga acttgctgtc 1500
aattatgatc agaagtctca ggaagttgaa gacaaaacta aggaatatga attgcttagt 1560
gatgaattga atcagaaatc ggcaacttta gcgagtatag atgctgagct tcagaaactt 1620
aaggaaatga ccaaccacca gaaaaaacga gcagctgaga tgatggcatc tttactaaaa 1680
gaccttgcag aaataggaat tgctgtggga aataatgatg taaaggagga tccaaagtgg 1740
gaattccctc ggaagaactt ggttcttgga aaaactctag gagaaggcga atttggaaaa 1800
gtggtcaagg caacggcctt ccatctgaaa ggcagagcag ggtacaccac ggtggccgtg 1860
aagatgctga aagagaacgc ctccccgagt gagctgcgag acctgctgtc agagttcaac 1920
gtcctgaagc aggtcaacca cccacatgtc atcaaattgt atggggcctg cagccaggat 1980
ggcccgctcc tcctcatcgt ggagtacgcc aaatacggct ccctgcgggg cttcctccgc 2040
gagagccgca aagtggggcc tggctacctg ggcagtggag gcagccgcaa ctccagctcc 2100
ctggaccacc cggatgagcg ggccctcacc atgggcgacc tcatctcatt tgcctggcag 2160
atctcacagg ggatgcagta tctggccgag atgaagctcg ttcatcggga cttggcagcc 2220
agaaacatcc tggtagctga ggggcggaag atgaagattt cggatttcgg cttgtcccga 2280
gatgtttatg aagaggattc ctacgtgaag aggagccagg gtcggattcc agttaaatgg 2340
atggcaattg aatccctttt tgatcatatc tacaccacgc aaagtgatgt atggtctttt 2400
ggtgtcctgc tgtgggagat cgtgacccta gggggaaacc cctatcctgg gattcctcct 2460
gagcggctct tcaaccttct gaagaccggc caccggatgg agaggccaga caactgcagc 2520
gaggagatgt accgcctgat gctgcaatgc tggaagcagg agccggacaa aaggccggtg 2580
tttgcggaca tcagcaaaga cctggagaag atgatggtta agaggagaga ctacttggac 2640
cttgcggcgt ccactccatc tgactccctg atttatgacg acggcctctc agaggaggag 2700
acaccgctgg tggactgtaa taatgccccc ctccctcgag ccctcccttc cacatggatt 2760
gaaaacaaac tctatggcat gtcagacccg aactggcctg gagagagtcc tgtaccactc 2820
acgagagctg atggcactaa cactgggttt ccaagatatc caaatgatag tgtatatgct 2880
aactggatgc tttcaccctc agcggcaaaa ttaatggaca cgtttgatag ttaa 2934
<210> 10
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Fusion region of KIF5B-RETa variant (LC-S2) fusion gene
<400> 10
gtgggaaata atgatgtaaa ggaggatcca aagtgggaat tc 42
<210> 11
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> KIF5B-RETa variant (LC-S2) fusion protein
<400> 11
Met Ala Asp Leu Ala Glu Cys Asn Ile Lys Val Met Cys Arg Phe Arg
1 5 10 15
Pro Leu Asn Glu Ser Glu Val Asn Arg Gly Asp Lys Tyr Ile Ala Lys
20 25 30
Phe Gln Gly Glu Asp Thr Val Val Ile Ala Ser Lys Pro Tyr Ala Phe
35 40 45
Asp Arg Val Phe Gln Ser Ser Thr Ser Gln Glu Gln Val Tyr Asn Asp
50 55 60
Cys Ala Lys Lys Ile Val Lys Asp Val Leu Glu Gly Tyr Asn Gly Thr
65 70 75 80
Ile Phe Ala Tyr Gly Gln Thr Ser Ser Gly Lys Thr His Thr Met Glu
85 90 95
Gly Lys Leu His Asp Pro Glu Gly Met Gly Ile Ile Pro Arg Ile Val
100 105 110
Gln Asp Ile Phe Asn Tyr Ile Tyr Ser Met Asp Glu Asn Leu Glu Phe
115 120 125
His Ile Lys Val Ser Tyr Phe Glu Ile Tyr Leu Asp Lys Ile Arg Asp
130 135 140
Leu Leu Asp Val Ser Lys Thr Asn Leu Ser Val His Glu Asp Lys Asn
145 150 155 160
Arg Val Pro Tyr Val Lys Gly Cys Thr Glu Arg Phe Val Cys Ser Pro
165 170 175
Asp Glu Val Met Asp Thr Ile Asp Glu Gly Lys Ser Asn Arg His Val
180 185 190
Ala Val Thr Asn Met Asn Glu His Ser Ser Arg Ser His Ser Ile Phe
195 200 205
Leu Ile Asn Val Lys Gln Glu Asn Thr Gln Thr Glu Gln Lys Leu Ser
210 215 220
Gly Lys Leu Tyr Leu Val Asp Leu Ala Gly Ser Glu Lys Val Ser Lys
225 230 235 240
Thr Gly Ala Glu Gly Ala Val Leu Asp Glu Ala Lys Asn Ile Asn Lys
245 250 255
Ser Leu Ser Ala Leu Gly Asn Val Ile Ser Ala Leu Ala Glu Gly Ser
260 265 270
Thr Tyr Val Pro Tyr Arg Asp Ser Lys Met Thr Arg Ile Leu Gln Asp
275 280 285
Ser Leu Gly Gly Asn Cys Arg Thr Thr Ile Val Ile Cys Cys Ser Pro
290 295 300
Ser Ser Tyr Asn Glu Ser Glu Thr Lys Ser Thr Leu Leu Phe Gly Gln
305 310 315 320
Arg Ala Lys Thr Ile Lys Asn Thr Val Cys Val Asn Val Glu Leu Thr
325 330 335
Ala Glu Gln Trp Lys Lys Lys Tyr Glu Lys Glu Lys Glu Lys Asn Lys
340 345 350
Ile Leu Arg Asn Thr Ile Gln Trp Leu Glu Asn Glu Leu Asn Arg Trp
355 360 365
Arg Asn Gly Glu Thr Val Pro Ile Asp Glu Gln Phe Asp Lys Glu Lys
370 375 380
Ala Asn Leu Glu Ala Phe Thr Val Asp Lys Asp Ile Thr Leu Thr Asn
385 390 395 400
Asp Lys Pro Ala Thr Ala Ile Gly Val Ile Gly Asn Phe Thr Asp Ala
405 410 415
Glu Arg Arg Lys Cys Glu Glu Glu Ile Ala Lys Leu Tyr Lys Gln Leu
420 425 430
Asp Asp Lys Asp Glu Glu Ile Asn Gln Gln Ser Gln Leu Val Glu Lys
435 440 445
Leu Lys Thr Gln Met Leu Asp Gln Glu Glu Leu Leu Ala Ser Thr Arg
450 455 460
Arg Asp Gln Asp Asn Met Gln Ala Glu Leu Asn Arg Leu Gln Ala Glu
465 470 475 480
Asn Asp Ala Ser Lys Glu Glu Val Lys Glu Val Leu Gln Ala Leu Glu
485 490 495
Glu Leu Ala Val Asn Tyr Asp Gln Lys Ser Gln Glu Val Glu Asp Lys
500 505 510
Thr Lys Glu Tyr Glu Leu Leu Ser Asp Glu Leu Asn Gln Lys Ser Ala
515 520 525
Thr Leu Ala Ser Ile Asp Ala Glu Leu Gln Lys Leu Lys Glu Met Thr
530 535 540
Asn His Gln Lys Lys Arg Ala Ala Glu Met Met Ala Ser Leu Leu Lys
545 550 555 560
Asp Leu Ala Glu Ile Gly Ile Ala Val Gly Asn Asn Asp Val Lys Glu
565 570 575
Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys Thr
580 585 590
Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe His
595 600 605
Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu Lys
610 615 620
Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe Asn
625 630 635 640
Val Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly Ala
645 650 655
Cys Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys Tyr
660 665 670
Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro Gly
675 680 685
Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His Pro
690 695 700
Asp Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp Gln
705 710 715 720
Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His Arg
725 730 735
Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met Lys
740 745 750
Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser Tyr
755 760 765
Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile Glu
770 775 780
Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser Phe
785 790 795 800
Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr Pro
805 810 815
Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His Arg
820 825 830
Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met Leu
835 840 845
Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp Ile
850 855 860
Ser Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu Asp
865 870 875 880
Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly Leu
885 890 895
Ser Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu Pro
900 905 910
Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met Ser
915 920 925
Asp Pro Asn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala Asp
930 935 940
Gly Thr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr Ala
945 950 955 960
Asn Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe Asp
965 970 975
Ser
<210> 12
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion region of KIF5B-RETa variant (LC-S2) fusion protein
<400> 12
Val Gly Asn Asn Asp Val Lys Glu Asp Pro Lys Trp Glu Phe
1 5 10
<210> 13
<211> 3753
<212> DNA
<213> Artificial Sequence
<220>
<223> KIF5B-RETa variant (LC-S6) fusion gene
<400> 13
atggcggacc tggccgagtg caacatcaaa gtgatgtgtc gcttcagacc tctcaacgag 60
tctgaagtga accgcggcga caagtacatc gccaagtttc agggagaaga cacggtcgtg 120
atcgcgtcca agccttatgc atttgatcgg gtgttccagt caagcacatc tcaagagcaa 180
gtgtataatg actgtgcaaa gaagattgtt aaagatgtac ttgaaggata taatggaaca 240
atatttgcat atggacaaac atcctctggg aagacacaca caatggaggg taaacttcat 300
gatccagaag gcatgggaat tattccaaga atagtgcaag atatttttaa ttatatttac 360
tccatggatg aaaatttgga atttcatatt aaggtttcat attttgaaat atatttggat 420
aagataaggg acctgttaga tgtttcaaag accaaccttt cagttcatga agacaaaaac 480
cgagttccct atgtaaaggg gtgcacagag cgttttgtat gtagtccaga tgaagttatg 540
gataccatag atgaaggaaa atccaacaga catgtagcag ttacaaatat gaatgaacat 600
agctctagga gtcacagtat atttcttatt aatgtcaaac aagagaacac acaaacggaa 660
caaaagctga gtggaaaact ttatctggtt gatttagctg gtagtgaaaa ggttagtaaa 720
actggagctg aaggtgctgt gctggatgaa gctaaaaaca tcaacaagtc actttctgct 780
cttggaaatg ttatttctgc tttggctgag ggtagtacat atgttccata tcgagatagt 840
aaaatgacaa gaatccttca agattcatta ggtggcaact gtagaaccac tattgtaatt 900
tgctgctctc catcatcata caatgagtct gaaacaaaat ctacactctt atttggccaa 960
agggccaaaa caattaagaa cacagtttgt gtcaatgtgg agttaactgc agaacagtgg 1020
aaaaagaagt atgaaaaaga aaaagaaaaa aataagatcc tgcggaacac tattcagtgg 1080
cttgaaaatg agctcaacag atggcgtaat ggggagacgg tgcctattga tgaacagttt 1140
gacaaagaga aagccaactt ggaagctttc acagtggata aagatattac tcttaccaat 1200
gataaaccag caaccgcaat tggagttata ggaaatttta ctgatgctga aagaagaaag 1260
tgtgaagaag aaattgctaa attatacaaa cagcttgatg acaaggatga agaaattaac 1320
cagcaaagtc aactggtaga gaaactgaag acgcaaatgt tggatcagga ggagcttttg 1380
gcatctacca gaagggatca agacaatatg caagctgagc tgaatcgcct tcaagcagaa 1440
aatgatgcct ctaaagaaga agtgaaagaa gttttacagg ccctagaaga acttgctgtc 1500
aattatgatc agaagtctca ggaagttgaa gacaaaacta aggaatatga attgcttagt 1560
gatgaattga atcagaaatc ggcaacttta gcgagtatag atgctgagct tcagaaactt 1620
aaggaaatga ccaaccacca gaaaaaacga gcagctgaga tgatggcatc tttactaaaa 1680
gaccttgcag aaataggaat tgctgtggga aataatgatg taaagcagcc tgagggaact 1740
ggcatgatag atgaagagtt cactgttgca agactctaca ttagcaaaat gaagtcagaa 1800
gtaaaaacca tggtgaaacg ttgcaagcag ttagaaagca cacaaactga gagcaacaaa 1860
aaaatggaag aaaatgaaaa ggagttagca gcatgtcagc ttcgtatctc tcaacatgaa 1920
gccaaaatca agtcattgac tgaatacctt caaaatgtgg aacaaaagaa aagacagttg 1980
gaggaatctg tcgatgccct cagtgaagaa ctagtccagc ttcgagcaca agagaaagtc 2040
catgaaatgg aaaaggagca cttaaataag gttcagactg caaatgaagt taagcaagct 2100
gttgaacagc agatccagag ccatagagaa actcatcaaa aacagatcag tagtttgaga 2160
gatgaagtag aagcaaaagc aaaacttatt actgatcttc aagaccaaaa ccagaaaatg 2220
atgttagagc aggaacgtct aagagtagaa catgagaagt tgaaagccac agatcaggaa 2280
aagagcagaa aactacatga acttacggtt atgcaagata gacgagaaca agcaagacaa 2340
gacttgaagg gtttggaaga gacagtggca aaagaacttc agactttaca caacctgcgc 2400
aaactctttg ttcaggacct ggctacaaga gttaaaaaga gtgctgagat tgattctgat 2460
gacaccggag gcagcgctgc tcagaagcaa aaaatctcct ttcttgaaaa taatcttgaa 2520
cagctcacta aagtgcacaa acaggaggat ccaaagtggg aattccctcg gaagaacttg 2580
gttcttggaa aaactctagg agaaggcgaa tttggaaaag tggtcaaggc aacggccttc 2640
catctgaaag gcagagcagg gtacaccacg gtggccgtga agatgctgaa agagaacgcc 2700
tccccgagtg agctgcgaga cctgctgtca gagttcaacg tcctgaagca ggtcaaccac 2760
ccacatgtca tcaaattgta tggggcctgc agccaggatg gcccgctcct cctcatcgtg 2820
gagtacgcca aatacggctc cctgcggggc ttcctccgcg agagccgcaa agtggggcct 2880
ggctacctgg gcagtggagg cagccgcaac tccagctccc tggaccaccc ggatgagcgg 2940
gccctcacca tgggcgacct catctcattt gcctggcaga tctcacaggg gatgcagtat 3000
ctggccgaga tgaagctcgt tcatcgggac ttggcagcca gaaacatcct ggtagctgag 3060
gggcggaaga tgaagatttc ggatttcggc ttgtcccgag atgtttatga agaggattcc 3120
tacgtgaaga ggagccaggg tcggattcca gttaaatgga tggcaattga atcccttttt 3180
gatcatatct acaccacgca aagtgatgta tggtcttttg gtgtcctgct gtgggagatc 3240
gtgaccctag ggggaaaccc ctatcctggg attcctcctg agcggctctt caaccttctg 3300
aagaccggcc accggatgga gaggccagac aactgcagcg aggagatgta ccgcctgatg 3360
ctgcaatgct ggaagcagga gccggacaaa aggccggtgt ttgcggacat cagcaaagac 3420
ctggagaaga tgatggttaa gaggagagac tacttggacc ttgcggcgtc cactccatct 3480
gactccctga tttatgacga cggcctctca gaggaggaga caccgctggt ggactgtaat 3540
aatgcccccc tccctcgagc cctcccttcc acatggattg aaaacaaact ctatggcatg 3600
tcagacccga actggcctgg agagagtcct gtaccactca cgagagctga tggcactaac 3660
actgggtttc caagatatcc aaatgatagt gtatatgcta actggatgct ttcaccctca 3720
gcggcaaaat taatggacac gtttgatagt taa 3753
<210> 14
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Fusion region of KIF5B-RETa variant (LC-S6) fusion gene
<400> 14
ctcactaaag tgcacaaaca ggaggatcca aagtgggaat tc 42
<210> 15
<211> 1250
<212> PRT
<213> Artificial Sequence
<220>
<223> KIF5B-RETa variant (LC-S6) fusion protein
<400> 15
Met Ala Asp Leu Ala Glu Cys Asn Ile Lys Val Met Cys Arg Phe Arg
1 5 10 15
Pro Leu Asn Glu Ser Glu Val Asn Arg Gly Asp Lys Tyr Ile Ala Lys
20 25 30
Phe Gln Gly Glu Asp Thr Val Val Ile Ala Ser Lys Pro Tyr Ala Phe
35 40 45
Asp Arg Val Phe Gln Ser Ser Thr Ser Gln Glu Gln Val Tyr Asn Asp
50 55 60
Cys Ala Lys Lys Ile Val Lys Asp Val Leu Glu Gly Tyr Asn Gly Thr
65 70 75 80
Ile Phe Ala Tyr Gly Gln Thr Ser Ser Gly Lys Thr His Thr Met Glu
85 90 95
Gly Lys Leu His Asp Pro Glu Gly Met Gly Ile Ile Pro Arg Ile Val
100 105 110
Gln Asp Ile Phe Asn Tyr Ile Tyr Ser Met Asp Glu Asn Leu Glu Phe
115 120 125
His Ile Lys Val Ser Tyr Phe Glu Ile Tyr Leu Asp Lys Ile Arg Asp
130 135 140
Leu Leu Asp Val Ser Lys Thr Asn Leu Ser Val His Glu Asp Lys Asn
145 150 155 160
Arg Val Pro Tyr Val Lys Gly Cys Thr Glu Arg Phe Val Cys Ser Pro
165 170 175
Asp Glu Val Met Asp Thr Ile Asp Glu Gly Lys Ser Asn Arg His Val
180 185 190
Ala Val Thr Asn Met Asn Glu His Ser Ser Arg Ser His Ser Ile Phe
195 200 205
Leu Ile Asn Val Lys Gln Glu Asn Thr Gln Thr Glu Gln Lys Leu Ser
210 215 220
Gly Lys Leu Tyr Leu Val Asp Leu Ala Gly Ser Glu Lys Val Ser Lys
225 230 235 240
Thr Gly Ala Glu Gly Ala Val Leu Asp Glu Ala Lys Asn Ile Asn Lys
245 250 255
Ser Leu Ser Ala Leu Gly Asn Val Ile Ser Ala Leu Ala Glu Gly Ser
260 265 270
Thr Tyr Val Pro Tyr Arg Asp Ser Lys Met Thr Arg Ile Leu Gln Asp
275 280 285
Ser Leu Gly Gly Asn Cys Arg Thr Thr Ile Val Ile Cys Cys Ser Pro
290 295 300
Ser Ser Tyr Asn Glu Ser Glu Thr Lys Ser Thr Leu Leu Phe Gly Gln
305 310 315 320
Arg Ala Lys Thr Ile Lys Asn Thr Val Cys Val Asn Val Glu Leu Thr
325 330 335
Ala Glu Gln Trp Lys Lys Lys Tyr Glu Lys Glu Lys Glu Lys Asn Lys
340 345 350
Ile Leu Arg Asn Thr Ile Gln Trp Leu Glu Asn Glu Leu Asn Arg Trp
355 360 365
Arg Asn Gly Glu Thr Val Pro Ile Asp Glu Gln Phe Asp Lys Glu Lys
370 375 380
Ala Asn Leu Glu Ala Phe Thr Val Asp Lys Asp Ile Thr Leu Thr Asn
385 390 395 400
Asp Lys Pro Ala Thr Ala Ile Gly Val Ile Gly Asn Phe Thr Asp Ala
405 410 415
Glu Arg Arg Lys Cys Glu Glu Glu Ile Ala Lys Leu Tyr Lys Gln Leu
420 425 430
Asp Asp Lys Asp Glu Glu Ile Asn Gln Gln Ser Gln Leu Val Glu Lys
435 440 445
Leu Lys Thr Gln Met Leu Asp Gln Glu Glu Leu Leu Ala Ser Thr Arg
450 455 460
Arg Asp Gln Asp Asn Met Gln Ala Glu Leu Asn Arg Leu Gln Ala Glu
465 470 475 480
Asn Asp Ala Ser Lys Glu Glu Val Lys Glu Val Leu Gln Ala Leu Glu
485 490 495
Glu Leu Ala Val Asn Tyr Asp Gln Lys Ser Gln Glu Val Glu Asp Lys
500 505 510
Thr Lys Glu Tyr Glu Leu Leu Ser Asp Glu Leu Asn Gln Lys Ser Ala
515 520 525
Thr Leu Ala Ser Ile Asp Ala Glu Leu Gln Lys Leu Lys Glu Met Thr
530 535 540
Asn His Gln Lys Lys Arg Ala Ala Glu Met Met Ala Ser Leu Leu Lys
545 550 555 560
Asp Leu Ala Glu Ile Gly Ile Ala Val Gly Asn Asn Asp Val Lys Gln
565 570 575
Pro Glu Gly Thr Gly Met Ile Asp Glu Glu Phe Thr Val Ala Arg Leu
580 585 590
Tyr Ile Ser Lys Met Lys Ser Glu Val Lys Thr Met Val Lys Arg Cys
595 600 605
Lys Gln Leu Glu Ser Thr Gln Thr Glu Ser Asn Lys Lys Met Glu Glu
610 615 620
Asn Glu Lys Glu Leu Ala Ala Cys Gln Leu Arg Ile Ser Gln His Glu
625 630 635 640
Ala Lys Ile Lys Ser Leu Thr Glu Tyr Leu Gln Asn Val Glu Gln Lys
645 650 655
Lys Arg Gln Leu Glu Glu Ser Val Asp Ala Leu Ser Glu Glu Leu Val
660 665 670
Gln Leu Arg Ala Gln Glu Lys Val His Glu Met Glu Lys Glu His Leu
675 680 685
Asn Lys Val Gln Thr Ala Asn Glu Val Lys Gln Ala Val Glu Gln Gln
690 695 700
Ile Gln Ser His Arg Glu Thr His Gln Lys Gln Ile Ser Ser Leu Arg
705 710 715 720
Asp Glu Val Glu Ala Lys Ala Lys Leu Ile Thr Asp Leu Gln Asp Gln
725 730 735
Asn Gln Lys Met Met Leu Glu Gln Glu Arg Leu Arg Val Glu His Glu
740 745 750
Lys Leu Lys Ala Thr Asp Gln Glu Lys Ser Arg Lys Leu His Glu Leu
755 760 765
Thr Val Met Gln Asp Arg Arg Glu Gln Ala Arg Gln Asp Leu Lys Gly
770 775 780
Leu Glu Glu Thr Val Ala Lys Glu Leu Gln Thr Leu His Asn Leu Arg
785 790 795 800
Lys Leu Phe Val Gln Asp Leu Ala Thr Arg Val Lys Lys Ser Ala Glu
805 810 815
Ile Asp Ser Asp Asp Thr Gly Gly Ser Ala Ala Gln Lys Gln Lys Ile
820 825 830
Ser Phe Leu Glu Asn Asn Leu Glu Gln Leu Thr Lys Val His Lys Gln
835 840 845
Glu Asp Pro Lys Trp Glu Phe Pro Arg Lys Asn Leu Val Leu Gly Lys
850 855 860
Thr Leu Gly Glu Gly Glu Phe Gly Lys Val Val Lys Ala Thr Ala Phe
865 870 875 880
His Leu Lys Gly Arg Ala Gly Tyr Thr Thr Val Ala Val Lys Met Leu
885 890 895
Lys Glu Asn Ala Ser Pro Ser Glu Leu Arg Asp Leu Leu Ser Glu Phe
900 905 910
Asn Val Leu Lys Gln Val Asn His Pro His Val Ile Lys Leu Tyr Gly
915 920 925
Ala Cys Ser Gln Asp Gly Pro Leu Leu Leu Ile Val Glu Tyr Ala Lys
930 935 940
Tyr Gly Ser Leu Arg Gly Phe Leu Arg Glu Ser Arg Lys Val Gly Pro
945 950 955 960
Gly Tyr Leu Gly Ser Gly Gly Ser Arg Asn Ser Ser Ser Leu Asp His
965 970 975
Pro Asp Glu Arg Ala Leu Thr Met Gly Asp Leu Ile Ser Phe Ala Trp
980 985 990
Gln Ile Ser Gln Gly Met Gln Tyr Leu Ala Glu Met Lys Leu Val His
995 1000 1005
Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Ala Glu Gly Arg Lys Met
1010 1015 1020
Lys Ile Ser Asp Phe Gly Leu Ser Arg Asp Val Tyr Glu Glu Asp Ser
1025 1030 1035 1040
Tyr Val Lys Arg Ser Gln Gly Arg Ile Pro Val Lys Trp Met Ala Ile
1045 1050 1055
Glu Ser Leu Phe Asp His Ile Tyr Thr Thr Gln Ser Asp Val Trp Ser
1060 1065 1070
Phe Gly Val Leu Leu Trp Glu Ile Val Thr Leu Gly Gly Asn Pro Tyr
1075 1080 1085
Pro Gly Ile Pro Pro Glu Arg Leu Phe Asn Leu Leu Lys Thr Gly His
1090 1095 1100
Arg Met Glu Arg Pro Asp Asn Cys Ser Glu Glu Met Tyr Arg Leu Met
1105 1110 1115 1120
Leu Gln Cys Trp Lys Gln Glu Pro Asp Lys Arg Pro Val Phe Ala Asp
1125 1130 1135
Ile Ser Lys Asp Leu Glu Lys Met Met Val Lys Arg Arg Asp Tyr Leu
1140 1145 1150
Asp Leu Ala Ala Ser Thr Pro Ser Asp Ser Leu Ile Tyr Asp Asp Gly
1155 1160 1165
Leu Ser Glu Glu Glu Thr Pro Leu Val Asp Cys Asn Asn Ala Pro Leu
1170 1175 1180
Pro Arg Ala Leu Pro Ser Thr Trp Ile Glu Asn Lys Leu Tyr Gly Met
1185 1190 1195 1200
Ser Asp Pro Asn Trp Pro Gly Glu Ser Pro Val Pro Leu Thr Arg Ala
1205 1210 1215
Asp Gly Thr Asn Thr Gly Phe Pro Arg Tyr Pro Asn Asp Ser Val Tyr
1220 1225 1230
Ala Asn Trp Met Leu Ser Pro Ser Ala Ala Lys Leu Met Asp Thr Phe
1235 1240 1245
Asp Ser
1250
<210> 16
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion region of KIF5B-RETa variant (LC-S6) fusion protein
<400> 16
Leu Thr Lys Val His Lys Gln Glu Asp Pro Lys Trp Glu Phe
1 5 10
<210> 17
<211> 310
<212> PRT
<213> Artificial Sequence
<220>
<223> coiled coil domain of KIF5B protein encoded by NM_004521
<400> 17
Val Cys Val Asn Val Glu Leu Thr Ala Glu Gln Trp Lys Lys Lys Tyr
1 5 10 15
Glu Lys Glu Lys Glu Lys Asn Lys Ile Leu Arg Asn Thr Ile Gln Trp
20 25 30
Leu Glu Asn Glu Leu Asn Arg Trp Arg Asn Gly Glu Thr Val Pro Ile
35 40 45
Asp Glu Gln Phe Asp Lys Glu Lys Ala Asn Leu Glu Ala Phe Thr Val
50 55 60
Asp Lys Asp Ile Thr Leu Thr Asn Asp Lys Pro Ala Thr Ala Ile Gly
65 70 75 80
Val Ile Gly Asn Phe Thr Asp Ala Glu Arg Arg Lys Cys Glu Glu Glu
85 90 95
Ile Ala Lys Leu Tyr Lys Gln Leu Asp Asp Lys Asp Glu Glu Ile Asn
100 105 110
Gln Gln Ser Gln Leu Val Glu Lys Leu Lys Thr Gln Met Leu Asp Gln
115 120 125
Glu Glu Leu Leu Ala Ser Thr Arg Arg Asp Gln Asp Asn Met Gln Ala
130 135 140
Glu Leu Asn Arg Leu Gln Ala Glu Asn Asp Ala Ser Lys Glu Glu Val
145 150 155 160
Lys Glu Val Leu Gln Ala Leu Glu Glu Leu Ala Val Asn Tyr Asp Gln
165 170 175
Lys Ser Gln Glu Val Glu Asp Lys Thr Lys Glu Tyr Glu Leu Leu Ser
180 185 190
Asp Glu Leu Asn Gln Lys Ser Ala Thr Leu Ala Ser Ile Asp Ala Glu
195 200 205
Leu Gln Lys Leu Lys Glu Met Thr Asn His Gln Lys Lys Arg Ala Ala
210 215 220
Glu Met Met Ala Ser Leu Leu Lys Asp Leu Ala Glu Ile Gly Ile Ala
225 230 235 240
Val Gly Asn Asn Asp Val Lys Gln Pro Glu Gly Thr Gly Met Ile Asp
245 250 255
Glu Glu Phe Thr Val Ala Arg Leu Tyr Ile Ser Lys Met Lys Ser Glu
260 265 270
Val Lys Thr Met Val Lys Arg Cys Lys Gln Leu Glu Ser Thr Gln Thr
275 280 285
Glu Ser Asn Lys Lys Met Glu Glu Asn Glu Lys Glu Leu Ala Ala Cys
290 295 300
Gln Leu Arg Ile Ser Gln
305 310
<210> 18
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for detecting the inversion of Chromosome 10
<400> 18
cagaatttca caaggaggga ag 22
<210> 19
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for detecting the inversion of Chromosome 10
<400> 19
caggacctct gactacagtg ga 22
<210> 20
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> KIF5B primer for detecting the fusion gene KIF5B-RET derived from
AK55 and LC_S6
<400> 20
gtgaaacgtt gcaagcagtt ag 22
<210> 21
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> RET primer for detecting the fusion gene KIF5B-RET
<400> 21
ccttgaccac ttttccaaat tc 22
<210> 22
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> KIF5B primer for detecting the fusion protein KIF5B-RET derived
from LC_S2
<400> 22
taaggaaatg accaaccacc ag 22
Claims (22)
- N-말단 위치에 N-말단 도메인으로서 KIF5B 단백질 및 C-말단 위치에 C-말단 도메인으로서 RET 단백질(re-arranged during transfection proteain)을 필수적으로 포함하는, KIF5B-RET 융합단백질.
- 삭제
- 제1항에 있어서, 상기 N-말단 도메인으로서 KIF5B 단백질은, NM_004521의 폴리뉴클레오타이드에 의해 암호화되는 KIF5B 단백질의 1번째 아미노산부터 329번째 아미노산의 연속적인 적어도 329개 아미노산을 필수적으로 포함하는 것인, KIF5B-RET 융합단백질.
- 제1항에 있어서, 상기 N-말단 도메인으로서 KIF5B 단백질은, KIF5B 단백질의 329번째 아미노산부터 시작되는 2개 이상의 KIF5B 코일 도메인을 추가로 포함하는 것인, KIF5B-RET 융합단백질.
- 제1항에 있어서, 상기 N-말단 도메인으로서 KIF5B 단백질은, NM_004521의 폴리뉴클레오타이드의 1번째 엑손부터 16번째 엑손의 폴리뉴클레오타이드, 1번째 엑손부터 15번째 엑손의 폴리뉴클레오타이드, 또는 1번째 엑손부터 23번째 엑손의 폴리뉴클레오타이드에 의해 암호화되는 아미노산 서열을 필수적으로 포함하는 것인, KIF5B-RET 융합단백질.
- 제1항에 있어서, 상기 C-말단 도메인의로서 RET 단백질은, NM_020630 또는 NM_020975의 폴리뉴클레오타이드의 12번째 엑손의 1번째 아미노산부터 시작되어, NM_020630 또는 NM_020975의 폴리뉴클레오타이드에 의해 암호화되는 RET 단백질의 C-말단을 향하여, 연속적인 300개 이상의 아미노산을 필수적으로 포함하는 것인, KIF5B-RET 융합단백질.
- 제1항에 있어서, 상기 C-말단 도메인으로서 RET 단백질은, NM_020630 또는 NM_020975의 12번째 엑손의 시작점에 해당하는 아미노산부터 시작되어, NM_020630 또는 NM_020975의 폴리뉴클레오타이드에 의해 암호화되는 RET 단백질의 C-말단을 향하여, 연속적인 300 내지 450개의 아미노산을 필수적으로 포함하는 것인, KIF5B-RET 융합단백질.
- 제1항에 있어서, 상기 융합단백질은 서열번호 3, 7, 11 또는 15의 아미노산 서열로 이루어진 것인, KIF5B-RET 융합단백질.
- 제1항 및 제3항 내지 제8항 중 어느 한 항에 따른 KIF5B-RET 융합단백질을 암호화하는 융합유전자.
- 제9항에 있어서, 상기 융합유전자는 서열번호 1, 5, 9 또는 13의 뉴클레오타이드 서열로 이루어진 것인, 융합유전자.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항 및 제3항 내지 제8항 중 어느 한 항에 따른 KIF5B-RET 융합단백질을 발현하는 세포에 시료 화합물을 접촉시키는 단계; 및
세포 내 KIF5B-RET 융합단백질의 발현 수준을 측정하는 단계를 포함하며,
상기 시료 화합물을 처리한 세포 내 KIF5B-RET 융합단백질의 발현 수준이, 시료 화합물을 처리하기 전의 세포 또는 시료 화합물을 처리하지 않은 세포의 KIF5B-RET 융합단백질 발현 수준에 비해 감소한 경우, 상기 시료 화합물을 항암제 후보물질로 결정하는 것인,
항암제의 스크리닝 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161553483P | 2011-10-31 | 2011-10-31 | |
US61/553,483 | 2011-10-31 | ||
US13/663,565 | 2012-10-30 | ||
US13/663,565 US10023855B2 (en) | 2011-10-31 | 2012-10-30 | Fusion protein comprising C-terminal domain of RET protein and use thereof as a diagnosing marker |
PCT/KR2012/009056 WO2013066047A1 (en) | 2011-10-31 | 2012-10-31 | Fusion protein comprising c-terminal domain of ret protein and use thereof as a diagnosing marker |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167010433A Division KR101660235B1 (ko) | 2011-10-31 | 2012-10-31 | Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140092846A KR20140092846A (ko) | 2014-07-24 |
KR101625139B1 true KR101625139B1 (ko) | 2016-05-31 |
Family
ID=48192340
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167010433A KR101660235B1 (ko) | 2011-10-31 | 2012-10-31 | Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 |
KR1020147013826A KR101625139B1 (ko) | 2011-10-31 | 2012-10-31 | Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167010433A KR101660235B1 (ko) | 2011-10-31 | 2012-10-31 | Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10023855B2 (ko) |
EP (1) | EP2773673B1 (ko) |
JP (1) | JP6389124B2 (ko) |
KR (2) | KR101660235B1 (ko) |
WO (1) | WO2013066047A1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG2014012728A (en) | 2011-08-23 | 2014-06-27 | Foundation Medicine Inc | Novel kif5b-ret fusion molecules and uses thereof |
CN114129566A (zh) * | 2012-09-07 | 2022-03-04 | 埃克塞里艾克西斯公司 | 用于治疗肺腺癌的met、vegfr和ret的抑制剂 |
MY170904A (en) | 2012-09-25 | 2019-09-13 | Chugai Pharmaceutical Co Ltd | Ret inhibitor |
US10202365B2 (en) | 2015-02-06 | 2019-02-12 | Blueprint Medicines Corporation | 2-(pyridin-3-yl)-pyrimidine derivatives as RET inhibitors |
NZ742351A (en) | 2015-11-02 | 2023-03-31 | Blueprint Medicines Corp | Inhibitors of ret |
WO2017161269A1 (en) | 2016-03-17 | 2017-09-21 | Blueprint Medicines Corporation | Inhibitors of ret receptor tyrosine kinases |
US10227329B2 (en) | 2016-07-22 | 2019-03-12 | Blueprint Medicines Corporation | Compounds useful for treating disorders related to RET |
SG11202001212SA (en) * | 2017-08-21 | 2020-03-30 | Taiho Pharmaceutical Co Ltd | Fusion protein of dctn1 protein with ret protein |
CA3096043A1 (en) | 2018-04-03 | 2019-10-10 | Blueprint Medicines Corporation | Ret inhibitor for use in treating cancer having a ret alteration |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130137111A1 (en) * | 2010-07-26 | 2013-05-30 | Astellas Pharma Inc. | Detection method of novel ret fusion |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997044356A2 (en) | 1996-05-08 | 1997-11-27 | Biogen, Inc. | RET LIGAND (RetL) FOR STIMULATING NEURAL AND RENAL GROWTH |
AU2001281136A1 (en) | 2000-08-04 | 2002-02-18 | Board Of Regents, The University Of Texas System | Detection and diagnosis of smoking related cancers |
US20070212689A1 (en) | 2003-10-30 | 2007-09-13 | Bianchi Diana W | Prenatal Diagnosis Using Cell-Free Fetal DNA in Amniotic Fluid |
CA2624221A1 (en) | 2005-10-24 | 2007-05-03 | Takeda Pharmaceutical Company Limited | Preventives/remedies for cancer |
EP2067039A2 (en) | 2006-09-12 | 2009-06-10 | Novartis Forschungsstiftung, Zweigniederlassung Friedrich Miescher Institute for Biomedical Research | Non-neuroendocrine cancer therapy |
JP6032616B2 (ja) | 2011-08-04 | 2016-11-30 | 国立研究開発法人国立がん研究センター | Kif5b遺伝子とret遺伝子との融合遺伝子、並びに該融合遺伝子を標的としたがん治療の有効性を判定する方法 |
SG2014012728A (en) * | 2011-08-23 | 2014-06-27 | Foundation Medicine Inc | Novel kif5b-ret fusion molecules and uses thereof |
-
2012
- 2012-10-30 US US13/663,565 patent/US10023855B2/en active Active
- 2012-10-31 JP JP2014538724A patent/JP6389124B2/ja active Active
- 2012-10-31 KR KR1020167010433A patent/KR101660235B1/ko active IP Right Grant
- 2012-10-31 KR KR1020147013826A patent/KR101625139B1/ko active IP Right Grant
- 2012-10-31 EP EP12845116.8A patent/EP2773673B1/en active Active
- 2012-10-31 WO PCT/KR2012/009056 patent/WO2013066047A1/en active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130137111A1 (en) * | 2010-07-26 | 2013-05-30 | Astellas Pharma Inc. | Detection method of novel ret fusion |
Non-Patent Citations (3)
Title |
---|
Chmielecki J., et al., 38(20):pp.6985-6996 (2010. 6.29.)* |
Takeuchi K., et al., KIF5B-ALK, Clin Cancer Res 15(9):pp. 3143-3149 (2009. 5. 1.)* |
Tanizaki J., et al., British Journal of Cancer 105:pp.807-813 (2011. 8.16.)* |
Also Published As
Publication number | Publication date |
---|---|
WO2013066047A1 (en) | 2013-05-10 |
EP2773673A1 (en) | 2014-09-10 |
EP2773673B1 (en) | 2019-12-04 |
JP6389124B2 (ja) | 2018-09-12 |
KR20160052751A (ko) | 2016-05-12 |
US10023855B2 (en) | 2018-07-17 |
US20130116280A1 (en) | 2013-05-09 |
KR20140092846A (ko) | 2014-07-24 |
EP2773673A4 (en) | 2015-03-18 |
KR101660235B1 (ko) | 2016-09-27 |
JP2015504299A (ja) | 2015-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101625139B1 (ko) | Ret 단백질의 c-말단 도메인을 포함하는 융합단백질 및 이의 진단마커로의 용도 | |
US11920138B2 (en) | Fusion proteins and methods thereof | |
JP6871869B2 (ja) | 新規融合体及びその検出法 | |
JP7037836B2 (ja) | タンパク質キナーゼ阻害剤に対する感受性予測用バイオマーカー及びその用途 | |
AU2013337277B2 (en) | Novel NTRK1 fusion molecules and uses thereof | |
KR20150038267A (ko) | 융합 단백질 및 그의 방법 | |
WO2015064621A1 (ja) | 新規融合体及びその検出法 | |
JPWO2012014795A1 (ja) | 新規ret融合体の検出法 | |
US8962808B2 (en) | EGFR-related polypeptides and methods of use | |
ES2684548T3 (es) | Proteína de fusión que comprende AXL y composición para tratar el cáncer que comprende la misma | |
JP6858563B2 (ja) | Braf変異検出によるegfr阻害剤の効果予測 | |
CN110191897A (zh) | 用于预防暴露于诱导p38活化的癌症治疗的受试者的转移的治疗 | |
EP3778644A2 (en) | Fgfr-tacc fusion proteins and methods thereof | |
WO2013113942A2 (en) | Novel fusion genes in lung cancer | |
WO2017122816A1 (ja) | 新規融合体及びその検出法 | |
JP6806440B2 (ja) | 新規融合体及びその検出法 | |
Golenar | Oncogenic Activity of Met Receptor Tyrosine Kinase Exon 14 Deletion Variant | |
US20190062846A1 (en) | Compositions and methods for screening pediatric gliomas and methods of treatment thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
A107 | Divisional application of patent | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190515 Year of fee payment: 4 |