KR102267407B1 - Novel NTRK1 fusion gene as colon cancer marker and the uses thereof - Google Patents

Novel NTRK1 fusion gene as colon cancer marker and the uses thereof Download PDF

Info

Publication number
KR102267407B1
KR102267407B1 KR1020140143631A KR20140143631A KR102267407B1 KR 102267407 B1 KR102267407 B1 KR 102267407B1 KR 1020140143631 A KR1020140143631 A KR 1020140143631A KR 20140143631 A KR20140143631 A KR 20140143631A KR 102267407 B1 KR102267407 B1 KR 102267407B1
Authority
KR
South Korea
Prior art keywords
ntrk1
protein
gene
leu
colorectal cancer
Prior art date
Application number
KR1020140143631A
Other languages
Korean (ko)
Other versions
KR20150085459A (en
Inventor
박중훈
신은지
박옥구
박도윤
신나리
최찬
이재혁
권채화
Original Assignee
주식회사 엘지화학
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지화학 filed Critical 주식회사 엘지화학
Priority to PCT/KR2015/000372 priority Critical patent/WO2015108328A1/en
Publication of KR20150085459A publication Critical patent/KR20150085459A/en
Application granted granted Critical
Publication of KR102267407B1 publication Critical patent/KR102267407B1/en

Links

Images

Abstract

LMNA(Lamin A) 또는 TPM3(Tropomyosin 3)와 NTRK1(Neurotrophic Tyrosine Kinase, Receptor, Type 1)와의 융합단백질 및 이를 암호화하는 융합유전자 폴리뉴클레오티드에 관한 것이다. 또한, 상기 융합단백질, 상기 융합유전자, 또는 상기 융합유전자의 전사산물을 측정하는 제제를 포함하는 대장암 진단용 조성물 및 이를 포함하는 대장암 진단용 키트에 관한 것이다. 아울러, NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계를 포함하는 대장암 진단에 필요한 정보를 제공하는 방법 및 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법에 관한 것이다. 또한, NTRK1 융합유전자의 발현 수준을 측정하는 단계를 포함하는 대장암 치료제의 스크리닝 방법 및 NTRK1 융합단백질 저해제를 유효성분으로 포함하는 대장암의 예방 또는 치료용 약제학적 조성물에 관한 것이다. 본 발명에 따라 대장암에 특이적인 진단 마커를 제공함으로써, 정확한 대장암 진단을 가능하게 하며, 대장암 환자의 계층화를 통해 임상예후를 예측하는 것, 대장암에 대한 치료의 유효성을 예측하는 것, 특히 NTRK1 단백질 저해제에 의한 대장암 치료의 유효성을 예측하는 것이 가능해진다. 이에 따라, 약물을 투여하는 것이 유효하지 않다고 생각되는 대장암 환자에 대한 약물의 투여를 제한할 수 있으므로, 효율적이고 안전한 맞춤형 대장암 치료를 실현하는 것이 가능해진다.It relates to a fusion protein of LMNA (Lamin A) or TPM3 (Tropomyosin 3) and NTRK1 (Neurotrophic Tyrosine Kinase, Receptor, Type 1) and a fusion gene polynucleotide encoding the same. In addition, the present invention relates to a composition for diagnosing colon cancer comprising the fusion protein, the fusion gene, or an agent for measuring a transcript of the fusion gene, and a kit for diagnosing colon cancer comprising the same. In addition, the present invention relates to a method of providing information necessary for diagnosing colorectal cancer, including measuring the level of the NTRK1 fusion gene, a transcript thereof, or a protein thereof, and a method of providing information necessary for predicting a prognosis of colorectal cancer treatment. In addition, it relates to a screening method for a colorectal cancer therapeutic agent comprising measuring the expression level of the NTRK1 fusion gene, and to a pharmaceutical composition for preventing or treating colorectal cancer comprising an NTRK1 fusion protein inhibitor as an active ingredient. By providing a diagnostic marker specific for colorectal cancer according to the present invention, accurate colorectal cancer diagnosis is possible, predicting the clinical prognosis through stratification of colorectal cancer patients, predicting the effectiveness of treatment for colorectal cancer, In particular, it becomes possible to predict the effectiveness of colorectal cancer treatment by NTRK1 protein inhibitors. Accordingly, it is possible to limit the administration of the drug to colorectal cancer patients who are considered to be ineffective to administer the drug, and thus it becomes possible to realize efficient and safe customized colorectal cancer treatment.

Description

대장암 마커로서의 신규 NTRK1 융합유전자 및 이의 용도{Novel NTRK1 fusion gene as colon cancer marker and the uses thereof} Novel NTRK1 fusion gene as colon cancer marker and the uses thereof

LMNA(Lamin A) 또는 TPM3(Tropomyosin 3)와 NTRK1(Neurotrophic Tyrosine Kinase, Receptor, Type 1)와의 융합단백질 및 이를 암호화하는 융합유전자 폴리뉴클레오티드에 관한 것이다. 또한, 상기 융합단백질, 상기 융합유전자, 또는 상기 융합유전자의 전사산물을 측정하는 제제를 포함하는 대장암 진단용 조성물 및 이를 포함하는 대장암 진단용 키트에 관한 것이다. 아울러, NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계를 포함하는 대장암 진단에 필요한 정보를 제공하는 방법 및 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법에 관한 것이다. 또한, NTRK1 융합유전자의 발현 수준을 측정하는 단계를 포함하는 대장암 치료제의 스크리닝 방법 및 NTRK1 융합단백질 저해제를 유효성분으로 포함하는 대장암의 예방 또는 치료용 약제학적 조성물에 관한 것이다.
It relates to a fusion protein of LMNA (Lamin A) or TPM3 (Tropomyosin 3) and NTRK1 (Neurotrophic Tyrosine Kinase, Receptor, Type 1) and a fusion gene polynucleotide encoding the same. In addition, the present invention relates to a composition for diagnosing colon cancer comprising the fusion protein, the fusion gene, or an agent for measuring a transcript of the fusion gene, and a kit for diagnosing colon cancer comprising the same. In addition, the present invention relates to a method of providing information necessary for diagnosing colorectal cancer, including measuring the level of the NTRK1 fusion gene, a transcript thereof, or a protein thereof, and a method of providing information necessary for predicting a prognosis of colorectal cancer treatment. In addition, it relates to a screening method for a colorectal cancer therapeutic agent comprising measuring the expression level of the NTRK1 fusion gene, and to a pharmaceutical composition for preventing or treating colorectal cancer comprising an NTRK1 fusion protein inhibitor as an active ingredient.

대장암은 암 사망에 있어서 제2-3위를 차지하는 암으로 전체 암의 약 13% 정도를 차지하고 있다. 미국의 경우, 연간 약 50,310명이 대장암으로 사망하고 136,830명의 새로운 대장암 환자가 발생한다고 보고되고 있다. 우리나라에서는 사망률에 있어서 전체 암에서 차지하는 비율이 대장암이 폐암, 간암, 위암에 이어 제4위를 차지하고 있다. 1980년에 전체 암의 5.8%를 차지하던 것이 1985년에는 6.1%, 1995년에는 8.2%, 2002년에는 11.2%, 2012년에는 12.9%로 지속적인 증가 추세를 보이고 있으며, 1999년도 자료와 비교해 볼 때 2011년에는 위암, 간암 및 자궁경부암의 사망률이 감소한 데 비해 대장암에 의한 사망률은 5.6%의 증가하였다.
Colorectal cancer is the second and third most common cancer in cancer deaths, accounting for about 13% of all cancers. In the United States, it is reported that about 50,310 people die from colorectal cancer every year and 136,830 new cases of colorectal cancer occur. In Korea, colorectal cancer ranks fourth in mortality rate after lung cancer, liver cancer, and stomach cancer. In 1980, 5.8% of all cancers accounted for 6.1% in 1985, 8.2% in 1995, 11.2% in 2002, and 12.9% in 2012. In 2011, the death rate from colorectal cancer increased by 5.6%, while the death rate from gastric cancer, liver cancer, and cervical cancer decreased.

대장내시경을 이용한 조기진단 및 근치술, 화학요법 등의 발달로 전체 대장암 환자의 5년 생존율이 약 64.7%로 보고되고 있다. 그러나 1기 대장암 환자의 5년 생존율이 89.8%, 2-3기 대장암 환자의 5년 생존율이 70.5%로 향상된 반면, 말기 대장암 환자의 5년 생존율은 12.9%로 지난 30여년 간 정체되었고, 기존 치료법을 통하여 생존율을 향상시키기는 어려운 실정이다. 최근 보험급여가 인정된 얼비툭스(머크사) 및 아바스틴(로슈사) 등의 표적치료제에 의한 말기 대장암 환자의 무병생존 연장기간은 기존의 화학요법 대비 각각 0.9개월(p = 0.048) 및 1.4개월(p = 0.0023)로 임상적 실효성이 불충분한 상황이다. 유방암 및 폐암 등과 비교할 때, 대장암은 유전체학적 연구가 미비하고, 이에 따라 분자수준의 환자계층화가 미비한 실정이다. 따라서, 대장암 환자의 생존율을 높이기 위해서는 무엇보다도 분자수준의 환자계층화 및 새로운 대장암 맞춤 타겟의 발굴이 시급하다.
With the development of early diagnosis, curative surgery, and chemotherapy using colonoscopy, the 5-year survival rate of all colorectal cancer patients is reported to be about 64.7%. However, the 5-year survival rate of stage 1 colorectal cancer patients improved to 89.8%, and the 5-year survival rate for stage 2–3 colorectal cancer patients improved to 70.5%, while the 5-year survival rate for late stage colorectal cancer patients was 12.9%, stagnating for the past 30 years. However, it is difficult to improve the survival rate through existing treatments. The extended period of disease-free survival of end-stage colorectal cancer patients by targeted therapies such as Erbitux (Merck) and Avastin (Roche), which were recently approved for insurance benefits, were 0.9 months (p = 0.048) and 1.4 months (p), respectively, compared to conventional chemotherapy. = 0.0023), indicating insufficient clinical efficacy. Compared with breast cancer and lung cancer, genomic research is insufficient for colorectal cancer, and accordingly, patient stratification at the molecular level is insufficient. Therefore, in order to increase the survival rate of colorectal cancer patients, it is urgent to stratify patients at the molecular level and discover new customized colorectal cancer targets.

대장암의 발생과정에는 여러 종류의 암 유전자, 종양 억제유전자 등 다양한 유전자 변화가 관여하는 것으로 알려져 있다. 실제 대장암은 발암과정에서 일어나는 유전적 변화가 가장 많이 밝혀진 암이다. 대장암은 한 개의 암 유전자 또는 종양억제 유전자의 변화가 단독으로 암을 유발시킬 수 있는 것이 아니고 정상 대장 점막세포가 선종의 단계를 거쳐 대장암으로 진행되기 위해서는 수년에 걸친 긴 세월을 통해 여러 개의 암 관련 유전자의 변화가 축적되어야 하는데 이를 대장암 발생에 있어서 유전자의 다단계적 변화라고 한다. 여기서 중요한 것은 각 단계에서의 유전자 변화 순서가 아니라 궁극적으로 누적되는 유전자들의 변화의 총합이다. 대장암 발생과정에 관여하는 유전적 변화로는 암 유전자와 종양 억제유전자의 돌연변이, DNA 메틸화 이상 및 DNA 수리 유전자의 돌연변이도 관계된다.
It is known that various genetic changes such as various types of cancer genes and tumor suppressor genes are involved in the development of colorectal cancer. In fact, colorectal cancer is the cancer for which genetic changes that occur during the carcinogenesis process have been identified the most. In colorectal cancer, a change in one oncogene or tumor suppressor gene cannot cause cancer alone. In order for normal colonic mucosal cells to progress to colorectal cancer through the stage of adenoma, several cancers are required over many years. Changes in related genes must be accumulated, which is called a multi-step change of genes in the development of colorectal cancer. What is important here is not the sequence of genetic changes at each stage, but the sum of the ultimately cumulative changes in genes. Genetic changes involved in the development of colorectal cancer include mutations in cancer genes and tumor suppressor genes, DNA methylation abnormalities, and mutations in DNA repair genes.

암의 형성은 다양한 유전자들과 이들 유전자들의 상호작용이 복합적으로 연관되어 진행되므로, 전체 유전자의 발현 및 돌연변이를 조사하고 비교하여 새로운 암 유전자 및 치료용 타겟을 발굴하고자 하는 유전체적 접근이 이루어지고 있다. 암세포에서 특이적으로 발현이 증가하거나 감소하는 유전자들은 세포분열, 세포신호전달, 세포 골격, 세포 운동, 세포 방어, 유전자 및 단백질의 발현 그리고 세포 내 물질 대사 등 암세포의 생존 및 증식에 관여하는 것으로 보고되고 있다. 암 유전체학의 발전은 유방암 및 폐암 등의 환자계층화 및 계층별 환자의 맞춤 치료용 타겟 발굴에 기여하였다. 그러나 발굴된 타겟에 대한 임상적 실효성에 대한 평가의 부재는 암 유전체학을 통해 연구개발된 맞춤형 항암 치료제의 임상연구 실패의 주요 원인으로 평가되고 있다.
Since the formation of cancer proceeds in a complex relationship between various genes and their interactions, a genomic approach is being made to discover new cancer genes and therapeutic targets by examining and comparing the expression and mutation of all genes. . Genes whose expression is specifically increased or decreased in cancer cells are reported to be involved in the survival and proliferation of cancer cells, such as cell division, cell signaling, cytoskeleton, cell movement, cell defense, expression of genes and proteins, and intracellular metabolism. is becoming Advances in cancer genomics have contributed to stratification of patients, such as breast cancer and lung cancer, and to discover targets for customized treatment of patients by class. However, the lack of evaluation of the clinical effectiveness of the discovered target is evaluated as a major cause of clinical research failure of customized anticancer therapeutics researched and developed through cancer genomics.

NTRK1 융합유전자는 다양한 암종에 걸쳐 보고된 바 있다. 대장암과 갑상선 유두암에서는 TPM3-NTRK1의 융합유전자가 보고되었고(Martin-Zanca 등, Nature, 1986년, 319권, 743~748 페이지; Wilton 등, Cytogenetics and cell genetics, 1995년, 68권, 122~124 페이지), 폐암에서는 미오신 탈인산화효소 Rho 상호작용 단백질(myosin phosphatase Rho interacting protein: MPRIP) 또는 CD74-NTRK1 융합유전자가 보고되었으며(Vaishnave 등, Nature medicine, 2013년, 19권, 1469~1472 페이지; 특허번호 WO 2014071358 A2), 스피트조이드(Spitzoid) 흑색종에서는 TP53 또는 라민 A/C (lamin A/C: LMNA)-NTRK1 융합유전자가 보고되었고(Wiesner 등, Nature communications, 2014년 5권, 3116; 특허번호 WO 2013059740 A1), 담낭암에서는 RAB 지티파아제 유사 활성 단백질 1(RAB GTPase activating protein 1-like: RABGAP1L)-NTRK1 융합유전자가 보고되었으며(Ross 등, The oncologist, 2014년, 19권, 235~242 페이지), 다형교아종에서는 뉴로파신(neurofascin: NFASC) 또는 브레비칸(brevican: BCAN)-NTRK1 융합유전자가 보고되었다(Kim 등, PloS one, 2014년, 9권, e91940). 그러나 NTRK1 융합유전자의 암 유전자로서의 역할은 일부 암종에서 규명된 반면, 대장암에서 NTRK1 융합유전자의 암 유전자로서의 역할, 빈도 및 임상적 의의는 포괄적으로 규명된 바 없다.
The NTRK1 fusion gene has been reported across a variety of carcinomas. A TPM3-NTRK1 fusion gene has been reported in colorectal cancer and papillary thyroid cancer (Martin-Zanca et al., Nature, 1986, vol. 319, pp. 743-748; Wilton et al., Cytogenetics and cell genetics, 1995, vol. 68, 122- 124), myosin phosphatase Rho interacting protein (MPRIP) or CD74-NTRK1 fusion gene has been reported in lung cancer (Vaishnave et al., Nature medicine, 2013, vol. 19, pp. 1469-1472; Patent No. WO 2014071358 A2), a TP53 or lamin A/C (LMNA)-NTRK1 fusion gene has been reported in Spitzoid melanoma (Wiesner et al., Nature communications, 2014 vol. 5, 3116; Patent No. WO 2013059740 A1), a RAB GTPase activating protein 1-like: RABGAP1L)-NTRK1 fusion gene has been reported in gallbladder cancer (Ross et al., The oncologist, 2014, Vol. 19, 235~ 242), a neurofascin (NFASC) or brevican (BCAN)-NTRK1 fusion gene was reported in glioblastoma multiforme (Kim et al., PloS one, 2014, Vol. 9, e91940). However, while the role of the NTRK1 fusion gene as an oncogene in some carcinomas has been identified, the role, frequency, and clinical significance of the NTRK1 fusion gene as an oncogene in colorectal cancer has not been comprehensively identified.

본 발명자들은 대장암의 유전체학적 연구를 통해 대장암 환자계층화 및 예후예측, 그리고 치료의 타겟이 될 수 있는 유전자의 발견을 위하여 예의 연구 노력한 결과, 한국인 및 중국인 대장암 조직 내 LMNA-NTRK1 및 TPM3-NTRK1 융합유전자 및 이의 발현이 특정 환자군에서 현저히 증가하며, NTRK1 융합유전자 및 이에 의해 암호화되는 융합전사산물 및 융합단백질은 대장암의 임상예후를 결정하는 인자로, 이를 억제하는 경우 대장암 치료 효능이 있다는 것을 알아냄으로써, 본 발명을 완성하게 되었다.
The present inventors have made intensive research efforts to stratify colorectal cancer patients, predict prognosis, and discover genes that can be a target of treatment through genomic research of colorectal cancer. As a result, LMNA-NTRK1 and TPM3- in Korean and Chinese colorectal cancer tissues The NTRK1 fusion gene and its expression are significantly increased in a specific patient group, and the NTRK1 fusion gene and the fusion transcript and fusion protein encoded by it are factors that determine the clinical prognosis of colorectal cancer. By finding out, the present invention was completed.

본 발명의 하나의 목적은, LMNA(Lamin A) 또는 TPM3(Tropomyosin 3)와 NTRK1(Neurotrophic Tyrosine Kinase, Receptor, Type 1)와의 융합단백질 및 이를 암호화하는 융합유전자 폴리뉴클레오티드를 제공하는 것이다.One object of the present invention is to provide a fusion protein of LMNA (Lamin A) or TPM3 (Tropomyosin 3) and NTRK1 (Neurotrophic Tyrosine Kinase, Receptor, Type 1) and a fusion gene polynucleotide encoding the same.

본 발명의 다른 목적은, 상기 융합단백질, 상기 융합유전자, 또는 상기 융합유전자의 전사산물을 측정하는 제제를 포함하는 대장암 진단용 조성물을 제공하는 것이다.Another object of the present invention is to provide a composition for diagnosing colon cancer comprising the fusion protein, the fusion gene, or an agent for measuring a transcript of the fusion gene.

본 발명의 또 다른 목적은, 상기 대장암 진단용 조성물을 포함하는 대장암 진단용 키트를 제공하는 것이다. Another object of the present invention is to provide a kit for diagnosing colon cancer comprising the composition for diagnosing colon cancer.

본 발명의 또 다른 목적은, 상기 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계를 포함하는 대장암 진단에 필요한 정보를 제공하는 방법을 제공하는 것이다.Another object of the present invention is to provide a method for providing information necessary for diagnosing colorectal cancer, comprising measuring the level of the NTRK1 fusion gene, its transcript, or its protein.

본 발명의 또 다른 목적은, 상기 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계를 포함하는 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법을 제공하는 것이다.Another object of the present invention is to provide a method for providing information necessary for predicting the prognosis of colorectal cancer treatment, which includes measuring the level of the NTRK1 fusion gene, its transcript, or its protein.

본 발명의 또 다른 목적은, 상기 NTRK1 융합유전자의 발현 수준을 측정하는 단계를 포함하는 대장암 치료제의 스크리닝 방법을 제공하는 것이다.Another object of the present invention is to provide a screening method for a therapeutic agent for colorectal cancer, comprising measuring the expression level of the NTRK1 fusion gene.

본 발명의 또 다른 목적은, NTRK1 융합단백질 저해제를 유효성분으로 포함하는 대장암의 예방 또는 치료용 약제학적 조성물을 제공하는 것이다.
Another object of the present invention is to provide a pharmaceutical composition for preventing or treating colorectal cancer comprising an NTRK1 fusion protein inhibitor as an active ingredient.

본 발명자들은, 상기 목적을 달성하기 위해 예의 연구를 거듭한 결과, 150례의 대장암 임상 조직과 50례의 정상 대장 임상 조직으로부터 추출한 전사체의 차세대 전사체 염기서열분석에 의해, TPM3-NTRK1 융합전사산물 및 LMNA-NTRK1 융합전사산물을 검출하였다. TPM3-NTRK1 융합유전자는 1번 염색체 q21.3와 q23.1 영역 간의 역위에 의해서 발생하였고, LMNA-NTRK1 융합유전자는 상기의 염색체 q22와 q23.1 영역 간의 결실에 의해서 발생하였다.
As a result of repeated intensive studies to achieve the above object, the present inventors conducted TPM3-NTRK1 fusion by next-generation transcriptome sequencing of transcripts extracted from 150 cases of colorectal cancer clinical tissue and 50 normal colorectal clinical tissues. Transcripts and LMNA-NTRK1 fusion transcripts were detected. The TPM3-NTRK1 fusion gene was generated by an inversion between the q21.3 and q23.1 regions of chromosome 1, and the LMNA-NTRK1 fusion gene was generated by a deletion between the q22 and q23.1 regions of the chromosome 1.

상기한 신규한 융합유전자 및 이에 암호화 된 융합전사산물 및 융합단백질은 147례의 한국인 대장암 임상 조직 중 3례(2%)에서 검색되었다. 상기의 사실로부터 대장암에서 융합전사산물 및 융합단백질의 발현은 유전자 융합에 의한 것이 밝혀졌다.
The novel fusion gene and its encoded fusion transcript and fusion protein were retrieved from 3 cases (2%) of 147 Korean colon cancer clinical tissues. From the above facts, it was found that the expression of fusion transcripts and fusion proteins in colorectal cancer was caused by gene fusion.

NTRK1 융합전사산물이 확인된 3례의 대장암 임상 조직은 KRAS, NRAS 및 PIK3CA 등 공지의 대장암 유전자의 체세포 돌연변이를 갖지 않았다. 또한 상기의 NTRK1 융합유전자를 종양성이 없는 NIH3T3 세포주에서 강제로 발현시켰을 때 체외 및 채내 종양성이 획득되었다. 상기의 사실로부터 NTRK1 유전자융합은 대장암에 있어서 원인 유전자(driver oncogene)인 것이 밝혀졌다.
The three cases of colorectal cancer clinical tissues in which NTRK1 fusion transcripts were confirmed did not have somatic mutations in known colorectal cancer genes such as KRAS, NRAS, and PIK3CA. In addition, when the NTRK1 fusion gene was forcibly expressed in a non-neoplastic NIH3T3 cell line, in vitro and in vitro tumorigenicity were obtained. From the above facts, it was revealed that NTRK1 gene fusion is a driver oncogene in colorectal cancer.

본 발명의 융합단백질은 29.2%의 한국인 대장암 환자에서 확인되었고, 25.6%의 중국인 대장암 환자에서 확인되어, 상기의 융합유전자는 한국인 및 중국인 등 동북아시아인의 대장암에 있어서 높은 빈도로 관찰되는 원인 유전자인 것이 밝혔다. 또한 본 발명의 융합유전자 또는 이에 암호화되는 융합단백질을 갖는 대장암 환자의 생존율은 본 발명의 융합유전자 또는 이에 암호화되는 융합단백질을 갖지 않는 대장암 환자의 생존율보다 낮아, 본 발명의 융합유전자가 대장암 환자의 임상예후를 예측하는 진단 마커로 가능하다는 것을 알아내었다.
The fusion protein of the present invention was confirmed in 29.2% of Korean colorectal cancer patients and 25.6% of Chinese colorectal cancer patients, and the fusion gene is observed with high frequency in colorectal cancer of Northeast Asians such as Koreans and Chinese. It was found that the causative gene was In addition, the survival rate of colorectal cancer patients having the fusion gene of the present invention or the fusion protein encoded therein is lower than the survival rate of colorectal cancer patients not having the fusion gene of the present invention or the fusion protein encoded therein, so that the fusion gene of the present invention has colorectal cancer It was found that it is possible as a diagnostic marker to predict the clinical prognosis of a patient.

상기의 유전자 융합은, NTRK1 단백질의 향상된 활성화를 초래하는 것이라고 생각되며, 이러한 활성화가 발생하고 있는 대장암 환자에 있어서는, NTRK1 단백질에 대한 저해제가 치료에 있어서 유효성을 나타내는 것이라고 생각된다. 이 때문에, 본 발명자들은, 대장암에 있어서, 해당 융합유전자를 표적으로 하여 약물에 의한 치료의 유효성을 예측하는 것이 가능하며, 또한, 이 예측에 있어서 약물에 의한 치료가 유효하다고 판정된 환자에 해당 약물을 투여하면, 효율적인 치료가 가능한 것을 알아내어, 본 발명을 완성하기에 이르렀다.
It is thought that the above gene fusion results in improved activation of NTRK1 protein, and in colorectal cancer patients in which such activation has occurred, an inhibitor for NTRK1 protein is considered to be therapeutically effective. For this reason, the present inventors are able to predict the efficacy of treatment with a drug by targeting the fusion gene in colorectal cancer, and in this prediction, it is possible to predict the efficacy of treatment with a drug for patients determined to be effective. When a drug is administered, it has been found that effective treatment is possible, and the present invention has been completed.

따라서, 본 발명은, TPM3 유전자 또는 LMNA 유전자와 NTRK1 유전자간의 융합유전자 및 이에 암호화되는 융합전사산물 및 융합단백질의 존재를 지표로 대장암 환자의 임상예후를 진단하는 방법, NTRK1 단백질 저해제에 의한 대장암 치료의 유효성을 판정하는 방법, 이 유효성의 판정을 이용한 대장암의 치료 방법에 관한 것으로서, 보다 상세하게는, 이하의 발명을 제공하는 것이다.
Accordingly, the present invention provides a method for diagnosing the clinical prognosis of a colorectal cancer patient using the fusion gene between the TPM3 gene or the LMNA gene and the NTRK1 gene, the fusion transcript and the fusion protein encoded therein, and colorectal cancer by the NTRK1 protein inhibitor. It relates to a method for judging the effectiveness of treatment, and a method for treating colorectal cancer using the judging of the efficacy, and more particularly, to provide the following inventions.

상기 목적을 달성하기 위한 하나의 양태로서, 본 발명은 LMNA(Lamin A) 또는 TPM3(Tropomyosin 3)와 NTRK1(Neurotrophic Tyrosine Kinase, Receptor, Type 1)와의 융합단백질 및 이를 암호화하는 융합유전자 폴리뉴클레오티드를 제공한다.As one aspect for achieving the above object, the present invention provides a fusion protein of LMNA (Lamin A) or TPM3 (Tropomyosin 3) and NTRK1 (Neurotrophic Tyrosine Kinase, Receptor, Type 1) and a fusion gene polynucleotide encoding the same do.

구체적으로, 본 발명은 하기의 구조식으로 이루어진 융합단백질을 제공한다.Specifically, the present invention provides a fusion protein consisting of the following structural formula.

N-[LMNA(Lamin A)의 N 말단을 포함하는 단편]-[NTRK1(Neurotrophic Tyrosine Kinase, Receptor, Type 1)의 C 말단을 포함하는 단편]-C, 또는N-[fragment containing the N terminus of LMNA (Lamin A)]-[fragment containing the C terminus of Neurotrophic Tyrosine Kinase (NTRK1, Receptor, Type 1)]-C, or

N-[TPM3(Tropomyosin 3)의 N 말단을 포함하는 단편]-[NTRK1의 C 말단을 포함하는 단편]-C.N-[fragment containing the N terminus of TPM3 (Tropomyosin 3)]-[fragment containing the C terminus of NTRK1]-C.

또한, 본 발명은 하기의 구조식으로 이루어진 융합유전자 폴리뉴클레오티드를 제공한다.In addition, the present invention provides a fusion gene polynucleotide consisting of the following structural formula.

5'-[LMNA 유전자의 5' 말단을 포함하는 단편]-[NTRK1 유전자의 3' 말단을 포함하는 단편]-3', 또는5'-[fragment comprising the 5' end of the LMNA gene]-[fragment comprising the 3' end of the NTRK1 gene]-3', or

5'-[TPM3의 5' 말단을 포함하는 단편]-[NTRK1 유전자의 3' 말단을 포함하는 단편]-3'.
5'-[fragment comprising the 5' end of TPM3]-[fragment comprising the 3' end of NTRK1 gene]-3'.

즉, 본 발명은 LMNA의 N 말단을 포함하는 단편 또는 TPM3의 N 말단을 포함하는 단편과 NTRK1의 C 말단을 포함하는 단편이 연결된 융합단백질 및 LMNA 유전자의 5' 말단을 포함하는 단편 또는 TPM3 유전자의 5' 말단을 포함하는 단편과 NTRK1 유전자의 3' 말단을 포함하는 단편이 연결된 융합단백질에 관한 것으로, 상기 LMNA, TPM3 또는 NTRK1은 인간 유래일 수 있다. 본 발명의 융합단백질은 NTRK1 융합단백질, 또는 경우에 따라 LMNA-NTRK1 융합단백질 또는 TPM3-NTRK1 융합단백질과 혼용될 수 있다.That is, the present invention relates to a fusion protein in which a fragment including the N-terminus of LMNA or a fragment including the N-terminus of TPM3 and a fragment including the C-terminus of NTRK1 are linked, and a fragment including the 5' end of the LMNA gene or TPM3 gene The present invention relates to a fusion protein in which a fragment including a 5' end and a fragment including a 3' end of the NTRK1 gene are linked, wherein the LMNA, TPM3 or NTRK1 may be of human origin. The fusion protein of the present invention may be mixed with the NTRK1 fusion protein, or, in some cases, the LMNA-NTRK1 fusion protein or the TPM3-NTRK1 fusion protein.

본 발명자들은 본 발명 실시예에 있어서 나타내는 바와 같이, 인간 대장암 환자에서 LMNA 단백질과 NTRK1 단백질과의 융합예를 처음으로 밝혀졌다. 또한 TPM3 유전자 또는 LMNA 유전자와 NTRK1 유전자의 융합 및 이에 암호화된 융합전사산물과 융합단백질을 갖는 대장암 환자의 빈도 및 임상예후를 대규모 대장암 환자 코호트 분석을 통해 처음으로 확인하였다(표 1).
As shown in the Examples of the present invention, the present inventors first discovered a fusion example of LMNA protein and NTRK1 protein in a human colorectal cancer patient. In addition, the frequency and clinical prognosis of colorectal cancer patients having TPM3 gene or LMNA gene fusion with NTRK1 gene and the fusion transcript and fusion protein encoded therein were confirmed for the first time through large-scale colorectal cancer patient cohort analysis (Table 1).

본 발명에서 TPM3 단백질을 암호화하는 TPM3 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 1번(q21.3)에 위치하며, 이로부터 암호화되는 TPM3 단백질은 총 아미노산 길이가 285aa인 폴리펩티드이다. TPM3 단백질 또는 TPM3 단백질 단편은 TPM3-NTRK1 융합단백질의 N 말단쪽 융합파트너이다. 예컨대, TPM3 유전자는 GenBank accession no. NM_152263에서 제공되는 염기 서열을 갖는 것일 수 있으며, TPM3 단백질은 NM_152263에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다. 특히 상기 TPM3 단백질은 서열번호 4의 아미노산 서열로 이루어진 폴리펩티드일 수 있으며, 상기 TPM3 유전자는 서열번호 2의 핵산 서열로 구성된 것일 수 있으나, 이에 제한되지 않는다.In the present invention, the TPM3 gene encoding the TPM3 protein may be derived from a human and is located on human chromosome 1 (q21.3), and the TPM3 protein encoded therefrom is a polypeptide having a total amino acid length of 285aa. The TPM3 protein or TPM3 protein fragment is the N-terminal fusion partner of the TPM3-NTRK1 fusion protein. For example, the TPM3 gene is GenBank accession no. It may have a nucleotide sequence provided by NM_152263, and the TPM3 protein may be a protein having an amino acid sequence encoded by NM_152263. In particular, the TPM3 protein may be a polypeptide consisting of the amino acid sequence of SEQ ID NO: 4, and the TPM3 gene may be composed of the nucleic acid sequence of SEQ ID NO: 2, but is not limited thereto.

본 발명에서 TPM3의 N 말단을 포함하는 단편은 NM_152263의 8번째 엑손(1번 염색체 상의 (-) 가닥(strand)을 기준으로 154134289~154142876 염기위치)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 8의 3’말단에 코돈(codon)을 이루지 못하는 1개의 뉴클레오타이드(g)가 존재하는 형태일 수 있다(표 2 및 표 3). 특히 상기 TPM3의 N 말단을 포함하는 단편은 서열번호 5의 아미노산 서열로 구성되는 것일 수 있으나, 이에 제한되지 않는다.
In the present invention, the fragment including the N-terminus of TPM3 has an amino acid sequence encoded by the nucleotide sequence up to the 8th exon of NM_152263 (from 154134289 to 154142876 base positions based on the (-) strand on chromosome 1). It may be a single nucleotide (g) that does not form a codon at the 3' end of exon 8 (Table 2 and Table 3). In particular, the fragment including the N-terminus of TPM3 may be composed of the amino acid sequence of SEQ ID NO: 5, but is not limited thereto.

LMNA 단백질을 암호화하는 LMNA 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 1번(q22)에 위치하며, 이로부터 암호화되는 LMNA 단백질은 총 아미노산 길이가 664aa인 폴리펩티드이다. LMNA 단백질 또는 LMNA 단백질 단편은 LMNA-NTRK1 융합단백질의 N 말단쪽 융합파트너이다. LMNA 유전자는 GenBank accession no. NM_170707에서 제공되는 뉴클레오타이드 서열을 갖는 것일 수 있으며, LMNA 단백질은 NM_170707에 의하여 암호화되는 아미노산 서열을 갖는 단백질 일 수 있다. 특히 상기 LMNA 단백질은 서열번호 27의 아미노산 서열로 이루어진 폴리펩티드일 수 있으며, 상기 LMNA 유전자는 서열번호 28의 핵산 서열로 구성된 것일 수 있으나, 이에 제한되지 않는다.
The LMNA gene encoding the LMNA protein may be of human origin and is located on human chromosome 1 (q22), and the LMNA protein encoded therefrom is a polypeptide having a total amino acid length of 664aa. The LMNA protein or LMNA protein fragment is the N-terminal fusion partner of the LMNA-NTRK1 fusion protein. The LMNA gene is GenBank accession no. It may have a nucleotide sequence provided by NM_170707, and the LMNA protein may be a protein having an amino acid sequence encoded by NM_170707. In particular, the LMNA protein may be a polypeptide consisting of the amino acid sequence of SEQ ID NO: 27, and the LMNA gene may be composed of the nucleic acid sequence of SEQ ID NO: 28, but is not limited thereto.

본 발명에서 LMNA의 N 말단을 포함하는 단편은 NM_170707의 6번째 엑손(1번 염색체 상의 (+)가닥을 기준으로 156084504~156105740 염기위치)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있으며, 엑손 6의 3’말단에 코돈(codon)을 이루지 못하는 1개의 뉴클레오타이드(c)가 존재하는 형태일 수 있다(표 6 및 표 7). 특히 상기 LMNA의 N 말단을 포함하는 단편은 서열번호 31의 아미노산 서열로 구성되는 것일 수 있으나, 이에 제한되지 않는다.
In the present invention, the fragment including the N-terminus of LMNA may have an amino acid sequence encoded by the nucleotide sequence up to the 6th exon of NM_170707 (base positions 156084504 to 156105740 bases relative to the (+) strand on chromosome 1). , one nucleotide (c) that does not form a codon at the 3' end of exon 6 may be present (Tables 6 and 7). In particular, the fragment including the N-terminus of the LMNA may consist of the amino acid sequence of SEQ ID NO: 31, but is not limited thereto.

NTRK1 단백질을 암호화하는 NTRK1 유전자는 인간으로부터 유래하는 것일 수 있고 인간의 염색체 1번(q23.1)에 위치하며, 이로부터 암호화되는 NTRK1 단백질은 총 아미노산 길이가 796aa인 단백질이다. NTRK1 단백질 또는 NTRK1 단백질 단편은 TPM3-NTRK1 융합단백질의 C 말단쪽 융합 파트너이다. 예컨대, 상기 NTRK1 유전자는 GenBank accession no. NM_001012331에 제공되는 염기 서열을 갖는 것일 수 있으며, 상기 NTRK1 단백질은 NM_001012331에 의하여 암호화되는 아미노산 서열을 갖는 단백질일 수 있다. 특히 상기 NTRK1 단백질은 서열번호 7의 아미노산 서열로 구성되는 폴리펩티드일 수 있으며, 상기 NTRK1 유전자는 서열번호 8, 서열번호 10 또는 서열번호 13의 핵산 서열로 구성된 것일 수 있으나, 이에 제한되지 않는다.
The NTRK1 gene encoding the NTRK1 protein may be of human origin and is located on human chromosome 1 (q23.1), and the NTRK1 protein encoded therefrom is a protein with a total amino acid length of 796aa. NTRK1 protein or NTRK1 protein fragment is the C-terminal fusion partner of the TPM3-NTRK1 fusion protein. For example, the NTRK1 gene is GenBank accession no. It may have a nucleotide sequence provided by NM_001012331, and the NTRK1 protein may be a protein having an amino acid sequence encoded by NM_001012331. In particular, the NTRK1 protein may be a polypeptide composed of the amino acid sequence of SEQ ID NO: 7, and the NTRK1 gene may be composed of the nucleic acid sequence of SEQ ID NO: 8, SEQ ID NO: 10 or SEQ ID NO: 13, but is not limited thereto.

본 발명에서 NTRK1의 C 말단을 포함하는 단편은 NM_001012331의 엑손 9(1번 염색체 상의 (+)가닥을 기준으로 156830671~156844363 염기위치) 또는 엑손 11(1번 염색체 상의 (-)가닥을 기준으로 156830671~156845312 염기위치) 또는 엑손 12(1번 염색체 상의 (-)가닥을 기준으로 156830671~156845872 염기위치)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것일 수 있다. 이때, 엑손 9의 3’말단의 처음 시작하는 2개의 뉴클레오타이드(ac)와 엑손 11의 3’말단의 처음 시작하는 2개의 뉴클레오타이드(gc) 및 엑손 12의 3’말단의 처음 시작하는 2개의 뉴클레오타이드(gt)는 코돈을 이루지 못하는 형태일 수 있고, TPM3 단백질의 단편과 융합 시에 앞서 설명한 바와 같이 TPM3 단백질의 단편에 추가로 포함된 1개의 뉴클레오타이드(g)와 연결되어 코돈(gac 또는 ggc 또는 ggt)을 이루어 하나의 아미노산(D 또는 G)을 코딩할 수 있다. 특히 상기 NTRK1의 C 말단을 포함하는 단편은 서열번호 15, 서열번호 17 또는 서열번호 19의 아미노산 서열로 구성되는 것일 수 있으나, 이에 제한되지 않는다.
In the present invention, the fragment including the C terminus of NTRK1 is exon 9 (156830671 to 156844363 base positions based on the (+) strand on chromosome 1) or exon 11 (156830671 based on the (-) strand on chromosome 1) of NM_001012331 It may have an amino acid sequence encoded by the nucleotide sequence from ~156845312 base position) or exon 12 (156830671 to 156845872 base positions based on the (-) strand on chromosome 1) to the last exon. At this time, the first two nucleotides (ac) of the 3' end of exon 9 and the first two nucleotides (gc) of the 3' end of exon 11 and the first two nucleotides of the 3' end of exon 12 ( gt) may be in a form that does not form a codon, and is linked to one nucleotide (g) additionally included in the TPM3 protein fragment as described above when fused with a TPM3 protein fragment to a codon (gac or ggc or ggt) to encode one amino acid (D or G). In particular, the fragment including the C terminus of NTRK1 may be composed of the amino acid sequence of SEQ ID NO: 15, SEQ ID NO: 17 or SEQ ID NO: 19, but is not limited thereto.

본 명세서에 있어서 융합파트너인 단백질의 단편들의 절단점(break point; 또는 융합 부위)은 이들을 암호화하는 유전자의 엑손(exon)을 기준으로 설명되며, 상기 단편의 N말단(C말단 융합파트너의 경우) 또는 C말단(N말단 융합 파트너의 경우) 마지막에 포함되는 엑손과 절단되어 제거되는 엑손 사이의 인트론(intron) 부위 중 어느 지점에서 절단되어도 암호화되는 단백질 단편의 아미노산 서열에는 영향을 미치지 않게 되므로, 실제 절단되는 지점은 상기 인트론 위치 중 어느 지점이어도 무방하다.
In the present specification, the break point (or fusion site) of the fragments of the fusion partner protein is described based on the exon of the gene encoding them, and the N-terminus of the fragment (in the case of the C-terminal fusion partner) Alternatively, the amino acid sequence of the encoded protein fragment is not affected by cleavage at any point in the intron region between the exon included at the end of the C-terminus (in the case of an N-terminal fusion partner) and the exon to be cleaved and removed. The cut point may be any point among the intron positions.

한편, 본 발명에서 LMNA-NTRK1 융합유전자는 서열번호 33의 염기서열을 가지는 것일 수 있으며, LMNA-NTRK1 융합단백질은 서열번호 34의 염기서열을 가지는 것일 수 있으나, 이에 제한되지 않는다. 또한, 본 발명에서 TPM3-NTRK1 융합유전자는 서열번호 21,서열번호 22 또는 서열번호 23의 염기서열을 가지는 것일 수 있으며, TPM3-NTRK1 융합단백질은 서열번호 24, 서열번호 25 또는 서열번호 26을 가지는 것일 수 있으나, 이에 제한되지 않는다.
Meanwhile, in the present invention, the LMNA-NTRK1 fusion gene may have the nucleotide sequence of SEQ ID NO: 33, and the LMNA-NTRK1 fusion protein may have the nucleotide sequence of SEQ ID NO: 34, but is not limited thereto. In addition, in the present invention, the TPM3-NTRK1 fusion gene may have the nucleotide sequence of SEQ ID NO: 21, SEQ ID NO: 22 or SEQ ID NO: 23, and the TPM3-NTRK1 fusion protein has SEQ ID NO: 24, SEQ ID NO: 25 or SEQ ID NO: 26 may be, but is not limited thereto.

본 발명에서 별다른 언급이 없는 한, 본 명세서에 기재된 유전자, 전사산물 또는 전사산물 유래 cDNA 또는 DNA 분자를 시퀀싱하여 결정된 모든 뉴클레오타이드 서열들은 자동화된 차세대 염기서열 시퀀서 또는 생거법 염기서열 시퀀서를 사용하여 결정될 수 있고, 결정된 뉴클레오타이드 서열에 의하여 암호화되는 모든 아미노산 서열들은 자동화된 펩타이드 시퀀서를 사용하여 결정될 수 있다. 이 자동화된 접근에 의하여 결정된 뉴클레오타이드 서열은 실제 서열과 비교하여 일부 에러를 포함할 수 있다. 예컨대, 자동에 의하여 결정된 뉴클레오타이드 서열들은 시퀀싱된 cDNA 또는 DNA 분자의 실제 뉴클레오타이드 서열과 전형적으로 약 90% 이상, 구체적으로 약 95% 이상, 보다 구체적으로 약 99% 이상, 더욱 구체적으로 약 99.9% 이상의 서열 상동성을 가질 수 있다. 실제 서열과 비교하여 결정된 뉴클레오타이드에서 하나의 삽입 또는 결손은 포함할 수 있으며, 이와 같은 삽입 또는 결손에 의하여 뉴클레오타이드 서열 번역시의 프레임시프트(frameshift)가 야기되어, 암호화되는 아미노산 서열이 실제 아미노산 서열과 완전하게 다르게 될 수 있다.
Unless otherwise stated in the present invention, all nucleotide sequences determined by sequencing the gene, transcript or transcript-derived cDNA or DNA molecule described herein may be determined using an automated next-generation sequencing sequencer or Sanger method sequence sequencer. and all amino acid sequences encoded by the determined nucleotide sequence can be determined using an automated peptide sequencer. The nucleotide sequence determined by this automated approach may contain some errors compared to the actual sequence. For example, the automatically determined nucleotide sequences are typically about 90% or more, specifically about 95% or more, more specifically about 99% or more, more specifically about 99.9% or more sequences from the actual nucleotide sequence of the sequenced cDNA or DNA molecule. may have homology. A single insertion or deletion in the nucleotide determined by comparison with the actual sequence may be included, and such an insertion or deletion causes a frameshift in translation of the nucleotide sequence so that the encoded amino acid sequence is completely different from the actual amino acid sequence. can be quite different.

또 하나의 양태로서, 본 발명은 상기 융합단백질, 상기 융합유전자, 또는 상기 융합유전자의 전사산물을 측정하는 제제를 포함하는 대장암 진단용 조성물을 제공한다.In another aspect, the present invention provides a composition for diagnosing colon cancer comprising the fusion protein, the fusion gene, or an agent for measuring a transcript of the fusion gene.

본 발명에서 상기 융합단백질 및 융합유전자는 상기 설명한 바와 같다.
In the present invention, the fusion protein and the fusion gene are as described above.

본 발명에서 용어, "진단"은 병리 상태의 존재 또는 특징을 확인하는 것을 의미한다. 본 발명의 목적상, 진단은 대장암 발병 여부를 확인하는 것이다.As used herein, the term “diagnosis” refers to confirming the presence or characteristics of a pathological condition. For the purposes of the present invention, diagnosis is to determine whether colon cancer has occurred.

본 발명에서 용어, “대장암(colon cancer)”은 대장의 가장 안쪽 표면인 점막에서 발생한 암으로, 직장암, 결장암 및 항문암을 통칭한 것을 의미한다.As used herein, the term “colon cancer” refers to cancer occurring in the mucous membrane, which is the innermost surface of the large intestine, and refers to rectal cancer, colon cancer, and anal cancer collectively.

한편, 본 발명에서 LMNA 또는 TPM3와 NTRK1의 융합단백질 및 융합유전자는 대장암을 진단하는 진단용 마커로 사용될 수 있으며, 본 발명에서 용어, “진단용 마커, 진단하기 위한 마커 또는 진단 마커(diagnosis marker)”란 대장암 세포를 정상 세포와 구분하여 진단할 수 있는 물질로, 정상 세포에 비하여 대장암을 가진 세포에서 증가양상을 보이는 폴리펩타이드 또는 핵산(예: mRNA 등), 지질 , 당지질, 당단백질, 당(단당류, 이당류, 올리고당류 등) 등과 같은 유기 생체 분자 등을 포함한다. 본 발명의 목적상, 대장암 진단 마커는 LMNA-NTRK1(Lamin A-Neurotrophic Tyrosine Kinase, Receptor, Type 1) 또는 TPM3-NTRK1(Tropomyosin 3-Neurotrophic Tyrosine Kinase, Receptor, Type 1) 융합유전자로, 대장암 조직 또는 세포에서 발현이 증가하는 유전자들이다. Meanwhile, in the present invention, the fusion protein and fusion gene of LMNA or TPM3 and NTRK1 can be used as a diagnostic marker for diagnosing colorectal cancer, and in the present invention, the term "diagnosis marker, diagnostic marker or diagnostic marker" A substance that can distinguish colon cancer cells from normal cells and diagnose them. Polypeptides or nucleic acids (eg, mRNA), lipids, glycolipids, glycoproteins, and sugars that show an increase in colorectal cancer cells compared to normal cells. organic biomolecules such as (monosaccharides, disaccharides, oligosaccharides, etc.) and the like. For the purpose of the present invention, the colorectal cancer diagnostic marker is LMNA-NTRK1 (Lamin A-Neurotrophic Tyrosine Kinase, Receptor, Type 1) or TPM3-NTRK1 (Tropomyosin 3-Neurotrophic Tyrosine Kinase, Receptor, Type 1) fusion gene. These are genes whose expression is increased in a tissue or cell.

유의성 있는 진단 마커의 선택과 적용은 진단 결과의 신뢰도를 결정짓는다. 유의성 있는 진단 마커란, 진단하여 얻은 결과가 정확하여 타당도(validity)가 높고 반복 측정시에도 일관된 결과를 나타내도록 신뢰도가(reliability)가 높은 마커를 의미한다. 본 발명의 대장암 진단 마커는, 대장암의 발병과 함께 직접적 또는 간접적 요인으로 발현이 항상 증가하는 유전자들로 반복된 실험에도 동일한 결과를 나타내며, 발현 수준의 차이가 대조군과 비교할 때 매우 커서 잘못된 결과를 내린 확률이 거의 없는 신뢰도가 높은 마커들이다. 그러므로 본 발명의 유의성 있는 진단 마커의 발현 정도를 측정하여 얻은 결과를 토대로 진단된 결과는 타당하게 신뢰할 수 있다. 이때, 정상 대장 상피 세포와 대장암 세포에서 거의 동일한 양으로 발현되는 유전자들은 제외하고, 예를 들어 대조군으로 사용한 정상 조직에서 발현되는 유전자들에 비해 대장암 조직에서 발현이 2배 이상으로 증가되는 유전자들을 선별할 수 있다.
Selection and application of significant diagnostic markers determine the reliability of diagnostic results. A significant diagnostic marker means a marker with high reliability so that a result obtained by diagnosis is accurate, thus having high validity and showing consistent results even during repeated measurements. The colorectal cancer diagnostic marker of the present invention shows the same results even in repeated experiments with genes whose expression always increases due to direct or indirect factors with the onset of colorectal cancer, and the difference in expression level is very large compared to the control group, resulting in erroneous results They are highly reliable markers with little probability of dropping . Therefore, a diagnosis result based on a result obtained by measuring the expression level of a significant diagnostic marker of the present invention is reasonably reliable. At this time, except for genes expressed in almost the same amount in normal colonic epithelial cells and colon cancer cells, for example, genes whose expression is increased more than twice in colorectal cancer tissue compared to genes expressed in normal tissue used as a control. can select them.

본 발명의 구체적인 일 실시예에서는, TPM3 유전자 또는 LMNA 유전자와 NTRK1 유전자와의 융합유전자는 대장암에 있어서의 원인 유전자이며, 상기의 융합에 의해 NTRK1 단백질 발현의 항진, 나아가서는 NTRK1 단백질의 항상적인 활성화가 생기고, 대장암의 악성화에 기인한 불량예후의 진단 및 NTRK1 단백질 저해제에 의한 치료의 개연성이 높다는 것을 확인하였다.In a specific embodiment of the present invention, the fusion gene of the TPM3 gene or the LMNA gene and the NTRK1 gene is a causative gene in colorectal cancer. It was confirmed that the probability of diagnosis of poor prognosis due to malignancy of colorectal cancer and treatment with NTRK1 protein inhibitor was high.

따라서, 본 발명의 NTRK1 융합유전자 또는 이에 암호화되는 융합전사산물 및 융합단백질은 고형암, 구체적으로 대장암 환자에게서 특이적으로 발견되거나 발현되는 것으로 확인되었으므로, 상기 융합유전자 또는 이에 암호화되는 융합전사산물 및 융합단백질은 고형암, 구체적으로 대장암의 예후예측 진단 마커로서 유용하게 사용될 수 있다.
Therefore, the NTRK1 fusion gene or the fusion transcript and fusion protein encoded therein of the present invention have been confirmed to be specifically found or expressed in patients with solid cancer, specifically colorectal cancer, and thus the fusion gene or the fusion transcript and fusion protein encoded therein The protein can be usefully used as a prognostic diagnostic marker for solid cancer, specifically colorectal cancer.

생물학적 시료 중의 본 발명의 융합유전자 발현 수준은 융합유전자의 전사산물, 특히 mRNA 등과 융합단백질의 양을 확인함으로써 확인할 수 있다. 바람직하게는, 상기 융합유전자 mRNA의 수준을 측정하는 제제는 상기 유전자에 특이적으로 결합하는 프라이머를 포함하는 것인 대장암 진단용 조성물일 수 있다.The expression level of the fusion gene of the present invention in a biological sample can be confirmed by checking the amount of the fusion protein such as a transcript of the fusion gene, particularly mRNA. Preferably, the agent for measuring the level of the fusion gene mRNA may be a composition for diagnosing colon cancer comprising a primer that specifically binds to the gene.

본 발명에서 “mRNA 발현수준 측정”이란 대장암을 진단하기 위하여 생물학적 시료에서 대장암 마커 유전자들의 mRNA 존재 여부와 발현 정도를 확인하는 과정으로 mRNA의 양을 측정한다. 이를 위한 분석 방법으로는 역전사 중합효소반응(RT-PCR), 경쟁적 역전사 중합효소반응(Competitive RT-PCR), 실시간 역전사 중합효소반응(Real-time RT-PCR), RNase 보호 분석법(RPA; RNase protection assay), 노던 블랏팅(Northern blotting), DNA 칩 등이 있으나 이로 제한되는 것은 아니다. In the present invention, "mRNA expression level measurement" refers to a process of determining the presence and expression level of mRNA of colorectal cancer marker genes in a biological sample in order to diagnose colon cancer, and the amount of mRNA is measured. Analytical methods for this include reverse transcription polymerase reaction (RT-PCR), competitive reverse transcription polymerase reaction (Competitive RT-PCR), real-time reverse transcription polymerase reaction (Real-time RT-PCR), RNase protection assay (RPA; RNase protection) assay), Northern blotting, and a DNA chip, but is not limited thereto.

본 발명에서 상기 융합유전자의 mRNA에 특이적으로 결합하는 프라이머는 상기 융합유전자의 mRNA에 특이적으로 결합하는 프라이머는 프라이머에 의해 증폭되는 영역이 융합 대상인 두 유전자의 융합점을 포함하도록, 융합점을 사이에 두도록 설계된 프라이머일 수 있으며, 상기 융합유전자를 구성하는 융합 대상인 두 유전자가 TPM3 유전자 및 NTRK1 유전자인 경우, TPM3 단백질의 N 말단을 암호화하는 염기서열에 특이적인 프라이머와 NTRK1의 C 말단을 암호화하는 염기서열에 특이적인 프라이머를 포함하는 프라이머쌍이며, 특히, 서열번호 35 및 서열번호 36의 염기서열로 구성된 프라이머쌍일 수 있으나, 이에 제한되지 않는다.In the present invention, the primer specifically binding to the mRNA of the fusion gene is a primer that specifically binds to the mRNA of the fusion gene, the fusion point is selected such that the region amplified by the primer includes the fusion point of the two genes to be fused. It may be a primer designed to be placed in between, and when the two genes to be fused constituting the fusion gene are the TPM3 gene and the NTRK1 gene, a primer specific for the nucleotide sequence encoding the N terminus of the TPM3 protein and the C terminus of NTRK1 It is a primer pair including a primer specific to a nucleotide sequence, and in particular, may be a primer pair consisting of the nucleotide sequences of SEQ ID NO: 35 and SEQ ID NO: 36, but is not limited thereto.

또한, 상기 융합유전자를 구성하는 융합 대상인 두 유전자가 LMNA 유전자 및 NTRK1 유전자인 경우, LMNA 단백질의 N 말단을 암호화하는 염기서열에 특이적인 프라이머와 NTRK1의 C 말단을 암호화하는 염기서열에 특이적인 프라이머를 포함하는 프라이머쌍이며, 특히, 서열번호 37 및 서열번호 38의 염기서열로 구성된 프라이머쌍일 수 있으나, 이에 제한되지 않는다.
In addition, when the two genes to be fused constituting the fusion gene are the LMNA gene and the NTRK1 gene, a primer specific for the nucleotide sequence encoding the N-terminus of the LMNA protein and a primer specific for the nucleotide sequence encoding the C-terminus of NTRK1 are used. A primer pair including, in particular, may be a primer pair consisting of the nucleotide sequences of SEQ ID NO: 37 and SEQ ID NO: 38, but is not limited thereto.

한편, 본 발명의 "프라이머"는 짧은 자유 3말단 수산화기를 가지는 핵산 서열로 상보적인 템플레이트(template)와 염기쌍을 형성할 수 있고 템플레이트 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 핵산 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응(즉, DNA 중합효소 또는 역전사효소)을 위한 시약 및 상이한 4가지 뉴클레오사이드 트리포스페이트의 존재하에서 DNA 합성이 개시할 수 있다. 본 발명의 프라이머는, 각 마커 유전자 특이적인 프라이머로 7개 내지 50개의 뉴클레오타이드 서열을 가진 센스 및 안티센스 핵산이다. 프라이머는 DNA 합성의 개시점으로 작용하는 프라이머의 기본 성질을 변화시키지 않는 추가의 특징을 혼입할 수 있다. On the other hand, the "primer" of the present invention is a nucleic acid sequence having a short free three-terminal hydroxyl group, which can form a base pair with a complementary template and refers to a short nucleic acid sequence that functions as a starting point for template strand copying. Primers can initiate DNA synthesis in the presence of reagents for polymerization (ie, DNA polymerase or reverse transcriptase) and four different nucleoside triphosphates in appropriate buffers and temperatures. The primers of the present invention are sense and antisense nucleic acids having a sequence of 7 to 50 nucleotides as primers specific for each marker gene. Primers may incorporate additional features that do not change the basic properties of the primer to serve as the starting point for DNA synthesis.

본 발명의 프라이머는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비제한적인 예로는 메틸화, "캡화", 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다. 핵산은 하나 이상의 부가적인 공유 결합된 잔기, 예를 들면, 단백질(예: 뉴클레아제, 독소, 항체, 시그날 펩타이드, 폴리-L-리신 등), 삽입제(예: 아크리딘, 프소랄렌 등), 킬레이트화제(예: 금속, 방사성 금속, 철, 산화성 금속 등), 및 알킬화제를 함유할 수 있다. 본 발명의 핵산 서열은 또한 검출 가능한 시그날을 직접적으로 또는 간접적으로 제공할 수 있는 표지를 이용하여 변형시킬 수 있다. 표지의 예로는 방사성 동위원소, 형광성 분자, 바이오틴 등이 있다.
The primers of the present invention can be chemically synthesized using the phosphoramidite solid support method, or other well-known methods. Such nucleic acid sequences may also be modified using a number of means known in the art. Non-limiting examples of such modifications include methylation, “encapsulation”, substitution of one or more homologues of natural nucleotides, and modifications between nucleotides, such as uncharged linkages such as methyl phosphonates, phosphotriesters, phospho poroamidates, carbamates, etc.) or charged linkages (eg phosphorothioates, phosphorodithioates, etc.). Nucleic acids may contain one or more additional covalently linked residues, e.g., proteins (e.g., nucleases, toxins, antibodies, signal peptides, poly-L-lysine, etc.), intercalating agents (e.g., acridine, psoralen, etc.) ), chelating agents (eg, metals, radioactive metals, iron, oxidizing metals, etc.), and alkylating agents. The nucleic acid sequences of the present invention may also be modified using labels capable of providing a detectable signal, either directly or indirectly. Examples of labels include radioactive isotopes, fluorescent molecules, biotin, and the like.

본 발명에서 "융합유전자를 측정하는 제제"는 대장암을 진단하기 위하여 생물학적 시료에서 대장암 마커 유전자인 본 발명의 융합유전자 존재 자체를 확인하는 과정으로, 예를 들어, 상기 융합유전자에 특이적으로 결합하는 프로브 또는 프라이머를 포함하는 것일 수 있다. 특히, 상기 융합유전자에 특이적으로 결합하는 프로브는 표 8의 특징을 갖는 프로브를 사용할 수 있으나, 이에 제한되지 않는다. 본 발명의 구체적인 실시예에서는 Abnova사에서 판매하는 NTRK1 Split FISH Probe( Cat# FS0024, Taiwan)의 프로브를 사용하여 측정하였다.
In the present invention, the "agent for measuring a fusion gene" is a process of confirming the existence of the fusion gene of the present invention, which is a colorectal cancer marker gene, in a biological sample for diagnosing colon cancer, for example, specifically to the fusion gene. It may include a binding probe or primer. In particular, as the probe specifically binding to the fusion gene, a probe having the characteristics of Table 8 may be used, but the present invention is not limited thereto. In a specific example of the present invention, measurements were made using a probe of the NTRK1 Split FISH Probe (Cat# FS0024, Taiwan) sold by Abnova.

본 발명에서 “단백질 발현수준 측정”이란 대장암을 진단하기 위하여 생물학적 시료에서 대장암 마커 유전자인 본 발명의 융합유전자로부터 발현된 단백질의 존재 여부와 발현 정도를 확인하는 과정으로, 바람직하게는, 상기 융합유전자의 단백질에 대하여 특이적으로 결합하는 항체를 이용하여 단백질의 양을 확인할 수 있다. In the present invention, "measurement of protein expression level" refers to a process of confirming the presence and expression level of a protein expressed from the fusion gene of the present invention, which is a colorectal cancer marker gene, in a biological sample for diagnosing colon cancer. The amount of the protein can be confirmed by using an antibody that specifically binds to the protein of the fusion gene.

특히, 본 발명에서 상기 융합유전자의 단백질에 대하여 특이적으로 결합하는 항체는 LMNA 또는 TPM3와 NTRK1의 융합위치 근방 또는 NTRK1의 C 말단에 결합하는 것일 수 있으나, 이에 제한되지 않는다. 이를 위한 분석 방법으로는 웨스턴 블랏, 엘라이자(enzyme linked immunosorbent assay,ELISA), 방사선면역분석(RIA: Radioimmunoassay), 방사 면역 확산법(radioimmunodiffusion), 오우크테로니(Ouchterlony) 면역 확산법, 로케트(rocket) 면역전기영동, 조직면역 염색, 면역침전 분석법(Immunoprecipitation Assay), 보체 고정 분석법(Complement Fixation Assay), 유세포분석(Fluorescence Activated Cell Sorter, FACS), 단백질 칩(protein chip) 등이 있으나 이로 제한되는 것은 아니다. In particular, in the present invention, the antibody that specifically binds to the protein of the fusion gene may be one that binds to LMNA or near the fusion site of TPM3 and NTRK1 or to the C terminus of NTRK1, but is not limited thereto. Analysis methods for this include Western blot, ELISA (enzyme linked immunosorbent assay, ELISA), radioimmunoassay (RIA), radioimmunodiffusion, Ouchterlony immunodiffusion method, and rocket. Immunoelectrophoresis, tissue immunostaining, Immunoprecipitation Assay, Complement Fixation Assay, Fluorescence Activated Cell Sorter (FACS), protein chip, etc., but are not limited thereto. .

바람직하게는, 상기 단백질의 수준을 측정하는 제제는 상기 단백질에 특이적인 항체를 포함하는 것인 대장암 진단용 조성물일 수 있다.Preferably, the agent for measuring the level of the protein may be a composition for diagnosing colon cancer comprising an antibody specific for the protein.

본 발명에서, “항체”란 항원성 부위에 대해서 지시되는 특이적인 단백질 분자를 의미한다. 본 발명의 목적상, 항체는 마커 단백질에 대해 특이적으로 결합하는 항체를 의미하며, 다클론 항체, 단클론 항체 및 재조합 항체를 모두 포함한다.
In the present invention, "antibody" refers to a specific protein molecule directed against an antigenic site. For the purposes of the present invention, an antibody refers to an antibody that specifically binds to a marker protein, and includes both polyclonal antibodies, monoclonal antibodies and recombinant antibodies.

상기한 바와 같이 본 발명에서는 신규한 대장암 마커 융합단백질이 규명되었으므로, 이를 이용하여 항체를 생성하는 것은 당업계에 널리 공지된 기술을 이용하여 용이하게 제조할 수 있다. As described above, since a novel colorectal cancer marker fusion protein has been identified in the present invention, it can be easily prepared using a technique well known in the art to generate an antibody using it.

다클론 항체는 상기한 대장암 마커 단백질 항원을 동물에 주사하고 동물로부터 채혈하여 항체를 포함하는 혈청을 수득하는 당업계에 널리 공지된 방법에 의해 생산할 수 있다. 이러한 다클론 항체는 염소, 토끼, 양, 원숭이, 말, 돼지, 소 개 등의 임의의 동물 종 숙주로부터 제조 가능하다. The polyclonal antibody can be produced by a method well known in the art for obtaining a serum containing the antibody by injecting the above-described colon cancer marker protein antigen into an animal and collecting blood from the animal. Such polyclonal antibodies can be prepared from hosts of any animal species, such as goats, rabbits, sheep, monkeys, horses, pigs, bovine dogs and the like.

단클론 항체는 당업계에 널리 공지된 하이브리도마 방법(hybridoma method)(Kohler 및 Milstein (1976) European Jounral of Immunology 6:511-519 참조), 또는 파지 항체 라이브러리(Clackson et al, Nature, 352:624-628, 1991; Marks et al, J. Mol. Biol., 222:58, 1-597, 1991) 기술을 이용하여 제조될 수 있다. 상기 방법으로 제조된 항체는 겔 전지영동, 투석, 염 침전, 이온교환 크로마토그래피, 친화성 크로마토그래피 등의 방법을 이용하여 분리, 정제할 수 있다. Monoclonal antibodies can be prepared using the hybridoma method well known in the art (see Kohler and Milstein (1976) European Jounral of Immunology 6:511-519), or a phage antibody library (Clackson et al, Nature, 352:624). -628, 1991; Marks et al, J. Mol. Biol., 222:58, 1-597, 1991). The antibody prepared by the above method may be separated and purified using methods such as gel electrophoresis, dialysis, salt precipitation, ion exchange chromatography, and affinity chromatography.

또한 본 발명의 항체는 2개의 전체 길이의 경쇄 및 2개의 전체 길이의 중쇄를 가지는 완전한 형태뿐만 아니라, 항체 분자의 기능적인 단편을 포함한다. 항체 분자의 기능적인 단편이란 적어도 항원 결합 기능을 보유하고 있는 단편을 뜻하며, Fab, F(ab'), F(ab') 2 및 Fv 등이 있다.
The antibodies of the present invention also include functional fragments of antibody molecules as well as complete forms having two full-length light chains and two full-length heavy chains. A functional fragment of an antibody molecule refers to a fragment having at least an antigen-binding function, and includes Fab, F(ab'), F(ab') 2 and Fv.

본 발명의 또 다른 양태에서는, 본 발명에 따른 상기 대장암 진단용 조성물을 포함하는 대장암 진단용 키트를 제공한다. In another aspect of the present invention, there is provided a kit for diagnosing colon cancer comprising the composition for diagnosing colon cancer according to the present invention.

구체적으로, 상기 대장암 진단용 키트는 역전자 중합효소-PCR(RT-PCR) 키트, DNA 칩 키트 또는 단백질 칩 키트일 수 있다. 특히, 상기 대장암 진단용 키트는 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성성분 조성물, 용액 또는 장치를 더 포함하여 구성될 수 있다. Specifically, the colorectal cancer diagnostic kit may be a reverse transcription polymerase-PCR (RT-PCR) kit, a DNA chip kit, or a protein chip kit. In particular, the colorectal cancer diagnostic kit may further include one or more other component compositions, solutions or devices suitable for the analysis method.

구체적인 일 양태로서, 상기 진단용 키트는 역전사 중합효소반응을 수행하기 위해 필요한 필수 요소를 포함하는 것을 특징으로 하는 진단용 키트일 수 있다. 역전사 중합효소반응 키트는 마커 유전자에 대한 특이적인 각각의 프라이머 쌍을 포함한다. 프라이머는 각 마커 유전자의 핵산서열에 특이적인 서열을 가지는 뉴클레오타이드로서, 약 7 bp 내지 50 bp의 길이, 보다 바람직하게는 약 10 bp 내지 30 bp 의 길이이다. 또한 대조군 유전자의 핵산 서열에 특이적인 프라이머를 포함할 수 있다. 그 외 역전사 중합효소반응 키트는 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사효소와 같은 효소, DNAse, RNAse 억제제 DEPC-수(DEPC-water), 멸균수 등을 포함할 수 있다. In a specific embodiment, the diagnostic kit may be a diagnostic kit comprising essential elements necessary for performing a reverse transcription polymerase reaction. The reverse transcription polymerase reaction kit includes each primer pair specific for a marker gene. The primer is a nucleotide having a sequence specific to the nucleic acid sequence of each marker gene, and has a length of about 7 bp to 50 bp, more preferably about 10 bp to 30 bp. It may also include primers specific for the nucleic acid sequence of the control gene. Other Reverse Transcription Polymerase Reaction Kits include test tubes or other suitable containers, reaction buffers (with varying pH and magnesium concentrations), deoxynucleotides (dNTPs), enzymes such as Taq-polymerase and reverse transcriptase, DNAse, RNAse inhibitor DEPC -Water (DEPC-water), sterile water, etc. may be included.

또 다른 양태로는, 바람직하게 DNA 칩을 수행하기 위해 필요한 필수 요소를 포함하는 것을 특징으로 하는 진단 키트일 수 있다. DNA 칩 키트는 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드 (oligonucleotide)가 부착되어 있는 기판, 및 형광표식 프로브를 제작하기 위한 시약, 제제, 효소 등을 포함할 수 있다. 또한 기판은 대조군 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드를 포함할 수 있다. In another aspect, it may preferably be a diagnostic kit comprising essential elements necessary for performing a DNA chip. The DNA chip kit may include a substrate to which cDNA or oligonucleotide corresponding to a gene or fragment thereof is attached, and reagents, agents, enzymes, and the like for preparing a fluorescent probe. The substrate may also contain cDNA or oligonucleotides corresponding to control genes or fragments thereof.

또한 바람직하게는, 단백질 칩을 수행하거나, ELISA를 수행하기 위해 필요한 필수 요소를 포함하는 것을 특징으로 하는 진단 키트일 수 있다. 단백질 칩 키트나 ELISA 키트는 마커 단백질에 대한 특이적인 항체를 포함한다. 항체는 각 마커 단백질에 대한 특이성 및 친화성이 높고 다른 단백질에 대한 교차 반응성이 거의 없는 항체로, 단클론 항체, 다클론 항체 또는 재조합 항체이다. 또한 ELISA 키트는 대조군 단백질에 특이적인 항체를 포함할 수 있다. 그 외 ELISA 키트는 결합된 항체를 검출할 수 있는 시약, 예를 들면, 표지된 2차 항체, 발색단(chromophores), 효소(예: 항체와 컨주게이트됨) 및 그의 기질 또는 항체와 결합할 수 있는 다른 물질 등을 포함할 수 있다.
Also preferably, it may be a diagnostic kit comprising essential elements necessary for performing a protein chip or performing ELISA. A protein chip kit or an ELISA kit includes an antibody specific for a marker protein. Antibodies are antibodies with high specificity and affinity for each marker protein and little cross-reactivity with other proteins, and are monoclonal antibodies, polyclonal antibodies, or recombinant antibodies. The ELISA kit may also include an antibody specific for a control protein. Other ELISA kits include reagents capable of detecting bound antibody, such as labeled secondary antibodies, chromophores, enzymes (eg, conjugated with an antibody) and substrates thereof or capable of binding the antibody. other materials and the like.

또 하나의 양태로서, 본 발명은 대장암 진단에 필요한 정보를 제공하기 위하여, NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계를 포함하는 대장암 진단에 필요한 정보를 제공하는 방법을 제공한다. 구체적으로, 대장암이 의심되는 개체의 분리된 시료로부터 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계; 및 상기 측정된 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준을 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준과 비교하는 단계를 포함하는, 대장암 진단에 필요한 정보를 제공하는 방법을 제공한다.In another aspect, the present invention provides a method of providing information necessary for diagnosing colorectal cancer, comprising measuring the level of the NTRK1 fusion gene, its transcript, or its protein, in order to provide information necessary for diagnosing colorectal cancer. to provide. Specifically, measuring the level of the NTRK1 fusion gene, its transcript or its protein from an isolated sample of an individual suspected of colon cancer; and comparing the measured expression level of the fusion gene, its transcript or its protein with the expression level of the fusion gene, its transcript, or its protein in a normal control sample. A method of providing information necessary for diagnosing colon cancer to provide.

본 발명에서 상기 NTRK1 융합유전자는 LMNA 유전자 또는 TPM3 유전자의 5' 말단을 구성하는 폴리뉴클레오티드; 및 NTRK1 유전자의 3' 말단을 구성하는 폴리뉴클레오티드일 수 있다.
In the present invention, the NTRK1 fusion gene includes a polynucleotide constituting the 5' end of the LMNA gene or the TPM3 gene; and a polynucleotide constituting the 3' end of the NTRK1 gene.

본 발명에서 "개체"란 대장암이 생길 수 있는 동물로, 대장암이 의심되는 한 제한되지 않는다. 또한, 상기 방법을 통하여 진단에 필요한 정보를 얻을 수 있는 질환으로는 TPM3 유전자 또는 LMNA 유전자와 NTRK1 유전자와의 융합유전자의 발현, 또는 NTRK1 유전자의 융합에 의존적으로 NTRK1 유전자의 발현이 인정되는 암종이라면 제한되지 않으며, 특히 대장암일 수 있다.
In the present invention, "individual" refers to an animal that can develop colon cancer, and is not limited as long as colon cancer is suspected. In addition, as a disease for which information necessary for diagnosis can be obtained through the above method, the expression of a fusion gene of the TPM3 gene or the LMNA gene and the NTRK1 gene, or the expression of the NTRK1 gene depending on the fusion of the NTRK1 gene is limited. It may not, in particular, be colon cancer.

본 발명에서 용어, 개체의 시료란 대장암 마커인 LMNA-NTRK1 또는 TPM3-NTRK1 융합유전자의 mRNA 또는 이의 단백질의 수준이 차이나는 조직, 예를 들면, 세포, 조직, 장기, 체액(혈액, 림프액 등), 소화액, 객담, 폐포-기관지 세정액, 뇨, 변뿐만 아니라, 이들의 생체 시료로부터 얻어지는 핵산 추출물(유전체 추출물, 전사체 추출물, 전사체 추출물로부터 조제된 cDNA 조제물이나 aRNA 조제물 등)이나 단백질 추출물도 포함등을 포함하며, 이에 제한되지 않는다. 한다. 또한, 상기 시료는, 포르말린 고정 처리, 알코올 고정 처리, 동결 처리 또는 파라핀 포매 처리가 실시되어 있는 것이어도 된다. 또한, 유전자, 전사산물, cDNA 또는 단백질은, 상기 시료의 종류 및 상태 등을 고려하여, 거기에 적합한 공지의 수법을 선택하여 조제하는 것이 가능하다.
In the present invention, as used herein, the subject's sample is a tissue in which the level of mRNA of the LMNA-NTRK1 or TPM3-NTRK1 fusion gene, which is a colorectal cancer marker, or its protein is different, for example, cells, tissues, organs, body fluids (blood, lymph fluid, etc.) ), digestive fluid, sputum, alveolar-bronchial lavage fluid, urine, feces, as well as nucleic acid extracts (genomic extracts, transcriptome extracts, cDNA preparations or aRNA preparations prepared from transcriptomic extracts) or proteins obtained from these biological samples Extracts include, but are not limited to. do. In addition, the sample may have been subjected to formalin fixation treatment, alcohol fixation treatment, freezing treatment or paraffin embedding treatment. In addition, the gene, transcript, cDNA, or protein can be prepared by selecting a known method suitable for it, taking into consideration the type and state of the sample, and the like.

상기 검출 방법들을 통하여, 정상 대조군에서의 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 발현 수준을 대장암 의심 개체에서의 발현 수준과 비교함으로써 대장암 의심 개체의 실제 대장암 여부를 진단할 수 있다. 즉, 대장암으로 추측되는 세포에 대해서 본 발명의 마커의 발현 수준을 측정하고, 정상 세포에 대해서 본 발명의 마커의 발현 수준을 측정하여 양자를 비교한 후, 본 발명의 마커의 발현 수준이 정상 세포의 것보다 대장암으로 추측되는 세포 유래에서 더 많이 발현되면 대장암으로 추측되는 세포를 대장암으로 판단할 수 있는 것이다. 즉, 상기 방법에서 대장암이 의심되는 개체의 분리된 시료로부터 측정된 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준이 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준보다 높을 경우, 대장암으로 진단하는 것을 특징으로 할 수 있다.
Through the above detection methods, by comparing the expression level of the NTRK1 fusion gene, its transcript, or its protein in the normal control with the expression level in the suspected colorectal cancer individual, it is possible to diagnose whether the colorectal cancer-suspected individual actually has colorectal cancer. That is, after measuring the expression level of the marker of the present invention in cells suspected of colorectal cancer, measuring the expression level of the marker of the present invention in normal cells and comparing both, the expression level of the marker of the present invention is normal If the expression is more from the cells estimated to be colorectal cancer than that of the cells, the cells estimated to be colorectal cancer can be judged as colorectal cancer. That is, when the expression level of the fusion gene, its transcript, or protein thereof measured from the isolated sample of an individual suspected of colon cancer in the above method is higher than the expression level of the fusion gene, its transcript, or its protein in the normal control sample, the large intestine It may be characterized in that it is diagnosed as cancer.

LMNA-NTRK1 또는 TPM3-NTRK1 융합유전자의 mRNA 또는 이의 단백질의 수준을 측정하기 위한 분석 방법으로는, 웨스턴 블랏, ELISA, 방사선면역분석, 방사 면역 확산법, 오우크테로니 면역 확산법, 로케트 면역전기영동, 조직면역 염색, 면역침전 분석법, 보체 고정 분석법, FACS, 단백질 칩 등이 있으나 이로 제한되는 것은 아니다. 상기 분석 방법들을 통하여, 정상 대조군에서의 항원-항체 복합체의 형성량과 대장암 의심 개체에서의 항원-항체 복합체의 형성량을 비교할 수 있고, 대장암 마커 유전자에서 LMNA-NTRK1 또는 TPM3-NTRK1 융합단백질으로의 유의한 발현량의 증가여부를 판단하여, 대장암 의심 환자의 실제 대장암 발병 여부를 진단할 수 있다.
As an analysis method for measuring the level of mRNA or protein thereof of the LMNA-NTRK1 or TPM3-NTRK1 fusion gene, Western blot, ELISA, radioimmunoassay, radioimmunodiffusion method, Oukteroni immunodiffusion method, rocket immunoelectrophoresis, tissue immunostaining, immunoprecipitation assay, complement fixation assay, FACS, protein chip, etc., but are not limited thereto. Through the above analysis methods, the amount of antigen-antibody complex formation in the normal control group and the antigen-antibody complex formation amount in the colorectal cancer suspect can be compared, and the LMNA-NTRK1 or TPM3-NTRK1 fusion protein in the colon cancer marker gene By judging whether or not there is a significant increase in the expression level, it is possible to diagnose whether a patient suspected of colon cancer actually develops colorectal cancer.

본 발명에서 용어 항원-항체 복합체란 대장암 마커 단백질과 이에 특이적인 항체의 결합물을 의미하고, 항원-항체 복합체의 형성 량은 검출 라벨(detection label)의 시그널의 크기를 통해서 정량적으로 측정 가능하다.
In the present invention, the term antigen-antibody complex refers to a combination of a colorectal cancer marker protein and an antibody specific thereto, and the amount of antigen-antibody complex formation can be quantitatively measured through the size of a signal of a detection label. .

이러한 검출 라벨은 효소, 형광물, 리간드, 발광물, 미소입자(microparticle), 레독스 분자 및 방사선 동위원소로 이루어진 그룹중에서 선택할 수 있으며, 반드시 이로 제한되는 것은 아니다. 검출 라벨로서 효소가 사용되는 경우 이용 가능한 효소에는 β-글루쿠로니다제, β-D-글루코시다제, β-D-갈락토시다제, 우레아제, 퍼옥시다아제 또는 알칼라인 포스파타아제, 아세틸콜린에스테라제, 글루코즈 옥시다제, 헥소키나제와 GDPase, RNase, 글루코즈 옥시다제와 루시페라제, 포스포프럭토키나제, 포스포에놀피루베이트 카복실라제, 아스파르테이트 아미노트랜스페라제, 포스페놀피루베이트 데카복실라제, β-라타마제 등이 있으며 이로 제한되지 않는다. 형광물에는 플루오레신, 이소티오시아네이트, 로다민, 피코에리테린, 피코시아닌, 알로피코시아닌, o-프탈데히드, 플루오레스카민 등이 있으며 이로 제한되지 않는다. 리간드에는 바이오틴 유도체 등이 있으며 이로 제한되지 않는다. 발광물에는 아크리디늄 에스테르, 루시페린, 루시퍼라아제 등이 있으며 이로 제한되지 않는다. 미소입자에는 콜로이드 금, 착색된 라텍스 등이 있으며 이로 제한되지 않는다. 레독스 분자에는 페로센, 루테늄 착화합물, 바이올로젠, 퀴논, Ti 이온, Cs 이온, 디이미드, 1,4-벤조퀴논, 하이드로퀴논, K4 W(CN)8 , [Os(bpy) 3 ] 2+ ,[RU(bpy) 3 ] 2+, [MO(CN) 8 ] 4- 등이 포함되며 이로 제한되지 않는다. 방사선동위원소에는 3H, 14C, 32P, 35S, 36Cl, 51Cr, 57Co, 58Co, 59Fe, 90Y, 125I, 131I , 186Re 등이 포함되며 이로 제한되지 않는다.
The detection label may be selected from the group consisting of an enzyme, a fluorescent substance, a ligand, a luminescent substance, a microparticle, a redox molecule, and a radioisotope, but is not limited thereto. When an enzyme is used as the detection label, available enzymes include β-glucuronidase, β-D-glucosidase, β-D-galactosidase, urease, peroxidase or alkaline phosphatase, acetylcholine Therase, glucose oxidase, hexokinase and GDPase, RNase, glucose oxidase and luciferase, phosphofructokinase, phosphoenolpyruvate carboxylase, aspartate aminotransferase, phosphophenolpyruvate deca Voxylase, β-latamase, and the like, but are not limited thereto. Fluorescent materials include, but are not limited to, fluorescein, isothiocyanate, rhodamine, phycoerythrine, phycocyanin, allophycocyanin, o-phthalaldehyde, fluorescamine, and the like. Ligands include, but are not limited to, biotin derivatives. Luminescent materials include, but are not limited to, acridinium esters, luciferin, luciferase, and the like. Microparticles include, but are not limited to, colloidal gold, colored latex, and the like. Redox molecules include ferrocene, ruthenium complex, viologen, quinone, Ti ion, Cs ion, diimide, 1,4-benzoquinone, hydroquinone, K4 W(CN)8 , [Os(bpy) 3 ] 2+ , [RU(bpy) 3 ] 2+, [MO(CN) 8 ] 4-, and the like. Radioisotopes include, but are not limited to, 3H, 14C, 32P, 35S, 36Cl, 51Cr, 57Co, 58Co, 59Fe, 90Y, 125I, 131I, 186Re, and the like.

단백질 발현수준 측정은 바람직하게는, ELISA법을 이용하는 것이다. ELISA는 고체 지지체에 부착된 항원을 인지하는 표지된 항체를 이용하는 직접적 ELISA, 고체 지지체에 부착된 항원을 인지하는 항체의 복합체에서 포획 항체를 인지하는 표지된 항체를 이용하는 간접적 ELISA, 고체 지지체에 부착된 항체와 항원의 복합체에서 항원을 인지하는 표지된 또 다른 항체를 이용하는 직접적 샌드위치 ELISA, 고체 지지체에 부착된 항체와 항원의 복합체에서 항원을 인지하는 또 다른 항체와 반응시킨 후 이 항체를 인지하는 표지된 2차 항체를 이용하는 간접적 샌드위치 ELISA 등 다양한 ELISA 방법을 포함한다. 보다 바람직하게는, 고체 지지체에 항체를 부착시키고 시료를 반응시킨 후 항원-항체 복합체의 항원을 인지하는 표지된 항체를 부착시켜 효소 적으로 발색시키거나 항원-항체 복합체의 항원을 인지하는 항체에 대해 표지된 2차 항체를 부착시켜 효소 적으로 발색시키는 샌드위치 ELISA 방법에 의해서 검출한다. 대장암 마커 단백질과 항체의 복합체 형성 정도를 확인하여, 대장암 발병 여부를 확인할 수 있다.
The protein expression level is preferably measured using an ELISA method. ELISA is a direct ELISA using a labeled antibody recognizing an antigen attached to a solid support, an indirect ELISA using a labeled antibody recognizing a capture antibody in a complex of an antibody recognizing an antigen attached to a solid support, and an indirect ELISA using a labeled antibody recognizing an antigen attached to a solid support. Direct sandwich ELISA using another labeled antibody that recognizes an antigen in a complex of an antibody and antigen, reacts with another antibody that recognizes an antigen in a complex of an antibody attached to a solid support and antigen, and then a labeled antibody that recognizes the antibody It includes various ELISA methods, such as an indirect sandwich ELISA using a secondary antibody. More preferably, after attaching an antibody to a solid support and reacting the sample, a labeled antibody recognizing the antigen of the antigen-antibody complex is attached to enzymatically develop color or for an antibody recognizing the antigen of the antigen-antibody complex It is detected by a sandwich ELISA method in which a labeled secondary antibody is attached to enzymatically develop color. By confirming the degree of formation of a complex between the colorectal cancer marker protein and the antibody, it is possible to determine whether colorectal cancer occurs.

또한, 바람직하게는, 상기 대장암 마커에 대한 하나 이상의 항체를 이용한 웨스턴 블랏을 이용하는 것이다. 시료에서 전체 단백질을 분리하고, 이를 전기영동하여 단백질을 크기에 따라 분리한 다음, 니트로셀룰로즈 막으로 이동시켜 항체와 반응시킨다. 생성된 항원-항체 복합체의 양을 표지된 항체를 이용하여 확인하는 방법으로 유전자의 발현에 의해 생성된 단백질의 양을 확인하여, 대장암 발병 여부를 확인할 수 있다. 상기 검출 방법은 대조군에서의 마커 유전자의 발현 량과 대장암이 발병한 세포에서의 마커 유전자의 발현 량을 조사하는 방법으로 이루어진다. 펩티드 단편의 수준은 상기한 마커 단백질의 절대적(예: ㎍/㎖) 또는 상대적(예: 시그널의 상대 강도) 차이로 나타낼 수 있다.
Also, preferably, Western blot using one or more antibodies against the colorectal cancer marker is used. The total protein is separated from the sample, and the protein is separated according to size by electrophoresis, and then transferred to a nitrocellulose membrane to react with the antibody. In a method of confirming the amount of the generated antigen-antibody complex using a labeled antibody, the amount of the protein generated by gene expression can be checked to determine whether colon cancer occurs. The detection method consists of a method of examining the expression level of the marker gene in the control group and the expression level of the marker gene in the colorectal cancer-infected cells. The level of the peptide fragment can be expressed as an absolute (eg, μg/ml) or relative (eg, relative intensity of signal) difference of the above-described marker protein.

또한, 바람직하게는, 상기 대장암 마커에 대한 하나 이상의 항체가 기판 위의 정해진 위치에 배열되어 고밀도로 고정화되어 있는 단백질 칩을 이용하는 것이다. 단백질 칩을 이용하여 시료를 분석하는 방법은, 시료에서 단백질을 분리하고, 분리한 단백질을 단백질 칩과 혼성화시켜서 항원-항체 복합체를 형성시키고, 이를 판독하여, 단백질의 존재 또는 발현 정도를 확인하여, 대장암 발병 여부를 확인할 수 있다.
Also, preferably, one or more antibodies against the colorectal cancer marker are arranged at a predetermined position on a substrate and immobilized at a high density using a protein chip. In the method of analyzing a sample using a protein chip, the protein is separated from the sample, the separated protein is hybridized with the protein chip to form an antigen-antibody complex, and the presence or expression level of the protein is checked by reading it, You can check if you have colon cancer.

구체적으로, 본 발명의 구체적인 대장암 의심 개체의 임상 시료에서 상기 융합단백질, 융합유전자 또는 전사산물을 검출하기 위하여 (a) 상기 임상 시료에 상기 융합단백질, 이를 암호화하는 융합유전자 및 상기 융합유전자에 상응하는 전사산물로 이루어진 군에서 선택된 1종 이상과 상호작용하는 물질을 처리(첨가)하고 반응시키는 단계; 및 (b) 상기 과정을 통해 얻어진 반응물을 검출하는 단계를 포함할 수 있다. 상기 단계 (a) 이전에 임상 시료를 준비하는 단계를 추가로 포함할 수 있으며, 상기 임상 시료를 준비하는 단계는 대장암 의심 개체로부터 임상 시료를 얻는(분리하는) 단계를 포함하는 것일 수 있다. 상기 단계 (a)에서 상기 상호작용하는 물질은 상기 융합단백질(전부 또는 일부; 예컨대 융합 부위)에 특이적으로 결합하는 화합물, 항체, 앱타머 및 상기 융합유전자 또는 전사산물(전부 또는 일부; 예컨대 융합 부위)에 결합하는 핵산 분자(예컨대, 프라이머, 프로브, 앱타머 등), 화합물 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 이들 상호작용 하는 물질은 자유 래디컬, 방사성-동위원소, 형광염료, 발색기질, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상의 면역화학적 표지 물질이 부착되거나, 상기 표지 물질과 함께 사용될 수 있다. 상기 단계 (b)에서, 상기 반응물은 단계 (a)에서 얻어진 상기 융합단백질, 융합유전자, 및 전사산물로 이루어진 군에서 선택된 1종 이상과 이와 상호작용하는 물질이 상호작용(결합)하여 생성된 복합체(complex)일 수 있다. 상기 반응물을 검출하는 단계에서 반응물이 검출되면 상기 융합단백질, 융합유전자 또는 전사산물이 존재하는 것으로 판단할 수 있다.
Specifically, in order to detect the fusion protein, the fusion gene, or the transcript in the clinical sample of a specific colorectal cancer suspect of the present invention, (a) the fusion protein, the fusion gene encoding it, and the fusion gene correspond to the clinical sample treating (adding) and reacting a substance that interacts with one or more selected from the group consisting of a transcription product; and (b) detecting the reactant obtained through the above process. It may further include the step of preparing a clinical sample prior to step (a), and the step of preparing the clinical sample may include obtaining (separating) a clinical sample from a subject suspected of colon cancer. In step (a), the interacting substance is a compound, antibody, aptamer, and the fusion gene or transcript (all or part; such as a fusion site) that specifically binds to the fusion protein (all or a part; for example, a fusion site). site) binding to nucleic acid molecules (eg, primers, probes, aptamers, etc.), and may be at least one selected from the group consisting of compounds. One or more immunochemical labeling materials selected from the group consisting of free radicals, radioactive isotopes, fluorescent dyes, chromogenic substrates, enzymes, bacteriophages, coenzymes, etc. are attached to these interacting substances, or can be used together with the labeling substances. . In step (b), the reactant is a complex produced by interaction (binding) between one or more selected from the group consisting of the fusion protein, fusion gene, and transcript obtained in step (a) and a substance interacting therewith (complex). When the reactant is detected in the step of detecting the reactant, it may be determined that the fusion protein, fusion gene or transcript is present.

NTRK1 융합단백질을 암호화하는 융합유전자 또는 이에 상응하는 전사산물과 상호작용하는 물질은 상기 융합유전자 또는 전사산물과 혼성화가 가능한 핵산 분자일 수 있다. 예컨대, 상기 핵산 분자는 임상 시료 내의 상기 융합유전자, 상기 융합유전자의 융합 부위 또는 상기 융합유전자 또는 융합 부위에 상응하는 전사산물과 특이적으로 혼성화가 가능한 안티센스 올리고뉴클레오타이드(예컨대, siRNA, 마이크로RNA 등), 프로브(예컨대, 5 내지 100 bp, 5 내지 50bp, 5 내지 30bp, 또는 5 내지 25bp), 앱타머 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 예컨대, 상기 융합단백질을 암호화하는 융합유전자 또는 융합유전자에 상응하는 전사산물 분자와 혼성화가 가능한 핵산 분자는 상기 융합유전자 내의 융합 부위를 포함하는 연속하는 50 내지 250개, 구체적으로 100 내지 200개의 염기로 이루어진 폴리뉴클레오타이드 단편을 증폭할 수 있도록 상기 폴리뉴클레오타이드 단편의 양 말단에 인접하는 20 내지 100개, 구체적으로 25 내지 50개의 염기서열 또는 이와 상보적인 서열과 혼성화가 가능한 20 내지 100bp, 또는 25 내지 50bp 길이의 프라이머쌍일 수 있다. 상기 '혼성화가 가능하다'함은 검출 대상 염기서열과 완전히 상보적이거나, 80% 이상(예컨대 80-100%), 구체적으로 90% 이상(예컨대 90-100%) 상보적인 염기서열을 가져서 상기 검출 대상 유전자 또는 전사산물과 특이적으로 결합 가능함을 의미한다.
The substance that interacts with the fusion gene encoding the NTRK1 fusion protein or a corresponding transcript may be a nucleic acid molecule capable of hybridizing with the fusion gene or transcript. For example, the nucleic acid molecule is an antisense oligonucleotide (eg, siRNA, microRNA, etc.) capable of specifically hybridizing with the fusion gene in the clinical sample, the fusion site of the fusion gene, or a transcript corresponding to the fusion gene or the fusion site. , a probe (eg, 5 to 100 bp, 5 to 50 bp, 5 to 30 bp, or 5 to 25 bp), and may be at least one selected from the group consisting of an aptamer. For example, a nucleic acid molecule capable of hybridizing with a fusion gene encoding the fusion protein or a transcript molecule corresponding to the fusion gene is 50 to 250 consecutive, specifically 100 to 200 bases including the fusion site in the fusion gene. 20 to 100, specifically 25 to 50 nucleotide sequences adjacent to both ends of the polynucleotide fragment, or a sequence complementary thereto, and 20 to 100 bp, or 25 to 50 bp in length to amplify the polynucleotide fragment consisting of may be a pair of primers. The 'hybridization is possible' means that the detection target nucleotide sequence is completely complementary, or has a nucleotide sequence that is 80% or more (eg 80-100%), specifically 90% or more (eg 90-100%) complementary nucleotide sequence. It means that it can specifically bind to a target gene or transcript.

또 다른 예에서, NTRK1 융합유전자 또는 이의 전사산물과 특이적으로 상호작용하는 물질은 자유 래디컬, 방사성-동위원소, 형광염료, 발색기질, 효소, 박테리오파지, 조효소 등으로 이루어진 군에서 선택된 1종 이상의 면역화학적 표지 물질이 부착되거나, 상기 표지 물질과 함께 사용될 수 있다. 예컨대, 각 융합유전자에 혼성 가능한 형광직접접합법(fluorescence in situ hybridization)용 프로브와 연쇄중합반응(polymerase chain reaction)용 프라이머쌍을 이용할 수 있다(표 8 및 표 9).
In another example, the substance that specifically interacts with the NTRK1 fusion gene or its transcript is at least one selected from the group consisting of free radicals, radioactive-isotopes, fluorescent dyes, chromogenic substrates, enzymes, bacteriophages, coenzymes, etc. A chemical labeling substance may be attached or used together with the labeling substance. For example, a probe for fluorescence in situ hybridization capable of hybridizing to each fusion gene and a primer pair for polymerase chain reaction can be used (Tables 8 and 9).

또 다른 예에서, NTRK1 융합단백질의 검출은 상기 융합단백질 또는 대장암에서 NTRK1 유전자의 융합에 의존적으로 발현하는 NTRK1 단백질과 상호작용하는 물질, 예컨대 특이적으로 결합하는 물질(예컨대, 항체, 앱타머 또는 화합물 등)을 이용하여 상기 융합단백질과 상기 물질(예컨대, 항체 또는 앱타머)과의 상호작용, 즉 복합체 형성을 검출하는 통상적인 에세이법, 예컨대, 면역크로마토그래피(immunochromatography), 면역조직학염색(immunohistochemistry), 효소결합 면역흡착 분석(enzyme linked immunosorbent assay), 방사선 면역측정법(radioimmunoassay), 효소 면역분석(enzyme immunoassay), 형광면역분석(fluorescence immunoassay), 발광면역분석(luminescence immunoassay), 웨스턴블라팅(western blotting) 및 유세포분석(flow cytometry cell sorting) 등에 의하여 검출할 수 있다.
In another example, the detection of the NTRK1 fusion protein is the fusion protein or a substance that interacts with the NTRK1 protein fusion-dependently expressed in colorectal cancer, such as a substance that specifically binds (eg, an antibody, an aptamer or compound) using a conventional assay method for detecting the interaction between the fusion protein and the substance (eg, antibody or aptamer), that is, formation of a complex, eg, immunochromatography, immunohistochemistry ), enzyme linked immunosorbent assay, radioimmunoassay, enzyme immunoassay, fluorescence immunoassay, luminescence immunoassay, western blotting blotting) and flow cytometry (cell sorting).

또 하나의 양태로서, 본 발명은 대장암 환자의 분리된 시료로부터 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계를 포함하는 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법을 제공한다.In another aspect, the present invention provides a method for providing information necessary for predicting a colorectal cancer treatment prognosis, comprising measuring the level of the NTRK1 fusion gene, its transcript, or its protein from an isolated sample of a colorectal cancer patient. to provide.

구체적으로, 본 발명은 대장암 환자의 분리된 시료로부터 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계; 및 상기 측정된 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준을 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준과 비교하는 단계를 포함하는, 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법Specifically, the present invention comprises the steps of measuring the level of an NTRK1 fusion gene, a transcript thereof or a protein thereof from an isolated sample of a colorectal cancer patient; and comparing the measured expression level of the fusion gene, its transcript or its protein with the fusion gene, its transcript, or its protein expression level in a normal control sample, providing information necessary for predicting the prognosis of colorectal cancer treatment How to

상기 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질 수준을 측정하는 단계는 상기 대장암 진단에 필요한 정보를 제공하는 방법에서 설명한 바와 거의 동일하다.The step of measuring the level of the NTRK1 fusion gene, its transcript, or its protein is almost the same as described in the method for providing information necessary for diagnosing colorectal cancer.

다만, 측정하는 시료가 대장암 의심 개체의 분리된 시료가 아닌 대장암 환자의 분리된 시료라는 측면과, 본 발명에서 정상 대조군이란 NTRK1 융합유전자가 발현되지 않은 정상군 및 대장암 환자군이라는 측면에서 차이가 있다.However, there is a difference in the aspect that the sample to be measured is an isolated sample of a colorectal cancer patient rather than an isolated sample of a suspected colon cancer individual, and a normal control group in the present invention is a normal group and a colorectal cancer patient group in which the NTRK1 fusion gene is not expressed. there is

본 발명에서 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법은 대장암 환자의 분리된 시료로부터 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준이 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준보다 높을 경우, 같거나 낮을 경우보다 대장암 치료 예후가 나쁠 것으로 예측하는 것을 특징으로 하는 것일 수 있다. 또한, NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준을 비교하는 것에는 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질 발현 여부를 확인하는 것이 포함된다. 즉, NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질 발현되지 않은 대장암 환자보다 발현된 대장암 환자가 대장암 치료 예후가 나쁠 것으로 예측하는 것을 포함한다.
In the present invention, the method for providing information necessary for predicting colorectal cancer treatment prognosis is the NTRK1 fusion gene, its transcript, or its protein expression level of a normal control sample from a sample isolated from a colorectal cancer patient. When it is higher than the protein expression level, it may be characterized in that the prognosis of colorectal cancer treatment is predicted to be worse than when it is the same or lower than the protein expression level. In addition, comparing the expression level of the NTRK1 fusion gene, its transcript, or its protein includes determining whether the NTRK1 fusion gene, its transcript, or its protein is expressed. That is, it includes predicting that a colorectal cancer patient expressing the NTRK1 fusion gene, a transcript thereof, or a protein thereof will have a poorer colorectal cancer treatment prognosis than a colorectal cancer patient not expressing the expression.

또한, 본 발명에서 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법은 대장암 환자의 분리된 시료로부터 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준이 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준보다 높을 경우, NTRK1 단백질 저해제에 의한 대장암 치료 유효성이 높다고 예측하는 것을 특징으로 하는 것일 수 있다.
In addition, in the present invention, the method for providing information necessary for predicting the treatment prognosis for colorectal cancer is a fusion gene, its transcript, or its protein expression level of a normal control sample from a sample isolated from a colorectal cancer patient. When it is higher than its protein expression level, it may be characterized in that it is predicted that the colorectal cancer treatment efficacy by the NTRK1 protein inhibitor is high.

한편, 본 발명에서 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법은 대장암 환자의 분리된 세포에 NTRK1 융합단백질 저해제를 처리하여, NTRK1 융합유전자의 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계를 포함하는 것일 수 있다.On the other hand, in the present invention, the method of providing information necessary for predicting the prognosis of colorectal cancer treatment is to treat isolated cells of colorectal cancer patients with an NTRK1 fusion protein inhibitor, and the NTRK1 fusion gene of the NTRK1 fusion gene, its transcript, or its protein. It may include the step of measuring the level.

본 발명에 있어서 대장암 치료의 유효성을 평가하는 대상이 되는 'NTRK1 단백질 저해제'로서는, NTRK1 단백질의 기능을 직접적으로 또는 간접적으로 억제할 수 있는 물질이면 특별한 제한은 없다. NTRK1 단백질의 기능, 구체적으로는 티로신키아나제, 구체적으로는 기타의 티로신키아나제를 저해할 수 있는 물질이어도 된다. 본 발명에 적용할 수 있는 공지의 NTRK1 단백질 저해제로서는, 예를 들면, (5S,6S,8R)-6-하이드록시-6-(하이드록시메틸)-5-메틸-7,8,14,15-테트라하이드로-5H-16-옥사-4b,8a,14-트리아자-5,8-메타노이벤조[b,h]사이클로옥타[jkl]사이클로펜타[e]-아스-인다센-13(6H)-원(일반명: 레스타우르티닙(lestaurtinib): FLT3, JAK2, TRKA, TRKB 및 TRKC를 표적으로 하는 화합물), N-[5-((2R)-2-메톡시-2-페닐에타노일)-1,4,5,6-테트라하이드로피롤로[3,4-c]피파졸-3-일]-4-(4-메틸피페라진-1-일)벤자마이드(일반명: 다누세르팁(danusertib): ARK1, RET, ABL, FGFR1, TRKA를 표적으로 하는 화합물), N,1,4,4-테트라메일-8-((4-(4-메틸피페라진-1-일)페닐)아미노)-4,5-디하이드로-1H-피라졸로[4,3-h]퀴나졸린-3-카복사마이드 (일반명: 미르시클립(milciclib): CDK2, TRKA, TRKB, TRKC를 표적으로 하는 화합물), RXDX-101 (코드명: ROS1, ALK, TRKA를 표적으로 하는 화합물), TSR-011 (코드명: TRKA, TRKB, TRKC, ALK를 표적으로 하는 화합물), PLX-7486 (코드명: CSF1R, TRKA, TRKB, TRKC를 표적으로 하는 화합물), NMS-E628 (코드명: ROS1, JAK2, ALK, TRKA를 표적으로 하는 화합물), 코드명 AZD-7451의 화합물 (TRKA, TRKB, TRKC를 표적으로 하는 화합물), 코드명 NMS-P626의 화합물 (TRKA를 표적으로 하는 화합물), 코드명 RXDX-102의 화합물 (TRKA를 표적으로 하는 화합물), 코드명 ARRY-47의 화합물 (TRKA, TRKB, TRKC를 표적으로 하는 화합물)을 들 수 있다.
In the present invention, the 'NTRK1 protein inhibitor' to be evaluated for the efficacy of colorectal cancer treatment is not particularly limited as long as it is a substance capable of directly or indirectly inhibiting the function of NTRK1 protein. Substances capable of inhibiting the function of NTRK1 protein, specifically, tyrosine kinase, specifically, other tyrosine kinases may be used. As known NTRK1 protein inhibitors applicable to the present invention, for example, (5S,6S,8R)-6-hydroxy-6-(hydroxymethyl)-5-methyl-7,8,14,15 -tetrahydro-5H-16-oxa-4b,8a,14-triaza-5,8-methanoibenzo[b,h]cycloocta[jkl]cyclopenta[e]-as-indacene-13 (6H )-one (generic name: lestaurtinib: compounds targeting FLT3, JAK2, TRKA, TRKB and TRKC), N-[5-((2R)-2-methoxy-2-phenyleta noyl)-1,4,5,6-tetrahydropyrrolo[3,4-c]pipeazol-3-yl]-4-(4-methylpiperazin-1-yl)benzamide (generic name: Danu) Sertib (danusertib): compounds targeting ARK1, RET, ABL, FGFR1, TRKA), N,1,4,4-tetramail-8-((4-(4-methylpiperazin-1-yl) Phenyl)amino)-4,5-dihydro-1H-pyrazolo[4,3-h]quinazoline-3-carboxamide (generic name: milciclib: CDK2, TRKA, TRKB, TRKC compounds targeting), RXDX-101 (codenames: compounds targeting ROS1, ALK, TRKA), TSR-011 (codenames: compounds targeting TRKA, TRKB, TRKC, ALK), PLX-7486 ( Codenames: compounds targeting CSF1R, TRKA, TRKB, TRKC), NMS-E628 (codenames: compounds targeting ROS1, JAK2, ALK, TRKA), compounds with codenames AZD-7451 (TRKA, TRKB, A compound targeting TRKC), a compound with the code name NMS-P626 (a compound targeting TRKA), a compound with the code name RXDX-102 (a compound targeting TRKA), a compound with the code name ARRY-47 (TRKA, TRKB, compounds targeting TRKC).

본 발명의 구체적인 일 실시예에서는 NTRK1 융합유전자에 의한 암호화되는 단백질의 발현에 따라 216명의 한국인 대장암 환자 코호트의 10년 생존기간을 분석하여 NTRK1 융합단백질이 발현된 63명의 대장암 환자는 NTRK1 융합단백질이 발현되지 않는 153명의 대장암 환자에 비하여 생존기간이 유의적으로 단축되는 것을 확인하였다(도 12). 이는 대장암 환자에서 NTRK1 융합유전자 및 이로부터 발현되는 융합단백질이 측정될 경우 대장암 치료 예후가 나쁘다는 것을 확인한 것이다.
In a specific embodiment of the present invention, the 10-year survival period of a cohort of 216 Korean colorectal cancer patients was analyzed according to the expression of the protein encoded by the NTRK1 fusion gene, and the NTRK1 fusion protein was expressed in 63 colorectal cancer patients expressing the NTRK1 fusion protein. It was confirmed that the survival period was significantly shortened compared to 153 colorectal cancer patients who did not express this (FIG. 12). This confirms that the prognosis of colorectal cancer treatment is poor when the NTRK1 fusion gene and the fusion protein expressed therefrom are measured in colorectal cancer patients.

또 하나의 양태로서, 본 발명은 NTRK1 융합유전자의 발현 수준을 측정하는 단계를 포함하는 대장암 치료제의 스크리닝 방법을 제공하며, 구체적으로 대장암 치료용 후보물질을 NTRK1 융합유전자를 발현하는 세포에 처리하는 단계; 및 상기 NTRK1 융합유전자의 발현 수준을 측정하는 단계를 포함하는, 대장암 치료제의 스크리닝 방법을 제공한다.In another aspect, the present invention provides a screening method for a colorectal cancer therapeutic agent comprising the step of measuring the expression level of the NTRK1 fusion gene, specifically, treating a candidate material for colorectal cancer treatment to cells expressing the NTRK1 fusion gene to do; and measuring the expression level of the NTRK1 fusion gene.

본 발명에서 NTRK1 융합유전자는 상기 설명한 바와 같다.
In the present invention, the NTRK1 fusion gene is as described above.

본 발명에서 NTRK1 융합유전자의 발현 수준을 측정하는 것에는, 융합유전자의 전사산물 및 이의 단백질 등의 수준을 측정하는 방법 등이 있고, 상기 융합유전자의 전사산물의 수준을 측정하는 방법이나 융합단백질의 수준을 측정하는 방법은 상기 설명한 바와 같다.In the present invention, measuring the expression level of the NTRK1 fusion gene includes a method of measuring the level of a transcript of the fusion gene and a protein thereof, and a method of measuring the level of the transcript of the fusion gene or the fusion protein. The method for measuring the level is the same as described above.

본 발명의 대장암 치료제의 스크리닝 방법은 특히 대장암 치료용 후보물질 처리에 의해 NTRK1 융합유전자의 발현 수준이 낮아질 경우, 대장암 치료제로 판단하는 것일 수 있다.In the screening method for a colorectal cancer therapeutic agent of the present invention, in particular, when the expression level of the NTRK1 fusion gene is lowered by treatment with a candidate substance for colorectal cancer treatment, it may be determined as a colorectal cancer therapeutic agent.

구체적으로, 대장암 치료 후보 물질의 존재 및 부재 하에서 NTRK1 융합유전자의 발현의 증가 또는 감소를 비교하는 방법으로 대장암 치료제를 스크리닝하는데 유용하게 사용할 수 있다. NTRK1 융합유전자(LMNA-NTRK1 또는 TPM3-NTRK1), 또는 이로부터 발현되는 단백질의 농도를 간접적으로 또는 직접적으로 감소시키는 물질은 대장암의 치료제로서 선택할 수 있다. 즉, 대장암 치료 후보 물질의 부재 하에 대장암 세포에서의 본 발명의 마커 NTRK1 융합유전자의 발현 수준을 측정하고, 또한 대장암 치료 후보 물질의 존재 하에서 본 발명의 마커 NTRK1 융합유전자의 발현 수준을 측정하여 양자를 비교한 후, 대장암 치료 후보 물질이 존재할 때의 본 발명의 마커의 발현 수준이 대장암 치료 후보 물질의 부재 하에서의 마커 발현 수준보다 감소시키는 물질을 대장암의 치료제로 예측할 수 있는 것이다.
Specifically, a method for comparing the increase or decrease in the expression of the NTRK1 fusion gene in the presence and absence of a candidate for colorectal cancer treatment can be usefully used for screening colorectal cancer therapeutic agents. A substance that indirectly or directly reduces the concentration of the NTRK1 fusion gene (LMNA-NTRK1 or TPM3-NTRK1) or a protein expressed therefrom can be selected as a therapeutic agent for colorectal cancer. That is, the expression level of the marker NTRK1 fusion gene of the present invention is measured in colorectal cancer cells in the absence of a candidate for colorectal cancer treatment, and the expression level of the marker NTRK1 fusion gene of the present invention is measured in the presence of a candidate for treatment of colorectal cancer. After comparing the two, a substance that reduces the expression level of the marker of the present invention in the presence of a candidate for treatment of colorectal cancer compared to the level of expression of the marker in the absence of a candidate for treatment of colorectal cancer can be predicted as a therapeutic agent for colorectal cancer.

또 하나의 양태로서, 본 발명은 상기 대장암 치료제의 스크리닝 방법을 통하여 대장암 치료제로 스크리닝된 물질을 제공한다. In another aspect, the present invention provides a material screened as a colorectal cancer treatment agent through the screening method of the colorectal cancer treatment agent.

본 발명의 구체적인 일 실시예에서, 상기 NTRK1 융합단백질의 기능 저해를 통한 대장암 치료제 스크리닝 방법은 대장암 세포주 KM12를 이용하여 확인하였다. 다중 티로신키나아제 저해제인 레스타우르티닙과 크리조티닙은 토크리스 바이오사이언스사 (영국)에서 구입하였고, NTRK1 단백질 특이적인 저해제인 ARRY-470은 LG생명과학에서 합성하였고, 한국과학기술원에서 제공받은 화합물을 상기 본 발명의 스크리닝 방법을 통하여 스크리닝한 결과 대한민국 공개특허 제10-2013-0106186호에 개시된 화합물 8(본 발명에서 5f) 및 화합물 27(본 발명에서 6s)이 스크리닝되었다. 상기 스크리닝된 화합물 8(5f)은 하기 화학식 1로 표시되는 화합물이고 화합물 27(6s)는 하기 화학식 2로 표시되는 화합물이다.In a specific embodiment of the present invention, the screening method for a colorectal cancer therapeutic agent by inhibiting the function of the NTRK1 fusion protein was confirmed using the colorectal cancer cell line KM12. Restautinib and crizotinib, which are multiple tyrosine kinase inhibitors, were purchased from Torqueless Bioscience (UK), and ARRY-470, an NTRK1 protein-specific inhibitor, was synthesized by LG Life Sciences, and the compound provided by the Korea Advanced Institute of Science and Technology was used. As a result of screening through the screening method of the present invention, compound 8 (5f in the present invention) and compound 27 (6s in the present invention) disclosed in Korean Patent Laid-Open No. 10-2013-0106186 were screened. The screened compound 8(5f) is a compound represented by Formula 1 below, and Compound 27(6s) is a compound represented by Formula 2 below.

[화학식 1][Formula 1]

Figure 112014101178197-pat00001
Figure 112014101178197-pat00001

[화학식 2][Formula 2]

Figure 112014101178197-pat00002
Figure 112014101178197-pat00002

상기 각각의 저해제는 0.64 nM에서 10 μM의 농도로 4일간 처리하였고, 세포증식의 억제 정도는 ATP-Glo Bioluminometric Cell Viability Assay kit (바이오티움사, 미국)를 이용하여 확인하였다.
Each of the inhibitors was treated at a concentration of 10 μM at 0.64 nM for 4 days, and the degree of inhibition of cell proliferation was confirmed using the ATP-Glo Bioluminometric Cell Viability Assay kit (Biotium, USA).

또 하나의 양태로서, 본 발명은 NTRK1 융합단백질 저해제를 유효성분으로 포함하는 대장암의 예방 또는 치료용 약제학적 조성물을 제공한다.In another aspect, the present invention provides a pharmaceutical composition for preventing or treating colorectal cancer comprising an NTRK1 fusion protein inhibitor as an active ingredient.

상기 NTRK1 융합단백질 저해제는 융합단백질의 활성이나 융합유전자의 발현을 억제하는 등의 작용을 할 수 있다. 상기 NTRK1 융합단백질 저해제는 상술한 바와 같이, NTRK1 단백질의 기능, 구체적으로 NTRK1 티로신키아나제의 기능을 직접적으로 또는 간접적으로 억제할 수 있는 물질이면 특히 제한은 없다. NTRK1 티로신키나아제를 저해할 수 있는 한, 기타 티로신키나아제를 저해하는 물질이어도 된다. 본 발명에 적용할 수 있는 공지의 RET 티로신키나아제 저해제로서는 상술한 바와 같이, 예를 들면, (5S,6S,8R)-6-하이드록시-6-(하이드록시메틸)-5-메틸-7,8,14,15-테트라하이드로-5H-16-옥사-4b,8a,14-트리아자-5,8-메타노이벤조[b,h]사이클로옥타[jkl]사이클로펜타[e]-아스-인다센-13(6H)-원(일반명: 레스타우르티닙(lestaurtinib): FLT3, JAK2, TRKA, TRKB 및 TRKC를 표적으로 하는 화합물), N-[5-((2R)-2-메톡시-2-페닐에타노일)-1,4,5,6-테트라하이드로피롤로[3,4-c]피파졸-3-일]-4-(4-메틸피페라진-1-일)벤자마이드(일반명: 다누세르팁(danusertib): ARK1, RET, ABL, FGFR1, TRKA를 표적으로 하는 화합물), N,1,4,4-테트라메일-8-((4-(4-메틸피페라진-1-일)페닐)아미노)-4,5-디하이드로-1H-피라졸로[4,3-h]퀴나졸린-3-카복사마이드 (일반명: 미르시클립(milciclib): CDK2, TRKA, TRKB, TRKC를 표적으로 하는 화합물), RXDX-101 (코드명: ROS1, ALK, TRKA를 표적으로 하는 화합물), TSR-011 (코드명: TRKA, TRKB, TRKC, ALK를 표적으로 하는 화합물), PLX-7486 (코드명: CSF1R, TRKA, TRKB, TRKC를 표적으로 하는 화합물), NMS-E628 (코드명: ROS1, JAK2, ALK, TRKA를 표적으로 하는 화합물), 코드명 AZD-7451의 화합물 (TRKA, TRKB, TRKC를 표적으로 하는 화합물), 코드명 NMS-P626의 화합물 (TRKA를 표적으로 하는 화합물), 코드명 RXDX-102의 화합물 (TRKA를 표적으로 하는 화합물), 코드명 ARRY-47의 화합물 (TRKA, TRKB, TRKC를 표적으로 하는 화합물)일 수 있으며, 특히 ARRY-470, 하기 화학식 1로 표시되는 화합물 또는 화학식 2로 표시되는 화합물일 수 있다. The NTRK1 fusion protein inhibitor may act by inhibiting the activity of the fusion protein or the expression of the fusion gene. As described above, the NTRK1 fusion protein inhibitor is not particularly limited as long as it is a substance capable of directly or indirectly inhibiting the function of the NTRK1 protein, specifically, the function of the NTRK1 tyrosine kinase. Substances that inhibit other tyrosine kinases may be used as long as they can inhibit NTRK1 tyrosine kinase. As a known RET tyrosine kinase inhibitor applicable to the present invention, as described above, for example, (5S,6S,8R)-6-hydroxy-6-(hydroxymethyl)-5-methyl-7, 8,14,15-tetrahydro-5H-16-oxa-4b,8a,14-triaza-5,8-methanoibenzo[b,h]cycloocta[jkl]cyclopenta[e]-as-inda Sen-13(6H)-one (generic name: lestaurtinib: compounds targeting FLT3, JAK2, TRKA, TRKB and TRKC), N-[5-((2R)-2-methoxy- 2-phenylethanoyl)-1,4,5,6-tetrahydropyrrolo[3,4-c]piperazin-3-yl]-4-(4-methylpiperazin-1-yl)benzamide (generic name: danusertib: compound targeting ARK1, RET, ABL, FGFR1, TRKA), N,1,4,4-tetramail-8-((4-(4-methylpiperazine) -1-yl) phenyl) amino) -4,5-dihydro-1H-pyrazolo [4,3-h] quinazoline-3-carboxamide (generic name: milciclib: CDK2, TRKA , TRKB, compounds targeting TRKC), RXDX-101 (codenames: compounds targeting ROS1, ALK, TRKA), TSR-011 (codenames: compounds targeting TRKA, TRKB, TRKC, ALK) , PLX-7486 (codenames: compounds targeting CSF1R, TRKA, TRKB, TRKC), NMS-E628 (codenames: compounds targeting ROS1, JAK2, ALK, TRKA), codenames AZD-7451 (compound targeting TRKA, TRKB, TRKC), code name NMS-P626 (compound targeting TRKA), code name RXDX-102 (compound targeting TRKA), code name ARRY-47 may be a compound of (a compound targeting TRKA, TRKB, or TRKC), in particular, ARRY-470, a compound represented by the following Chemical Formula 1 or a compound represented by Chemical Formula 2.

[화학식 1][Formula 1]

Figure 112014101178197-pat00003
Figure 112014101178197-pat00003

[화학식 2][Formula 2]

Figure 112014101178197-pat00004

Figure 112014101178197-pat00004

또한, 상기 NTRK1 융합단백질 저해제는 NTRK1 융합유전자 발현 억제제일 수 있으며, NTRK1 융합유전자의 안티센스 올리고뉴클레오타이드, siRNA, shRNA 및 microRNA로 구성된 군으로부터 선택되는 것일 수 있다. 또한, NTRK1 융합단백질 저해제는 NTRK1 융합단백질에 특이적으로 결합하는 항체일 수 있다.
In addition, the NTRK1 fusion protein inhibitor may be an NTRK1 fusion gene expression inhibitor, and may be selected from the group consisting of NTRK1 fusion gene antisense oligonucleotides, siRNA, shRNA and microRNA. In addition, the NTRK1 fusion protein inhibitor may be an antibody that specifically binds to the NTRK1 fusion protein.

이러한 항체는 폴리클로날 항체, 모노클로날 항체 또는 항원 결합성을 갖는 것이면 그것의 일부도 본 발명의 항체에 포함되고 모든 면역 글로불린 항체가 포함된다. 나아가, 본 발명의 항체에는 인간화 항체 등의 특수 항체도 포함하며, 신규한 항체 외에 이미 당해 기술분야에서 공지된 항체들도 포함될 수 있다. 상기 항체는 상기 목적을 달성하기 위한 또 다른 양태로서, 본 발명은 LMNA-NTRK1 또는 TPM3-NTRK1 융합유전자의 발현 억제제 또는 상기 융합유전자로부터 발현되는 단백질 억제제를 유효성분으로 포함하는 대장암의 예방 또는 치료용 약제학적 조성물을 제공한다.을 특이적으로 인식하는 결합의 특성을 갖는 한, 2개의 중쇄와 2개의 경쇄의 전체 길이를 가지는 완전한 형태뿐만 아니라, 항체 분자의 기능적인 단편을 포함한다. 항체의 분자의 기능적인 단편이란, 적어도 항원 결합 기능을 보유하고 있는 단편을 뜻하며, Fab, F(ab'), F(ab')2 및 Fv 등이 있다.As long as such an antibody is a polyclonal antibody, a monoclonal antibody, or an antigen-binding property, a part thereof is also included in the antibody of the present invention, and all immunoglobulin antibodies are included. Furthermore, the antibody of the present invention includes a special antibody such as a humanized antibody, and in addition to the novel antibody, antibodies already known in the art may be included. The antibody is another aspect for achieving the above object, and the present invention provides an LMNA-NTRK1 or TPM3-NTRK1 fusion gene expression inhibitor or a protein inhibitor expressed from the fusion gene as an active ingredient for the prevention or treatment of colorectal cancer. Provided is a pharmaceutical composition for use. It includes functional fragments of antibody molecules as well as complete forms having full lengths of two heavy chains and two light chains, as long as they have the properties of binding to specifically recognize them. A functional fragment of an antibody molecule means a fragment having at least an antigen-binding function, and includes Fab, F(ab'), F(ab') 2 and Fv.

본 발명의 상기 대장암 치료용 약제학적 조성물은 NTRK1 융합단백질에 특이적인 항체를 이용하여, 대장암 환자의 혈청 내에서 암의 이동을 증가시키는 활성을 가지는 NTRK1 융합단백질을 제거하는 방법에 이용되어, 대장암을 치료할 수 있다. 본 발명자들은 스크리닝을 통해 NTRK1 융합단백질 억제 효과를 보이는 화합물이 대장암 세포 증식을 억제하는 효과를 가지는 것을 확인하여 NTRK1 융합유전자 또는 이로부터 발현되는 융합단백질이 대장암 치료의 타겟이 될 수 있음을 규명하였다.The pharmaceutical composition for the treatment of colorectal cancer of the present invention is used in a method of removing the NTRK1 fusion protein having an activity of increasing cancer migration in the serum of a colorectal cancer patient using an antibody specific for the NTRK1 fusion protein, It can cure colon cancer. The present inventors confirmed that the compound exhibiting the NTRK1 fusion protein inhibitory effect through screening has the effect of inhibiting colorectal cancer cell proliferation, and identified that the NTRK1 fusion gene or a fusion protein expressed therefrom can be a target for colorectal cancer treatment did.

이와 같은 대장암 치료용 조성물은 NTRK1 융합유전자 또는 이로부터 발현되는 단백질에 특이적으로 결합하여 항암 활성을 촉진할 수 있는 물질은 제한없이 포함하나, 그 예로서 단백질, 앱타머, 펩티드, 탄수화물, 화합물일 수 있다. Such a composition for treating colorectal cancer includes, without limitation, substances capable of promoting anticancer activity by specifically binding to the NTRK1 fusion gene or a protein expressed therefrom, for example, proteins, aptamers, peptides, carbohydrates, compounds can be

본 발명의 조성물은 약제학적으로 허용되는 담체와 함께 투여될 수 있고, 경구 투여시에는 결합체, 활택제, 붕해제, 부형제, 가용화제, 분산제, 안정화제, 현탁화제, 색소, 향료 등을 사용할 수 있으며, 주사제의 경우에는 완충제, 보존제, 무통화제, 가용화제, 등장제, 안정화제 등을 혼합하여 사용할 수 있으며, 국소 투여용의 경우에는 기제, 부형제, 윤활제, 보존제 등을 사용할 수 있다. 본 발명의 조성물의 제형은 상술한 바와 같은 약제학적으로 허용되는 담체와 혼합하여 다양하게 제조될 수 있다. 예를 들어, 경구 투여시에는 정제, 트로키, 캡슐, 엘릭시르, 서스펜션, 시럽, 웨이퍼 등의 형태로 제조할 수 있으며, 주사제의 경우에는 단위 투약 앰플 또는 다수회 투약 형태로 제조될 수 있다.
The composition of the present invention may be administered together with a pharmaceutically acceptable carrier, and for oral administration, binders, lubricants, disintegrants, excipients, solubilizers, dispersants, stabilizers, suspending agents, pigments, fragrances, etc. may be used. In the case of injections, buffers, preservatives, analgesics, solubilizers, isotonic agents, stabilizers, etc. can be mixed and used, and in the case of topical administration, bases, excipients, lubricants, preservatives, etc. can be used. The formulation of the composition of the present invention can be prepared in various ways by mixing with a pharmaceutically acceptable carrier as described above. For example, in the case of oral administration, it may be prepared in the form of tablets, troches, capsules, elixirs, suspensions, syrups, wafers, and the like, and in the case of injections, it may be prepared in the form of unit dose ampoules or multiple doses.

또 하나의 양태로서, 본 발명은 상기 NTRK1 융합단백질 저해제를 유효성분으로 포함하는 대장암의 예방 또는 치료용 약제학적 조성물을 개체에 투여하는 단계를 포함하는, 대장암 예방 또는 치료방법을 제공한다.In another aspect, the present invention provides a method for preventing or treating colon cancer, comprising administering to an individual a pharmaceutical composition for the prevention or treatment of colorectal cancer comprising the NTRK1 fusion protein inhibitor as an active ingredient.

본 발명의 NTRK1 융합단백질 저해제, 개체 및 조성물은 상기 설명한 바와 같다.
The NTRK1 fusion protein inhibitor, subject and composition of the present invention are as described above.

본 발명의 조성물은 단독으로 사용할 수 있지만, 치료 효율을 증가시키기 위해 방사선 요법 또는 화학요법(세포 성장 정지 또는 세포 독성 물질, 항생 물질형 물질, 알킬화제, 항대사성 물질, 호르몬제, 면역제, 인터페론형 물질, 사이클로옥시게나제 억제제, 메탈로매트릭스프로테아제 억제제, 텔로머라제 억제제, 티로신 키나제 억제제, 항성장인자 수용체 물질, 항-HER 물질, 항-EGFR 물질, 항-혈관생성 물질, 파르네실 트랜스퍼라제 억제제, ras-raf 시그날 전도 경로 억제제, 세포 주기 억제제, 기타 cdk 억제제, 튜불린 결합체, 토포이소머라제Ⅰ 억제제, 토포이소머라제 Ⅱ 억제제 등)과 같은 다른 항암 치료법과 병용하여 사용할 수 있다.The composition of the present invention can be used alone, but in order to increase the therapeutic efficiency, radiation therapy or chemotherapy (cell growth arrest or cytotoxic substance, antibiotic-type substance, alkylating agent, antimetabolic substance, hormone agent, immune agent, interferon-type substance) Substance, cyclooxygenase inhibitor, metallomatrix protease inhibitor, telomerase inhibitor, tyrosine kinase inhibitor, anti-growth factor receptor substance, anti-HER substance, anti-EGFR substance, anti-angiogenic substance, farnesyl transferase inhibitor , ras-raf signal conduction pathway inhibitors, cell cycle inhibitors, other cdk inhibitors, tubulin conjugates, topoisomerase I inhibitors, topoisomerase II inhibitors, etc.) can be used in combination with other anticancer therapies.

본 발명에서 사용되는 용어, 투여는 어떠한 적절한 방법으로 환자에게 본 발명의 조성물을 도입하는 것을 의미하며, 본 발명의 조성물의 투여경로는 해당 저해제의 종류나 대장암의 종류 등에 따라 선택되지만, 목적 조직에 도달할 수 있는 한 어떠한 일반적인 경로를 통하여 투여될 수 있다. 경구 투여, 복강 내 투여, 정맥 내 투여, 근육 내 투여, 피하 투여, 피내 투여, 비내 투여, 폐내 투여, 직장내 투여, 강내 투여, 복강 내 투여, 경막 내 투여가 이루어질 수 있으나, 이에 제한되지는 않는다.The term, administration, as used in the present invention, means introducing the composition of the present invention to a patient by any suitable method, and the route of administration of the composition of the present invention is selected according to the type of the inhibitor or the type of colorectal cancer, but the target tissue It can be administered through any general route as long as it can be reached. Oral administration, intraperitoneal administration, intravenous administration, intramuscular administration, subcutaneous administration, intradermal administration, intranasal administration, intrapulmonary administration, rectal administration, intraperitoneal administration, intraperitoneal administration, intrathecal administration may be made, but is not limited thereto does not

본 발명의 조성물의 유효 투여량의 범위는 성별, 체표면적, 질환의 종류 및 중증도, 연령, 약물에 대한 민감도, 투여경로 및 배출비율, 투여시간, 치료기간, 표적세포, 발현 수준 등 기타 의학 분야에 잘 알려진 다양한 요인에 따라 달라질 수 있으며, 당 분야의 전문가들에 의해 용이하게 결정될 수 있다.
The effective dosage range of the composition of the present invention includes sex, body surface area, disease type and severity, age, drug sensitivity, administration route and excretion rate, administration time, treatment period, target cells, expression level, etc. in other medical fields It may vary depending on various factors well known in the art, and can be easily determined by experts in the art.

본 발명에 따라 대장암에 특이적인 진단 마커를 제공함으로써, 정확한 대장암 진단을 가능하게 하며, 대장암 환자의 계층화를 통해 임상예후를 예측하는 것, 대장암에 대한 치료의 유효성을 예측하는 것, 특히 NTRK1 단백질 저해제에 의한 대장암 치료의 유효성을 예측하는 것이 가능해진다. 이에 따라, 약물을 투여하는 것이 유효하지 않다고 생각되는 대장암 환자에 대한 약물의 투여를 제한할 수 있으므로, 효율적이고 안전한 맞춤형 대장암 치료를 실현하는 것이 가능해진다.
By providing a diagnostic marker specific for colorectal cancer according to the present invention, accurate colorectal cancer diagnosis is possible, predicting the clinical prognosis through stratification of colorectal cancer patients, predicting the effectiveness of treatment for colorectal cancer, In particular, it becomes possible to predict the effectiveness of colorectal cancer treatment by NTRK1 protein inhibitors. Accordingly, it is possible to limit the administration of the drug to colorectal cancer patients who are considered to be ineffective to administer the drug, and thus it becomes possible to realize efficient and safe customized colorectal cancer treatment.

도 1은 일루미나사의 HiSeq 2000을 이용한 차세대 전사체 염기서열분석을 통해 150명의 대장암 임상 조직 및 50명의 동일 환자 유래의 정상 대장 임상 조직 중 3개의 대장암 임상 조직에서 NTRK1 유전자 융합에 의해 NTRK1 유전자의 전사산물의 발현이 증가되었음을 나타내는 그림과 데이터 분석 결과를 나타내는 그림이다.
도 2는 NTRK1 융합유전자로부터 암호화된 융합전사산물을 생어시퀀싱(Sanger sequencing)에 의해 염기서열을 분석하여 NTRK1이 LMNA 또는 TPM3와 융합되었음을 나타내는 그림과 데이터 분석 결과를 나타내는 그림이다.
도 3은 전사산물 수준에서 NTRK1 융합유전자가 확인 된 대장암 및 정상 대장 임상 조직쌍을 대상으로 NTRK1 단백질의 발현을 분석하여, NTRK1 융합유전자를 갖는 대장암 특이적인 NTRK1 단백질 발현을 나타내는 그림이다.
도 4는 차세대 전사체 염기서열분석을 통해 전사산물 및 단백질 수준에서 NTRK1 융합유전자가 확인 된 (a) 대장암 및; (b) 정상 대장 임상 조직쌍을 대상으로 NTRK1 유전자의 융합여부를 형광직접접합법(fluorescence in situ hybridization)을 통해 DNA 수준에서 분석하여, 대장암 특이적인 NTRK1 유전자의 융합을 나타내는 그림이다. 노란색 화살표는 유전자 융합에 의해 분리된 NTRK1 유전자를 나타낸다. 기준자는 5 마이크로미터를 나타낸다.
도 5는 LMNA 유전자와 NTRK1 유전자의 단일 융합 부위 및 TPM3 유전자와 NTRK1 유전자의 3종류의 융합 부위를 나타내는 그림이다.
도 6은 LMNA 유전자와 NTRK1 유전자의 단일 융합유전자와 TPM3 유전자와 NTRK1 유전자의 3종류의 융합유전자에 의해 암호화되는 융합단백질의 구조를 나타내는 그림이다.
도 7은 차세대 전사체 염기서열분석을 통해 147명의 대장암 임상 조직에서 대장암 특이적인 암 유전자 및 억제 유전자의 체세포 돌연변이를 분석하여 NTRK1 융합유전자가 있는 대장암 임상 조직은 대장암 특이적인 암 유전자의 체세포 돌연변이가 없는 것을 확인한 그림이다.
도 8은 LMNA-NTRK1 및 TPM3-NTRK1 융합유전자를 종양성이 없는 NIH3T3 세포주에서 강제로 발현시켜 세포괴 형성 유무(colony formation assay)를 평가하여 NTRK1 융합유전자의 발현이 NIH3T3 세포주의 체외 종양성을 유도하는 것을 나타낸 그림이다. 음성대조군으로 NTRK1 융합유전자가 없는 공백터(empty vector)를 강제 발현하였고, 양성대조군으로 TPM3-NTRK1 융합유전자가 있는 KM12 대장암 세포주를 사용하였다.
도 9는 LMNA-NTRK1 및 TPM3-NTRK1 융합유전자를 종양성이 없는 NIH3T3 세포주에서 강제로 발현시켜 면역기능이 결핍된 누드마우스의 등쪽 피하에 접종한 후 종양 형성 유무를 평가하여 NTRK1 융합유전자의 발현이 NIH3T3 세포주의 체외 종양성을 유도하는 것을 나타낸 그림이다. 양성대조군으로 TPM3-NTRK1 융합유전자가 있는 KM12 대장암 세포주를 사용하였다.
도 10은 NTRK1 유전자에 의해 암호화되는 단백질의 발현을 216명의 한국인 대장암 환자 코호트 유래의 조직마이크로어레이(tissue microarray) 및 472명의 중국인 대장암 환자 코호트 유래의 조직마이크로어레이에서 분석하여 한국인 대장암 환자 코호트 중 29.1% 및 중국인 대장암 코호트 중 25.6%에서 NTRK1 단백질의 발현을 확인한 그림이다.
도 11은 NTRK1 유전자에 의해 암호화되는 단백질의 발현이 확인된 한국인 대장암 환자 코호트 유래의 임상 조직 중 NTRK1 단백질의 발현 수준이 높을 수록 NTRK1 유전자의 융합 빈도가 높아졌음을 형광직접접합법으로 나타낸 그림이다. 노란색 화살표는 유전자 융합에 의해 분리된 NTRK1 유전자를 나타낸다. 기준자는 10 마이크로미터를 나타낸다.
도 12는 NTRK1 유전자에 의한 암호화되는 단백질의 발현에 따라 216명의 한국인 대장암 환자 코호트의 10년 생존기간을 분석하여 NTRK1 단백질이 발현된 63명의 대장암 환자는 NTRK1 단백질이 발현되지 않는 153명의 대장암 환자에 비하여 생존기간이 유의적으로 단축되는 것을 나타낸 그림이다.
도 13은 TPM3-NTRK1 융합유전자가 있는 KM12 대장암 세포주를 대상으로 티로신키나아제 저해제 중 NTRK1 단백질에 대한 저해능이 있는 레스타우르티닙(lestaurtinib) 및 NTRK1 단백질에 대한 저해능이 없는 크리조티닙(crizotinib)과 NTRK1 단백질 특이적 저해제인 대한민국 공개특허 제10-2013-0106186호에 개시된 화합물 8(5f) 및 화합물 27(5s) 및 ARRY-470을 농도별로 적용하여 KM12 세포증식이 NTRK1 특이적 저해제에서 더욱 감소하는 것을 나타낸 그림이다.
도 14는 차세대 전사체 염기서열분석을 통해 중간값 118.5 백만개의 얼라인된 리드는 생산하였고 100개의 염기 중 1개의 염기에서 오차가 발생할 수 있는 수준은 94.3%로 확인되었음을 나타낸 그림이다.
도 15는 80% 이상의 임상 조직에서 발현이 인정되는 18,725개의 유전자 발현량을 기초로 전체 임상 조직을 PCA (Principle Component Analysis)로 분석하여 이상치(outlier) 임상조직 3개를 확인한 그림이다.
1 is a diagram of the NTRK1 gene by NTRK1 gene fusion in three colorectal cancer clinical tissues among 150 colorectal cancer clinical tissues and 50 normal colorectal clinical tissues derived from the same patient through next-generation transcriptome sequencing using Illumina's HiSeq 2000. A figure showing the increased expression of transcripts and a figure showing the data analysis result.
Figure 2 is a figure showing that NTRK1 is fused with LMNA or TPM3 by analyzing the nucleotide sequence of the fusion transcript encoded from the NTRK1 fusion gene by Sanger sequencing, and a figure showing the data analysis results.
3 is a diagram showing the expression of NTRK1 protein specific to colorectal cancer having an NTRK1 fusion gene by analyzing the expression of NTRK1 protein in a pair of normal colon cancer and normal colon clinical tissues in which the NTRK1 fusion gene is confirmed at the transcript level.
FIG. 4 shows (a) colon cancer and NTRK1 fusion gene at the transcript and protein level through next-generation transcriptome sequencing; (b) A figure showing the fusion of the NTRK1 gene specific to colon cancer by analyzing the NTRK1 gene fusion in a normal colon clinical tissue pair at the DNA level through fluorescence in situ hybridization. Yellow arrows indicate NTRK1 gene isolated by gene fusion. The ruler represents 5 micrometers.
5 is a diagram showing a single fusion site of the LMNA gene and the NTRK1 gene and three types of fusion sites of the TPM3 gene and the NTRK1 gene.
6 is a diagram showing the structure of a fusion protein encoded by a single fusion gene of an LMNA gene and an NTRK1 gene and three types of a fusion gene of a TPM3 gene and an NTRK1 gene.
7 is a colorectal cancer clinical tissue with NTRK1 fusion gene by analyzing somatic mutations of colorectal cancer-specific oncogenes and suppressor genes in 147 colorectal cancer clinical tissues through next-generation transcriptome sequencing analysis. The figure confirms that there is no somatic mutation.
Figure 8 shows that LMNA-NTRK1 and TPM3-NTRK1 fusion genes are forcibly expressed in a non-neoplastic NIH3T3 cell line to evaluate the presence or absence of cell mass formation (colony formation assay). Expression of the NTRK1 fusion gene induces in vitro tumorigenicity of the NIH3T3 cell line. is a picture that shows As a negative control, an empty vector without the NTRK1 fusion gene was forcibly expressed, and as a positive control, a KM12 colorectal cancer cell line containing the TPM3-NTRK1 fusion gene was used.
9 shows the expression of the NTRK1 fusion gene by forcibly expressing the LMNA-NTRK1 and TPM3-NTRK1 fusion genes in the non-neoplastic NIH3T3 cell line and inoculating them under the dorsal subcutaneous tissue of immune-deficient nude mice to evaluate the presence or absence of tumor formation. Figure showing the induction of in vitro tumorigenicity of the NIH3T3 cell line. As a positive control, the KM12 colorectal cancer cell line containing the TPM3-NTRK1 fusion gene was used.
10 is a cohort of Korean colorectal cancer patients by analyzing the expression of the protein encoded by the NTRK1 gene in a tissue microarray derived from a cohort of 216 Korean colorectal cancer patients and a tissue microarray derived from a cohort of 472 Chinese colorectal cancer patients. This is a figure confirming the expression of NTRK1 protein in 29.1% of patients and 25.6% of the Chinese colorectal cancer cohort.
11 is a diagram showing by fluorescence direct conjugation that the higher the NTRK1 protein expression level, the higher the NTRK1 gene fusion frequency among clinical tissues derived from a cohort of Korean colorectal cancer patients in which the expression of the protein encoded by the NTRK1 gene was confirmed. Yellow arrows indicate NTRK1 gene isolated by gene fusion. The ruler represents 10 micrometers.
12 shows the 10-year survival period of a cohort of 216 Korean colorectal cancer patients according to the expression of the protein encoded by the NTRK1 gene. 63 colorectal cancer patients expressing NTRK1 protein and 153 colorectal cancer patients not expressing NTRK1 protein The figure shows that the survival period is significantly shortened compared to the patient.
13 is a KM12 colorectal cancer cell line with a TPM3-NTRK1 fusion gene, among tyrosine kinase inhibitors, restaurtinib (lestaurtinib), which has inhibitory ability on NTRK1 protein, and crizotinib (crizotinib) and NTRK1 without inhibitory ability on NTRK1 protein; By applying compound 8(5f) and compound 27(5s) and ARRY-470 disclosed in Korean Patent Application Laid-Open No. 10-2013-0106186, which are protein-specific inhibitors, by concentration, KM12 cell proliferation was further reduced in the NTRK1-specific inhibitor is the picture shown.
14 is a diagram showing that 118.5 million aligned reads were produced with a median value through next-generation transcriptome sequencing, and the level at which an error could occur in one base out of 100 was confirmed to be 94.3%.
15 is a diagram confirming three outlier clinical tissues by analyzing the entire clinical tissues by PCA (Principle Component Analysis) based on the expression levels of 18,725 genes whose expression is recognized in 80% or more of clinical tissues.

이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
Hereinafter, the present invention will be described in more detail through examples. However, these examples are for illustrative purposes of the present invention, and the scope of the present invention is not limited to these examples.

실시예Example 1 : One : LMNALMNA 또는 or TPM3TPM3 -- NTRK1NTRK1 융합유전자 및 이에 의해 암호화된 Fusion gene and encoded by it 전사산all-in-one 물 및 융합 단백질water and fusion proteins

본 발명에서는 하기 실시예를 통하여, 대장암에 있어서 LMNA 단백질과 NTRK1 단백질과의 융합예를 본 발명에서 처음으로 밝혔다. 또한 TPM3 유전자 또는 LMNA 유전자와 NTRK1 유전자의 융합 및 이에 암호화된 융합전사산물과 융합단백질을 갖는 대장암 환자의 빈도 및 임상예후가 대규모 대장암 환자 코호트 분석을 통해 본 발명에서 처음으로 확인되었다.
In the present invention, a fusion example of LMNA protein and NTRK1 protein in colorectal cancer was first disclosed in the present invention through the following examples. In addition, the frequency and clinical prognosis of colorectal cancer patients having TPM3 gene or LMNA gene and NTRK1 gene fusion, and the fusion transcript and fusion protein encoded therein were confirmed for the first time in the present invention through large-scale colorectal cancer patient cohort analysis.

1-1. 1-1. NTRK1NTRK1 Wow 융합단백질을fusion protein 이루는 유전자 genes that make up

우선, 본 발명에서 확인된 대장암 조직에서 특이적으로 존재하는 NTRK1 융합유전자를 다음의 표 1에 정리하였다.
First, the NTRK1 fusion gene specifically present in colorectal cancer tissues identified in the present invention is summarized in Table 1 below.

대장암 특이적 NTRK1 융합유전자Colorectal cancer-specific NTRK1 fusion gene 공여유전자 (donor gene)donor gene 영역domain 수납유전자 (acceptor gene)acceptor gene 영역domain 거리 (Mb)Distance (Mb) TPM3TPM3 1q21.31q21.3 NTRK1NTRK1 1q23.11q23.1 2.62.6 LMNALMNA 1q221q22 NTRK1NTRK1 1q23.11q23.1 0.60.6

본 발명의 NTRK1 융합유전자는 상기 표 1에서 정리하고 있는 단백질 단편들의 절단점(break point; 또는 융합 부위)에서 절단 및 융합된다. 상기 단편의 N말단(C말단 융합파트너의 경우) 또는 C말단(N말단 융합 파트너의 경우) 마지막에 포함되는 엑손과 절단되어 제거되는 엑손 사이의 인트론(intron) 부위 중 어느 지점에서 절단되어도 암호화되는 단백질 단편의 아미노산 서열에는 영향을 미치지 않게 되므로, 실제 절단되는 지점은 상기 인트론 위치 중 어느 지점이어도 무방하다.
The NTRK1 fusion gene of the present invention is cleaved and fused at the break point (or fusion site) of the protein fragments listed in Table 1 above. The fragment is encoded at any point in the intron region between the exon included at the end of the N-terminal (in the case of a C-terminal fusion partner) or C-terminus (in the case of an N-terminal fusion partner) of the fragment and the exon to be cleaved and removed. Since the amino acid sequence of the protein fragment is not affected, the actual cleavage point may be any of the intron positions.

1-2. 1-2. TPM3TPM3 -- NTRK1NTRK1 융합유전자 및 fusion gene and TPM3TPM3 -- NTRK1NTRK1 융합단백질fusion protein

본 발명에서 TPM3 단백질을 암호화하는 TPM3 유전자는 인간 유래 TPM3 유전자를 이용하였으며 인간의 염색체 1번(q21.3)에 위치하며, 이로부터 암호화되는 TPM3 단백질은 총 아미노산 길이가 285aa인 단백질이다. TPM3 단백질 또는 TPM3 단백질 단편은 TPM3-NTRK1 융합단백질의 N 말단쪽 융합파트너이다. In the present invention, the TPM3 gene encoding the TPM3 protein is a human-derived TPM3 gene and is located on human chromosome 1 (q21.3), and the TPM3 protein encoded therefrom is a protein having a total amino acid length of 285aa. The TPM3 protein or TPM3 protein fragment is the N-terminal fusion partner of the TPM3-NTRK1 fusion protein.

본 발명에서 TPM3 단백질은 인간 유래 TPM3를 사용하였고, 이를 암호화하는 NTRK1 유전자는 인간의 염색체 1번(q21.3)에 위치한다. 이로부터 암호화되는 TPM3 단백질은 총 아미노산 길이가 285 aa인 단백질이다. TPM3 단백질 또는 TPM3 단백질 단편은 TPM3-NTRK1 융합단백질의 N 말단쪽 융합 파트너이다. In the present invention, the TPM3 protein is human-derived TPM3, and the NTRK1 gene encoding it is located on human chromosome 1 (q21.3). The TPM3 protein encoded therefrom is a protein with a total amino acid length of 285 aa. The TPM3 protein or TPM3 protein fragment is the N-terminal fusion partner of the TPM3-NTRK1 fusion protein.

본 발명에서는 상기 GenBank accession no. NM_152263의 염기 서열을 갖는 TPM3 유전자를 사용하였다.
In the present invention, the GenBank accession no. The TPM3 gene having the nucleotide sequence of NM_152263 was used.

상기 TPM3 단백질의 단편은 NM_152263의 8번째 엑손(1번 염색체 상의 (-) 가닥(strand)을 기준으로 154134289~154142876 염기위치)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것을 사용하였다. 본 발명에서 사용한 상기 TPM3 단백질을 암호화하는 엑손 8의 3' 말단에 코돈(codon)을 이루지 못하는 1개의 뉴클레오타이드(g)가 존재하였다. 상기 TPM3 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 TPM3 단백질에 대하여 아래의 표 2 및 3에 정리하였다.
The fragment of the TPM3 protein was used to have an amino acid sequence encoded by the nucleotide sequence up to the 8th exon of NM_152263 (from 154134289 to 154142876 base positions based on the (-) strand on chromosome 1). One nucleotide (g) that did not form a codon was present at the 3' end of exon 8 encoding the TPM3 protein used in the present invention. The gene encoding the fragment of the TPM3 protein and the TPM3 protein encoded therefrom are summarized in Tables 2 and 3 below.

TPM3 단백질의 단편을 암호화 하는 유전자Gene encoding a fragment of the TPM3 protein TPM3 유전자
Accession No.
TPM3 gene
Accession No.
TPM3 단백질 암호화 부위
(CDS)
TPM3 protein coding region
(CDS)
TPM3 단백질 단편 암호화 부위:
엑손 기준
TPM3 protein fragment coding region:
exon basis
TPM3 단백질 단편 암호화 부위:
cDNA 기준
TPM3 protein fragment coding region:
cDNA standard
염색체 상
절단위치
chromosomal
cutting position
5' 말단 방향 절단위치
염기서열
5' end cut position
base sequence
NM_152263NM_152263 118~975 (858bp)
(서열번호 1)
118~975 (858bp)
(SEQ ID NO: 1)
엑손 1~엑손 8exon 1 to exon 8 118~891 + 1nt (g) (775bp) (서열번호 2)118-891 + 1nt (g) (775bp) (SEQ ID NO: 2) chr1: 154142876chr1: 154142876 5'-ATT GAT GAC CTG GAA g-3'
(서열번호 3)
5'-ATT GAT GAC CTG GAA g-3'
(SEQ ID NO: 3)

TPM3 단백질의 단편Fragment of TPM3 protein TPM3 단백질의 전체 길이
(Accession No.)
Total length of TPM3 protein
(Accession No.)
TPM3 단백질 단편 부위TPM3 protein fragment site N-말단방향 절단위치
아미노산 서열
N-terminal cut position
amino acid sequence
285aa (NP_689476)
(서열번호 4)
285aa (NP_689476)
(SEQ ID NO: 4)
1~258aa + 1nt (g) (아미노산 서열: 서열번호 5)1-258aa + 1nt (g) (amino acid sequence: SEQ ID NO: 5) N-IDDLE + 1nt (g) (아미노산 서열: 서열번호 6)N-IDDLE + 1 nt (g) (amino acid sequence: SEQ ID NO: 6)

본 발명에서 NTRK1 단백질은 인간 유래 NTRK1을 사용하였고, 이를 암호화하는 NTRK1 유전자는 인간의 염색체 1번(q23.1)에 위치한다. 이로부터 암호화되는 NTRK1 단백질은 총 아미노산 길이가 796aa인 단백질이다. NTRK1 단백질 또는 NTRK1 단백질 단편은 TPM3-NTRK1 융합단백질의 C 말단쪽 융합 파트너이다. In the present invention, NTRK1 protein is human-derived NTRK1, and the NTRK1 gene encoding it is located on human chromosome 1 (q23.1). The NTRK1 protein encoded therefrom is a protein with a total amino acid length of 796aa. NTRK1 protein or NTRK1 protein fragment is the C-terminal fusion partner of the TPM3-NTRK1 fusion protein.

본 발명에서는 GenBank accession no. NM_001012331의 염기 서열을 갖는 NTRK1 유전자를 사용하였다.
In the present invention, GenBank accession no. The NTRK1 gene having the nucleotide sequence of NM_001012331 was used.

상기 NTRK1 단백질의 단편은 NM_001012331의 엑손 9(1번 염색체 상의 (+)가닥을 기준으로 156830671~156844363 염기위치) 또는 엑손 11(1번 염색체 상의 (-)가닥을 기준으로 156830671~156845312 염기위치) 또는 엑손 12(1번 염색체 상의 (-)가닥을 기준으로 156830671~156845872 염기위치)부터 마지막 엑손까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것을 사용하였다. 이때, 엑손 9의 3' 말단의 처음 시작하는 2개의 뉴클레오타이드(ac)와 엑손 11의 3' 말단의 처음 시작하는 2개의 뉴클레오타이드(gc) 및 엑손 12의 3' 말단의 처음 시작하는 2개의 뉴클레오타이드(gt)는 코돈을 이루지 못하는 서열을 가지고 있었다. 상기 코돈을 이루지 못하는 서열들은 TPM3 단백질의 단편과 융합 시에 앞서 설명한 바와 같이 TPM3 단백질의 단편에 추가로 포함된 1개의 뉴클레오타이드(g)와 연결되어 코돈(gac 또는 ggc 또는 ggt)을 이루어 하나의 아미노산(D 또는 G)을 암호화하였다. 상기 NTRK1 단백질의 단편을 암호화하는 유전자 및 이로부터 발현되는 NTRK1 단백질에 대하여 아래의 표 4 및 표 5에 정리하였다.
The fragment of the NTRK1 protein is exon 9 (156830671 to 156844363 base positions relative to the (+) strand on chromosome 1) or exon 11 (156830671 to 156845312 base positions relative to the (-) strand on chromosome 1) of NM_001012331 or Those having an amino acid sequence encoded by the nucleotide sequence from exon 12 (base positions 156830671 to 156845872 based on the (-) strand on chromosome 1) to the last exon were used. At this time, the first two nucleotides (ac) of the 3' end of exon 9 and the first two nucleotides (gc) of the 3' end of exon 11 and the first two nucleotides of the 3' end of exon 12 ( gt) had a sequence that did not form a codon. The sequences that do not form the codon are linked to one nucleotide (g) additionally included in the TPM3 protein fragment as described above when fused with the TPM3 protein fragment to form a codon (gac or ggc or ggt) to form one amino acid (D or G) was encoded. The genes encoding the fragments of the NTRK1 protein and the NTRK1 protein expressed therefrom are summarized in Tables 4 and 5 below.

NTRK1 단백질의 단편을 암호화 하는 유전자Gene encoding fragment of NTRK1 protein NTRK1 유전자
(Accession No.)
NTRK1 gene
(Accession No.)
NTRK1 단백질의 암호화 부위 (CDS)Coding region of NTRK1 protein (CDS) NTRK1 단백질 단편 암호화 부위:
엑손 기준
NTRK1 protein fragment coding region:
exon basis
NTRK1 단백질 단편 암호화 부위:
cDNA 기준
NTRK1 protein fragment coding region:
cDNA standard
염색체 상 절단위치cleavage site on chromosome 3' 말단 방향 절단위치 염기서열3' end direction cleavage site base sequence
NM_002529NM_002529 52~2447 (2396bp)
(서열번호 7)
52~2447 (2396bp)
(SEQ ID NO: 7)
엑손 9~엑손 17exon 9 to exon 17 2nt (ac) +1236~2447 (1214bp) (서열번호 8)2nt (ac) +1236-2447 (1214bp) (SEQ ID NO: 8) chr1:156844363chr1:156844363 5'- ac ACT AAC AGC ACA TCT -3' (서열번호 9)5'-ac ACT AAC AGC ACA TCT -3' (SEQ ID NO: 9)
NM_002529NM_002529 52~2447 (2396bp)
(서열번호 7)
52~2447 (2396bp)
(SEQ ID NO: 7)
엑손 11~엑손 17exon 11 to exon 17 2nt (gc) + 1393~2447 (1055bp) (서열번호 10)2nt (gc) + 1393-2447 (1055bp) (SEQ ID NO: 10) chr1:156845312chr1:156845312 5'- gc CCG GCT GTG CTG GCT -3' (서열번호 11)5'- gc CCG GCT GTG CTG GCT -3' (SEQ ID NO: 11)
NM_002529NM_002529 52~2447 (2396bp)
(서열번호 7)
52~2447 (2396bp)
(SEQ ID NO: 7)
엑손 12~엑손 17exon 12 to exon 17 2nt (gt) + 1540~2447 (908bp) (서열번호 12)2nt (gt) + 1540-2447 (908bp) (SEQ ID NO: 12) chr1:156845872chr1:156845872 5'- gt GTT CAC CAC ATC AAG -3' (서열번호 13)5'-gt GTT CAC CAC ATC AAG -3' (SEQ ID NO: 13)

NTRK1 단백질의 단편Fragment of NTRK1 protein NTRK1 단백질의 전체 길이 (Accession No.)Total length of NTRK1 protein (Accession No.) NTRK1 단백질 단편 부위NTRK1 protein fragment site C-말단방향 절단위치 아미노산 서열C-terminal cleavage site amino acid sequence 796aa (NP_002520)
(서열번호 14)
796aa (NP_002520)
(SEQ ID NO: 14)
2nt (ac) + 400~796 (아미노산 서열: 서열번호 15)2nt (ac) + 400-796 (amino acid sequence: SEQ ID NO: 15) 2nt (ac) + TNSTS-C (아미노산 서열: 서열번호 16)2nt (ac) + TNSTS-C (amino acid sequence: SEQ ID NO: 16)
796aa (NP_002520)
(서열번호 14)
796aa (NP_002520)
(SEQ ID NO: 14)
2nt (gc) + 453~796 (아미노산 서열: 서열번호 17)2nt (gc) + 453-796 (amino acid sequence: SEQ ID NO: 17) 2nt (gc) + PAVLA-C (아미노산 서열: 서열번호 18)2nt (gc) + PAVLA-C (amino acid sequence: SEQ ID NO: 18)
796aa (NP_002520)
(서열번호 14)
796aa (NP_002520)
(SEQ ID NO: 14)
2nt (gt) + 502~796 (아미노산 서열: 서열번호 19)2nt (gt) + 502-796 (amino acid sequence: SEQ ID NO: 19) 2nt (gt) + VHHIK-C (아미노산 서열: 서열번호 20)2nt (gt) + VHHIK-C (amino acid sequence: SEQ ID NO: 20)

상기 TPM3 단백질 또는 그의 단편과 NTRK1 단백질 또는 그의 단편이 융합된 TPM3-NTRK1 융합단백질을 암호화하는 융합유전자(TPM3-NTRK1 융합유전자)는 5' 말단에 상기한 바와 같은 TPM3 단백질 또는 그의 단편을 암호화하는 뉴클레오타이드 분자 및 3' 말단에 상기한 바와 같은 NTRK1 단백질 또는 그의 단편을 암호화하는 뉴클레오타이드 분자를 포함하도록 제조하였다.
The fusion gene (TPM3-NTRK1 fusion gene) encoding the TPM3-NTRK1 fusion protein in which the TPM3 protein or a fragment thereof and the NTRK1 protein or a fragment thereof is fused is a nucleotide encoding the TPM3 protein or a fragment thereof as described above at the 5' end. The molecule and the 3' end were prepared to contain a nucleotide molecule encoding the NTRK1 protein or a fragment thereof as described above.

상기 표에서 확인할 수 있듯이 본 발명에서 TPM3-NTRK1 융합유전자로 5' 말단 쪽에 NM_152263의 엑손 1부터 엑손 8까지의 뉴클레오타이드 서열과 3' 말단 쪽에 NM_002529의 엑손 9 또는 엑손 11 또는 엑손 12부터 엑손 17까지의 뉴클레오타이드 서열이 연결된 융합유전자를 제조하였다. 구체적으로, 본 발명에서 5' 말단 쪽에 NM_152263의 118번째부터 892번째까지의 뉴클레오타이드 서열(서열번호 2)과 3' 말단 쪽에 NM_002529의 1234번째 또는 1391번째 또는 1538번째부터 2447번째까지의 뉴클레오타이드 서열(서열번호 8; 서열번호10; 서열번호 12)이 연결된 TPM3-NTRK1 융합유전자(서열번호 21: 서열번호 3과 서열번호 9를 포함하는 염기서열; 서열번호 22: 서열번호 3과 서열번호 11을 포함하는 염기서열; 서열번호 23: 서열번호 3과 서열번호 13을 포함하는 염기서열)를 제조하였다.As can be seen in the table above, in the present invention, the nucleotide sequence from exon 1 to exon 8 of NM_152263 at the 5' end of the TPM3-NTRK1 fusion gene in the present invention and exon 9 or exon 11 or exon 12 to exon 17 of NM_002529 at the 3' end A fusion gene in which nucleotide sequences were linked was prepared. Specifically, in the present invention, the nucleotide sequence from the 118th to the 892th of NM_152263 (SEQ ID NO: 2) at the 5' end in the present invention and the nucleotide sequence from the 1234th or 1391th or 1538th to the 2447th of NM_002529 at the 3' end (SEQ ID NO: 2) No. 8; SEQ ID NO: 10; SEQ ID NO: 12) linked TPM3-NTRK1 fusion gene (SEQ ID NO: 21: a nucleotide sequence comprising SEQ ID NO: 3 and SEQ ID NO: 9; SEQ ID NO: 22: comprising SEQ ID NO: 3 and SEQ ID NO: 11 nucleotide sequence; SEQ ID NO: 23: a nucleotide sequence including SEQ ID NO: 3 and SEQ ID NO: 13) was prepared.

또한, 본 발명에서 상기 제조된 TPM3-NTRK1 융합유전자로부터 암호화된 TPM3-NTRK1 융합단백질은 N말단 쪽에 NP_689476의 1번째부터 258번째까지의 아미노산 서열(서열번호 5)과 C말단 쪽에 NP_002520의 400번째 또는 453번째 또는 502번째부터 796번째까지의 아미노산 서열(서열번호 16; 서열번호 18; 서열번호 20)이 연결된 융합단백질(서열번호 24: 서열번호 6과 서열번호 16을 포함하는 아미노산 서열; 서열번호 25: 서열번호 6과 서열번호 18을 포함하는 아미노산 서열; 서열번호 26: 서열번호 6과 서열번호 20을 포함하는 아미노산 서열)이였다.
In addition, the TPM3-NTRK1 fusion protein encoded from the TPM3-NTRK1 fusion gene prepared above in the present invention has the amino acid sequence from the 1st to the 258th of NP_689476 on the N-terminal side (SEQ ID NO: 5) and the 400th or NP_002520 on the C terminal A fusion protein (SEQ ID NO: 24: an amino acid sequence comprising SEQ ID NO: 6 and SEQ ID NO: 16; SEQ ID NO: 25) to which the 453th or 502th to 796th amino acid sequences (SEQ ID NO: 16; SEQ ID NO: 18; SEQ ID NO: 20) are linked : amino acid sequence comprising SEQ ID NO: 6 and SEQ ID NO: 18; SEQ ID NO: 26: amino acid sequence comprising SEQ ID NO: 6 and SEQ ID NO: 20).

1-3. 1-3. NMNANMNA -- NTRK1NTRK1 융합유전자 및 fusion gene and NMNANMNA -- NTRK1NTRK1 융합단백질fusion protein

본 발명에서 대표적으로 실시한 LMNA 단백질을 암호화하는 LMNA 유전자는 인간 유래 LMNA 유전자를 이용하였으며 인간의 염색체 1번(q22)에 위치하며, 이로부터 암호화되는 LMNA 단백질은 총 아미노산 길이가 664aa인 단백질이다. LMNA 단백질 또는 LMNA 단백질 단편은 LMNA-NTRK1 융합단백질의 N 말단쪽 융합파트너이다.The LMNA gene encoding the LMNA protein typically performed in the present invention is a human-derived LMNA gene and is located on human chromosome 1 (q22), and the LMNA protein encoded therefrom is a protein having a total amino acid length of 664aa. The LMNA protein or LMNA protein fragment is the N-terminal fusion partner of the LMNA-NTRK1 fusion protein.

본 발명에서는 GenBank accession no. NM_170707의 염기 서열을 갖는 TPM3 유전자를 사용하였다.
In the present invention, GenBank accession no. The TPM3 gene having the nucleotide sequence of NM_170707 was used.

상기 LMNA 단백질의 단편은 NM_170707의 6번째 엑손(1번 염색체 상의 (+)가닥을 기준으로 156084504~156105740 염기위치)까지의 뉴클레오타이드 서열에 의하여 암호화되는 아미노산 서열을 갖는 것을 사용하였다. 본 발명에서 사용한 상기 LMNA 단백질을 암호화하는 엑손 6의 3' 말단에 코돈(codon)을 이루지 못하는 1개의 뉴클레오타이드(c)가 존재하였다. 상기 LMNA 단백질의 단편을 암호화하는 유전자 및 이로부터 암호화되는 LMNA 단백질에 대하여 아래의 표 6 및 7에 정리하였다.
As the fragment of the LMNA protein, one having an amino acid sequence encoded by the nucleotide sequence up to the 6th exon of NM_170707 (base positions 156084504 to 156105740 bases on the (+) strand on chromosome 1) was used. One nucleotide (c) that does not form a codon was present at the 3' end of exon 6 encoding the LMNA protein used in the present invention. Genes encoding fragments of the LMNA protein and LMNA proteins encoded therefrom are summarized in Tables 6 and 7 below.

LMNA 단백질의 단편을 암호화 하는 유전자Gene encoding fragment of LMNA protein LMNA 유전자
(Accession No.)
LMNA gene
(Accession No.)
LMNA 단백질 암호화 부위 (CDS)LMNA protein coding region (CDS) LMNA 단백질 단편 암호화 부위: 엑손 기준LMNA protein fragment coding region: exon reference LMNA 단백질 단편 암호화 부위: cDNA 기준LMNA protein fragment coding region: cDNA reference 염색체 상 절단위치cleavage site on chromosome 5' 말단 방향 절단위치 염기서열5' end direction cleavage site nucleotide sequence
NM_170707NM_170707 250~2244 (1995bp) (서열번호 27)250-2244 (1995 bp) (SEQ ID NO: 27) 엑손 1~엑손 6exon 1 to exon 6 250~1233 + 1nt (c) (985bp) (서열번호 28)250-1233 + 1nt (c) (985bp) (SEQ ID NO: 28) chr1:156105740chr1:156105740 5'-GAG GAC TCA CTG GCC c-3' (서열번호 29)5'-GAG GAC TCA CTG GCC c-3' (SEQ ID NO: 29)

LMNA 단백질의 단편Fragments of LMNA Proteins LMNA 단백질의 전체 길이 (Accession No.)Overall length of LMNA protein (Accession No.) LMNA 단백질 단편 부위LMNA protein fragment site N-말단방향 절단위치 아미노산 서열N-terminal cleavage site amino acid sequence 664aa (NP_733821) (서열번호 30)664aa (NP_733821) (SEQ ID NO: 30) 1~328aa + 1nt (c) (아미노산 서열: 서열번호 31)1-328aa + 1nt (c) (amino acid sequence: SEQ ID NO: 31) N-EDSLA + 1nt (g) (아미노산 서열: 서열번호 32)N-EDSLA + 1 nt (g) (amino acid sequence: SEQ ID NO: 32)

본 발명에서 상기 LMNA 단백질 또는 그의 단편과 NTRK1 단백질 또는 그의 단편이 융합된 LMNA-NTRK1 융합단백질을 암호화하는 융합유전자(LMNA-NTRK1 융합유전자)는 5' 말단에 상기한 바와 같은 LMNA 단백질 또는 그의 단편을 암호화하는 뉴클레오타이드 분자 및 3' 말단에 상기 실시예 1-2에서 설명한 NTRK1 단백질 또는 그의 단편을 암호화하는 뉴클레오타이드 분자를 포함하도록 제조하였다.
In the present invention, the fusion gene (LMNA-NTRK1 fusion gene) encoding the LMNA-NTRK1 fusion protein in which the LMNA protein or a fragment thereof is fused with the NTRK1 protein or a fragment thereof (LMNA-NTRK1 fusion gene) includes the LMNA protein or a fragment thereof as described above at the 5' end. It was prepared to include the encoding nucleotide molecule and the nucleotide molecule encoding the NTRK1 protein or a fragment thereof described in Example 1-2 at the 3' end.

구체적으로 본 발명에서 5' 말단 쪽에 NM_170707의 엑손 1부터 엑손 6까지의 뉴클레오타이드 서열과 3' 말단 쪽에 NM_002529의 엑손 11부터 엑손 17까지의 뉴클레오타이드 서열이 연결된 LMNA-NTRK1 융합유전자를 제조하였다. 구체적으로, 본 발명에서는 5' 말단 쪽에 NM_170707의 250번째부터 1234번째까지의 뉴클레오타이드 서열(서열번호 28)과 3' 말단 쪽에 NM_002529의 1391번째부터 2447번째까지의 뉴클레오타이드 서열(서열번호10)이 연결된 LMNA-NTRK1 융합유전자(서열번호 33: 서열번호 29와 서열번호 11를 포함하는 염기서열)를 제조하였다.Specifically, in the present invention, an LMNA-NTRK1 fusion gene was prepared in which the nucleotide sequence from exon 1 to exon 6 of NM_170707 on the 5' end and the nucleotide sequence from exon 11 to exon 17 of NM_002529 on the 3' end were linked. Specifically, in the present invention, the nucleotide sequence from the 250th to the 1234th (SEQ ID NO: 28) of NM_170707 on the 5' end and the nucleotide sequence from the 1391th to the 2447th of NM_002529 on the 3' end are linked (SEQ ID NO: 10) to the LMNA -NTRK1 fusion gene (SEQ ID NO: 33: a nucleotide sequence comprising SEQ ID NO: 29 and SEQ ID NO: 11) was prepared.

또한, 본 발명에서 상기 제조된 LMNA-NTRK1 융합유전자로부터 암호화된 LMNA-NTRK1 융합단백질은 N-말단 쪽에 LMNA 단백질의 1번째부터 328번째까지의 아미노산 서열(서열번호 31)과 C-말단 쪽에 NTRK1 단백질의 453번째부터 796번째까지의 아미노산 서열(서열번호 18)이 연결된 융합단백질(서열번호 34: 서열번호 32와 서열번호 18을 포함하는 아미노산 서열)이었다.
In addition, the LMNA-NTRK1 fusion protein encoded from the LMNA-NTRK1 fusion gene prepared in the present invention has the amino acid sequence from the 1st to the 328th amino acid sequence of the LMNA protein on the N-terminal side (SEQ ID NO: 31) and the NTRK1 protein on the C-terminal side It was a fusion protein (SEQ ID NO: 34: an amino acid sequence comprising SEQ ID NO: 32 and SEQ ID NO: 18) to which the amino acid sequence from the 453th to the 796th of the (SEQ ID NO: 18) was linked.

실시예Example 2: 2: NTRK1NTRK1 융합유전자 또는 이의 Fusion gene or its 전사산물transcript 측정 수단 measure

본 발명에서는 NTRK1 융합유전자(TPM3 유전자 또는 LMNA 유전자와 NTRK1 유전자의 융합유전자) 및 이에 암호화된 융합전사산물과 융합단백질을 갖는 대장암 환자의 빈도 및 임상예후에 대하여 대장암 환자에서 분석하기 위해서, 해당 NTRK1 융합유전자 또는 이의 전사산물을 측정하고자 하였다. 이를 위해서는 다양한 방법이 가능하나 본 발명에서는 NTRK1 융합유전자에 혼성가능한 형광직접접합법(fluorescence in situ hybridization: FISH)용 프로브(NTRK1 Split FISH Probe, Cat# FS0024, Abnova, Taiwan)를 사용하였으며, NTRK1 융합전사산물에 혼성가능한 연쇄중합반응용 프라이머를 제조하였다.
In the present invention, the frequency and clinical prognosis of colorectal cancer patients having the NTRK1 fusion gene (TPM3 gene or fusion gene of LMNA gene and NTRK1 gene) and the fusion transcript and fusion protein encoded therein in colorectal cancer patients. To measure the NTRK1 fusion gene or its transcript. Various methods are available for this purpose, but in the present invention, a probe for fluorescence in situ hybridization (FISH) that can be hybridized to the NTRK1 fusion gene (NTRK1 Split FISH Probe, Cat# FS0024, Abnova, Taiwan) was used, and NTRK1 fusion transcription was performed. A primer for chain polymerization that is hybridizable to the product was prepared.

NTRK1 융합유전자에 혼성 가능한 형광직접접합법용 프로브Probe for fluorescence direct conjugation that can be hybridized to NTRK1 fusion gene 접합 부위junction site 길이Length 표지 물질label material 서열번호 7의 5' 말단
(chr1: 156390000~156814000)
5' end of SEQ ID NO:7
(chr1: 156390000~156814000)
약 420 kbabout 420 kb TexRedTexRed
서열번호 7의 3' 말단
(chr1: 156851000~157630000)
3' end of SEQ ID NO:7
(chr1: 156851000~157630000)
약 780 kbabout 780 kb FITCFITC

NTRK1 융합전사산물에 혼성 가능한 연쇄중합반응용 프라이머Primer for chain polymerization that can be hybridized to NTRK1 fusion transcript 융합유전자fusion gene 융합 부위fusion site Forward Primer SequenceForward Primer Sequence Reverse Primer SequenceReverse Primer Sequence TPM3-NTRK1TPM3-NTRK1 서열번호 21;
서열번호 22;
서열번호 23
SEQ ID NO: 21;
SEQ ID NO: 22;
SEQ ID NO:23
5'- AAG AAG ATA AAT ATG AGG -3'
(서열번호 35)
5'- AAG AAG ATA AAT ATG AGG -3'
(SEQ ID NO: 35)
5'- CCG TGC CGC ATA TAC TCA AA -3'
(서열번호 36)
5'-CCG TGC CGC ATA TAC TCA AA -3'
(SEQ ID NO: 36)
LMNA-NTRK1LMNA-NTRK1 서열번호 33SEQ ID NO: 33 5'- CCA GGT GGA GCA GTA TAA GAA G -3'
(서열번호 37)
5'-CCA GGT GGA GCA GTA TAA GAA G -3'
(SEQ ID NO: 37)
5'- TGT GGG TTC TCG ATG ATG TG -3'
(서열변호 38)
5'- TGT GGG TTC TCG ATG ATG TG -3'
(SEQ ID NO: 38)

또한, NTRK1 융합단백질의 검출은 상기 융합단백질 또는 대장암에서 NTRK1 유전자의 융합에 의존적으로 발현하는 NTRK1 단백질과 상호작용하는 물질, 예컨대 특이적으로 결합하는 물질(예컨대, 항체, 앱타머 또는 화합물 등)을 이용하여 상기 융합단백질과 상기 물질(예컨대, 항체 또는 앱타머)과의 상호작용, 즉 복합체 형성을 검출하는 통상적인 에세이법, 예컨대, 면역크로마토그래피(immunochromatography), 면역조직학염색(immunohistochemistry), 효소결합 면역흡착 분석(enzyme linked immunosorbent assay), 방사선 면역측정법(radioimmunoassay), 효소 면역분석(enzyme immunoassay), 형광면역분석(fluorescence immunoassay), 발광면역분석(luminescence immunoassay), 웨스턴블라팅(western blotting) 및 유세포분석(flow cytometry cell sorting) 등에 의하여 검출할 수 있다. 예컨대, NTRK1 단백질을 검출하는 면역조직학검사용 항체를 아래 표 10에 예시하였다. 본 발명에서는 NTRK1 단백질을 검출하는 면역조직학검사용 항체(Anti-NTRK1 Antibody EP1058Y (Cat# TA301109, OriGene, USA))를 이용하였다.
In addition, the detection of the NTRK1 fusion protein is a substance that interacts with the fusion protein or NTRK1 protein that is expressed dependently on the fusion of the NTRK1 gene in colorectal cancer, such as a substance that specifically binds (eg, an antibody, an aptamer, or a compound) A conventional assay method for detecting the interaction between the fusion protein and the substance (eg, antibody or aptamer), that is, the formation of a complex, using, for example, immunochromatography, immunohistochemistry, enzyme enzyme linked immunosorbent assay, radioimmunoassay, enzyme immunoassay, fluorescence immunoassay, luminescence immunoassay, western blotting and It can be detected by flow cytometry cell sorting or the like. For example, antibodies for immunohistologic examination for detecting NTRK1 protein are exemplified in Table 10 below. In the present invention, an antibody for immunohistochemistry that detects NTRK1 protein (Anti-NTRK1 Antibody EP1058Y (Cat# TA301109, OriGene, USA)) was used.

NTRK1 융합단백질과 상호작용하는 면역조직학검사용 항체Antibody for immunohistochemistry that interacts with NTRK1 fusion protein 항원antigen 작용 부위site of action 음성대조voice contrast 양성대조positive control 기타 적용Other applications NTRK1 단백질 아미노산 서열 중 791번째 타이로신 및 그 주변의 펩타이드Tyrosine at position 791 of the NTRK1 protein amino acid sequence and its surrounding peptides NTRK1 단백질의 카이네이즈 도메인 C-말단Kinase domain C-terminus of NTRK1 protein 임파구(lymphocytes)lymphocytes 신경절 세포(ganglion cells)ganglion cells 웨스턴블라팅, 형광면역분석, 유세포분석Western blotting, fluorescence immunoassay, flow cytometry

실시예Example 3: 임상 조직을 이용한 실험 3: Experiments using clinical tissue

본 발명에 사용된 신선 동결(fresh frozen) 임상 조직은 2008년부터 2012년에 부산대학교병원 및 화순전남대학교병원에서 외과적 절제를 받은 대장암 환자로부터 수집되어 한국인체자원은행 부산대학교병원 거점은행 및 화순전남대학교병원 거점은행에서 보관 후 분양되었다. 대장암 조직은 국제 암게놈 컨소시움(International Cancer Genome Consortium: ICGC)의 지침에 따라 선발되었다. 예컨대, 임상조직은 병리학적 진단 후 60% 이상의 암세포 및 20% 미만의 괴사세포(necrotic cells) 또는 정상세포로 구성된 임상 조직만을 사용하였다. 대장암 가족력이 있는 대장암 환자로부터 수집된 대장암 임상 조직은 제외되었다. 최종적으로 150례의 대장암 조직 및 50례의 정상 대장 조직이 사용되었다.
Fresh frozen clinical tissues used in the present invention were collected from colorectal cancer patients who underwent surgical resection at Pusan National University Hospital and Hwasun Chonnam National University Hospital from 2008 to 2012, Hwasun Chonnam National University Hospital was stored and sold at the base bank. Colorectal cancer tissues were selected according to the guidelines of the International Cancer Genome Consortium (ICGC). For example, only clinical tissues composed of more than 60% cancer cells and less than 20% necrotic cells or normal cells after pathological diagnosis were used as clinical tissues. Colorectal cancer clinical tissues collected from colorectal cancer patients with a family history of colorectal cancer were excluded. Finally, 150 cases of colorectal cancer tissues and 50 cases of normal colon tissues were used.

실시예Example 4: 4: 현미부수체microsatellite 불안정성 분석( instability analysis ( microsatellitemicrosatellite instabilityinstability analysisanalysis : : MSIMSI ))

상기 실시예 3의 대장암 임상조직 중 포르말린 고정 후 파라핀으로 포매된(formalin-fixed paraffin-embedded) 조직에서 전체 DNA를 추출한 후 베데스다 마커(BAT26, D5S346, BAT25, D17S250, D2S123)를 이용하여 현미부수체 불안정성을 조사하였다. After extracting total DNA from the formalin-fixed paraffin-embedded tissue after formalin-fixed paraffin-embedded among the colorectal cancer clinical tissues of Example 3, using Bethesda markers (BAT26, D5S346, BAT25, D17S250, D2S123) Sieve instability was investigated.

구체적으로, 전체 DNA는 QIAmp DNA FFPE Tissue kit (키아젠사, 독일)을 이용하여 추출하였다. DNA 순도 및 농도는 ND-100 분광광도계(spectrophotometer) (나노드롭테크놀로지사, 미국)로 측정하였다. 다중(multiplex) 연쇄중합반응 후 획득한 증폭산물의 길이와 신호강도에 따라 현미부수체 불안정성을 판단하였다. 추출된 DNA의 불완전성 등으로 연쇄중합반응이 실패한 경우 DNA중합요소 엡실론(DNA polymerase epsilon: POLE)를 포함한 주요 유전자의 체세포 돌연변이의 총 수를 고려하여 현미부수체 불안전성을 판단하였다.
Specifically, total DNA was extracted using the QIAmp DNA FFPE Tissue kit (Kiagen, Germany). DNA purity and concentration were measured with an ND-100 spectrophotometer (Nanodrop Technology, USA). Microsatellite instability was determined according to the length and signal intensity of the amplification product obtained after multiplex chain polymerization. When the chain polymerization reaction failed due to incompleteness of the extracted DNA, etc., microsatellite instability was determined by considering the total number of somatic mutations in major genes including DNA polymerase epsilon (POLE).

실시예Example 5: 차세대 5: Next Generation 전사체transcript 염기서열 분석 ( sequencing ( RNARNA -- seqseq ))

전체 RNA는 RNAiso Plus(타카다 바이오사, 일본)로 추출하여 DNase I(키아젠사)로 전처리 한 다음 RNeasy Mini kit(키아젠사)로 정제하였다. RNA 완전성은 Bioanalyer (아질런트사, 미국)로 분석하였고, RNA 완전성 지표(RNA Integrity Number: RIN)가 6 이상인 대장암 임상 조직 유래 RNA를 RNA-seq에 적용하였다. RNA-seq을 위한 라이브러리는 TruSeq RNA sample preparation kit (일루미나사, 미국)으로 제작하였다. 예컨대, mRNA은 폴리-T 올리고가 부착된 마그네틱 비드(magnetic beads)로 회수한 후 음향전단(acoustic shearing) 방식으로 파편화하였다. 파편화 된 mRNA로부터 역전사효소(reverse transcriptase) 및 랜덤핵사머(random hexamer)를 이용하여 1차 cDNA를 제작하였고, DNA 중합효소 I(DNA polymerase I)과 RNase H를 이용하여 2차 cDNA를 제작하였다. 2차 cDNA는 어뎁터를 접합 한 후 연쇄중합반응을 통해 cDNA 라이브러리를 완성하였다. cDNA 라이브러리는 HiSeq 2000 (일루미나사)를 이용하여 염기서열을 분석하였고, 약 100백만개의 101bp 길이의 페어드엔드 리드(paired-end reads)가 생산하였다.
Total RNA was extracted with RNAiso Plus (Takada Bio, Japan), pretreated with DNase I (Kiagen), and then purified with RNeasy Mini kit (Kiagen). RNA integrity was analyzed by Bioanalyer (Agilent, USA), and RNA from clinical tissue of colorectal cancer having an RNA integrity index (RNA Integrity Number: RIN) of 6 or higher was applied to RNA-seq. A library for RNA-seq was prepared with TruSeq RNA sample preparation kit (Illumina, USA). For example, mRNA was recovered as magnetic beads to which poly-T oligo was attached, and then fragmented by acoustic shearing. Primary cDNA was prepared from fragmented mRNA using reverse transcriptase and random hexamer, and secondary cDNA was prepared using DNA polymerase I and RNase H. Secondary cDNA was connected to the adapter and then the cDNA library was completed through chain polymerization. The cDNA library was sequenced using HiSeq 2000 (Illumina), and about 100 million paired-end reads with a length of 101 bp were produced.

실시예Example 6: 염기서열 분석 6: sequencing

상기 실시예 5에서 차세대 전사체 염기서열 분석을 통해 생산한 페어드엔드 리드는 GSNAP 및 TopHat을 이용하여 5% 불일치를 허용하는 조건에서 국립생명공학정보센터(National Center for Biotechnology Information: NCBI, 미국)에서 제공하는 인간참조유전체(hg 19)에 얼라인(align) 하였다. 페어드엔드 리드는 또한 공공데이터베이스로부터 추출한 161,250개의 mRNA (RefSeq 데이터베이스로부터 36,742개의 mRNA, USCS 데이터베이스로부터 73,671개의 mRNA 및 Ensembl 데이터베이스로부터 161,214개의 mRNA)로 구성한 인간참조전사체에 얼라인하여 mRNA 편집(mRNA splicing)에 기인한 미스얼라인(misalignment)을 최소화하였다.
In Example 5, the paired-end reads produced through next-generation transcriptome sequencing were performed using GSNAP and TopHat under conditions that allow 5% mismatch, National Center for Biotechnology Information (NCBI, USA) It was aligned with the human reference genome (hg 19) provided by Paired-end reads were also extracted from public databases (36,742 mRNAs from the RefSeq database, 73,671 mRNAs from the USCS database and 161,214 mRNAs from the Ensembl database) extracted from public databases by aligning them to a human reference transcript for mRNA splicing. Misalignment caused by the was minimized.

실시예Example 7: 융합유전자 분석 7: Fusion gene analysis

인프레임(in-frame) 융합유전자는 GFP 알고리즘을 통해 검색하였고, deFuse 및 FusionMap 알고리즘으로 교차검증하였다. 예컨대, GFP를 통한 융합유전자는 다음의 조건을 통해 검색하였다.In-frame fusion genes were searched through the GFP algorithm and cross-verified with the deFuse and FusionMap algorithms. For example, a fusion gene through GFP was searched under the following conditions.

(1) 융합전사체를 구성하는 상이한 공여유전자(donor gene)와 수납유전자(acceptor gene)에 얼라인 된 리드쌍(discordant read pairs) 및 융합 부위(exonic fusion breakpoint)에 얼라인된 리드(exon-spanning reads)가 존재하는 경우 수락한다.(1) Discordant read pairs aligned with different donor genes and acceptor genes constituting the fusion transcript and reads aligned with exonic fusion breakpoints (exon- If spanning reads exist, accept them.

(2) 공여 및 수납유전자 DNA 가닥의 방향성(strand orientation)이 염색체 전좌 또는 역위 또는 결실을 통해 유전자융합을 설명하는 경우 수락한다.(2) Accept if the strand orientation of the donor and recipient gene DNA strands accounts for gene fusion through chromosomal translocations or inversions or deletions.

(3) 염기서열의 상동성이 높은 경우 (E값 < 0.01) 제외한다.(3) Excludes cases with high nucleotide sequence homology (E value < 0.01).

(4) 거리가 10bp 미만의 비논리적 리드쌍인 경우 제외한다.
(4) Excludes illogical read pairs with a distance of less than 10bp.

융합유전자는 다음의 조건을 통해 확정하였다.The fusion gene was confirmed through the following conditions.

(1) GFP 또는 deFuse 또는 FusionMap 중 2개의 알고리즘에서 검색된 융합유전자를 수락한다.(1) Accept the fusion gene retrieved from two algorithms of GFP or deFuse or FusionMap.

(2) 공여유전자와 수납유전자에 얼라인된 리드쌍이 10개 이상인 경우 수락한다.(2) If there are more than 10 lead pairs aligned with the donor gene and the recipient gene, it is accepted.

(3) 융합 부위에 얼라인된 리드가 10개 이상인 경우 수락한다.(3) Accept when there are more than 10 reads aligned to the fusion site.

(4) 공여유전자와 수납유전자가 동일한 염색체 내에 존재하고 유전자간 거리가 100Kb 이상인 경우 수락한다.(4) If the donor gene and the recipient gene exist in the same chromosome and the distance between genes is more than 100Kb, it is accepted.

(5) 아웃프레임(out-frame) 융합유전자는 제외한다.(5) Out-frame fusion genes are excluded.

(6) 융합 부위 이후에 존재하는 수납유전자의 엑손들이 융합되지 않은 수납유전자의 엑손들과 비교하여 과발현된 경우 수락한다.
(6) Acceptance is accepted if the exons of the recipient gene present after the fusion site are overexpressed compared to the exons of the unfused recipient gene.

실시예Example 8: 이상발현유전자( 8: aberrant gene ( differentiallydifferentially expressedexpressed genegene : : DEGDEG ) 분석) analysis

이상발현유전자는 미국 브로드연구소(Broad Institute)의 GenePattern 소프트웨어를 이용하여 분석하였다. 차세대 전사체 염기서열분석을 통해 생산하고 TopHat으로 얼라인된 리드는 Cufflinks를 이용하여 전사체로 조합하였다. 각각의 유전자별로 얼라인된 리드의 수는 FPKM (Fragments Per Kilobase of exon per Million) 방법으로 표준화한 후 각각의 유전자별 발현량으로 표시하였다. 80% 이상의 임상조직에서 0 이상의 FPKM을 갖는 18,725개의 유전자 발현량을 기초로 전체 임상조직을 PCA (Principle Component Analysis)로 분석하여 이상치(outlier) 임상조직 3개(6쌍)를 제거하였다. PCA 분석을 통해 총 147개의 대장암 임상조직 및 47개의 정상 임상조직에서 얻어진 18,725개의 유전자가 이상발현유전자 분석의 대상이 되었다. 대장암 임상조직에서 특이적인 이상발현유전자는 쌍체 양측 t검정(pairwise 2-sided t-test) (p < 0.05) 및 Benjamini-Hochart 다중비교보정(FDR < 0.05)를 통해 검색하였다.
Aberrant genes were analyzed using GenePattern software of Broad Institute, USA. Reads produced through next-generation transcriptome sequencing and aligned with TopHat were assembled into transcripts using Cufflinks. The number of aligned reads for each gene was standardized by the FPKM (Fragments Per Kilobase of exon per Million) method, and then expressed as the expression level for each gene. Based on the expression level of 18,725 genes with FPKM of 0 or more in 80% or more of the clinical tissues, the entire clinical tissues were analyzed by PCA (Principle Component Analysis), and 3 outlier clinical tissues (6 pairs) were removed. Through PCA analysis, 18,725 genes obtained from a total of 147 colorectal cancer clinical tissues and 47 normal clinical tissues were subjected to aberrant gene analysis. Aberrant genes specific to colorectal cancer clinical tissues were searched for by pairwise 2-sided t-test (p < 0.05) and Benjamini-Hochart multiple comparison correction (FDR < 0.05).

실시예Example 9: 체세포 돌연변이( 9: somatic mutation ( nonnon -- synonymoussynonymous somaticsomatic mutationmutation ) 분석) analysis

단일염기변이(single nucleotide variances: SNVs)는 차세대 전사체 염기서열분석을 통해 생산된 리드를 GSNAP을 통해 인간참조전사체에 얼라인하여 검색하였다. 단일염기변이는 다음의 조건을 통해 검색하였다.Single nucleotide variances (SNVs) were searched by aligning reads produced through next-generation transcriptome sequencing to human reference transcripts through GSNAP. Single nucleotide mutations were searched through the following conditions.

(1) 위치 특이적으로 얼라인되는 리드의 수가 2개 이상인 경우 수락한다.(1) If the number of position-specifically aligned leads is two or more, it is accepted.

(2) 상기 위치의 평균 염기품질이 20 이상인 경우 수락한다.(2) If the average base quality of the above position is 20 or more, it is accepted.

(3) 상기 위치의 대립유전자(allele) 빈도가 3% 이상인 경우 수락한다.(3) Accept when the allele frequency of the position is 3% or more.

(4) 상기 위치에 얼라인된 리드의 수가 10개 이상인 경우 수락한다.(4) Accept when the number of leads aligned in the above position is 10 or more.

유전자의 어노테이션(annotation)은 RefSeq을 참고하고, 생식세포 돌연변이(germline variants)는 다음의 조건을 통하여 제거하였다.For gene annotation, refer to RefSeq, and germline variants were removed through the following conditions.

(1) dbSNP137와 비교하여 전체 임상조직 중 대립유전자형(minor allele)의 빈도가 1% 이상인 경우 제외한다.(1) Compared with dbSNP137, cases where the frequency of minor allele among all clinical tissues is 1% or more are excluded.

(2) 59명의 한국인참조유전체와 비교하여 정상인에서 관찰된 생식세포 돌연변이는 제외한다.(2) Compared with the 59 Korean reference genomes, germline mutations observed in normal individuals are excluded.

(3) 본 발명에서 사용된 47례의 정상 대장조직에서 관찰된 생식세포 돌연변이는 제외한다.(3) Germ cell mutations observed in the normal colon tissues of 47 cases used in the present invention are excluded.

정상 대장조직쌍이 없는 대장암 임상조직에서는 예상치보다 높은 체세포 돌연변이의 빈도가 관찰되는 점을 고려하여, 체세포 돌연변이는 음성선발(negative selection)을 기준으로 검색하였다.
Considering that a higher-than-expected frequency of somatic mutation was observed in colorectal cancer clinical tissues without a normal colonic tissue pair, somatic mutations were searched based on negative selection.

실시예Example 10: 역전사연쇄중합반응( 10: reverse transcription chain polymerization reaction ( reversereverse transcriptasetranscriptase -- polymerasepolymerase chainchain reaction: reaction: RTRT -- PCRPCR )과 )and 생어시퀀싱Sanger sequencing (( SangerSanger sequencingsequencing ))

NTRK1 융합전사체는 역전사연쇄중합반응 및 생어시퀀싱을 통해 확인하였다. 연쇄중합반응의 조건은 아래의 표 11에 정리하였다.
The NTRK1 fusion transcript was confirmed by reverse transcription chain polymerization and Sanger sequencing. The conditions of the chain polymerization reaction are summarized in Table 11 below.

NTRK1 융합전사체 확인용 연쇄중합반응 조건Chain polymerization conditions for confirming NTRK1 fusion transcripts 공여유전자donor gene 수납유전자host gene 프라이머primer 연쇄중합반응 조건Chain Polymerization Conditions 연쇄중합반응 산물chain polymerization reaction product TPM3 (엑손 8)TPM3 (exon 8) NTRK1 (엑손 9 또는 엑손 11 또는 엑손 12)NTRK1 (exon 9 or exon 11 or exon 12) 서열번호 35 및 서열번호 36SEQ ID NO: 35 and SEQ ID NO: 36 변성(denaturation): 94도 30초
결합(annealing): 55.7도 30초
신장(extension)
72도 30초
총 30회
Denaturation: 94 degrees 30 seconds
Annealing: 55.7 degrees 30 seconds
extension
72 degrees 30 seconds
30 total
406bp
553bp
712bp
406bp
553bp
712bp
LMNA (엑손 6)LMNA (exon 6) NTRK1 (엑손 11)NTRK1 (exon 11) 서열번호 37 및 서열번호 38SEQ ID NO: 37 and SEQ ID NO: 38 변성: 94도 30초
결합: 54도 30초
신장: 72도 30초
총 30회
Metamorphosis: 94 degrees 30 seconds
Bonding: 54 degrees 30 seconds
Height: 72 degrees 30 seconds
30 total
354bp354bp

연쇄중합반응의 산물은 TOPO TA 벡터(라이프 테크놀로지사, 미국)에 삽입한 다음 생어법으로 시퀀싱하였다.
The product of the chain polymerization reaction was inserted into TOPO TA vector (Life Technologies, USA) and then sequenced by Sanger method.

실시예Example 11: 형광직접접합( 11: Direct fluorescence bonding ( fluorescencefluorescence inin situsitu hybridizationhybridization : : FISHFISH ))

NTRK1 융합유전자는 NTRK1 유전자의 5' 말단 및 3' 말단에 각각 결합하는 분리 형광직접접합 (split FISH) 프로브를 이용하여 확인하였다(아브노바사, 대만). 예컨대, 포르말린 고정 후 파라핀으로 포매 된 대장암 및 정상 임상조직의 절단면은 파라핀을 제거하고, 프로티아제를 처리한 다음 75도에서 변성하였다. 변성된 임상조직의 절단면은 표 8에 정리된 프로브와 함께 ThermoBrite (아보트사, 미국)에서 17시간 배양하였다. 배앙된 임상조직의 절단면은 세척 후 DAPI(아보트사)를 이용하여 대조염색하였고, TexRed와 FITC 신호의 거리를 관찰하였다.
The NTRK1 fusion gene was identified using a split FISH probe that binds to the 5' and 3' ends of the NTRK1 gene, respectively (Abnova, Taiwan). For example, after formalin fixation, the paraffin-embedded sections of colon cancer and normal clinical tissues were paraffin-removed, treated with protease, and then denatured at 75°C. Sections of denatured clinical tissues were incubated for 17 hours in ThermoBrite (Abot, USA) together with the probes listed in Table 8. Cross-sections of cultured clinical tissues were counterstained using DAPI (Abot) after washing, and the distance between TexRed and FITC signals was observed.

실시예Example 12: 면역조직학분석( 12: Immunohistological analysis ( immunohistochemistryimmunohistochemistry ) 및 임상병리학적() and clinicopathological ( clinicopathologicalclinicopathological ) 분석) analysis

NTRK1 융합단백질은 NTRK1 유전자 융합에 의존적으로 발현한다는 점에 착안하여, NTRK1 융합단백질의 발현은 표 10에 정리된 NTRK1 단백질 특이적인 항체(오리진사, 미국)를 이용하여 면역조직학적으로 확인하였다. 뇌의 신경절 세포 및 임파구는 각각 NTRK1 융합단백질 발현의 면역조직학분석의 양성대조군 및 음성대조군으로 사용하였다. Focusing on the NTRK1 fusion protein's expression dependent on NTRK1 gene fusion, the expression of the NTRK1 fusion protein was confirmed immunohistologic using the NTRK1 protein-specific antibody listed in Table 10 (Origin, USA). Brain ganglion cells and lymphocytes were used as positive and negative controls for immunohistologic analysis of NTRK1 fusion protein expression, respectively.

NTRK1 융합단백질의 발현 빈도는 216명의 한국인 대장암 환자 코호트 및 472명의 중국 대장암 환자 코호트(바이오맥스사, 미국)에서 구축한 조직마이크로어레이(tissue microarray)를 이용하여 면역조직학적으로 분석하였다. NTRK1 융합단백질 발현의 면역조직학분석을 통해 한국인 대장암 환자는 NTRK1 융합단백질 양성환자와 음성환자로 계층화하였고, 계층화된 환자군은 대장암의 위치, 대장암 침윤도(invasion depth), 신경주위침윤(perineural invasion), 림프혈관색전(lymphovascular emboli), 임파절전이(lymphnode metastasis), 현미부수체 불안정성 및 10년 생존율을 비교하였다.
The expression frequency of NTRK1 fusion protein was analyzed immunohistochemically using tissue microarrays constructed from a cohort of 216 Korean colorectal cancer patients and 472 Chinese colorectal cancer patients (Biomax, USA). Through immunohistological analysis of NTRK1 fusion protein expression, Korean colorectal cancer patients were stratified into NTRK1 fusion protein positive and negative patients, and the stratified patient group was colorectal cancer location, colon cancer invasion depth, and perineural invasion. ), lymphovascular emboli, lymphnode metastasis, microsatellite instability, and 10-year survival rates were compared.

실시예Example 13: 13: NIH3T3NIH3T3 세포주에서 in cell lines NTRK1NTRK1 융합유전자의 발현 Expression of fusion gene

TPM3, LMNA 및 NTRK1 유전자의 cDNA는 오리진사로부터 구입하였다. LMNA (엑손 6)-NTRK1 (엑손 11) 및 TPM3 (엑손 8)-NTRK1 (엑손 9 또는 엑손 11 또는 엑손 12) 융합전사산물은 오버랩익스텐션(overlap extension) 연쇄중합반응을 통해 제작하였다. 제작된 융합전사산물은 Cold Fusion Cloning kit (시스템 바이오사이언스사, 미국)를 이용하여 IRES-GFP가 장착된 pcDNA3.1 (라이프 테크놀로지사)에 클로닝하였다. 클로닝된 융합유전자는 생어시퀀싱을 통해 확인한 후 TPM3-NTRK1 및 LMNA-NTRK1 융합전사산물 발현 벡터를 완성하였다. NIH3T3 세포주는 한국세포주은행에서 구입하였다. 융합전사산물 발현 벡터는 FUGENE 6 (로슈, 독일)을 이용하여 NIH3T3 세포주에 도입하였다. 형질전환 된 NIH3T3 세포주는 G418(라이크 테크놀로지사)를 이용하여 선발하였고, GFP 단백질 발현을 이용한 유세포 분석을 통해 완성하였다.
The cDNAs of TPM3, LMNA and NTRK1 genes were purchased from Origin. LMNA (exon 6)-NTRK1 (exon 11) and TPM3 (exon 8)-NTRK1 (exon 9 or exon 11 or exon 12) fusion transcripts were prepared through overlap extension chain polymerization. The prepared fusion transcript was cloned into pcDNA3.1 (Life Technologies) equipped with IRES-GFP using a Cold Fusion Cloning kit (System Bioscience, USA). After the cloned fusion gene was confirmed through raw sequencing, TPM3-NTRK1 and LMNA-NTRK1 fusion transcript expression vectors were completed. The NIH3T3 cell line was purchased from the Korea Cell Line Bank. The fusion transcript expression vector was introduced into the NIH3T3 cell line using FUGENE 6 (Roche, Germany). The transformed NIH3T3 cell line was selected using G418 (Like Technologies), and was completed through flow cytometry analysis using GFP protein expression.

실시예Example 14: 14: NTRK1NTRK1 융합유전자의 fusion gene 종양성neoplastic 분석 analysis

TPM3-NTRK1 또는 LMNA-NTRK1 융합유전자의 종양성은 형질전환 된 NIH3T3 세포주의 체외 세포괴 형성능 및 체내 종양성 평가를 통해 확인하였다. 체외 세포괴 형성능은 총 1,200개의 형질전환 된 NIH3T3 세포를 0.3% 상단 아가로즈(agarose)에 도입한 다음 0.5% 하단 아가로즈 위에서 3주일간 배양하여 형성된 세포괴의 수와 크기를 관찰하였다. 융합유전자가 없는 공벡터가 도입된 NIH3T3 세포주와 TPM3-NTRK1 융합유전자가 있는 KM12 대장암 세포주는 각각 음성 및 양성대조군으로 사용되었다. 형성된 세포괴는 0.05% 크리스탈 바이올렛으로 염색한 다음 광학현미경으로 개수하였다. 체내 종양성은 총 백만 개의 형질전환 된 NIH3T3 세포 또는 KM12 세포를 면역능이 결핍된 누드마우스의 등쪽 피하에 접종한 후 관찰하였다. 실험군별로 5마리의 누드마우스를 사용하였다. 세포 접종 후 측정 가능한 종양이 형성되면 3일 간격으로 세포 접종 후 총 32일 동안 종양의 크기를 측정하였다.
The tumorigenicity of the TPM3-NTRK1 or LMNA-NTRK1 fusion gene was confirmed by evaluating the in vitro cell aggregation ability and in vivo tumorigenicity of the transformed NIH3T3 cell line. For the in vitro cell agglomeration capacity, a total of 1,200 transformed NIH3T3 cells were introduced into 0.3% upper agarose and then cultured on 0.5% lower agarose for 3 weeks to observe the number and size of the formed cell agglomerates. The NIH3T3 cell line introduced with the empty vector without the fusion gene and the KM12 colorectal cancer cell line with the TPM3-NTRK1 fusion gene were used as negative and positive controls, respectively. The formed cell agglomerates were stained with 0.05% crystal violet and then counted under an optical microscope. In vivo neoplasticity was observed after inoculation of a total of one million transformed NIH3T3 cells or KM12 cells into the dorsal subcutaneous tissue of immune-deficient nude mice. Five nude mice were used in each experimental group. When a measurable tumor was formed after cell inoculation, the size of the tumor was measured for a total of 32 days after cell inoculation at 3-day intervals.

실시예Example 15: 약물 스크리닝 15: Drug screening

NTRK1 융합단백질의 기능 저해를 통한 대장암 치료 약물 스크리닝 방법은 KM12 세포주를 이용하여 확인하였다. 다중 티로신키나아제 저해제인 레스타우르티닙과 크리조티닙은 토크리스 바이오사이언스사 (영국)에서 구입하였고, NTRK1 단백질 특이적인 저해제인 ARRY-470은 LG생명과학에서 합성하였고, 한국과학기술원에서 제공받은 화합물을 상기 본 발명의 스크리닝 방법을 통하여 스크리닝한 결과 공개특허 제10-2013-0106186호에 개시된 화합물 8(본 발명에서 5f) 및 화합물 27(본 발명에서 6s)이 스크리닝되었다. 상기 스크리닝된 화합물 8(5f)은 하기 화학식 1로 표시되는 화합물이고 화합물 27(6s)는 하기 화학식 2로 표시되는 화합물이다.The screening method for colorectal cancer treatment drug through inhibition of NTRK1 fusion protein was confirmed using the KM12 cell line. Restautinib and crizotinib, which are multiple tyrosine kinase inhibitors, were purchased from Torqueless Bioscience (UK), and ARRY-470, an NTRK1 protein-specific inhibitor, was synthesized by LG Life Sciences, and the compound provided by the Korea Advanced Institute of Science and Technology was used. As a result of screening through the screening method of the present invention, compound 8 (5f in the present invention) and compound 27 (6s in the present invention) disclosed in Patent Publication No. 10-2013-0106186 were screened. The screened compound 8(5f) is a compound represented by Formula 1 below, and Compound 27(6s) is a compound represented by Formula 2 below.

[화학식 1][Formula 1]

Figure 112014101178197-pat00005
Figure 112014101178197-pat00005

[화학식 2][Formula 2]

Figure 112014101178197-pat00006

Figure 112014101178197-pat00006

상기 각각의 저해제는 0.64 nM에서 10 μM의 농도로 4일간 처리하였고, 세포증식의 억제 정도는 ATP-Glo Bioluminometric Cell Viability Assay kit (바이오티움사, 미국)를 이용하여 확인하였다.
Each of the inhibitors was treated at a concentration of 10 μM at 0.64 nM for 4 days, and the degree of inhibition of cell proliferation was confirmed using the ATP-Glo Bioluminometric Cell Viability Assay kit (Biotium, USA).

상기 NTRK1 융합유전자 또는 이에 암호화된 NTRK1 융합단백질의 활성을 저해하여 대장암을 치료할 수 있는 약물을 스크리닝 한 결과, 다중 티로신키나아제 억제제 중 NTRK1 단백질에 활성을 갖는 레스타우르티닙은 약 10.7 nM의 농도에서 KM12 세포의 성장을 50% 억제하였고, NTRK1 단백질에 선택적인 저해제인 ARRY-470은 약 3.2 nM에서 KM12 세포의 성장을 50% 억제하였다. 반면, NTRK1 단백질에 낮은 활성을 갖는 크리조티닙은 약 184.8 nM의 농도에서 KM12 세포의 성장을 50% 억제하였다. NTRK1 단백질에 높은 선택성을 갖는 공개특허 제10-2013-0106186호에 개시된 화합물 8(본 발명에서 5f) 및 화합물 27(본 발명에서 6s)은 낮은 세포투과도 때문에 비교적 낮은 544.2 nM 및 929.1 nM에서 KM12 세포의 성장을 50% 억제하는 것을 확인하였다(도 13 참고).
As a result of screening for drugs capable of treating colorectal cancer by inhibiting the activity of the NTRK1 fusion gene or the NTRK1 fusion protein encoded therein, restaurtinib, which has activity on the NTRK1 protein among multiple tyrosine kinase inhibitors, is KM12 at a concentration of about 10.7 nM. The growth of cells was inhibited by 50%, and ARRY-470, a selective inhibitor of NTRK1 protein, inhibited the growth of KM12 cells by 50% at about 3.2 nM. On the other hand, crizotinib, which has low activity on NTRK1 protein, inhibited the growth of KM12 cells by 50% at a concentration of about 184.8 nM. Compound 8 (5f in the present invention) and compound 27 (6s in the present invention) disclosed in Korean Patent Application Publication No. 10-2013-0106186 with high selectivity for NTRK1 protein showed relatively low cell permeability in KM12 cells at 544.2 nM and 929.1 nM was confirmed to inhibit the growth of 50% (see FIG. 13).

실시예Example 16: 한국인 대장암 임상조직에서 관찰된 16: Observed in Korean colorectal cancer clinical tissue 인프레임in-frame 융합유전자 fusion gene

상기 차세대 전사체 염기서열분석을 통해 중간값 118.5 백만개의 얼라인된 리드는 생산하였고 100개의 염기 중 1개의 염기에서 오차가 발생할 수 있는 수준은 94.3%로 확인되었다 (도 14 참고). PCA 분석 결과 3개의 임상조직이 이상치로 확인되었고, 이상치 임상조직을 포함하는 대장암 및 정상 대장 임상조직 3쌍이 본 발명에서 제외되었다 (도 15 참고). 따라서 대장암 임상조직 147례 및 정상 대장 임상조직 47례가 본 발명에 사용되었다. GFP 또는 deFuse 또는 FusionMap 알고리즘을 이용한 융합유전자 분석 결과 9개의 인프레임 융합유전자가 확인되었다 (표 12 참고).
Through the next-generation transcriptome sequencing analysis, a median value of 118.5 million aligned reads was produced, and the level at which an error could occur in one base out of 100 was confirmed to be 94.3% (see FIG. 14 ). As a result of PCA analysis, 3 clinical tissues were identified as outliers, and 3 pairs of colon cancer and normal colonic clinical tissues including the abnormal clinical tissues were excluded from the present invention (see FIG. 15 ). Therefore, 147 cases of colorectal cancer clinical tissue and 47 cases of normal colon clinical tissue were used in the present invention. As a result of fusion gene analysis using GFP or deFuse or FusionMap algorithm, nine in-frame fusion genes were identified (see Table 12).

한국인 대장암 임상조직에서 관찰된 인프레임 융합유전자 In-frame fusion gene observed in Korean colorectal cancer clinical tissue 시료IDSample ID StageStage Discordant paired-end readsDiscordant paired-end reads spanning readsspanning reads Distance
(bp)
Distance
(bp)
공여 유전자
(Donor gene)
donor gene
(Donor gene)
FPKMFPKM LocationLocation 수여 유전자
(Acceptor)
conferred gene
(Acceptor)
FPKMFPKM LocationLocation
LGP088TLGP088T 2727 153153 26209332620933 TPM3TPM3 5959 chr1:154142876chr1:154142876 NTRK1NTRK1 3131 chr1:156844363chr1:156844363 LGC012TLGC012T 2525 132132 26209332620933 TPM3TPM3 9494 chr1:154142876chr1:154142876 NTRK1NTRK1 2020 chr1:156845312chr1:156845312 TPM3TPM3 9494 chr1:154142876chr1:154142876 NTRK1NTRK1 2020 chr1:156845872chr1:156845872 LGC026TLGC026T II 1111 1515 675664675664 LMNALMNA 145145 chr1:156105740chr1:156105740 NTRK1NTRK1 3232 chr1:156845312chr1:156845312 LGC007TLGC007T 2121 197197 771740771740 PTPRKPTPRK 1717 chr6:128841404chr6:128841404 RSPO3RSPO3 3131 chr6:127469793chr6:127469793 LGC054TLGC054T 3636 140140 771740771740 PTPRKPTPRK 1515 chr6:128505577chr6:128505577 RSPO3RSPO3 3737 chr6:127469793chr6:127469793 LGC030TLGC030T 5656 374374 26675102667510 NAGLUNAGLU 255255 chr17:40693224chr17:40693224 IKZF3IKZF3 5555 chr17:37922746chr17:37922746 LGP047TLGP047T II 4545 206206 10201121020112 GTF3AGTF3A 641641 chr13:27999075chr13:27999075 CDK8CDK8 9393 chr13:26923209chr13:26923209 LGP024TLGP024T II 2424 9898 5546355463 RAD51AP1RAD51AP1 77 chr12:4662255chr12:4662255 AKAP3AKAP3 1818 chr12:4737971chr12:4737971 LGP031TLGP031T II 1717 5353 2882961528829615 RASA1RASA1 1111 chr5:86564807chr5:86564807 LOC644100LOC644100 1919 chr5:115394422chr5:115394422

확인된 융합유전자로는 타이로신 탈인산화효소, 수용체 타입, K(tyrosine phosphatase, receptor type, K: PTPRK) 유전자와 R 스폰딘 3(R-spondin 3: RSPO3) 유전자간의 융합유전자가 2례의 대장암 임상조직에서 확인되었고(1.4%), N-아세틸클루코사미니다제, 알파(N-acetylglucosaminidase, alpha: NAGLU) 유전자와 아키로스 페밀리 징크 핑거 3(IKAROS family zinc finger 3: IKZF3) 유전자간의 융합유전자가 1례의 대장암 임상조직에서 확인되었고(0.7%), 일반 전사인자 IIIA(general transcription factor IIIA: GTF3A) 유전자와 사이클린 의존적 키나아제 8(cyclin-dependent kinase 8: CDK8) 유전자간의 융합유전자가 1례의 대장암 임상조직에서 확인되었고(0.7%), RAD51 연관 단백질 1(RAD51 associated protein 1: RAD51AP1) 유전자와 A 키나아제 고정 단백질 3(A kinase anchor protein 3: AKAP3) 유전자간의 융합유전자가 1례의 대장암 임상조직에서 확인되었고(0.7%), RAS p21 활성 단백질 1(RAS p21 protein activator 1: RASA1) 유전자와 ADP 리보실레이션 유사인자 14 유사 단백질(ADP-ribosylation factor-like 14 effector protein-like: LOC644100) 유전자간의 융합유전자가 1례의 대장암 임상조직에서 확인되었고(0.7%), 라민 A/C(lamin A/C: LMNA) 또는 트로포미오신 3(tropomysosin 3: TPM3) 유전자와 신경영양성 타이로신 키나아제, 수용체, 타입 1(neurotrophic tyrosine kinase, receptor, type 1: NTRK1) 유전자간의 융합유전자가 3례의 대장암 임상조직에서 확인되었다(2.0%). 상기의 융합유전자 중 NTRK1 유전자는 세포막에 고정되어 있는 TrkA 단백질을 암호화하는 유전자로 대장암 및 갑상선 유두암에서 TPM3-NTRK1 융합유전자가 보고되었고, 폐선암에서는 미오신 탈인산화효소 Rho 상호작용 단백질(myosin phosphatase Rho interacting protein: MPRIP) 유전자 또는 CD74 유전자와 NTRK1 유전자간의 융합유전자가 보고되었고, 스피트조이드(Spitzoid) 흑색종에서는 TP53 유전자 또는 LMNA 유전자와 NTRK1 유전자간의 융합유전자가 보고되었고, 담낭암에서는 RAB 지티파아제 유사 활성 단백질 1(RAB GTPase activating protein 1-like: RABGAP1L) 유전자와 NTRK1 유전자간의 융합유전자가 보고되었고, 다형성고아종에서는 뉴로파신(neurofascin: NFASC) 유전자 또는 브레비칸(brevica: BCAN) 유전자와 NTRK1 유전자간의 융합유전자가 보고되었다. 그러나 대장암에서 NTRK1 융합유전자의 빈도 및 임상적 의의는 규명되지 않았다.
The confirmed fusion gene was a fusion gene between the tyrosine dephosphorylation enzyme, receptor type, K (tyrosine phosphatase, receptor type, K: PTPRK) gene and R-spondin 3 (R-spondin 3: RSPO3) gene in 2 cases of colorectal cancer. It was confirmed in clinical tissues (1.4%), and a fusion gene between the N-acetylglucosaminidase (NAGLU) gene and the IKAROS family zinc finger 3 (IKAROS family zinc finger 3: IKZF3) gene was found. It was confirmed in 1 case of colorectal cancer clinical tissue (0.7%), and a fusion gene between the general transcription factor IIIA (GTF3A) gene and the cyclin-dependent kinase 8 (CDK8) gene was found in 1 case. It was confirmed in colorectal cancer clinical tissue (0.7%), and a fusion gene between the RAD51 associated protein 1 (RAD51AP1) gene and the A kinase anchor protein 3: AKAP3 gene was found in one case of colorectal cancer. Confirmed in clinical tissues (0.7%), RAS p21 protein activator 1: RASA1 gene and ADP-ribosylation factor-like 14 effector protein-like: LOC644100 A fusion gene between genes was identified in one case of colorectal cancer clinical tissue (0.7%), and lamin A/C (lamin A/C: LMNA) or tropomysosin 3 (tropomysosin 3: TPM3) gene and neurotrophic tyrosine kinase, receptor , a type 1 (neurotrophic tyrosine kinase, receptor, type 1: NTRK1) gene fusion gene was identified in 3 cases of colorectal cancer clinical tissue (2.0%). Among the above fusion genes, the NTRK1 gene is a gene encoding a TrkA protein fixed to the cell membrane, and the TPM3-NTRK1 fusion gene has been reported in colorectal cancer and papillary thyroid cancer, and myosin phosphatase Rho interacting protein (myosin phosphatase Rho) in lung adenocarcinoma. A fusion gene between the interacting protein: MPRIP gene or CD74 gene and NTRK1 gene has been reported, a fusion gene between the TP53 gene or LMNA gene and NTRK1 gene has been reported in Spitzoid melanoma, and RAB gtipase-like activity in gallbladder cancer. A fusion gene between the RAB GTPase activating protein 1-like (RABGAP1L) gene and the NTRK1 gene has been reported. In polymorphic orphan species, a fusion between a neurofascin (NFASC) gene or a brevica (BCAN) gene and an NTRK1 gene has been reported. genes have been reported. However, the frequency and clinical significance of the NTRK1 fusion gene in colorectal cancer have not been identified.

실시예Example 17: 17: NTRK1NTRK1 유전자, gene, NTRK1NTRK1 융합유전자 및 이의 단백질 분석 Analysis of fusion gene and its protein

NTRK1 유전자 엑손의 발현은 NTRK1 융합유전자가 확인된 대장암 임상조직에서만 관찰되었다(도 1 참고). 역전사연쇄중합반응 및 생어시퀀싱을 이용하여 NTRK1 융합전사산물을 분석한 결과, TPM3-NTRK1 융합유전자는 TMP3 유전자 중 chr1: 154142876 위치에서 절단되어 서열번호 2를 보존하고, 구체적으로 서열번호 3을 5' 말단방향으로 보존하고, NTRK1 유전자 중 chr1:156844363 또는 chr1:156845312 또는 chr1:156845872 위치에서 절단되어 서열번호 8 또는 서열번호 10 또는 서열번호 12를 보존하고, 구체적으로 서열번호 9 또는 서열번호 11 또는 서열번호 13을 3' 말단방향으로 보존한 형태로 융합되었음이 확인되었다. LMNA-NTRK1 유전자는 LMNA 유전자 중 chr1:156105740 위치에서 절단되어 서얼변호 28을 보존하고, 구체적으로 서열번호 29를 5' 말단방향으로 보존하고, NTRK1 유전자 중 chr1:156845312 위치에서 절단되어 서열번호 10을 보존하고, 구체적으로 서열번호 11을 3' 말단방향으로 보존한 형태로 융합되었음이 확인되었다 (도 2 참고).
Expression of the NTRK1 gene exon was observed only in colorectal cancer clinical tissues in which the NTRK1 fusion gene was identified (see FIG. 1 ). As a result of analyzing the NTRK1 fusion transcript using reverse transcription chain polymerization and Sanger sequencing, the TPM3-NTRK1 fusion gene was cut at the chr1: 154142876 position in the TMP3 gene to preserve SEQ ID NO: 2, and specifically, SEQ ID NO: 3 to 5' conserved terminally and truncated at positions chr1:156844363 or chr1:156845312 or chr1:156845872 in the NTRK1 gene to preserve SEQ ID NO: 8 or SEQ ID NO: 10 or SEQ ID NO: 12, specifically SEQ ID NO: 9 or SEQ ID NO: 11 or sequence It was confirmed that No. 13 was fused in a form conserved in the 3' end direction. The LMNA-NTRK1 gene was cut at position chr1:156105740 of the LMNA gene to preserve Serial code 28, specifically, SEQ ID NO: 29 was conserved in the 5' end direction, and was cut at position chr1: 156845312 in the NTRK1 gene to obtain SEQ ID NO: 10 It was confirmed that the fusion was conserved, specifically, SEQ ID NO: 11 was conserved in the 3' end direction (refer to FIG. 2).

NTRK1 단백질에 대한 항체, 구체적으로 NTRK1에 의한 암호화되는 NTRK1 단백질, 구체적으로 TrkA 단백질의 C말단 부위에 결합하는 항체를 이용한 면역조직학 분석 결과, NTRK1 융합전사산물이 확인된 대장암 임상조직에서 TRKA 발현이 확인되었다(도 3 참고). NTRK1 융합유전자는 NTRK1 유전자에 대한 형광직접접합 분석으로 재확인하였다. NTRK1 유전자의 5' 말단은 TexRed가 표지된 프로브로 접합하였고, NTRK1 유전자의 3' 말단은 FITC가 표지된 프로브로 접합한 결과, NTRK1 융합전사산물 및 융합단백질이 확인된 대장암 임상조직에서 분리된 적색과 녹색의 프로브 신호가 확인되었고(도 4 참고), 정상 대장 임상조직에서는 합쳐진 적색과 녹색의 프로브 신호가 확인되었다(도 5 참고). NTRK1 융합유전자 및 융합단백질을 추정한 결과, NTRK1 융합단백질은 NTRK1 단백질 중 티로신키아나제 도메인이 잘 보존되어 있는 것이 확인되었다(도 6 참고).
As a result of immunohistologic analysis using an antibody against NTRK1 protein, specifically NTRK1 protein encoded by NTRK1, specifically an antibody that binds to the C-terminal region of TrkA protein, TRKA expression was observed in colorectal cancer clinical tissues in which NTRK1 fusion transcript was confirmed. was confirmed (see FIG. 3 ). The NTRK1 fusion gene was reconfirmed by fluorescence direct fusion analysis for the NTRK1 gene. The 5' end of the NTRK1 gene was spliced with a TexRed-labeled probe, and the 3' end of the NTRK1 gene was spliced with a FITC-labeled probe. As a result, NTRK1 fusion transcripts and fusion proteins were isolated from clinical tissues of colorectal cancer. Red and green probe signals were confirmed (refer to FIG. 4), and combined red and green probe signals were confirmed in normal colon clinical tissue (refer to FIG. 5). As a result of estimating the NTRK1 fusion gene and the fusion protein, it was confirmed that the NTRK1 fusion protein has a well-conserved tyrosine kinase domain in the NTRK1 protein (see FIG. 6 ).

실시예Example 18: 18: NTRK1NTRK1 융합유전자의 fusion gene 종양성neoplastic 확인 Confirm

NTRK1 융합유전자의 종양성은 갑상선 유두암 및 폐선암에서 보고되었다. 그러나 대장암에서 NTRK1 융합유전자의 종양성은 충분히 검증되지 않았다. TPM3-NTRK1 융합유전자 및 LMNA-NTRK1 융합유전자의 종양성을 확인하고자 인실리코(in silico) 및 체외 및 체내 평가가 실시되었다. 체세포 돌연변이 분석 결과를 기반으로 NTRK1 융합유전자의 종양성을 인실리코 방법으로 분석한 결과, NTRK1 융합유전자가 확인된 대장암 임상조직에서는 대표적인 대장암 유전자의 체세포 돌연변이가 관찰되지 않았다(도 7 참고). 이를 통하여 NTRK1 융합유전자가 대장암의 원인 유전자(driver oncogene)로서 작용하는 것을 확인하였다. NTRK1 융합유전자의 강제발현을 통해 형질전환된 NIH3T3 세포는 체외에서 KM12 대장암 세포주와 유사한 수준의 세포괴를 형성하였다. 이와 대조적으로 NTRK1 융합유전자가 없는 공벡터를 도입한 NIH3T3 세포주는 세포괴를 형성하지 않았다(도 8 참고). 형질전환된 NIH3T3 세포주를 면역능이 결핍된 누드마우스에 접종한, NTRK1 융합유전자가 도입된 NIH3T3 세포주는 세포 접종 후 18일째부터 측정이 가능한 종양이 형성되었고, 세포 접종 후 32일째에는 KM12 대장암 세포주와 유사한 수준의 종양으로 발달하였다(도 9 참고).
The oncogenicity of the NTRK1 fusion gene has been reported in papillary thyroid cancer and lung adenocarcinoma. However, the oncogenicity of the NTRK1 fusion gene in colorectal cancer has not been sufficiently verified. In silico and in vitro and in vivo evaluations were performed to confirm the tumorigenicity of the TPM3-NTRK1 fusion gene and the LMNA-NTRK1 fusion gene. As a result of in silico analysis of the neoplasticity of the NTRK1 fusion gene based on the results of the somatic mutation analysis, somatic mutations of the representative colorectal cancer gene were not observed in colorectal cancer clinical tissues in which the NTRK1 fusion gene was confirmed (refer to FIG. 7). Through this, it was confirmed that the NTRK1 fusion gene acts as a driver oncogene of colorectal cancer. NIH3T3 cells transformed through forced expression of the NTRK1 fusion gene formed a cell mass similar to that of the KM12 colorectal cancer cell line in vitro. In contrast, the NIH3T3 cell line introduced with the empty vector without the NTRK1 fusion gene did not form a cell mass (see FIG. 8 ). The transformed NIH3T3 cell line was inoculated into immune-deficient nude mice, and the NTRK1 fusion gene was introduced in the NIH3T3 cell line, and measurable tumors were formed from the 18th day after the cell inoculation. On the 32nd day after the cell inoculation, the KM12 colorectal cancer cell line and the KM12 colorectal cancer cell line It developed into a tumor at a similar level (see FIG. 9).

실시예Example 19: 19: NTRK1NTRK1 단백질 발현과 protein expression and NTRK1NTRK1 융합유전자의 상관성 Correlation of fusion genes

NTRK1 단백질은 NTRK1 유전자 융합에 의존적으로 발현한다는 점에 착안하여, 216명의 한국인 대장암 환자 코호트 및 472명의 중국인 대장암 환자 코호트로부터 구축한 조직마이크로어레이와 NTRK1 단백질, 구체적으로 NTRK1 유전자에 의해 암호화된 TrkA 단백질의 C말단 부위에 결합하는 항체를 이용하여 NTRK1 융합유전자의 빈도를 관찰한 결과, 29.2%의 한국인 대장암 환자 유래의 대장암 임상조직에서 NTRK1 단백질이 발현하는 것이 확인되었고, 25.6%의 중국인 대장암 환자 유래의 대장암 임상조직에서 NTRK1 단백질이 발현하는 것이 확인되었다 (도 10 참고). NTRK1 단백질 발현과 NTRK1 융합유전자의 상관성을 확인하고자, 한국인 대장암 환자 코호트로부터 NTRK1 단백질 발현이 확인된 한국인 대장암 환자의 임상조직에 NTRK1 유전자에 대한 형광직접접합을 실시하였다. 분리된 NTRK1 형광직접접합 신호의 빈도는 NTRK1 단백질의 발현이 확인된 임상조직에서 관찰되었다 (p < 0.0192) (도 11 및 표 13 참고). 따라서, NTRK1 융합유전자는 NTRK1 단백질 발현의 일부, 구체적으로 42.9%의 원인 유전자임이 확인되었다.
Considering that NTRK1 protein is expressed in an NTRK1 gene fusion-dependent manner, tissue microarrays and NTRK1 protein, specifically TrkA encoded by NTRK1 gene, were constructed from a cohort of 216 Korean colorectal cancer patients and 472 Chinese colorectal cancer patients. As a result of observing the frequency of the NTRK1 fusion gene using an antibody that binds to the C-terminal part of the protein, it was confirmed that the NTRK1 protein was expressed in 29.2% of colon cancer clinical tissues derived from Korean colorectal cancer patients, and 25.6% of the Chinese colon. It was confirmed that NTRK1 protein was expressed in colorectal cancer clinical tissues derived from cancer patients (see FIG. 10 ). In order to confirm the correlation between NTRK1 protein expression and the NTRK1 fusion gene, direct fluorescence fusion for the NTRK1 gene was performed in clinical tissues of Korean colorectal cancer patients whose NTRK1 protein expression was confirmed from a cohort of Korean colorectal cancer patients. The frequency of the isolated NTRK1 fluorescence direct junction signal was observed in clinical tissues in which NTRK1 protein expression was confirmed (p < 0.0192) (see FIG. 11 and Table 13). Therefore, it was confirmed that the NTRK1 fusion gene is a part of NTRK1 protein expression, specifically, the gene responsible for 42.9% of the expression.

NTRK1 단백질 발현과 NTRK1 융합유전자의 상관성Correlation between NTRK1 protein expression and NTRK1 fusion gene Sample IDSample ID Cytoplasmic TrkA expressionCytoplasmic TrkA expression NTRK1 fusionNTRK1 fusion P valueP value IHCIHC FISHFISH Colon_50_FISH01Colon_50_FISH01 StrongStrong Frequently detectedfrequently detected 0.01920.0192 Colon_50_FISH02Colon_50_FISH02 StrongStrong Not detectedNot detected Colon_50_FISH03Colon_50_FISH03 StrongStrong Not availableNot available Colon_50_FISH04Colon_50_FISH04 StrongStrong Frequently detectedfrequently detected Colon_50_FISH05Colon_50_FISH05 StrongStrong Not detectedNot detected Colon_50_FISH06Colon_50_FISH06 ModerateModerate Frequently detectedfrequently detected Colon_50_FISH07Colon_50_FISH07 ModerateModerate Not detectedNot detected Colon_50_FISH08Colon_50_FISH08 MildMild Not detectedNot detected Colon_50_FISH09Colon_50_FISH09 MildMild Not detectedNot detected Colon_50_FISH10Colon_50_FISH10 MildMild Not detectedNot detected Colon_50_FISH11Colon_50_FISH11 Negativenegative Not detectedNot detected Colon_50_FISH12Colon_50_FISH12 Negativenegative Not detectedNot detected Colon_50_FISH13Colon_50_FISH13 Negativenegative Not detectedNot detected Colon_50_FISH14Colon_50_FISH14 Negativenegative Not detectedNot detected Colon_50_FISH15Colon_50_FISH15 Negativenegative Not detectedNot detected

실시예Example 20: 20: NTRK1NTRK1 융합단백질과fusion protein and 대장암 환자군 생존율 Survival rate of colorectal cancer patient group

상기 임상 시료를 받은 대장암 환자 중에 추적이 가능한 216명의 한국인 대장암 환자에 대해 코호트 분석을 진행하였다. 216명의 한국인 대장암 환자에 대한 10년 생존율 추적 중 42명의 환자(24.1%)가 추적기간 동안 사망하였다. A cohort analysis was performed on 216 Korean colorectal cancer patients who could be tracked among colorectal cancer patients who received the clinical sample. Among the 10-year survival rates of 216 Korean colon cancer patients, 42 patients (24.1%) died during the follow-up period.

먼저, 임상 시료를 분석한 결과에 따라 전체 216명의 한국인 대장암 환자는 NTRK1 단백질의 발현에 따라 NTRK1 융합단백질 양성 환자군과 NTRK1 융합단백질 음성 환자군으로 계층화하였다. 계층화된 대장암 환자군 간의 임상병리학적 분석 결과, NTRK1 융합유전자 또는 이에 암호화된 NTRK1 융합단백질이 확인된 대장암 환자군은 좌측 대장에 대장암이 위치하고(p = 0.0504), 대장암의 침윤도가 높으며(p = 0.0437), 양성의 신경주위침윤 또는 림프혈관색전이가 관찰되고(p = 0.0429), 임파절 전이가 높고(p = 0.015), 현미부수체가 안정한 것으로(p = 0.0024) 확인되었다 (표 14 참고).
First, according to the results of analyzing clinical samples, a total of 216 Korean colorectal cancer patients were stratified into NTRK1 fusion protein-positive patients and NTRK1 fusion protein-negative patients according to the expression of NTRK1 protein. As a result of clinical pathological analysis between the stratified colorectal cancer patient groups, the colorectal cancer patient group in which the NTRK1 fusion gene or the NTRK1 fusion protein encoded therein was confirmed had colorectal cancer located in the left colon (p = 0.0504), and the colorectal cancer invasiveness was high (p = 0.0437), positive perineuronal infiltration or lymphatic vascular embolism was observed (p = 0.0429), lymph node metastasis was high (p = 0.015), and microsatellite was stable (p = 0.0024) (see Table 14). .

대장암 환자(한국인) 코호트의 임상병리적 특징Clinicopathological characteristics of colorectal cancer patients (Korean) cohort NN Cytoplasmic TrkACytoplasmic TrkA P valueP value (-)(-) (+)(+) 나이 (years)age (years) 216216 70.3570.35 70.2270.22 0.46750.4675 크기 (cm)Size (cm) 216216 5.1995.199 5.5485.548 0.29590.2959 성별gender 0.33510.3351 MaleMale 118118 8585 3333 FemaleFemale 9898 6868 3030 위치location 0.05040.0504 Right colonright colon 8787 6767 2020 Left colonleft colon 129129 8686 4343 Histological typeHistological type 0.07610.0761 wellwell 1616 1313 33 ModerateModerate 178178 120120 5858 PoorPoor 1010 1010 00 MucinousMucinous 1212 1010 22 Invasion depth
(T1-2 vs. T3)
Invasion depth
(T1-2 vs. T3)
0.04370.0437
T1T1 1212 1010 22 T2T2 2323 1919 44 T3T3 181181 124124 5757 Perineural invation
(PNI)
Perineural invation
(PNI)
0.13150.1315
Negativenegative 149149 109109 4040 PositivePositive 6767 4444 2323 Lymphovascular emboli (LVE)Lymphovascular emboli (LVE) 0.22290.2229 Negativenegative 142142 103103 3939 PositivePositive 7474 5050 2424 PNI/LVEPNI/LVE 0.04290.0429 Negativenegative 119119 9090 2929 PositivePositive 9797 6363 3434 Lymphnode metastasis
(N0 vs N1-2)
Lymphnode metastasis
(N0 vs N1-2)
0.0150.015
N0N0 124124 9595 2929 N1aN1a 4040 2323 1717 N1bN1b 3232 2222 1010 N2aN2a 1313 99 44 N2bN2b 77 44 33 Microsatellite statusMicrosatellite status 0.00240.0024 MSSMSS 180180 119119 6161 MSI-LMSI-L 66 55 1One MSI-HMSI-H 3030 2929 1One

상기 대장암 계층군의 10년 생존율을 분석한 결과, NTRK1 융합단백질이 확인된 대장암 환자군은 NTRK1 융합단백질이 확인되지 않은 대장암 환자군보다 유의적으로 낮은 생존율이 관찰되었다 (p = 0.0411, 위험도 = 0.5346, 95% 신뢰구간 = 0.2548~0.9722)(도 12 참고).
As a result of analyzing the 10-year survival rate of the colorectal cancer hierarchical group, the colorectal cancer patient group in which the NTRK1 fusion protein was confirmed had a significantly lower survival rate than the colorectal cancer patient group in which the NTRK1 fusion protein was not identified (p = 0.0411, risk = 0.5346, 95% confidence interval = 0.2548 to 0.9722) (see Figure 12).

실시예Example 21: 결론 21: Conclusion

이상 설명한 바와 같이, 본 발명에 의하면, TPM3-NTRK1 융합유전자 또는 이에 암호화된 융합전사산물 및 융합단백질 또는 NTRK1 유전자의 융합에 의존적인 NTRK1 유전자의 전사산물 및 단백질의 검출에 의하여 대장암 환자의 예후를 진단하고, NTRK1 단백질 저해제에 의한 대장암 치료의 유효성을 예측하는 것이 가능해진다.
As described above, according to the present invention, the prognosis of colorectal cancer patients can be improved by the detection of the TPM3-NTRK1 fusion gene or its encoded fusion transcript and the fusion protein or the NTRK1 gene transcript and protein dependent on the fusion of the NTRK1 gene. It becomes possible to diagnose and predict the effectiveness of colorectal cancer treatment with NTRK1 protein inhibitors.

NTRK1 단백질에 대한 저해 효과를 가지는 저해제는 이미 여러 암종의 치료를 위한 임상연구에 도입되어 있다. 예를 들면 레스타우르티닙은 전립선암, 신경아세포종, 골수성 백혈병에 대한 치료효과를 연구 중에 있고, 다누세르팁은 전립선암, 비소세포폐암, 만성 골수성 백혈병에 대한 치료효과를 연구 중에 있고, 미르시클립은 갑상선암 및 기타 고형암에 대한 치료효과를 연구 중에 있고, RXDA-101은 기타의 고형암에, TSR-011은 비소세포폐암에, NMS-P626은 대장암에, RXDX-102는 기타의 암종에 대한 치료효과를 연구 중에 있다.
Inhibitors having an inhibitory effect on NTRK1 protein have already been introduced into clinical studies for the treatment of various carcinomas. For example, restautinib is being studied for its therapeutic effect on prostate cancer, neuroblastoma, and myeloid leukemia, danucertib is being studied for its therapeutic effect on prostate cancer, non-small cell lung cancer, and chronic myelogenous leukemia, and myrciclib is being studied for its therapeutic effect on thyroid cancer and other solid cancers, RXDA-101 for other solid cancers, TSR-011 for non-small cell lung cancer, NMS-P626 for colorectal cancer, and RXDX-102 for other carcinomas The effect is being studied.

이와 같이, NTRK1 유전자의 융합 또는 이에 의존적인 NTRK1 유전자의 전사산물 및 단백질의 발현은 복수의 암종에서 생겨 있다. NTRK1 융합유전자는, KRAS, NRAS, PIK3CA 등 대장암 유전자의 돌연변이로부터 괴리하고 있다. 따라서, NTRK1 융합유전자는, 기존의 NTRK1 단백질 저해제, 구체적으로 NTRK1 티로신키나아제에 대한 저해능을 갖는 티로신티나아제 저해제의 표적이 될수 있다. 또한, NTRK1 융합유전자의 존재는 한국인을 포함한 중국인 대장암 환자에 있어서도 인정된다. 따라서, 본 발명의 방법은, 한국인 및 중국인 대장암 환자에 있어서, 대장암 치료의 효율을 높이는 동시에, 매우 유용하다.
As such, fusion of the NTRK1 gene or expression of the NTRK1 gene transcript and protein dependent thereon occurs in a plurality of carcinomas. The NTRK1 fusion gene is separated from mutations in colon cancer genes such as KRAS, NRAS, and PIK3CA. Therefore, the NTRK1 fusion gene can be a target of an existing NTRK1 protein inhibitor, specifically, a tyrosine tyrosine kinase inhibitor having inhibitory activity against NTRK1 tyrosine kinase. In addition, the existence of the NTRK1 fusion gene is recognized in Chinese colon cancer patients including Koreans. Therefore, the method of the present invention is very useful while increasing the efficiency of colorectal cancer treatment in Korean and Chinese colorectal cancer patients.

이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.From the above description, those skilled in the art to which the present invention pertains will understand that the present invention may be embodied in other specific forms without changing the technical spirit or essential characteristics thereof. In this regard, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. The scope of the present invention should be construed as being included in the scope of the present invention, rather than the above detailed description, all changes or modifications derived from the meaning and scope of the claims described below and their equivalents.

<110> LG Life Sciences Ltd. <120> Novel NTRK1 fusion gene as colon cancer marker and the uses thereof <130> KPA140037-KR-P1 <150> KR 10-2014-0004491 <151> 2014-01-14 <160> 38 <170> KopatentIn 2.0 <210> 1 <211> 858 <212> DNA <213> TPM3 cds <400> 1 atgatggagg ccatcaagaa aaagatgcag atgctgaagt tagacaagga gaatgctctg 60 gatcgggcag agcaagctga agctgagcag aagcaggcag aagaaagaag taaacagctg 120 gaggatgagc tggcagccat gcagaagaag ctgaaaggga cagaggatga gctggacaag 180 tattctgaag ctttgaagga tgcccaggag aagctggaac tggcagagaa gaaggctgct 240 gatgctgagg ctgaggtggc ctccttgaac cgtaggatcc agctggttga agaagagctg 300 gaccgtgctc aggagcgcct ggccactgcc ctgcaaaagc tggaagaagc tgaaaaagct 360 gctgatgaga gtgagagagg tatgaaggtt attgaaaacc gggccttaaa agatgaagaa 420 aagatggaac tccaggaaat ccaactcaaa gaagctaagc acattgcaga agaggcagat 480 aggaagtatg aagaggtggc tcgtaagttg gtgatcattg aaggagactt ggaacgcaca 540 gaggaacgag ctgagctggc agagtctaag tgttctgagc tggaggagga gctgaagaat 600 gtcaccaaca acctcaagtc tcttgaggct caggcggaga agtactctca aaaagaagat 660 aaatatgagg aagaaatcaa gattcttact gataaactca aggaggcaga gacccgtgct 720 gagtttgctg agagatcggt agccaagctg gaaaagacaa ttgatgacct ggaagatgag 780 ctctatgccc agaaactgaa gtacaaggcc attagcgagg agctggacca cgccctcaat 840 gacatgacct ctatataa 858 <210> 2 <211> 775 <212> DNA <213> TPM3 fragment cDNA <400> 2 atgatggagg ccatcaagaa aaagatgcag atgctgaagt tagacaagga gaatgctctg 60 gatcgggcag agcaagctga agctgagcag aagcaggcag aagaaagaag taaacagctg 120 gaggatgagc tggcagccat gcagaagaag ctgaaaggga cagaggatga gctggacaag 180 tattctgaag ctttgaagga tgcccaggag aagctggaac tggcagagaa gaaggctgct 240 gatgctgagg ctgaggtggc ctccttgaac cgtaggatcc agctggttga agaagagctg 300 gaccgtgctc aggagcgcct ggccactgcc ctgcaaaagc tggaagaagc tgaaaaagct 360 gctgatgaga gtgagagagg tatgaaggtt attgaaaacc gggccttaaa agatgaagaa 420 aagatggaac tccaggaaat ccaactcaaa gaagctaagc acattgcaga agaggcagat 480 aggaagtatg aagaggtggc tcgtaagttg gtgatcattg aaggagactt ggaacgcaca 540 gaggaacgag ctgagctggc agagtctaag tgttctgagc tggaggagga gctgaagaat 600 gtcaccaaca acctcaagtc tcttgaggct caggcggaga agtactctca aaaagaagat 660 aaatatgagg aagaaatcaa gattcttact gataaactca aggaggcaga gacccgtgct 720 gagtttgctg agagatcggt agccaagctg gaaaagacaa ttgatgacct ggaag 775 <210> 3 <211> 16 <212> DNA <213> TPM3 5'terminal cleavage site seq <400> 3 attgatgacc tggaag 16 <210> 4 <211> 285 <212> PRT <213> TPM3 full length <400> 4 Met Met Glu Ala Ile Lys Lys Lys Met Gln Met Leu Lys Leu Asp Lys 1 5 10 15 Glu Asn Ala Leu Asp Arg Ala Glu Gln Ala Glu Ala Glu Gln Lys Gln 20 25 30 Ala Glu Glu Arg Ser Lys Gln Leu Glu Asp Glu Leu Ala Ala Met Gln 35 40 45 Lys Lys Leu Lys Gly Thr Glu Asp Glu Leu Asp Lys Tyr Ser Glu Ala 50 55 60 Leu Lys Asp Ala Gln Glu Lys Leu Glu Leu Ala Glu Lys Lys Ala Ala 65 70 75 80 Asp Ala Glu Ala Glu Val Ala Ser Leu Asn Arg Arg Ile Gln Leu Val 85 90 95 Glu Glu Glu Leu Asp Arg Ala Gln Glu Arg Leu Ala Thr Ala Leu Gln 100 105 110 Lys Leu Glu Glu Ala Glu Lys Ala Ala Asp Glu Ser Glu Arg Gly Met 115 120 125 Lys Val Ile Glu Asn Arg Ala Leu Lys Asp Glu Glu Lys Met Glu Leu 130 135 140 Gln Glu Ile Gln Leu Lys Glu Ala Lys His Ile Ala Glu Glu Ala Asp 145 150 155 160 Arg Lys Tyr Glu Glu Val Ala Arg Lys Leu Val Ile Ile Glu Gly Asp 165 170 175 Leu Glu Arg Thr Glu Glu Arg Ala Glu Leu Ala Glu Ser Lys Cys Ser 180 185 190 Glu Leu Glu Glu Glu Leu Lys Asn Val Thr Asn Asn Leu Lys Ser Leu 195 200 205 Glu Ala Gln Ala Glu Lys Tyr Ser Gln Lys Glu Asp Lys Tyr Glu Glu 210 215 220 Glu Ile Lys Ile Leu Thr Asp Lys Leu Lys Glu Ala Glu Thr Arg Ala 225 230 235 240 Glu Phe Ala Glu Arg Ser Val Ala Lys Leu Glu Lys Thr Ile Asp Asp 245 250 255 Leu Glu Asp Glu Leu Tyr Ala Gln Lys Leu Lys Tyr Lys Ala Ile Ser 260 265 270 Glu Glu Leu Asp His Ala Leu Asn Asp Met Thr Ser Ile 275 280 285 <210> 5 <211> 258 <212> PRT <213> TPM3 fragment <400> 5 Met Met Glu Ala Ile Lys Lys Lys Met Gln Met Leu Lys Leu Asp Lys 1 5 10 15 Glu Asn Ala Leu Asp Arg Ala Glu Gln Ala Glu Ala Glu Gln Lys Gln 20 25 30 Ala Glu Glu Arg Ser Lys Gln Leu Glu Asp Glu Leu Ala Ala Met Gln 35 40 45 Lys Lys Leu Lys Gly Thr Glu Asp Glu Leu Asp Lys Tyr Ser Glu Ala 50 55 60 Leu Lys Asp Ala Gln Glu Lys Leu Glu Leu Ala Glu Lys Lys Ala Ala 65 70 75 80 Asp Ala Glu Ala Glu Val Ala Ser Leu Asn Arg Arg Ile Gln Leu Val 85 90 95 Glu Glu Glu Leu Asp Arg Ala Gln Glu Arg Leu Ala Thr Ala Leu Gln 100 105 110 Lys Leu Glu Glu Ala Glu Lys Ala Ala Asp Glu Ser Glu Arg Gly Met 115 120 125 Lys Val Ile Glu Asn Arg Ala Leu Lys Asp Glu Glu Lys Met Glu Leu 130 135 140 Gln Glu Ile Gln Leu Lys Glu Ala Lys His Ile Ala Glu Glu Ala Asp 145 150 155 160 Arg Lys Tyr Glu Glu Val Ala Arg Lys Leu Val Ile Ile Glu Gly Asp 165 170 175 Leu Glu Arg Thr Glu Glu Arg Ala Glu Leu Ala Glu Ser Lys Cys Ser 180 185 190 Glu Leu Glu Glu Glu Leu Lys Asn Val Thr Asn Asn Leu Lys Ser Leu 195 200 205 Glu Ala Gln Ala Glu Lys Tyr Ser Gln Lys Glu Asp Lys Tyr Glu Glu 210 215 220 Glu Ile Lys Ile Leu Thr Asp Lys Leu Lys Glu Ala Glu Thr Arg Ala 225 230 235 240 Glu Phe Ala Glu Arg Ser Val Ala Lys Leu Glu Lys Thr Ile Asp Asp 245 250 255 Leu Glu <210> 6 <211> 5 <212> PRT <213> TPM3 N terminus cleavage site seq <400> 6 Ile Asp Asp Leu Glu 1 5 <210> 7 <211> 2391 <212> DNA <213> NTRK1 CDS <400> 7 atgctgcgag gcggacggcg cgggcagctt ggctggcaca gctgggctgc ggggccgggc 60 agcctgctgg cttggctgat actggcatct gcgggcgccg caccctgccc cgatgcctgc 120 tgcccccacg gctcctcggg actgcgatgc acccgggatg gggccctgga tagcctccac 180 cacctgcccg gcgcagagaa cctgactgag ctctacatcg agaaccagca gcatctgcag 240 catctggagc tccgtgatct gaggggcctg ggggagctga gaaacctcac catcgtgaag 300 agtggtctcc gtttcgtggc gccagatgcc ttccatttca ctcctcggct cagtcgcctg 360 aatctctcct tcaacgctct ggagtctctc tcctggaaaa ctgtgcaggg cctctcctta 420 caggaactgg tcctgtcggg gaaccctctg cactgttctt gtgccctgcg ctggctacag 480 cgctgggagg aggagggact gggcggagtg cctgaacaga agctgcagtg tcatgggcaa 540 gggcccctgg cccacatgcc caatgccagc tgtggtgtgc ccacgctgaa ggtccaggtg 600 cccaatgcct cggtggatgt gggggacgac gtgctgctgc ggtgccaggt ggaggggcgg 660 ggcctggagc aggccggctg gatcctcaca gagctggagc agtcagccac ggtgatgaaa 720 tctgggggtc tgccatccct ggggctgacc ctggccaatg tcaccagtga cctcaacagg 780 aagaacgtga cgtgctgggc agagaacgat gtgggccggg cagaggtctc tgttcaggtc 840 aacgtctcct tcccggccag tgtgcagctg cacacggcgg tggagatgca ccactggtgc 900 atccccttct ctgtggatgg gcagccggca ccgtctctgc gctggctctt caatggctcc 960 gtgctcaatg agaccagctt catcttcact gagttcctgg agccggcagc caatgagacc 1020 gtgcggcacg ggtgtctgcg cctcaaccag cccacccacg tcaacaacgg caactacacg 1080 ctgctggctg ccaacccctt cggccaggcc tccgcctcca tcatggctgc cttcatggac 1140 aaccctttcg agttcaaccc cgaggacccc atccctgtct ccttctcgcc ggtggacact 1200 aacagcacat ctggagaccc ggtggagaag aaggacgaaa caccttttgg ggtctcggtg 1260 gctgtgggcc tggccgtctt tgcctgcctc ttcctttcta cgctgctcct tgtgctcaac 1320 aaatgtggac ggagaaacaa gtttgggatc aaccgcccgg ctgtgctggc tccagaggat 1380 gggctggcca tgtccctgca tttcatgaca ttgggtggca gctccctgtc ccccaccgag 1440 ggcaaaggct ctgggctcca aggccacatc atcgagaacc cacaatactt cagtgatgcc 1500 tgtgttcacc acatcaagcg ccgggacatc gtgctcaagt gggagctggg ggagggcgcc 1560 tttgggaagg tcttccttgc tgagtgccac aacctcctgc ctgagcagga caagatgctg 1620 gtggctgtca aggcactgaa ggaggcgtcc gagagtgctc ggcaggactt ccagcgtgag 1680 gctgagctgc tcaccatgct gcagcaccag cacatcgtgc gcttcttcgg cgtctgcacc 1740 gagggccgcc ccctgctcat ggtctttgag tatatgcggc acggggacct caaccgcttc 1800 ctccgatccc atggacctga tgccaagctg ctggctggtg gggaggatgt ggctccaggc 1860 cccctgggtc tggggcagct gctggccgtg gctagccagg tcgctgcggg gatggtgtac 1920 ctggcgggtc tgcattttgt gcaccgggac ctggccacac gcaactgtct agtgggccag 1980 ggactggtgg tcaagattgg tgattttggc atgagcaggg atatctacag caccgactat 2040 taccgtgtgg gaggccgcac catgctgccc attcgctgga tgccgcccga gagcatcctg 2100 taccgtaagt tcaccaccga gagcgacgtg tggagcttcg gcgtggtgct ctgggagatc 2160 ttcacctacg gcaagcagcc ctggtaccag ctctccaaca cggaggcaat cgactgcatc 2220 acgcagggac gtgagttgga gcggccacgt gcctgcccac cagaggtcta cgccatcatg 2280 cggggctgct ggcagcggga gccccagcaa cgccacagca tcaaggatgt gcacgcccgg 2340 ctgcaagccc tggcccaggc acctcctgtc tacctggatg tcctgggcta g 2391 <210> 8 <211> 1196 <212> DNA <213> NTRK1 fragment cDNA <400> 8 acactaacag cacatctgga gacccggtgg agaagaagga cgaaacacct tttggggtct 60 cggtggctgt gggcctggcc gtctttgcct gcctcttcct ttctacgctg ctccttgtgc 120 tcaacaaatg tggacggaga aacaagtttg ggatcaaccg cccggctgtg ctggctccag 180 aggatgggct ggccatgtcc ctgcatttca tgacattggg tggcagctcc ctgtccccca 240 ccgagggcaa aggctctggg ctccaaggcc acatcatcga gaacccacaa tacttcagtg 300 atgcctgtgt tcaccacatc aagcgccggg acatcgtgct caagtgggag ctgggggagg 360 gcgcctttgg gaaggtcttc cttgctgagt gccacaacct cctgcctgag caggacaaga 420 tgctggtggc tgtcaaggca ctgaaggagg cgtccgagag tgctcggcag gacttccagc 480 gtgaggctga gctgctcacc atgctgcagc accagcacat cgtgcgcttc ttcggcgtct 540 gcaccgaggg ccgccccctg ctcatggtct ttgagtatat gcggcacggg gacctcaacc 600 gcttcctccg atcccatgga cctgatgcca agctgctggc tggtggggag gatgtggctc 660 caggccccct gggtctgggg cagctgctgg ccgtggctag ccaggtcgct gcggggatgg 720 tgtacctggc gggtctgcat tttgtgcacc gggacctggc cacacgcaac tgtctagtgg 780 gccagggact ggtggtcaag attggtgatt ttggcatgag cagggatatc tacagcaccg 840 actattaccg tgtgggaggc cgcaccatgc tgcccattcg ctggatgccg cccgagagca 900 tcctgtaccg taagttcacc accgagagcg acgtgtggag cttcggcgtg gtgctctggg 960 agatcttcac ctacggcaag cagccctggt accagctctc caacacggag gcaatcgact 1020 gcatcacgca gggacgtgag ttggagcggc cacgtgcctg cccaccagag gtctacgcca 1080 tcatgcgggg ctgctggcag cgggagcccc agcaacgcca cagcatcaag gatgtgcacg 1140 cccggctgca agccctggcc caggcacctc ctgtctacct ggatgtcctg ggctag 1196 <210> 9 <211> 17 <212> DNA <213> NTRK1 3' terminal cleavage site seq <400> 9 acactaacag cacatct 17 <210> 10 <211> 1037 <212> DNA <213> NTRK1 fragment cDNA <400> 10 gcccggctgt gctggctcca gaggatgggc tggccatgtc cctgcatttc atgacattgg 60 gtggcagctc cctgtccccc accgagggca aaggctctgg gctccaaggc cacatcatcg 120 agaacccaca atacttcagt gatgcctgtg ttcaccacat caagcgccgg gacatcgtgc 180 tcaagtggga gctgggggag ggcgcctttg ggaaggtctt ccttgctgag tgccacaacc 240 tcctgcctga gcaggacaag atgctggtgg ctgtcaaggc actgaaggag gcgtccgaga 300 gtgctcggca ggacttccag cgtgaggctg agctgctcac catgctgcag caccagcaca 360 tcgtgcgctt cttcggcgtc tgcaccgagg gccgccccct gctcatggtc tttgagtata 420 tgcggcacgg ggacctcaac cgcttcctcc gatcccatgg acctgatgcc aagctgctgg 480 ctggtgggga ggatgtggct ccaggccccc tgggtctggg gcagctgctg gccgtggcta 540 gccaggtcgc tgcggggatg gtgtacctgg cgggtctgca ttttgtgcac cgggacctgg 600 ccacacgcaa ctgtctagtg ggccagggac tggtggtcaa gattggtgat tttggcatga 660 gcagggatat ctacagcacc gactattacc gtgtgggagg ccgcaccatg ctgcccattc 720 gctggatgcc gcccgagagc atcctgtacc gtaagttcac caccgagagc gacgtgtgga 780 gcttcggcgt ggtgctctgg gagatcttca cctacggcaa gcagccctgg taccagctct 840 ccaacacgga ggcaatcgac tgcatcacgc agggacgtga gttggagcgg ccacgtgcct 900 gcccaccaga ggtctacgcc atcatgcggg gctgctggca gcgggagccc cagcaacgcc 960 acagcatcaa ggatgtgcac gcccggctgc aagccctggc ccaggcacct cctgtctacc 1020 tggatgtcct gggctag 1037 <210> 11 <211> 17 <212> DNA <213> NTRK1 3' terminal cleavage site seq <400> 11 gcccggctgt gctggct 17 <210> 12 <211> 890 <212> DNA <213> NTRK1 fragment cDNA <400> 12 gtgttcacca catcaagcgc cgggacatcg tgctcaagtg ggagctgggg gagggcgcct 60 ttgggaaggt cttccttgct gagtgccaca acctcctgcc tgagcaggac aagatgctgg 120 tggctgtcaa ggcactgaag gaggcgtccg agagtgctcg gcaggacttc cagcgtgagg 180 ctgagctgct caccatgctg cagcaccagc acatcgtgcg cttcttcggc gtctgcaccg 240 agggccgccc cctgctcatg gtctttgagt atatgcggca cggggacctc aaccgcttcc 300 tccgatccca tggacctgat gccaagctgc tggctggtgg ggaggatgtg gctccaggcc 360 ccctgggtct ggggcagctg ctggccgtgg ctagccaggt cgctgcgggg atggtgtacc 420 tggcgggtct gcattttgtg caccgggacc tggccacacg caactgtcta gtgggccagg 480 gactggtggt caagattggt gattttggca tgagcaggga tatctacagc accgactatt 540 accgtgtggg aggccgcacc atgctgccca ttcgctggat gccgcccgag agcatcctgt 600 accgtaagtt caccaccgag agcgacgtgt ggagcttcgg cgtggtgctc tgggagatct 660 tcacctacgg caagcagccc tggtaccagc tctccaacac ggaggcaatc gactgcatca 720 cgcagggacg tgagttggag cggccacgtg cctgcccacc agaggtctac gccatcatgc 780 ggggctgctg gcagcgggag ccccagcaac gccacagcat caaggatgtg cacgcccggc 840 tgcaagccct ggcccaggca cctcctgtct acctggatgt cctgggctag 890 <210> 13 <211> 17 <212> DNA <213> NTRK1 3' terminal cleavage site seq <400> 13 gtgttcacca catcaag 17 <210> 14 <211> 796 <212> PRT <213> NTRK1 full length <400> 14 Met Leu Arg Gly Gly Arg Arg Gly Gln Leu Gly Trp His Ser Trp Ala 1 5 10 15 Ala Gly Pro Gly Ser Leu Leu Ala Trp Leu Ile Leu Ala Ser Ala Gly 20 25 30 Ala Ala Pro Cys Pro Asp Ala Cys Cys Pro His Gly Ser Ser Gly Leu 35 40 45 Arg Cys Thr Arg Asp Gly Ala Leu Asp Ser Leu His His Leu Pro Gly 50 55 60 Ala Glu Asn Leu Thr Glu Leu Tyr Ile Glu Asn Gln Gln His Leu Gln 65 70 75 80 His Leu Glu Leu Arg Asp Leu Arg Gly Leu Gly Glu Leu Arg Asn Leu 85 90 95 Thr Ile Val Lys Ser Gly Leu Arg Phe Val Ala Pro Asp Ala Phe His 100 105 110 Phe Thr Pro Arg Leu Ser Arg Leu Asn Leu Ser Phe Asn Ala Leu Glu 115 120 125 Ser Leu Ser Trp Lys Thr Val Gln Gly Leu Ser Leu Gln Glu Leu Val 130 135 140 Leu Ser Gly Asn Pro Leu His Cys Ser Cys Ala Leu Arg Trp Leu Gln 145 150 155 160 Arg Trp Glu Glu Glu Gly Leu Gly Gly Val Pro Glu Gln Lys Leu Gln 165 170 175 Cys His Gly Gln Gly Pro Leu Ala His Met Pro Asn Ala Ser Cys Gly 180 185 190 Val Pro Thr Leu Lys Val Gln Val Pro Asn Ala Ser Val Asp Val Gly 195 200 205 Asp Asp Val Leu Leu Arg Cys Gln Val Glu Gly Arg Gly Leu Glu Gln 210 215 220 Ala Gly Trp Ile Leu Thr Glu Leu Glu Gln Ser Ala Thr Val Met Lys 225 230 235 240 Ser Gly Gly Leu Pro Ser Leu Gly Leu Thr Leu Ala Asn Val Thr Ser 245 250 255 Asp Leu Asn Arg Lys Asn Val Thr Cys Trp Ala Glu Asn Asp Val Gly 260 265 270 Arg Ala Glu Val Ser Val Gln Val Asn Val Ser Phe Pro Ala Ser Val 275 280 285 Gln Leu His Thr Ala Val Glu Met His His Trp Cys Ile Pro Phe Ser 290 295 300 Val Asp Gly Gln Pro Ala Pro Ser Leu Arg Trp Leu Phe Asn Gly Ser 305 310 315 320 Val Leu Asn Glu Thr Ser Phe Ile Phe Thr Glu Phe Leu Glu Pro Ala 325 330 335 Ala Asn Glu Thr Val Arg His Gly Cys Leu Arg Leu Asn Gln Pro Thr 340 345 350 His Val Asn Asn Gly Asn Tyr Thr Leu Leu Ala Ala Asn Pro Phe Gly 355 360 365 Gln Ala Ser Ala Ser Ile Met Ala Ala Phe Met Asp Asn Pro Phe Glu 370 375 380 Phe Asn Pro Glu Asp Pro Ile Pro Val Ser Phe Ser Pro Val Asp Thr 385 390 395 400 Asn Ser Thr Ser Gly Asp Pro Val Glu Lys Lys Asp Glu Thr Pro Phe 405 410 415 Gly Val Ser Val Ala Val Gly Leu Ala Val Phe Ala Cys Leu Phe Leu 420 425 430 Ser Thr Leu Leu Leu Val Leu Asn Lys Cys Gly Arg Arg Asn Lys Phe 435 440 445 Gly Ile Asn Arg Pro Ala Val Leu Ala Pro Glu Asp Gly Leu Ala Met 450 455 460 Ser Leu His Phe Met Thr Leu Gly Gly Ser Ser Leu Ser Pro Thr Glu 465 470 475 480 Gly Lys Gly Ser Gly Leu Gln Gly His Ile Ile Glu Asn Pro Gln Tyr 485 490 495 Phe Ser Asp Ala Cys Val His His Ile Lys Arg Arg Asp Ile Val Leu 500 505 510 Lys Trp Glu Leu Gly Glu Gly Ala Phe Gly Lys Val Phe Leu Ala Glu 515 520 525 Cys His Asn Leu Leu Pro Glu Gln Asp Lys Met Leu Val Ala Val Lys 530 535 540 Ala Leu Lys Glu Ala Ser Glu Ser Ala Arg Gln Asp Phe Gln Arg Glu 545 550 555 560 Ala Glu Leu Leu Thr Met Leu Gln His Gln His Ile Val Arg Phe Phe 565 570 575 Gly Val Cys Thr Glu Gly Arg Pro Leu Leu Met Val Phe Glu Tyr Met 580 585 590 Arg His Gly Asp Leu Asn Arg Phe Leu Arg Ser His Gly Pro Asp Ala 595 600 605 Lys Leu Leu Ala Gly Gly Glu Asp Val Ala Pro Gly Pro Leu Gly Leu 610 615 620 Gly Gln Leu Leu Ala Val Ala Ser Gln Val Ala Ala Gly Met Val Tyr 625 630 635 640 Leu Ala Gly Leu His Phe Val His Arg Asp Leu Ala Thr Arg Asn Cys 645 650 655 Leu Val Gly Gln Gly Leu Val Val Lys Ile Gly Asp Phe Gly Met Ser 660 665 670 Arg Asp Ile Tyr Ser Thr Asp Tyr Tyr Arg Val Gly Gly Arg Thr Met 675 680 685 Leu Pro Ile Arg Trp Met Pro Pro Glu Ser Ile Leu Tyr Arg Lys Phe 690 695 700 Thr Thr Glu Ser Asp Val Trp Ser Phe Gly Val Val Leu Trp Glu Ile 705 710 715 720 Phe Thr Tyr Gly Lys Gln Pro Trp Tyr Gln Leu Ser Asn Thr Glu Ala 725 730 735 Ile Asp Cys Ile Thr Gln Gly Arg Glu Leu Glu Arg Pro Arg Ala Cys 740 745 750 Pro Pro Glu Val Tyr Ala Ile Met Arg Gly Cys Trp Gln Arg Glu Pro 755 760 765 Gln Gln Arg His Ser Ile Lys Asp Val His Ala Arg Leu Gln Ala Leu 770 775 780 Ala Gln Ala Pro Pro Val Tyr Leu Asp Val Leu Gly 785 790 795 <210> 15 <211> 397 <212> PRT <213> NTRK1 fragment <400> 15 Thr Asn Ser Thr Ser Gly Asp Pro Val Glu Lys Lys Asp Glu Thr Pro 1 5 10 15 Phe Gly Val Ser Val Ala Val Gly Leu Ala Val Phe Ala Cys Leu Phe 20 25 30 Leu Ser Thr Leu Leu Leu Val Leu Asn Lys Cys Gly Arg Arg Asn Lys 35 40 45 Phe Gly Ile Asn Arg Pro Ala Val Leu Ala Pro Glu Asp Gly Leu Ala 50 55 60 Met Ser Leu His Phe Met Thr Leu Gly Gly Ser Ser Leu Ser Pro Thr 65 70 75 80 Glu Gly Lys Gly Ser Gly Leu Gln Gly His Ile Ile Glu Asn Pro Gln 85 90 95 Tyr Phe Ser Asp Ala Cys Val His His Ile Lys Arg Arg Asp Ile Val 100 105 110 Leu Lys Trp Glu Leu Gly Glu Gly Ala Phe Gly Lys Val Phe Leu Ala 115 120 125 Glu Cys His Asn Leu Leu Pro Glu Gln Asp Lys Met Leu Val Ala Val 130 135 140 Lys Ala Leu Lys Glu Ala Ser Glu Ser Ala Arg Gln Asp Phe Gln Arg 145 150 155 160 Glu Ala Glu Leu Leu Thr Met Leu Gln His Gln His Ile Val Arg Phe 165 170 175 Phe Gly Val Cys Thr Glu Gly Arg Pro Leu Leu Met Val Phe Glu Tyr 180 185 190 Met Arg His Gly Asp Leu Asn Arg Phe Leu Arg Ser His Gly Pro Asp 195 200 205 Ala Lys Leu Leu Ala Gly Gly Glu Asp Val Ala Pro Gly Pro Leu Gly 210 215 220 Leu Gly Gln Leu Leu Ala Val Ala Ser Gln Val Ala Ala Gly Met Val 225 230 235 240 Tyr Leu Ala Gly Leu His Phe Val His Arg Asp Leu Ala Thr Arg Asn 245 250 255 Cys Leu Val Gly Gln Gly Leu Val Val Lys Ile Gly Asp Phe Gly Met 260 265 270 Ser Arg Asp Ile Tyr Ser Thr Asp Tyr Tyr Arg Val Gly Gly Arg Thr 275 280 285 Met Leu Pro Ile Arg Trp Met Pro Pro Glu Ser Ile Leu Tyr Arg Lys 290 295 300 Phe Thr Thr Glu Ser Asp Val Trp Ser Phe Gly Val Val Leu Trp Glu 305 310 315 320 Ile Phe Thr Tyr Gly Lys Gln Pro Trp Tyr Gln Leu Ser Asn Thr Glu 325 330 335 Ala Ile Asp Cys Ile Thr Gln Gly Arg Glu Leu Glu Arg Pro Arg Ala 340 345 350 Cys Pro Pro Glu Val Tyr Ala Ile Met Arg Gly Cys Trp Gln Arg Glu 355 360 365 Pro Gln Gln Arg His Ser Ile Lys Asp Val His Ala Arg Leu Gln Ala 370 375 380 Leu Ala Gln Ala Pro Pro Val Tyr Leu Asp Val Leu Gly 385 390 395 <210> 16 <211> 344 <212> PRT <213> NTRK1 fragment <400> 16 Pro Ala Val Leu Ala Pro Glu Asp Gly Leu Ala Met Ser Leu His Phe 1 5 10 15 Met Thr Leu Gly Gly Ser Ser Leu Ser Pro Thr Glu Gly Lys Gly Ser 20 25 30 Gly Leu Gln Gly His Ile Ile Glu Asn Pro Gln Tyr Phe Ser Asp Ala 35 40 45 Cys Val His His Ile Lys Arg Arg Asp Ile Val Leu Lys Trp Glu Leu 50 55 60 Gly Glu Gly Ala Phe Gly Lys Val Phe Leu Ala Glu Cys His Asn Leu 65 70 75 80 Leu Pro Glu Gln Asp Lys Met Leu Val Ala Val Lys Ala Leu Lys Glu 85 90 95 Ala Ser Glu Ser Ala Arg Gln Asp Phe Gln Arg Glu Ala Glu Leu Leu 100 105 110 Thr Met Leu Gln His Gln His Ile Val Arg Phe Phe Gly Val Cys Thr 115 120 125 Glu Gly Arg Pro Leu Leu Met Val Phe Glu Tyr Met Arg His Gly Asp 130 135 140 Leu Asn Arg Phe Leu Arg Ser His Gly Pro Asp Ala Lys Leu Leu Ala 145 150 155 160 Gly Gly Glu Asp Val Ala Pro Gly Pro Leu Gly Leu Gly Gln Leu Leu 165 170 175 Ala Val Ala Ser Gln Val Ala Ala Gly Met Val Tyr Leu Ala Gly Leu 180 185 190 His Phe Val His Arg Asp Leu Ala Thr Arg Asn Cys Leu Val Gly Gln 195 200 205 Gly Leu Val Val Lys Ile Gly Asp Phe Gly Met Ser Arg Asp Ile Tyr 210 215 220 Ser Thr Asp Tyr Tyr Arg Val Gly Gly Arg Thr Met Leu Pro Ile Arg 225 230 235 240 Trp Met Pro Pro Glu Ser Ile Leu Tyr Arg Lys Phe Thr Thr Glu Ser 245 250 255 Asp Val Trp Ser Phe Gly Val Val Leu Trp Glu Ile Phe Thr Tyr Gly 260 265 270 Lys Gln Pro Trp Tyr Gln Leu Ser Asn Thr Glu Ala Ile Asp Cys Ile 275 280 285 Thr Gln Gly Arg Glu Leu Glu Arg Pro Arg Ala Cys Pro Pro Glu Val 290 295 300 Tyr Ala Ile Met Arg Gly Cys Trp Gln Arg Glu Pro Gln Gln Arg His 305 310 315 320 Ser Ile Lys Asp Val His Ala Arg Leu Gln Ala Leu Ala Gln Ala Pro 325 330 335 Pro Val Tyr Leu Asp Val Leu Gly 340 <210> 17 <211> 5 <212> PRT <213> NTRK1 C terminus cleavage site aa seq <400> 17 Pro Ala Val Leu Ala 1 5 <210> 18 <211> 295 <212> PRT <213> NTRK1 fragment site <400> 18 Val His His Ile Lys Arg Arg Asp Ile Val Leu Lys Trp Glu Leu Gly 1 5 10 15 Glu Gly Ala Phe Gly Lys Val Phe Leu Ala Glu Cys His Asn Leu Leu 20 25 30 Pro Glu Gln Asp Lys Met Leu Val Ala Val Lys Ala Leu Lys Glu Ala 35 40 45 Ser Glu Ser Ala Arg Gln Asp Phe Gln Arg Glu Ala Glu Leu Leu Thr 50 55 60 Met Leu Gln His Gln His Ile Val Arg Phe Phe Gly Val Cys Thr Glu 65 70 75 80 Gly Arg Pro Leu Leu Met Val Phe Glu Tyr Met Arg His Gly Asp Leu 85 90 95 Asn Arg Phe Leu Arg Ser His Gly Pro Asp Ala Lys Leu Leu Ala Gly 100 105 110 Gly Glu Asp Val Ala Pro Gly Pro Leu Gly Leu Gly Gln Leu Leu Ala 115 120 125 Val Ala Ser Gln Val Ala Ala Gly Met Val Tyr Leu Ala Gly Leu His 130 135 140 Phe Val His Arg Asp Leu Ala Thr Arg Asn Cys Leu Val Gly Gln Gly 145 150 155 160 Leu Val Val Lys Ile Gly Asp Phe Gly Met Ser Arg Asp Ile Tyr Ser 165 170 175 Thr Asp Tyr Tyr Arg Val Gly Gly Arg Thr Met Leu Pro Ile Arg Trp 180 185 190 Met Pro Pro Glu Ser Ile Leu Tyr Arg Lys Phe Thr Thr Glu Ser Asp 195 200 205 Val Trp Ser Phe Gly Val Val Leu Trp Glu Ile Phe Thr Tyr Gly Lys 210 215 220 Gln Pro Trp Tyr Gln Leu Ser Asn Thr Glu Ala Ile Asp Cys Ile Thr 225 230 235 240 Gln Gly Arg Glu Leu Glu Arg Pro Arg Ala Cys Pro Pro Glu Val Tyr 245 250 255 Ala Ile Met Arg Gly Cys Trp Gln Arg Glu Pro Gln Gln Arg His Ser 260 265 270 Ile Lys Asp Val His Ala Arg Leu Gln Ala Leu Ala Gln Ala Pro Pro 275 280 285 Val Tyr Leu Asp Val Leu Gly 290 295 <210> 19 <211> 5 <212> PRT <213> NTRK1 C terminus cleavage site seq <400> 19 Val His His Ile Lys 1 5 <210> 20 <211> 5 <212> PRT <213> NTRK1 C terminus cleavage site seq <400> 20 Val His His Ile Lys 1 5 <210> 21 <211> 33 <212> DNA <213> TPM3-NTRK1 fusion site seq <400> 21 attgatgacc tggaagacac taacagcaca tct 33 <210> 22 <211> 33 <212> DNA <213> TPM3-NTRK1 fusion site seq <400> 22 attgatgacc tggaaggccc ggctgtgctg gct 33 <210> 23 <211> 33 <212> DNA <213> TPM3-NTRK1 fusion site seq <400> 23 attgatgacc tggaaggtgt tcaccacatc aag 33 <210> 24 <211> 11 <212> PRT <213> TPM3-NTRK1 fusion site aa seq <400> 24 Ile Asp Asp Leu Glu Asp Thr Asn Ser Thr Ser 1 5 10 <210> 25 <211> 11 <212> PRT <213> TPM3-NTRK1 fusion site aa seq <400> 25 Ile Asp Asp Leu Glu Gly Pro Ala Val Leu Ala 1 5 10 <210> 26 <211> 11 <212> PRT <213> TPM3-NTRK1 fusion site aa seq <400> 26 Ile Asp Asp Leu Glu Gly Val His His Ile Lys 1 5 10 <210> 27 <211> 1995 <212> DNA <213> LMNA CDS <400> 27 atggagaccc cgtcccagcg gcgcgccacc cgcagcgggg cgcaggccag ctccactccg 60 ctgtcgccca cccgcatcac ccggctgcag gagaaggagg acctgcagga gctcaatgat 120 cgcttggcgg tctacatcga ccgtgtgcgc tcgctggaaa cggagaacgc agggctgcgc 180 cttcgcatca ccgagtctga agaggtggtc agccgcgagg tgtccggcat caaggccgcc 240 tacgaggccg agctcgggga tgcccgcaag acccttgact cagtagccaa ggagcgcgcc 300 cgcctgcagc tggagctgag caaagtgcgt gaggagttta aggagctgaa agcgcgcaat 360 accaagaagg agggtgacct gatagctgct caggctcggc tgaaggacct ggaggctctg 420 ctgaactcca aggaggccgc actgagcact gctctcagtg agaagcgcac gctggagggc 480 gagctgcatg atctgcgggg ccaggtggcc aagcttgagg cagccctagg tgaggccaag 540 aagcaacttc aggatgagat gctgcggcgg gtggatgctg agaacaggct gcagaccatg 600 aaggaggaac tggacttcca gaagaacatc tacagtgagg agctgcgtga gaccaagcgc 660 cgtcatgaga cccgactggt ggagattgac aatgggaagc agcgtgagtt tgagagccgg 720 ctggcggatg cgctgcagga actgcgggcc cagcatgagg accaggtgga gcagtataag 780 aaggagctgg agaagactta ttctgccaag ctggacaatg ccaggcagtc tgctgagagg 840 aacagcaacc tggtgggggc tgcccacgag gagctgcagc agtcgcgcat ccgcatcgac 900 agcctctctg cccagctcag ccagctccag aagcagctgg cagccaagga ggcgaagctt 960 cgagacctgg aggactcact ggcccgtgag cgggacacca gccggcggct gctggcggaa 1020 aaggagcggg agatggccga gatgcgggca aggatgcagc agcagctgga cgagtaccag 1080 gagcttctgg acatcaagct ggccctggac atggagatcc acgcctaccg caagctcttg 1140 gagggcgagg aggagaggct acgcctgtcc cccagcccta cctcgcagcg cagccgtggc 1200 cgtgcttcct ctcactcatc ccagacacag ggtgggggca gcgtcaccaa aaagcgcaaa 1260 ctggagtcca ctgagagccg cagcagcttc tcacagcacg cacgcactag cgggcgcgtg 1320 gccgtggagg aggtggatga ggagggcaag tttgtccggc tgcgcaacaa gtccaatgag 1380 gaccagtcca tgggcaattg gcagatcaag cgccagaatg gagatgatcc cttgctgact 1440 taccggttcc caccaaagtt caccctgaag gctgggcagg tggtgacgat ctgggctgca 1500 ggagctgggg ccacccacag cccccctacc gacctggtgt ggaaggcaca gaacacctgg 1560 ggctgcggga acagcctgcg tacggctctc atcaactcca ctggggaaga agtggccatg 1620 cgcaagctgg tgcgctcagt gactgtggtt gaggacgacg aggatgagga tggagatgac 1680 ctgctccatc accaccacgg ctcccactgc agcagctcgg gggaccccgc tgagtacaac 1740 ctgcgctcgc gcaccgtgct gtgcgggacc tgcgggcagc ctgccgacaa ggcatctgcc 1800 agcggctcag gagcccaggt gggcggaccc atctcctctg gctcttctgc ctccagtgtc 1860 acggtcactc gcagctaccg cagtgtgggg ggcagtgggg gtggcagctt cggggacaat 1920 ctggtcaccc gctcctacct cctgggcaac tccagccccc gaacccagag cccccagaac 1980 tgcagcatca tgtaa 1995 <210> 28 <211> 985 <212> DNA <213> LMNA fragment cDNA <400> 28 atggagaccc cgtcccagcg gcgcgccacc cgcagcgggg cgcaggccag ctccactccg 60 ctgtcgccca cccgcatcac ccggctgcag gagaaggagg acctgcagga gctcaatgat 120 cgcttggcgg tctacatcga ccgtgtgcgc tcgctggaaa cggagaacgc agggctgcgc 180 cttcgcatca ccgagtctga agaggtggtc agccgcgagg tgtccggcat caaggccgcc 240 tacgaggccg agctcgggga tgcccgcaag acccttgact cagtagccaa ggagcgcgcc 300 cgcctgcagc tggagctgag caaagtgcgt gaggagttta aggagctgaa agcgcgcaat 360 accaagaagg agggtgacct gatagctgct caggctcggc tgaaggacct ggaggctctg 420 ctgaactcca aggaggccgc actgagcact gctctcagtg agaagcgcac gctggagggc 480 gagctgcatg atctgcgggg ccaggtggcc aagcttgagg cagccctagg tgaggccaag 540 aagcaacttc aggatgagat gctgcggcgg gtggatgctg agaacaggct gcagaccatg 600 aaggaggaac tggacttcca gaagaacatc tacagtgagg agctgcgtga gaccaagcgc 660 cgtcatgaga cccgactggt ggagattgac aatgggaagc agcgtgagtt tgagagccgg 720 ctggcggatg cgctgcagga actgcgggcc cagcatgagg accaggtgga gcagtataag 780 aaggagctgg agaagactta ttctgccaag ctggacaatg ccaggcagtc tgctgagagg 840 aacagcaacc tggtgggggc tgcccacgag gagctgcagc agtcgcgcat ccgcatcgac 900 agcctctctg cccagctcag ccagctccag aagcagctgg cagccaagga ggcgaagctt 960 cgagacctgg aggactcact ggccc 985 <210> 29 <211> 16 <212> DNA <213> LMNA 5' terminal cleavage site seq <400> 29 gaggactcac tggccc 16 <210> 30 <211> 664 <212> PRT <213> LMNA full length <400> 30 Met Glu Thr Pro Ser Gln Arg Arg Ala Thr Arg Ser Gly Ala Gln Ala 1 5 10 15 Ser Ser Thr Pro Leu Ser Pro Thr Arg Ile Thr Arg Leu Gln Glu Lys 20 25 30 Glu Asp Leu Gln Glu Leu Asn Asp Arg Leu Ala Val Tyr Ile Asp Arg 35 40 45 Val Arg Ser Leu Glu Thr Glu Asn Ala Gly Leu Arg Leu Arg Ile Thr 50 55 60 Glu Ser Glu Glu Val Val Ser Arg Glu Val Ser Gly Ile Lys Ala Ala 65 70 75 80 Tyr Glu Ala Glu Leu Gly Asp Ala Arg Lys Thr Leu Asp Ser Val Ala 85 90 95 Lys Glu Arg Ala Arg Leu Gln Leu Glu Leu Ser Lys Val Arg Glu Glu 100 105 110 Phe Lys Glu Leu Lys Ala Arg Asn Thr Lys Lys Glu Gly Asp Leu Ile 115 120 125 Ala Ala Gln Ala Arg Leu Lys Asp Leu Glu Ala Leu Leu Asn Ser Lys 130 135 140 Glu Ala Ala Leu Ser Thr Ala Leu Ser Glu Lys Arg Thr Leu Glu Gly 145 150 155 160 Glu Leu His Asp Leu Arg Gly Gln Val Ala Lys Leu Glu Ala Ala Leu 165 170 175 Gly Glu Ala Lys Lys Gln Leu Gln Asp Glu Met Leu Arg Arg Val Asp 180 185 190 Ala Glu Asn Arg Leu Gln Thr Met Lys Glu Glu Leu Asp Phe Gln Lys 195 200 205 Asn Ile Tyr Ser Glu Glu Leu Arg Glu Thr Lys Arg Arg His Glu Thr 210 215 220 Arg Leu Val Glu Ile Asp Asn Gly Lys Gln Arg Glu Phe Glu Ser Arg 225 230 235 240 Leu Ala Asp Ala Leu Gln Glu Leu Arg Ala Gln His Glu Asp Gln Val 245 250 255 Glu Gln Tyr Lys Lys Glu Leu Glu Lys Thr Tyr Ser Ala Lys Leu Asp 260 265 270 Asn Ala Arg Gln Ser Ala Glu Arg Asn Ser Asn Leu Val Gly Ala Ala 275 280 285 His Glu Glu Leu Gln Gln Ser Arg Ile Arg Ile Asp Ser Leu Ser Ala 290 295 300 Gln Leu Ser Gln Leu Gln Lys Gln Leu Ala Ala Lys Glu Ala Lys Leu 305 310 315 320 Arg Asp Leu Glu Asp Ser Leu Ala Arg Glu Arg Asp Thr Ser Arg Arg 325 330 335 Leu Leu Ala Glu Lys Glu Arg Glu Met Ala Glu Met Arg Ala Arg Met 340 345 350 Gln Gln Gln Leu Asp Glu Tyr Gln Glu Leu Leu Asp Ile Lys Leu Ala 355 360 365 Leu Asp Met Glu Ile His Ala Tyr Arg Lys Leu Leu Glu Gly Glu Glu 370 375 380 Glu Arg Leu Arg Leu Ser Pro Ser Pro Thr Ser Gln Arg Ser Arg Gly 385 390 395 400 Arg Ala Ser Ser His Ser Ser Gln Thr Gln Gly Gly Gly Ser Val Thr 405 410 415 Lys Lys Arg Lys Leu Glu Ser Thr Glu Ser Arg Ser Ser Phe Ser Gln 420 425 430 His Ala Arg Thr Ser Gly Arg Val Ala Val Glu Glu Val Asp Glu Glu 435 440 445 Gly Lys Phe Val Arg Leu Arg Asn Lys Ser Asn Glu Asp Gln Ser Met 450 455 460 Gly Asn Trp Gln Ile Lys Arg Gln Asn Gly Asp Asp Pro Leu Leu Thr 465 470 475 480 Tyr Arg Phe Pro Pro Lys Phe Thr Leu Lys Ala Gly Gln Val Val Thr 485 490 495 Ile Trp Ala Ala Gly Ala Gly Ala Thr His Ser Pro Pro Thr Asp Leu 500 505 510 Val Trp Lys Ala Gln Asn Thr Trp Gly Cys Gly Asn Ser Leu Arg Thr 515 520 525 Ala Leu Ile Asn Ser Thr Gly Glu Glu Val Ala Met Arg Lys Leu Val 530 535 540 Arg Ser Val Thr Val Val Glu Asp Asp Glu Asp Glu Asp Gly Asp Asp 545 550 555 560 Leu Leu His His His His Gly Ser His Cys Ser Ser Ser Gly Asp Pro 565 570 575 Ala Glu Tyr Asn Leu Arg Ser Arg Thr Val Leu Cys Gly Thr Cys Gly 580 585 590 Gln Pro Ala Asp Lys Ala Ser Ala Ser Gly Ser Gly Ala Gln Val Gly 595 600 605 Gly Pro Ile Ser Ser Gly Ser Ser Ala Ser Ser Val Thr Val Thr Arg 610 615 620 Ser Tyr Arg Ser Val Gly Gly Ser Gly Gly Gly Ser Phe Gly Asp Asn 625 630 635 640 Leu Val Thr Arg Ser Tyr Leu Leu Gly Asn Ser Ser Pro Arg Thr Gln 645 650 655 Ser Pro Gln Asn Cys Ser Ile Met 660 <210> 31 <211> 328 <212> PRT <213> LMNA fragment <400> 31 Met Glu Thr Pro Ser Gln Arg Arg Ala Thr Arg Ser Gly Ala Gln Ala 1 5 10 15 Ser Ser Thr Pro Leu Ser Pro Thr Arg Ile Thr Arg Leu Gln Glu Lys 20 25 30 Glu Asp Leu Gln Glu Leu Asn Asp Arg Leu Ala Val Tyr Ile Asp Arg 35 40 45 Val Arg Ser Leu Glu Thr Glu Asn Ala Gly Leu Arg Leu Arg Ile Thr 50 55 60 Glu Ser Glu Glu Val Val Ser Arg Glu Val Ser Gly Ile Lys Ala Ala 65 70 75 80 Tyr Glu Ala Glu Leu Gly Asp Ala Arg Lys Thr Leu Asp Ser Val Ala 85 90 95 Lys Glu Arg Ala Arg Leu Gln Leu Glu Leu Ser Lys Val Arg Glu Glu 100 105 110 Phe Lys Glu Leu Lys Ala Arg Asn Thr Lys Lys Glu Gly Asp Leu Ile 115 120 125 Ala Ala Gln Ala Arg Leu Lys Asp Leu Glu Ala Leu Leu Asn Ser Lys 130 135 140 Glu Ala Ala Leu Ser Thr Ala Leu Ser Glu Lys Arg Thr Leu Glu Gly 145 150 155 160 Glu Leu His Asp Leu Arg Gly Gln Val Ala Lys Leu Glu Ala Ala Leu 165 170 175 Gly Glu Ala Lys Lys Gln Leu Gln Asp Glu Met Leu Arg Arg Val Asp 180 185 190 Ala Glu Asn Arg Leu Gln Thr Met Lys Glu Glu Leu Asp Phe Gln Lys 195 200 205 Asn Ile Tyr Ser Glu Glu Leu Arg Glu Thr Lys Arg Arg His Glu Thr 210 215 220 Arg Leu Val Glu Ile Asp Asn Gly Lys Gln Arg Glu Phe Glu Ser Arg 225 230 235 240 Leu Ala Asp Ala Leu Gln Glu Leu Arg Ala Gln His Glu Asp Gln Val 245 250 255 Glu Gln Tyr Lys Lys Glu Leu Glu Lys Thr Tyr Ser Ala Lys Leu Asp 260 265 270 Asn Ala Arg Gln Ser Ala Glu Arg Asn Ser Asn Leu Val Gly Ala Ala 275 280 285 His Glu Glu Leu Gln Gln Ser Arg Ile Arg Ile Asp Ser Leu Ser Ala 290 295 300 Gln Leu Ser Gln Leu Gln Lys Gln Leu Ala Ala Lys Glu Ala Lys Leu 305 310 315 320 Arg Asp Leu Glu Asp Ser Leu Ala 325 <210> 32 <211> 5 <212> PRT <213> LMNA N terminus cleavage site seq <400> 32 Glu Asp Ser Leu Ala 1 5 <210> 33 <211> 33 <212> DNA <213> LMNA-NTRK1 fusion site seq <400> 33 gaggactcac tggcccgccc ggctgtgctg gct 33 <210> 34 <211> 11 <212> PRT <213> LMNA-NTRK1 fusion site aa seq <400> 34 Glu Asp Ser Leu Ala Gly Pro Ala Val Leu Ala 1 5 10 <210> 35 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> TPM3-NTRK1 Forward Primer Sequence <400> 35 aagaagataa atatgagg 18 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> TPM3-NTRK1 Reverse Primer Sequence <400> 36 ccgtgccgca tatactcaaa 20 <210> 37 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> LMNA-NTRK1 Forward Primer Sequence <400> 37 ccaggtggag cagtataaga ag 22 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> LMNA-NTRK1 Reverse Primer Sequence <400> 38 tgtgggttct cgatgatgtg 20 <110> LG Life Sciences Ltd. <120> Novel NTRK1 fusion gene as colon cancer marker and the uses it <130> KPA140037-EN-P1 <150> KR 10-2014-0004491 <151> 2014-01-14 <160> 38 <170> KopatentIn 2.0 <210> 1 <211> 858 <212> DNA <213> TPM3 cds <400> 1 atgatggagg ccatcaagaa aaagatgcag atgctgaagt tagacaagga gaatgctctg 60 gatcgggcag agcaagctga agctgagcag aagcaggcag aagaaagaag taaacagctg 120 gaggatgagc tggcagccat gcagaagaag ctgaaaggga cagaggatga gctggacaag 180 tattctgaag ctttgaagga tgcccaggag aagctggaac tggcagagaa gaaggctgct 240 gatgctgagg ctgaggtggc ctccttgaac cgtaggatcc agctggttga agaagagctg 300 gaccgtgctc aggagcgcct ggccactgcc ctgcaaaagc tggaagaagc tgaaaaagct 360 gctgatgaga gtgagagagg tatgaaggtt attgaaaacc gggccttaaa agatgaagaa 420 aagatggaac tccaggaaat ccaactcaaa gaagctaagc acattgcaga agaggcagat 480 aggaagtatg aagaggtggc tcgtaagttg gtgatcattg aaggagactt ggaacgcaca 540 gaggaacgag ctgagctggc agagtctaag tgttctgagc tggaggagga gctgaagaat 600 gtcaccaaca acctcaagtc tcttgaggct caggcggaga agtactctca aaaagaagat 660 aaatatgagg aagaaatcaa gattcttact gataaactca aggaggcaga gacccgtgct 720 gagtttgctg agagatcggt agccaagctg gaaaagacaa ttgatgacct ggaagatgag 780 ctctatgccc agaaactgaa gtacaaggcc attagcgagg agctggacca cgccctcaat 840 gacatgacct ctatataa 858 <210> 2 <211> 775 <212> DNA <213> TPM3 fragment cDNA <400> 2 atgatggagg ccatcaagaa aaagatgcag atgctgaagt tagacaagga gaatgctctg 60 gatcgggcag agcaagctga agctgagcag aagcaggcag aagaaagaag taaacagctg 120 gaggatgagc tggcagccat gcagaagaag ctgaaaggga cagaggatga gctggacaag 180 tattctgaag ctttgaagga tgcccaggag aagctggaac tggcagagaa gaaggctgct 240 gatgctgagg ctgaggtggc ctccttgaac cgtaggatcc agctggttga agaagagctg 300 gaccgtgctc aggagcgcct ggccactgcc ctgcaaaagc tggaagaagc tgaaaaagct 360 gctgatgaga gtgagagagg tatgaaggtt attgaaaacc gggccttaaa agatgaagaa 420 aagatggaac tccaggaaat ccaactcaaa gaagctaagc acattgcaga agaggcagat 480 aggaagtatg aagaggtggc tcgtaagttg gtgatcattg aaggagactt ggaacgcaca 540 gaggaacgag ctgagctggc agagtctaag tgttctgagc tggaggagga gctgaagaat 600 gtcaccaaca acctcaagtc tcttgaggct caggcggaga agtactctca aaaagaagat 660 aaatatgagg aagaaatcaa gattcttact gataaactca aggaggcaga gacccgtgct 720 gagtttgctg agagatcggt agccaagctg gaaaagacaa ttgatgacct ggaag 775 <210> 3 <211> 16 <212> DNA <213> TPM3 5'terminal cleavage site seq <400> 3 attgatgacc tggaag 16 <210> 4 <211> 285 <212> PRT <213> TPM3 full length <400> 4 Met Met Glu Ala Ile Lys Lys Lys Met Gln Met Leu Lys Leu Asp Lys 1 5 10 15 Glu Asn Ala Leu Asp Arg Ala Glu Gln Ala Glu Ala Glu Gln Lys Gln 20 25 30 Ala Glu Glu Arg Ser Lys Gln Leu Glu Asp Glu Leu Ala Ala Met Gln 35 40 45 Lys Lys Leu Lys Gly Thr Glu Asp Glu Leu Asp Lys Tyr Ser Glu Ala 50 55 60 Leu Lys Asp Ala Gln Glu Lys Leu Glu Leu Ala Glu Lys Lys Ala Ala 65 70 75 80 Asp Ala Glu Ala Glu Val Ala Ser Leu Asn Arg Arg Ile Gln Leu Val 85 90 95 Glu Glu Glu Leu Asp Arg Ala Gln Glu Arg Leu Ala Thr Ala Leu Gln 100 105 110 Lys Leu Glu Glu Ala Glu Lys Ala Ala Asp Glu Ser Glu Arg Gly Met 115 120 125 Lys Val Ile Glu Asn Arg Ala Leu Lys Asp Glu Glu Lys Met Glu Leu 130 135 140 Gln Glu Ile Gln Leu Lys Glu Ala Lys His Ile Ala Glu Glu Ala Asp 145 150 155 160 Arg Lys Tyr Glu Glu Val Ala Arg Lys Leu Val Ile Ile Glu Gly Asp 165 170 175 Leu Glu Arg Thr Glu Glu Arg Ala Glu Leu Ala Glu Ser Lys Cys Ser 180 185 190 Glu Leu Glu Glu Glu Leu Lys Asn Val Thr Asn Asn Leu Lys Ser Leu 195 200 205 Glu Ala Gln Ala Glu Lys Tyr Ser Gln Lys Glu Asp Lys Tyr Glu Glu 210 215 220 Glu Ile Lys Ile Leu Thr Asp Lys Leu Lys Glu Ala Glu Thr Arg Ala 225 230 235 240 Glu Phe Ala Glu Arg Ser Val Ala Lys Leu Glu Lys Thr Ile Asp Asp 245 250 255 Leu Glu Asp Glu Leu Tyr Ala Gln Lys Leu Lys Tyr Lys Ala Ile Ser 260 265 270 Glu Glu Leu Asp His Ala Leu Asn Asp Met Thr Ser Ile 275 280 285 <210> 5 <211> 258 <212> PRT <213> TPM3 fragment <400> 5 Met Met Glu Ala Ile Lys Lys Lys Met Gln Met Leu Lys Leu Asp Lys 1 5 10 15 Glu Asn Ala Leu Asp Arg Ala Glu Gln Ala Glu Ala Glu Gln Lys Gln 20 25 30 Ala Glu Glu Arg Ser Lys Gln Leu Glu Asp Glu Leu Ala Ala Met Gln 35 40 45 Lys Lys Leu Lys Gly Thr Glu Asp Glu Leu Asp Lys Tyr Ser Glu Ala 50 55 60 Leu Lys Asp Ala Gln Glu Lys Leu Glu Leu Ala Glu Lys Lys Ala Ala 65 70 75 80 Asp Ala Glu Ala Glu Val Ala Ser Leu Asn Arg Arg Ile Gln Leu Val 85 90 95 Glu Glu Glu Leu Asp Arg Ala Gln Glu Arg Leu Ala Thr Ala Leu Gln 100 105 110 Lys Leu Glu Glu Ala Glu Lys Ala Ala Asp Glu Ser Glu Arg Gly Met 115 120 125 Lys Val Ile Glu Asn Arg Ala Leu Lys Asp Glu Glu Lys Met Glu Leu 130 135 140 Gln Glu Ile Gln Leu Lys Glu Ala Lys His Ile Ala Glu Glu Ala Asp 145 150 155 160 Arg Lys Tyr Glu Glu Val Ala Arg Lys Leu Val Ile Ile Glu Gly Asp 165 170 175 Leu Glu Arg Thr Glu Glu Arg Ala Glu Leu Ala Glu Ser Lys Cys Ser 180 185 190 Glu Leu Glu Glu Glu Leu Lys Asn Val Thr Asn Asn Leu Lys Ser Leu 195 200 205 Glu Ala Gln Ala Glu Lys Tyr Ser Gln Lys Glu Asp Lys Tyr Glu Glu 210 215 220 Glu Ile Lys Ile Leu Thr Asp Lys Leu Lys Glu Ala Glu Thr Arg Ala 225 230 235 240 Glu Phe Ala Glu Arg Ser Val Ala Lys Leu Glu Lys Thr Ile Asp Asp 245 250 255 Leu Glu <210> 6 <211> 5 <212> PRT <213> TPM3 N terminus cleavage site seq <400> 6 Ile Asp Asp Leu Glu 1 5 <210> 7 <211> 2391 <212> DNA <213> NTRK1 CDS <400> 7 atgctgcgag gcggacggcg cgggcagctt ggctggcaca gctgggctgc ggggccgggc 60 agcctgctgg cttggctgat actggcatct gcgggcgccg caccctgccc cgatgcctgc 120 tgcccccacg gctcctcggg actgcgatgc acccgggatg gggccctgga tagcctccac 180 cacctgcccg gcgcagagaa cctgactgag ctctacatcg agaaccagca gcatctgcag 240 catctggagc tccgtgatct gaggggcctg ggggagctga gaaacctcac catcgtgaag 300 agtggtctcc gtttcgtggc gccagatgcc ttccatttca ctcctcggct cagtcgcctg 360 aatctctcct tcaacgctct ggagtctctc tcctggaaaa ctgtgcaggg cctctcctta 420 caggaactgg tcctgtcggg gaaccctctg cactgttctt gtgccctgcg ctggctacag 480 cgctgggagg aggagggact gggcggagtg cctgaacaga agctgcagtg tcatgggcaa 540 gggcccctgg cccacatgcc caatgccagc tgtggtgtgc ccacgctgaa ggtccaggtg 600 cccaatgcct cggtggatgt gggggacgac gtgctgctgc ggtgccaggt ggaggggcgg 660 ggcctggagc aggccggctg gatcctcaca gagctggagc agtcagccac ggtgatgaaa 720 tctgggggtc tgccatccct ggggctgacc ctggccaatg tcaccagtga cctcaacagg 780 aagaacgtga cgtgctgggc agagaacgat gtgggccggg cagaggtctc tgttcaggtc 840 aacgtctcct tcccggccag tgtgcagctg cacacggcgg tggagatgca ccactggtgc 900 atccccttct ctgtggatgg gcagccggca ccgtctctgc gctggctctt caatggctcc 960 gtgctcaatg agaccagctt catcttcact gagttcctgg agccggcagc caatgagacc 1020 gtgcggcacg ggtgtctgcg cctcaaccag cccacccacg tcaacaacgg caactacacg 1080 ctgctggctg ccaacccctt cggccaggcc tccgcctcca tcatggctgc cttcatggac 1140 aaccctttcg agttcaaccc cgaggacccc atccctgtct ccttctcgcc ggtggacact 1200 aacagcacat ctggagaccc ggtggagaag aaggacgaaa caccttttgg ggtctcggtg 1260 gctgtgggcc tggccgtctt tgcctgcctc ttcctttcta cgctgctcct tgtgctcaac 1320 aaatgtggac ggagaaacaa gtttgggatc aaccgcccgg ctgtgctggc tccagaggat 1380 gggctggcca tgtccctgca tttcatgaca ttgggtggca gctccctgtc ccccaccgag 1440 ggcaaaggct ctgggctcca aggccacatc atcgagaacc cacaatactt cagtgatgcc 1500 tgtgttcacc acatcaagcg ccgggacatc gtgctcaagt gggagctggg ggagggcgcc 1560 tttgggaagg tcttccttgc tgagtgccac aacctcctgc ctgagcagga caagatgctg 1620 gtggctgtca aggcactgaa ggaggcgtcc gagagtgctc ggcaggactt ccagcgtgag 1680 gctgagctgc tcaccatgct gcagcaccag cacatcgtgc gcttcttcgg cgtctgcacc 1740 gagggccgcc ccctgctcat ggtctttgag tatatgcggc acggggacct caaccgcttc 1800 ctccgatccc atggacctga tgccaagctg ctggctggtg gggaggatgt ggctccaggc 1860 cccctgggtc tggggcagct gctggccgtg gctagccagg tcgctgcggg gatggtgtac 1920 ctggcgggtc tgcattttgt gcaccgggac ctggccacac gcaactgtct agtgggccag 1980 ggactggtgg tcaagattgg tgattttggc atgagcaggg atatctacag caccgactat 2040 taccgtgtgg gaggccgcac catgctgccc attcgctgga tgccgcccga gagcatcctg 2100 taccgtaagt tcaccaccga gagcgacgtg tggagcttcg gcgtggtgct ctgggagatc 2160 ttcacctacg gcaagcagcc ctggtaccag ctctccaaca cggaggcaat cgactgcatc 2220 acgcagggac gtgagttgga gcggccacgt gcctgcccac cagaggtcta cgccatcatg 2280 cggggctgct ggcagcggga gccccagcaa cgccacagca tcaaggatgt gcacgcccgg 2340 ctgcaagccc tggcccaggc acctcctgtc tacctggatg tcctgggcta g 2391 <210> 8 <211> 1196 <212> DNA <213> NTRK1 fragment cDNA <400> 8 acactaacag cacatctgga gacccggtgg agaagaagga cgaaacacct tttggggtct 60 cggtggctgt gggcctggcc gtctttgcct gcctcttcct ttctacgctg ctccttgtgc 120 tcaacaaatg tggacggaga aacaagtttg ggatcaaccg cccggctgtg ctggctccag 180 aggatgggct ggccatgtcc ctgcatttca tgacattggg tggcagctcc ctgtccccca 240 ccgagggcaa aggctctggg ctccaaggcc acatcatcga gaacccacaa tacttcagtg 300 atgcctgtgt tcaccacatc aagcgccggg acatcgtgct caagtgggag ctgggggagg 360 gcgcctttgg gaaggtcttc cttgctgagt gccacaacct cctgcctgag caggacaaga 420 tgctggtggc tgtcaaggca ctgaaggagg cgtccgagag tgctcggcag gacttccagc 480 gtgaggctga gctgctcacc atgctgcagc accagcacat cgtgcgcttc ttcggcgtct 540 gcaccgaggg ccgccccctg ctcatggtct ttgagtatat gcggcagggg gacctcaacc 600 gcttcctccg atcccatgga cctgatgcca agctgctggc tggtggggag gatgtggctc 660 caggccccct gggtctgggg cagctgctgg ccgtggctag ccaggtcgct gcggggatgg 720 tgtacctggc gggtctgcat tttgtgcacc gggacctggc cacacgcaac tgtctagtgg 780 gccagggact ggtggtcaag attggtgatt ttggcatgag cagggatatc tacagcaccg 840 actattaccg tgtgggaggc cgcaccatgc tgcccattcg ctggatgccg cccgagagca 900 tcctgtaccg taagttcacc accgagagcg acgtgtggag cttcggcgtg gtgctctggg 960 agatcttcac ctacggcaag cagccctggt accagctctc caacacggag gcaatcgact 1020 gcatcacgca gggacgtgag ttggagcggc cacgtgcctg cccaccagag gtctacgcca 1080 tcatgcgggg ctgctggcag cgggagcccc agcaacgcca cagcatcaag gatgtgcacg 1140 cccggctgca agccctggcc caggcacctc ctgtctacct ggatgtcctg ggctag 1196 <210> 9 <211> 17 <212> DNA <213> NTRK1 3' terminal cleavage site seq <400> 9 acactaacag cacatct 17 <210> 10 <211> 1037 <212> DNA <213> NTRK1 fragment cDNA <400> 10 gcccggctgt gctggctcca gaggatgggc tggccatgtc cctgcatttc atgacattgg 60 gtggcagctc cctgtccccc accgagggca aaggctctgg gctccaaggc cacatcatcg 120 agaacccaca atacttcagt gatgcctgtg ttcaccacat caagcgccgg gacatcgtgc 180 tcaagtggga gctgggggag ggcgcctttg ggaaggtctt ccttgctgag tgccacaacc 240 tcctgcctga gcaggacaag atgctggtgg ctgtcaaggc actgaaggag gcgtccgaga 300 gtgctcggca ggacttccag cgtgaggctg agctgctcac catgctgcag caccagcaca 360 tcgtgcgctt cttcggcgtc tgcaccgagg gccgccccct gctcatggtc tttgagtata 420 tgcggcacgg ggacctcaac cgcttcctcc gatcccatgg acctgatgcc aagctgctgg 480 ctggtgggga ggatgtggct ccaggccccc tgggtctggg gcagctgctg gccgtggcta 540 gccaggtcgc tgcggggatg gtgtacctgg cgggtctgca ttttgtgcac cgggacctgg 600 ccacacgcaa ctgtctagtg ggccagggac tggtggtcaa gattggtgat tttggcatga 660 gcagggatat ctacagcacc gactattacc gtgtgggagg ccgcaccatg ctgcccattc 720 gctggatgcc gcccgagagc atcctgtacc gtaagttcac caccgagagc gacgtgtgga 780 gcttcggcgt ggtgctctgg gagatcttca cctacggcaa gcagccctgg taccagctct 840 ccaacacgga ggcaatcgac tgcatcacgc agggacgtga gttggagcgg ccacgtgcct 900 gcccaccaga ggtctacgcc atcatgcggg gctgctggca gcgggagccc cagcaacgcc 960 acagcatcaa ggatgtgcac gcccggctgc aagccctggc ccaggcacct cctgtctacc 1020 tggatgtcct gggctag 1037 <210> 11 <211> 17 <212> DNA <213> NTRK1 3' terminal cleavage site seq <400> 11 gcccggctgt gctggct 17 <210> 12 <211> 890 <212> DNA <213> NTRK1 fragment cDNA <400> 12 gtgttcacca catcaagcgc cgggacatcg tgctcaagtg ggagctgggg gagggcgcct 60 ttgggaaggt cttccttgct gagtgccaca acctcctgcc tgagcaggac aagatgctgg 120 tggctgtcaa ggcactgaag gaggcgtccg agagtgctcg gcaggacttc cagcgtgagg 180 ctgagctgct caccatgctg cagcaccagc acatcgtgcg cttcttcggc gtctgcaccg 240 agggccgccc cctgctcatg gtctttgagt atatgcggca cggggacctc aaccgcttcc 300 tccgatccca tggacctgat gccaagctgc tggctggtgg ggaggatgtg gctccaggcc 360 ccctgggtct ggggcagctg ctggccgtgg ctagccaggt cgctgcgggg atggtgtacc 420 tggcgggtct gcattttgtg caccgggacc tggccacacg caactgtcta gtgggccagg 480 gactggtggt caagattggt gattttggca tgagcaggga tatctacagc accgactatt 540 accgtgtggg aggccgcacc atgctgccca ttcgctggat gccgcccgag agcatcctgt 600 accgtaagtt caccaccgag agcgacgtgt ggagcttcgg cgtggtgctc tgggagatct 660 tcacctacgg caagcagccc tggtaccagc tctccaacac ggaggcaatc gactgcatca 720 cgcagggacg tgagttggag cggccacgtg cctgcccacc agaggtctac gccatcatgc 780 ggggctgctg gcagcgggag ccccagcaac gccacagcat caaggatgtg cacgcccggc 840 tgcaagccct ggcccaggca cctcctgtct acctggatgt cctgggctag 890 <210> 13 <211> 17 <212> DNA <213> NTRK1 3' terminal cleavage site seq <400> 13 gtgttcacca catcaag 17 <210> 14 <211> 796 <212> PRT <213> NTRK1 full length <400> 14 Met Leu Arg Gly Gly Arg Arg Gly Gln Leu Gly Trp His Ser Trp Ala 1 5 10 15 Ala Gly Pro Gly Ser Leu Leu Ala Trp Leu Ile Leu Ala Ser Ala Gly 20 25 30 Ala Ala Pro Cys Pro Asp Ala Cys Cys Pro His Gly Ser Ser Gly Leu 35 40 45 Arg Cys Thr Arg Asp Gly Ala Leu Asp Ser Leu His His Leu Pro Gly 50 55 60 Ala Glu Asn Leu Thr Glu Leu Tyr Ile Glu Asn Gln Gln His Leu Gln 65 70 75 80 His Leu Glu Leu Arg Asp Leu Arg Gly Leu Gly Glu Leu Arg Asn Leu 85 90 95 Thr Ile Val Lys Ser Gly Leu Arg Phe Val Ala Pro Asp Ala Phe His 100 105 110 Phe Thr Pro Arg Leu Ser Arg Leu Asn Leu Ser Phe Asn Ala Leu Glu 115 120 125 Ser Leu Ser Trp Lys Thr Val Gln Gly Leu Ser Leu Gln Glu Leu Val 130 135 140 Leu Ser Gly Asn Pro Leu His Cys Ser Cys Ala Leu Arg Trp Leu Gln 145 150 155 160 Arg Trp Glu Glu Glu Gly Leu Gly Gly Val Pro Glu Gln Lys Leu Gln 165 170 175 Cys His Gly Gln Gly Pro Leu Ala His Met Pro Asn Ala Ser Cys Gly 180 185 190 Val Pro Thr Leu Lys Val Gln Val Pro Asn Ala Ser Val Asp Val Gly 195 200 205 Asp Asp Val Leu Leu Arg Cys Gln Val Glu Gly Arg Gly Leu Glu Gln 210 215 220 Ala Gly Trp Ile Leu Thr Glu Leu Glu Gln Ser Ala Thr Val Met Lys 225 230 235 240 Ser Gly Gly Leu Pro Ser Leu Gly Leu Thr Leu Ala Asn Val Thr Ser 245 250 255 Asp Leu Asn Arg Lys Asn Val Thr Cys Trp Ala Glu Asn Asp Val Gly 260 265 270 Arg Ala Glu Val Ser Val Gln Val Asn Val Ser Phe Pro Ala Ser Val 275 280 285 Gln Leu His Thr Ala Val Glu Met His His Trp Cys Ile Pro Phe Ser 290 295 300 Val Asp Gly Gln Pro Ala Pro Ser Leu Arg Trp Leu Phe Asn Gly Ser 305 310 315 320 Val Leu Asn Glu Thr Ser Phe Ile Phe Thr Glu Phe Leu Glu Pro Ala 325 330 335 Ala Asn Glu Thr Val Arg His Gly Cys Leu Arg Leu Asn Gln Pro Thr 340 345 350 His Val Asn Asn Gly Asn Tyr Thr Leu Leu Ala Ala Asn Pro Phe Gly 355 360 365 Gln Ala Ser Ala Ser Ile Met Ala Ala Phe Met Asp Asn Pro Phe Glu 370 375 380 Phe Asn Pro Glu Asp Pro Ile Pro Val Ser Phe Ser Pro Val Asp Thr 385 390 395 400 Asn Ser Thr Ser Gly Asp Pro Val Glu Lys Lys Asp Glu Thr Pro Phe 405 410 415 Gly Val Ser Val Ala Val Gly Leu Ala Val Phe Ala Cys Leu Phe Leu 420 425 430 Ser Thr Leu Leu Leu Val Leu Asn Lys Cys Gly Arg Arg Asn Lys Phe 435 440 445 Gly Ile Asn Arg Pro Ala Val Leu Ala Pro Glu Asp Gly Leu Ala Met 450 455 460 Ser Leu His Phe Met Thr Leu Gly Gly Ser Ser Leu Ser Pro Thr Glu 465 470 475 480 Gly Lys Gly Ser Gly Leu Gln Gly His Ile Ile Glu Asn Pro Gln Tyr 485 490 495 Phe Ser Asp Ala Cys Val His His Ile Lys Arg Arg Asp Ile Val Leu 500 505 510 Lys Trp Glu Leu Gly Glu Gly Ala Phe Gly Lys Val Phe Leu Ala Glu 515 520 525 Cys His Asn Leu Leu Pro Glu Gln Asp Lys Met Leu Val Ala Val Lys 530 535 540 Ala Leu Lys Glu Ala Ser Glu Ser Ala Arg Gln Asp Phe Gln Arg Glu 545 550 555 560 Ala Glu Leu Leu Thr Met Leu Gln His Gln His Ile Val Arg Phe Phe 565 570 575 Gly Val Cys Thr Glu Gly Arg Pro Leu Leu Met Val Phe Glu Tyr Met 580 585 590 Arg His Gly Asp Leu Asn Arg Phe Leu Arg Ser His Gly Pro Asp Ala 595 600 605 Lys Leu Leu Ala Gly Gly Glu Asp Val Ala Pro Gly Pro Leu Gly Leu 610 615 620 Gly Gln Leu Leu Ala Val Ala Ser Gln Val Ala Ala Gly Met Val Tyr 625 630 635 640 Leu Ala Gly Leu His Phe Val His Arg Asp Leu Ala Thr Arg Asn Cys 645 650 655 Leu Val Gly Gln Gly Leu Val Val Lys Ile Gly Asp Phe Gly Met Ser 660 665 670 Arg Asp Ile Tyr Ser Thr Asp Tyr Tyr Arg Val Gly Gly Arg Thr Met 675 680 685 Leu Pro Ile Arg Trp Met Pro Pro Glu Ser Ile Leu Tyr Arg Lys Phe 690 695 700 Thr Thr Glu Ser Asp Val Trp Ser Phe Gly Val Val Leu Trp Glu Ile 705 710 715 720 Phe Thr Tyr Gly Lys Gln Pro Trp Tyr Gln Leu Ser Asn Thr Glu Ala 725 730 735 Ile Asp Cys Ile Thr Gln Gly Arg Glu Leu Glu Arg Pro Arg Ala Cys 740 745 750 Pro Pro Glu Val Tyr Ala Ile Met Arg Gly Cys Trp Gln Arg Glu Pro 755 760 765 Gln Gln Arg His Ser Ile Lys Asp Val His Ala Arg Leu Gln Ala Leu 770 775 780 Ala Gln Ala Pro Pro Val Tyr Leu Asp Val Leu Gly 785 790 795 <210> 15 <211> 397 <212> PRT <213> NTRK1 fragment <400> 15 Thr Asn Ser Thr Ser Gly Asp Pro Val Glu Lys Lys Asp Glu Thr Pro 1 5 10 15 Phe Gly Val Ser Val Ala Val Gly Leu Ala Val Phe Ala Cys Leu Phe 20 25 30 Leu Ser Thr Leu Leu Leu Val Leu Asn Lys Cys Gly Arg Arg Asn Lys 35 40 45 Phe Gly Ile Asn Arg Pro Ala Val Leu Ala Pro Glu Asp Gly Leu Ala 50 55 60 Met Ser Leu His Phe Met Thr Leu Gly Gly Ser Ser Leu Ser Pro Thr 65 70 75 80 Glu Gly Lys Gly Ser Gly Leu Gln Gly His Ile Ile Glu Asn Pro Gln 85 90 95 Tyr Phe Ser Asp Ala Cys Val His His Ile Lys Arg Arg Asp Ile Val 100 105 110 Leu Lys Trp Glu Leu Gly Glu Gly Ala Phe Gly Lys Val Phe Leu Ala 115 120 125 Glu Cys His Asn Leu Leu Pro Glu Gln Asp Lys Met Leu Val Ala Val 130 135 140 Lys Ala Leu Lys Glu Ala Ser Glu Ser Ala Arg Gln Asp Phe Gln Arg 145 150 155 160 Glu Ala Glu Leu Leu Thr Met Leu Gln His Gln His Ile Val Arg Phe 165 170 175 Phe Gly Val Cys Thr Glu Gly Arg Pro Leu Leu Met Val Phe Glu Tyr 180 185 190 Met Arg His Gly Asp Leu Asn Arg Phe Leu Arg Ser His Gly Pro Asp 195 200 205 Ala Lys Leu Leu Ala Gly Gly Glu Asp Val Ala Pro Gly Pro Leu Gly 210 215 220 Leu Gly Gln Leu Leu Ala Val Ala Ser Gln Val Ala Ala Gly Met Val 225 230 235 240 Tyr Leu Ala Gly Leu His Phe Val His Arg Asp Leu Ala Thr Arg Asn 245 250 255 Cys Leu Val Gly Gln Gly Leu Val Val Lys Ile Gly Asp Phe Gly Met 260 265 270 Ser Arg Asp Ile Tyr Ser Thr Asp Tyr Tyr Arg Val Gly Gly Arg Thr 275 280 285 Met Leu Pro Ile Arg Trp Met Pro Pro Glu Ser Ile Leu Tyr Arg Lys 290 295 300 Phe Thr Thr Glu Ser Asp Val Trp Ser Phe Gly Val Val Leu Trp Glu 305 310 315 320 Ile Phe Thr Tyr Gly Lys Gln Pro Trp Tyr Gln Leu Ser Asn Thr Glu 325 330 335 Ala Ile Asp Cys Ile Thr Gln Gly Arg Glu Leu Glu Arg Pro Arg Ala 340 345 350 Cys Pro Pro Glu Val Tyr Ala Ile Met Arg Gly Cys Trp Gln Arg Glu 355 360 365 Pro Gln Gln Arg His Ser Ile Lys Asp Val His Ala Arg Leu Gln Ala 370 375 380 Leu Ala Gln Ala Pro Pro Val Tyr Leu Asp Val Leu Gly 385 390 395 <210> 16 <211> 344 <212> PRT <213> NTRK1 fragment <400> 16 Pro Ala Val Leu Ala Pro Glu Asp Gly Leu Ala Met Ser Leu His Phe 1 5 10 15 Met Thr Leu Gly Gly Ser Ser Leu Ser Pro Thr Glu Gly Lys Gly Ser 20 25 30 Gly Leu Gln Gly His Ile Ile Glu Asn Pro Gln Tyr Phe Ser Asp Ala 35 40 45 Cys Val His His Ile Lys Arg Arg Asp Ile Val Leu Lys Trp Glu Leu 50 55 60 Gly Glu Gly Ala Phe Gly Lys Val Phe Leu Ala Glu Cys His Asn Leu 65 70 75 80 Leu Pro Glu Gln Asp Lys Met Leu Val Ala Val Lys Ala Leu Lys Glu 85 90 95 Ala Ser Glu Ser Ala Arg Gln Asp Phe Gln Arg Glu Ala Glu Leu Leu 100 105 110 Thr Met Leu Gln His Gln His Ile Val Arg Phe Phe Gly Val Cys Thr 115 120 125 Glu Gly Arg Pro Leu Leu Met Val Phe Glu Tyr Met Arg His Gly Asp 130 135 140 Leu Asn Arg Phe Leu Arg Ser His Gly Pro Asp Ala Lys Leu Leu Ala 145 150 155 160 Gly Gly Glu Asp Val Ala Pro Gly Pro Leu Gly Leu Gly Gln Leu Leu 165 170 175 Ala Val Ala Ser Gln Val Ala Ala Gly Met Val Tyr Leu Ala Gly Leu 180 185 190 His Phe Val His Arg Asp Leu Ala Thr Arg Asn Cys Leu Val Gly Gln 195 200 205 Gly Leu Val Val Lys Ile Gly Asp Phe Gly Met Ser Arg Asp Ile Tyr 210 215 220 Ser Thr Asp Tyr Tyr Arg Val Gly Gly Arg Thr Met Leu Pro Ile Arg 225 230 235 240 Trp Met Pro Pro Glu Ser Ile Leu Tyr Arg Lys Phe Thr Thr Glu Ser 245 250 255 Asp Val Trp Ser Phe Gly Val Val Leu Trp Glu Ile Phe Thr Tyr Gly 260 265 270 Lys Gln Pro Trp Tyr Gln Leu Ser Asn Thr Glu Ala Ile Asp Cys Ile 275 280 285 Thr Gln Gly Arg Glu Leu Glu Arg Pro Arg Ala Cys Pro Pro Glu Val 290 295 300 Tyr Ala Ile Met Arg Gly Cys Trp Gln Arg Glu Pro Gln Gln Arg His 305 310 315 320 Ser Ile Lys Asp Val His Ala Arg Leu Gln Ala Leu Ala Gln Ala Pro 325 330 335 Pro Val Tyr Leu Asp Val Leu Gly 340 <210> 17 <211> 5 <212> PRT <213> NTRK1 C terminus cleavage site aa seq <400> 17 Pro Ala Val Leu Ala 1 5 <210> 18 <211> 295 <212> PRT <213> NTRK1 fragment site <400> 18 Val His His Ile Lys Arg Arg Asp Ile Val Leu Lys Trp Glu Leu Gly 1 5 10 15 Glu Gly Ala Phe Gly Lys Val Phe Leu Ala Glu Cys His Asn Leu Leu 20 25 30 Pro Glu Gln Asp Lys Met Leu Val Ala Val Lys Ala Leu Lys Glu Ala 35 40 45 Ser Glu Ser Ala Arg Gln Asp Phe Gln Arg Glu Ala Glu Leu Leu Thr 50 55 60 Met Leu Gln His Gln His Ile Val Arg Phe Phe Gly Val Cys Thr Glu 65 70 75 80 Gly Arg Pro Leu Leu Met Val Phe Glu Tyr Met Arg His Gly Asp Leu 85 90 95 Asn Arg Phe Leu Arg Ser His Gly Pro Asp Ala Lys Leu Leu Ala Gly 100 105 110 Gly Glu Asp Val Ala Pro Gly Pro Leu Gly Leu Gly Gln Leu Leu Ala 115 120 125 Val Ala Ser Gln Val Ala Ala Gly Met Val Tyr Leu Ala Gly Leu His 130 135 140 Phe Val His Arg Asp Leu Ala Thr Arg Asn Cys Leu Val Gly Gln Gly 145 150 155 160 Leu Val Val Lys Ile Gly Asp Phe Gly Met Ser Arg Asp Ile Tyr Ser 165 170 175 Thr Asp Tyr Tyr Arg Val Gly Gly Arg Thr Met Leu Pro Ile Arg Trp 180 185 190 Met Pro Pro Glu Ser Ile Leu Tyr Arg Lys Phe Thr Thr Glu Ser Asp 195 200 205 Val Trp Ser Phe Gly Val Val Leu Trp Glu Ile Phe Thr Tyr Gly Lys 210 215 220 Gln Pro Trp Tyr Gln Leu Ser Asn Thr Glu Ala Ile Asp Cys Ile Thr 225 230 235 240 Gln Gly Arg Glu Leu Glu Arg Pro Arg Ala Cys Pro Pro Glu Val Tyr 245 250 255 Ala Ile Met Arg Gly Cys Trp Gln Arg Glu Pro Gln Gln Arg His Ser 260 265 270 Ile Lys Asp Val His Ala Arg Leu Gln Ala Leu Ala Gln Ala Pro Pro 275 280 285 Val Tyr Leu Asp Val Leu Gly 290 295 <210> 19 <211> 5 <212> PRT <213> NTRK1 C terminus cleavage site seq <400> 19 Val His His Ile Lys 1 5 <210> 20 <211> 5 <212> PRT <213> NTRK1 C terminus cleavage site seq <400> 20 Val His His Ile Lys 1 5 <210> 21 <211> 33 <212> DNA <213> TPM3-NTRK1 fusion site seq <400> 21 attgatgacc tggaagacac taacagcaca tct 33 <210> 22 <211> 33 <212> DNA <213> TPM3-NTRK1 fusion site seq <400> 22 attgatgacc tggaaggccc ggctgtgctg gct 33 <210> 23 <211> 33 <212> DNA <213> TPM3-NTRK1 fusion site seq <400> 23 attgatgacc tggaaggtgt tcaccacatc aag 33 <210> 24 <211> 11 <212> PRT <213> TPM3-NTRK1 fusion site aa seq <400> 24 Ile Asp Asp Leu Glu Asp Thr Asn Ser Thr Ser 1 5 10 <210> 25 <211> 11 <212> PRT <213> TPM3-NTRK1 fusion site aa seq <400> 25 Ile Asp Asp Leu Glu Gly Pro Ala Val Leu Ala 1 5 10 <210> 26 <211> 11 <212> PRT <213> TPM3-NTRK1 fusion site aa seq <400> 26 Ile Asp Asp Leu Glu Gly Val His His Ile Lys 1 5 10 <210> 27 <211> 1995 <212> DNA <213> LMNA CDS <400> 27 atggagaccc cgtcccagcg gcgcgccacc cgcagcgggg cgcaggccag ctccactccg 60 ctgtcgccca cccgcatcac ccggctgcag gagaaggagg acctgcagga gctcaatgat 120 cgcttggcgg tctacatcga ccgtgtgcgc tcgctggaaa cggagaacgc agggctgcgc 180 cttcgcatca ccgagtctga agaggtggtc agccgcgagg tgtccggcat caaggccgcc 240 tacgaggccg agctcgggga tgcccgcaag acccttgact cagtagccaa ggagcgcgcc 300 cgcctgcagc tggagctgag caaagtgcgt gaggagttta aggagctgaa agcgcgcaat 360 accaagaagg agggtgacct gatagctgct caggctcggc tgaaggacct ggaggctctg 420 ctgaactcca aggaggccgc actgagcact gctctcagtg agaagcgcac gctggagggc 480 gagctgcatg atctgcgggg ccaggtggcc aagcttgagg cagccctagg tgaggccaag 540 aagcaacttc aggatgagat gctgcggcgg gtggatgctg agaacaggct gcagaccatg 600 aaggaggaac tggacttcca gaagaacatc tacagtgagg agctgcgtga gaccaagcgc 660 cgtcatgaga cccgactggt ggagattgac aatgggaagc agcgtgagtt tgagagccgg 720 ctggcggatg cgctgcagga actgcgggcc cagcatgagg accaggtgga gcagtataag 780 aaggagctgg agaagactta ttctgccaag ctggacaatg ccaggcagtc tgctgagagg 840 aacagcaacc tggtgggggc tgcccacgag gagctgcagc agtcgcgcat ccgcatcgac 900 agcctctctg cccagctcag ccagctccag aagcagctgg cagccaagga ggcgaagctt 960 cgagacctgg aggactcact ggcccgtgag cgggacacca gccggcggct gctggcggaa 1020 aaggagcggg agatggccga gatgcgggca aggatgcagc agcagctgga cgagtaccag 1080 gagcttctgg acatcaagct ggccctggac atggagatcc acgcctaccg caagctcttg 1140 gagggcgagg aggagaggct acgcctgtcc cccagcccta cctcgcagcg cagccgtggc 1200 cgtgcttcct ctcactcatc ccagacacag ggtgggggca gcgtcaccaa aaagcgcaaa 1260 ctggagtcca ctgagagccg cagcagcttc tcacagcacg cacgcactag cgggcgcgtg 1320 gccgtggagg aggtggatga ggagggcaag tttgtccggc tgcgcaacaa gtccaatgag 1380 gaccagtcca tgggcaattg gcagatcaag cgccagaatg gagatgatcc cttgctgact 1440 taccggttcc caccaaagtt caccctgaag gctgggcagg tggtgacgat ctgggctgca 1500 ggagctgggg ccacccacag cccccctacc gacctggtgt ggaaggcaca gaacacctgg 1560 ggctgcggga acagcctgcg tacggctctc atcaactcca ctggggaaga agtggccatg 1620 cgcaagctgg tgcgctcagt gactgtggtt gaggacgacg aggatgagga tggagatgac 1680 ctgctccatc accaccacgg ctcccactgc agcagctcgg gggaccccgc tgagtacaac 1740 ctgcgctcgc gcaccgtgct gtgcgggacc tgcgggcagc ctgccgacaa ggcatctgcc 1800 agcggctcag gagcccaggt gggcggaccc atctcctctg gctcttctgc ctccagtgtc 1860 acggtcactc gcagctaccg cagtgtgggg ggcagtgggg gtggcagctt cggggacaat 1920 ctggtcaccc gctcctacct cctgggcaac tccagccccc gaacccagag cccccagaac 1980 tgcagcatca tgtaa 1995 <210> 28 <211> 985 <212> DNA <213> LMNA fragment cDNA <400> 28 atggagaccc cgtcccagcg gcgcgccacc cgcagcgggg cgcaggccag ctccactccg 60 ctgtcgccca cccgcatcac ccggctgcag gagaaggagg acctgcagga gctcaatgat 120 cgcttggcgg tctacatcga ccgtgtgcgc tcgctggaaa cggagaacgc agggctgcgc 180 cttcgcatca ccgagtctga agaggtggtc agccgcgagg tgtccggcat caaggccgcc 240 tacgaggccg agctcgggga tgcccgcaag acccttgact cagtagccaa ggagcgcgcc 300 cgcctgcagc tggagctgag caaagtgcgt gaggagttta aggagctgaa agcgcgcaat 360 accaagaagg agggtgacct gatagctgct caggctcggc tgaaggacct ggaggctctg 420 ctgaactcca aggaggccgc actgagcact gctctcagtg agaagcgcac gctggagggc 480 gagctgcatg atctgcgggg ccaggtggcc aagcttgagg cagccctagg tgaggccaag 540 aagcaacttc aggatgagat gctgcggcgg gtggatgctg agaacaggct gcagaccatg 600 aaggaggaac tggacttcca gaagaacatc tacagtgagg agctgcgtga gaccaagcgc 660 cgtcatgaga cccgactggt ggagattgac aatgggaagc agcgtgagtt tgagagccgg 720 ctggcggatg cgctgcagga actgcgggcc cagcatgagg accaggtgga gcagtataag 780 aaggagctgg agaagactta ttctgccaag ctggacaatg ccaggcagtc tgctgagagg 840 aacagcaacc tggtgggggc tgcccacgag gagctgcagc agtcgcgcat ccgcatcgac 900 agcctctctg cccagctcag ccagctccag aagcagctgg cagccaagga ggcgaagctt 960 cgagacctgg aggactcact ggccc 985 <210> 29 <211> 16 <212> DNA <213> LMNA 5' terminal cleavage site seq <400> 29 gaggactcac tggccc 16 <210> 30 <211> 664 <212> PRT <213> LMNA full length <400> 30 Met Glu Thr Pro Ser Gln Arg Arg Ala Thr Arg Ser Gly Ala Gln Ala 1 5 10 15 Ser Ser Thr Pro Leu Ser Pro Thr Arg Ile Thr Arg Leu Gln Glu Lys 20 25 30 Glu Asp Leu Gln Glu Leu Asn Asp Arg Leu Ala Val Tyr Ile Asp Arg 35 40 45 Val Arg Ser Leu Glu Thr Glu Asn Ala Gly Leu Arg Leu Arg Ile Thr 50 55 60 Glu Ser Glu Glu Val Val Ser Arg Glu Val Ser Gly Ile Lys Ala Ala 65 70 75 80 Tyr Glu Ala Glu Leu Gly Asp Ala Arg Lys Thr Leu Asp Ser Val Ala 85 90 95 Lys Glu Arg Ala Arg Leu Gln Leu Glu Leu Ser Lys Val Arg Glu Glu 100 105 110 Phe Lys Glu Leu Lys Ala Arg Asn Thr Lys Lys Glu Gly Asp Leu Ile 115 120 125 Ala Ala Gln Ala Arg Leu Lys Asp Leu Glu Ala Leu Leu Asn Ser Lys 130 135 140 Glu Ala Ala Leu Ser Thr Ala Leu Ser Glu Lys Arg Thr Leu Glu Gly 145 150 155 160 Glu Leu His Asp Leu Arg Gly Gln Val Ala Lys Leu Glu Ala Ala Leu 165 170 175 Gly Glu Ala Lys Lys Gln Leu Gln Asp Glu Met Leu Arg Arg Val Asp 180 185 190 Ala Glu Asn Arg Leu Gln Thr Met Lys Glu Glu Leu Asp Phe Gln Lys 195 200 205 Asn Ile Tyr Ser Glu Glu Leu Arg Glu Thr Lys Arg Arg His Glu Thr 210 215 220 Arg Leu Val Glu Ile Asp Asn Gly Lys Gln Arg Glu Phe Glu Ser Arg 225 230 235 240 Leu Ala Asp Ala Leu Gln Glu Leu Arg Ala Gln His Glu Asp Gln Val 245 250 255 Glu Gln Tyr Lys Lys Glu Leu Glu Lys Thr Tyr Ser Ala Lys Leu Asp 260 265 270 Asn Ala Arg Gln Ser Ala Glu Arg Asn Ser Asn Leu Val Gly Ala Ala 275 280 285 His Glu Glu Leu Gln Gln Ser Arg Ile Arg Ile Asp Ser Leu Ser Ala 290 295 300 Gln Leu Ser Gln Leu Gln Lys Gln Leu Ala Ala Lys Glu Ala Lys Leu 305 310 315 320 Arg Asp Leu Glu Asp Ser Leu Ala Arg Glu Arg Asp Thr Ser Arg Arg 325 330 335 Leu Leu Ala Glu Lys Glu Arg Glu Met Ala Glu Met Arg Ala Arg Met 340 345 350 Gln Gln Gln Leu Asp Glu Tyr Gln Glu Leu Leu Asp Ile Lys Leu Ala 355 360 365 Leu Asp Met Glu Ile His Ala Tyr Arg Lys Leu Leu Glu Gly Glu Glu 370 375 380 Glu Arg Leu Arg Leu Ser Pro Ser Pro Thr Ser Gln Arg Ser Arg Gly 385 390 395 400 Arg Ala Ser Ser His Ser Ser Gln Thr Gln Gly Gly Gly Ser Val Thr 405 410 415 Lys Lys Arg Lys Leu Glu Ser Thr Glu Ser Arg Ser Ser Phe Ser Gln 420 425 430 His Ala Arg Thr Ser Gly Arg Val Ala Val Glu Glu Val Asp Glu Glu 435 440 445 Gly Lys Phe Val Arg Leu Arg Asn Lys Ser Asn Glu Asp Gln Ser Met 450 455 460 Gly Asn Trp Gln Ile Lys Arg Gln Asn Gly Asp Asp Pro Leu Leu Thr 465 470 475 480 Tyr Arg Phe Pro Lys Phe Thr Leu Lys Ala Gly Gln Val Val Thr 485 490 495 Ile Trp Ala Ala Gly Ala Gly Ala Thr His Ser Pro Pro Thr Asp Leu 500 505 510 Val Trp Lys Ala Gln Asn Thr Trp Gly Cys Gly Asn Ser Leu Arg Thr 515 520 525 Ala Leu Ile Asn Ser Thr Gly Glu Glu Val Ala Met Arg Lys Leu Val 530 535 540 Arg Ser Val Thr Val Val Glu Asp Asp Glu Asp Glu Asp Gly Asp Asp 545 550 555 560 Leu Leu His His His His Gly Ser His Cys Ser Ser Ser Gly Asp Pro 565 570 575 Ala Glu Tyr Asn Leu Arg Ser Arg Thr Val Leu Cys Gly Thr Cys Gly 580 585 590 Gln Pro Ala Asp Lys Ala Ser Ala Ser Gly Ser Gly Ala Gln Val Gly 595 600 605 Gly Pro Ile Ser Ser Gly Ser Ser Ala Ser Ser Val Thr Val Thr Arg 610 615 620 Ser Tyr Arg Ser Val Gly Gly Ser Gly Gly Gly Ser Phe Gly Asp Asn 625 630 635 640 Leu Val Thr Arg Ser Tyr Leu Leu Gly Asn Ser Ser Pro Arg Thr Gln 645 650 655 Ser Pro Gln Asn Cys Ser Ile Met 660 <210> 31 <211> 328 <212> PRT <213> LMNA fragment <400> 31 Met Glu Thr Pro Ser Gln Arg Arg Ala Thr Arg Ser Gly Ala Gln Ala 1 5 10 15 Ser Ser Thr Pro Leu Ser Pro Thr Arg Ile Thr Arg Leu Gln Glu Lys 20 25 30 Glu Asp Leu Gln Glu Leu Asn Asp Arg Leu Ala Val Tyr Ile Asp Arg 35 40 45 Val Arg Ser Leu Glu Thr Glu Asn Ala Gly Leu Arg Leu Arg Ile Thr 50 55 60 Glu Ser Glu Glu Val Val Ser Arg Glu Val Ser Gly Ile Lys Ala Ala 65 70 75 80 Tyr Glu Ala Glu Leu Gly Asp Ala Arg Lys Thr Leu Asp Ser Val Ala 85 90 95 Lys Glu Arg Ala Arg Leu Gln Leu Glu Leu Ser Lys Val Arg Glu Glu 100 105 110 Phe Lys Glu Leu Lys Ala Arg Asn Thr Lys Lys Glu Gly Asp Leu Ile 115 120 125 Ala Ala Gln Ala Arg Leu Lys Asp Leu Glu Ala Leu Leu Asn Ser Lys 130 135 140 Glu Ala Ala Leu Ser Thr Ala Leu Ser Glu Lys Arg Thr Leu Glu Gly 145 150 155 160 Glu Leu His Asp Leu Arg Gly Gln Val Ala Lys Leu Glu Ala Ala Leu 165 170 175 Gly Glu Ala Lys Lys Gln Leu Gln Asp Glu Met Leu Arg Arg Val Asp 180 185 190 Ala Glu Asn Arg Leu Gln Thr Met Lys Glu Glu Leu Asp Phe Gln Lys 195 200 205 Asn Ile Tyr Ser Glu Glu Leu Arg Glu Thr Lys Arg Arg His Glu Thr 210 215 220 Arg Leu Val Glu Ile Asp Asn Gly Lys Gln Arg Glu Phe Glu Ser Arg 225 230 235 240 Leu Ala Asp Ala Leu Gln Glu Leu Arg Ala Gln His Glu Asp Gln Val 245 250 255 Glu Gln Tyr Lys Lys Glu Leu Glu Lys Thr Tyr Ser Ala Lys Leu Asp 260 265 270 Asn Ala Arg Gln Ser Ala Glu Arg Asn Ser Asn Leu Val Gly Ala Ala 275 280 285 His Glu Glu Leu Gln Gln Ser Arg Ile Arg Ile Asp Ser Leu Ser Ala 290 295 300 Gln Leu Ser Gln Leu Gln Lys Gln Leu Ala Ala Lys Glu Ala Lys Leu 305 310 315 320 Arg Asp Leu Glu Asp Ser Leu Ala 325 <210> 32 <211> 5 <212> PRT <213> LMNA N terminus cleavage site seq <400> 32 Glu Asp Ser Leu Ala 1 5 <210> 33 <211> 33 <212> DNA <213> LMNA-NTRK1 fusion site seq <400> 33 gaggactcac tggcccgccc ggctgtgctg gct 33 <210> 34 <211> 11 <212> PRT <213> LMNA-NTRK1 fusion site aa seq <400> 34 Glu Asp Ser Leu Ala Gly Pro Ala Val Leu Ala 1 5 10 <210> 35 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> TPM3-NTRK1 Forward Primer Sequence <400> 35 aagaagataa atatgagg 18 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> TPM3-NTRK1 Reverse Primer Sequence <400> 36 ccgtgccgca tatactcaaa 20 <210> 37 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> LMNA-NTRK1 Forward Primer Sequence <400> 37 ccaggtggag cagtataaga ag 22 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> LMNA-NTRK1 Reverse Primer Sequence <400> 38 tgtgggttct cgatgatgtg 20

Claims (42)

N-[LMNA(Lamin A)의 N 말단을 포함하는 단편]-[NTRK1(Neurotrophic Tyrosine Kinase, Receptor, Type 1)의 C 말단을 포함하는 단편]-C, 또는
N-[TPM3(Tropomyosin 3)의 N 말단을 포함하는 단편]-[NTRK1의 C 말단을 포함하는 단편]-C로 이루어진 융합단백질; 상기 융합 단백질을 코딩하는 융합 유전자; 또는 상기 융합유전자의 전사산물을 측정하는 제제를 포함하는 대장암 진단용 조성물로서, 상기 LMNA의 N 말단을 포함하는 단편은 인간 유래 LMNA 단백질에 있어서 N 말단으로부터 1번째 내지 328번째 아미노산을 포함하고, 상기 TPM3의 N 말단을 포함하는 단편은 인간 유래 TPM3 단백질에 있어서 N 말단으로부터 1번째 내지 258번째 아미노산을 포함하는 것인, 대장암 진단용 조성물.
N-[fragment containing the N terminus of LMNA (Lamin A)]-[fragment containing the C terminus of Neurotrophic Tyrosine Kinase (NTRK1, Receptor, Type 1)]-C, or
a fusion protein consisting of N-[fragment containing the N terminus of TPM3 (Tropomyosin 3)]-[fragment containing the C terminus of NTRK1]-C; a fusion gene encoding the fusion protein; Or a composition for diagnosing colorectal cancer comprising an agent for measuring the transcript of the fusion gene, wherein the fragment including the N-terminus of the LMNA comprises amino acids 1 to 328 from the N-terminus in a human-derived LMNA protein, and wherein The fragment including the N-terminus of TPM3 will include the amino acids 1 to 258 from the N-terminus in the human-derived TPM3 protein, a composition for diagnosing colon cancer.
제1항에 있어서, 상기 LMNA, TPM3 또는 NTRK1는 인간 유래인 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 1, wherein the LMNA, TPM3 or NTRK1 is human-derived.
제2항에 있어서, 상기 인간 유래 LMNA은 서열번호 27의 아미노산 서열로 이루어진, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 2, wherein the human-derived LMNA consists of the amino acid sequence of SEQ ID NO: 27.
삭제delete 제1항에 있어서, 상기 LMNA의 N 말단을 포함하는 단편은 서열번호 31의 아미노산 서열로 이루어진 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 1, wherein the fragment including the N-terminus of the LMNA consists of the amino acid sequence of SEQ ID NO: 31.
제2항에 있어서, 상기 인간 유래 TPM3은 서열번호 4의 아미노산 서열로 이루어진, 대장암 진단용 조성물.
According to claim 2, wherein the human-derived TPM3 consists of the amino acid sequence of SEQ ID NO: 4, colon cancer diagnostic composition.
삭제delete 제1항에 있어서, 상기 TPM3의 N 말단을 포함하는 단편은 서열번호 5의 아미노산 서열로 구성되는 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 1, wherein the fragment including the N-terminus of TPM3 is composed of the amino acid sequence of SEQ ID NO: 5.
제2항에 있어서, 상기 인간 유래 NTRK1은 서열번호 7의 아미노산 서열로 이루어진, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 2, wherein the human-derived NTRK1 consists of the amino acid sequence of SEQ ID NO: 7.
제1항에 있어서, 상기 NTRK1의 C 말단을 포함하는 단편은 인간 유래 NTRK1 단백질에 있어서 N 말단으로부터 400번째 내지 796번째 아미노산, 453번째 내지 796번째 아미노산, 또는 502번째 내지 796번째 아미노산을 포함하는 것인, 대장암 진단용 조성물.
The method of claim 1, wherein the fragment including the C-terminus of NTRK1 comprises amino acids 400 to 796, 453 to 796, or 502 to 796, from the N-terminus in human NTRK1 protein. Phosphorus, a composition for diagnosing colon cancer.
제1항에 있어서, 상기 NTRK1의 C 말단을 포함하는 단편은 서열번호 15, 서열번호 17 또는 서열번호 19의 아미노산 서열로 구성되는 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 1, wherein the fragment including the C-terminus of NTRK1 is composed of the amino acid sequence of SEQ ID NO: 15, SEQ ID NO: 17, or SEQ ID NO: 19.
삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 제1항에 있어서, 상기 융합유전자의 전사산물은 mRNA인 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 1, wherein the transcript of the fusion gene is mRNA.
제18항에 있어서, 상기 융합유전자의 mRNA를 측정하는 제제는 상기 융합유전자의 mRNA에 특이적으로 결합하는 프라이머를 포함하는 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 18, wherein the agent for measuring the mRNA of the fusion gene comprises a primer that specifically binds to the mRNA of the fusion gene.
제19항에 있어서, 상기 융합유전자의 mRNA에 특이적으로 결합하는 프라이머는 프라이머에 의해 증폭되는 영역이 융합 대상인 두 유전자의 융합점을 포함하도록, 융합점을 사이에 두도록 설계된 프라이머인 것인, 대장암 진단용 조성물.
The colon according to claim 19, wherein the primer specifically binding to the mRNA of the fusion gene is a primer designed to sandwich the fusion point so that the region amplified by the primer includes the fusion point of two genes to be fused. A composition for diagnosing cancer.
제20항에 있어서, 상기 융합 대상인 두 유전자가 TPM3 유전자 및 NTRK1 유전자인 경우, TPM3 단백질의 N 말단을 암호화하는 염기서열에 특이적인 프라이머와 NTRK1의 C 말단을 암호화하는 염기서열에 특이적인 프라이머를 포함하는 프라이머쌍인 것인, 대장암 진단용 조성물.
The method according to claim 20, wherein when the two genes to be fused are the TPM3 gene and the NTRK1 gene, a primer specific to the nucleotide sequence encoding the N-terminus of the TPM3 protein and a primer specific to the nucleotide sequence encoding the C-terminus of NTRK1 are included. Which is a primer pair, colon cancer diagnostic composition.
제21항에 있어서, 상기 융합유전자의 mRNA에 특이적으로 결합하는 프라이머는 서열번호 35 및 서열번호 36의 염기서열로 구성된 프라이머쌍인 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 21, wherein the primer specifically binding to the mRNA of the fusion gene is a primer pair consisting of the nucleotide sequences of SEQ ID NO: 35 and SEQ ID NO: 36.
제19항에 있어서, 상기 융합 유전자가 LMNA 유전자 및 NTRK1 유전자인 경우, LMNA 단백질의 N 말단을 암호화하는 염기서열에 특이적인 프라이머와 NTRK1의 C 말단을 암호화하는 염기서열에 특이적인 프라이머를 포함하는 프라이머쌍인 것인, 대장암 진단용 조성물.
20. The method of claim 19, wherein when the fusion gene is an LMNA gene and an NTRK1 gene, a primer comprising a primer specific for the nucleotide sequence encoding the N-terminus of the LMNA protein and a primer specific for the nucleotide sequence encoding the C-terminus of NTRK1. A pair, a composition for diagnosing colon cancer.
제23항에 있어서, 상기 융합유전자의 mRNA에 특이적으로 결합하는 프라이머는 서열번호 37 및 서열번호 38의 염기서열로 구성된 프라이머쌍인 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 23, wherein the primer specifically binding to the mRNA of the fusion gene is a primer pair consisting of the nucleotide sequences of SEQ ID NO: 37 and SEQ ID NO: 38.
제1항에 있어서, 상기 융합유전자를 측정하는 제제는 상기 융합유전자에 특이적으로 결합하는 프로브 또는 프라이머를 포함하는 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 1, wherein the agent for measuring the fusion gene comprises a probe or primer that specifically binds to the fusion gene.
제1항에 있어서, 상기 NTRK1 융합단백질을 측정하는 제제는 상기 단백질에 특이적인 항체를 포함하는 것인, 대장암 진단용 조성물.
The composition for diagnosing colon cancer according to claim 1, wherein the agent for measuring the NTRK1 fusion protein comprises an antibody specific for the protein.
제26항에 있어서, 상기 NTRK1 융합단백질에 특이적인 항체는 NTRK1 단백질의 C 말단에 결합하는 것인, 대장암 진단용 조성물.
The composition for diagnosis of colorectal cancer according to claim 26, wherein the antibody specific for the NTRK1 fusion protein binds to the C-terminus of the NTRK1 protein.
제1항의 조성물을 포함하는 대장암 진단용 키트.
A kit for diagnosing colon cancer comprising the composition of claim 1.
제28항에 있어서, RT-PCR 키트, DNA 칩 키트 또는 단백질 칩 키트인 것을 특징으로 하는 대장암 진단용 키트.
The kit for diagnosing colon cancer according to claim 28, which is an RT-PCR kit, a DNA chip kit, or a protein chip kit.
대장암이 의심되는 개체의 분리된 시료로부터 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계; 및 상기 측정된 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준을 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준과 비교하는 단계를 포함하는, 대장암 진단에 필요한 정보를 제공하는 방법으로서, 상기 유전자는 5'-[LMNA 유전자의 5' 말단을 포함하는 단편]-[NTRK1 유전자의 3' 말단을 포함하는 단편]-3', 또는
5'-[TPM3의 5' 말단을 포함하는 단편]-[NTRK1 유전자의 3' 말단을 포함하는 단편]-3' 것인, 방법.
Measuring the level of the NTRK1 fusion gene, its transcript, or its protein from an isolated sample of a subject suspected of colon cancer; And Comprising the step of comparing the measured expression level of the fusion gene, its transcript or its protein expression level with the fusion gene, its transcript, or its protein expression level of a normal control sample, a method of providing information necessary for diagnosing colon cancer , the gene is 5'-[fragment comprising the 5' end of the LMNA gene]-[fragment comprising the 3' end of the NTRK1 gene]-3', or
5'-[fragment comprising the 5' end of TPM3]-[fragment comprising the 3' end of NTRK1 gene]-3'.
제30항에 있어서, 상기 NTRK1 융합유전자는 LMNA 유전자 또는 TPM3 유전자의 5' 말단을 구성하는 폴리뉴클레오티드; 및 NTRK1 유전자의 3' 말단을 구성하는 폴리뉴클레오티드인, 대장암 진단에 필요한 정보를 제공하는 방법.
31. The method of claim 30, wherein the NTRK1 fusion gene comprises: a polynucleotide constituting the 5' end of the LMNA gene or the TPM3 gene; and a polynucleotide constituting the 3' end of the NTRK1 gene, a method for providing information necessary for diagnosing colorectal cancer.
제30항에 있어서, 대장암이 의심되는 개체의 분리된 시료로부터 측정된 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준이 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준보다 높을 경우, 대장암으로 진단하는 것을 특징으로 하는, 대장암 진단에 필요한 정보를 제공하는 방법.
The method of claim 30, wherein the expression level of the fusion gene, its transcript, or protein thereof measured from the isolated sample of a subject suspected of colon cancer is higher than the expression level of the fusion gene, its transcript, or its protein in the normal control sample, A method of providing information necessary for diagnosing colon cancer, characterized in that it is diagnosed as colon cancer.
대장암 환자의 분리된 시료로부터 NTRK1 융합유전자, 이의 전사산물 또는 이의 단백질의 수준을 측정하는 단계; 및 상기 측정된 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준을 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준과 비교하는 단계를 포함하는, 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법으로서, 상기 유전자는 5'-[LMNA 유전자의 5' 말단을 포함하는 단편]-[NTRK1 유전자의 3' 말단을 포함하는 단편]-3', 또는 5'-[TPM3의 5' 말단을 포함하는 단편]-[NTRK1 유전자의 3' 말단을 포함하는 단편]-3' 것인, 방법.
Measuring the level of the NTRK1 fusion gene, its transcript, or its protein from the isolated sample of a colorectal cancer patient; and comparing the measured expression level of the fusion gene, its transcript or its protein with the fusion gene, its transcript, or its protein expression level in a normal control sample, providing information necessary for predicting the prognosis of colorectal cancer treatment As a method, the gene is 5'-[fragment comprising the 5' end of the LMNA gene]-[fragment comprising the 3' end of the NTRK1 gene]-3', or 5'-[the 5' end of TPM3 Fragment comprising]-[fragment comprising the 3' end of NTRK1 gene]-3'.
제33항에 있어서, 대장암 환자의 분리된 시료로부터 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준이 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준보다 높을 경우, 대장암 치료 예후가 같거나 낮을 경우보다 나쁠 것으로 예측하는 것을 특징으로 하는, 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법.
34. The method of claim 33, wherein when the expression level of the fusion gene, its transcript, or its protein from the isolated sample of a colorectal cancer patient is higher than the expression level of the fusion gene, its transcript, or its protein of the normal control sample, the colorectal cancer treatment prognosis is A method of providing information necessary for predicting a colorectal cancer treatment prognosis, characterized in that the prediction is worse than the same or lower case.
제33항에 있어서, 대장암 환자의 분리된 시료로부터 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준이 정상 대조군 시료의 융합유전자, 이의 전사산물 또는 이의 단백질 발현 수준보다 높을 경우, NTRK1 단백질 저해제에 의한 대장암 치료 유효성이 높다고 예측하는 것을 특징으로 하는, 대장암 치료 예후를 예측하는데 필요한 정보를 제공하는 방법.
34. The method of claim 33, wherein when the expression level of the fusion gene, its transcript, or its protein from the sample isolated from a colorectal cancer patient is higher than that of the normal control sample, the NTRK1 protein inhibitor is used. A method of providing information necessary for predicting a colorectal cancer treatment prognosis, characterized in that predicting that the colorectal cancer treatment efficacy is high.
삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete
KR1020140143631A 2014-01-14 2014-10-22 Novel NTRK1 fusion gene as colon cancer marker and the uses thereof KR102267407B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2015/000372 WO2015108328A1 (en) 2014-01-14 2015-01-14 Novel ntrk1 fusion gene as colorectal cancer marker and use thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020140004491 2014-01-14
KR20140004491 2014-01-14

Publications (2)

Publication Number Publication Date
KR20150085459A KR20150085459A (en) 2015-07-23
KR102267407B1 true KR102267407B1 (en) 2021-06-23

Family

ID=53875473

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140143631A KR102267407B1 (en) 2014-01-14 2014-10-22 Novel NTRK1 fusion gene as colon cancer marker and the uses thereof

Country Status (1)

Country Link
KR (1) KR102267407B1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101889594B1 (en) * 2015-10-07 2018-08-21 이화여자대학교 산학협력단 A composition for diagnosing vascular endothelial cell dysfunction and use thereof
PE20181888A1 (en) * 2016-04-04 2018-12-11 Loxo Oncology Inc LIQUID FORMULATIONS OF (S) -N- (5 - ((R) -2- (2,5-DIFLUOROPHENYL) -PYRROLIDIN-1-IL) -PYRAZOLE [1,5-A] PYRIMIDIN-3-IL) -3 -HYDROXYPYRROLIDINE-1-CARBOXAMIDE
KR102110338B1 (en) * 2017-06-02 2020-05-13 부산대학교 산학협력단 Novel FOLR2 Fusion Gene As Colon Cancer Diagnosis Marker and Uses Thereof
KR20230166775A (en) * 2022-05-31 2023-12-07 사회복지법인 삼성생명공익재단 Novel MFSD7-ATP5l fusion gene and uses thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013059740A1 (en) * 2011-10-21 2013-04-25 Foundation Medicine, Inc. Novel alk and ntrk1 fusion molecules and uses thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130106186A (en) * 2012-03-19 2013-09-27 한국과학기술원 Azaindole derivatives, trk inhibitoring composition and pharmaceutical compositions for prevention and treatment of diseases linked to trk comprising the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013059740A1 (en) * 2011-10-21 2013-04-25 Foundation Medicine, Inc. Novel alk and ntrk1 fusion molecules and uses thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Vaishnavi et al, Nature Medicine (2013), vol 19, no 11, pp 1469-1472.

Also Published As

Publication number Publication date
KR20150085459A (en) 2015-07-23

Similar Documents

Publication Publication Date Title
JP6404378B2 (en) Recurrent gene fusion in prostate cancer
US10190173B2 (en) Recurrent gene fusions in prostate cancer
JP2018019720A (en) Recurrent gene fusions in prostate cancer
KR20110111474A (en) Recurrent gene fusions in cancer
PT1994410E (en) Methods for early detection of cancer
KR102267407B1 (en) Novel NTRK1 fusion gene as colon cancer marker and the uses thereof
US9719143B2 (en) MIPOL1-ETV1 gene rearrangements
KR102110338B1 (en) Novel FOLR2 Fusion Gene As Colon Cancer Diagnosis Marker and Uses Thereof
US10590488B2 (en) Recurrent gene fusions in cutaneous CD30-positive lymphoproliferative disorders
KR102084658B1 (en) Metastasis-specific markers for diagnosing prognosis and determining treatment strategies of patient of clear cell renal cell carcinoma
US7888007B2 (en) Cancer associated plexin B1 mutations
KR20190030833A (en) Age-specific markers for diagnosing prognosis and determining treatment strategies of patient of clear cell renal cell carcinoma

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant