KR20170124683A - 담도암 진단용 신규 바이오마커로서의 융합 유전자 및 융합 단백질 - Google Patents
담도암 진단용 신규 바이오마커로서의 융합 유전자 및 융합 단백질 Download PDFInfo
- Publication number
- KR20170124683A KR20170124683A KR1020160054201A KR20160054201A KR20170124683A KR 20170124683 A KR20170124683 A KR 20170124683A KR 1020160054201 A KR1020160054201 A KR 1020160054201A KR 20160054201 A KR20160054201 A KR 20160054201A KR 20170124683 A KR20170124683 A KR 20170124683A
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- leu
- ala
- gly
- lys
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6893—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
- C12Y201/01043—Histone-lysine N-methyltransferase (2.1.1.43)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57484—Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/107—Modifications characterised by incorporating a peptide nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/205—Aptamer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Urology & Nephrology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pathology (AREA)
- Microbiology (AREA)
- Hematology (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Cell Biology (AREA)
- Oncology (AREA)
- Biophysics (AREA)
- Hospice & Palliative Care (AREA)
- General Physics & Mathematics (AREA)
- Food Science & Technology (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 담도암 진단용 신규 바이오마커로서의 융합 유전자 및 이에 의하여 암호화된 융합 단백질에 관한 것이다. 본 발명의 마커는 담도암 조직 또는 담도암 세포로부터 발굴된 마커로서, 본 발명의 마커를 이용하면 담도암을 정확하게 진단할 수 있다.
Description
본 발명은 담도암 진단용 신규 바이오마커로서의 융합 유전자 및 이에 의하여 암호화된 융합 단백질에 관한 것이다.
담관은 간에서 만들어지는 담즙을 십이지장으로 보내는 관으로서, 간 속에서 나뭇가지가 하나의 가지를 향해 모이듯이 서서히 합류하면서 굵어지며, 간에서 나올 때에 좌우의 담관이 대부분 하나로 합류하게 된다. 담관은 간 속을 지나는 간 내 담관과 간을 벗어나 십이지장까지 이어지는 간 외 담관으로 나뉜다. 간 외 담관 중 담즙을 일시적으로 저장하여 농축하는 주머니를 담낭이라 부르며, 이들 간 내외 담관과 담낭을 통틀어 담도라고 부른다.
담도암은 담관암이라고도 하며, 담관의 상피에서 발생하는 악성종양이다. 담도암은 진단 당시 70-80%가 진행암으로, 수술은 30-40%에만 가능하고, 5년 생존율은 7% 내외에 불과한 치료가 어려운 난치암 중의 하나이다. 이와 같이, 담도암은 암의 진행이 상당히 이루어진 뒤에 발견되어 예후가 불량하고 치료가 어려운바, 담도암에 대한 조기 진단법 개발이 절실히 요망되고 있다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 담도암을 조기에 정확하게 분자진단 할 수 있는 신규한 바이오마커를 발굴하고자 예의 연구 노력하였다. 그 결과, 담도암에서 특이적으로 발현되는 융합 유전자를 발굴하고, 이를 담도암의 진단에 활용할 수 있음을 규명함으로써, 본 발명을 완성하게 되었다.
따라서, 본 발명의 목적은 담도암 진단용 키트를 제공하는 데 있다.
본 발명의 다른 목적은 담도암 진단용 마커 검출용 키트를 제공하는 데 있다.
본 발명의 또 다른 목적은 담도암 진단에 필요한 정보를 제공하기 위하여 담도암 진단용 마커를 검출하는 방법을 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 하기의 발명의 상세한 설명, 청구범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 일 양태에 따르면, 본 발명은 하기의 융합 단백질에 특이적으로 결합하는 항체, 올리고펩티드, 리간드, PNA(Peptide nucleic acid) 또는 앱타머(aptamer); 또는 상기 융합 단백질을 암호화하는 융합 유전자에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 담도암 진단용 키트를 제공한다:
(ⅰ) 5' 쪽에 ASH1L(Histone-lysine N-methyltransferase ASH1L) 유전자의 5' 쪽 단편 서열을 가지며, 3' 쪽에는 DOCK7(Dedicator of cytokinesis protein 7) 유전자의 3' 쪽 단편 서열의 5' 쪽 단편 서열을 갖는 ASH1L-DOCK7 융합 유전자에 의하여 암호화된 ASH1L-DOCK7 융합 단백질;
(ⅱ) 5' 쪽에 ASH1L(Histone-lysine N-methyltransferase ASH1L) 유전자의 5' 쪽 단편 서열의 3' 쪽 단편 서열을 가지며, 3' 쪽에는 DOCK7(Dedicator of cytokinesis protein 7) 유전자의 3' 쪽 단편 서열을 갖는 ASH1L-DOCK7 융합 유전자에 의하여 암호화된 ASH1L-DOCK7 융합 단백질;
(ⅲ) 5' 쪽에 3'-말단이 절단된 PUM1(pumilio RNA binding family member 1) 유전자의 단편 서열을 가지며, 3' 쪽에는 TRAF3(TNF receptor associated factor 3) 유전자의 3' 쪽 단편 서열을 갖는 PUM1-TRAF3 융합 유전자에 의하여 암호화된 PUM1-TRAF3 융합 단백질; 또는
(ⅳ) 5' 쪽에 3'-말단이 절단되고, 엑손14가 결실된 PUM1(pumilio RNA binding family member 1) 유전자의 단편 서열을 가지며, 3' 쪽에는 TRAF3(TNF receptor associated factor 3) 유전자의 3' 쪽 단편 서열을 갖는 PUM1-TRAF3 융합 유전자에 의하여 암호화된 PUM1-TRAF3 융합 단백질.
본 발명의 다른 일 양태에 따르면, 본 발명은 담도암 진단용 마커인 상기 (ⅰ) 내지 (ⅳ) 중 어느 하나의 융합 단백질에 특이적으로 결합하는 항체, 올리고펩티드, 리간드, PNA(Peptide nucleic acid) 또는 앱타머; 또는 상기 융합 단백질을 암호화하는 융합 유전자에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 담도암 진단용 마커 검출용 키트를 제공한다.
본 발명자들은 담도암을 조기에 정확하게 분자진단 할 수 있는 신규한 바이오마커를 발굴하고자 예의 연구 노력하였다. 그 결과, 담도암에서 특이적으로 발현되는 융합 유전자를 발굴하고, 이를 담도암의 진단에 활용할 수 있음을 규명하였다.
본 명세서에서 사용된 표현, "담도암 진단용 키트"는 "담도암 진단용 조성물"이 포함된 키트를 의미한다. 따라서, 상기 표현 "담도암 진단용 키트"는 "담도암 진단용 조성물"과 서로 교차 또는 혼용하여 사용이 가능하다.
본 명세서에서 사용된 용어, "진단"은 의 특정 질병 또는 질환에 대한 한 객체의 감수성(susceptibility)을 판정하는 것, 한 객체가 특정 질병 또는 질환을 현재 가지고 있는 지 여부를 판정하는 것, 특정 질병 또는 질환에 걸린 한 객체의 예후(prognosis)(예컨대, 전-전이성 또는 전이성 암 상태의 동정, 암의 단계 결정 또는 치료에 대한 암의 반응성 결정)를 판정하는 것, 또는 테라메트릭스(therametrics)(예컨대, 치료 효능에 대한 정보를 제공하기 위하여 객체의 상태를 모니터링 하는 것)를 포함한다.
본 발명자들은 본 발명의 진단 마커를 사용하면, 담도암의 발병 여부에 대해 민감도 및 신뢰도가 높은 결과를 얻을 수 있음을 확인하였다.
본 명세서에서 사용된 용어, "진단용 마커, 진단하기 위한 마커 또는 진단 마커(diagnosis marker)"란 담도암 세포 또는 조직을 정상 세포 또는 조직과 구분하여 진단할 수 있는 물질로, 정상 세포에서는 발현되지 않으면서 담도암 세포 또는 조직에서 발현되는 유기 생체 분자를 의미한다. 본 발명의 목적상, 상기 담도암 진단 마커는 상기 (ⅰ)(ⅱ) ASH1L-DOCK7 융합 단백질, (ⅲ)(ⅳ) PUM1-TRAF3 융합 단백질, 및 이들을 암호화하는 핵산분자(DNA 또는 mRNA)를 포함한다.
상기 (ⅰ) 내지 (ⅳ)의 융합 단백질 및 상기 융합 단백질을 암호화하는 융합 유전자에 대하여 설명하면 다음과 같다.
본 발명의 일구현예에 따르면, 상기 ASH1L-DOCK7 융합 단백질은 서열목록 제1서열 또는 제2서열의 아미노산 서열을 포함한다.
본 발명의 일구현예에 따르면, 상기 ASH1L-DOCK7 융합 단백질을 암호화하는 융합 유전자는 서열목록 제3서열, 제4서열 또는 제5서열의 뉴클레오티드 서열을 포함한다. 여기서, 상기 서열목록 제3서열은 ASH1L-DOCK7 융합 유전자의 전체(full length) 뉴클레오티드 서열이며, 서열목록 제4서열 또는 제5서열은 각각 서열목록 제3서열 중 융합 단백질로 발현되는 부분의 서열이다. 상기 서열목록 제4서열의 뉴클레오티드 서열은 서열목록 제1서열의 융합 단백질을 암호화하며, 서열목록 제5서열의 뉴클레오티드 서열은 서열목록 제2서열의 융합 단백질을 암호화한다.
본 발명의 일구현예에 따르면, 상기 PUM1-TRAF3 융합 단백질은 서열목록 제6서열 또는 제7서열의 아미노산 서열을 포함한다.
본 발명의 일구현예에 따르면, 상기 서열목록 제6서열의 PUM1-TRAF3 융합 단백질을 암호화하는 융합 유전자는 서열목록 제8서열의 뉴클레오티드 서열을 포함한다.
본 발명의 일구현예에 따르면, 상기 서열목록 제7서열의 PUM1-TRAF3 융합 단백질을 암호화하는 융합 유전자는 서열목록 제9서열의 뉴클레오티드 서열을 포함한다.
상기 서열목록 제8서열은 PUM1-TRAF3 융합 유전자의 전체(full length) 뉴클레오티드 서열이자 융합 단백질로 발현되는 부분의 서열이며, 서열목록 제9서열은 상기 PUM1-TRAF3 융합 유전자의 전체 뉴클레오티드 서열에서 273 nt가 결실된 형태의 뉴클레오티드 서열이자 융합 단백질로 발현되는 부분의 서열이다.
본 발명의 융합 단백질 또는 이를 암호화하는 융합 유전자는 서열목록에 기재된 서열과 실질적인 동일성(substantial identity)을 나타내는 서열도 포함하는 것으로 해석된다. 상기의 실질적인 동일성은, 상기한 본 발명의 서열과 임의의 다른 서열을 최대한 대응되도록 얼라인하고, 당업계에서 통상적으로 이용되는 알고리즘을 이용하여 얼라인된 서열을 분석한 경우에, 최소 61%의 상동성, 보다 바람직하게는 70%의 상동성, 보다 더 바람직하게는 80%의 상동성, 가장 바람직하게는 90%의 상동성을 나타내는 서열을 의미한다. 서열비교를 위한 얼라인먼트 방법은 당업계에 공지되어 있다. 얼라인먼트에 대한 다양한 방법 및 알고리즘은 Smith and Waterman, Adv. Appl. Math. (1981) 2:482; Needleman and Wunsch, J. Mol. Bio. (1970) 48:443; Pearson and Lipman, Methods in Mol. Biol. (1988) 24: 307-31; Higgins and Sharp, Gene (1988) 73:237-44; Higgins and Sharp, CABIOS (1989) 5:151-3; Corpet et al., Nuc. Acids Res. (1988) 16:10881-90; Huang et al., Comp. Appl. BioSci. (1992) 8:155-65 및 Pearson et al., Meth. Mol. Biol. (1994) 24:307-31에 개시되어 있다. NCBI Basic Local Alignment Search Tool(BLAST)(Altschul et al., J. Mol. Biol. (1990) 215:403-10)은 NBCI 등에서 접근 가능하며, 인터넷 상에서 blastp, blasm, blastx, tblastn 및 tblastx와 같은 서열 분석 프로그램과 연동되어 이용할 수 있다. BLSAT는 www.ncbi.nlm.nih.gov/BLAST/에서 접속 가능하다. 이 프로그램을 이용한 서열 상동성 비교 방법은 www.ncbi.nlm.nih.gov/BLAST/blast_help.html에서 확인할 수 있다.
본 발명의 일구현예에 따르면, 본 발명의 키트는 면역분석(immunoassay)용 키트, 즉 면역분석 방식(항원-항체 반응)으로 융합 단백질의 존재 여부와 발현 정도를 확인할 수 있는 키트이이며, 예를 들어, 상기 키트는 루미넥스 분석 키트, 단백질 마이크로어레이 키트 또는 ELISA 키트이다.
하나의 특정예에서, 본 발명의 키트는 융합 단백질의 존재 여부와 발현 정도를 측정하기 위한 융합 단백질에 특이적으로 결합하는 항체를 포함한다.
본 발명에서 항체란, 항원성 부위에 대해서 지시되는 특이적인 단백질 분자를 의미한다. 본 발명의 목적상, 항체는 마커 단백질에 대해 특이적으로 결합하는 항체를 의미하며, 다클론 항체, 단클론 항체 및 재조합 항체를 모두 포함한다. 상기한 바와 같이 새로운 담도암 진단용 마커 단백질이 규명되었으므로, 이를 이용하여 항체를 생성하는 것은 당업계에 널리 공지된 기술을 이용하여 용이하게 제조할 수 있다.
본 발명의 항체는 2개의 전체 길이의 경쇄 및 2개의 전체 길이의 중쇄를 가지는 완전한 형태뿐만 아니라, 항체 분자의 기능적인 단편을 포함한다. 항체 분자의 기능적인 단편이란 적어도 항원 결합 기능을 보유하고 있는 단편을 뜻하며, Fab, F(ab'), F(ab')2 및 Fv 등이 있다.
본 발명의 키트는 통상적인 면역분석 방법을 통하여 담도암을 진단하는 데 이용될 수 있다. 이러한 면역분석은 종래에 개발된 다양한 정량적 또는 정성적 면역분석 프로토콜에 따라 실시될 수 있다.
상기 면역분석 포맷은 방사능면역분석, 방사능면역침전, 면역침전, 면역조직화학염색, ELISA(enzyme-linked immunosorbent assay), 캡처-ELISA, 억제 또는 경재 분석, 샌드위치 분석, 유세포 분석(flow cytometry), 면역형광염색 및 면역친화성 정제를 포함하지만, 이에 한정되는 것은 아니다. 상기 면역분석 또는 면역염색의 방법은 Enzyme Immunoassay, E. T. Maggio, ed., CRC Press, Boca Raton, Florida, 1980; Gaastra, W., Enzymelinked immunosorbent assay (ELISA), in Methods in Molecular Biology, Vol. 1, Walker, J.M. ed., Humana Press, NJ, 1984; 및 Ed Harlow and David Lane, Using Antibodies:A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999에 기재되어 있으며, 상기 문헌은 본 명세서에 참조로서 삽입된다.
예를 들어, 본 발명의 방법이 방사능면역분석 방법에 따라 실시되는 경우, 방사능동위원소(예컨대, C14, I125, P32 및 S35)로 레이블링된 항체가 본 발명의 마커 분자를 검출하는 데 이용될 수 있다.
예를 들어, 본 발명의 방법이 ELISA 방식으로 실시되는 경우, 본 발명의 특정 실시예는 (i) 분석하고자 하는 미지의 세포 시료 분해물 또는 세포 배양물을 고체 기질의 표면에 코팅하는 단계; (ⅱ) 일차항체로서의 마커에 대한 항체와 상기 세포 분해물 또는 세포 배양물을 반응시키는 단계; (ⅲ) 상기 단계 (ⅱ)의 결과물을 효소가 결합된 이차항체와 반응시키는 단계; 및 (ⅳ) 상기 효소의 활성을 측정하는 단계를 포함한다.
상기 이차항체에 결합된 효소는 발색반응, 형광반응, 발광반응 또는 적외선 반응을 촉매하는 효소를 포함하나, 이에 한정되지 않으며, 예를 들어, 알칼린 포스파타아제, β-갈락토시다아제, 호스래디쉬 퍼옥시다아제, 루시퍼라아제 및 사이토크롬 P450을 포함한다. 상기 이차항체에 결합하는 효소로서 알칼린 포스파타아제가 이용되는 경우에는, 기질로서 브로모클로로인돌일 포스페이트(BCIP), 니트로 블루 테트라졸리움(NBT), 나프톨-ASB1-포스페이트(naphthol-AS-B1-phosphate) 및 ECF(enhanced chemifluorescence)와 같은 발색반응 기질이 이용되고, 호스래디쉬 퍼옥시다아제가 이용되는 경우에는 클로로나프톨, 아미노에틸카바졸, 디아미노벤지딘, D-루시페린, 루시게닌(비스-N-메틸아크리디늄 니트레이트), 레소루핀 벤질 에테르, 루미놀, 암플렉스 레드 시약(10-아세틸-3,7-디하이드록시페녹사진), HYR(p-phenylenediamine-HCl and pyrocatechol), TMB(tetramethylbenzidine), ABTS(2,2'-Azine-di[3-ethylbenzthiazoline sulfonate]), o-페닐렌디아민(OPD) 및 나프톨/파이로닌, 글루코스 옥시다아제와 t-NBT(nitroblue tetrazolium) 및 m-PMS(phenzaine methosulfate)과 같은 기질이 이용될 수 있다.
ELISA 방법을 포함한 면역분석 방법에서, 최종적인 효소의 활성 측정 또는 시그널의 측정은 당업계에 공지된 다양한 방법에 따라 실시될 수 있다. 이러한 시그널이 검출은 본 발명의 마커의 정성적 또는 정량적 분석을 가능하게 한다. 만일, 레이블로서 바이오틴이 이용된 경우에는 스트렙타비딘으로, 루시퍼라아제가 이용된 경우에는 루시페린으로 시그널을 용이하게 검출할 수 있다.
다른 한편으로, 본 발명의 키트는 마커 단백질(융합 단백질)에 대한 하나 이상의 항체를 이용한 웨스턴 블랏에 이용될 수 있다. 시료에서 전체 단백질을 분리하고, 이를 전기영동 하여 단백질을 크기에 따라 분리한 다음, 니트로셀루로즈 막으로 이동시켜 항체와 반응시킨다. 생성된 항원-항체 복합체의 양을 표지된 항체를 이용하여 확인하는 방법으로 유전자의 발현에 의해 생성된 단백질의 양을 확인하여 담도암을 진단할 수 있다.
또 다른 한편으로, 본 발명의 키트는 상기 마커 단백질에 대한 하나 이상의 항체를 이용한 면역조직 염색에 이용될 수 있다.
본 발명의 키트에는, 항체 대신에 본 발명의 마커 단백질에 특이적으로 결합하는 앱타머를 포함할 수 있다. 앱타머는 올리고핵산 또는 펩티드 분자이며, 앱타머의 일반적인 내용은 Bock LC et al., Nature 355(6360):5646(1992); Hoppe-Seyler F, Butz K "Peptide aptamers: powerful new tools for molecular medicine". J Mol Med. 78(8):42630(2000); Cohen BA, Colas P, Brent R . "An artificial cell-cycle inhibitor isolated from a combinatorial library". Proc Natl Acad Sci USA. 95(24):142727(1998)에 상세하게 개시되어 있다.
본 발명의 키트는 상기한 성분 이외에도, 다른 성분들을 추가적으로 포함할 수 있다. 예를 들어, 본 발명의 키트가 PCR 증폭 과정에 적용되는 경우에는, 본 발명의 키트는 선택적으로, PCR 증폭에 필요한 시약, 예컨대, 완충액, DNA 중합효소(예컨대, Thermus aquaticus (Taq), Thermus thermophilus (Tth), Thermus filiformis, Thermis flavus, Thermococcus literalis 또는 Pyrococcus furiosus (Pfu)로부터 수득한 열 안정성 DNA 중합효소), DNA 중합효소조인자 및 dNTPs를 포함할 수 있다. 본 발명의 키트는 상기한 시약 성분을 포함하는 다수의 별도 패키징 또는 컴파트먼트로 제작될 수 있다.
본 발명의 일구현예에 따르면, 본 발명의 키트는 마이크로어레이 또는 유전자 증폭 키트이다. 본 발명의 키트가 마이크로어레이인 경우에는, 마이크로어레이의 고상 표면에 프로브가 고정화 되어 있으며, 본 발명의 키트가 유전자 증폭 키트인 경우에는 프라이머를 포함한다.
본 발명의 진단용 키트에 포함된 프로브 또는 프라이머는 상기 융합 단백질을 암호화하는 뉴클레오티드 서열에 대하여 상보적인 서열을 갖는다. 본 명세서에서 사용된 용어, "상보적(complementary)"은 어떤 특정한 혼성화(hybridization) 또는 어닐링 조건 하에서 상술한 뉴클레오티드 서열에 선택적으로 혼성화 할 수 있을 정도의 상보성을 갖는 것을 의미한다. 따라서, 용어 "상보적"은 용어 완전 상보적(perfectly complementary)과는 다른 의미를 가지며, 본 발명의 프라이머 또는 프로브는 상술한 뉴클레오티드 서열에 선택적으로 혼성화 할 수 있을 정도이면, 하나 또는 그 이상의 미스매치(mismatch) 염기서열을 가질 수 있다.
본 명세서에서 사용된 용어, "프라이머"는 적합한 온도에서 적합한 완충액 내에서 적합한 조건(즉, 4종의 다른 뉴클레오사이드 트리포스페이트 및 중합반응 효소) 하에서 주형-지시 DNA 합성의 개시점으로 작용할 수 있는 단일-가닥 올리고뉴클레오티드를 의미한다. 프라이머의 적합한 길이는 다양한 요소, 예컨대, 온도와 프라이머의 용도에 따라 변화가 있지만, 전형적으로 15-30 뉴클레오티드이다. 이러한 프라이머의 디자인은 TAGLN2의 뉴클레오티드 서열을 참조하여 당업자에 의해 용이하게 실시할 수 있으며, 예컨대, 프라이머 디자인용 프로그램(예: PRIMER 3 프로그램)을 이용하여 할 수 있다.
본 명세서에서 사용된 용어, "프로브"는 자연의 또는 변형된 모노머 또는 연쇄(linkages)의 선형 올리고머를 의미하며, 디옥시리보뉴클레오티드 및 리보뉴클레오티드를 포함하고, 타깃 뉴클레오티드 서열에 특이적으로 혼성화 할 수 있으며, 자연적으로 존재하거나 또는 인위적으로 합성된 것이다.
프라이머 또는 프로브 제작 시 참조하여야 하는 본 발명 마커의 뉴클레오티드 서열은 GenBank 혹은 서열목록에서 확인할 수 있으며, 이 서열을 참조하여 프라이머 또는 프로브를 디자인할 수 있다.
본 발명의 마이크로어레이에 있어서, 상기한 프로브는 혼성화 어레이 요소(hybridizable array element)로서 이용되며, 기체(substrate) 상에 고정화된다.
본 발명의 마이크로어레이에 적용되는 시료 DNA 또는 mRNA는 표지(labeling)될 수 있고, 마이크로어레이상의 어레이 요소와 혼성화된다. 혼성화 조건은 다양하게 할 수 있다. 혼성화 정도의 검출 및 분석은 표지 물질에 따라 다양하게 실시될 수 있다.
프로브의 표지는 혼성화 여부를 검출케 하는 시그널을 제공할 수 있으며, 이는 올리고뉴클레오티드에 연결될 수 있다. 적합한 표지는 형광단(예컨대, 플루오리신(fluorescein), 피코에리트린(phycoerythrin), 로다민, 리사민(lissamine), 그리고 Cy3와 Cy5(Pharmacia)), 발색단, 화학발광단, 자기입자, 방사능동위원소(P32 및 S35), 매스 표지, 전자밀집입자, 효소(알칼린 포스파타아제 또는 호스래디쉬 퍼옥시다아제), 조인자, 효소에 대한 기질, 중금속(예컨대, 금) 그리고 항체, 스트렙타비딘, 바이오틴, 디곡시게닌과 킬레이팅기와 같은 특정 결합 파트너를 갖는 햅텐을 포함하나, 이에 한정되는 것은 아니다. 표지는 당업계에서 통상적으로 실시되는 다양한 방법, 예컨대, 닉 트랜스레이션(nick translation) 방법, 무작위 프라이밍 방법(Multiprime DNA labelling systems booklet, "Amersham"(1989)) 및 카이네이션 방법(Maxam & Gilbert, Methods in Enzymology, 65:499(1986))을 통해 실시될 수 있다. 표지는 형광, 방사능, 발색 측정, 중량 측정, X-선 회절 또는 흡수, 자기, 효소적 활성, 매스 분석, 결합 친화도, 혼성화 고주파, 나노크리스탈에 의하여 검출할 수 있는 시그널을 제공한다.
분석 대상이 되는 핵산 시료는 다양한 생시료(biosamples)에서 얻은 mRNA를 이용하여 제조할 수 있다. 상기 생시료는, 예를 들어, 조직, 세포 또는 이의 배양액, 혈액, 혈청 및 혈장이다. 프로브 대신에 분석 대상이 되는 cDNA를 표지하여 혼성화 반응-기초 분석을 실시할 수도 있다.
상기 "유전자 증폭 키트"를 언급하면서 사용한 용어,"증폭"은 핵산분자를 증폭하는 반응을 의미한다. 중합효소 연쇄반응(RT-PCR)(Sambrook 등, Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)), Miller, H. I.(WO 89/06700) 및 Davey, C. 등(EP 329,822)의 방법, 리가아제 연쇄 반응(ligase chain reaction; LCR)(17, 18), Gap-LCR(WO 90/01069), 복구 연쇄 반응(repair chain reaction; EP 439,182), 전사-매개 증폭(transcription-mediated amplification; TMA, WO 88/10315), 자가 유지 염기서열 복제(self sustained sequence replication, WO 90/06995), 타깃 폴리뉴클레오티드 염기서열의 선택적 증폭(selective amplification of target polynucleotide sequences, 미국 특허 제6,410,276호), 컨센서스 서열 프라이밍 중합효소 연쇄 반응(consensus sequence primed polymerase chain reaction(CP-PCR), 미국 특허 제4,437,975호), 임의적 프라이밍 중합효소 연쇄 반응(arbitrarily primed polymerase chain reaction(AP-PCR), 미국 특허 제5,413,909호 및 제5,861,245호), 핵산 염기서열 기반 증폭(nucleic acid sequence based amplification(NASBA), 미국 특허 제5,130,238호, 제5,409,818호, 제5,554,517호, 및 제6,063,603호), 가닥 치환 증폭(strand displacement amplification) 및 고리-중재 항온성 증폭(loop-mediated isothermal amplification; LAMP)와 같은 다양한 증폭 반응들이 당업계에 알려져 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 담도암 진단에 필요한 정보를 제공하기 위하여, 생물학적 시료 내에 있는 상기 (ⅰ) 내지 (ⅳ) 중 어느 하나의 융합 단백질 또는 상기 융합 단백질을 암호화하는 융합 유전자를 검출하는 단계를 통하여 담도암 진단용 마커를 검출하는 방법을 제공한다.
상기 담도암 진단용 마커를 검출하는 방법과 상기 담도암 진단용 키트는 동일한 마커를 사용하기 때문에, 이 둘 사이에 공통된 내용은 본 명세서의 과도한 복잡성을 회피하기 위하여 그 기재를 생략한다.
본 발명의 일구현예에 따르면, 상기 방법은 상술한 항원-항체 반응 방식 또는 유전자 증폭 방식으로 실시된다. 상기 검출 방법들을 통하여 분석대상 생물학적 시료에서의 마커 단백질 또는 이를 암호화하는 핵산분자의 발현 여부 또는 발현수준을 분석할 수 있고, 이를 통하여 담도암을 진단할 수 있다. 이와 같이, 본 발명은 담도암을 분자진단 방법으로 판단한다. 본 발명의 마커는 정상 조직에는 존재하지 않으며, 담도암이 발병한 개체의 생물학적 시료에 특이적으로 존재하는 생체 분자이다.
본 발명의 일구현예에 따르면, 상기 생물학적 시료는 조직, 세포 또는 이의 배양액, 혈액, 혈청 및 혈장으로 구성된 군으로부터 선택된다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(ⅰ) 본 발명은 담도암 진단용 신규 바이오마커로서의 융합 유전자 및 이에 의하여 암호화된 융합 단백질에 관한 것이다.
(ⅱ) 본 발명의 마커는 담도암 조직 또는 담도암 세포로부터 발굴된 마커로서, 본 발명의 마커를 이용하면 담도암을 정확하게 진단할 수 있다.
도 1은 담도암 조직에서의 ASH1L-DOCK7 융합 유전자의 발현을 보여준다. NL: 정상 조직; CA: 암조직.
도 2a는 융합이 확인된 환자 조직 이외의 다른 환자 조직에서의 ASH1L-DOCK7 융합 유전자의 발현을 보여준다.
도 2b는 ASH1L-DOCK7 융합 유전자의 담도암 세포주에서의 발현결과를 보여준다.
도 3은 ASH1L-DOCK7 융합 유전자의 융합 형태에 관한 모식도이다.
도 4는 ASH1L-DOCK7 융합 유전자의 뉴클레오티드 서열 및 이에 의하여 암호화된 융합 단백질의 아미노산 서열을 보여준다. 도 4a-b는 ASH1L-DOCK7 융합 유전자의 전체 뉴클레오티드 서열이며, 도 4c는 이중 단백질로 발현되는 부분의 뉴클레오티드 서열 및 이에 의하여 암호화된 아미노산 서열이고, 도 4d는 도 4c와는 다른 형태의, ASH1L-DOCK7 융합 유전자의 전체 뉴클레오티드 서열에서 단백질로 발현되는 뉴클레오티드 서열 및 이에 의하여 암호화된 아미노산 서열을 보여준다.
도 5는 담도암 조직에서의 PUM1-TRAF3 융합 유전자의 발현을 보여준다. NL: 정상 조직; CA: 암조직.
도 6a는 융합이 확인된 환자 조직 이외의 다른 환자 조직에서의 PUM1-TRAF3 융합 유전자의 발현을 보여준다.
도 6b는 PUM1-TRAF3 융합 유전자의 담도암 세포주에서의 발현결과를 보여준다.
도 6c는 PUM1 유전자 부분이 결실된 형태와 그렇지 않은 형태의 PUM1-TRAF3 융합 유전자가 존재함을 보여준다.
도 7a-b는 PUM1-TRAF3 융합 유전자의 융합 형태에 관한 모식도이다.
도 8a는 PUM1-TRAF3 융합 유전자의 전체 뉴클레오티드 서열, 이중 단백질로 발현되는 부분의 뉴클레오티드 서열 및 이에 의하여 암호화된 아미노산 서열을 보여준다.
도 8b는 237 nt가 결실된 PUM1-TRAF3 융합 유전자의 뉴클레오티드 서열 및 이에 의하여 암호화된 아미노산 서열을 보여준다.
도 2a는 융합이 확인된 환자 조직 이외의 다른 환자 조직에서의 ASH1L-DOCK7 융합 유전자의 발현을 보여준다.
도 2b는 ASH1L-DOCK7 융합 유전자의 담도암 세포주에서의 발현결과를 보여준다.
도 3은 ASH1L-DOCK7 융합 유전자의 융합 형태에 관한 모식도이다.
도 4는 ASH1L-DOCK7 융합 유전자의 뉴클레오티드 서열 및 이에 의하여 암호화된 융합 단백질의 아미노산 서열을 보여준다. 도 4a-b는 ASH1L-DOCK7 융합 유전자의 전체 뉴클레오티드 서열이며, 도 4c는 이중 단백질로 발현되는 부분의 뉴클레오티드 서열 및 이에 의하여 암호화된 아미노산 서열이고, 도 4d는 도 4c와는 다른 형태의, ASH1L-DOCK7 융합 유전자의 전체 뉴클레오티드 서열에서 단백질로 발현되는 뉴클레오티드 서열 및 이에 의하여 암호화된 아미노산 서열을 보여준다.
도 5는 담도암 조직에서의 PUM1-TRAF3 융합 유전자의 발현을 보여준다. NL: 정상 조직; CA: 암조직.
도 6a는 융합이 확인된 환자 조직 이외의 다른 환자 조직에서의 PUM1-TRAF3 융합 유전자의 발현을 보여준다.
도 6b는 PUM1-TRAF3 융합 유전자의 담도암 세포주에서의 발현결과를 보여준다.
도 6c는 PUM1 유전자 부분이 결실된 형태와 그렇지 않은 형태의 PUM1-TRAF3 융합 유전자가 존재함을 보여준다.
도 7a-b는 PUM1-TRAF3 융합 유전자의 융합 형태에 관한 모식도이다.
도 8a는 PUM1-TRAF3 융합 유전자의 전체 뉴클레오티드 서열, 이중 단백질로 발현되는 부분의 뉴클레오티드 서열 및 이에 의하여 암호화된 아미노산 서열을 보여준다.
도 8b는 237 nt가 결실된 PUM1-TRAF3 융합 유전자의 뉴클레오티드 서열 및 이에 의하여 암호화된 아미노산 서열을 보여준다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예
실험방법
담도암 특이적 융합 유전자 분석
5명의 담도암 환자의 정상 담도 조직 및 담도암 조직과, 1명의 담도암 환자의 암조직을 이용하여 RNA 시퀀싱(sequencing)을 진행하였다. 조직에서 RNA를 추출하기 위하여, TRIzol 시약에 분쇄된 조직을 섞어서 클로로포름을 넣어 원심분리(12,000xg, 4℃, 15분)한 후 상층액을 분리하여 동일량의 이소프로판올을 첨가하여 침전시킨 후, 70% 에탄올로 세척하고 건조(air-dry)시킨 다음 Rnase-free water 또는 DEPC water(30 ㎕ 또는 50 ㎕)를 넣어주었다.
RNA 시퀀싱은 다음과 같이 실시하였다. RNA 품질을 Agilent RNA 6000 Nano 키트(Agilent Technologies, CA) 상의 rRNA 밴드 강도를 통하여 평가하였다. cDNA 라이브러리 구축에 앞서 2 ㎍의 전체 RNA와 Oligo (dT)를 갖는 마그네틱 비드를 사용하여 poly (A) mRNA를 증폭하였다. 이후, 정제된 mRNA를 짧은 절편으로 분해시키고, 이중가닥 cDNA를 즉시 합성하였다. cDNA는 말단 교정(end-repair)과 poly (A) 첨가 후, TruSeq RNA sample prep 키트(Illumina, CA)를 사용하여 시퀀싱 어댑터(sequencing adapter)에 연결되었다. BluePippin 2% 아가로스 겔 카세트(Sage Science, MA)에 의하여 자동적으로 정제된 적절한 절편을 PCR 증폭을 위한 주형으로 선택하였다. 최종 라이브러리의 크기와 품질을 Agilent High Sensitivity DNA 키트(Agilent Technologies, CA)로 평가하였고, 절편은 350-450 bp의 크기를 가지고 있었다. 이후, Illumina HiSeq2500 서열분석기(Illumina, CA)를 사용하여 라이브러리의 시퀀싱을 실시하였다.
전사체(Transcriptome) 데이터 분석은 다음과 같이 실시하였다. 낮은 품질의 리드를 다음의 기준에 따라 제거(filtering)하였다: 10% 이상의 건너뛴 염기(skipped bases)를 포함하는 리드('N'으로 표기), 품질 스코어가 20 미만인 염기를 40% 이상 포함하는 리드, 및 각 리드의 평균 품질 스코어가 20미만인 리드. 서열 정렬(sequence alignment)을 위하여, 필터링된 리드를 aligner STAR v.2.3.0e(Dobin et al. 2013)를 사용하여 인간 레퍼런스 게놈(Ensembl release 72, Flicek P. et al., 2013)에 대하여 맵핑하였다. 유전자 발현 평가를 위하여, Ensembl release 72의 유전자 주석 데이터베이스(gene annotation database)를 이용하는 Cufflinks v2.1.1(Trapnell C. et al, 2010)을 사용하여 유전자 발현수준을 측정하였다. 비-코딩 유전자 영역(non-coding gene region)을 제거하였다. 측정의 정확성을 향상시키기 위하여, 멀티-리드-교정(multi-read-correction)과 fragbias-교정 옵션을 적용하였다. 모든 다른 옵션들을 디폴트값에 대하여 세팅하였다.
RNA 시퀀싱 분석결과를 통해 암의 체세포 융합 유전자(somatic fusion gene)를 검출하기 위하여 다음의 방법을 통해 추가 분석을 진행하였다. 종양과 정상 샘플의 RNA-seq fastq 파일을 ChimeraScan, JAFFA 및 FusionCatcher 분석 tool을 사용하여 각 샘플의 융합 유전자를 검출하였다. 체세포성 암 융합 유전자(cancer somatic fusion gene)를 찾기 위하여, 각각의 종양 샘플의 융합 유전자 리스트에서 정상 샘플에서 검출된 융합 유전자를 제거하였다. 기능적으로 의미가 있는 후보 융합 유전자를 찾기 위하여, 코딩 유전자에서 융합이 일어난 융합 리스트를 선별하였다. 이후, 찾은 후보들 중에서 위양성 오류(false positive)를 줄이기 위하여, spanning read (융합되는 부위에 해당하는 리드)가 1개 이상인 융합 유전자를 선별하였다. 알려진 암 융합 유전자가 있는지 확인하기 위하여, 암 융합 데이터베이스(cancer fusion database)인 ChimeraDB2.0 및 cosmic DB를 확인하였다. 이후, Cancer gene census와 인산화효소(kinase)에 융합 유전자가 있는지 확인하였다. 정상에서 발견되었다고 알려진 논문의 리스트에 존재하는 융합 유전자(Greger L et al. 2014. PlosOne)를 제거하였다. 이상과 같은 과정을 통하여 담도암 조직에서 특이적으로 발현되는 융합 유전자를 최종 선별하였다.
선별된 융합 유전자의 발현 여부 검증
선별된 유전자(융합 유전자)의 발현 유무를 확인하기 위하여, 해당 조직의 mRNA를 추출하여 역전사를 통해 cDNA를 합성하고, 접합부위를 포함하도록 프라이머를 제작하여 PCR을 통해 접합부위를 확인하고, 해당 부위를 아가로스 겔을 이용한 전기영동을 통해 해당 크기의 PCR 부위를 절제하여 TA 벡터에 클로닝하여 시퀀싱을 진행하였다.
조직의 RNA는 Qiagen사의 RNeasy 미니 키트를 제조사의 프로토콜에 따라 수행하였고, 나노드롭ND-1000(NanoDrop Technologies, Wilmington, DE)을 이용하여 정량한 후 역전사 반응을 Invitrogen사의 SuperscriptII, RNaseOUT, oligo(dT) 프라이머와 NTPs(Carlsbad, CA)를 이용하여 진행하였다. 합성된 cDNA는 각 유전자의 해당 융합 유전자 프라이머와 적정 온도를 이용하여 PCR을 수행하였고, 이때 Ex Taq HS DNA 폴리머레이즈(TaKaRa, Shiga, Japan)를 이용하여 진행하였다. PCR 반응을 마친 후 아가로스 겔을 이용한 전기영동을 통해 해당 유전자의 발현 유무를 UV 램프를 통하여 확인하고, 해당 PCR 생산물을 절제하여 Qiagen사의 겔 추출 키트를 이용해 추출한 후 Clonetech사의 TA 클로닝 키트를 이용하여 TA 벡터에 넣은 후 해당 벡터에서 제공하는 시퀀싱용 프라이머를 이용하여 서열을 확인하였다. 각 융합 유전자의 개별 유전자 및 융합 부위 확인용 프라이머 서열을 표 1에 나타내었다.
실험결과
접합부위에 해당하는 서열을 확인한 융합 유전자의 경우, 타 환자의 담도암 조직에서의 발현 유무를 확인하였다. 선별된 담도암 특이적 융합 유전자는 담도암 조직 특이적으로 발생한 것으로, 해당 환자의 정상 조직에는 존재하지 않는 유전자로 선별되었다.
구체적인 결과는 다음과 같았다.
1. ASH1L-DOCK7
Gene-front | Gene-back | |
유전자 이름 | ASH1L(Histone-lysine N-methyltransferase ASH1L) | DOCK7(Dedicator of cytokinesis protein 7) |
도 1에 나타난 바와 같이, 환자의 암조직에서 ASH1L-DOCK7 융합 유전자의 발현을 확인하였다(NL: 정상 조직; CA: 암조직). 또한, 도 2a에 나타난 바와 같이, 융합이 확인된 환자 조직 이외의 다른 환자 조직에서도 ASH1L-DOCK7 융합 유전자의 발현이 확인되었다. ASH1L-DOCK7 융합 유전자의 담도암 세포주에서의 발현결과는 도 2b와 같았다.
ASH1L-DOCK7 융합 유전자의 융합 형태에 관한 모식도, 및 이의 뉴클레오티드 서열과 아미노산 서열을 각각 도 3 내지 4a-d에 나타내었다.
2.PUM1-TRAF3
Gene-front | Gene-back | |
유전자 이름 | PUM1(pumilio RNA binding family member 1) | TRAF3(TNF receptor associated factor 3) |
도 5에 나타난 바와 같이, 환자의 암조직에서 PUM1-TRAF3 융합 유전자의 발현을 확인하였다(NL: 정상 조직; CA: 암조직). 또한, 도 6a에 나타난 바와 같이, 융합이 확인된 환자 조직 이외의 다른 환자 조직에서도 PUM1-TRAF3 융합 유전자의 발현이 확인되었다. PUM1-TRAF3 융합 유전자의 담도암 세포주에서의 발현결과는 도 6b와 같았다.
도 6c에 나타난 바와 같이, 담도암 조직에서 PUM1-TRAF3 융합유전자가 PUM1의 길이에 따라 두 가지 형태가 있으며, 짧은 길이의 PUM1-TRAF3 융합 유전자는 PUM1-TRAF3 융합 유전자 중 PUM1의 유전자 중에서 79개의 아미노산이 잘려져 나간 형태로 두 형태 모두 동일 환자에서 확인되었다.
PUM1-TRAF3 융합 유전자의 융합 형태에 관한 모식도, 및 이의 뉴클레오티드 서열과 아미노산 서열을 각각 도 7a-b 및 8a-b에 나타내었다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
<110> INDUSTRY-ACADEMIC COOPERATION FOUNDATION, Yonsei University
<120> Fusion genes and proteins as a novel biomarker for diagnosis of
biliary trat cancer
<130> PN150595
<160> 23
<170> KopatentIn 2.0
<210> 1
<211> 2044
<212> PRT
<213> Artificial Sequence
<220>
<223> ASH1L-DOCK7 fusion protein of Homo sapiens
<400> 1
Met Asp Pro Arg Asn Thr Ala Met Leu Gly Leu Gly Ser Asp Ser Glu
1 5 10 15
Gly Phe Ser Arg Lys Ser Pro Ser Ala Ile Ser Thr Gly Thr Leu Val
20 25 30
Ser Lys Arg Glu Val Glu Leu Glu Lys Asn Thr Lys Glu Glu Glu Asp
35 40 45
Leu Arg Lys Arg Asn Arg Glu Arg Asn Ile Glu Ala Gly Lys Asp Asp
50 55 60
Gly Leu Thr Asp Ala Gln Gln Gln Phe Ser Val Lys Glu Thr Asn Phe
65 70 75 80
Ser Glu Gly Asn Leu Lys Leu Lys Ile Gly Leu Gln Ala Lys Arg Thr
85 90 95
Lys Lys Pro Pro Lys Asn Leu Glu Asn Tyr Val Cys Arg Pro Ala Ile
100 105 110
Lys Thr Thr Ile Lys His Pro Arg Lys Ala Leu Lys Ser Gly Lys Met
115 120 125
Thr Asp Glu Lys Asn Glu His Cys Pro Ser Lys Arg Asp Pro Ser Lys
130 135 140
Leu Tyr Lys Lys Ala Asp Asp Val Ala Ala Ile Glu Cys Gln Ser Glu
145 150 155 160
Glu Val Ile Arg Leu His Ser Gln Gly Glu Asn Asn Pro Leu Ser Lys
165 170 175
Lys Leu Ser Pro Val His Ser Glu Met Ala Asp Tyr Ile Asn Ala Thr
180 185 190
Pro Ser Thr Leu Leu Gly Ser Arg Asp Pro Asp Leu Lys Asp Arg Ala
195 200 205
Leu Leu Asn Gly Gly Thr Ser Val Thr Glu Lys Leu Ala Gln Leu Ile
210 215 220
Ala Thr Cys Pro Pro Ser Lys Ser Ser Lys Thr Lys Pro Lys Lys Leu
225 230 235 240
Gly Thr Gly Thr Thr Ala Gly Leu Val Ser Lys Asp Leu Ile Arg Lys
245 250 255
Ala Gly Val Gly Ser Val Ala Gly Ile Ile His Lys Asp Leu Ile Lys
260 265 270
Lys Pro Thr Ile Ser Thr Ala Val Gly Leu Val Thr Lys Asp Pro Gly
275 280 285
Lys Lys Pro Val Phe Asn Ala Ala Val Gly Leu Val Asn Lys Asp Ser
290 295 300
Val Lys Lys Leu Gly Thr Gly Thr Thr Ala Val Phe Ile Asn Lys Asn
305 310 315 320
Leu Gly Lys Lys Pro Gly Thr Ile Thr Thr Val Gly Leu Leu Ser Lys
325 330 335
Asp Ser Gly Lys Lys Leu Gly Ile Gly Ile Val Pro Gly Leu Val His
340 345 350
Lys Glu Ser Gly Lys Lys Leu Gly Leu Gly Thr Val Val Gly Leu Val
355 360 365
Asn Lys Asp Leu Gly Lys Lys Leu Gly Ser Thr Val Gly Leu Val Ala
370 375 380
Lys Asp Cys Ala Lys Lys Ile Val Ala Ser Ser Ala Met Gly Leu Val
385 390 395 400
Asn Lys Asp Ile Gly Lys Lys Leu Met Ser Cys Pro Leu Ala Gly Leu
405 410 415
Ile Ser Lys Asp Ala Ile Asn Leu Lys Ala Glu Ala Leu Leu Pro Thr
420 425 430
Gln Glu Pro Leu Lys Ala Ser Cys Ser Thr Asn Ile Asn Asn Gln Glu
435 440 445
Ser Gln Glu Leu Ser Glu Ser Leu Lys Asp Ser Ala Thr Ser Lys Thr
450 455 460
Phe Glu Lys Asn Val Val Arg Gln Asn Lys Glu Ser Ile Leu Glu Lys
465 470 475 480
Phe Ser Val Arg Lys Glu Ile Ile Asn Leu Glu Lys Glu Met Phe Asn
485 490 495
Glu Gly Thr Cys Ile Gln Gln Asp Ser Phe Ser Ser Ser Glu Lys Gly
500 505 510
Ser Tyr Glu Thr Ser Lys His Glu Lys Gln Pro Pro Val Tyr Cys Thr
515 520 525
Ser Pro Asp Phe Lys Met Gly Gly Ala Ser Asp Val Ser Thr Ala Lys
530 535 540
Ser Pro Phe Ser Ala Val Gly Glu Ser Asn Leu Pro Ser Pro Ser Pro
545 550 555 560
Thr Val Ser Val Asn Pro Leu Thr Arg Ser Pro Pro Glu Thr Ser Ser
565 570 575
Gln Leu Ala Pro Asn Pro Leu Leu Leu Ser Ser Thr Thr Glu Leu Ile
580 585 590
Glu Glu Ile Ser Glu Ser Val Gly Lys Asn Gln Phe Thr Ser Glu Ser
595 600 605
Thr His Leu Asn Val Gly His Arg Ser Val Gly His Ser Ile Ser Ile
610 615 620
Glu Cys Lys Gly Ile Asp Lys Glu Val Asn Asp Ser Lys Thr Thr His
625 630 635 640
Ile Asp Ile Pro Arg Ile Ser Ser Ser Leu Gly Lys Lys Pro Ser Leu
645 650 655
Thr Ser Glu Ser Ser Ile His Thr Ile Thr Pro Ser Val Val Asn Phe
660 665 670
Thr Ser Leu Phe Ser Asn Lys Pro Phe Leu Lys Leu Gly Ala Val Ser
675 680 685
Ala Ser Asp Lys His Cys Gln Val Ala Glu Ser Leu Ser Thr Ser Leu
690 695 700
Gln Ser Lys Pro Leu Lys Lys Arg Lys Gly Arg Lys Pro Arg Trp Thr
705 710 715 720
Lys Val Val Ala Arg Ser Thr Cys Arg Ser Pro Lys Gly Leu Glu Leu
725 730 735
Glu Arg Ser Glu Leu Phe Lys Asn Val Ser Cys Ser Ser Leu Ser Asn
740 745 750
Ser Asn Ser Glu Pro Ala Lys Phe Met Lys Asn Ile Gly Pro Pro Ser
755 760 765
Phe Val Asp His Asp Phe Leu Lys Arg Arg Leu Pro Lys Leu Ser Lys
770 775 780
Ser Thr Ala Pro Ser Leu Ala Leu Leu Ala Asp Ser Glu Lys Pro Ser
785 790 795 800
His Lys Ser Phe Ala Thr His Lys Leu Ser Ser Ser Met Cys Val Ser
805 810 815
Ser Asp Leu Leu Ser Asp Ile Tyr Lys Pro Lys Arg Gly Arg Pro Lys
820 825 830
Ser Lys Glu Met Pro Gln Leu Glu Gly Pro Pro Lys Arg Thr Leu Lys
835 840 845
Ile Pro Ala Ser Lys Val Phe Ser Leu Gln Ser Lys Glu Glu Gln Glu
850 855 860
Pro Pro Ile Leu Gln Pro Glu Ile Glu Ile Pro Ser Phe Lys Gln Gly
865 870 875 880
Leu Ser Val Ser Pro Phe Pro Lys Lys Arg Gly Arg Pro Lys Arg Gln
885 890 895
Met Arg Ser Pro Val Lys Met Lys Pro Pro Val Leu Ser Val Ala Pro
900 905 910
Phe Val Ala Thr Glu Ser Pro Ser Lys Leu Glu Ser Glu Ser Asp Asn
915 920 925
His Arg Ser Ser Ser Asp Phe Phe Glu Ser Glu Asp Gln Leu Gln Asp
930 935 940
Pro Asp Asp Leu Asp Asp Ser His Arg Pro Ser Val Cys Ser Met Ser
945 950 955 960
Asp Leu Glu Met Glu Pro Asp Lys Lys Ile Thr Lys Arg Asn Asn Gly
965 970 975
Gln Leu Met Lys Thr Ile Ile Arg Lys Ile Asn Lys Met Lys Thr Leu
980 985 990
Lys Arg Lys Lys Leu Leu Asn Gln Ile Leu Ser Ser Ser Val Glu Ser
995 1000 1005
Ser Asn Lys Gly Lys Val Gln Ser Lys Leu His Asn Thr Val Ser Ser
1010 1015 1020
Leu Ala Ala Thr Phe Gly Ser Lys Leu Gly Gln Gln Ile Asn Val Ser
1025 1030 1035 1040
Lys Lys Gly Thr Ile Tyr Ile Gly Lys Arg Arg Gly Arg Lys Pro Lys
1045 1050 1055
Thr Val Leu Asn Gly Ile Leu Ser Gly Ser Pro Thr Ser Leu Ala Val
1060 1065 1070
Leu Glu Gln Thr Ala Gln Gln Ala Ala Gly Ser Ala Leu Gly Gln Ile
1075 1080 1085
Leu Pro Pro Leu Leu Pro Ser Ser Ala Ser Ser Ser Glu Ile Leu Pro
1090 1095 1100
Ser Pro Ile Cys Ser Gln Ser Ser Gly Thr Ser Gly Gly Gln Ser Pro
1105 1110 1115 1120
Val Ser Ser Asp Ala Gly Phe Val Glu Pro Ser Ser Val Pro Tyr Leu
1125 1130 1135
His Leu His Ser Arg Gln Gly Ser Met Ile Gln Thr Leu Ala Met Lys
1140 1145 1150
Lys Ala Ser Lys Gly Arg Arg Arg Leu Ser Pro Pro Thr Leu Leu Pro
1155 1160 1165
Asn Ser Pro Ser His Leu Ser Glu Leu Thr Ser Leu Lys Glu Ala Thr
1170 1175 1180
Pro Ser Pro Ile Ser Glu Ser His Ser Asp Glu Thr Ile Pro Ser Asp
1185 1190 1195 1200
Ser Gly Ile Gly Thr Asp Asn Asn Ser Thr Ser Asp Arg Ala Glu Lys
1205 1210 1215
Phe Cys Gly Gln Lys Lys Arg Arg His Ser Phe Glu His Val Ser Leu
1220 1225 1230
Ile Pro Pro Glu Thr Ser Thr Val Leu Ser Ser Leu Lys Glu Lys His
1235 1240 1245
Lys His Lys Cys Lys Arg Arg Asn His Asp Tyr Leu Ser Tyr Asp Lys
1250 1255 1260
Met Lys Arg Gln Lys Arg Lys Arg Lys Lys Lys Tyr Pro Gln Leu Arg
1265 1270 1275 1280
Asn Arg Gln Asp Pro Asp Phe Ile Ala Glu Leu Glu Glu Leu Ile Ser
1285 1290 1295
Arg Leu Ser Glu Ile Arg Ile Thr His Arg Ser His His Phe Ile Pro
1300 1305 1310
Arg Asp Leu Leu Pro Thr Ile Phe Arg Ile Asn Phe Asn Ser Phe Tyr
1315 1320 1325
Thr His Pro Ser Phe Pro Leu Asp Pro Leu His Tyr Ile Arg Lys Pro
1330 1335 1340
Asp Leu Lys Lys Lys Arg Gly Arg Pro Pro Lys Met Arg Glu Ala Met
1345 1350 1355 1360
Ala Glu Met Pro Phe Met His Ser Leu Ser Phe Pro Leu Ser Ser Thr
1365 1370 1375
Gly Phe Tyr Pro Ser Tyr Gly Met Pro Tyr Ser Pro Ser Pro Leu Thr
1380 1385 1390
Ala Ala Pro Ile Gly Leu Gly Tyr Tyr Gly Arg Tyr Pro Pro Thr Leu
1395 1400 1405
Tyr Pro Pro Pro Pro Ser Pro Ser Phe Thr Thr Pro Leu Pro Pro Pro
1410 1415 1420
Ser Tyr Met His Ala Gly His Leu Leu Leu Asn Pro Ala Lys Tyr His
1425 1430 1435 1440
Lys Lys Lys His Lys Leu Leu Arg Gln Glu Ala Phe Leu Thr Thr Ser
1445 1450 1455
Arg Thr Pro Leu Leu Ser Met Ser Thr Tyr Pro Ser Val Pro Pro Glu
1460 1465 1470
Met Ala Tyr Gly Trp Met Val Glu His Lys His Arg His Arg His Lys
1475 1480 1485
His Arg Glu His Arg Ser Ser Glu Gln Pro Gln Val Ser Met Asp Thr
1490 1495 1500
Gly Ser Ser Arg Ser Val Leu Glu Ser Leu Lys Arg Tyr Arg Phe Gly
1505 1510 1515 1520
Lys Asp Ala Val Gly Glu Arg Tyr Lys His Lys Glu Lys His Arg Cys
1525 1530 1535
His Met Ser Cys Pro His Leu Ser Pro Ser Lys Ser Leu Ile Asn Arg
1540 1545 1550
Glu Glu Gln Trp Val His Arg Glu Pro Ser Glu Ser Ser Pro Leu Ala
1555 1560 1565
Leu Gly Leu Gln Thr Pro Leu Gln Ile Asp Cys Ser Glu Ser Ser Pro
1570 1575 1580
Ser Leu Ser Leu Gly Gly Phe Thr Pro Asn Ser Glu Pro Ala Ser Ser
1585 1590 1595 1600
Asp Glu His Thr Asn Leu Phe Thr Ser Ala Ile Gly Ser Cys Arg Val
1605 1610 1615
Ser Asn Pro Asn Ser Ser Gly Arg Lys Lys Leu Thr Asp Ser Pro Gly
1620 1625 1630
Leu Phe Ser Ala Gln Asp Thr Ser Leu Asn Arg Leu His Arg Lys Glu
1635 1640 1645
Ser Leu Pro Ser Asn Glu Arg Ala Val Gln Thr Leu Ala Gly Ser Gln
1650 1655 1660
Pro Thr Ser Asp Lys Pro Ser Gln Arg Pro Ser Glu Ser Thr Asn Cys
1665 1670 1675 1680
Ser Pro Thr Arg Lys Arg Ser Ser Ser Glu Ser Thr Ser Ser Thr Val
1685 1690 1695
Asn Gly Val Pro Ser Arg Ser Pro Arg Leu Val Ala Ser Gly Asp Asp
1700 1705 1710
Ser Val Asp Ser Leu Leu Gln Arg Met Val Gln Asn Glu Asp Gln Glu
1715 1720 1725
Pro Met Glu Lys Ser Ile Asp Ala Val Ile Ala Thr Ala Ser Ala Pro
1730 1735 1740
Pro Ser Ser Ser Pro Gly Arg Ser His Ser Lys Asp Arg Thr Leu Gly
1745 1750 1755 1760
Lys Pro Asp Ser Leu Leu Val Pro Ala Val Thr Ser Asp Ser Cys Asn
1765 1770 1775
Asn Ser Ile Ser Leu Leu Ser Glu Lys Leu Thr Ser Ser Cys Ser Pro
1780 1785 1790
His His Ile Lys Arg Ser Val Val Glu Ala Met Gln Arg Gln Ala Arg
1795 1800 1805
Lys Met Cys Asn Tyr Asp Lys Ile Leu Ala Thr Lys Lys Asn Leu Asp
1810 1815 1820
His Val Asn Lys Ile Leu Lys Ala Lys Lys Leu Gln Arg Gln Ala Arg
1825 1830 1835 1840
Thr Gly Asn Asn Phe Val Lys Arg Arg Pro Gly Arg Pro Arg Lys Cys
1845 1850 1855
Pro Leu Gln Ala Val Val Ser Met Gln Ala Phe Gln Ala Ala Gln Phe
1860 1865 1870
Val Asn Pro Glu Leu Asn Arg Asp Glu Glu Gly Ala Ala Leu His Leu
1875 1880 1885
Ser Pro Asp Thr Val Thr Asp Val Ile Glu Ala Val Val Gln Ser Val
1890 1895 1900
Asn Leu Asn Pro Glu His Lys Lys Gly Leu Lys Arg Lys Gly Trp Leu
1905 1910 1915 1920
Leu Glu Glu Gln Thr Arg Lys Lys Gln Lys Pro Leu Pro Glu Glu Glu
1925 1930 1935
Glu Gln Glu Asn Asn Lys Ser Phe Asn Glu Ala Pro Val Glu Ile Pro
1940 1945 1950
Ser Pro Ser Glu Thr Pro Ala Lys Pro Ser Glu Pro Glu Ser Thr Leu
1955 1960 1965
Gln Pro Val Leu Ser Leu Ile Pro Arg Glu Lys Lys Pro Pro Arg Pro
1970 1975 1980
Pro Lys Lys Lys Tyr Gln Lys Ala Gly Leu Tyr Ser Asp Val Tyr Lys
1985 1990 1995 2000
Thr Thr Asp Pro Lys Ser Arg Leu Ile Gln Leu Lys Lys Glu Lys Leu
2005 2010 2015
Glu Tyr Thr Pro Gly Glu His Glu Tyr Gly Leu Phe Pro Ala Pro Ile
2020 2025 2030
His Val Gly Lys Glu His Gly Ala Pro Phe Ile Leu
2035 2040
<210> 2
<211> 1126
<212> PRT
<213> Artificial Sequence
<220>
<223> ASH1L-DOCK7 fusion protein of Homo sapiens
<400> 2
Met Asn Met Asp Tyr Phe Gln Arg Pro Phe Met Leu Val Lys Ser Met
1 5 10 15
Val His His Leu Tyr Phe Asn Asp Lys Leu Glu Ala Pro Arg Lys Ser
20 25 30
Arg Phe Pro Glu Arg Phe Met Asp Asp Ile Ala Ala Leu Val Ser Thr
35 40 45
Ile Ala Ser Asp Ile Val Ser Arg Phe Gln Lys Asp Thr Glu Met Val
50 55 60
Glu Arg Leu Asn Thr Ser Leu Ala Phe Phe Leu Asn Asp Leu Leu Ser
65 70 75 80
Val Met Asp Arg Gly Phe Val Phe Ser Leu Ile Lys Ser Cys Tyr Lys
85 90 95
Gln Val Ser Ser Lys Leu Tyr Ser Leu Pro Asn Pro Ser Val Leu Val
100 105 110
Ser Leu Arg Leu Asp Phe Leu Arg Ile Ile Cys Ser His Glu His Tyr
115 120 125
Val Thr Leu Asn Leu Pro Cys Ser Leu Leu Thr Pro Pro Ala Ser Pro
130 135 140
Ser Pro Ser Val Ser Ser Ala Thr Ser Gln Ser Ser Gly Phe Ser Thr
145 150 155 160
Asn Val Gln Asp Gln Lys Ile Ala Asn Met Phe Glu Leu Ser Val Pro
165 170 175
Phe Arg Gln Gln His Tyr Leu Ala Gly Leu Val Leu Thr Glu Leu Ala
180 185 190
Val Ile Leu Asp Pro Asp Ala Glu Gly Leu Phe Gly Leu His Lys Lys
195 200 205
Val Ile Asn Met Val His Asn Leu Leu Ser Ser His Asp Ser Asp Pro
210 215 220
Arg Tyr Ser Asp Pro Gln Ile Lys Ala Arg Val Ala Met Leu Tyr Leu
225 230 235 240
Pro Leu Ile Gly Ile Ile Met Glu Thr Val Pro Gln Leu Tyr Asp Phe
245 250 255
Thr Glu Thr His Asn Gln Arg Gly Arg Pro Ile Cys Ile Ala Thr Asp
260 265 270
Asp Tyr Glu Ser Glu Ser Gly Ser Met Ile Ser Gln Thr Val Ala Met
275 280 285
Ala Ile Ala Gly Thr Ser Val Pro Gln Leu Thr Arg Pro Gly Ser Phe
290 295 300
Leu Leu Thr Ser Thr Ser Gly Arg Gln His Thr Thr Phe Ser Ala Glu
305 310 315 320
Ser Ser Arg Ser Leu Leu Ile Cys Leu Leu Trp Val Leu Lys Asn Ala
325 330 335
Asp Glu Thr Val Leu Gln Lys Trp Phe Thr Asp Leu Ser Val Leu Gln
340 345 350
Leu Asn Arg Leu Leu Asp Leu Leu Tyr Leu Cys Val Ser Cys Phe Glu
355 360 365
Tyr Lys Gly Lys Lys Val Phe Glu Arg Met Asn Ser Leu Thr Phe Lys
370 375 380
Lys Ser Lys Asp Met Arg Ala Lys Leu Glu Glu Ala Ile Leu Gly Ser
385 390 395 400
Ile Gly Ala Arg Gln Glu Met Val Arg Arg Ser Arg Gly Gln Leu Glu
405 410 415
Arg Ser Pro Ser Gly Ser Ala Phe Gly Ser Gln Glu Asn Leu Arg Trp
420 425 430
Arg Lys Asp Met Thr His Trp Arg Gln Asn Thr Glu Lys Leu Asp Lys
435 440 445
Ser Arg Ala Glu Ile Glu His Glu Ala Leu Ile Asp Gly Asn Leu Ala
450 455 460
Thr Glu Ala Asn Leu Ile Ile Leu Asp Thr Leu Glu Ile Val Val Gln
465 470 475 480
Thr Val Ser Val Thr Glu Ser Lys Glu Ser Ile Leu Gly Gly Val Leu
485 490 495
Lys Val Leu Leu His Ser Met Ala Cys Asn Gln Ser Ala Val Tyr Leu
500 505 510
Gln His Cys Phe Ala Thr Gln Arg Ala Leu Val Ser Lys Phe Pro Glu
515 520 525
Leu Leu Phe Glu Glu Glu Thr Glu Gln Cys Ala Asp Leu Cys Leu Arg
530 535 540
Leu Leu Arg His Cys Ser Ser Ser Ile Gly Thr Ile Arg Ser His Ala
545 550 555 560
Ser Ala Ser Leu Tyr Leu Leu Met Arg Gln Asn Phe Glu Ile Gly Asn
565 570 575
Asn Phe Ala Arg Val Lys Met Gln Val Thr Met Ser Leu Ser Ser Leu
580 585 590
Val Gly Thr Ser Gln Asn Phe Asn Glu Glu Phe Leu Arg Arg Ser Leu
595 600 605
Lys Thr Ile Leu Thr Tyr Ala Glu Glu Asp Leu Glu Leu Arg Glu Thr
610 615 620
Thr Phe Pro Asp Gln Val Gln Asp Leu Val Phe Asn Leu His Met Ile
625 630 635 640
Leu Ser Asp Thr Val Lys Met Lys Glu His Gln Glu Asp Pro Glu Met
645 650 655
Leu Ile Asp Leu Met Tyr Arg Ile Ala Lys Gly Tyr Gln Thr Ser Pro
660 665 670
Asp Leu Arg Leu Thr Trp Leu Gln Asn Met Ala Gly Lys His Ser Glu
675 680 685
Arg Ser Asn His Ala Glu Ala Ala Gln Cys Leu Val His Ser Ala Ala
690 695 700
Leu Val Ala Glu Tyr Leu Ser Met Leu Glu Asp Arg Lys Tyr Leu Pro
705 710 715 720
Val Gly Cys Val Thr Phe Gln Asn Ile Ser Ser Asn Val Leu Glu Glu
725 730 735
Ser Ala Val Ser Asp Asp Val Val Ser Pro Asp Glu Glu Gly Ile Cys
740 745 750
Ser Gly Lys Tyr Phe Thr Glu Ser Gly Leu Val Gly Leu Leu Glu Gln
755 760 765
Ala Ala Ala Ser Phe Ser Met Ala Gly Met Tyr Glu Ala Val Asn Glu
770 775 780
Val Tyr Lys Val Leu Ile Pro Ile His Glu Ala Asn Arg Asp Ala Lys
785 790 795 800
Lys Leu Ser Thr Ile His Gly Lys Leu Gln Glu Ala Phe Ser Lys Ile
805 810 815
Val His Gln Asp Gly Lys Arg Met Phe Gly Thr Tyr Phe Arg Val Gly
820 825 830
Phe Tyr Gly Thr Lys Phe Gly Asp Leu Asp Glu Gln Glu Phe Val Tyr
835 840 845
Lys Glu Pro Ala Ile Thr Lys Leu Ala Glu Ile Ser His Arg Leu Glu
850 855 860
Gly Phe Tyr Gly Glu Arg Phe Gly Glu Asp Val Val Glu Val Ile Lys
865 870 875 880
Asp Ser Asn Pro Val Asp Lys Cys Lys Leu Asp Pro Asn Lys Ala Tyr
885 890 895
Ile Gln Ile Thr Tyr Val Glu Pro Tyr Phe Asp Thr Tyr Glu Met Lys
900 905 910
Asp Arg Ile Thr Tyr Phe Asp Lys Asn Tyr Asn Leu Arg Arg Phe Met
915 920 925
Tyr Cys Thr Pro Phe Thr Leu Asp Gly Arg Ala His Gly Glu Leu His
930 935 940
Glu Gln Phe Lys Arg Lys Thr Ile Leu Thr Thr Ser His Ala Phe Pro
945 950 955 960
Tyr Ile Lys Thr Arg Val Asn Val Thr His Lys Glu Glu Ile Ile Leu
965 970 975
Thr Pro Ile Glu Val Ala Ile Glu Asp Met Gln Lys Lys Thr Gln Glu
980 985 990
Leu Ala Phe Ala Thr His Gln Asp Pro Ala Asp Pro Lys Met Leu Gln
995 1000 1005
Met Val Leu Gln Gly Ser Val Gly Thr Thr Val Asn Gln Gly Pro Leu
1010 1015 1020
Glu Val Ala Gln Val Phe Leu Ser Glu Ile Pro Ser Asp Pro Lys Leu
1025 1030 1035 1040
Phe Arg His His Asn Lys Leu Arg Leu Cys Phe Lys Asp Phe Thr Lys
1045 1050 1055
Arg Cys Glu Asp Ala Leu Arg Lys Asn Lys Ser Leu Ile Gly Pro Asp
1060 1065 1070
Gln Lys Glu Tyr Gln Arg Glu Leu Glu Arg Asn Tyr His Arg Leu Lys
1075 1080 1085
Glu Ala Leu Gln Pro Leu Ile Asn Arg Lys Ile Pro Gln Leu Tyr Lys
1090 1095 1100
Ala Val Leu Pro Val Thr Cys His Arg Asp Ser Phe Ser Arg Met Ser
1105 1110 1115 1120
Leu Arg Lys Met Asp Leu
1125
<210> 3
<211> 9445
<212> DNA
<213> Artificial Sequence
<220>
<223> ASH1L-DOCK7 fusion gene of Homo sapiens
<400> 3
atggacccta gaaatactgc tatgttagga ttgggttctg attccgaagg tttttcaaga 60
aagagtcctt ctgccatcag tactggcaca ttggtcagta agagagaagt agagctagaa 120
aaaaacacaa aggaggaaga ggaccttcgc aaacggaatc gagaaagaaa catcgaagct 180
gggaaagatg atggtttgac tgatgcacag caacagtttt cagtgaaaga aacaaacttt 240
tcagagggaa atttaaaatt gaaaattggc ctccaggcta agagaactaa aaaacctcca 300
aagaacttgg agaactatgt atgtcgacct gccataaaaa caactattaa gcacccaagg 360
aaagcactta aaagtggaaa gatgacggat gaaaagaatg aacactgtcc ttcaaaacga 420
gacccttcaa agttgtacaa gaaagcagat gatgttgcag ccattgaatg ccagtctgaa 480
gaagtcatcc gtcttcattc acagggagaa aacaatcctt tgtctaagaa gctgtctcca 540
gtacactcag aaatggcaga ttatattaat gcaacgccat ctactcttct tggtagccgg 600
gatcctgatt taaaggacag agcattactt aatggaggaa ctagtgtaac agaaaagttg 660
gcacagctga ttgctacctg tcctccttcc aagtcttcca agacaaaacc gaagaagtta 720
ggaactggca ctacagcagg attggttagc aaggatttga tcaggaaagc aggtgttggc 780
tctgtagctg gaataataca taaggactta ataaaaaagc caaccatcag cacagcagtt 840
ggattggtaa ctaaagatcc tgggaaaaag ccagtgttta atgcagcagt aggattggtc 900
aataaggact ctgtgaaaaa actgggaact ggcactacag cggtattcat taataaaaac 960
ttaggcaaaa agccaggaac tatcactaca gtaggactgc taagcaaaga ttcaggaaag 1020
aagctaggaa ttggtattgt tccaggttta gtgcataaag agtctggcaa gaagttagga 1080
cttggcactg tggttggact ggttaataaa gatttgggaa agaaattggg ttctactgtt 1140
ggcctagtgg ccaaggactg tgcaaagaag attgtagcaa gttcagcaat gggattggtt 1200
aataaggaca ttggaaagaa actaatgagt tgtcctttgg caggtctgat cagtaaagat 1260
gccataaacc ttaaagccga agcactgctc cccactcagg aaccgcttaa ggcttcttgt 1320
agtacaaaca tcaataatca ggaaagtcag gaactttctg aatccctgaa agatagtgcc 1380
accagcaaaa cttttgaaaa gaatgttgta cggcagaata aagaaagcat attggaaaag 1440
ttctcagtac gaaaagaaat cattaatttg gagaaagaaa tgtttaatga aggaacatgc 1500
attcagcaag acagtttctc atccagtgaa aagggatctt atgaaacctc aaagcatgaa 1560
aagcagcctc ctgtatattg cacttctccg gactttaaaa tgggaggtgc ttctgatgta 1620
tctaccgcta aatccccatt cagtgcagta ggagaaagca atctcccttc cccatcacct 1680
actgtatctg ttaatccttt aaccagaagt ccccctgaaa cttcttcaca gttggctcct 1740
aatccattac ttttaagttc tactacagaa ctaatcgaag aaatttctga atctgttgga 1800
aagaaccagt ttacttctga aagtacccac ttgaacgttg gtcataggtc agttggtcat 1860
agtataagta ttgaatgtaa agggattgat aaagaggtaa atgattcaaa aactacccat 1920
atagatattc caagaataag ctcttccctt ggaaaaaagc caagtttgac ttctgaatcc 1980
agcattcata ctattactcc ttcagttgtt aacttcacta gtttatttag taataagcct 2040
tttttaaaac tgggtgcagt atctgcatca gacaaacact gccaagttgc tgaaagccta 2100
agtactagtt tgcagtccaa accattaaaa aaaagaaaag gaagaaaacc tcggtggact 2160
aaagtggtgg caagaagcac atgccggtct ccaaaagggc tagaattaga aagatcagag 2220
ctttttaaaa acgtttcatg tagctcacta tcaaatagta attctgagcc agccaagttt 2280
atgaaaaaca ttggaccccc ttcatttgta gatcatgact tccttaaacg ccgattgcca 2340
aagttgagca aatccacagc tccatctctt gctctcttag ctgatagtga aaaaccatct 2400
cataagtctt ttgctactca caaactatcc tccagtatgt gtgtctctag tgaccttttg 2460
tctgatattt ataagcccaa aagaggaagg cctaaatcta aggagatgcc tcaactggaa 2520
gggccaccta aaaggacttt aaaaatccct gcttctaaag tgttttcttt acagtctaag 2580
gaagaacaag aacccccaat tttacagcca gaaattgaaa tcccttcctt caaacaaggt 2640
ctgtctgtgt ctccttttcc aaaaaagaga ggcaggccta agaggcaaat gaggtcacca 2700
gtcaagatga agccacctgt actgtcagtg gctccatttg ttgccactga aagtccaagc 2760
aagctagaat ctgaaagtga caaccataga agtagcagtg atttctttga gagcgaggat 2820
caacttcagg atccagatga cctagatgac agtcataggc caagtgtctg tagtatgagt 2880
gaccttgaga tggaaccaga taaaaaaatt accaagagaa acaatggaca attaatgaaa 2940
acaattatcc gcaaaataaa taaaatgaag actttaaaga gaaagaaact gttgaatcag 3000
attctttcaa gttctgtaga atcaagtaat aaagggaaag tgcaatccaa actccataat 3060
acggtatcaa gtcttgctgc cacatttggc tctaaattgg gccaacagat aaatgtcagc 3120
aagaaaggaa ccatttatat aggaaagaga agaggtcgca aaccaaaaac tgtcttaaat 3180
ggtattcttt ctggtagtcc tactagcctt gctgttcttg agcaaacagc tcaacaggca 3240
gctgggtcag cattaggaca gattcttccc ccattactgc cttcatctgc tagtagttct 3300
gagattcttc catcacctat ttgctctcag tcttctggga ctagtggagg tcagagccct 3360
gtaagtagtg atgcaggttt tgttgaaccc agttcagtgc catatttgca tttacactcc 3420
agacagggca gtatgattca gactcttgca atgaagaagg cctcaaaggg gaggaggcgg 3480
ttatctcctc ctactttgtt gccaaattct ccttcgcact tgagtgaact cacatctcta 3540
aaagaagcta ctccttcccc aatcagtgag tctcatagtg atgagaccat tcccagtgat 3600
agtggaattg gaacagataa taacagcaca tcagacaggg cagagaaatt ttgtgggcaa 3660
aaaaagagga ggcattcttt tgagcatgtt tctctgattc cccctgaaac ctctacagtg 3720
ctaagcagtc ttaaagaaaa acataaacac aaatgtaagc gcaggaatca tgattacctc 3780
agctatgaca agatgaaaag gcagaaacga aaacggaaaa agaaatatcc ccagcttcga 3840
aatagacagg atccagactt tattgcagag ctggaggaac taataagtcg cctaagtgaa 3900
attcggatca ctcatcgaag tcatcatttt atcccccgag atcttctgcc aactatcttt 3960
cgaatcaact ttaatagttt ctatacacat ccttctttcc ccttagaccc tttgcactac 4020
attcgaaaac ctgacttaaa aaagaaaaga gggagacccc ctaagatgag ggaggcaatg 4080
gctgaaatgc cttttatgca cagccttagt tttcctcttt ctagtactgg attctatcca 4140
tcttatggta tgccttactc tccttcaccc cttacagctg ctcccatagg attaggttac 4200
tatggaaggt atcctcccac tctttatcca cctcctccat ctccttcttt caccacgcca 4260
cttccacctc cttcctatat gcatgctggt catttacttc tcaatcctgc caaataccat 4320
aagaaaaagc ataagctact tcgacaggag gcctttctta caaccagcag gactcccctc 4380
ctttccatga gtacctaccc cagtgttcct cctgagatgg cctatggttg gatggttgag 4440
cacaaacaca ggcaccgtca caaacacaga gaacaccgtt cttctgaaca accccaggtt 4500
tctatggaca ctggctcttc ccgatctgtc ctggaatctt tgaagcgcta tagatttgga 4560
aaggatgctg ttggagagcg atataagcat aaggaaaagc accgttgtca catgtcctgc 4620
cctcatctct ctccttcaaa aagcttaata aacagagagg aacagtgggt ccaccgagag 4680
ccttcagaat ctagtccatt ggccttggga ttgcagacac ctttacagat tgactgttca 4740
gaaagttctc caagcttatc ccttggagga ttcactccca actctgagcc agccagcagt 4800
gatgaacata caaacctttt cacaagtgca ataggcagct gcagagtttc aaaccctaac 4860
tccagtggcc ggaagaaatt aactgacagc cctggactct tttctgcaca ggacacttca 4920
ctaaatcggc ttcacagaaa ggagtcactg ccttctaacg aaagggcagt acagactttg 4980
gcaggctccc agccaacctc tgataaaccc tcccagcggc catcagagag cacaaattgt 5040
agccctaccc ggaaaaggtc ttcatctgag agtacttctt caacagtaaa cggagttccc 5100
tctcgaagtc caagattagt tgcttctggg gatgactctg tggatagtct gctgcagcgg 5160
atggtacaaa atgaggacca agagcccatg gagaaaagta ttgatgctgt gattgcaact 5220
gcctctgcac caccttcttc cagtccaggc cgtagccaca gcaaggaccg aaccctggga 5280
aaaccagaca gccttttagt gcctgcagtc acaagtgact cttgcaataa tagcatctca 5340
ctcctatctg aaaagttgac aagcagctgt tccccccatc atatcaagag aagtgtagtg 5400
gaagctatgc aacgccaagc tcggaaaatg tgcaattacg acaaaatctt ggccacaaag 5460
aaaaacctag accatgtcaa taaaatctta aaagccaaaa aacttcaaag gcaggccagg 5520
acagggaata actttgtgaa acgtaggcca ggtcgacctc ggaaatgtcc ccttcaggct 5580
gtcgtatcaa tgcaagcatt ccaggctgct cagtttgtca acccagaatt gaacagagac 5640
gaggaaggag cagcactgca cctcagtcct gacacagtta cagatgtaat tgaggctgtt 5700
gttcagagtg taaatctgaa cccagaacat aaaaaggggt tgaagagaaa aggttggcta 5760
ttggaagaac agaccagaaa aaagcagaag ccattaccag aggaagaaga gcaagagaat 5820
aataaaagct ttaatgaagc accagttgag attcccagtc cttctgaaac cccagctaaa 5880
ccttctgaac ctgaaagtac cttgcagcct gtgctttctc tcatcccaag ggaaaagaag 5940
cccccacgtc ccccaaagaa gaagtatcag aaagcagggc tgtattctga cgtttacaaa 6000
actacagacc caaagagtcg attgatccaa ttaaagaaag agaagctgga gtatactcca 6060
ggagagcatg aatatggatt atttccagcg cccattcatg ttggtaaaga gcatggtgca 6120
ccatttatac tttaatgata aacttgaggc tccaaggaaa agtcgttttc cagaacgttt 6180
catggatgac attgcagctc ttgtcagcac gattgctagt gatatagttt cacgatttca 6240
gaaggacaca gaaatggttg agagactcaa tacaagcctt gcattctttc tcaatgatct 6300
gttgtctgtt atggacagag gatttgtttt tagccttata aagtcctgct ataaacaggt 6360
gtcttcaaag ctttactcat taccgaatcc cagtgttctg gtgtccttga ggctggattt 6420
tctacgaatc atctgcagtc atgagcacta tgttacatta aacttaccct gcagcttact 6480
tactccacct gcatctccat caccttctgt ttcttctgca acatctcaga gttctggatt 6540
ttctacgaat gtacaagacc aaaagattgc aaatatgttt gaattatccg tgcctttccg 6600
ccaacagcat tatttggcag gacttgtgtt aacagagctg gctgtcattt tagaccctga 6660
tgctgaagga ctgtttggat tgcataagaa agtcatcaat atggtacaca atttactctc 6720
cagtcacgac tcagacccgc ggtactctga ccctcagata aaggctcgag tggccatgtt 6780
gtatctacct ctgattggta ttatcatgga aactgtacct cagctgtatg attttacaga 6840
aactcacaat caacgaggaa gaccaatttg tatagccact gatgattatg aaagtgagag 6900
cggaagtatg ataagccaga ccgttgccat ggcaatcgca gggacatcgg tccctcaact 6960
aacaaggcct ggcagtttcc tcctcacgtc aacgagtggc aggcaacaca ctaccttttc 7020
agcagaatca agtcgaagcc ttttgatctg tctactttgg gttctcaaaa atgcagatga 7080
aacagttcta cagaagtggt ttacagatct ctcagtcttg cagctaaacc ggctattaga 7140
tctgctttat ctctgtgtgt cttgctttga gtataaaggg aaaaaagtgt ttgaacgaat 7200
gaatagcttg acctttaaga aatcaaaaga catgagagca aagcttgaag aagctattct 7260
tgggagcata ggtgccaggc aagaaatggt acggcgaagc cgaggacagc tcgagagaag 7320
cccatctgga agtgcctttg gaagtcaaga aaatttgagg tggaggaaag atatgactca 7380
ctggcgtcaa aacacagaga agcttgacaa atcaagagca gagattgaac acgaagcact 7440
gattgatgga aacctggcta cagaagcaaa cctaatcatt ttagatacat tagagattgt 7500
tgttcagacc gtttctgtaa cggaatccaa agagagcatt cttggtggag tgctaaaagt 7560
gctactacac agcatggcct gtaaccaaag tgcagtttat ctacaacact gttttgctac 7620
acagagagcc ttggtttcaa agtttcctga actcttattt gaagaagaga cagagcagtg 7680
tgctgattta tgcctcaggc ttctccgaca ctgtagcagt agcatcggta caatacggtc 7740
acacgccagt gcctcccttt acctactaat gaggcaaaac tttgagattg ggaataactt 7800
tgccagggtt aaaatgcagg taacaatgtc actatcctcc ttggtgggca catctcagaa 7860
ttttaatgaa gaattcttaa gacgttctct aaagactata ttgacatatg ctgaagaaga 7920
tctggaattg agggaaacaa catttcctga tcaggtccag gatctggttt tcaatctcca 7980
tatgattctt tctgatactg tgaaaatgaa ggaacaccag gaggatcctg aaatgttgat 8040
tgatctaatg tacagaattg ccaagggtta ccagacctct ccagatctgc gattgacctg 8100
gttgcagaac atggcaggca agcactcaga acgaagcaat catgctgaag ctgcacagtg 8160
tctagtccac tcagcagcac ttgttgctga atatttgagc atgctggagg accggaaata 8220
tcttcctgtg ggatgtgtaa catttcagaa tatttcatct aatgttttag aagaatctgc 8280
ggtctcagat gatgtggtat ctccagatga agaaggtatc tgctctggaa aatactttac 8340
tgagtcagga cttgtgggat tactggaaca agcagctgct tccttctcta tggctggcat 8400
gtatgaagca gttaatgaag tttacaaagt acttattcct attcatgaag ctaatcggga 8460
tgcaaagaaa ctatccacaa ttcatggtaa acttcaagaa gcattcagca aaattgttca 8520
tcaggatggt aagcggatgt ttggcaccta ttttcgtgtt ggtttttatg gaaccaagtt 8580
cggggatttg gatgaacaag aatttgttta caaggagcct gcaataacca aacttgcaga 8640
gatatctcac agattggagg gattttacgg agaaagattt ggagaggatg tggttgaagt 8700
aatcaaagac tctaatcctg tagacaagtg taaattagat cctaacaagg catatattca 8760
gattacctat gtggagccat actttgacac atatgagatg aaggacagaa tcacctattt 8820
cgacaaaaat tacaatcttc gtcgattcat gtactgtaca ccctttactt tagatggccg 8880
tgcccatggg gaacttcatg aacaattcaa aaggaagacc attctgacta cgtctcatgc 8940
ctttccttat attaaaacaa gggtcaatgt cactcataaa gaagagatca tcttaacacc 9000
aattgaagtt gctattgagg acatgcagaa aaagacacag gagttggcat ttgcaacaca 9060
tcaggatccc gcagacccca aaatgcttca gatggtactc cagggatctg taggcaccac 9120
agtgaatcag gggcctttgg aagttgccca ggtttttctg tctgaaatac ctagtgaccc 9180
aaagctcttc agacatcata ataaactgcg actctgcttt aaagatttta ctaaaaggtg 9240
tgaagatgcc ttaagaaaaa ataagagctt aattgggccg gatcaaaagg agtatcaaag 9300
ggaactggag agaaactatc atcgccttaa agaggcccta cagccactga tcaacagaaa 9360
gatccctcag ttatacaagg cagtattgcc tgtcacctgc cacagagatt ccttcagtcg 9420
aatgagcctt cgcaaaatgg atctc 9445
<210> 4
<211> 6132
<212> DNA
<213> Artificial Sequence
<220>
<223> ASH1L-DOCK7 fusion gene of Homo sapiens
<400> 4
atggacccta gaaatactgc tatgttagga ttgggttctg attccgaagg tttttcaaga 60
aagagtcctt ctgccatcag tactggcaca ttggtcagta agagagaagt agagctagaa 120
aaaaacacaa aggaggaaga ggaccttcgc aaacggaatc gagaaagaaa catcgaagct 180
gggaaagatg atggtttgac tgatgcacag caacagtttt cagtgaaaga aacaaacttt 240
tcagagggaa atttaaaatt gaaaattggc ctccaggcta agagaactaa aaaacctcca 300
aagaacttgg agaactatgt atgtcgacct gccataaaaa caactattaa gcacccaagg 360
aaagcactta aaagtggaaa gatgacggat gaaaagaatg aacactgtcc ttcaaaacga 420
gacccttcaa agttgtacaa gaaagcagat gatgttgcag ccattgaatg ccagtctgaa 480
gaagtcatcc gtcttcattc acagggagaa aacaatcctt tgtctaagaa gctgtctcca 540
gtacactcag aaatggcaga ttatattaat gcaacgccat ctactcttct tggtagccgg 600
gatcctgatt taaaggacag agcattactt aatggaggaa ctagtgtaac agaaaagttg 660
gcacagctga ttgctacctg tcctccttcc aagtcttcca agacaaaacc gaagaagtta 720
ggaactggca ctacagcagg attggttagc aaggatttga tcaggaaagc aggtgttggc 780
tctgtagctg gaataataca taaggactta ataaaaaagc caaccatcag cacagcagtt 840
ggattggtaa ctaaagatcc tgggaaaaag ccagtgttta atgcagcagt aggattggtc 900
aataaggact ctgtgaaaaa actgggaact ggcactacag cggtattcat taataaaaac 960
ttaggcaaaa agccaggaac tatcactaca gtaggactgc taagcaaaga ttcaggaaag 1020
aagctaggaa ttggtattgt tccaggttta gtgcataaag agtctggcaa gaagttagga 1080
cttggcactg tggttggact ggttaataaa gatttgggaa agaaattggg ttctactgtt 1140
ggcctagtgg ccaaggactg tgcaaagaag attgtagcaa gttcagcaat gggattggtt 1200
aataaggaca ttggaaagaa actaatgagt tgtcctttgg caggtctgat cagtaaagat 1260
gccataaacc ttaaagccga agcactgctc cccactcagg aaccgcttaa ggcttcttgt 1320
agtacaaaca tcaataatca ggaaagtcag gaactttctg aatccctgaa agatagtgcc 1380
accagcaaaa cttttgaaaa gaatgttgta cggcagaata aagaaagcat attggaaaag 1440
ttctcagtac gaaaagaaat cattaatttg gagaaagaaa tgtttaatga aggaacatgc 1500
attcagcaag acagtttctc atccagtgaa aagggatctt atgaaacctc aaagcatgaa 1560
aagcagcctc ctgtatattg cacttctccg gactttaaaa tgggaggtgc ttctgatgta 1620
tctaccgcta aatccccatt cagtgcagta ggagaaagca atctcccttc cccatcacct 1680
actgtatctg ttaatccttt aaccagaagt ccccctgaaa cttcttcaca gttggctcct 1740
aatccattac ttttaagttc tactacagaa ctaatcgaag aaatttctga atctgttgga 1800
aagaaccagt ttacttctga aagtacccac ttgaacgttg gtcataggtc agttggtcat 1860
agtataagta ttgaatgtaa agggattgat aaagaggtaa atgattcaaa aactacccat 1920
atagatattc caagaataag ctcttccctt ggaaaaaagc caagtttgac ttctgaatcc 1980
agcattcata ctattactcc ttcagttgtt aacttcacta gtttatttag taataagcct 2040
tttttaaaac tgggtgcagt atctgcatca gacaaacact gccaagttgc tgaaagccta 2100
agtactagtt tgcagtccaa accattaaaa aaaagaaaag gaagaaaacc tcggtggact 2160
aaagtggtgg caagaagcac atgccggtct ccaaaagggc tagaattaga aagatcagag 2220
ctttttaaaa acgtttcatg tagctcacta tcaaatagta attctgagcc agccaagttt 2280
atgaaaaaca ttggaccccc ttcatttgta gatcatgact tccttaaacg ccgattgcca 2340
aagttgagca aatccacagc tccatctctt gctctcttag ctgatagtga aaaaccatct 2400
cataagtctt ttgctactca caaactatcc tccagtatgt gtgtctctag tgaccttttg 2460
tctgatattt ataagcccaa aagaggaagg cctaaatcta aggagatgcc tcaactggaa 2520
gggccaccta aaaggacttt aaaaatccct gcttctaaag tgttttcttt acagtctaag 2580
gaagaacaag aacccccaat tttacagcca gaaattgaaa tcccttcctt caaacaaggt 2640
ctgtctgtgt ctccttttcc aaaaaagaga ggcaggccta agaggcaaat gaggtcacca 2700
gtcaagatga agccacctgt actgtcagtg gctccatttg ttgccactga aagtccaagc 2760
aagctagaat ctgaaagtga caaccataga agtagcagtg atttctttga gagcgaggat 2820
caacttcagg atccagatga cctagatgac agtcataggc caagtgtctg tagtatgagt 2880
gaccttgaga tggaaccaga taaaaaaatt accaagagaa acaatggaca attaatgaaa 2940
acaattatcc gcaaaataaa taaaatgaag actttaaaga gaaagaaact gttgaatcag 3000
attctttcaa gttctgtaga atcaagtaat aaagggaaag tgcaatccaa actccataat 3060
acggtatcaa gtcttgctgc cacatttggc tctaaattgg gccaacagat aaatgtcagc 3120
aagaaaggaa ccatttatat aggaaagaga agaggtcgca aaccaaaaac tgtcttaaat 3180
ggtattcttt ctggtagtcc tactagcctt gctgttcttg agcaaacagc tcaacaggca 3240
gctgggtcag cattaggaca gattcttccc ccattactgc cttcatctgc tagtagttct 3300
gagattcttc catcacctat ttgctctcag tcttctggga ctagtggagg tcagagccct 3360
gtaagtagtg atgcaggttt tgttgaaccc agttcagtgc catatttgca tttacactcc 3420
agacagggca gtatgattca gactcttgca atgaagaagg cctcaaaggg gaggaggcgg 3480
ttatctcctc ctactttgtt gccaaattct ccttcgcact tgagtgaact cacatctcta 3540
aaagaagcta ctccttcccc aatcagtgag tctcatagtg atgagaccat tcccagtgat 3600
agtggaattg gaacagataa taacagcaca tcagacaggg cagagaaatt ttgtgggcaa 3660
aaaaagagga ggcattcttt tgagcatgtt tctctgattc cccctgaaac ctctacagtg 3720
ctaagcagtc ttaaagaaaa acataaacac aaatgtaagc gcaggaatca tgattacctc 3780
agctatgaca agatgaaaag gcagaaacga aaacggaaaa agaaatatcc ccagcttcga 3840
aatagacagg atccagactt tattgcagag ctggaggaac taataagtcg cctaagtgaa 3900
attcggatca ctcatcgaag tcatcatttt atcccccgag atcttctgcc aactatcttt 3960
cgaatcaact ttaatagttt ctatacacat ccttctttcc ccttagaccc tttgcactac 4020
attcgaaaac ctgacttaaa aaagaaaaga gggagacccc ctaagatgag ggaggcaatg 4080
gctgaaatgc cttttatgca cagccttagt tttcctcttt ctagtactgg attctatcca 4140
tcttatggta tgccttactc tccttcaccc cttacagctg ctcccatagg attaggttac 4200
tatggaaggt atcctcccac tctttatcca cctcctccat ctccttcttt caccacgcca 4260
cttccacctc cttcctatat gcatgctggt catttacttc tcaatcctgc caaataccat 4320
aagaaaaagc ataagctact tcgacaggag gcctttctta caaccagcag gactcccctc 4380
ctttccatga gtacctaccc cagtgttcct cctgagatgg cctatggttg gatggttgag 4440
cacaaacaca ggcaccgtca caaacacaga gaacaccgtt cttctgaaca accccaggtt 4500
tctatggaca ctggctcttc ccgatctgtc ctggaatctt tgaagcgcta tagatttgga 4560
aaggatgctg ttggagagcg atataagcat aaggaaaagc accgttgtca catgtcctgc 4620
cctcatctct ctccttcaaa aagcttaata aacagagagg aacagtgggt ccaccgagag 4680
ccttcagaat ctagtccatt ggccttggga ttgcagacac ctttacagat tgactgttca 4740
gaaagttctc caagcttatc ccttggagga ttcactccca actctgagcc agccagcagt 4800
gatgaacata caaacctttt cacaagtgca ataggcagct gcagagtttc aaaccctaac 4860
tccagtggcc ggaagaaatt aactgacagc cctggactct tttctgcaca ggacacttca 4920
ctaaatcggc ttcacagaaa ggagtcactg ccttctaacg aaagggcagt acagactttg 4980
gcaggctccc agccaacctc tgataaaccc tcccagcggc catcagagag cacaaattgt 5040
agccctaccc ggaaaaggtc ttcatctgag agtacttctt caacagtaaa cggagttccc 5100
tctcgaagtc caagattagt tgcttctggg gatgactctg tggatagtct gctgcagcgg 5160
atggtacaaa atgaggacca agagcccatg gagaaaagta ttgatgctgt gattgcaact 5220
gcctctgcac caccttcttc cagtccaggc cgtagccaca gcaaggaccg aaccctggga 5280
aaaccagaca gccttttagt gcctgcagtc acaagtgact cttgcaataa tagcatctca 5340
ctcctatctg aaaagttgac aagcagctgt tccccccatc atatcaagag aagtgtagtg 5400
gaagctatgc aacgccaagc tcggaaaatg tgcaattacg acaaaatctt ggccacaaag 5460
aaaaacctag accatgtcaa taaaatctta aaagccaaaa aacttcaaag gcaggccagg 5520
acagggaata actttgtgaa acgtaggcca ggtcgacctc ggaaatgtcc ccttcaggct 5580
gtcgtatcaa tgcaagcatt ccaggctgct cagtttgtca acccagaatt gaacagagac 5640
gaggaaggag cagcactgca cctcagtcct gacacagtta cagatgtaat tgaggctgtt 5700
gttcagagtg taaatctgaa cccagaacat aaaaaggggt tgaagagaaa aggttggcta 5760
ttggaagaac agaccagaaa aaagcagaag ccattaccag aggaagaaga gcaagagaat 5820
aataaaagct ttaatgaagc accagttgag attcccagtc cttctgaaac cccagctaaa 5880
ccttctgaac ctgaaagtac cttgcagcct gtgctttctc tcatcccaag ggaaaagaag 5940
cccccacgtc ccccaaagaa gaagtatcag aaagcagggc tgtattctga cgtttacaaa 6000
actacagacc caaagagtcg attgatccaa ttaaagaaag agaagctgga gtatactcca 6060
ggagagcatg aatatggatt atttccagcg cccattcatg ttggtaaaga gcatggtgca 6120
ccatttatac tt 6132
<210> 5
<211> 3378
<212> DNA
<213> Artificial Sequence
<220>
<223> ASH1L-DOCK7 fusion gene of Homo sapiens
<400> 5
atgaatatgg attatttcca gcgcccattc atgttggtaa agagcatggt gcaccattta 60
tactttaatg ataaacttga ggctccaagg aaaagtcgtt ttccagaacg tttcatggat 120
gacattgcag ctcttgtcag cacgattgct agtgatatag tttcacgatt tcagaaggac 180
acagaaatgg ttgagagact caatacaagc cttgcattct ttctcaatga tctgttgtct 240
gttatggaca gaggatttgt ttttagcctt ataaagtcct gctataaaca ggtgtcttca 300
aagctttact cattaccgaa tcccagtgtt ctggtgtcct tgaggctgga ttttctacga 360
atcatctgca gtcatgagca ctatgttaca ttaaacttac cctgcagctt acttactcca 420
cctgcatctc catcaccttc tgtttcttct gcaacatctc agagttctgg attttctacg 480
aatgtacaag accaaaagat tgcaaatatg tttgaattat ccgtgccttt ccgccaacag 540
cattatttgg caggacttgt gttaacagag ctggctgtca ttttagaccc tgatgctgaa 600
ggactgtttg gattgcataa gaaagtcatc aatatggtac acaatttact ctccagtcac 660
gactcagacc cgcggtactc tgaccctcag ataaaggctc gagtggccat gttgtatcta 720
cctctgattg gtattatcat ggaaactgta cctcagctgt atgattttac agaaactcac 780
aatcaacgag gaagaccaat ttgtatagcc actgatgatt atgaaagtga gagcggaagt 840
atgataagcc agaccgttgc catggcaatc gcagggacat cggtccctca actaacaagg 900
cctggcagtt tcctcctcac gtcaacgagt ggcaggcaac acactacctt ttcagcagaa 960
tcaagtcgaa gccttttgat ctgtctactt tgggttctca aaaatgcaga tgaaacagtt 1020
ctacagaagt ggtttacaga tctctcagtc ttgcagctaa accggctatt agatctgctt 1080
tatctctgtg tgtcttgctt tgagtataaa gggaaaaaag tgtttgaacg aatgaatagc 1140
ttgaccttta agaaatcaaa agacatgaga gcaaagcttg aagaagctat tcttgggagc 1200
ataggtgcca ggcaagaaat ggtacggcga agccgaggac agctcgagag aagcccatct 1260
ggaagtgcct ttggaagtca agaaaatttg aggtggagga aagatatgac tcactggcgt 1320
caaaacacag agaagcttga caaatcaaga gcagagattg aacacgaagc actgattgat 1380
ggaaacctgg ctacagaagc aaacctaatc attttagata cattagagat tgttgttcag 1440
accgtttctg taacggaatc caaagagagc attcttggtg gagtgctaaa agtgctacta 1500
cacagcatgg cctgtaacca aagtgcagtt tatctacaac actgttttgc tacacagaga 1560
gccttggttt caaagtttcc tgaactctta tttgaagaag agacagagca gtgtgctgat 1620
ttatgcctca ggcttctccg acactgtagc agtagcatcg gtacaatacg gtcacacgcc 1680
agtgcctccc tttacctact aatgaggcaa aactttgaga ttgggaataa ctttgccagg 1740
gttaaaatgc aggtaacaat gtcactatcc tccttggtgg gcacatctca gaattttaat 1800
gaagaattct taagacgttc tctaaagact atattgacat atgctgaaga agatctggaa 1860
ttgagggaaa caacatttcc tgatcaggtc caggatctgg ttttcaatct ccatatgatt 1920
ctttctgata ctgtgaaaat gaaggaacac caggaggatc ctgaaatgtt gattgatcta 1980
atgtacagaa ttgccaaggg ttaccagacc tctccagatc tgcgattgac ctggttgcag 2040
aacatggcag gcaagcactc agaacgaagc aatcatgctg aagctgcaca gtgtctagtc 2100
cactcagcag cacttgttgc tgaatatttg agcatgctgg aggaccggaa atatcttcct 2160
gtgggatgtg taacatttca gaatatttca tctaatgttt tagaagaatc tgcggtctca 2220
gatgatgtgg tatctccaga tgaagaaggt atctgctctg gaaaatactt tactgagtca 2280
ggacttgtgg gattactgga acaagcagct gcttccttct ctatggctgg catgtatgaa 2340
gcagttaatg aagtttacaa agtacttatt cctattcatg aagctaatcg ggatgcaaag 2400
aaactatcca caattcatgg taaacttcaa gaagcattca gcaaaattgt tcatcaggat 2460
ggtaagcgga tgtttggcac ctattttcgt gttggttttt atggaaccaa gttcggggat 2520
ttggatgaac aagaatttgt ttacaaggag cctgcaataa ccaaacttgc agagatatct 2580
cacagattgg agggatttta cggagaaaga tttggagagg atgtggttga agtaatcaaa 2640
gactctaatc ctgtagacaa gtgtaaatta gatcctaaca aggcatatat tcagattacc 2700
tatgtggagc catactttga cacatatgag atgaaggaca gaatcaccta tttcgacaaa 2760
aattacaatc ttcgtcgatt catgtactgt acacccttta ctttagatgg ccgtgcccat 2820
ggggaacttc atgaacaatt caaaaggaag accattctga ctacgtctca tgcctttcct 2880
tatattaaaa caagggtcaa tgtcactcat aaagaagaga tcatcttaac accaattgaa 2940
gttgctattg aggacatgca gaaaaagaca caggagttgg catttgcaac acatcaggat 3000
cccgcagacc ccaaaatgct tcagatggta ctccagggat ctgtaggcac cacagtgaat 3060
caggggcctt tggaagttgc ccaggttttt ctgtctgaaa tacctagtga cccaaagctc 3120
ttcagacatc ataataaact gcgactctgc tttaaagatt ttactaaaag gtgtgaagat 3180
gccttaagaa aaaataagag cttaattggg ccggatcaaa aggagtatca aagggaactg 3240
gagagaaact atcatcgcct taaagaggcc ctacagccac tgatcaacag aaagatccct 3300
cagttataca aggcagtatt gcctgtcacc tgccacagag attccttcag tcgaatgagc 3360
cttcgcaaaa tggatctc 3378
<210> 6
<211> 1244
<212> PRT
<213> Artificial Sequence
<220>
<223> PUM1-TRAF3 fusion protein of Homo sapiens
<400> 6
Met Ser Val Ala Cys Val Leu Lys Arg Lys Ala Val Leu Trp Gln Asp
1 5 10 15
Ser Phe Ser Pro His Leu Lys His His Pro Gln Glu Pro Ala Asn Pro
20 25 30
Asn Met Pro Val Val Leu Thr Ser Gly Thr Gly Ser Gln Ala Gln Pro
35 40 45
Gln Pro Ala Ala Asn Gln Ala Leu Ala Ala Gly Thr His Ser Ser Pro
50 55 60
Val Pro Gly Ser Ile Gly Val Ala Gly Arg Ser Gln Asp Asp Ala Met
65 70 75 80
Val Asp Tyr Phe Phe Gln Arg Gln His Gly Glu Gln Leu Gly Gly Gly
85 90 95
Gly Ser Gly Gly Gly Gly Tyr Asn Asn Ser Lys His Arg Trp Pro Thr
100 105 110
Gly Asp Asn Ile His Ala Glu His Gln Val Arg Ser Met Asp Glu Leu
115 120 125
Asn His Asp Phe Gln Ala Leu Ala Leu Glu Gly Arg Ala Met Gly Glu
130 135 140
Gln Leu Leu Pro Gly Lys Lys Phe Trp Glu Thr Asp Glu Ser Ser Lys
145 150 155 160
Asp Gly Pro Lys Gly Ile Phe Leu Gly Asp Gln Trp Arg Asp Ser Ala
165 170 175
Trp Gly Thr Ser Asp His Ser Val Ser Gln Pro Ile Met Val Gln Arg
180 185 190
Arg Pro Gly Gln Ser Phe His Val Asn Ser Glu Val Asn Ser Val Leu
195 200 205
Ser Pro Arg Ser Glu Ser Gly Gly Leu Gly Val Ser Met Val Glu Tyr
210 215 220
Val Leu Ser Ser Ser Pro Gly Asp Ser Cys Leu Arg Lys Gly Gly Phe
225 230 235 240
Gly Pro Arg Asp Ala Asp Ser Asp Glu Asn Asp Lys Gly Glu Lys Lys
245 250 255
Asn Lys Gly Thr Phe Asp Gly Asp Lys Leu Gly Asp Leu Lys Glu Glu
260 265 270
Gly Asp Val Met Asp Lys Thr Asn Gly Leu Pro Val Gln Asn Gly Ile
275 280 285
Asp Ala Asp Val Lys Asp Phe Ser Arg Thr Pro Gly Asn Cys Gln Asn
290 295 300
Ser Ala Asn Glu Val Asp Leu Leu Gly Pro Asn Gln Asn Gly Ser Glu
305 310 315 320
Gly Leu Ala Gln Leu Thr Ser Thr Asn Gly Ala Lys Pro Val Glu Asp
325 330 335
Phe Ser Asn Met Glu Ser Gln Ser Val Pro Leu Asp Pro Met Glu His
340 345 350
Val Gly Met Glu Pro Leu Gln Phe Asp Tyr Ser Gly Thr Gln Val Pro
355 360 365
Val Asp Ser Ala Ala Ala Thr Val Gly Leu Phe Asp Tyr Asn Ser Gln
370 375 380
Gln Gln Leu Phe Gln Arg Pro Asn Ala Leu Ala Val Gln Gln Leu Thr
385 390 395 400
Ala Ala Gln Gln Gln Gln Tyr Ala Leu Ala Ala Ala His Gln Pro His
405 410 415
Ile Gly Leu Ala Pro Ala Ala Phe Val Pro Asn Pro Tyr Ile Ile Ser
420 425 430
Ala Ala Pro Pro Gly Thr Asp Pro Tyr Thr Ala Gly Leu Ala Ala Ala
435 440 445
Ala Thr Leu Gly Pro Ala Val Val Pro His Gln Tyr Tyr Gly Val Thr
450 455 460
Pro Trp Gly Val Tyr Pro Ala Ser Leu Phe Gln Gln Gln Ala Ala Ala
465 470 475 480
Ala Ala Ala Ala Thr Asn Ser Ala Asn Gln Gln Thr Thr Pro Gln Ala
485 490 495
Gln Gln Gly Gln Gln Gln Val Leu Arg Gly Gly Ala Ser Gln Arg Pro
500 505 510
Leu Thr Pro Asn Gln Asn Gln Gln Gly Gln Gln Thr Asp Pro Leu Val
515 520 525
Ala Ala Ala Ala Val Asn Ser Ala Leu Ala Phe Gly Gln Gly Leu Ala
530 535 540
Ala Gly Met Pro Gly Tyr Pro Val Leu Ala Pro Ala Ala Tyr Tyr Asp
545 550 555 560
Gln Thr Gly Ala Leu Val Val Asn Ala Gly Ala Arg Asn Gly Leu Gly
565 570 575
Ala Pro Val Arg Leu Val Ala Pro Ala Pro Val Ile Ile Ser Ser Ser
580 585 590
Ala Ala Gln Ala Ala Val Ala Ala Ala Ala Ala Ser Ala Asn Gly Ala
595 600 605
Ala Gly Gly Leu Ala Gly Thr Thr Asn Gly Pro Phe Arg Pro Leu Gly
610 615 620
Thr Gln Gln Pro Gln Pro Gln Pro Gln Gln Gln Pro Asn Asn Asn Leu
625 630 635 640
Ala Ser Ser Ser Phe Tyr Gly Asn Asn Ser Leu Asn Ser Asn Ser Gln
645 650 655
Ser Ser Ser Leu Phe Ser Gln Gly Ser Ala Gln Pro Ala Asn Thr Ser
660 665 670
Leu Gly Phe Gly Ser Ser Ser Ser Leu Gly Ala Thr Leu Gly Ser Ala
675 680 685
Leu Gly Gly Phe Gly Thr Ala Val Ala Asn Ser Asn Thr Gly Ser Gly
690 695 700
Ser Arg Arg Asp Ser Leu Thr Gly Ser Ser Asp Leu Tyr Lys Arg Thr
705 710 715 720
Ser Ser Ser Leu Thr Pro Ile Gly His Ser Phe Tyr Asn Gly Leu Ser
725 730 735
Phe Ser Ser Ser Pro Gly Pro Val Gly Met Pro Leu Pro Ser Gln Gly
740 745 750
Pro Gly His Ser Gln Thr Pro Pro Pro Ser Leu Ser Ser His Gly Ser
755 760 765
Ser Ser Ser Leu Asn Leu Gly Gly Leu Thr Asn Gly Ser Gly Arg Tyr
770 775 780
Ile Ser Ala Ala Pro Gly Ala Glu Ala Lys Tyr Arg Ser Ala Ser Ser
785 790 795 800
Ala Ser Ser Leu Phe Ser Pro Ser Ser Thr Leu Phe Ser Ser Ser Arg
805 810 815
Leu Arg Tyr Gly Met Ser Asp Val Met Pro Ser Gly Arg Ser Arg Leu
820 825 830
Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg Glu
835 840 845
Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser Arg
850 855 860
Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Leu
865 870 875 880
Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp Val
885 890 895
Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Glu
900 905 910
Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser Leu
915 920 925
Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala Leu Glu Phe
930 935 940
Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly His
945 950 955 960
Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys
965 970 975
Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala
980 985 990
Phe Lys Gly Gln Arg Val Ile Asp Ser Gln Ala Glu Lys Leu Lys Glu
995 1000 1005
Leu Asp Lys Glu Ile Arg Pro Phe Arg Gln Asn Trp Glu Glu Ala Asp
1010 1015 1020
Ser Met Lys Ser Ser Val Glu Ser Leu Gln Asn Arg Val Thr Glu Leu
1025 1030 1035 1040
Glu Ser Val Asp Lys Ser Ala Gly Gln Val Ala Arg Asn Thr Gly Leu
1045 1050 1055
Leu Glu Ser Gln Leu Ser Arg His Asp Gln Met Leu Ser Val His Asp
1060 1065 1070
Ile Arg Leu Ala Asp Met Asp Leu Arg Phe Gln Val Leu Glu Thr Ala
1075 1080 1085
Ser Tyr Asn Gly Val Leu Ile Trp Lys Ile Arg Asp Tyr Lys Arg Arg
1090 1095 1100
Lys Gln Glu Ala Val Met Gly Lys Thr Leu Ser Leu Tyr Ser Gln Pro
1105 1110 1115 1120
Phe Tyr Thr Gly Tyr Phe Gly Tyr Lys Met Cys Ala Arg Val Tyr Leu
1125 1130 1135
Asn Gly Asp Gly Met Gly Lys Gly Thr His Leu Ser Leu Phe Phe Val
1140 1145 1150
Ile Met Arg Gly Glu Tyr Asp Ala Leu Leu Pro Trp Pro Phe Lys Gln
1155 1160 1165
Lys Val Thr Leu Met Leu Met Asp Gln Gly Ser Ser Arg Arg His Leu
1170 1175 1180
Gly Asp Ala Phe Lys Pro Asp Pro Asn Ser Ser Ser Phe Lys Lys Pro
1185 1190 1195 1200
Thr Gly Glu Met Asn Ile Ala Ser Gly Cys Pro Val Phe Val Ala Gln
1205 1210 1215
Thr Val Leu Glu Asn Gly Thr Tyr Ile Lys Asp Asp Thr Ile Phe Ile
1220 1225 1230
Lys Val Ile Val Asp Thr Ser Asp Leu Pro Asp Pro
1235 1240
<210> 7
<211> 1165
<212> PRT
<213> Artificial Sequence
<220>
<223> PUM1-TRAF3 fusion protein of Homo sapiens
<400> 7
Met Ser Val Ala Cys Val Leu Lys Arg Lys Ala Val Leu Trp Gln Asp
1 5 10 15
Ser Phe Ser Pro His Leu Lys His His Pro Gln Glu Pro Ala Asn Pro
20 25 30
Asn Met Pro Val Val Leu Thr Ser Gly Thr Gly Ser Gln Ala Gln Pro
35 40 45
Gln Pro Ala Ala Asn Gln Ala Leu Ala Ala Gly Thr His Ser Ser Pro
50 55 60
Val Pro Gly Ser Ile Gly Val Ala Gly Arg Ser Gln Asp Asp Ala Met
65 70 75 80
Val Asp Tyr Phe Phe Gln Arg Gln His Gly Glu Gln Leu Gly Gly Gly
85 90 95
Gly Ser Gly Gly Gly Gly Tyr Asn Asn Ser Lys His Arg Trp Pro Thr
100 105 110
Gly Asp Asn Ile His Ala Glu His Gln Val Arg Ser Met Asp Glu Leu
115 120 125
Asn His Asp Phe Gln Ala Leu Ala Leu Glu Gly Arg Ala Met Gly Glu
130 135 140
Gln Leu Leu Pro Gly Lys Lys Phe Trp Glu Thr Asp Glu Ser Ser Lys
145 150 155 160
Asp Gly Pro Lys Gly Ile Phe Leu Gly Asp Gln Trp Arg Asp Ser Ala
165 170 175
Trp Gly Thr Ser Asp His Ser Val Ser Gln Pro Ile Met Val Gln Arg
180 185 190
Arg Pro Gly Gln Ser Phe His Val Asn Ser Glu Val Asn Ser Val Leu
195 200 205
Ser Pro Arg Ser Glu Ser Gly Gly Leu Gly Val Ser Met Val Glu Tyr
210 215 220
Val Leu Ser Ser Ser Pro Gly Asp Ser Cys Leu Arg Lys Gly Gly Phe
225 230 235 240
Gly Pro Arg Asp Ala Asp Ser Asp Glu Asn Asp Lys Gly Glu Lys Lys
245 250 255
Asn Lys Gly Thr Phe Asp Gly Asp Lys Leu Gly Asp Leu Lys Glu Glu
260 265 270
Gly Asp Val Met Asp Lys Thr Asn Gly Leu Pro Val Gln Asn Gly Ile
275 280 285
Asp Ala Asp Val Lys Asp Phe Ser Arg Thr Pro Gly Asn Cys Gln Asn
290 295 300
Ser Ala Asn Glu Val Asp Leu Leu Gly Pro Asn Gln Asn Gly Ser Glu
305 310 315 320
Gly Leu Ala Gln Leu Thr Ser Thr Asn Gly Ala Lys Pro Val Glu Asp
325 330 335
Phe Ser Asn Met Glu Ser Gln Ser Val Pro Leu Asp Pro Met Glu His
340 345 350
Val Gly Met Glu Pro Leu Gln Phe Asp Tyr Ser Gly Thr Gln Val Pro
355 360 365
Val Asp Ser Ala Ala Ala Thr Val Gly Leu Phe Asp Tyr Asn Ser Gln
370 375 380
Gln Gln Leu Phe Gln Arg Pro Asn Ala Leu Ala Val Gln Gln Leu Thr
385 390 395 400
Ala Ala Gln Gln Gln Gln Tyr Ala Leu Ala Ala Ala His Gln Pro His
405 410 415
Ile Gly Leu Ala Pro Ala Ala Phe Val Pro Asn Pro Tyr Ile Ile Ser
420 425 430
Ala Ala Pro Pro Gly Thr Asp Pro Tyr Thr Ala Gly Leu Ala Ala Ala
435 440 445
Ala Thr Leu Gly Pro Ala Val Val Pro His Gln Tyr Tyr Gly Val Thr
450 455 460
Pro Trp Gly Val Tyr Pro Ala Ser Leu Phe Gln Gln Gln Ala Ala Ala
465 470 475 480
Ala Ala Ala Ala Thr Asn Ser Ala Asn Gln Gln Thr Thr Pro Gln Ala
485 490 495
Gln Gln Gly Gln Gln Gln Val Leu Arg Gly Gly Ala Ser Gln Arg Pro
500 505 510
Leu Thr Pro Asn Gln Asn Gln Gln Gly Gln Gln Thr Asp Pro Leu Val
515 520 525
Ala Ala Ala Ala Val Asn Ser Ala Leu Ala Phe Gly Gln Gly Leu Ala
530 535 540
Ala Gly Met Pro Gly Tyr Pro Val Leu Ala Pro Ala Ala Tyr Tyr Asp
545 550 555 560
Gln Thr Gly Ala Leu Val Val Asn Ala Gly Ala Arg Asn Gly Leu Gly
565 570 575
Ala Pro Val Arg Leu Val Ala Pro Ala Pro Val Ile Ile Ser Ser Ser
580 585 590
Ala Ala Gln Ala Ala Val Ala Ala Ala Ala Ala Ser Ala Asn Gly Ala
595 600 605
Ala Gly Gly Leu Ala Gly Thr Thr Asn Gly Pro Phe Arg Pro Leu Gly
610 615 620
Thr Gln Gln Pro Gln Pro Gln Pro Gln Gln Gln Pro Asn Asn Asn Leu
625 630 635 640
Ala Ser Ser Ser Phe Tyr Gly Asn Asn Ser Leu Asn Ser Asn Ser Gln
645 650 655
Ser Ser Ser Leu Phe Ser Gln Gly Ser Ala Gln Pro Ala Asn Thr Ser
660 665 670
Leu Gly Phe Gly Ser Ser Ser Ser Leu Gly Ala Thr Leu Gly Ser Ala
675 680 685
Leu Gly Gly Phe Gly Thr Ala Gly Gly Leu Thr Asn Gly Ser Gly Arg
690 695 700
Tyr Ile Ser Ala Ala Pro Gly Ala Glu Ala Lys Tyr Arg Ser Ala Ser
705 710 715 720
Ser Ala Ser Ser Leu Phe Ser Pro Ser Ser Thr Leu Phe Ser Ser Ser
725 730 735
Arg Leu Arg Tyr Gly Met Ser Asp Val Met Pro Ser Gly Arg Ser Arg
740 745 750
Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg
755 760 765
Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser
770 775 780
Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln
785 790 795 800
Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp
805 810 815
Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu
820 825 830
Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser
835 840 845
Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala Leu Glu
850 855 860
Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly
865 870 875 880
His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val Val Gln
885 890 895
Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp
900 905 910
Ala Phe Lys Gly Gln Arg Val Ile Asp Ser Gln Ala Glu Lys Leu Lys
915 920 925
Glu Leu Asp Lys Glu Ile Arg Pro Phe Arg Gln Asn Trp Glu Glu Ala
930 935 940
Asp Ser Met Lys Ser Ser Val Glu Ser Leu Gln Asn Arg Val Thr Glu
945 950 955 960
Leu Glu Ser Val Asp Lys Ser Ala Gly Gln Val Ala Arg Asn Thr Gly
965 970 975
Leu Leu Glu Ser Gln Leu Ser Arg His Asp Gln Met Leu Ser Val His
980 985 990
Asp Ile Arg Leu Ala Asp Met Asp Leu Arg Phe Gln Val Leu Glu Thr
995 1000 1005
Ala Ser Tyr Asn Gly Val Leu Ile Trp Lys Ile Arg Asp Tyr Lys Arg
1010 1015 1020
Arg Lys Gln Glu Ala Val Met Gly Lys Thr Leu Ser Leu Tyr Ser Gln
1025 1030 1035 1040
Pro Phe Tyr Thr Gly Tyr Phe Gly Tyr Lys Met Cys Ala Arg Val Tyr
1045 1050 1055
Leu Asn Gly Asp Gly Met Gly Lys Gly Thr His Leu Ser Leu Phe Phe
1060 1065 1070
Val Ile Met Arg Gly Glu Tyr Asp Ala Leu Leu Pro Trp Pro Phe Lys
1075 1080 1085
Gln Lys Val Thr Leu Met Leu Met Asp Gln Gly Ser Ser Arg Arg His
1090 1095 1100
Leu Gly Asp Ala Phe Lys Pro Asp Pro Asn Ser Ser Ser Phe Lys Lys
1105 1110 1115 1120
Pro Thr Gly Glu Met Asn Ile Ala Ser Gly Cys Pro Val Phe Val Ala
1125 1130 1135
Gln Thr Val Leu Glu Asn Gly Thr Tyr Ile Lys Asp Asp Thr Ile Phe
1140 1145 1150
Ile Lys Val Ile Val Asp Thr Ser Asp Leu Pro Asp Pro
1155 1160 1165
<210> 8
<211> 3732
<212> DNA
<213> Artificial Sequence
<220>
<223> PUM1-TRAF3 fusion gene of Homo sapiens
<400> 8
atgagcgttg catgtgtctt gaagagaaaa gcagtgcttt ggcaggactc tttcagcccc 60
cacctgaaac atcaccctca agaaccagct aatcccaaca tgcctgttgt tttgacatct 120
ggaacagggt cgcaagcgca gccacaacca gctgcaaatc aggctcttgc agctgggact 180
cactccagcc ctgtcccagg atctatagga gttgcaggcc gttcccagga cgacgctatg 240
gtggactact tctttcagag gcagcatggt gagcagcttg ggggaggagg aagtggagga 300
ggcggctata ataatagcaa acatcgatgg cctactgggg ataacattca tgcagaacat 360
caggtgcgtt ccatggatga actgaatcat gattttcaag cacttgctct ggagggaaga 420
gcgatgggag agcagctctt gccaggtaaa aagttttggg aaacagatga atccagcaaa 480
gatggaccaa aaggaatatt cctgggtgat caatggcgag acagtgcctg gggaacatca 540
gatcattcag tttcccagcc aatcatggtg cagagaagac ctggtcagag tttccatgtg 600
aacagtgagg tcaattctgt actgtcccca cgatcggaga gtgggggact aggcgttagc 660
atggtggagt atgtgttgag ctcatccccg ggcgattcct gtctaagaaa aggaggattt 720
ggcccaaggg atgcagacag tgatgaaaac gacaaaggtg aaaagaagaa caagggtacg 780
tttgatggag ataagctagg agatttgaag gaggagggtg atgtgatgga caagaccaat 840
ggtttaccag tgcagaatgg gattgatgca gacgtcaaag attttagccg tacccctggt 900
aattgccaga actctgctaa tgaagtggat cttctgggtc caaaccagaa tggttctgag 960
ggcttagccc agctgaccag caccaatggt gccaagcctg tggaggattt ctccaacatg 1020
gagtcccaga gtgtcccctt ggaccccatg gaacatgtgg gcatggagcc tcttcagttt 1080
gattattcag gcacgcaggt acctgtggac tcagcagcag caactgtggg actttttgac 1140
tacaattctc aacaacagct gttccaaaga cctaatgcgc ttgctgtcca gcagttgaca 1200
gctgctcagc agcagcagta tgcactggca gctgctcatc agccgcacat cggtttagct 1260
cccgctgcgt ttgtccccaa tccatacatc atcagcgctg ctcccccagg gacggacccc 1320
tacacagctg gattggctgc agcagcgaca ctaggcccag ctgtggtccc tcaccagtat 1380
tatggagtta ctccctgggg agtctaccct gccagtcttt tccagcagca agctgccgct 1440
gccgctgcag caactaattc agctaatcaa cagaccaccc cacaggctca gcaaggacag 1500
cagcaggttc tccgtggagg agccagccaa cgtcctttga ccccaaacca gaaccagcag 1560
ggacagcaaa cggatcccct tgtggcagct gcagcagtga attctgccct tgcatttgga 1620
caaggtctgg cagcaggcat gccaggttat ccggtgttgg ctcctgctgc ttactatgac 1680
caaactggtg cccttgtagt gaatgcaggc gcgagaaatg gtcttggagc tcctgttcga 1740
cttgtagctc ctgccccagt catcattagt tcctcagctg cacaagcagc tgttgcagca 1800
gccgcagctt cagcaaatgg agcagctggt ggtcttgctg gaacaacaaa tggaccattt 1860
cgccctttag gaacacagca gcctcagccc cagccccagc agcagcccaa taacaacctg 1920
gcatccagtt ctttctacgg caacaactct ctgaacagca attcacagag cagctccctc 1980
ttctcccagg gctctgccca gcctgccaac acatccttgg gattcggaag tagcagttct 2040
ctcggcgcca ccctgggatc cgcccttgga gggtttggaa cagcagttgc aaactccaac 2100
actggcagtg gctcccgccg tgactccctg actggcagca gtgaccttta taagaggaca 2160
tcgagcagct tgacccccat tggacacagt ttttataacg gccttagctt ttcctcctct 2220
cctggacccg tgggcatgcc tctccctagt cagggaccag gacattcaca gacaccacct 2280
ccttccctct cttcacatgg atcctcttca agcttaaacc tgggaggact cacgaatggc 2340
agtggaagat acatctctgc tgctccaggc gctgaagcca agtaccgcag tgcaagcagc 2400
gcctccagcc tcttcagccc gagcagcact cttttctctt cctctcgttt gcgatatgga 2460
atgtctgatg tcatgccttc tggcaggagc aggcttttgg aagattttcg aaacaaccgg 2520
taccccaatt tacaactgcg ggagattgct ggacatataa tggaattttc ccaagaccag 2580
catgggtcca gattcattca gctgaaactg gagcgtgcca caccagctga gcgccagctt 2640
gtcttcaatg aaatcctcca ggctgcctac caactcatgg tggatgtgtt tggtaattac 2700
gtcattcaga agttctttga atttggcagt cttgaacaga agctggcttt ggcagaacgg 2760
attcgaggcc acgtcctgtc attggcacta cagatgtatg gctgccgtgt tatccagaaa 2820
gctcttgagt ttattccttc agaccagcag aatgagatgg ttcgggaact agatggccat 2880
gtcttgaagt gtgtgaaaga tcagaatggc aatcacgtgg ttcagaaatg cattgaatgt 2940
gtacagcccc agtctttgca atttatcatc gatgcgttta agggacagcg agtgatagac 3000
agccaagcag agaaactgaa ggagcttgac aaggagatcc ggcccttccg gcagaactgg 3060
gaggaagcag acagcatgaa gagcagcgtg gagtccctcc agaaccgcgt gaccgagctg 3120
gagagcgtgg acaagagcgc ggggcaagtg gctcggaaca caggcctgct ggagtcccag 3180
ctgagccggc atgaccagat gctgagtgtg cacgacatcc gcctagccga catggacctg 3240
cgcttccagg tcctggagac cgccagctac aatggagtgc tcatctggaa gattcgcgac 3300
tacaagcggc ggaagcagga ggccgtcatg gggaagaccc tgtcccttta cagccagcct 3360
ttctacactg gttactttgg ctataagatg tgtgccaggg tctacctgaa cggggacggg 3420
atggggaagg ggacgcactt gtcgctgttt tttgtcatca tgcgtggaga atatgatgcc 3480
ctgcttcctt ggccgtttaa gcagaaagtg acactcatgc tgatggatca ggggtcctct 3540
cgacgtcatt tgggagatgc attcaagccc gaccccaaca gcagcagctt caagaagccc 3600
actggagaga tgaatatcgc ctctggctgc ccagtctttg tggcccaaac tgttctagaa 3660
aatgggacat atattaaaga tgatacaatt tttattaaag tcatagtgga tacttcggat 3720
ctgcccgatc cc 3732
<210> 9
<211> 3495
<212> DNA
<213> Artificial Sequence
<220>
<223> PUM1-TRAF3 fusion gene of Homo sapiens
<400> 9
atgagcgttg catgtgtctt gaagagaaaa gcagtgcttt ggcaggactc tttcagcccc 60
cacctgaaac atcaccctca agaaccagct aatcccaaca tgcctgttgt tttgacatct 120
ggaacagggt cgcaagcgca gccacaacca gctgcaaatc aggctcttgc agctgggact 180
cactccagcc ctgtcccagg atctatagga gttgcaggcc gttcccagga cgacgctatg 240
gtggactact tctttcagag gcagcatggt gagcagcttg ggggaggagg aagtggagga 300
ggcggctata ataatagcaa acatcgatgg cctactgggg ataacattca tgcagaacat 360
caggtgcgtt ccatggatga actgaatcat gattttcaag cacttgctct ggagggaaga 420
gcgatgggag agcagctctt gccaggtaaa aagttttggg aaacagatga atccagcaaa 480
gatggaccaa aaggaatatt cctgggtgat caatggcgag acagtgcctg gggaacatca 540
gatcattcag tttcccagcc aatcatggtg cagagaagac ctggtcagag tttccatgtg 600
aacagtgagg tcaattctgt actgtcccca cgatcggaga gtgggggact aggcgttagc 660
atggtggagt atgtgttgag ctcatccccg ggcgattcct gtctaagaaa aggaggattt 720
ggcccaaggg atgcagacag tgatgaaaac gacaaaggtg aaaagaagaa caagggtacg 780
tttgatggag ataagctagg agatttgaag gaggagggtg atgtgatgga caagaccaat 840
ggtttaccag tgcagaatgg gattgatgca gacgtcaaag attttagccg tacccctggt 900
aattgccaga actctgctaa tgaagtggat cttctgggtc caaaccagaa tggttctgag 960
ggcttagccc agctgaccag caccaatggt gccaagcctg tggaggattt ctccaacatg 1020
gagtcccaga gtgtcccctt ggaccccatg gaacatgtgg gcatggagcc tcttcagttt 1080
gattattcag gcacgcaggt acctgtggac tcagcagcag caactgtggg actttttgac 1140
tacaattctc aacaacagct gttccaaaga cctaatgcgc ttgctgtcca gcagttgaca 1200
gctgctcagc agcagcagta tgcactggca gctgctcatc agccgcacat cggtttagct 1260
cccgctgcgt ttgtccccaa tccatacatc atcagcgctg ctcccccagg gacggacccc 1320
tacacagctg gattggctgc agcagcgaca ctaggcccag ctgtggtccc tcaccagtat 1380
tatggagtta ctccctgggg agtctaccct gccagtcttt tccagcagca agctgccgct 1440
gccgctgcag caactaattc agctaatcaa cagaccaccc cacaggctca gcaaggacag 1500
cagcaggttc tccgtggagg agccagccaa cgtcctttga ccccaaacca gaaccagcag 1560
ggacagcaaa cggatcccct tgtggcagct gcagcagtga attctgccct tgcatttgga 1620
caaggtctgg cagcaggcat gccaggttat ccggtgttgg ctcctgctgc ttactatgac 1680
caaactggtg cccttgtagt gaatgcaggc gcgagaaatg gtcttggagc tcctgttcga 1740
cttgtagctc ctgccccagt catcattagt tcctcagctg cacaagcagc tgttgcagca 1800
gccgcagctt cagcaaatgg agcagctggt ggtcttgctg gaacaacaaa tggaccattt 1860
cgccctttag gaacacagca gcctcagccc cagccccagc agcagcccaa taacaacctg 1920
gcatccagtt ctttctacgg caacaactct ctgaacagca attcacagag cagctccctc 1980
ttctcccagg gctctgccca gcctgccaac acatccttgg gattcggaag tagcagttct 2040
ctcggcgcca ccctgggatc cgcccttgga gggtttggaa cagcaggagg actcacgaat 2100
ggcagtggaa gatacatctc tgctgctcca ggcgctgaag ccaagtaccg cagtgcaagc 2160
agcgcctcca gcctcttcag cccgagcagc actcttttct cttcctctcg tttgcgatat 2220
ggaatgtctg atgtcatgcc ttctggcagg agcaggcttt tggaagattt tcgaaacaac 2280
cggtacccca atttacaact gcgggagatt gctggacata taatggaatt ttcccaagac 2340
cagcatgggt ccagattcat tcagctgaaa ctggagcgtg ccacaccagc tgagcgccag 2400
cttgtcttca atgaaatcct ccaggctgcc taccaactca tggtggatgt gtttggtaat 2460
tacgtcattc agaagttctt tgaatttggc agtcttgaac agaagctggc tttggcagaa 2520
cggattcgag gccacgtcct gtcattggca ctacagatgt atggctgccg tgttatccag 2580
aaagctcttg agtttattcc ttcagaccag cagaatgaga tggttcggga actagatggc 2640
catgtcttga agtgtgtgaa agatcagaat ggcaatcacg tggttcagaa atgcattgaa 2700
tgtgtacagc cccagtcttt gcaatttatc atcgatgcgt ttaagggaca gcgagtgata 2760
gacagccaag cagagaaact gaaggagctt gacaaggaga tccggccctt ccggcagaac 2820
tgggaggaag cagacagcat gaagagcagc gtggagtccc tccagaaccg cgtgaccgag 2880
ctggagagcg tggacaagag cgcggggcaa gtggctcgga acacaggcct gctggagtcc 2940
cagctgagcc ggcatgacca gatgctgagt gtgcacgaca tccgcctagc cgacatggac 3000
ctgcgcttcc aggtcctgga gaccgccagc tacaatggag tgctcatctg gaagattcgc 3060
gactacaagc ggcggaagca ggaggccgtc atggggaaga ccctgtccct ttacagccag 3120
cctttctaca ctggttactt tggctataag atgtgtgcca gggtctacct gaacggggac 3180
gggatgggga aggggacgca cttgtcgctg ttttttgtca tcatgcgtgg agaatatgat 3240
gccctgcttc cttggccgtt taagcagaaa gtgacactca tgctgatgga tcaggggtcc 3300
tctcgacgtc atttgggaga tgcattcaag cccgacccca acagcagcag cttcaagaag 3360
cccactggag agatgaatat cgcctctggc tgcccagtct ttgtggccca aactgttcta 3420
gaaaatggga catatattaa agatgataca atttttatta aagtcatagt ggatacttcg 3480
gatctgcccg atccc 3495
<210> 10
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for ASH1L
<400> 10
cgagctgagg aaaaaggttg 20
<210> 11
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for ASH1L
<400> 11
ctccgatgat tcctcgacat 20
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for DOCK7
<400> 12
ctgtggattc tgggccttta 20
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for DOCK7
<400> 13
ggaagcaaag catcaggaag 20
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for ASH1L-DOCK7
<400> 14
ccttctgaaa ccccagctaa 20
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for ASH1L-DOCK7
<400> 15
agcaatcgtg ctgacaagag 20
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for PUM1
<400> 16
cggtcgtcct gaggataaaa 20
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for PUM1
<400> 17
tacgaagagt tgcgatgtgg 20
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for deletion form of PUM1
<400> 18
cggcaacaac tctctgaaca 20
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for deletion form of PUM1
<400> 19
atcgcaaacg agaggaagag 20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for TRAF3
<400> 20
tgctgagctc ttcaagtcca 20
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for TRAF3
<400> 21
tcggtgtctt cgtgtttctg 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for PUM1-TRAF3
<400> 22
tgtatggctg ccgtgttatc 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for PUM1-TRAF3
<400> 23
atgtcgtgca cactcagcat 20
Claims (11)
- 하기의 융합 단백질에 특이적으로 결합하는 항체, 올리고펩티드, 리간드, PNA(Peptide nucleic acid) 또는 앱타머(aptamer); 또는 상기 융합 단백질을 암호화하는 융합 유전자에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 담도암 진단용 키트:
(ⅰ) 5' 쪽에 ASH1L(Histone-lysine N-methyltransferase ASH1L) 유전자의 5' 쪽 단편 서열을 가지며, 3' 쪽에는 DOCK7(Dedicator of cytokinesis protein 7) 유전자의 3' 쪽 단편 서열의 5' 쪽 단편 서열을 갖는 ASH1L-DOCK7 융합 유전자에 의하여 암호화된 ASH1L-DOCK7 융합 단백질;
(ⅱ) 5' 쪽에 ASH1L(Histone-lysine N-methyltransferase ASH1L) 유전자의 5' 쪽 단편 서열의 3' 쪽 단편 서열을 가지며, 3' 쪽에는 DOCK7(Dedicator of cytokinesis protein 7) 유전자의 3' 쪽 단편 서열을 갖는 ASH1L-DOCK7 융합 유전자에 의하여 암호화된 ASH1L-DOCK7 융합 단백질;
(ⅲ) 5' 쪽에 3'-말단이 절단된 PUM1(pumilio RNA binding family member 1) 유전자의 단편 서열을 가지며, 3' 쪽에는 TRAF3(TNF receptor associated factor 3) 유전자의 3' 쪽 단편 서열을 갖는 PUM1-TRAF3 융합 유전자에 의하여 암호화된 PUM1-TRAF3 융합 단백질; 또는
(ⅳ) 5' 쪽에 3'-말단이 절단되고, 엑손14가 결실된 PUM1(pumilio RNA binding family member 1) 유전자의 단편 서열을 가지며, 3' 쪽에는 TRAF3(TNF receptor associated factor 3) 유전자의 3' 쪽 단편 서열을 갖는 PUM1-TRAF3 융합 유전자에 의하여 암호화된 PUM1-TRAF3 융합 단백질.
- 담도암 진단용 마커인 하기의 융합 단백질에 특이적으로 결합하는 항체, 올리고펩티드, 리간드, PNA(Peptide nucleic acid) 또는 앱타머(aptamer); 또는 상기 융합 단백질을 암호화하는 융합 유전자에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 담도암 진단용 마커 검출용 키트:
(ⅰ) 5' 쪽에 ASH1L(Histone-lysine N-methyltransferase ASH1L) 유전자의 5' 쪽 단편 서열을 가지며, 3' 쪽에는 DOCK7(Dedicator of cytokinesis protein 7) 유전자의 3' 쪽 단편 서열의 5' 쪽 단편 서열을 갖는 ASH1L-DOCK7 융합 유전자에 의하여 암호화된 ASH1L-DOCK7 융합 단백질;
(ⅱ) 5' 쪽에 ASH1L(Histone-lysine N-methyltransferase ASH1L) 유전자의 5' 쪽 단편 서열의 3' 쪽 단편 서열을 가지며, 3' 쪽에는 DOCK7(Dedicator of cytokinesis protein 7) 유전자의 3' 쪽 단편 서열을 갖는 ASH1L-DOCK7 융합 유전자에 의하여 암호화된 ASH1L-DOCK7 융합 단백질;
(ⅲ) 5' 쪽에 3'-말단이 절단된 PUM1(pumilio RNA binding family member 1) 유전자의 단편 서열을 가지며, 3' 쪽에는 TRAF3(TNF receptor associated factor 3) 유전자의 3' 쪽 단편 서열을 갖는 PUM1-TRAF3 융합 유전자에 의하여 암호화된 PUM1-TRAF3 융합 단백질; 또는
(ⅳ) 5' 쪽에 3'-말단이 절단되고, 엑손14가 결실된 PUM1(pumilio RNA binding family member 1) 유전자의 단편 서열을 가지며, 3' 쪽에는 TRAF3(TNF receptor associated factor 3) 유전자의 3' 쪽 단편 서열을 갖는 PUM1-TRAF3 융합 유전자에 의하여 암호화된 PUM1-TRAF3 융합 단백질.
- 제 1 항 또는 제 2 항에 있어서, 상기 ASH1L-DOCK7 융합 단백질은 서열목록 제1서열 또는 제2서열의 아미노산 서열을 갖는 것을 특징으로 하는 키트.
- 제 3 항에 있어서, 상기 ASH1L-DOCK7 융합 단백질을 암호화하는 융합 유전자는 서열목록 제3서열, 제4서열 또는 제5서열의 뉴클레오티드 서열을 갖는 것을 특징으로 하는 키트.
- 제 1 항 또는 제 2 항에 있어서, 상기 PUM1-TRAF3 융합 단백질은 서열목록 제6서열 또는 제7서열의 아미노산 서열을 갖는 것을 특징으로 하는 키트.
- 제 5 항에 있어서, 상기 서열목록 제6서열의 PUM1-TRAF3 융합 단백질을 암호화하는 융합 유전자는 서열목록 제8서열의 뉴클레오티드 서열을 갖는 것을 특징으로 하는 키트.
- 제 5 항에 있어서, 상기 서열목록 제7서열의 PUM1-TRAF3 융합 단백질을 암호화하는 융합 유전자는 서열목록 제9서열의 뉴클레오티드 서열을 갖는 것을 특징으로 하는 키트.
- 담도암 진단에 필요한 정보를 제공하기 위하여, 생물학적 시료 내에 있는 하기의 융합 단백질 또는 상기 융합 단백질을 암호화하는 융합 유전자를 검출하는 단계를 통하여 담도암 진단용 마커를 검출하는 방법:
(ⅰ) 5' 쪽에 ASH1L(Histone-lysine N-methyltransferase ASH1L) 유전자의 5' 쪽 단편 서열을 가지며, 3' 쪽에는 DOCK7(Dedicator of cytokinesis protein 7) 유전자의 3' 쪽 단편 서열의 5' 쪽 단편 서열을 갖는 ASH1L-DOCK7 융합 유전자에 의하여 암호화된 ASH1L-DOCK7 융합 단백질;
(ⅱ) 5' 쪽에 ASH1L(Histone-lysine N-methyltransferase ASH1L) 유전자의 5' 쪽 단편 서열의 3' 쪽 단편 서열을 가지며, 3' 쪽에는 DOCK7(Dedicator of cytokinesis protein 7) 유전자의 3' 쪽 단편 서열을 갖는 ASH1L-DOCK7 융합 유전자에 의하여 암호화된 ASH1L-DOCK7 융합 단백질;
(ⅲ) 5' 쪽에 3'-말단이 절단된 PUM1(pumilio RNA binding family member 1) 유전자의 단편 서열을 가지며, 3' 쪽에는 TRAF3(TNF receptor associated factor 3) 유전자의 3' 쪽 단편 서열을 갖는 PUM1-TRAF3 융합 유전자에 의하여 암호화된 PUM1-TRAF3 융합 단백질; 또는
(ⅳ) 5' 쪽에 3'-말단이 절단되고, 엑손14가 결실된 PUM1(pumilio RNA binding family member 1) 유전자의 단편 서열을 가지며, 3' 쪽에는 TRAF3(TNF receptor associated factor 3) 유전자의 3' 쪽 단편 서열을 갖는 PUM1-TRAF3 융합 유전자에 의하여 암호화된 PUM1-TRAF3 융합 단백질.
- 제 8 항에 있어서, 상기 생물학적 시료는 조직, 세포 또는 이의 배양액, 혈액, 혈청 및 혈장으로 구성된 군으로부터 선택되는 것을 특징으로 하는 방법.
- 제 8 항에 있어서, 상기 방법은 항원-항체 반응 방식으로 실시되는 것을 특징으로 하는 방법.
- 제 8 항에 있어서, 상기 방법은 유전자 증폭 방식으로 실시되는 것을 특징으로 하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160054201A KR20170124683A (ko) | 2016-05-02 | 2016-05-02 | 담도암 진단용 신규 바이오마커로서의 융합 유전자 및 융합 단백질 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160054201A KR20170124683A (ko) | 2016-05-02 | 2016-05-02 | 담도암 진단용 신규 바이오마커로서의 융합 유전자 및 융합 단백질 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20170124683A true KR20170124683A (ko) | 2017-11-13 |
Family
ID=60385982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160054201A KR20170124683A (ko) | 2016-05-02 | 2016-05-02 | 담도암 진단용 신규 바이오마커로서의 융합 유전자 및 융합 단백질 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20170124683A (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023101457A1 (ko) * | 2021-12-01 | 2023-06-08 | 연세대학교 산학협력단 | 담도암의 예방 또는 치료용 조성물 |
KR20240063787A (ko) | 2022-11-03 | 2024-05-10 | 부산대학교 산학협력단 | 담도암 진단용 바이오마커 조성물 및 이를 이용한 담도암 진단을 위한 정보를 제공하는 방법 |
-
2016
- 2016-05-02 KR KR1020160054201A patent/KR20170124683A/ko not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023101457A1 (ko) * | 2021-12-01 | 2023-06-08 | 연세대학교 산학협력단 | 담도암의 예방 또는 치료용 조성물 |
KR20240063787A (ko) | 2022-11-03 | 2024-05-10 | 부산대학교 산학협력단 | 담도암 진단용 바이오마커 조성물 및 이를 이용한 담도암 진단을 위한 정보를 제공하는 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2456889T3 (en) | Markers of endometrial cancer | |
US20110224313A1 (en) | Compositions and methods for classifying lung cancer and prognosing lung cancer survival | |
JP7150018B2 (ja) | 新規なcip2aバリアント及びその使用 | |
KR20170124683A (ko) | 담도암 진단용 신규 바이오마커로서의 융합 유전자 및 융합 단백질 | |
KR20120004286A (ko) | 림프종 진단 또는 예후 마커로서 Pellino 1 | |
KR101054952B1 (ko) | 간암 진단 및 환자 생존기간 예측용 마커인 uqcrh, 그를 포함하는 키트 및 상기 마커를 이용한 간암 환자 생존기간 예측 | |
WO2012115493A2 (ko) | 암에 대한 바이오마커 및 이를 이용한 암 진단 | |
WO2015194524A1 (ja) | B前駆細胞性急性リンパ芽球性白血病新規キメラ遺伝子 | |
US20070264651A1 (en) | Methods, compositions, and kits for the detection and monitoring of kidney cancer | |
JP2009535033A5 (ko) | ||
KR101054953B1 (ko) | 간암을 진단 및 치료하기 위한 분자인 snx14, 그를 포함하는 키트 | |
US20070281895A1 (en) | Molecular Marker | |
KR101683961B1 (ko) | 방광암 재발 진단 마커 | |
JP5467256B2 (ja) | 消化器癌検出用血清腫瘍マーカー、消化器癌検出キット、および消化器癌検出方法 | |
KR20190037071A (ko) | 대장암의 항암제 내성 진단용 바이오마커 및 이의 용도 | |
KR20190026179A (ko) | 간암 예후진단을 위한 바이오 마커로서의 sord | |
JP5055543B2 (ja) | 新規癌検出方法、癌検出器具、および癌検出キット | |
KR101917677B1 (ko) | 폐암의 예후 예측용 바이오 마커로서 메티오닐-티알엔에이 합성효소(mrs)의 유용성 | |
KR101054951B1 (ko) | 간암을 진단 및 치료하기 위한 분자인 capn12, 그를 포함하는 키트 | |
KR101093508B1 (ko) | 대장암 진단용 조성물 및 그 용도 | |
KR20100086362A (ko) | 간암 진단 마커인 apoa1, 그를 포함하는 키트 | |
JP2007503826A (ja) | 乳癌のリスクの診断 | |
TW201015069A (en) | Markers for detection of gastric cancer | |
KR20140095027A (ko) | 알츠하이머 질환에 대한 바이오마커 및 이를 이용한 알츠하이머 질환 진단 방법 | |
KR20110036557A (ko) | 대장암 진단용 조성물 및 그 용도 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |