KR20180075265A

KR20180075265A - 항암제 내성 특이 유전자 및 이의 용도

Info

Publication number: KR20180075265A
Application number: KR1020160179400A
Authority: KR
Inventors: 박성수; 이상혁
Original assignee: 성균관대학교산학협력단; 이화여자대학교 산학협력단
Priority date: 2016-12-26
Filing date: 2016-12-26
Publication date: 2018-07-04

Abstract

본 발명은 항암제 내성 조절 유전자 및 이의 용도에 관한 것이다. 본 발명에 따른 조성물은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하며, 상기 유전자의 발현 억제에 의한 항암제 내성 획득 및 암세포 생존율 증가를 실험적으로 확인하였는바, 암 치료에 있어서, 보다 효과적으로 접근하여 타겟 치료할 수 있을 것으로 기대된다.

Description

항암제 내성 특이 유전자 및 이의 용도 {Gene that is specific to anti-cancer drug resistance and use thereof}

본 발명은 항암제 내성 관련 특이 유전자 및 이의 용도로서, 보다 구체적으로 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물 및 이를 이용한 스크리닝 방법에 관한 것이다.

암은 우리나라 성인의 사망 원인 중 1위 또는 2위를 다투는 중요한 질병으로서, 많은 연구에도 불구하고 암 환자의 약 과반수 가량이 결국에는 사망에 이르고 있다. 현재까지 유효한 것으로 알려져 있는 암 치료 방법으로는 수술, 방사사선 항암제 치료법이 있으며, 이 중에서 수술과 방사선 치료법은 절제 부위 또는 방사선 조사부위에만 효과가 있는 국소 요법이고, 항암제 치료 요법은 전신에 효과를 나타내는 전신 요법이라는 점에서 차이가 있다.

현재까지 많은 항암제의 개발에도 불구하고, 항암제만으로 완치가 가능한 암은 백혈병, 악성 림프종, 고환암 등 소수의 암에 불과하며, 이는 항암제를 이용한 암 치료시 항암제에 암세포가 반응을 하지 않거나 초기에는 효과적으로 종양이 줄어들지만 치료 도중 또는 치료 후에 항암제 치료에 대한 내성이 생기기 때문이다. 항암제 내성이란, 항암제를 이용하여 암 환자를 치료할 때, 치료 초기부터 치료 효과가 없거나 초기에는 암 치료 효과가 있었으나, 계속적인 치료 과정에서 암 치료 효과가 상실되는 것을 의미한다. 이 경우, 치료에 사용된 항암제 뿐 아니라, 다른 종류의 항암제에 대해서도 내성을 나타내는 이른바, 다중 약제 내성 (MDR; multi-drug resistance)을 나타내기 때문에 일단 암세포가 항암제에 대한 내성을 획득하면, 이 후, 암 치료에 있어서 큰 어려움을 겪고 있는 실정이다.

따라서, 효과적인 항암제 치료를 위해서는 상기와 같은 항암제에 대한 암세포 내성을 극복해야 하며, 이를 위해서는 항암제에 대한 암세포의 내성에 관련된 유전자를 규명할 필요가 있다. 지금까지 P-당단백질 (P-glycoprotein : PgP), 다약제 내성 관련 단백질 (Multidrug Resistance-associated Protein, MRP) 등이 항암제 내성 관련 인자로 알려져 있으며, 이에 대한 다양한 연구가 진행되고 있으나, (한국 특허공개번호 10-2007-0101610), 아직 미비한 실정이다.

본 발명은 상기와 같은 암 치료의 문제점을 해결하기 위해 안출된 것으로서, 본 발명자들은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현 억제에 의한 항암제 내성 촉진 효과를 확인하고 이에 기초하여 본 발명을 완성하게 되었다.

이에, 본 발명의 목적은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물을 제공하는 것이다.

또한, 본 발명의 다른 목적은 a) in vitro 상에서 암세포에 후보 물질을 처리하는 단계; b) 상기 암세포의 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 측정하는 단계; 및 c) 비처리군에 비해 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 증진시키는 물질을 항암제 내성 억제물질로 선정하는 단계를 포함하는, 항암제 내성 억제물질 스크리닝 방법을 제공한다.

그러나 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.

상기와 같은 본 발명의 목적을 달성하기 위하여, 본 발명은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물을 제공한다.

본 발명의 일 구현예로서, 상기 CARD6 단백질은 서열번호 1로 이루어질 수 있다.

본 발명의 다른 구현예로서, 상기 CARD6 단백질을 코딩하는 유전자는 서열번호 2로 이루어질 수 있다.

본 발명의 또 다른 구현예로서, 상기 NSD1 단백질은 서열번호 3 또는 4로 이루어질 수 있다.

본 발명의 또 다른 구현예로서, 상기 NSD1 단백질을 코딩하는 유전자는 서열번호 5 또는 6으로 이루어질 수 있다.

본 발명의 또 다른 구현예로서, 상기 항암제는 독소루비신 (doxorubicin)일 수 있다.

본 발명의 또 다른 구현예로서, 상기 조성물은 교아세포종 (glioblastoma)에 적용될 수 있다.

또한, 본 발명은 a) in vitro 상에서 암세포에 후보 물질을 처리하는 단계; b) 상기 암세포의 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 측정하는 단계; 및 c) 비처리군에 비해 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 증진시키는 물질을 항암제 내성 억제물질로 선정하는 단계를 포함하는, 항암제 내성 억제물질 스크리닝 방법을 제공한다.

본 발명의 일 구현예로서, 상기 암세포는 교아세포종 (glioblastoma) 세포일 수 있다.

본 발명은 상기 약학적 조성물을 개체에 투여하는 단계를 포함하는 암의 치료방법을 제공한다.

본 발명은 상기 약학적 조성물의 암의 치료용도를 제공한다.

본 발명에 따른 조성물은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하며, 상기 유전자의 발현 억제에 의한 항암제 내성 획득 및 암세포의 생존율 증가를 실험적으로 확인하였는바, 항암제 내성 억제 및 이를 통한 암 치료에 유용하게 사용될 수 있을 것으로 기대된다.

도 1은 항암제 내성 유전자 도출을 위한 엑솜 염기서열 분석 (Exome sequencing)의 개략적인 모식도이다.
도 2는 4 가지 분석 프로그램 (MuTect, Strelka, VarScan2, 및 Virmid)에서 항암제 내성 세포 내 단일 염기 다형성 (single nucleotide polymorphism, SNP) 검출 결과를 밴다이어그램으로 나타낸 도이다.
도 3은 내성 세포에서 CARD6의 stop-gain 돌연변이를 확인한 결과를 나타낸 것이다.
도 4는 CARD6 넉다운 (Knock down) 세포들의 독소루비신 내성촉진효과를 확인한 결과를 나타낸 것이다.
도 5는 CARD6 관련 siRNA의 효율을 확인한 결과를 나타낸 것이다.
도 6은 NSD1에서 missense 돌연변이를 확인한 결과를 나타낸 것이다.
도 7은 NSD1 넉다운 (Knock down) 세포들의 독소루비신 내성촉진효과를 확인한 결과를 나타낸 것이다.
도 8은 NSD1 관련 siRNA의 효율을 확인한 결과를 나타낸 것이다.

본 발명자들은, 항암제 내성과 관련된 유전자 변이를 확인하고자 항암제 내성 암세포의 엑솜 염기서열 분석 (Exome sequencing)을 실시하였다. 그 결과, 상기 암세포에서 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1)의 변이를 관찰하였으며, 상기 유전자를 넉다운 (knock down)시킨 경우, 항암제에 대한 내성이 증가됨을 실험적으로 확인하고, 이에 기초하여 본 발명을 완성하였다.

이하 본 발명을 상세히 설명한다.

본 발명은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물을 제공한다.

본 발명에서 사용되는 용어, "항암제"란, 종양의 치료를 위하여 사용되는 화학 요법제를 총칭하는 것으로서, 암세포의 각종 대사경로에 개입하여 주로 핵산의 합성을 억제하거나 항암활성을 나타내는 물질을 의미한다. 다만, 항암제를 이용한 치료가 장기화되는 과정에서 암세포가 항암제에 대한 내성을 획득하게 되어 암 치료 효율을 떨어지게 하는바, 항암제 내성은 암 치료에 있어서 어려움을 겪고 있는 실정이다. 본 발명에서, 항암제는 바람직하게는 독소루비신 (doxorubicin)일 수 있으나, 이에 제한되는 것은 아니다.

또한, 본 발명의 조성물은 교아세포종 (glioblastoma)에 적용될 수 있으나, 항암제 내성을 나타내는 암세포라면 제한 없이 적용될 수 있다.

본 발명에서 사용되는 용어, "항암제 내성"이란, 항암제를 이용한 암 치료에서, 치료 초기부터 치료 효과가 없거나 초기에는 암 치료 효과가 있었으나, 계속적인 치료 과정에서 암 치료 효과가 상실되는 것을 의미한다. 이에, 본 발명자들은 암 치료의 커다란 걸림돌인 항암제 내성을 극복하고자 항암제 내성과 관련된 유전자를 규명하고자 하였다.

그 결과, 항암제 내성 세포에서, stop-gain 변이된 CARD6 (caspase activation and recruitment domain family, member 6)유전자, missense 변이된 NSD1 (nuclear receptor binding SET domain protein 1)유전자를 확인하였다. 상기 CARD6 단백질은 서열번호 1, CARD6 단백질을 코딩하는 유전자는 서열번호 2로 이루어질 수 있고, 상기 NSD1 단백질은 서열번호 3 또는 4, NSD1 단백질을 코딩하는 유전자는 서열번호 5 또는 6으로 이루어질 수 있으며, 상기 염기서열의 상동체가 본 발명의 범위 내에 포함된다. 구체적으로, 상기 유전자는 서열번호 1 또는 2의 염기서열과 각각 70% 이상, 바람직하게는 80% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 서열 상동성을 가지는 염기서열을 포함할 수 있다.

본 발명의 약학적 조성물은 약제학적으로 허용되는 담체를 더 포함할 수도 있다. 본 발명의 약학적 조성물에 포함되는 약제학적으로 허용되는 담체는 제제 시에 통상적으로 이용되는 것으로서, 락토스, 덱스트로스, 수크로스, 솔비톨, 만니톨, 전분, 아카시아 고무, 인산 칼슘, 알기네이트, 젤라틴, 규산 칼슘, 미세 결정성셀룰로스, 폴리비닐피롤리돈, 셀룰로스, 물, 시럽, 메틸 셀룰로스, 메틸히드록시벤조에이트, 프로필히드록시벤조에이트, 활석, 스테아르산 마그네슘 및 미네랄 오일등을 포함하나, 이에 한정되는 것은 아니다. 본 발명의 약제학적 조성물은 상기성분들 이외에 윤활제, 습윤제, 감미제, 향미제, 유화제, 현탁제, 보존제 등을 추가로 포함할 수 있다.

본 발명에 따른 약학적 조성물은 약학적으로 유효한 양으로 투여한다. 본 발명에 있어서, "약학적으로 유효한 양"은 의학적 치료에 적용 가능한 합리적인 수혜/위험 비율로 질환을 치료하기에 충분한 양을 의미하며, 유효용량 수준은 환자의 질환의 종류, 중증도, 약물의 활성, 약물에 대한 민감도, 투여 시간, 투여 경로 및 배출 비율, 치료기간, 동시 사용되는 약물을 포함한 요소 및 기타 의학 분야에 잘 알려진 요소에 따라 결정될 수 있다. 본 발명에 따른 약학적 조성물은 개별 치료제로 투여하거나 다른 치료제와 병용하여 투여될 수 있고 종래의 치료제와는 순차적 또는 동시에 투여될 수 있으며, 단일 또는 다중 투여될 수 있다. 상기 요소들을 모두 고려하여 부작용 없이 최소한의 양으로 최대 효과를 얻을 수 있는 양을 투여하는 것이 중요하며, 이는 당업자에 의해 용이하게 결정될 수 있다.

구체적으로, 본 발명에 따른 약학적 조성물의 유효량은 환자의 연령, 성별, 상태, 체중, 체내에서 활성 성분의 흡수도, 불활성율 및 배설속도, 질병종류, 병용되는 약물에 따라 달라질 수 있으며, 일반적으로는 체중 1㎏ 당 0.001 내지 150 mg, 바람직하게는 0.01 내지 100 mg을 매일 또는 격일 투여하거나 1일 1 내지 3회로 나누어 투여할 수 있다. 그러나 투여 경로, 비만의 중증도, 성별, 체중, 연령 등에 따라서 증감될 수 있으므로 상기 투여량이 어떠한 방법으로도 본 발명의 범위를 한정하는 것은 아니다.

본 발명의 약학적 조성물은 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있는 방법에 따라, 약제학적으로 허용되는 담체 및/또는 부형제를 이용하여 제제화 함으로써 단위 용량 형태로 제조되거나 또는 다용량 용기내에 내입시켜 제조될 수 있다. 이때 제형은 오일 또는 수성 매질중의 용액, 현탁액 또는 유화액 형태이거나 엑스제, 분말제, 과립제, 정제 또는 캅셀제 형태일 수도 있으며, 분산제 또는 안정화제를 추가적으로 포함할 수 있다.

본 발명의 일 실시예에서는, 약물 내성 암세포 (U87-DR)에 대한 엑솜 염기서열 분석을 실시하여 항암제 내성과 관련된 2 가지 indels, 5 가지 stop-gain 변이 및 54 가지 missense 변이 (표 1 참조)를 포함한 107 가지의 변이 유전자를 확인하였으며 (실시예 1 내지 3 참조), 또한, 변이에 대한 분자 기능 분석을 실시하여, 'carbohydrate derivative binding', 'nucleoside binding' 및 'ATP-dependent helicase activity' 기능과 관련된 변이를 통해 항암제의 구체적인 작용 기전을 확인하였으며 (실시예 4 참조), 아울러, 상기 항암제 내성 관련 유전자 중 CARD6 또는 NSD1 유전자를 넉다운 (knock down)시킨 경우, 항암제 내성을 가진 암세포가 현저히 증가함을 확인하였는바, 항암제 내성 억제물질 스크리닝 방법으로 매우 유용하게 사용될 수 있음을 확인하였다(실시예 6 또는 7 참조).

이에, 본 발명은 a) in vitro 상에서 암세포에 후보 물질을 처리하는 단계; b) 상기 암세포의 CARD6 (caspase activation and recruitment domain family, member 6)유전자, 또는 missense 변이된 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 측정하는 단계; 및 c) 비처리군에 비해 CARD6 (caspase activation and recruitment domain family, member 6)유전자, missense 변이된 NSD1 (nuclear receptor binding SET domain protein 1) 발현이 증진된 물질을 치료제로 선정하는 단계를 포함하는, 항암제 내성 억제물질 스크리닝 방법을 제공한다.

본 발명의 스크리닝 방법에서, 상기 암세포는 바람직하게 인간 교아세포종 (glioblastoma) 세포일 수 있으나, 이로써 제한되는 것은 아니다.

본 발명의 다른 양태로서, 본 발명은 상기 약학적 조성물을 개체에 투여하는 단계를 포함하는 암의 치료방법을 제공한다. 본 발명에서 "개체"란 질병의 치료를 필요로 하는 대상을 의미하고, 보다 구체적으로는, 인간 또는 비-인간인 영장류, 생쥐(mouse), 개, 고양이, 말 및 소 등의 포유류를 의미한다.

이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.

[실시예]

실시예 1. 실험준비 및 실험방법

1-1. 독소루비신 내성 암세포주 (U87-DR) 배양

항암제 (Doxorubicin) 내성 발달에 영향을 미치는 유전자 변이를 확인하기 위하여, 약물내성 암세포를 준비하였다. 보다 구체적으로, 본 발명자가 종래 출원한 (출원번호 2015-0068217) 특허 문헌을 통해 제조한 CDRA 칩을 이용하여, 인간 교아세포종 (human glioblastoma) 유래 U87 세포를 10 % (v:v) FBS, 100 units/ml 페니실린 및 100 ㎍/ml 스트렙토마이신으로 보충된 MEM에서 배양하고, 위생 처리를 위해서, 70 %의 에탄올을 needle-free syringe를 사용하여 칩 중심의 셀 장착 구멍을 통해 칩에 조심스럽게 주입한 다음 항암제인 독소루비신 (doxorubicin)을 농도 구배에 따라 노출시킨 후, 이들 중 생존한 세포 (U87-DR 세포)가 부착된 세포배양 접시의 표면으로부터 육각형의 마이크로챔버 어레이를 제거하였다. 이 후, 트립신화시키고, 세포를 수득한 후, 새로운 배양 접시로 옮겨 정상적인 성장 배지 (MEM)에서 일주일간 배양하였다.

1-2. Drug efflux assay

다중약제내성은 세포의 MDR 1　（다중약제내성 단백질) 및 MRP1 (다중약제내성 관련 단백질 1) 유전자의 기질인 형광염료 Rhodamine 123 (Sigma-Aldrich)을 압출하는 능력을 검정함으로써 결정하였다. 보다 구체적으로, 세포를 아이스에서 30분 동안 Rhodamine 123을 미리 로딩한 다음 37 ℃에서 1 시간동안 배양하여 MDR 단백질 매개 염료의 유출을 허용하고, 세포는 propidum iodide (Pl; Sigama-Aldrich)로 염색하여 아이스에서 유지시켰다. 염색 유출은 분석으로부터 PI-양성 사균을 제외하고 유동 세포 계측법 (BD Biosciences, San Jose, CA)으로 분석하였으며, 또한 형광 측정 플레이트 판독기 (Molecular Devices, Sunnyvale, CA)를 사용하여 Rhodamine 123의 유출 속도를 평가하였다. 또한, 세포 현탁액을 염료 유출 전후에 96-웰 플레이트의 분주하여 형광 광도는 485 ㎚ (여기) 및 530 ㎚ (방출)에서 측정하였다.

1-3. drug-free 상태에서의 세포 증식 분석

U87-WT 및 U87-DR 세포의 세포 증식을 측정하기 위해서, EZ-Cytox 세포 생존률 측정 키트 (Daeillab Service, Korea)를 사용하여 측정 하였다. 보다 구체적으로, 세포 (1 × 10³ 내지 3 × 10⁴)를 180 ㎕의 배지를 함유한 96 웰에 접종하고 6 시간동안 배양을 진행하였으며, 이 후, 20 ㎕의 EZ-Cytox 시약을 각 웰에 첨가하고 1 시간 동안 배양 하였다. 미토콘드리아 탈수소 효소에 의해 생성된 WST-포르마잔의 흡광도를 마이크로 플레이트 판독기 (Molecular Devices, Sunnyvale, CA)를 사용하여 450 nm에서 측정하였다.

1-4. 유전자 특이 siRNA 및 siRNA 트랜스펙션

CARD6 및 NSD1의 넉다운 실험을 위해서, 미리 설계된 siRNA (HsCARD6 5 및 HsCARD6 6의 ID를 갖는 CARD6에 대한 FlexiTube GeneSolution GS84674; Hs NSD1 3 및 Hs NSD1 8의 ID를 갖는 NSD1에 대한 FlexiTube GeneSolution GS64324) 및 스크램블된 음성 대조군 siRNA는 Qiagen (독일)에서 구입하였으며, 제조사의 지시에 따라 Lipofectamine RNAiMAX (Invitrogen)를 사용하여 U87 세포에 siRNA 이중 가닥을 형질 감염시켰다.

1-5. 유전자 넉다운을 위한 세포 증식 분석

세포 증식은 EZ-ytox 세포 생존력 측정 키트 (Daeillab Service, Korea)를 사용하여 측정하였다. 보다 구체적으로, U87의 3000 세포를 96 웰 플레이트의 각 웰에 접종하고, 다음 날 20 nM의 표적 siRNA으로 트랜스펙션시킨 다음 6 시간 후, 배양 배지에 독소루비신으로 세포를 처리하고 3 일간 배양하였다. 이 후, EZ-Cytox 용액을 각 웰에 첨가하고 37 ℃에서 3 시간 동안 배양하였으며, 배양이 완료되면, 흡광도를 마이크로 플레이트 판독기 (Molecular Devices, Sunnyvale, CA)를 사용하여 450 nm에서 측정하였다. 또한, 독소루비신이 없는 상태에서 값을 정규화하여 생존율을 결정하였다.

1-6. RNA-Seq 데이터 처리

제조업체의 지침에 따라 Direct-zol™ RNA MiniPrep 키트 (Zymo Research, Irvine, CA)를 사용하여 U87-WT 및 U87-DR 세포에서 총 RNA를 추출하였으며, RNA 시퀀싱은 Illumina HiSeq-2500 시퀀싱 플랫폼 (Illumina, San Diego, CA)에서 101bp pair-end run을 사용하여 수행하였다. 또한, Fastx 툴킷 (version 0.0.13.2)은 로우 시퀀싱 데이터의 사전 처리에 사용하였으며, 상기 리드는 MapSplice 2 (version 2.1.7)를 사용하여 참조 유전체 (human reference genome, hg19)를 정렬하였다. 다음으로 RSEM (version 1.2.12)을 사용하여 mRNA abundance를 정량화하였고, U87과 U87-DR 세포 사이의 차등 발현은 edgeR 프로그램 (version 3.8.6)에 의해 얻어졌다. 이 때, 상기 차등 발현 유전자 (DEGs)는 P-value < 0.01 이하에서 선택되었다.

실시예 2. 엑솜 염기서열 분석 ( Exome sequencing)

제조사의 지시에 따라 게놈 DNA 추출 키트 (Qiagen)를 사용하여 U87-WT 및 U87-DR 세포로부터 총 DNA를 추출하였다. 또한, Agilent Sure Select Human All Exon V4 with post-capture kit (Agilent, Santa Clara, CA, USA)를 이용하여 엑솜을 농축시켰으며, 엑솜 염기서열 분석은 101 염기쌍 페어드 엔드 런(Paired-end runs)을 이용한 Illumina HiSeq-2000 sequencing platform (Illumina, San Diego, CA, USA)으로 실시하였다. 또한, 도 1에 나타낸 바와 같이 엑솜 염기서열분석을 진행하였으며, 보다 구체적으로 Fastx_toolkit (version 0.0.13.2)(http://hannonlab.cshl.edu/fastx toolkit/)를 이용하여 어댑터 시퀀스 트리밍, 아티팩트 필터링, 20 이하 quality score를 갖는 서열조각 (리드, read)의 제거를 통해 염기서열의 quality를 조절하였다(Sequence quality control). 상기 리드는 bowtie2 (version 2.1.0)의 default 설정을 이용하여 참조 유전체 (human reference genome, hg19)를 정렬 (alignment) 하였다 (pre-alignment). 다음으로 Genome anlysis Toolkit (GATK, version 2.5.2) 및 Picard (version 1.92)를 이용하여, 중복된 리드의 제거, 국소적 재정렬 (realignment), quality scores의 재측정을 실시하였다. 평균 정렬된 리드의 수는 8 천백만 개였으며, 타겟 부분의 평균 read depth는 187X였다.

실시예 3. 약물 내성 세포의 변이 검출

독소루비신 저항성 세포의 변이를 확인하기 위해서, 도 2에 나타낸 바와 같이, 약물 내성 세포의 변이 검출을 진행하였다.

보다 구체적으로, U87 야생형을 대조군으로 하여, 체세포 돌연변이를 총 4가지 분석 프로그램 MuTect (version 1.1.4), Strelka (version 1.0.7), VarScan2 (version 2.3.5) 및 Virmid (version 1.1.0)을 통하여 확인하였다.

그 결과, 다중 (≥2) 프로그램에 의해 확인된 신체 변이가 신뢰할만한 대체물로 분류되었으며, 2 개의 indels, 5 개의 stop-gain 변이 및 54 개의 missense 변이 (표 1 참조)를 포함한 107 가지의 변이형을 얻었다. 또한, 삽입 및 결실 변이 (INDEl)는 2가지 분석 프로그램 (Strelka (version 1.0.7), VarScan2 (version 2.3.5))을 이용하여 상기와 동일한 방법으로 암세포 내성 관련 변이를 도출하였으며, 기능 변형은 ANNOVAR 프로그램을 사용하여 주석을 달고 통합 유전체 뷰어 (IGV)는 판독 정렬의 육안 검사에 사용되었다.

[표 1]

실시예 4. 변이에 대한 분자 기능 분석

Gene Ontology (GO) 기능 및 경로에 대한 유전자 세트 분석은 웹 기반 Gene Set Analysis Toolkit (WebGestalt) 웹 서버를 사용하여 수행하였으며, 이 때, 체외 돌연변이와 차별적으로 발현된 유전자 (DEG)를 분석에 포함하였다 (각각 표 2).

[표 2]

그 결과, 'carbohydrate derivative binding', 'nucleoside binding' 및 'ATP-dependent helicase activity' 기능과 관련된 변이를 확인하였는바, 이를 통해서, 독소루비신은 DNA 이중 나선의 두 염기쌍 사이에 삽입되어 topoisomerase Ⅱ를 방해한다는 이전 연구결과를 뒷받침한다.

이 때, topoisomerase Ⅱ의 헬리케이즈 활성은 독소루비신과 같은 안트라사이클린 항생제에 의해 강력하게 억제되는 것으로 나타났으며, 독소루비신의 4'- epi-isomer 인 epirubicin의 타겟으로 알려진 CHD1 (choromodomain helicase DNA binding protein 1)에서 유전자 변이를 관찰하였다.

또 다른 주목할만한 돌연변이는 filamin-A (FLNA) 유전자에 프레임 이동 삽입 (frame-shift insertion)으로, 그 손실은 topoisomerase Ⅱ 독소의 유입과 유출을 조절함으로써 독소루비신 내성을 촉진시키는 것으로 확인하였다.

실시예 5. 내성 발달을 위한 전사체 시퀀싱 및 신호전달 경로 분석

약물 내성의 관여하는 변화된 경로와 분자 과정을 더 확인하기 위해서, CDRA 칩에서 7일간 성장 후 얻은 U87 야생형 및 내성 세포주에 대한 RNA-seq데이터를 생성하였다.

[표 3]

[표 4]

그 결과, 표 3에 나타낸 바와 같이, 83개의 DEG를 확인했으며, 그 중 77개가 상향 조절되었고, 6개가 하향 조절되었음을 확인하였으며, 표 4에 나타낸 바와 같이, 상기 83개의 DEG에 대한 GO 기능의 유전자 세트 분석은 '상처에 대한 반응', '염증 반응', '백혈구 화학 주성', '저산소 반응', '세포 증식 조절' 및 '사이토카인 활성'과 관련되어 있다. 특히, 가장 관련된 기능은 독소루비신을 독소루비시놀 (Doxorubicinol)로 전환시키는 4개의 알도-케토 환원 효소 (AKR; AKR1B1, AKR1C1, AKR1C2, AKR1C3)로 대표되는 독소루비신 대사 과정 (FDR = 3.89e-6)이다. 이 때, 독소루비신과 비교하여 독소루비시놀은 현저하게 감소된 세포 독성, 감소된 DNA-결합 활성 및 핵 외 리소좀 (extra-nuclear lysosomes)에 강한 발현 위치를 나타내었다.

또한, WebGestalt를 이용한 83 DEG의 교토 백과사전 유전자 및 게놈 (KEGG) 경로 분석은 NOD 유사 수용체 신호 전달 경로 (FDR = 1.33e-6) 및 사이토카인 - 사이토카인 수용체 상호 작용 경로 (FDR = 2.46e-8)를 산출했다. 이러한 경로에 관여하는 DEG는 NF-κB 경로에 의해 조절되는 대부분 케모카인 및 전 염증성 사이토카인 (예 : CCL2, CXCL1, CXCL2, CXCL3, IL1B, IL6, IL8 및 IL11)을 포함한다.

이때, NF-κB 활성화는 독소루비신 및 그 유사체의 세포 독성 효과에 필수적인 것으로 알려져 있으며, 엑솜 염기서열 데이터로부터 NF-κB 활성화와 관련있는 3개의 돌연변이 유전자 (CARD6, NSD1 및 NLRP13)을 확인하였다.

특히, CARD6 (caspase activation and recruitment domain family, member 6)는 인간 배아 신장 유도 HEK293T 세포에서 NOD1 (nucleotide-binding oligomerization domain containing 1) 수용체에 의한 NF-κB 활성화를 음성 조절하는 반면에, 간세포 암 기원의 Huh7 세포에서는 양성 조절자로 작용한다. 따라서, NF-κB 활성화에서 CARD6의 역할은 세포 유효 특이적일 수 있음을 알 수 있었다.

실시예 6. CARD6 변이에 의한 항암제 내성 촉진효과 확인

본 발명자들은 in silico 분석에 대한 사전 검증을 수행하고자, 우선, FLNA에서 frameshift 돌연변이의 효과를 특정 siRNA로 넉다운 (knock down)하여 모방하고자 하였다.

보다 구체적으로, 내성 세포에서 CARD6의 stop-gain 돌연변이 (c.G2014T of NM 032587 encoding p.Gly672*)를 관찰하였으며 (도 3 참조), CARD6에 대한 siRNA로 넉다운 (knock down)하는 실험을 수행하였다.

그 결과, 도 4에 나타낸 바와 같이, CARD6에 특이적인 siRNA를 가진 U87 세포의 처리는 이들 세포에서 NF-κB 신호전달 경로의 하향 조절과 일치하는 독소루비신 내성을 증가시키는 것을 확인하였으며, 이 때, CARD6에 대한 siRNA의 넉다운 효율을 도 5에 나타내었다.

실시예 7. NSD1 변이에 의한 항암제 내성 촉진효과 확인

NSD1 (nuclear receptor binding SET domain protein 1)에서 NF-κB 활성화를 감소시키는 것으로 알려진 missense 돌연변이 (c.T3380G of NM 02245 encoding p.Leu1127Arg)를 확인하였으며 (도 6 참조), 상기와 같이, NSD1을 넉다운 (knock down)시켰다.

그 결과, 도 7에 나타낸 바와 같이, NSD1의 넉다운 (knock down)은 감소된 NF-κB 활성화와 일치하는 독소루비신 내성을 증가시키고, 아폽토시스를 감소시키는 것을 확인하였으며, 이 때, NSD1에 대한 siRNA의 넉다운 효율을 도 8에 나타내었다.

상기 결과들을 통해서, 암세포의 CARD6 또는 NSD1의 발현을 억제함으로써, 항암제 내성을 촉진시킬 수 있음을 나타내는 것으로, CARD6 또는 NSD1과 항암제 내성간 높은 관련성이 있음을 의미한다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

<110> Research and Business Foundation SUNGKYUNKWAN UNIVERSITY Ewha University - Industry Collaboration Foundation <120> Gene that is specific to anti-cancer drug resistance and use thereof <130> MP16-500 <160> 6 <170> KoPatentIn 3.0 <210> 1 <211> 1037 <212> PRT <213> CARD6 protein <400> 1 Met Ala Thr Glu Ser Thr Pro Ser Glu Ile Ile Glu Arg Glu Arg Lys 1 5 10 15 Lys Leu Leu Glu Ile Leu Gln His Asp Pro Asp Ser Ile Leu Asp Thr 20 25 30 Leu Thr Ser Arg Arg Leu Ile Ser Glu Glu Glu Tyr Glu Thr Leu Glu 35 40 45 Asn Val Thr Asp Leu Leu Lys Lys Ser Arg Lys Leu Leu Ile Leu Val 50 55 60 Gln Lys Lys Gly Glu Ala Thr Cys Gln His Phe Leu Lys Cys Leu Phe 65 70 75 80 Ser Thr Phe Pro Gln Ser Ala Ala Ile Cys Gly Leu Arg His Glu Val 85 90 95 Leu Lys His Glu Asn Thr Val Pro Pro Gln Ser Met Gly Ala Ser Ser 100 105 110 Asn Ser Glu Asp Ala Phe Ser Pro Gly Ile Lys Gln Pro Glu Ala Pro 115 120 125 Glu Ile Thr Val Phe Phe Ser Glu Lys Glu His Leu Asp Leu Glu Thr 130 135 140 Ser Glu Phe Phe Arg Asp Lys Lys Thr Ser Tyr Arg Glu Thr Ala Leu 145 150 155 160 Ser Ala Arg Lys Asn Glu Lys Glu Tyr Asp Thr Pro Glu Val Thr Leu 165 170 175 Ser Tyr Ser Val Glu Lys Val Gly Cys Glu Val Pro Ala Thr Ile Thr 180 185 190 Tyr Ile Lys Asp Gly Gln Arg Tyr Glu Glu Leu Asp Asp Ser Leu Tyr 195 200 205 Leu Gly Lys Glu Glu Tyr Leu Gly Ser Val Asp Thr Pro Glu Asp Ala 210 215 220 Glu Ala Thr Val Glu Glu Glu Val Tyr Asp Asp Pro Glu His Val Gly 225 230 235 240 Tyr Asp Gly Glu Glu Asp Phe Glu Asn Ser Glu Thr Thr Glu Phe Ser 245 250 255 Gly Glu Glu Pro Ser Tyr Glu Gly Ser Glu Thr Ser Leu Ser Leu Glu 260 265 270 Glu Glu Gln Glu Lys Ser Ile Glu Glu Arg Lys Lys Val Phe Lys Asp 275 280 285 Val Leu Leu Cys Leu Asn Met Asp Arg Ser Arg Lys Val Leu Pro Asp 290 295 300 Phe Val Lys Gln Phe Ser Leu Asp Arg Gly Cys Lys Trp Thr Pro Glu 305 310 315 320 Ser Pro Gly Asp Leu Ala Trp Asn Phe Leu Met Lys Val Gln Ala Arg 325 330 335 Asp Val Thr Ala Arg Asp Ser Ile Leu Ser His Lys Val Leu Asp Glu 340 345 350 Asp Ser Lys Glu Asp Leu Leu Ala Gly Val Glu Asn Leu Glu Ile Arg 355 360 365 Asp Ile Gln Thr Ile Asn Pro Leu Asp Val Leu Cys Ala Thr Met Leu 370 375 380 Cys Ser Asp Ser Ser Leu Gln Arg Gln Val Met Ser Asn Met Tyr Gln 385 390 395 400 Cys Gln Phe Ala Leu Pro Leu Leu Leu Pro Asp Ala Glu Asn Asn Lys 405 410 415 Ser Ile Leu Met Leu Gly Ala Met Lys Asp Ile Val Lys Lys Gln Ser 420 425 430 Thr Gln Phe Ser Gly Gly Pro Thr Glu Asp Thr Glu Lys Phe Leu Thr 435 440 445 Leu Met Lys Met Pro Val Ile Ser Phe Val Arg Leu Gly Tyr Cys Ser 450 455 460 Phe Ser Lys Ser Arg Ile Leu Asn Thr Leu Leu Ser Pro Ala Gln Leu 465 470 475 480 Lys Leu His Lys Ile Phe Leu His Gln Asp Leu Pro Leu Leu Val Leu 485 490 495 Pro Arg Gln Ile Ser Asp Gly Leu Val Glu Ile Thr Trp Cys Phe Pro 500 505 510 Asp Ser Asp Asp Arg Lys Glu Asn Pro Phe Phe Gln Lys Pro Val Ala 515 520 525 Leu Ala Asn Leu Arg Gly Asn Leu Glu Ser Phe Trp Thr Gln Phe Gly 530 535 540 Phe Leu Met Glu Val Ser Ser Ala Val Phe Phe Phe Thr Asp Cys Leu 545 550 555 560 Gly Glu Lys Glu Trp Asp Leu Leu Met Phe Leu Gly Glu Ala Ala Ile 565 570 575 Glu Arg Cys Tyr Phe Val Leu Ser Ser Gln Ala Arg Glu Ser Glu Glu 580 585 590 Ala Gln Ile Phe Gln Arg Ile Leu Asn Leu Lys Pro Ala Gln Leu Leu 595 600 605 Phe Trp Glu Arg Gly Asp Ala Gly Asp Arg Arg Lys Asn Met Glu Gly 610 615 620 Leu Gln Ala Ala Leu Gln Glu Val Met Phe Ser Ser Cys Leu Arg Cys 625 630 635 640 Val Ser Val Glu Asp Met Ala Ala Leu Ala Arg Glu Leu Gly Ile Gln 645 650 655 Val Asp Glu Asp Phe Glu Asn Thr Gln Arg Ile Gln Val Ser Ser Gly 660 665 670 Glu Asn Met Ala Gly Thr Ala Glu Gly Glu Gly Gln Gln Arg His Ser 675 680 685 Gln Leu Lys Ser Ser Ser Lys Ser Gln Ala Leu Met Pro Ile Gln Glu 690 695 700 Pro Gly Thr Gln Cys Glu Leu Ser Gln Asn Leu Gln Asn Leu Tyr Gly 705 710 715 720 Thr Pro Val Phe Arg Pro Val Leu Glu Asn Ser Trp Leu Phe Pro Thr 725 730 735 Arg Ile Gly Gly Asn Phe Asn His Val Ser Leu Lys Ala Ser Trp Val 740 745 750 Met Gly Arg Pro Phe Gly Ser Glu Gln Arg Pro Lys Trp Phe His Pro 755 760 765 Leu Pro Phe Gln Asn Ala Gly Ala Gln Gly Arg Gly Lys Ser Phe Gly 770 775 780 Ile Gln Ser Phe His Pro Gln Ile Phe Tyr Ser Gly Glu Arg Phe Met 785 790 795 800 Lys Phe Ser Arg Val Ala Arg Gly Cys His Ser Asn Gly Thr Phe Gly 805 810 815 Arg Leu Pro Arg Pro Ile Cys Gln His Val Gln Ala Cys Pro Glu Arg 820 825 830 Pro Gln Met Met Gly Thr Leu Glu Arg Ser Arg Ala Val Ala Ser Lys 835 840 845 Ile Gly His Ser Tyr Ser Leu Asp Ser Gln Pro Ala Arg Ala Val Gly 850 855 860 Lys Pro Trp Pro Gln Gln Ala Cys Thr Arg Val Thr Glu Leu Thr Glu 865 870 875 880 Ala Thr Gly Lys Leu Ile Arg Thr Ser His Ile Gly Lys Pro His Pro 885 890 895 Gln Ser Phe Gln Pro Ala Ala Ala Thr Gln Lys Leu Arg Pro Ala Ser 900 905 910 Gln Gln Gly Val Gln Met Lys Thr Gln Gly Gly Ala Ser Asn Pro Ala 915 920 925 Leu Gln Ile Gly Ser His Pro Met Cys Lys Ser Ser Gln Phe Lys Ser 930 935 940 Asp Gln Ser Asn Pro Ser Thr Val Lys His Ser Gln Pro Lys Pro Phe 945 950 955 960 His Ser Val Pro Ser Gln Pro Lys Ser Ser Gln Thr Lys Ser Cys Gln 965 970 975 Ser Gln Pro Ser Gln Thr Lys Pro Ser Pro Cys Lys Ser Thr Gln Pro 980 985 990 Lys Pro Ser Gln Pro Trp Pro Pro Gln Ser Lys Pro Ser Gln Pro Arg 995 1000 1005 Pro Pro Gln Pro Lys Ser Ser Ser Thr Asn Pro Ser Gln Ala Lys Ala 1010 1015 1020 His His Ser Lys Ala Gly Gln Lys Arg Gly Gly Lys His 1025 1030 1035 <210> 2 <211> 3114 <212> DNA <213> CARD6 polynucleotide <400> 2 atggctaccg agagtactcc ctcagagatc atagaaagag aaagaaaaaa gttgcttgaa 60 atccttcaac atgatcctga ttctatctta gacacgttaa cttctcggag gctgatttct 120 gaggaagagt atgagactct ggagaatgtt acagatctcc tgaagaaaag tcggaagctg 180 ttaattttgg tacagaaaaa gggagaggcg acctgtcagc attttctcaa gtgtttattt 240 agtacttttc cacagtcagc tgccatttgc ggcttaaggc atgaagtttt aaaacatgag 300 aatacagtac ctcctcaatc tatgggggca agcagtaatt cagaagatgc tttttctcct 360 ggaataaaac agcctgaagc ccctgagatc acagtgttct tcagtgagaa ggaacacttg 420 gatttggaaa cctctgagtt tttcagggac aagaaaacta gttataggga aacagctttg 480 tctgccagga agaatgagaa ggaatatgac acaccagaag tcacattatc atattcagtt 540 gagaaagttg gatgtgaagt tccagcaact attacatata taaaagatgg acagagatat 600 gaggagctag atgattcttt atacttagga aaagaggaat atctaggatc tgttgacacc 660 cctgaagatg cagaagccac tgtggaagag gaggtttatg atgacccaga gcacgttgga 720 tatgatggtg aagaggactt cgagaattca gaaaccacag agttctctgg tgaagaacca 780 agttatgagg gatcagaaac cagcctttca ttggaggagg aacaggagaa aagtatagaa 840 gaaagaaaaa aggtgtttaa agatgtcctg ttatgtttga acatggatag aagcagaaag 900 gttctgccag attttgttaa acaattctcc ttagatcgag gatgtaagtg gacccctgag 960 agtccaggag acttagcctg gaatttcctg atgaaagttc aagcacgaga tgtgaccgct 1020 agggattcaa tcctcagtca caaggttctg gatgaagata gcaaggagga tttgctggct 1080 ggagtggaga atttggaaat tcgagacata caaaccatta atccccttga cgtgctttgt 1140 gccaccatgc tgtgttcaga tagctctttg caacgccaag tcatgtcaaa catgtatcag 1200 tgccagtttg ctcttcccct gctactgcca gatgcagaaa acaacaaaag catcttaatg 1260 ctgggggcca tgaaagacat tgtgaagaag cagtcaacac agttttcagg ggggcctaca 1320 gaggatacag aaaagtttct gactctcatg aagatgcctg tcatctcttt tgtgcgtcta 1380 ggatactgta gcttctctaa gtccagaatc ctcaacacac ttctcagccc tgcccagttg 1440 aaattacaca aaatctttct tcatcaagat ttgcctcttt tggtgcttcc ccggcaaatc 1500 tctgatggcc tggttgagat aacatggtgt tttcctgata gcgatgatag aaaggaaaac 1560 ccctttttcc aaaagcctgt tgctctggct aatctccgtg gaaatctaga aagcttttgg 1620 actcagtttg gttttttgat ggaagtttct tcagctgtgt tttttttcac tgactgttta 1680 ggtgagaagg aatgggactt gctaatgttt ttaggagagg ctgccattga aagatgctac 1740 tttgttctca gttcccaagc cagggagagt gaagaggctc aaatttttca gaggatactg 1800 aacttgaagc cagcacagct actgttttgg gagaggggag atgctgggga tagaaggaag 1860 aacatggagg gccttcaagc tgccctccag gaagtgatgt tctcttcttg cctcagatgt 1920 gtgtctgtgg aggatatggc cgccctggcc agggagctgg ggattcaggt agatgaagac 1980 tttgaaaaca ctcagagaat tcaagtttcc tctggagaaa acatggctgg gacagctgaa 2040 ggtgagggtc agcaaagaca cagtcagcta aaaagctcat ctaaaagcca ggctctaatg 2100 ccaattcaag agcctgggac tcaatgtgag ctcagccaga atcttcagaa tctctatggt 2160 accccagtat tcaggcctgt tctagagaac tcctggctct ttccaaccag aattggaggt 2220 aactttaacc atgtttcctt gaaagcctcc tgggttatgg gccgcccctt tgggtcagag 2280 cagaggccta agtggttcca tcctttgcct tttcagaatg caggggccca gggccgaggt 2340 aaaagttttg gtattcaatc cttccatccc cagatatttt attcaggtga aagattcatg 2400 aaattttcca gagttgctcg gggatgtcac tcgaatggaa catttgggag actgccaaga 2460 cccatttgtc agcatgtaca ggcctgccct gagagaccac aaatgatggg aactcttgaa 2520 aggtctaggg cagtagcctc caagataggt cactcctatt ccctggattc acagccagca 2580 agagcagtag ggaagccatg gcctcagcaa gcttgcacca gggtaacaga gttaactgaa 2640 gcaactggaa aactgataag aacatcccat attggaaagc ctcaccctca gtcctttcaa 2700 ccagcagcag ccacacaaaa actaagacct gcttctcagc aaggagtcca gatgaagaca 2760 caaggtgggg cttcaaatcc agctctccaa atagggtccc atcccatgtg caagagctct 2820 cagttcaaat ccgatcagtc caacccatcc acagtcaaac actcccagcc taaacccttc 2880 cattctgtgc cctctcaacc taaatcctct cagacaaaat cctgtcagtc ccagccctcc 2940 caaactaaac cttctccatg caaatctact cagcctaagc caagccagcc ctggcctccc 3000 cagtctaagc cttctcagcc cagaccccct caacctaagt catcctcaac caatccttca 3060 caagctaagg cacaccactc aaaagcaggg cagaagaggg gagggaagca ttaa 3114 <210> 3 <211> 2696 <212> PRT <213> NSD1_1 protein <400> 3 Met Asp Gln Thr Cys Glu Leu Pro Arg Arg Asn Cys Leu Leu Pro Phe 1 5 10 15 Ser Asn Pro Val Asn Leu Asp Ala Pro Glu Asp Lys Asp Ser Pro Phe 20 25 30 Gly Asn Gly Gln Ser Asn Phe Ser Glu Pro Leu Asn Gly Cys Thr Met 35 40 45 Gln Leu Ser Thr Val Ser Gly Thr Ser Gln Asn Ala Tyr Gly Gln Asp 50 55 60 Ser Pro Ser Cys Tyr Ile Pro Leu Arg Arg Leu Gln Asp Leu Ala Ser 65 70 75 80 Met Ile Asn Val Glu Tyr Leu Asn Gly Ser Ala Asp Gly Ser Glu Ser 85 90 95 Phe Gln Asp Pro Glu Lys Ser Asp Ser Arg Ala Gln Thr Pro Ile Val 100 105 110 Cys Thr Ser Leu Ser Pro Gly Gly Pro Thr Ala Leu Ala Met Lys Gln 115 120 125 Glu Pro Ser Cys Asn Asn Ser Pro Glu Leu Gln Val Lys Val Thr Lys 130 135 140 Thr Ile Lys Asn Gly Phe Leu His Phe Glu Asn Phe Thr Cys Val Asp 145 150 155 160 Asp Ala Asp Val Asp Ser Glu Met Asp Pro Glu Gln Pro Val Thr Glu 165 170 175 Asp Glu Ser Ile Glu Glu Ile Phe Glu Glu Thr Gln Thr Asn Ala Thr 180 185 190 Cys Asn Tyr Glu Thr Lys Ser Glu Asn Gly Val Lys Val Ala Met Gly 195 200 205 Ser Glu Gln Asp Ser Thr Pro Glu Ser Arg His Gly Ala Val Lys Ser 210 215 220 Pro Phe Leu Pro Leu Ala Pro Gln Thr Glu Thr Gln Lys Asn Lys Gln 225 230 235 240 Arg Asn Glu Val Asp Gly Ser Asn Glu Lys Ala Ala Leu Leu Pro Ala 245 250 255 Pro Phe Ser Leu Gly Asp Thr Asn Ile Thr Ile Glu Glu Gln Leu Asn 260 265 270 Ser Ile Asn Leu Ser Phe Gln Asp Asp Pro Asp Ser Ser Thr Ser Thr 275 280 285 Leu Gly Asn Met Leu Glu Leu Pro Gly Thr Ser Ser Ser Ser Thr Ser 290 295 300 Gln Glu Leu Pro Phe Cys Gln Pro Lys Lys Lys Ser Thr Pro Leu Lys 305 310 315 320 Tyr Glu Val Gly Asp Leu Ile Trp Ala Lys Phe Lys Arg Arg Pro Trp 325 330 335 Trp Pro Cys Arg Ile Cys Ser Asp Pro Leu Ile Asn Thr His Ser Lys 340 345 350 Met Lys Val Ser Asn Arg Arg Pro Tyr Arg Gln Tyr Tyr Val Glu Ala 355 360 365 Phe Gly Asp Pro Ser Glu Arg Ala Trp Val Ala Gly Lys Ala Ile Val 370 375 380 Met Phe Glu Gly Arg His Gln Phe Glu Glu Leu Pro Val Leu Arg Arg 385 390 395 400 Arg Gly Lys Gln Lys Glu Lys Gly Tyr Arg His Lys Val Pro Gln Lys 405 410 415 Ile Leu Ser Lys Trp Glu Ala Ser Val Gly Leu Ala Glu Gln Tyr Asp 420 425 430 Val Pro Lys Gly Ser Lys Asn Arg Lys Cys Ile Pro Gly Ser Ile Lys 435 440 445 Leu Asp Ser Glu Glu Asp Met Pro Phe Glu Asp Cys Thr Asn Asp Pro 450 455 460 Glu Ser Glu His Asp Leu Leu Leu Asn Gly Cys Leu Lys Ser Leu Ala 465 470 475 480 Phe Asp Ser Glu His Ser Ala Asp Glu Lys Glu Lys Pro Cys Ala Lys 485 490 495 Ser Arg Ala Arg Lys Ser Ser Asp Asn Pro Lys Arg Thr Ser Val Lys 500 505 510 Lys Gly His Ile Gln Phe Glu Ala His Lys Asp Glu Arg Arg Gly Lys 515 520 525 Ile Pro Glu Asn Leu Gly Leu Asn Phe Ile Ser Gly Asp Ile Ser Asp 530 535 540 Thr Gln Ala Ser Asn Glu Leu Ser Arg Ile Ala Asn Ser Leu Thr Gly 545 550 555 560 Ser Asn Thr Ala Pro Gly Ser Phe Leu Phe Ser Ser Cys Gly Lys Asn 565 570 575 Thr Ala Lys Lys Glu Phe Glu Thr Ser Asn Gly Asp Ser Leu Leu Gly 580 585 590 Leu Pro Glu Gly Ala Leu Ile Ser Lys Cys Ser Arg Glu Lys Asn Lys 595 600 605 Pro Gln Arg Ser Leu Val Cys Gly Ser Lys Val Lys Leu Cys Tyr Ile 610 615 620 Gly Ala Gly Asp Glu Glu Lys Arg Ser Asp Ser Ile Ser Ile Cys Thr 625 630 635 640 Thr Ser Asp Asp Gly Ser Ser Asp Leu Asp Pro Ile Glu His Ser Ser 645 650 655 Glu Ser Asp Asn Ser Val Leu Glu Ile Pro Asp Ala Phe Asp Arg Thr 660 665 670 Glu Asn Met Leu Ser Met Gln Lys Asn Glu Lys Ile Lys Tyr Ser Arg 675 680 685 Phe Ala Ala Thr Asn Thr Arg Val Lys Ala Lys Gln Lys Pro Leu Ile 690 695 700 Ser Asn Ser His Thr Asp His Leu Met Gly Cys Thr Lys Ser Ala Glu 705 710 715 720 Pro Gly Thr Glu Thr Ser Gln Val Asn Leu Ser Asp Leu Lys Ala Ser 725 730 735 Thr Leu Val His Lys Pro Gln Ser Asp Phe Thr Asn Asp Ala Leu Ser 740 745 750 Pro Lys Phe Asn Leu Ser Ser Ser Ile Ser Ser Glu Asn Ser Leu Ile 755 760 765 Lys Gly Gly Ala Ala Asn Gln Ala Leu Leu His Ser Lys Ser Lys Gln 770 775 780 Pro Lys Phe Arg Ser Ile Lys Cys Lys His Lys Glu Asn Pro Val Met 785 790 795 800 Ala Glu Pro Pro Val Ile Asn Glu Glu Cys Ser Leu Lys Cys Cys Ser 805 810 815 Ser Asp Thr Lys Gly Ser Pro Leu Ala Ser Ile Ser Lys Ser Gly Lys 820 825 830 Val Asp Gly Leu Lys Leu Leu Asn Asn Met His Glu Lys Thr Arg Asp 835 840 845 Ser Ser Asp Ile Glu Thr Ala Val Val Lys His Val Leu Ser Glu Leu 850 855 860 Lys Glu Leu Ser Tyr Arg Ser Leu Gly Glu Asp Val Ser Asp Ser Gly 865 870 875 880 Thr Ser Lys Pro Ser Lys Pro Leu Leu Phe Ser Ser Ala Ser Ser Gln 885 890 895 Asn His Ile Pro Ile Glu Pro Asp Tyr Lys Phe Ser Thr Leu Leu Met 900 905 910 Met Leu Lys Asp Met His Asp Ser Lys Thr Lys Glu Gln Arg Leu Met 915 920 925 Thr Ala Gln Asn Leu Val Ser Tyr Arg Ser Pro Gly Arg Gly Asp Cys 930 935 940 Ser Thr Asn Ser Pro Val Gly Val Ser Lys Val Leu Val Ser Gly Gly 945 950 955 960 Ser Thr His Asn Ser Glu Lys Lys Gly Asp Gly Thr Gln Asn Ser Ala 965 970 975 Asn Pro Ser Pro Ser Gly Gly Asp Ser Ala Leu Ser Gly Glu Leu Ser 980 985 990 Ala Ser Leu Pro Gly Leu Leu Ser Asp Lys Arg Asp Leu Pro Ala Ser 995 1000 1005 Gly Lys Ser Arg Ser Asp Cys Val Thr Arg Arg Asn Cys Gly Arg Ser 1010 1015 1020 Lys Pro Ser Ser Lys Leu Arg Asp Ala Phe Ser Ala Gln Met Val Lys 1025 1030 1035 1040 Asn Thr Val Asn Arg Lys Ala Leu Lys Thr Glu Arg Lys Arg Lys Leu 1045 1050 1055 Asn Gln Leu Pro Ser Val Thr Leu Asp Ala Val Leu Gln Gly Asp Arg 1060 1065 1070 Glu Arg Gly Gly Ser Leu Arg Gly Gly Ala Glu Asp Pro Ser Lys Glu 1075 1080 1085 Asp Pro Leu Gln Ile Met Gly His Leu Thr Ser Glu Asp Gly Asp His 1090 1095 1100 Phe Ser Asp Val His Phe Asp Ser Lys Val Lys Gln Ser Asp Pro Gly 1105 1110 1115 1120 Lys Ile Ser Glu Lys Gly Leu Ser Phe Glu Asn Gly Lys Gly Pro Glu 1125 1130 1135 Leu Asp Ser Val Met Asn Ser Glu Asn Asp Glu Leu Asn Gly Val Asn 1140 1145 1150 Gln Val Val Pro Lys Lys Arg Trp Gln Arg Leu Asn Gln Arg Arg Thr 1155 1160 1165 Lys Pro Arg Lys Arg Met Asn Arg Phe Lys Glu Lys Glu Asn Ser Glu 1170 1175 1180 Cys Ala Phe Arg Val Leu Leu Pro Ser Asp Pro Val Gln Glu Gly Arg 1185 1190 1195 1200 Asp Glu Phe Pro Glu His Arg Thr Pro Ser Ala Ser Ile Leu Glu Glu 1205 1210 1215 Pro Leu Thr Glu Gln Asn His Ala Asp Cys Leu Asp Ser Ala Gly Pro 1220 1225 1230 Arg Leu Asn Val Cys Asp Lys Ser Ser Ala Ser Ile Gly Asp Met Glu 1235 1240 1245 Lys Glu Pro Gly Ile Pro Ser Leu Thr Pro Gln Ala Glu Leu Pro Glu 1250 1255 1260 Pro Ala Val Arg Ser Glu Lys Lys Arg Leu Arg Lys Pro Ser Lys Trp 1265 1270 1275 1280 Leu Leu Glu Tyr Thr Glu Glu Tyr Asp Gln Ile Phe Ala Pro Lys Lys 1285 1290 1295 Lys Gln Lys Lys Val Gln Glu Gln Val His Lys Val Ser Ser Arg Cys 1300 1305 1310 Glu Glu Glu Ser Leu Leu Ala Arg Gly Arg Ser Ser Ala Gln Asn Lys 1315 1320 1325 Gln Val Asp Glu Asn Ser Leu Ile Ser Thr Lys Glu Glu Pro Pro Val 1330 1335 1340 Leu Glu Arg Glu Ala Pro Phe Leu Glu Gly Pro Leu Ala Gln Ser Glu 1345 1350 1355 1360 Leu Gly Gly Gly His Ala Glu Leu Pro Gln Leu Thr Leu Ser Val Pro 1365 1370 1375 Val Ala Pro Glu Val Ser Pro Arg Pro Ala Leu Glu Ser Glu Glu Leu 1380 1385 1390 Leu Val Lys Thr Pro Gly Asn Tyr Glu Ser Lys Arg Gln Arg Lys Pro 1395 1400 1405 Thr Lys Lys Leu Leu Glu Ser Asn Asp Leu Asp Pro Gly Phe Met Pro 1410 1415 1420 Lys Lys Gly Asp Leu Gly Leu Ser Lys Lys Cys Tyr Glu Ala Gly His 1425 1430 1435 1440 Leu Glu Asn Gly Ile Thr Glu Ser Cys Ala Thr Ser Tyr Ser Lys Asp 1445 1450 1455 Phe Gly Gly Gly Thr Thr Lys Ile Phe Asp Lys Pro Arg Lys Arg Lys 1460 1465 1470 Arg Gln Arg His Ala Ala Ala Lys Met Gln Cys Lys Lys Val Lys Asn 1475 1480 1485 Asp Asp Ser Ser Lys Glu Ile Pro Gly Ser Glu Gly Glu Leu Met Pro 1490 1495 1500 His Arg Thr Ala Thr Ser Pro Lys Glu Thr Val Glu Glu Gly Val Glu 1505 1510 1515 1520 His Asp Pro Gly Met Pro Ala Ser Lys Lys Met Gln Gly Glu Arg Gly 1525 1530 1535 Gly Gly Ala Ala Leu Lys Glu Asn Val Cys Gln Asn Cys Glu Lys Leu 1540 1545 1550 Gly Glu Leu Leu Leu Cys Glu Ala Gln Cys Cys Gly Ala Phe His Leu 1555 1560 1565 Glu Cys Leu Gly Leu Thr Glu Met Pro Arg Gly Lys Phe Ile Cys Asn 1570 1575 1580 Glu Cys Arg Thr Gly Ile His Thr Cys Phe Val Cys Lys Gln Ser Gly 1585 1590 1595 1600 Glu Asp Val Lys Arg Cys Leu Leu Pro Leu Cys Gly Lys Phe Tyr His 1605 1610 1615 Glu Glu Cys Val Gln Lys Tyr Pro Pro Thr Val Met Gln Asn Lys Gly 1620 1625 1630 Phe Arg Cys Ser Leu His Ile Cys Ile Thr Cys His Ala Ala Asn Pro 1635 1640 1645 Ala Asn Val Ser Ala Ser Lys Gly Arg Leu Met Arg Cys Val Arg Cys 1650 1655 1660 Pro Val Ala Tyr His Ala Asn Asp Phe Cys Leu Ala Ala Gly Ser Lys 1665 1670 1675 1680 Ile Leu Ala Ser Asn Ser Ile Ile Cys Pro Asn His Phe Thr Pro Arg 1685 1690 1695 Arg Gly Cys Arg Asn His Glu His Val Asn Val Ser Trp Cys Phe Val 1700 1705 1710 Cys Ser Glu Gly Gly Ser Leu Leu Cys Cys Asp Ser Cys Pro Ala Ala 1715 1720 1725 Phe His Arg Glu Cys Leu Asn Ile Asp Ile Pro Glu Gly Asn Trp Tyr 1730 1735 1740 Cys Asn Asp Cys Lys Ala Gly Lys Lys Pro His Tyr Arg Glu Ile Val 1745 1750 1755 1760 Trp Val Lys Val Gly Arg Tyr Arg Trp Trp Pro Ala Glu Ile Cys His 1765 1770 1775 Pro Arg Ala Val Pro Ser Asn Ile Asp Lys Met Arg His Asp Val Gly 1780 1785 1790 Glu Phe Pro Val Leu Phe Phe Gly Ser Asn Asp Tyr Leu Trp Thr His 1795 1800 1805 Gln Ala Arg Val Phe Pro Tyr Met Glu Gly Asp Val Ser Ser Lys Asp 1810 1815 1820 Lys Met Gly Lys Gly Val Asp Gly Thr Tyr Lys Lys Ala Leu Gln Glu 1825 1830 1835 1840 Ala Ala Ala Arg Phe Glu Glu Leu Lys Ala Gln Lys Glu Leu Arg Gln 1845 1850 1855 Leu Gln Glu Asp Arg Lys Asn Asp Lys Lys Pro Pro Pro Tyr Lys His 1860 1865 1870 Ile Lys Val Asn Arg Pro Ile Gly Arg Val Gln Ile Phe Thr Ala Asp 1875 1880 1885 Leu Ser Glu Ile Pro Arg Cys Asn Cys Lys Ala Thr Asp Glu Asn Pro 1890 1895 1900 Cys Gly Ile Asp Ser Glu Cys Ile Asn Arg Met Leu Leu Tyr Glu Cys 1905 1910 1915 1920 His Pro Thr Val Cys Pro Ala Gly Gly Arg Cys Gln Asn Gln Cys Phe 1925 1930 1935 Ser Lys Arg Gln Tyr Pro Glu Val Glu Ile Phe Arg Thr Leu Gln Arg 1940 1945 1950 Gly Trp Gly Leu Arg Thr Lys Thr Asp Ile Lys Lys Gly Glu Phe Val 1955 1960 1965 Asn Glu Tyr Val Gly Glu Leu Ile Asp Glu Glu Glu Cys Arg Ala Arg 1970 1975 1980 Ile Arg Tyr Ala Gln Glu His Asp Ile Thr Asn Phe Tyr Met Leu Thr 1985 1990 1995 2000 Leu Asp Lys Asp Arg Ile Ile Asp Ala Gly Pro Lys Gly Asn Tyr Ala 2005 2010 2015 Arg Phe Met Asn His Cys Cys Gln Pro Asn Cys Glu Thr Gln Lys Trp 2020 2025 2030 Ser Val Asn Gly Asp Thr Arg Val Gly Leu Phe Ala Leu Ser Asp Ile 2035 2040 2045 Lys Ala Gly Thr Glu Leu Thr Phe Asn Tyr Asn Leu Glu Cys Leu Gly 2050 2055 2060 Asn Gly Lys Thr Val Cys Lys Cys Gly Ala Pro Asn Cys Ser Gly Phe 2065 2070 2075 2080 Leu Gly Val Arg Pro Lys Asn Gln Pro Ile Ala Thr Glu Glu Lys Ser 2085 2090 2095 Lys Lys Phe Lys Lys Lys Gln Gln Gly Lys Arg Arg Thr Gln Gly Glu 2100 2105 2110 Ile Thr Lys Glu Arg Glu Asp Glu Cys Phe Ser Cys Gly Asp Ala Gly 2115 2120 2125 Gln Leu Val Ser Cys Lys Lys Pro Gly Cys Pro Lys Val Tyr His Ala 2130 2135 2140 Asp Cys Leu Asn Leu Thr Lys Arg Pro Ala Gly Lys Trp Glu Cys Pro 2145 2150 2155 2160 Trp His Gln Cys Asp Ile Cys Gly Lys Glu Ala Ala Ser Phe Cys Glu 2165 2170 2175 Met Cys Pro Ser Ser Phe Cys Lys Gln His Arg Glu Gly Met Leu Phe 2180 2185 2190 Ile Ser Lys Leu Asp Gly Arg Leu Ser Cys Thr Glu His Asp Pro Cys 2195 2200 2205 Gly Pro Asn Pro Leu Glu Pro Gly Glu Ile Arg Glu Tyr Val Pro Pro 2210 2215 2220 Pro Val Pro Leu Pro Pro Gly Pro Ser Thr His Leu Ala Glu Gln Ser 2225 2230 2235 2240 Thr Gly Met Ala Ala Gln Ala Pro Lys Met Ser Asp Lys Pro Pro Ala 2245 2250 2255 Asp Thr Asn Gln Met Leu Ser Leu Ser Lys Lys Ala Leu Ala Gly Thr 2260 2265 2270 Cys Gln Arg Pro Leu Leu Pro Glu Arg Pro Leu Glu Arg Thr Asp Ser 2275 2280 2285 Arg Pro Gln Pro Leu Asp Lys Val Arg Asp Leu Ala Gly Ser Gly Thr 2290 2295 2300 Lys Ser Gln Ser Leu Val Ser Ser Gln Arg Pro Leu Asp Arg Pro Pro 2305 2310 2315 2320 Ala Val Ala Gly Pro Arg Pro Gln Leu Ser Asp Lys Pro Ser Pro Val 2325 2330 2335 Thr Ser Pro Ser Ser Ser Pro Ser Val Arg Ser Gln Pro Leu Glu Arg 2340 2345 2350 Pro Leu Gly Thr Ala Asp Pro Arg Leu Asp Lys Ser Ile Gly Ala Ala 2355 2360 2365 Ser Pro Arg Pro Gln Ser Leu Glu Lys Thr Ser Val Pro Thr Gly Leu 2370 2375 2380 Arg Leu Pro Pro Pro Asp Arg Leu Leu Ile Thr Ser Ser Pro Lys Pro 2385 2390 2395 2400 Gln Thr Ser Asp Arg Pro Thr Asp Lys Pro His Ala Ser Leu Ser Gln 2405 2410 2415 Arg Leu Pro Pro Pro Glu Lys Val Leu Ser Ala Val Val Gln Thr Leu 2420 2425 2430 Val Ala Lys Glu Lys Ala Leu Arg Pro Val Asp Gln Asn Thr Gln Ser 2435 2440 2445 Lys Asn Arg Ala Ala Leu Val Met Asp Leu Ile Asp Leu Thr Pro Arg 2450 2455 2460 Gln Lys Glu Arg Ala Ala Ser Pro His Gln Val Thr Pro Gln Ala Asp 2465 2470 2475 2480 Glu Lys Met Pro Val Leu Glu Ser Ser Ser Trp Pro Ala Ser Lys Gly 2485 2490 2495 Leu Gly His Met Pro Arg Ala Val Glu Lys Gly Cys Val Ser Asp Pro 2500 2505 2510 Leu Gln Thr Ser Gly Lys Ala Ala Ala Pro Ser Glu Asp Pro Trp Gln 2515 2520 2525 Ala Val Lys Ser Leu Thr Gln Ala Arg Leu Leu Ser Gln Pro Pro Ala 2530 2535 2540 Lys Ala Phe Leu Tyr Glu Pro Thr Thr Gln Ala Ser Gly Arg Ala Ser 2545 2550 2555 2560 Ala Gly Ala Glu Gln Thr Pro Gly Pro Leu Ser Gln Ser Pro Gly Leu 2565 2570 2575 Val Lys Gln Ala Lys Gln Met Val Gly Gly Gln Gln Leu Pro Ala Leu 2580 2585 2590 Ala Ala Lys Ser Gly Gln Ser Phe Arg Ser Leu Gly Lys Ala Pro Ala 2595 2600 2605 Ser Leu Pro Thr Glu Glu Lys Lys Leu Val Thr Thr Glu Gln Ser Pro 2610 2615 2620 Trp Ala Leu Gly Lys Ala Ser Ser Arg Ala Gly Leu Trp Pro Ile Val 2625 2630 2635 2640 Ala Gly Gln Thr Leu Ala Gln Ser Cys Trp Ser Ala Gly Ser Thr Gln 2645 2650 2655 Thr Leu Ala Gln Thr Cys Trp Ser Leu Gly Arg Gly Gln Asp Pro Lys 2660 2665 2670 Pro Glu Gln Asn Thr Leu Pro Ala Leu Asn Gln Ala Pro Ser Ser His 2675 2680 2685 Lys Cys Ala Glu Ser Glu Gln Lys 2690 2695 <210> 4 <211> 2427 <212> PRT <213> NSD1_2 protein <400> 4 Met Pro Leu Lys Thr Arg Thr Ala Leu Ser Asp Asp Pro Asp Ser Ser 1 5 10 15 Thr Ser Thr Leu Gly Asn Met Leu Glu Leu Pro Gly Thr Ser Ser Ser 20 25 30 Ser Thr Ser Gln Glu Leu Pro Phe Cys Gln Pro Lys Lys Lys Ser Thr 35 40 45 Pro Leu Lys Tyr Glu Val Gly Asp Leu Ile Trp Ala Lys Phe Lys Arg 50 55 60 Arg Pro Trp Trp Pro Cys Arg Ile Cys Ser Asp Pro Leu Ile Asn Thr 65 70 75 80 His Ser Lys Met Lys Val Ser Asn Arg Arg Pro Tyr Arg Gln Tyr Tyr 85 90 95 Val Glu Ala Phe Gly Asp Pro Ser Glu Arg Ala Trp Val Ala Gly Lys 100 105 110 Ala Ile Val Met Phe Glu Gly Arg His Gln Phe Glu Glu Leu Pro Val 115 120 125 Leu Arg Arg Arg Gly Lys Gln Lys Glu Lys Gly Tyr Arg His Lys Val 130 135 140 Pro Gln Lys Ile Leu Ser Lys Trp Glu Ala Ser Val Gly Leu Ala Glu 145 150 155 160 Gln Tyr Asp Val Pro Lys Gly Ser Lys Asn Arg Lys Cys Ile Pro Gly 165 170 175 Ser Ile Lys Leu Asp Ser Glu Glu Asp Met Pro Phe Glu Asp Cys Thr 180 185 190 Asn Asp Pro Glu Ser Glu His Asp Leu Leu Leu Asn Gly Cys Leu Lys 195 200 205 Ser Leu Ala Phe Asp Ser Glu His Ser Ala Asp Glu Lys Glu Lys Pro 210 215 220 Cys Ala Lys Ser Arg Ala Arg Lys Ser Ser Asp Asn Pro Lys Arg Thr 225 230 235 240 Ser Val Lys Lys Gly His Ile Gln Phe Glu Ala His Lys Asp Glu Arg 245 250 255 Arg Gly Lys Ile Pro Glu Asn Leu Gly Leu Asn Phe Ile Ser Gly Asp 260 265 270 Ile Ser Asp Thr Gln Ala Ser Asn Glu Leu Ser Arg Ile Ala Asn Ser 275 280 285 Leu Thr Gly Ser Asn Thr Ala Pro Gly Ser Phe Leu Phe Ser Ser Cys 290 295 300 Gly Lys Asn Thr Ala Lys Lys Glu Phe Glu Thr Ser Asn Gly Asp Ser 305 310 315 320 Leu Leu Gly Leu Pro Glu Gly Ala Leu Ile Ser Lys Cys Ser Arg Glu 325 330 335 Lys Asn Lys Pro Gln Arg Ser Leu Val Cys Gly Ser Lys Val Lys Leu 340 345 350 Cys Tyr Ile Gly Ala Gly Asp Glu Glu Lys Arg Ser Asp Ser Ile Ser 355 360 365 Ile Cys Thr Thr Ser Asp Asp Gly Ser Ser Asp Leu Asp Pro Ile Glu 370 375 380 His Ser Ser Glu Ser Asp Asn Ser Val Leu Glu Ile Pro Asp Ala Phe 385 390 395 400 Asp Arg Thr Glu Asn Met Leu Ser Met Gln Lys Asn Glu Lys Ile Lys 405 410 415 Tyr Ser Arg Phe Ala Ala Thr Asn Thr Arg Val Lys Ala Lys Gln Lys 420 425 430 Pro Leu Ile Ser Asn Ser His Thr Asp His Leu Met Gly Cys Thr Lys 435 440 445 Ser Ala Glu Pro Gly Thr Glu Thr Ser Gln Val Asn Leu Ser Asp Leu 450 455 460 Lys Ala Ser Thr Leu Val His Lys Pro Gln Ser Asp Phe Thr Asn Asp 465 470 475 480 Ala Leu Ser Pro Lys Phe Asn Leu Ser Ser Ser Ile Ser Ser Glu Asn 485 490 495 Ser Leu Ile Lys Gly Gly Ala Ala Asn Gln Ala Leu Leu His Ser Lys 500 505 510 Ser Lys Gln Pro Lys Phe Arg Ser Ile Lys Cys Lys His Lys Glu Asn 515 520 525 Pro Val Met Ala Glu Pro Pro Val Ile Asn Glu Glu Cys Ser Leu Lys 530 535 540 Cys Cys Ser Ser Asp Thr Lys Gly Ser Pro Leu Ala Ser Ile Ser Lys 545 550 555 560 Ser Gly Lys Val Asp Gly Leu Lys Leu Leu Asn Asn Met His Glu Lys 565 570 575 Thr Arg Asp Ser Ser Asp Ile Glu Thr Ala Val Val Lys His Val Leu 580 585 590 Ser Glu Leu Lys Glu Leu Ser Tyr Arg Ser Leu Gly Glu Asp Val Ser 595 600 605 Asp Ser Gly Thr Ser Lys Pro Ser Lys Pro Leu Leu Phe Ser Ser Ala 610 615 620 Ser Ser Gln Asn His Ile Pro Ile Glu Pro Asp Tyr Lys Phe Ser Thr 625 630 635 640 Leu Leu Met Met Leu Lys Asp Met His Asp Ser Lys Thr Lys Glu Gln 645 650 655 Arg Leu Met Thr Ala Gln Asn Leu Val Ser Tyr Arg Ser Pro Gly Arg 660 665 670 Gly Asp Cys Ser Thr Asn Ser Pro Val Gly Val Ser Lys Val Leu Val 675 680 685 Ser Gly Gly Ser Thr His Asn Ser Glu Lys Lys Gly Asp Gly Thr Gln 690 695 700 Asn Ser Ala Asn Pro Ser Pro Ser Gly Gly Asp Ser Ala Leu Ser Gly 705 710 715 720 Glu Leu Ser Ala Ser Leu Pro Gly Leu Leu Ser Asp Lys Arg Asp Leu 725 730 735 Pro Ala Ser Gly Lys Ser Arg Ser Asp Cys Val Thr Arg Arg Asn Cys 740 745 750 Gly Arg Ser Lys Pro Ser Ser Lys Leu Arg Asp Ala Phe Ser Ala Gln 755 760 765 Met Val Lys Asn Thr Val Asn Arg Lys Ala Leu Lys Thr Glu Arg Lys 770 775 780 Arg Lys Leu Asn Gln Leu Pro Ser Val Thr Leu Asp Ala Val Leu Gln 785 790 795 800 Gly Asp Arg Glu Arg Gly Gly Ser Leu Arg Gly Gly Ala Glu Asp Pro 805 810 815 Ser Lys Glu Asp Pro Leu Gln Ile Met Gly His Leu Thr Ser Glu Asp 820 825 830 Gly Asp His Phe Ser Asp Val His Phe Asp Ser Lys Val Lys Gln Ser 835 840 845 Asp Pro Gly Lys Ile Ser Glu Lys Gly Leu Ser Phe Glu Asn Gly Lys 850 855 860 Gly Pro Glu Leu Asp Ser Val Met Asn Ser Glu Asn Asp Glu Leu Asn 865 870 875 880 Gly Val Asn Gln Val Val Pro Lys Lys Arg Trp Gln Arg Leu Asn Gln 885 890 895 Arg Arg Thr Lys Pro Arg Lys Arg Met Asn Arg Phe Lys Glu Lys Glu 900 905 910 Asn Ser Glu Cys Ala Phe Arg Val Leu Leu Pro Ser Asp Pro Val Gln 915 920 925 Glu Gly Arg Asp Glu Phe Pro Glu His Arg Thr Pro Ser Ala Ser Ile 930 935 940 Leu Glu Glu Pro Leu Thr Glu Gln Asn His Ala Asp Cys Leu Asp Ser 945 950 955 960 Ala Gly Pro Arg Leu Asn Val Cys Asp Lys Ser Ser Ala Ser Ile Gly 965 970 975 Asp Met Glu Lys Glu Pro Gly Ile Pro Ser Leu Thr Pro Gln Ala Glu 980 985 990 Leu Pro Glu Pro Ala Val Arg Ser Glu Lys Lys Arg Leu Arg Lys Pro 995 1000 1005 Ser Lys Trp Leu Leu Glu Tyr Thr Glu Glu Tyr Asp Gln Ile Phe Ala 1010 1015 1020 Pro Lys Lys Lys Gln Lys Lys Val Gln Glu Gln Val His Lys Val Ser 1025 1030 1035 1040 Ser Arg Cys Glu Glu Glu Ser Leu Leu Ala Arg Gly Arg Ser Ser Ala 1045 1050 1055 Gln Asn Lys Gln Val Asp Glu Asn Ser Leu Ile Ser Thr Lys Glu Glu 1060 1065 1070 Pro Pro Val Leu Glu Arg Glu Ala Pro Phe Leu Glu Gly Pro Leu Ala 1075 1080 1085 Gln Ser Glu Leu Gly Gly Gly His Ala Glu Leu Pro Gln Leu Thr Leu 1090 1095 1100 Ser Val Pro Val Ala Pro Glu Val Ser Pro Arg Pro Ala Leu Glu Ser 1105 1110 1115 1120 Glu Glu Leu Leu Val Lys Thr Pro Gly Asn Tyr Glu Ser Lys Arg Gln 1125 1130 1135 Arg Lys Pro Thr Lys Lys Leu Leu Glu Ser Asn Asp Leu Asp Pro Gly 1140 1145 1150 Phe Met Pro Lys Lys Gly Asp Leu Gly Leu Ser Lys Lys Cys Tyr Glu 1155 1160 1165 Ala Gly His Leu Glu Asn Gly Ile Thr Glu Ser Cys Ala Thr Ser Tyr 1170 1175 1180 Ser Lys Asp Phe Gly Gly Gly Thr Thr Lys Ile Phe Asp Lys Pro Arg 1185 1190 1195 1200 Lys Arg Lys Arg Gln Arg His Ala Ala Ala Lys Met Gln Cys Lys Lys 1205 1210 1215 Val Lys Asn Asp Asp Ser Ser Lys Glu Ile Pro Gly Ser Glu Gly Glu 1220 1225 1230 Leu Met Pro His Arg Thr Ala Thr Ser Pro Lys Glu Thr Val Glu Glu 1235 1240 1245 Gly Val Glu His Asp Pro Gly Met Pro Ala Ser Lys Lys Met Gln Gly 1250 1255 1260 Glu Arg Gly Gly Gly Ala Ala Leu Lys Glu Asn Val Cys Gln Asn Cys 1265 1270 1275 1280 Glu Lys Leu Gly Glu Leu Leu Leu Cys Glu Ala Gln Cys Cys Gly Ala 1285 1290 1295 Phe His Leu Glu Cys Leu Gly Leu Thr Glu Met Pro Arg Gly Lys Phe 1300 1305 1310 Ile Cys Asn Glu Cys Arg Thr Gly Ile His Thr Cys Phe Val Cys Lys 1315 1320 1325 Gln Ser Gly Glu Asp Val Lys Arg Cys Leu Leu Pro Leu Cys Gly Lys 1330 1335 1340 Phe Tyr His Glu Glu Cys Val Gln Lys Tyr Pro Pro Thr Val Met Gln 1345 1350 1355 1360 Asn Lys Gly Phe Arg Cys Ser Leu His Ile Cys Ile Thr Cys His Ala 1365 1370 1375 Ala Asn Pro Ala Asn Val Ser Ala Ser Lys Gly Arg Leu Met Arg Cys 1380 1385 1390 Val Arg Cys Pro Val Ala Tyr His Ala Asn Asp Phe Cys Leu Ala Ala 1395 1400 1405 Gly Ser Lys Ile Leu Ala Ser Asn Ser Ile Ile Cys Pro Asn His Phe 1410 1415 1420 Thr Pro Arg Arg Gly Cys Arg Asn His Glu His Val Asn Val Ser Trp 1425 1430 1435 1440 Cys Phe Val Cys Ser Glu Gly Gly Ser Leu Leu Cys Cys Asp Ser Cys 1445 1450 1455 Pro Ala Ala Phe His Arg Glu Cys Leu Asn Ile Asp Ile Pro Glu Gly 1460 1465 1470 Asn Trp Tyr Cys Asn Asp Cys Lys Ala Gly Lys Lys Pro His Tyr Arg 1475 1480 1485 Glu Ile Val Trp Val Lys Val Gly Arg Tyr Arg Trp Trp Pro Ala Glu 1490 1495 1500 Ile Cys His Pro Arg Ala Val Pro Ser Asn Ile Asp Lys Met Arg His 1505 1510 1515 1520 Asp Val Gly Glu Phe Pro Val Leu Phe Phe Gly Ser Asn Asp Tyr Leu 1525 1530 1535 Trp Thr His Gln Ala Arg Val Phe Pro Tyr Met Glu Gly Asp Val Ser 1540 1545 1550 Ser Lys Asp Lys Met Gly Lys Gly Val Asp Gly Thr Tyr Lys Lys Ala 1555 1560 1565 Leu Gln Glu Ala Ala Ala Arg Phe Glu Glu Leu Lys Ala Gln Lys Glu 1570 1575 1580 Leu Arg Gln Leu Gln Glu Asp Arg Lys Asn Asp Lys Lys Pro Pro Pro 1585 1590 1595 1600 Tyr Lys His Ile Lys Val Asn Arg Pro Ile Gly Arg Val Gln Ile Phe 1605 1610 1615 Thr Ala Asp Leu Ser Glu Ile Pro Arg Cys Asn Cys Lys Ala Thr Asp 1620 1625 1630 Glu Asn Pro Cys Gly Ile Asp Ser Glu Cys Ile Asn Arg Met Leu Leu 1635 1640 1645 Tyr Glu Cys His Pro Thr Val Cys Pro Ala Gly Gly Arg Cys Gln Asn 1650 1655 1660 Gln Cys Phe Ser Lys Arg Gln Tyr Pro Glu Val Glu Ile Phe Arg Thr 1665 1670 1675 1680 Leu Gln Arg Gly Trp Gly Leu Arg Thr Lys Thr Asp Ile Lys Lys Gly 1685 1690 1695 Glu Phe Val Asn Glu Tyr Val Gly Glu Leu Ile Asp Glu Glu Glu Cys 1700 1705 1710 Arg Ala Arg Ile Arg Tyr Ala Gln Glu His Asp Ile Thr Asn Phe Tyr 1715 1720 1725 Met Leu Thr Leu Asp Lys Asp Arg Ile Ile Asp Ala Gly Pro Lys Gly 1730 1735 1740 Asn Tyr Ala Arg Phe Met Asn His Cys Cys Gln Pro Asn Cys Glu Thr 1745 1750 1755 1760 Gln Lys Trp Ser Val Asn Gly Asp Thr Arg Val Gly Leu Phe Ala Leu 1765 1770 1775 Ser Asp Ile Lys Ala Gly Thr Glu Leu Thr Phe Asn Tyr Asn Leu Glu 1780 1785 1790 Cys Leu Gly Asn Gly Lys Thr Val Cys Lys Cys Gly Ala Pro Asn Cys 1795 1800 1805 Ser Gly Phe Leu Gly Val Arg Pro Lys Asn Gln Pro Ile Ala Thr Glu 1810 1815 1820 Glu Lys Ser Lys Lys Phe Lys Lys Lys Gln Gln Gly Lys Arg Arg Thr 1825 1830 1835 1840 Gln Gly Glu Ile Thr Lys Glu Arg Glu Asp Glu Cys Phe Ser Cys Gly 1845 1850 1855 Asp Ala Gly Gln Leu Val Ser Cys Lys Lys Pro Gly Cys Pro Lys Val 1860 1865 1870 Tyr His Ala Asp Cys Leu Asn Leu Thr Lys Arg Pro Ala Gly Lys Trp 1875 1880 1885 Glu Cys Pro Trp His Gln Cys Asp Ile Cys Gly Lys Glu Ala Ala Ser 1890 1895 1900 Phe Cys Glu Met Cys Pro Ser Ser Phe Cys Lys Gln His Arg Glu Gly 1905 1910 1915 1920 Met Leu Phe Ile Ser Lys Leu Asp Gly Arg Leu Ser Cys Thr Glu His 1925 1930 1935 Asp Pro Cys Gly Pro Asn Pro Leu Glu Pro Gly Glu Ile Arg Glu Tyr 1940 1945 1950 Val Pro Pro Pro Val Pro Leu Pro Pro Gly Pro Ser Thr His Leu Ala 1955 1960 1965 Glu Gln Ser Thr Gly Met Ala Ala Gln Ala Pro Lys Met Ser Asp Lys 1970 1975 1980 Pro Pro Ala Asp Thr Asn Gln Met Leu Ser Leu Ser Lys Lys Ala Leu 1985 1990 1995 2000 Ala Gly Thr Cys Gln Arg Pro Leu Leu Pro Glu Arg Pro Leu Glu Arg 2005 2010 2015 Thr Asp Ser Arg Pro Gln Pro Leu Asp Lys Val Arg Asp Leu Ala Gly 2020 2025 2030 Ser Gly Thr Lys Ser Gln Ser Leu Val Ser Ser Gln Arg Pro Leu Asp 2035 2040 2045 Arg Pro Pro Ala Val Ala Gly Pro Arg Pro Gln Leu Ser Asp Lys Pro 2050 2055 2060 Ser Pro Val Thr Ser Pro Ser Ser Ser Pro Ser Val Arg Ser Gln Pro 2065 2070 2075 2080 Leu Glu Arg Pro Leu Gly Thr Ala Asp Pro Arg Leu Asp Lys Ser Ile 2085 2090 2095 Gly Ala Ala Ser Pro Arg Pro Gln Ser Leu Glu Lys Thr Ser Val Pro 2100 2105 2110 Thr Gly Leu Arg Leu Pro Pro Pro Asp Arg Leu Leu Ile Thr Ser Ser 2115 2120 2125 Pro Lys Pro Gln Thr Ser Asp Arg Pro Thr Asp Lys Pro His Ala Ser 2130 2135 2140 Leu Ser Gln Arg Leu Pro Pro Pro Glu Lys Val Leu Ser Ala Val Val 2145 2150 2155 2160 Gln Thr Leu Val Ala Lys Glu Lys Ala Leu Arg Pro Val Asp Gln Asn 2165 2170 2175 Thr Gln Ser Lys Asn Arg Ala Ala Leu Val Met Asp Leu Ile Asp Leu 2180 2185 2190 Thr Pro Arg Gln Lys Glu Arg Ala Ala Ser Pro His Gln Val Thr Pro 2195 2200 2205 Gln Ala Asp Glu Lys Met Pro Val Leu Glu Ser Ser Ser Trp Pro Ala 2210 2215 2220 Ser Lys Gly Leu Gly His Met Pro Arg Ala Val Glu Lys Gly Cys Val 2225 2230 2235 2240 Ser Asp Pro Leu Gln Thr Ser Gly Lys Ala Ala Ala Pro Ser Glu Asp 2245 2250 2255 Pro Trp Gln Ala Val Lys Ser Leu Thr Gln Ala Arg Leu Leu Ser Gln 2260 2265 2270 Pro Pro Ala Lys Ala Phe Leu Tyr Glu Pro Thr Thr Gln Ala Ser Gly 2275 2280 2285 Arg Ala Ser Ala Gly Ala Glu Gln Thr Pro Gly Pro Leu Ser Gln Ser 2290 2295 2300 Pro Gly Leu Val Lys Gln Ala Lys Gln Met Val Gly Gly Gln Gln Leu 2305 2310 2315 2320 Pro Ala Leu Ala Ala Lys Ser Gly Gln Ser Phe Arg Ser Leu Gly Lys 2325 2330 2335 Ala Pro Ala Ser Leu Pro Thr Glu Glu Lys Lys Leu Val Thr Thr Glu 2340 2345 2350 Gln Ser Pro Trp Ala Leu Gly Lys Ala Ser Ser Arg Ala Gly Leu Trp 2355 2360 2365 Pro Ile Val Ala Gly Gln Thr Leu Ala Gln Ser Cys Trp Ser Ala Gly 2370 2375 2380 Ser Thr Gln Thr Leu Ala Gln Thr Cys Trp Ser Leu Gly Arg Gly Gln 2385 2390 2395 2400 Asp Pro Lys Pro Glu Gln Asn Thr Leu Pro Ala Leu Asn Gln Ala Pro 2405 2410 2415 Ser Ser His Lys Cys Ala Glu Ser Glu Gln Lys 2420 2425 <210> 5 <211> 8091 <212> DNA <213> NSD1_1 polynucleotide <400> 5 atggatcaga cctgtgaact acccagaaga aattgtctgc tgcccttttc caatccagtg 60 aatttagatg cccctgaaga caaggacagc cctttcggta atggtcaatc caatttttct 120 gagccactta atgggtgtac tatgcagtta tcgactgtca gtggaacatc ccaaaatgct 180 tatggacaag attctccatc ttgttacatt ccactgcgga gactacagga tttggcctcc 240 atgatcaatg tagagtattt aaatgggtct gctgatggat cagaatcctt tcaagaccct 300 gaaaaaagtg attcaagagc tcagacgcca attgtttgca cttccttgag tcctggtggt 360 cctacagcac ttgctatgaa acaggaaccc tcttgtaata actcccctga actccaggta 420 aaagtaacaa agactatcaa gaatggcttt ctgcactttg agaattttac ttgtgtggac 480 gatgcagatg tagattctga aatggaccca gaacagccag tcacagagga tgagagtata 540 gaggagatct ttgaggaaac tcagaccaat gccacctgca attatgagac taaatcagag 600 aatggtgtaa aagtggccat gggaagtgaa caagacagca caccagagag tagacacggt 660 gcagtcaaat cgccattctt gccattagct cctcagactg aaacacagaa aaataagcaa 720 agaaatgaag tggacggcag caatgaaaaa gcagcccttc tcccagcccc cttttcacta 780 ggagacacaa acattacaat agaagagcaa ttaaactcaa taaatttatc ttttcaggat 840 gatccagatt ccagtaccag tacattagga aacatgctag aattacctgg aacttcatca 900 tcatctactt cacaggaatt gccattttgt caacctaaga aaaagtctac gccactgaag 960 tatgaagttg gagatctcat ctgggcaaaa ttcaagagac gcccatggtg gccctgcagg 1020 atttgttctg atccgttgat taacacacat tcaaaaatga aagtttccaa ccggaggccc 1080 tatcggcagt actacgtgga ggcttttgga gatccttctg agagagcctg ggtggctgga 1140 aaagcaatcg tcatgtttga aggcagacat caattcgaag agctacctgt ccttaggaga 1200 agagggaaac agaaagaaaa aggatatagg cataaggttc ctcagaaaat tttgagtaaa 1260 tgggaagcca gtgttggact tgcagaacag tatgatgttc ccaaggggtc aaagaaccga 1320 aaatgtattc ctggttcaat caagttggac agtgaagaag atatgccatt tgaagactgc 1380 acaaatgatc ctgagtcaga acatgacctg ttgcttaatg gctgtttgaa atcactggct 1440 tttgattctg aacattctgc agatgagaag gaaaagcctt gcgctaaatc tcgagccaga 1500 aagagctctg ataatccaaa aaggactagt gtgaaaaagg gccacataca atttgaagca 1560 cataaagatg aacggagggg aaagattcca gagaaccttg gcctaaactt tatctctggg 1620 gatatatctg atacgcaggc ctctaatgaa ctttccagga tagcaaatag cctcacaggg 1680 tccaacactg ccccaggaag ttttctgttt tcttcctgtg gaaaaaacac tgcaaagaaa 1740 gaatttgaga cttcaaatgg tgactcttta ttgggcttgc ctgagggtgc tttgatctca 1800 aagtgttctc gagagaagaa taaaccccaa cgaagcctgg tgtgtggttc aaaagtgaag 1860 ctctgctata ttggagcagg tgatgaggaa aagcgaagtg attccattag tatctgtacc 1920 acttctgatg atggaagcag tgacctggat cccatagaac acagctcaga gtctgataac 1980 agtgtccttg aaattccaga tgctttcgat agaacagaga acatgttatc tatgcagaaa 2040 aatgaaaaga taaagtattc taggtttgct gccacaaaca ctagggtaaa agcaaaacag 2100 aagcctctca ttagtaactc acatacagac cacttaatgg gttgtactaa gagtgcagag 2160 cctggaaccg agacgtctca ggttaatctc tctgatctga aggcatctac tcttgttcac 2220 aaaccccagt cagattttac aaatgatgct ctctctccaa aattcaacct gtcatcaagc 2280 atatccagtg agaactcgtt aataaagggt ggggcagcaa atcaagctct attacattcg 2340 aaaagcaaac agcccaagtt ccgaagtata aagtgcaaac acaaagaaaa tccagttatg 2400 gcagaacccc cagttataaa tgaggagtgc agtttgaaat gctgctcttc tgataccaaa 2460 ggctctcctt tggccagcat ttctaaaagt gggaaagtgg atggtctaaa actactgaac 2520 aatatgcatg agaaaaccag ggattcaagt gacatagaaa cagcagtggt gaaacatgtt 2580 ttatccgagt tgaaggaact ctcttacaga tccttaggtg aggatgtcag tgactctgga 2640 acatcaaagc catcaaaacc attacttttc tcttctgctt ctagtcagaa tcacatacct 2700 attgaaccag actacaaatt cagtacattg ctaatgatgt tgaaagatat gcatgatagt 2760 aagacgaagg agcagcggtt gatgactgct caaaacctgg tctcttaccg gagtcctggt 2820 cgtggggact gttctactaa tagtcctgta ggagtctcta aggttttggt ttcaggaggc 2880 tccacacaca attcagagaa aaagggagat ggcactcaga actccgccaa tcctagccct 2940 agtgggggtg actctgcatt atctggcgag ttgtctgctt ccctacctgg cttactgtcc 3000 gacaagagag acctccctgc ttctggtaaa agtcgttcag actgtgttac taggcgcaac 3060 tgtggacgat caaagccttc atccaaattg cgagatgctt tttcagccca aatggtaaag 3120 aacacagtga accgtaaagc cttaaagacc gagcgcaaaa gaaaactgaa tcagcttcca 3180 agtgtgactc ttgatgctgt actgcaggga gaccgagaac gtggaggttc attgagaggt 3240 ggggcagaag atcctagtaa agaggatccc cttcagataa tgggccactt aacaagtgaa 3300 gatggtgacc atttttctga tgtgcatttc gatagcaagg ttaagcaatc tgatcctggt 3360 aaaatttctg aaaaaggact ctcttttgaa aacggaaaag gcccagagct ggactctgta 3420 atgaacagtg agaatgatga actcaatggt gtaaatcaag tggtgcctaa aaagcggtgg 3480 cagcgtttaa accaaaggcg cactaaacct cgtaagcgca tgaacagatt taaagagaaa 3540 gaaaactctg agtgtgcctt tagggtctta cttcctagtg accctgtgca ggaggggcgg 3600 gatgagtttc cagagcatag aactccttca gcaagcatac ttgaggaacc actgacagag 3660 caaaatcatg ctgactgctt agattcagct gggccacggt taaatgtttg tgataaatcc 3720 agtgccagca ttggtgacat ggaaaaggag ccaggaattc ccagtttgac accacaggct 3780 gagctccctg aaccagctgt gcggtcagag aagaaacgcc ttaggaagcc aagcaagtgg 3840 cttttggaat atacagaaga atatgatcag atatttgctc ctaagaaaaa acaaaagaag 3900 gtacaggagc aggtgcacaa ggtaagttcc cgctgtgaag aggaaagcct tctagcccga 3960 ggtcgatcta gtgctcagaa caagcaggtg gacgagaatt ctttgatttc aaccaaagaa 4020 gagcctccag ttcttgaaag ggaggctccg tttttggagg gccccttggc tcagtcagaa 4080 cttggaggtg gacatgctga gttgccgcag ctgaccttgt ctgtgcctgt ggctccggaa 4140 gtctctccac ggcctgccct tgagtctgag gaattgctag ttaaaacgcc aggaaattat 4200 gaaagtaaac gtcaaagaaa accaactaag aaacttcttg aatccaatga tttagaccct 4260 ggatttatgc ccaagaaggg ggaccttggc ctttctaaaa agtgctatga agctggtcac 4320 ctggagaatg gcataactga atcttgtgcc acatcttatt caaaagattt tggtggaggc 4380 actaccaaga tatttgacaa gccaaggaag cgaaaacgac agaggcatgc tgcagccaag 4440 atgcagtgta aaaaagtgaa aaatgatgac tcgtcaaaag agattccagg ctcagaggga 4500 gaactaatgc ctcacaggac ggccacaagc cccaaggaga ctgttgagga aggtgtagaa 4560 cacgatcccg ggatgcctgc ctctaaaaaa atgcagggtg aacgcggtgg aggagctgca 4620 ctcaaggaga atgtctgtca gaattgtgaa aaattgggtg agctgctgtt atgtgaggct 4680 cagtgctgtg gggctttcca cctggagtgc cttggattga ctgagatgcc aagaggaaaa 4740 tttatctgca atgaatgtcg cacaggaatc catacctgtt ttgtatgtaa gcagagtggg 4800 gaagatgtta aaaggtgcct tctacccttg tgtggaaagt tttaccatga agagtgtgtc 4860 cagaagtacc cacccactgt tatgcagaac aagggcttcc ggtgctccct ccacatctgt 4920 ataacctgtc atgctgctaa tccagccaat gtttctgcat ctaaaggtcg gttgatgcgc 4980 tgtgtccgct gtcctgtggc ataccacgcc aatgactttt gcctggctgc tgggtcaaag 5040 atccttgcat ctaatagtat catctgccct aatcacttta cccctaggcg gggctgccga 5100 aatcatgagc atgttaatgt tagctggtgc tttgtgtgct cagaaggagg cagccttctg 5160 tgctgtgatt cttgccctgc tgcttttcat cgtgaatgcc tgaacattga tatccctgaa 5220 ggaaactggt attgcaatga ctgtaaagca ggcaaaaagc cacactacag ggagattgtc 5280 tgggtaaaag ttggacgata caggtggtgg ccagctgaga tctgccatcc tcgagctgtt 5340 ccttccaaca ttgataagat gagacatgat gtgggagagt tcccagtcct cttttttgga 5400 tctaatgact atttgtggac tcaccaggcc cgagtcttcc cttacatgga gggtgacgtg 5460 agcagcaagg ataagatggg caaaggagtg gatgggacat ataaaaaagc tcttcaggaa 5520 gctgcagcaa ggtttgagga attaaaggcc caaaaagagc taagacagct gcaggaagac 5580 cgaaagaatg acaagaagcc accaccttat aaacatataa aggtaaaccg tcctattggc 5640 agggtacaga tcttcactgc agacttatct gaaatacccc gttgcaactg taaagctact 5700 gatgagaacc cctgtgggat agactctgaa tgcatcaacc gcatgctgct ctatgagtgc 5760 caccccacag tgtgtcctgc cggagggcgc tgtcaaaacc agtgcttttc caagcgccaa 5820 tatccagagg ttgaaatttt ccgcacatta cagcggggtt ggggtctacg gacaaaaaca 5880 gatattaaaa agggtgaatt tgtgaatgag tatgtgggtg agcttataga tgaagaagaa 5940 tgcagagctc gaattcgcta tgctcaagaa catgatatca ctaatttcta tatgctcacc 6000 ctagacaaag accgaatcat tgatgctggt cccaaaggaa actatgctcg gttcatgaat 6060 cattgctgcc agcccaactg tgaaacacag aagtggtctg tgaatggaga tacccgtgta 6120 ggcctttttg cactaagtga cattaaagca ggcactgaac ttaccttcaa ctacaaccta 6180 gaatgtcttg ggaatggaaa gactgtttgc aaatgtggag ccccgaactg cagtggcttc 6240 ttgggtgtaa ggccaaagaa tcaacccatt gccacggaag aaaagtcaaa gaaattcaag 6300 aagaagcaac agggaaagcg caggacccag ggtgaaatca caaaggagcg agaagatgag 6360 tgttttagtt gtggggatgc tggccagctc gtctcctgca agaaaccagg ctgcccaaaa 6420 gtttaccacg cagactgtct caatctgacc aagcgaccag cagggaaatg ggaatgtccg 6480 tggcatcagt gtgacatctg cgggaaggaa gcagcctcct tctgtgagat gtgccccagc 6540 tccttttgta agcagcatcg agaagggatg cttttcattt ccaaactgga tgggcgtctg 6600 tcttgtactg agcatgaccc ctgtgggccc aatcctctgg aacctgggga gatccgtgag 6660 tatgtgcctc ccccagtacc gctgcctcca gggccaagca ctcacctggc agagcaatca 6720 acaggaatgg ctgctcaggc acccaaaatg tcagataaac ctcctgctga caccaaccag 6780 atgctgtcgc tctccaaaaa agctctggca gggacttgtc agaggccatt gctacctgaa 6840 agacctcttg agagaactga ctccaggccc cagcctttag ataaggtcag agacctcgct 6900 gggtcaggga ccaaatccca atccttggtt tccagccaga ggccactgga caggccacca 6960 gcagtggcag gaccaagacc ccagctaagc gacaaaccct ctccagtgac cagcccaagc 7020 tcctcaccct cagtcaggtc ccaaccactg gaaagacctc tggggacggc tgacccaagg 7080 ctggataaat ccataggtgc tgccagccca aggccccagt cactggagaa aacctcagtt 7140 cccactggcc tgagacttcc gccgccagac agactgctca ttactagcag tcccaaaccc 7200 cagacttcag acaggcctac tgacaaaccc catgcctctt tgtcccagag actcccacct 7260 cctgagaaag tactatcagc tgtggtccag acccttgtag ctaaagaaaa agcactgagg 7320 cctgtggacc agaatactca gtcaaaaaat agagctgctt tggtgatgga tctcatagac 7380 ctaactcctc gccagaagga gcgggcagct tcacctcatc aggtcacacc acaggctgat 7440 gagaagatgc cagtgttgga gtcaagttca tggcctgcca gcaaaggtct ggggcatatg 7500 ccgagagctg ttgagaaagg ctgtgtgtca gatcctcttc agacatctgg gaaagcagca 7560 gccccttcag aggacccctg gcaagctgtt aaatcactca cccaggccag acttctttct 7620 cagcctcctg ccaaggcctt tttatatgag ccaacaactc aggcctcagg aagagcttct 7680 gcaggggctg agcagacccc agggcctctt agccaatccc cgggcctggt gaagcaggcg 7740 aagcagatgg tcggaggcca gcaactacct gcacttgccg ccaagagtgg gcaatctttt 7800 aggtctctcg ggaaggcccc agcctccctc cccactgaag aaaagaagtt ggtaaccaca 7860 gagcaaagtc cctgggccct gggaaaagcc tcatcacggg cagggctctg gcccatagtg 7920 gctggacaga cactggcaca gtcttgctgg tctgctggga gcacacagac attggcacag 7980 acttgctggt ctcttggaag agggcaagac cccaaaccag agcaaaatac acttccagct 8040 cttaaccagg ctccttccag tcacaagtgt gcagaatcag aacagaagta g 8091 <210> 6 <211> 7284 <212> DNA <213> NSD1_2 polynucleotide <400> 6 atgcccctga agacaaggac agccctttcg gatgatccag attccagtac cagtacatta 60 ggaaacatgc tagaattacc tggaacttca tcatcatcta cttcacagga attgccattt 120 tgtcaaccta agaaaaagtc tacgccactg aagtatgaag ttggagatct catctgggca 180 aaattcaaga gacgcccatg gtggccctgc aggatttgtt ctgatccgtt gattaacaca 240 cattcaaaaa tgaaagtttc caaccggagg ccctatcggc agtactacgt ggaggctttt 300 ggagatcctt ctgagagagc ctgggtggct ggaaaagcaa tcgtcatgtt tgaaggcaga 360 catcaattcg aagagctacc tgtccttagg agaagaggga aacagaaaga aaaaggatat 420 aggcataagg ttcctcagaa aattttgagt aaatgggaag ccagtgttgg acttgcagaa 480 cagtatgatg ttcccaaggg gtcaaagaac cgaaaatgta ttcctggttc aatcaagttg 540 gacagtgaag aagatatgcc atttgaagac tgcacaaatg atcctgagtc agaacatgac 600 ctgttgctta atggctgttt gaaatcactg gcttttgatt ctgaacattc tgcagatgag 660 aaggaaaagc cttgcgctaa atctcgagcc agaaagagct ctgataatcc aaaaaggact 720 agtgtgaaaa agggccacat acaatttgaa gcacataaag atgaacggag gggaaagatt 780 ccagagaacc ttggcctaaa ctttatctct ggggatatat ctgatacgca ggcctctaat 840 gaactttcca ggatagcaaa tagcctcaca gggtccaaca ctgccccagg aagttttctg 900 ttttcttcct gtggaaaaaa cactgcaaag aaagaatttg agacttcaaa tggtgactct 960 ttattgggct tgcctgaggg tgctttgatc tcaaagtgtt ctcgagagaa gaataaaccc 1020 caacgaagcc tggtgtgtgg ttcaaaagtg aagctctgct atattggagc aggtgatgag 1080 gaaaagcgaa gtgattccat tagtatctgt accacttctg atgatggaag cagtgacctg 1140 gatcccatag aacacagctc agagtctgat aacagtgtcc ttgaaattcc agatgctttc 1200 gatagaacag agaacatgtt atctatgcag aaaaatgaaa agataaagta ttctaggttt 1260 gctgccacaa acactagggt aaaagcaaaa cagaagcctc tcattagtaa ctcacataca 1320 gaccacttaa tgggttgtac taagagtgca gagcctggaa ccgagacgtc tcaggttaat 1380 ctctctgatc tgaaggcatc tactcttgtt cacaaacccc agtcagattt tacaaatgat 1440 gctctctctc caaaattcaa cctgtcatca agcatatcca gtgagaactc gttaataaag 1500 ggtggggcag caaatcaagc tctattacat tcgaaaagca aacagcccaa gttccgaagt 1560 ataaagtgca aacacaaaga aaatccagtt atggcagaac ccccagttat aaatgaggag 1620 tgcagtttga aatgctgctc ttctgatacc aaaggctctc ctttggccag catttctaaa 1680 agtgggaaag tggatggtct aaaactactg aacaatatgc atgagaaaac cagggattca 1740 agtgacatag aaacagcagt ggtgaaacat gttttatccg agttgaagga actctcttac 1800 agatccttag gtgaggatgt cagtgactct ggaacatcaa agccatcaaa accattactt 1860 ttctcttctg cttctagtca gaatcacata cctattgaac cagactacaa attcagtaca 1920 ttgctaatga tgttgaaaga tatgcatgat agtaagacga aggagcagcg gttgatgact 1980 gctcaaaacc tggtctctta ccggagtcct ggtcgtgggg actgttctac taatagtcct 2040 gtaggagtct ctaaggtttt ggtttcagga ggctccacac acaattcaga gaaaaaggga 2100 gatggcactc agaactccgc caatcctagc cctagtgggg gtgactctgc attatctggc 2160 gagttgtctg cttccctacc tggcttactg tccgacaaga gagacctccc tgcttctggt 2220 aaaagtcgtt cagactgtgt tactaggcgc aactgtggac gatcaaagcc ttcatccaaa 2280 ttgcgagatg ctttttcagc ccaaatggta aagaacacag tgaaccgtaa agccttaaag 2340 accgagcgca aaagaaaact gaatcagctt ccaagtgtga ctcttgatgc tgtactgcag 2400 ggagaccgag aacgtggagg ttcattgaga ggtggggcag aagatcctag taaagaggat 2460 ccccttcaga taatgggcca cttaacaagt gaagatggtg accatttttc tgatgtgcat 2520 ttcgatagca aggttaagca atctgatcct ggtaaaattt ctgaaaaagg actctctttt 2580 gaaaacggaa aaggcccaga gctggactct gtaatgaaca gtgagaatga tgaactcaat 2640 ggtgtaaatc aagtggtgcc taaaaagcgg tggcagcgtt taaaccaaag gcgcactaaa 2700 cctcgtaagc gcatgaacag atttaaagag aaagaaaact ctgagtgtgc ctttagggtc 2760 ttacttccta gtgaccctgt gcaggagggg cgggatgagt ttccagagca tagaactcct 2820 tcagcaagca tacttgagga accactgaca gagcaaaatc atgctgactg cttagattca 2880 gctgggccac ggttaaatgt ttgtgataaa tccagtgcca gcattggtga catggaaaag 2940 gagccaggaa ttcccagttt gacaccacag gctgagctcc ctgaaccagc tgtgcggtca 3000 gagaagaaac gccttaggaa gccaagcaag tggcttttgg aatatacaga agaatatgat 3060 cagatatttg ctcctaagaa aaaacaaaag aaggtacagg agcaggtgca caaggtaagt 3120 tcccgctgtg aagaggaaag ccttctagcc cgaggtcgat ctagtgctca gaacaagcag 3180 gtggacgaga attctttgat ttcaaccaaa gaagagcctc cagttcttga aagggaggct 3240 ccgtttttgg agggcccctt ggctcagtca gaacttggag gtggacatgc tgagttgccg 3300 cagctgacct tgtctgtgcc tgtggctccg gaagtctctc cacggcctgc ccttgagtct 3360 gaggaattgc tagttaaaac gccaggaaat tatgaaagta aacgtcaaag aaaaccaact 3420 aagaaacttc ttgaatccaa tgatttagac cctggattta tgcccaagaa gggggacctt 3480 ggcctttcta aaaagtgcta tgaagctggt cacctggaga atggcataac tgaatcttgt 3540 gccacatctt attcaaaaga ttttggtgga ggcactacca agatatttga caagccaagg 3600 aagcgaaaac gacagaggca tgctgcagcc aagatgcagt gtaaaaaagt gaaaaatgat 3660 gactcgtcaa aagagattcc aggctcagag ggagaactaa tgcctcacag gacggccaca 3720 agccccaagg agactgttga ggaaggtgta gaacacgatc ccgggatgcc tgcctctaaa 3780 aaaatgcagg gtgaacgcgg tggaggagct gcactcaagg agaatgtctg tcagaattgt 3840 gaaaaattgg gtgagctgct gttatgtgag gctcagtgct gtggggcttt ccacctggag 3900 tgccttggat tgactgagat gccaagagga aaatttatct gcaatgaatg tcgcacagga 3960 atccatacct gttttgtatg taagcagagt ggggaagatg ttaaaaggtg ccttctaccc 4020 ttgtgtggaa agttttacca tgaagagtgt gtccagaagt acccacccac tgttatgcag 4080 aacaagggct tccggtgctc cctccacatc tgtataacct gtcatgctgc taatccagcc 4140 aatgtttctg catctaaagg tcggttgatg cgctgtgtcc gctgtcctgt ggcataccac 4200 gccaatgact tttgcctggc tgctgggtca aagatccttg catctaatag tatcatctgc 4260 cctaatcact ttacccctag gcggggctgc cgaaatcatg agcatgttaa tgttagctgg 4320 tgctttgtgt gctcagaagg aggcagcctt ctgtgctgtg attcttgccc tgctgctttt 4380 catcgtgaat gcctgaacat tgatatccct gaaggaaact ggtattgcaa tgactgtaaa 4440 gcaggcaaaa agccacacta cagggagatt gtctgggtaa aagttggacg atacaggtgg 4500 tggccagctg agatctgcca tcctcgagct gttccttcca acattgataa gatgagacat 4560 gatgtgggag agttcccagt cctctttttt ggatctaatg actatttgtg gactcaccag 4620 gcccgagtct tcccttacat ggagggtgac gtgagcagca aggataagat gggcaaagga 4680 gtggatggga catataaaaa agctcttcag gaagctgcag caaggtttga ggaattaaag 4740 gcccaaaaag agctaagaca gctgcaggaa gaccgaaaga atgacaagaa gccaccacct 4800 tataaacata taaaggtaaa ccgtcctatt ggcagggtac agatcttcac tgcagactta 4860 tctgaaatac cccgttgcaa ctgtaaagct actgatgaga acccctgtgg gatagactct 4920 gaatgcatca accgcatgct gctctatgag tgccacccca cagtgtgtcc tgccggaggg 4980 cgctgtcaaa accagtgctt ttccaagcgc caatatccag aggttgaaat tttccgcaca 5040 ttacagcggg gttggggtct acggacaaaa acagatatta aaaagggtga atttgtgaat 5100 gagtatgtgg gtgagcttat agatgaagaa gaatgcagag ctcgaattcg ctatgctcaa 5160 gaacatgata tcactaattt ctatatgctc accctagaca aagaccgaat cattgatgct 5220 ggtcccaaag gaaactatgc tcggttcatg aatcattgct gccagcccaa ctgtgaaaca 5280 cagaagtggt ctgtgaatgg agatacccgt gtaggccttt ttgcactaag tgacattaaa 5340 gcaggcactg aacttacctt caactacaac ctagaatgtc ttgggaatgg aaagactgtt 5400 tgcaaatgtg gagccccgaa ctgcagtggc ttcttgggtg taaggccaaa gaatcaaccc 5460 attgccacgg aagaaaagtc aaagaaattc aagaagaagc aacagggaaa gcgcaggacc 5520 cagggtgaaa tcacaaagga gcgagaagat gagtgtttta gttgtgggga tgctggccag 5580 ctcgtctcct gcaagaaacc aggctgccca aaagtttacc acgcagactg tctcaatctg 5640 accaagcgac cagcagggaa atgggaatgt ccgtggcatc agtgtgacat ctgcgggaag 5700 gaagcagcct ccttctgtga gatgtgcccc agctcctttt gtaagcagca tcgagaaggg 5760 atgcttttca tttccaaact ggatgggcgt ctgtcttgta ctgagcatga cccctgtggg 5820 cccaatcctc tggaacctgg ggagatccgt gagtatgtgc ctcccccagt accgctgcct 5880 ccagggccaa gcactcacct ggcagagcaa tcaacaggaa tggctgctca ggcacccaaa 5940 atgtcagata aacctcctgc tgacaccaac cagatgctgt cgctctccaa aaaagctctg 6000 gcagggactt gtcagaggcc attgctacct gaaagacctc ttgagagaac tgactccagg 6060 ccccagcctt tagataaggt cagagacctc gctgggtcag ggaccaaatc ccaatccttg 6120 gtttccagcc agaggccact ggacaggcca ccagcagtgg caggaccaag accccagcta 6180 agcgacaaac cctctccagt gaccagccca agctcctcac cctcagtcag gtcccaacca 6240 ctggaaagac ctctggggac ggctgaccca aggctggata aatccatagg tgctgccagc 6300 ccaaggcccc agtcactgga gaaaacctca gttcccactg gcctgagact tccgccgcca 6360 gacagactgc tcattactag cagtcccaaa ccccagactt cagacaggcc tactgacaaa 6420 ccccatgcct ctttgtccca gagactccca cctcctgaga aagtactatc agctgtggtc 6480 cagacccttg tagctaaaga aaaagcactg aggcctgtgg accagaatac tcagtcaaaa 6540 aatagagctg ctttggtgat ggatctcata gacctaactc ctcgccagaa ggagcgggca 6600 gcttcacctc atcaggtcac accacaggct gatgagaaga tgccagtgtt ggagtcaagt 6660 tcatggcctg ccagcaaagg tctggggcat atgccgagag ctgttgagaa aggctgtgtg 6720 tcagatcctc ttcagacatc tgggaaagca gcagcccctt cagaggaccc ctggcaagct 6780 gttaaatcac tcacccaggc cagacttctt tctcagcctc ctgccaaggc ctttttatat 6840 gagccaacaa ctcaggcctc aggaagagct tctgcagggg ctgagcagac cccagggcct 6900 cttagccaat ccccgggcct ggtgaagcag gcgaagcaga tggtcggagg ccagcaacta 6960 cctgcacttg ccgccaagag tgggcaatct tttaggtctc tcgggaaggc cccagcctcc 7020 ctccccactg aagaaaagaa gttggtaacc acagagcaaa gtccctgggc cctgggaaaa 7080 gcctcatcac gggcagggct ctggcccata gtggctggac agacactggc acagtcttgc 7140 tggtctgctg ggagcacaca gacattggca cagacttgct ggtctcttgg aagagggcaa 7200 gaccccaaac cagagcaaaa tacacttcca gctcttaacc aggctccttc cagtcacaag 7260 tgtgcagaat cagaacagaa gtag 7284

Claims

CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물.
제1항에 있어서, 상기 CARD6 단백질은 서열번호 1로 이루어지는 것을 특징으로 하는, 조성물.
제1항에 있어서, 상기 CARD6 단백질을 코딩하는 유전자는 서열번호 2로 이루어지는 것을 특징으로 하는, 조성물.
제1항에 있어서, 상기 NSD1 단백질은 서열번호 3 또는 4로 이루어지는 것을 특징으로 하는, 조성물.
제1항에 있어서, 상기 NSD1 단백질을 코딩하는 유전자는 서열번호 5 또는 6으로 이루어지는 것을 특징으로 하는, 조성물.
제1항에 있어서,
상기 항암제는 독소루비신 (doxorubicin)인 것을 특징으로 하는, 조성물.
제1항에 있어서, 상기 조성물은 교아세포종 (glioblastoma)에 적용되는 것을 특징으로 하는, 조성물.
하기 단계를 포함하는 항암제 내성 억제물질 스크리닝 방법:
a) in vitro 상에서 암세포에 후보 물질을 처리하는 단계;
b) 상기 암세포의 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 측정하는 단계; 및
c) 비처리군에 비해 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 증진시키는 물질을 항암제 내성 억제물질로 선정하는 단계.
제8항에 있어서,
상기 암세포는 교아세포종 (glioblastoma) 세포인 것을 특징으로 하는, 스크리닝 방법.