KR20180075265A - 항암제 내성 특이 유전자 및 이의 용도 - Google Patents
항암제 내성 특이 유전자 및 이의 용도 Download PDFInfo
- Publication number
- KR20180075265A KR20180075265A KR1020160179400A KR20160179400A KR20180075265A KR 20180075265 A KR20180075265 A KR 20180075265A KR 1020160179400 A KR1020160179400 A KR 1020160179400A KR 20160179400 A KR20160179400 A KR 20160179400A KR 20180075265 A KR20180075265 A KR 20180075265A
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- leu
- lys
- glu
- pro
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
- G01N33/5044—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/04—Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/10—Screening for compounds of potential therapeutic value involving cells
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Hematology (AREA)
- General Health & Medical Sciences (AREA)
- Urology & Nephrology (AREA)
- Cell Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Toxicology (AREA)
- Food Science & Technology (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Microbiology (AREA)
- Pathology (AREA)
- Veterinary Medicine (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 발명은 항암제 내성 조절 유전자 및 이의 용도에 관한 것이다. 본 발명에 따른 조성물은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하며, 상기 유전자의 발현 억제에 의한 항암제 내성 획득 및 암세포 생존율 증가를 실험적으로 확인하였는바, 암 치료에 있어서, 보다 효과적으로 접근하여 타겟 치료할 수 있을 것으로 기대된다.
Description
본 발명은 항암제 내성 관련 특이 유전자 및 이의 용도로서, 보다 구체적으로 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물 및 이를 이용한 스크리닝 방법에 관한 것이다.
암은 우리나라 성인의 사망 원인 중 1위 또는 2위를 다투는 중요한 질병으로서, 많은 연구에도 불구하고 암 환자의 약 과반수 가량이 결국에는 사망에 이르고 있다. 현재까지 유효한 것으로 알려져 있는 암 치료 방법으로는 수술, 방사사선 항암제 치료법이 있으며, 이 중에서 수술과 방사선 치료법은 절제 부위 또는 방사선 조사부위에만 효과가 있는 국소 요법이고, 항암제 치료 요법은 전신에 효과를 나타내는 전신 요법이라는 점에서 차이가 있다.
현재까지 많은 항암제의 개발에도 불구하고, 항암제만으로 완치가 가능한 암은 백혈병, 악성 림프종, 고환암 등 소수의 암에 불과하며, 이는 항암제를 이용한 암 치료시 항암제에 암세포가 반응을 하지 않거나 초기에는 효과적으로 종양이 줄어들지만 치료 도중 또는 치료 후에 항암제 치료에 대한 내성이 생기기 때문이다. 항암제 내성이란, 항암제를 이용하여 암 환자를 치료할 때, 치료 초기부터 치료 효과가 없거나 초기에는 암 치료 효과가 있었으나, 계속적인 치료 과정에서 암 치료 효과가 상실되는 것을 의미한다. 이 경우, 치료에 사용된 항암제 뿐 아니라, 다른 종류의 항암제에 대해서도 내성을 나타내는 이른바, 다중 약제 내성 (MDR; multi-drug resistance)을 나타내기 때문에 일단 암세포가 항암제에 대한 내성을 획득하면, 이 후, 암 치료에 있어서 큰 어려움을 겪고 있는 실정이다.
따라서, 효과적인 항암제 치료를 위해서는 상기와 같은 항암제에 대한 암세포 내성을 극복해야 하며, 이를 위해서는 항암제에 대한 암세포의 내성에 관련된 유전자를 규명할 필요가 있다. 지금까지 P-당단백질 (P-glycoprotein : PgP), 다약제 내성 관련 단백질 (Multidrug Resistance-associated Protein, MRP) 등이 항암제 내성 관련 인자로 알려져 있으며, 이에 대한 다양한 연구가 진행되고 있으나, (한국 특허공개번호 10-2007-0101610), 아직 미비한 실정이다.
본 발명은 상기와 같은 암 치료의 문제점을 해결하기 위해 안출된 것으로서, 본 발명자들은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현 억제에 의한 항암제 내성 촉진 효과를 확인하고 이에 기초하여 본 발명을 완성하게 되었다.
이에, 본 발명의 목적은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물을 제공하는 것이다.
또한, 본 발명의 다른 목적은 a) in vitro 상에서 암세포에 후보 물질을 처리하는 단계; b) 상기 암세포의 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 측정하는 단계; 및 c) 비처리군에 비해 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 증진시키는 물질을 항암제 내성 억제물질로 선정하는 단계를 포함하는, 항암제 내성 억제물질 스크리닝 방법을 제공한다.
그러나 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 본 발명의 목적을 달성하기 위하여, 본 발명은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물을 제공한다.
본 발명의 일 구현예로서, 상기 CARD6 단백질은 서열번호 1로 이루어질 수 있다.
본 발명의 다른 구현예로서, 상기 CARD6 단백질을 코딩하는 유전자는 서열번호 2로 이루어질 수 있다.
본 발명의 또 다른 구현예로서, 상기 NSD1 단백질은 서열번호 3 또는 4로 이루어질 수 있다.
본 발명의 또 다른 구현예로서, 상기 NSD1 단백질을 코딩하는 유전자는 서열번호 5 또는 6으로 이루어질 수 있다.
본 발명의 또 다른 구현예로서, 상기 항암제는 독소루비신 (doxorubicin)일 수 있다.
본 발명의 또 다른 구현예로서, 상기 조성물은 교아세포종 (glioblastoma)에 적용될 수 있다.
또한, 본 발명은 a) in vitro 상에서 암세포에 후보 물질을 처리하는 단계; b) 상기 암세포의 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 측정하는 단계; 및 c) 비처리군에 비해 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 증진시키는 물질을 항암제 내성 억제물질로 선정하는 단계를 포함하는, 항암제 내성 억제물질 스크리닝 방법을 제공한다.
본 발명의 일 구현예로서, 상기 암세포는 교아세포종 (glioblastoma) 세포일 수 있다.
본 발명은 상기 약학적 조성물을 개체에 투여하는 단계를 포함하는 암의 치료방법을 제공한다.
본 발명은 상기 약학적 조성물의 암의 치료용도를 제공한다.
본 발명에 따른 조성물은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하며, 상기 유전자의 발현 억제에 의한 항암제 내성 획득 및 암세포의 생존율 증가를 실험적으로 확인하였는바, 항암제 내성 억제 및 이를 통한 암 치료에 유용하게 사용될 수 있을 것으로 기대된다.
도 1은 항암제 내성 유전자 도출을 위한 엑솜 염기서열 분석 (Exome sequencing)의 개략적인 모식도이다.
도 2는 4 가지 분석 프로그램 (MuTect, Strelka, VarScan2, 및 Virmid)에서 항암제 내성 세포 내 단일 염기 다형성 (single nucleotide polymorphism, SNP) 검출 결과를 밴다이어그램으로 나타낸 도이다.
도 3은 내성 세포에서 CARD6의 stop-gain 돌연변이를 확인한 결과를 나타낸 것이다.
도 4는 CARD6 넉다운 (Knock down) 세포들의 독소루비신 내성촉진효과를 확인한 결과를 나타낸 것이다.
도 5는 CARD6 관련 siRNA의 효율을 확인한 결과를 나타낸 것이다.
도 6은 NSD1에서 missense 돌연변이를 확인한 결과를 나타낸 것이다.
도 7은 NSD1 넉다운 (Knock down) 세포들의 독소루비신 내성촉진효과를 확인한 결과를 나타낸 것이다.
도 8은 NSD1 관련 siRNA의 효율을 확인한 결과를 나타낸 것이다.
도 2는 4 가지 분석 프로그램 (MuTect, Strelka, VarScan2, 및 Virmid)에서 항암제 내성 세포 내 단일 염기 다형성 (single nucleotide polymorphism, SNP) 검출 결과를 밴다이어그램으로 나타낸 도이다.
도 3은 내성 세포에서 CARD6의 stop-gain 돌연변이를 확인한 결과를 나타낸 것이다.
도 4는 CARD6 넉다운 (Knock down) 세포들의 독소루비신 내성촉진효과를 확인한 결과를 나타낸 것이다.
도 5는 CARD6 관련 siRNA의 효율을 확인한 결과를 나타낸 것이다.
도 6은 NSD1에서 missense 돌연변이를 확인한 결과를 나타낸 것이다.
도 7은 NSD1 넉다운 (Knock down) 세포들의 독소루비신 내성촉진효과를 확인한 결과를 나타낸 것이다.
도 8은 NSD1 관련 siRNA의 효율을 확인한 결과를 나타낸 것이다.
본 발명자들은, 항암제 내성과 관련된 유전자 변이를 확인하고자 항암제 내성 암세포의 엑솜 염기서열 분석 (Exome sequencing)을 실시하였다. 그 결과, 상기 암세포에서 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1)의 변이를 관찰하였으며, 상기 유전자를 넉다운 (knock down)시킨 경우, 항암제에 대한 내성이 증가됨을 실험적으로 확인하고, 이에 기초하여 본 발명을 완성하였다.
이하 본 발명을 상세히 설명한다.
본 발명은 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물을 제공한다.
본 발명에서 사용되는 용어, "항암제"란, 종양의 치료를 위하여 사용되는 화학 요법제를 총칭하는 것으로서, 암세포의 각종 대사경로에 개입하여 주로 핵산의 합성을 억제하거나 항암활성을 나타내는 물질을 의미한다. 다만, 항암제를 이용한 치료가 장기화되는 과정에서 암세포가 항암제에 대한 내성을 획득하게 되어 암 치료 효율을 떨어지게 하는바, 항암제 내성은 암 치료에 있어서 어려움을 겪고 있는 실정이다. 본 발명에서, 항암제는 바람직하게는 독소루비신 (doxorubicin)일 수 있으나, 이에 제한되는 것은 아니다.
또한, 본 발명의 조성물은 교아세포종 (glioblastoma)에 적용될 수 있으나, 항암제 내성을 나타내는 암세포라면 제한 없이 적용될 수 있다.
본 발명에서 사용되는 용어, "항암제 내성"이란, 항암제를 이용한 암 치료에서, 치료 초기부터 치료 효과가 없거나 초기에는 암 치료 효과가 있었으나, 계속적인 치료 과정에서 암 치료 효과가 상실되는 것을 의미한다. 이에, 본 발명자들은 암 치료의 커다란 걸림돌인 항암제 내성을 극복하고자 항암제 내성과 관련된 유전자를 규명하고자 하였다.
그 결과, 항암제 내성 세포에서, stop-gain 변이된 CARD6 (caspase activation and recruitment domain family, member 6)유전자, missense 변이된 NSD1 (nuclear receptor binding SET domain protein 1)유전자를 확인하였다. 상기 CARD6 단백질은 서열번호 1, CARD6 단백질을 코딩하는 유전자는 서열번호 2로 이루어질 수 있고, 상기 NSD1 단백질은 서열번호 3 또는 4, NSD1 단백질을 코딩하는 유전자는 서열번호 5 또는 6으로 이루어질 수 있으며, 상기 염기서열의 상동체가 본 발명의 범위 내에 포함된다. 구체적으로, 상기 유전자는 서열번호 1 또는 2의 염기서열과 각각 70% 이상, 바람직하게는 80% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 서열 상동성을 가지는 염기서열을 포함할 수 있다.
본 발명의 약학적 조성물은 약제학적으로 허용되는 담체를 더 포함할 수도 있다. 본 발명의 약학적 조성물에 포함되는 약제학적으로 허용되는 담체는 제제 시에 통상적으로 이용되는 것으로서, 락토스, 덱스트로스, 수크로스, 솔비톨, 만니톨, 전분, 아카시아 고무, 인산 칼슘, 알기네이트, 젤라틴, 규산 칼슘, 미세 결정성셀룰로스, 폴리비닐피롤리돈, 셀룰로스, 물, 시럽, 메틸 셀룰로스, 메틸히드록시벤조에이트, 프로필히드록시벤조에이트, 활석, 스테아르산 마그네슘 및 미네랄 오일등을 포함하나, 이에 한정되는 것은 아니다. 본 발명의 약제학적 조성물은 상기성분들 이외에 윤활제, 습윤제, 감미제, 향미제, 유화제, 현탁제, 보존제 등을 추가로 포함할 수 있다.
본 발명에 따른 약학적 조성물은 약학적으로 유효한 양으로 투여한다. 본 발명에 있어서, "약학적으로 유효한 양"은 의학적 치료에 적용 가능한 합리적인 수혜/위험 비율로 질환을 치료하기에 충분한 양을 의미하며, 유효용량 수준은 환자의 질환의 종류, 중증도, 약물의 활성, 약물에 대한 민감도, 투여 시간, 투여 경로 및 배출 비율, 치료기간, 동시 사용되는 약물을 포함한 요소 및 기타 의학 분야에 잘 알려진 요소에 따라 결정될 수 있다. 본 발명에 따른 약학적 조성물은 개별 치료제로 투여하거나 다른 치료제와 병용하여 투여될 수 있고 종래의 치료제와는 순차적 또는 동시에 투여될 수 있으며, 단일 또는 다중 투여될 수 있다. 상기 요소들을 모두 고려하여 부작용 없이 최소한의 양으로 최대 효과를 얻을 수 있는 양을 투여하는 것이 중요하며, 이는 당업자에 의해 용이하게 결정될 수 있다.
구체적으로, 본 발명에 따른 약학적 조성물의 유효량은 환자의 연령, 성별, 상태, 체중, 체내에서 활성 성분의 흡수도, 불활성율 및 배설속도, 질병종류, 병용되는 약물에 따라 달라질 수 있으며, 일반적으로는 체중 1㎏ 당 0.001 내지 150 mg, 바람직하게는 0.01 내지 100 mg을 매일 또는 격일 투여하거나 1일 1 내지 3회로 나누어 투여할 수 있다. 그러나 투여 경로, 비만의 중증도, 성별, 체중, 연령 등에 따라서 증감될 수 있으므로 상기 투여량이 어떠한 방법으로도 본 발명의 범위를 한정하는 것은 아니다.
본 발명의 약학적 조성물은 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있는 방법에 따라, 약제학적으로 허용되는 담체 및/또는 부형제를 이용하여 제제화 함으로써 단위 용량 형태로 제조되거나 또는 다용량 용기내에 내입시켜 제조될 수 있다. 이때 제형은 오일 또는 수성 매질중의 용액, 현탁액 또는 유화액 형태이거나 엑스제, 분말제, 과립제, 정제 또는 캅셀제 형태일 수도 있으며, 분산제 또는 안정화제를 추가적으로 포함할 수 있다.
본 발명의 일 실시예에서는, 약물 내성 암세포 (U87-DR)에 대한 엑솜 염기서열 분석을 실시하여 항암제 내성과 관련된 2 가지 indels, 5 가지 stop-gain 변이 및 54 가지 missense 변이 (표 1 참조)를 포함한 107 가지의 변이 유전자를 확인하였으며 (실시예 1 내지 3 참조), 또한, 변이에 대한 분자 기능 분석을 실시하여, 'carbohydrate derivative binding', 'nucleoside binding' 및 'ATP-dependent helicase activity' 기능과 관련된 변이를 통해 항암제의 구체적인 작용 기전을 확인하였으며 (실시예 4 참조), 아울러, 상기 항암제 내성 관련 유전자 중 CARD6 또는 NSD1 유전자를 넉다운 (knock down)시킨 경우, 항암제 내성을 가진 암세포가 현저히 증가함을 확인하였는바, 항암제 내성 억제물질 스크리닝 방법으로 매우 유용하게 사용될 수 있음을 확인하였다(실시예 6 또는 7 참조).
이에, 본 발명은 a) in vitro 상에서 암세포에 후보 물질을 처리하는 단계; b) 상기 암세포의 CARD6 (caspase activation and recruitment domain family, member 6)유전자, 또는 missense 변이된 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 측정하는 단계; 및 c) 비처리군에 비해 CARD6 (caspase activation and recruitment domain family, member 6)유전자, missense 변이된 NSD1 (nuclear receptor binding SET domain protein 1) 발현이 증진된 물질을 치료제로 선정하는 단계를 포함하는, 항암제 내성 억제물질 스크리닝 방법을 제공한다.
본 발명의 스크리닝 방법에서, 상기 암세포는 바람직하게 인간 교아세포종 (glioblastoma) 세포일 수 있으나, 이로써 제한되는 것은 아니다.
본 발명의 다른 양태로서, 본 발명은 상기 약학적 조성물을 개체에 투여하는 단계를 포함하는 암의 치료방법을 제공한다. 본 발명에서 "개체"란 질병의 치료를 필요로 하는 대상을 의미하고, 보다 구체적으로는, 인간 또는 비-인간인 영장류, 생쥐(mouse), 개, 고양이, 말 및 소 등의 포유류를 의미한다.
이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.
[실시예]
실시예
1. 실험준비 및 실험방법
1-1. 독소루비신 내성 암세포주 (U87-DR) 배양
항암제 (Doxorubicin) 내성 발달에 영향을 미치는 유전자 변이를 확인하기 위하여, 약물내성 암세포를 준비하였다. 보다 구체적으로, 본 발명자가 종래 출원한 (출원번호 2015-0068217) 특허 문헌을 통해 제조한 CDRA 칩을 이용하여, 인간 교아세포종 (human glioblastoma) 유래 U87 세포를 10 % (v:v) FBS, 100 units/ml 페니실린 및 100 ㎍/ml 스트렙토마이신으로 보충된 MEM에서 배양하고, 위생 처리를 위해서, 70 %의 에탄올을 needle-free syringe를 사용하여 칩 중심의 셀 장착 구멍을 통해 칩에 조심스럽게 주입한 다음 항암제인 독소루비신 (doxorubicin)을 농도 구배에 따라 노출시킨 후, 이들 중 생존한 세포 (U87-DR 세포)가 부착된 세포배양 접시의 표면으로부터 육각형의 마이크로챔버 어레이를 제거하였다. 이 후, 트립신화시키고, 세포를 수득한 후, 새로운 배양 접시로 옮겨 정상적인 성장 배지 (MEM)에서 일주일간 배양하였다.
1-2. Drug efflux assay
다중약제내성은 세포의 MDR 1 (다중약제내성 단백질) 및 MRP1 (다중약제내성 관련 단백질 1) 유전자의 기질인 형광염료 Rhodamine 123 (Sigma-Aldrich)을 압출하는 능력을 검정함으로써 결정하였다. 보다 구체적으로, 세포를 아이스에서 30분 동안 Rhodamine 123을 미리 로딩한 다음 37 ℃에서 1 시간동안 배양하여 MDR 단백질 매개 염료의 유출을 허용하고, 세포는 propidum iodide (Pl; Sigama-Aldrich)로 염색하여 아이스에서 유지시켰다. 염색 유출은 분석으로부터 PI-양성 사균을 제외하고 유동 세포 계측법 (BD Biosciences, San Jose, CA)으로 분석하였으며, 또한 형광 측정 플레이트 판독기 (Molecular Devices, Sunnyvale, CA)를 사용하여 Rhodamine 123의 유출 속도를 평가하였다. 또한, 세포 현탁액을 염료 유출 전후에 96-웰 플레이트의 분주하여 형광 광도는 485 ㎚ (여기) 및 530 ㎚ (방출)에서 측정하였다.
1-3. drug-free 상태에서의 세포 증식 분석
U87-WT 및 U87-DR 세포의 세포 증식을 측정하기 위해서, EZ-Cytox 세포 생존률 측정 키트 (Daeillab Service, Korea)를 사용하여 측정 하였다. 보다 구체적으로, 세포 (1 × 103 내지 3 × 104)를 180 ㎕의 배지를 함유한 96 웰에 접종하고 6 시간동안 배양을 진행하였으며, 이 후, 20 ㎕의 EZ-Cytox 시약을 각 웰에 첨가하고 1 시간 동안 배양 하였다. 미토콘드리아 탈수소 효소에 의해 생성된 WST-포르마잔의 흡광도를 마이크로 플레이트 판독기 (Molecular Devices, Sunnyvale, CA)를 사용하여 450 nm에서 측정하였다.
1-4. 유전자 특이 siRNA 및 siRNA 트랜스펙션
CARD6 및 NSD1의 넉다운 실험을 위해서, 미리 설계된 siRNA (HsCARD6 5 및 HsCARD6 6의 ID를 갖는 CARD6에 대한 FlexiTube GeneSolution GS84674; Hs NSD1 3 및 Hs NSD1 8의 ID를 갖는 NSD1에 대한 FlexiTube GeneSolution GS64324) 및 스크램블된 음성 대조군 siRNA는 Qiagen (독일)에서 구입하였으며, 제조사의 지시에 따라 Lipofectamine RNAiMAX (Invitrogen)를 사용하여 U87 세포에 siRNA 이중 가닥을 형질 감염시켰다.
1-5. 유전자 넉다운을 위한 세포 증식 분석
세포 증식은 EZ-ytox 세포 생존력 측정 키트 (Daeillab Service, Korea)를 사용하여 측정하였다. 보다 구체적으로, U87의 3000 세포를 96 웰 플레이트의 각 웰에 접종하고, 다음 날 20 nM의 표적 siRNA으로 트랜스펙션시킨 다음 6 시간 후, 배양 배지에 독소루비신으로 세포를 처리하고 3 일간 배양하였다. 이 후, EZ-Cytox 용액을 각 웰에 첨가하고 37 ℃에서 3 시간 동안 배양하였으며, 배양이 완료되면, 흡광도를 마이크로 플레이트 판독기 (Molecular Devices, Sunnyvale, CA)를 사용하여 450 nm에서 측정하였다. 또한, 독소루비신이 없는 상태에서 값을 정규화하여 생존율을 결정하였다.
1-6. RNA-Seq 데이터 처리
제조업체의 지침에 따라 Direct-zol™ RNA MiniPrep 키트 (Zymo Research, Irvine, CA)를 사용하여 U87-WT 및 U87-DR 세포에서 총 RNA를 추출하였으며, RNA 시퀀싱은 Illumina HiSeq-2500 시퀀싱 플랫폼 (Illumina, San Diego, CA)에서 101bp pair-end run을 사용하여 수행하였다. 또한, Fastx 툴킷 (version 0.0.13.2)은 로우 시퀀싱 데이터의 사전 처리에 사용하였으며, 상기 리드는 MapSplice 2 (version 2.1.7)를 사용하여 참조 유전체 (human reference genome, hg19)를 정렬하였다. 다음으로 RSEM (version 1.2.12)을 사용하여 mRNA abundance를 정량화하였고, U87과 U87-DR 세포 사이의 차등 발현은 edgeR 프로그램 (version 3.8.6)에 의해 얻어졌다. 이 때, 상기 차등 발현 유전자 (DEGs)는 P-value < 0.01 이하에서 선택되었다.
실시예
2.
엑솜
염기서열 분석 (
Exome
sequencing)
제조사의 지시에 따라 게놈 DNA 추출 키트 (Qiagen)를 사용하여 U87-WT 및 U87-DR 세포로부터 총 DNA를 추출하였다. 또한, Agilent Sure Select Human All Exon V4 with post-capture kit (Agilent, Santa Clara, CA, USA)를 이용하여 엑솜을 농축시켰으며, 엑솜 염기서열 분석은 101 염기쌍 페어드 엔드 런(Paired-end runs)을 이용한 Illumina HiSeq-2000 sequencing platform (Illumina, San Diego, CA, USA)으로 실시하였다. 또한, 도 1에 나타낸 바와 같이 엑솜 염기서열분석을 진행하였으며, 보다 구체적으로 Fastx_toolkit (version 0.0.13.2)(http://hannonlab.cshl.edu/fastx toolkit/)를 이용하여 어댑터 시퀀스 트리밍, 아티팩트 필터링, 20 이하 quality score를 갖는 서열조각 (리드, read)의 제거를 통해 염기서열의 quality를 조절하였다(Sequence quality control). 상기 리드는 bowtie2 (version 2.1.0)의 default 설정을 이용하여 참조 유전체 (human reference genome, hg19)를 정렬 (alignment) 하였다 (pre-alignment). 다음으로 Genome anlysis Toolkit (GATK, version 2.5.2) 및 Picard (version 1.92)를 이용하여, 중복된 리드의 제거, 국소적 재정렬 (realignment), quality scores의 재측정을 실시하였다. 평균 정렬된 리드의 수는 8 천백만 개였으며, 타겟 부분의 평균 read depth는 187X였다.
실시예
3. 약물 내성 세포의 변이 검출
독소루비신 저항성 세포의 변이를 확인하기 위해서, 도 2에 나타낸 바와 같이, 약물 내성 세포의 변이 검출을 진행하였다.
보다 구체적으로, U87 야생형을 대조군으로 하여, 체세포 돌연변이를 총 4가지 분석 프로그램 MuTect (version 1.1.4), Strelka (version 1.0.7), VarScan2 (version 2.3.5) 및 Virmid (version 1.1.0)을 통하여 확인하였다.
그 결과, 다중 (≥2) 프로그램에 의해 확인된 신체 변이가 신뢰할만한 대체물로 분류되었으며, 2 개의 indels, 5 개의 stop-gain 변이 및 54 개의 missense 변이 (표 1 참조)를 포함한 107 가지의 변이형을 얻었다. 또한, 삽입 및 결실 변이 (INDEl)는 2가지 분석 프로그램 (Strelka (version 1.0.7), VarScan2 (version 2.3.5))을 이용하여 상기와 동일한 방법으로 암세포 내성 관련 변이를 도출하였으며, 기능 변형은 ANNOVAR 프로그램을 사용하여 주석을 달고 통합 유전체 뷰어 (IGV)는 판독 정렬의 육안 검사에 사용되었다.
[표 1]
실시예
4. 변이에 대한 분자 기능 분석
Gene Ontology (GO) 기능 및 경로에 대한 유전자 세트 분석은 웹 기반 Gene Set Analysis Toolkit (WebGestalt) 웹 서버를 사용하여 수행하였으며, 이 때, 체외 돌연변이와 차별적으로 발현된 유전자 (DEG)를 분석에 포함하였다 (각각 표 2).
[표 2]
그 결과, 'carbohydrate derivative binding', 'nucleoside binding' 및 'ATP-dependent helicase activity' 기능과 관련된 변이를 확인하였는바, 이를 통해서, 독소루비신은 DNA 이중 나선의 두 염기쌍 사이에 삽입되어 topoisomerase Ⅱ를 방해한다는 이전 연구결과를 뒷받침한다.
이 때, topoisomerase Ⅱ의 헬리케이즈 활성은 독소루비신과 같은 안트라사이클린 항생제에 의해 강력하게 억제되는 것으로 나타났으며, 독소루비신의 4'- epi-isomer 인 epirubicin의 타겟으로 알려진 CHD1 (choromodomain helicase DNA binding protein 1)에서 유전자 변이를 관찰하였다.
또 다른 주목할만한 돌연변이는 filamin-A (FLNA) 유전자에 프레임 이동 삽입 (frame-shift insertion)으로, 그 손실은 topoisomerase Ⅱ 독소의 유입과 유출을 조절함으로써 독소루비신 내성을 촉진시키는 것으로 확인하였다.
실시예
5. 내성 발달을 위한
전사체
시퀀싱 및 신호전달 경로 분석
약물 내성의 관여하는 변화된 경로와 분자 과정을 더 확인하기 위해서, CDRA 칩에서 7일간 성장 후 얻은 U87 야생형 및 내성 세포주에 대한 RNA-seq데이터를 생성하였다.
[표 3]
[표 4]
그 결과, 표 3에 나타낸 바와 같이, 83개의 DEG를 확인했으며, 그 중 77개가 상향 조절되었고, 6개가 하향 조절되었음을 확인하였으며, 표 4에 나타낸 바와 같이, 상기 83개의 DEG에 대한 GO 기능의 유전자 세트 분석은 '상처에 대한 반응', '염증 반응', '백혈구 화학 주성', '저산소 반응', '세포 증식 조절' 및 '사이토카인 활성'과 관련되어 있다. 특히, 가장 관련된 기능은 독소루비신을 독소루비시놀 (Doxorubicinol)로 전환시키는 4개의 알도-케토 환원 효소 (AKR; AKR1B1, AKR1C1, AKR1C2, AKR1C3)로 대표되는 독소루비신 대사 과정 (FDR = 3.89e-6)이다. 이 때, 독소루비신과 비교하여 독소루비시놀은 현저하게 감소된 세포 독성, 감소된 DNA-결합 활성 및 핵 외 리소좀 (extra-nuclear lysosomes)에 강한 발현 위치를 나타내었다.
또한, WebGestalt를 이용한 83 DEG의 교토 백과사전 유전자 및 게놈 (KEGG) 경로 분석은 NOD 유사 수용체 신호 전달 경로 (FDR = 1.33e-6) 및 사이토카인 - 사이토카인 수용체 상호 작용 경로 (FDR = 2.46e-8)를 산출했다. 이러한 경로에 관여하는 DEG는 NF-κB 경로에 의해 조절되는 대부분 케모카인 및 전 염증성 사이토카인 (예 : CCL2, CXCL1, CXCL2, CXCL3, IL1B, IL6, IL8 및 IL11)을 포함한다.
이때, NF-κB 활성화는 독소루비신 및 그 유사체의 세포 독성 효과에 필수적인 것으로 알려져 있으며, 엑솜 염기서열 데이터로부터 NF-κB 활성화와 관련있는 3개의 돌연변이 유전자 (CARD6, NSD1 및 NLRP13)을 확인하였다.
특히, CARD6 (caspase activation and recruitment domain family, member 6)는 인간 배아 신장 유도 HEK293T 세포에서 NOD1 (nucleotide-binding oligomerization domain containing 1) 수용체에 의한 NF-κB 활성화를 음성 조절하는 반면에, 간세포 암 기원의 Huh7 세포에서는 양성 조절자로 작용한다. 따라서, NF-κB 활성화에서 CARD6의 역할은 세포 유효 특이적일 수 있음을 알 수 있었다.
실시예
6.
CARD6
변이에 의한 항암제 내성 촉진효과 확인
본 발명자들은 in silico 분석에 대한 사전 검증을 수행하고자, 우선, FLNA에서 frameshift 돌연변이의 효과를 특정 siRNA로 넉다운 (knock down)하여 모방하고자 하였다.
보다 구체적으로, 내성 세포에서 CARD6의 stop-gain 돌연변이 (c.G2014T of NM 032587 encoding p.Gly672*)를 관찰하였으며 (도 3 참조), CARD6에 대한 siRNA로 넉다운 (knock down)하는 실험을 수행하였다.
그 결과, 도 4에 나타낸 바와 같이, CARD6에 특이적인 siRNA를 가진 U87 세포의 처리는 이들 세포에서 NF-κB 신호전달 경로의 하향 조절과 일치하는 독소루비신 내성을 증가시키는 것을 확인하였으며, 이 때, CARD6에 대한 siRNA의 넉다운 효율을 도 5에 나타내었다.
실시예
7.
NSD1
변이에 의한 항암제 내성 촉진효과 확인
NSD1 (nuclear receptor binding SET domain protein 1)에서 NF-κB 활성화를 감소시키는 것으로 알려진 missense 돌연변이 (c.T3380G of NM 02245 encoding p.Leu1127Arg)를 확인하였으며 (도 6 참조), 상기와 같이, NSD1을 넉다운 (knock down)시켰다.
그 결과, 도 7에 나타낸 바와 같이, NSD1의 넉다운 (knock down)은 감소된 NF-κB 활성화와 일치하는 독소루비신 내성을 증가시키고, 아폽토시스를 감소시키는 것을 확인하였으며, 이 때, NSD1에 대한 siRNA의 넉다운 효율을 도 8에 나타내었다.
상기 결과들을 통해서, 암세포의 CARD6 또는 NSD1의 발현을 억제함으로써, 항암제 내성을 촉진시킬 수 있음을 나타내는 것으로, CARD6 또는 NSD1과 항암제 내성간 높은 관련성이 있음을 의미한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
<110> Research and Business Foundation SUNGKYUNKWAN UNIVERSITY
Ewha University - Industry Collaboration Foundation
<120> Gene that is specific to anti-cancer drug resistance and use
thereof
<130> MP16-500
<160> 6
<170> KoPatentIn 3.0
<210> 1
<211> 1037
<212> PRT
<213> CARD6 protein
<400> 1
Met Ala Thr Glu Ser Thr Pro Ser Glu Ile Ile Glu Arg Glu Arg Lys
1 5 10 15
Lys Leu Leu Glu Ile Leu Gln His Asp Pro Asp Ser Ile Leu Asp Thr
20 25 30
Leu Thr Ser Arg Arg Leu Ile Ser Glu Glu Glu Tyr Glu Thr Leu Glu
35 40 45
Asn Val Thr Asp Leu Leu Lys Lys Ser Arg Lys Leu Leu Ile Leu Val
50 55 60
Gln Lys Lys Gly Glu Ala Thr Cys Gln His Phe Leu Lys Cys Leu Phe
65 70 75 80
Ser Thr Phe Pro Gln Ser Ala Ala Ile Cys Gly Leu Arg His Glu Val
85 90 95
Leu Lys His Glu Asn Thr Val Pro Pro Gln Ser Met Gly Ala Ser Ser
100 105 110
Asn Ser Glu Asp Ala Phe Ser Pro Gly Ile Lys Gln Pro Glu Ala Pro
115 120 125
Glu Ile Thr Val Phe Phe Ser Glu Lys Glu His Leu Asp Leu Glu Thr
130 135 140
Ser Glu Phe Phe Arg Asp Lys Lys Thr Ser Tyr Arg Glu Thr Ala Leu
145 150 155 160
Ser Ala Arg Lys Asn Glu Lys Glu Tyr Asp Thr Pro Glu Val Thr Leu
165 170 175
Ser Tyr Ser Val Glu Lys Val Gly Cys Glu Val Pro Ala Thr Ile Thr
180 185 190
Tyr Ile Lys Asp Gly Gln Arg Tyr Glu Glu Leu Asp Asp Ser Leu Tyr
195 200 205
Leu Gly Lys Glu Glu Tyr Leu Gly Ser Val Asp Thr Pro Glu Asp Ala
210 215 220
Glu Ala Thr Val Glu Glu Glu Val Tyr Asp Asp Pro Glu His Val Gly
225 230 235 240
Tyr Asp Gly Glu Glu Asp Phe Glu Asn Ser Glu Thr Thr Glu Phe Ser
245 250 255
Gly Glu Glu Pro Ser Tyr Glu Gly Ser Glu Thr Ser Leu Ser Leu Glu
260 265 270
Glu Glu Gln Glu Lys Ser Ile Glu Glu Arg Lys Lys Val Phe Lys Asp
275 280 285
Val Leu Leu Cys Leu Asn Met Asp Arg Ser Arg Lys Val Leu Pro Asp
290 295 300
Phe Val Lys Gln Phe Ser Leu Asp Arg Gly Cys Lys Trp Thr Pro Glu
305 310 315 320
Ser Pro Gly Asp Leu Ala Trp Asn Phe Leu Met Lys Val Gln Ala Arg
325 330 335
Asp Val Thr Ala Arg Asp Ser Ile Leu Ser His Lys Val Leu Asp Glu
340 345 350
Asp Ser Lys Glu Asp Leu Leu Ala Gly Val Glu Asn Leu Glu Ile Arg
355 360 365
Asp Ile Gln Thr Ile Asn Pro Leu Asp Val Leu Cys Ala Thr Met Leu
370 375 380
Cys Ser Asp Ser Ser Leu Gln Arg Gln Val Met Ser Asn Met Tyr Gln
385 390 395 400
Cys Gln Phe Ala Leu Pro Leu Leu Leu Pro Asp Ala Glu Asn Asn Lys
405 410 415
Ser Ile Leu Met Leu Gly Ala Met Lys Asp Ile Val Lys Lys Gln Ser
420 425 430
Thr Gln Phe Ser Gly Gly Pro Thr Glu Asp Thr Glu Lys Phe Leu Thr
435 440 445
Leu Met Lys Met Pro Val Ile Ser Phe Val Arg Leu Gly Tyr Cys Ser
450 455 460
Phe Ser Lys Ser Arg Ile Leu Asn Thr Leu Leu Ser Pro Ala Gln Leu
465 470 475 480
Lys Leu His Lys Ile Phe Leu His Gln Asp Leu Pro Leu Leu Val Leu
485 490 495
Pro Arg Gln Ile Ser Asp Gly Leu Val Glu Ile Thr Trp Cys Phe Pro
500 505 510
Asp Ser Asp Asp Arg Lys Glu Asn Pro Phe Phe Gln Lys Pro Val Ala
515 520 525
Leu Ala Asn Leu Arg Gly Asn Leu Glu Ser Phe Trp Thr Gln Phe Gly
530 535 540
Phe Leu Met Glu Val Ser Ser Ala Val Phe Phe Phe Thr Asp Cys Leu
545 550 555 560
Gly Glu Lys Glu Trp Asp Leu Leu Met Phe Leu Gly Glu Ala Ala Ile
565 570 575
Glu Arg Cys Tyr Phe Val Leu Ser Ser Gln Ala Arg Glu Ser Glu Glu
580 585 590
Ala Gln Ile Phe Gln Arg Ile Leu Asn Leu Lys Pro Ala Gln Leu Leu
595 600 605
Phe Trp Glu Arg Gly Asp Ala Gly Asp Arg Arg Lys Asn Met Glu Gly
610 615 620
Leu Gln Ala Ala Leu Gln Glu Val Met Phe Ser Ser Cys Leu Arg Cys
625 630 635 640
Val Ser Val Glu Asp Met Ala Ala Leu Ala Arg Glu Leu Gly Ile Gln
645 650 655
Val Asp Glu Asp Phe Glu Asn Thr Gln Arg Ile Gln Val Ser Ser Gly
660 665 670
Glu Asn Met Ala Gly Thr Ala Glu Gly Glu Gly Gln Gln Arg His Ser
675 680 685
Gln Leu Lys Ser Ser Ser Lys Ser Gln Ala Leu Met Pro Ile Gln Glu
690 695 700
Pro Gly Thr Gln Cys Glu Leu Ser Gln Asn Leu Gln Asn Leu Tyr Gly
705 710 715 720
Thr Pro Val Phe Arg Pro Val Leu Glu Asn Ser Trp Leu Phe Pro Thr
725 730 735
Arg Ile Gly Gly Asn Phe Asn His Val Ser Leu Lys Ala Ser Trp Val
740 745 750
Met Gly Arg Pro Phe Gly Ser Glu Gln Arg Pro Lys Trp Phe His Pro
755 760 765
Leu Pro Phe Gln Asn Ala Gly Ala Gln Gly Arg Gly Lys Ser Phe Gly
770 775 780
Ile Gln Ser Phe His Pro Gln Ile Phe Tyr Ser Gly Glu Arg Phe Met
785 790 795 800
Lys Phe Ser Arg Val Ala Arg Gly Cys His Ser Asn Gly Thr Phe Gly
805 810 815
Arg Leu Pro Arg Pro Ile Cys Gln His Val Gln Ala Cys Pro Glu Arg
820 825 830
Pro Gln Met Met Gly Thr Leu Glu Arg Ser Arg Ala Val Ala Ser Lys
835 840 845
Ile Gly His Ser Tyr Ser Leu Asp Ser Gln Pro Ala Arg Ala Val Gly
850 855 860
Lys Pro Trp Pro Gln Gln Ala Cys Thr Arg Val Thr Glu Leu Thr Glu
865 870 875 880
Ala Thr Gly Lys Leu Ile Arg Thr Ser His Ile Gly Lys Pro His Pro
885 890 895
Gln Ser Phe Gln Pro Ala Ala Ala Thr Gln Lys Leu Arg Pro Ala Ser
900 905 910
Gln Gln Gly Val Gln Met Lys Thr Gln Gly Gly Ala Ser Asn Pro Ala
915 920 925
Leu Gln Ile Gly Ser His Pro Met Cys Lys Ser Ser Gln Phe Lys Ser
930 935 940
Asp Gln Ser Asn Pro Ser Thr Val Lys His Ser Gln Pro Lys Pro Phe
945 950 955 960
His Ser Val Pro Ser Gln Pro Lys Ser Ser Gln Thr Lys Ser Cys Gln
965 970 975
Ser Gln Pro Ser Gln Thr Lys Pro Ser Pro Cys Lys Ser Thr Gln Pro
980 985 990
Lys Pro Ser Gln Pro Trp Pro Pro Gln Ser Lys Pro Ser Gln Pro Arg
995 1000 1005
Pro Pro Gln Pro Lys Ser Ser Ser Thr Asn Pro Ser Gln Ala Lys Ala
1010 1015 1020
His His Ser Lys Ala Gly Gln Lys Arg Gly Gly Lys His
1025 1030 1035
<210> 2
<211> 3114
<212> DNA
<213> CARD6 polynucleotide
<400> 2
atggctaccg agagtactcc ctcagagatc atagaaagag aaagaaaaaa gttgcttgaa 60
atccttcaac atgatcctga ttctatctta gacacgttaa cttctcggag gctgatttct 120
gaggaagagt atgagactct ggagaatgtt acagatctcc tgaagaaaag tcggaagctg 180
ttaattttgg tacagaaaaa gggagaggcg acctgtcagc attttctcaa gtgtttattt 240
agtacttttc cacagtcagc tgccatttgc ggcttaaggc atgaagtttt aaaacatgag 300
aatacagtac ctcctcaatc tatgggggca agcagtaatt cagaagatgc tttttctcct 360
ggaataaaac agcctgaagc ccctgagatc acagtgttct tcagtgagaa ggaacacttg 420
gatttggaaa cctctgagtt tttcagggac aagaaaacta gttataggga aacagctttg 480
tctgccagga agaatgagaa ggaatatgac acaccagaag tcacattatc atattcagtt 540
gagaaagttg gatgtgaagt tccagcaact attacatata taaaagatgg acagagatat 600
gaggagctag atgattcttt atacttagga aaagaggaat atctaggatc tgttgacacc 660
cctgaagatg cagaagccac tgtggaagag gaggtttatg atgacccaga gcacgttgga 720
tatgatggtg aagaggactt cgagaattca gaaaccacag agttctctgg tgaagaacca 780
agttatgagg gatcagaaac cagcctttca ttggaggagg aacaggagaa aagtatagaa 840
gaaagaaaaa aggtgtttaa agatgtcctg ttatgtttga acatggatag aagcagaaag 900
gttctgccag attttgttaa acaattctcc ttagatcgag gatgtaagtg gacccctgag 960
agtccaggag acttagcctg gaatttcctg atgaaagttc aagcacgaga tgtgaccgct 1020
agggattcaa tcctcagtca caaggttctg gatgaagata gcaaggagga tttgctggct 1080
ggagtggaga atttggaaat tcgagacata caaaccatta atccccttga cgtgctttgt 1140
gccaccatgc tgtgttcaga tagctctttg caacgccaag tcatgtcaaa catgtatcag 1200
tgccagtttg ctcttcccct gctactgcca gatgcagaaa acaacaaaag catcttaatg 1260
ctgggggcca tgaaagacat tgtgaagaag cagtcaacac agttttcagg ggggcctaca 1320
gaggatacag aaaagtttct gactctcatg aagatgcctg tcatctcttt tgtgcgtcta 1380
ggatactgta gcttctctaa gtccagaatc ctcaacacac ttctcagccc tgcccagttg 1440
aaattacaca aaatctttct tcatcaagat ttgcctcttt tggtgcttcc ccggcaaatc 1500
tctgatggcc tggttgagat aacatggtgt tttcctgata gcgatgatag aaaggaaaac 1560
ccctttttcc aaaagcctgt tgctctggct aatctccgtg gaaatctaga aagcttttgg 1620
actcagtttg gttttttgat ggaagtttct tcagctgtgt tttttttcac tgactgttta 1680
ggtgagaagg aatgggactt gctaatgttt ttaggagagg ctgccattga aagatgctac 1740
tttgttctca gttcccaagc cagggagagt gaagaggctc aaatttttca gaggatactg 1800
aacttgaagc cagcacagct actgttttgg gagaggggag atgctgggga tagaaggaag 1860
aacatggagg gccttcaagc tgccctccag gaagtgatgt tctcttcttg cctcagatgt 1920
gtgtctgtgg aggatatggc cgccctggcc agggagctgg ggattcaggt agatgaagac 1980
tttgaaaaca ctcagagaat tcaagtttcc tctggagaaa acatggctgg gacagctgaa 2040
ggtgagggtc agcaaagaca cagtcagcta aaaagctcat ctaaaagcca ggctctaatg 2100
ccaattcaag agcctgggac tcaatgtgag ctcagccaga atcttcagaa tctctatggt 2160
accccagtat tcaggcctgt tctagagaac tcctggctct ttccaaccag aattggaggt 2220
aactttaacc atgtttcctt gaaagcctcc tgggttatgg gccgcccctt tgggtcagag 2280
cagaggccta agtggttcca tcctttgcct tttcagaatg caggggccca gggccgaggt 2340
aaaagttttg gtattcaatc cttccatccc cagatatttt attcaggtga aagattcatg 2400
aaattttcca gagttgctcg gggatgtcac tcgaatggaa catttgggag actgccaaga 2460
cccatttgtc agcatgtaca ggcctgccct gagagaccac aaatgatggg aactcttgaa 2520
aggtctaggg cagtagcctc caagataggt cactcctatt ccctggattc acagccagca 2580
agagcagtag ggaagccatg gcctcagcaa gcttgcacca gggtaacaga gttaactgaa 2640
gcaactggaa aactgataag aacatcccat attggaaagc ctcaccctca gtcctttcaa 2700
ccagcagcag ccacacaaaa actaagacct gcttctcagc aaggagtcca gatgaagaca 2760
caaggtgggg cttcaaatcc agctctccaa atagggtccc atcccatgtg caagagctct 2820
cagttcaaat ccgatcagtc caacccatcc acagtcaaac actcccagcc taaacccttc 2880
cattctgtgc cctctcaacc taaatcctct cagacaaaat cctgtcagtc ccagccctcc 2940
caaactaaac cttctccatg caaatctact cagcctaagc caagccagcc ctggcctccc 3000
cagtctaagc cttctcagcc cagaccccct caacctaagt catcctcaac caatccttca 3060
caagctaagg cacaccactc aaaagcaggg cagaagaggg gagggaagca ttaa 3114
<210> 3
<211> 2696
<212> PRT
<213> NSD1_1 protein
<400> 3
Met Asp Gln Thr Cys Glu Leu Pro Arg Arg Asn Cys Leu Leu Pro Phe
1 5 10 15
Ser Asn Pro Val Asn Leu Asp Ala Pro Glu Asp Lys Asp Ser Pro Phe
20 25 30
Gly Asn Gly Gln Ser Asn Phe Ser Glu Pro Leu Asn Gly Cys Thr Met
35 40 45
Gln Leu Ser Thr Val Ser Gly Thr Ser Gln Asn Ala Tyr Gly Gln Asp
50 55 60
Ser Pro Ser Cys Tyr Ile Pro Leu Arg Arg Leu Gln Asp Leu Ala Ser
65 70 75 80
Met Ile Asn Val Glu Tyr Leu Asn Gly Ser Ala Asp Gly Ser Glu Ser
85 90 95
Phe Gln Asp Pro Glu Lys Ser Asp Ser Arg Ala Gln Thr Pro Ile Val
100 105 110
Cys Thr Ser Leu Ser Pro Gly Gly Pro Thr Ala Leu Ala Met Lys Gln
115 120 125
Glu Pro Ser Cys Asn Asn Ser Pro Glu Leu Gln Val Lys Val Thr Lys
130 135 140
Thr Ile Lys Asn Gly Phe Leu His Phe Glu Asn Phe Thr Cys Val Asp
145 150 155 160
Asp Ala Asp Val Asp Ser Glu Met Asp Pro Glu Gln Pro Val Thr Glu
165 170 175
Asp Glu Ser Ile Glu Glu Ile Phe Glu Glu Thr Gln Thr Asn Ala Thr
180 185 190
Cys Asn Tyr Glu Thr Lys Ser Glu Asn Gly Val Lys Val Ala Met Gly
195 200 205
Ser Glu Gln Asp Ser Thr Pro Glu Ser Arg His Gly Ala Val Lys Ser
210 215 220
Pro Phe Leu Pro Leu Ala Pro Gln Thr Glu Thr Gln Lys Asn Lys Gln
225 230 235 240
Arg Asn Glu Val Asp Gly Ser Asn Glu Lys Ala Ala Leu Leu Pro Ala
245 250 255
Pro Phe Ser Leu Gly Asp Thr Asn Ile Thr Ile Glu Glu Gln Leu Asn
260 265 270
Ser Ile Asn Leu Ser Phe Gln Asp Asp Pro Asp Ser Ser Thr Ser Thr
275 280 285
Leu Gly Asn Met Leu Glu Leu Pro Gly Thr Ser Ser Ser Ser Thr Ser
290 295 300
Gln Glu Leu Pro Phe Cys Gln Pro Lys Lys Lys Ser Thr Pro Leu Lys
305 310 315 320
Tyr Glu Val Gly Asp Leu Ile Trp Ala Lys Phe Lys Arg Arg Pro Trp
325 330 335
Trp Pro Cys Arg Ile Cys Ser Asp Pro Leu Ile Asn Thr His Ser Lys
340 345 350
Met Lys Val Ser Asn Arg Arg Pro Tyr Arg Gln Tyr Tyr Val Glu Ala
355 360 365
Phe Gly Asp Pro Ser Glu Arg Ala Trp Val Ala Gly Lys Ala Ile Val
370 375 380
Met Phe Glu Gly Arg His Gln Phe Glu Glu Leu Pro Val Leu Arg Arg
385 390 395 400
Arg Gly Lys Gln Lys Glu Lys Gly Tyr Arg His Lys Val Pro Gln Lys
405 410 415
Ile Leu Ser Lys Trp Glu Ala Ser Val Gly Leu Ala Glu Gln Tyr Asp
420 425 430
Val Pro Lys Gly Ser Lys Asn Arg Lys Cys Ile Pro Gly Ser Ile Lys
435 440 445
Leu Asp Ser Glu Glu Asp Met Pro Phe Glu Asp Cys Thr Asn Asp Pro
450 455 460
Glu Ser Glu His Asp Leu Leu Leu Asn Gly Cys Leu Lys Ser Leu Ala
465 470 475 480
Phe Asp Ser Glu His Ser Ala Asp Glu Lys Glu Lys Pro Cys Ala Lys
485 490 495
Ser Arg Ala Arg Lys Ser Ser Asp Asn Pro Lys Arg Thr Ser Val Lys
500 505 510
Lys Gly His Ile Gln Phe Glu Ala His Lys Asp Glu Arg Arg Gly Lys
515 520 525
Ile Pro Glu Asn Leu Gly Leu Asn Phe Ile Ser Gly Asp Ile Ser Asp
530 535 540
Thr Gln Ala Ser Asn Glu Leu Ser Arg Ile Ala Asn Ser Leu Thr Gly
545 550 555 560
Ser Asn Thr Ala Pro Gly Ser Phe Leu Phe Ser Ser Cys Gly Lys Asn
565 570 575
Thr Ala Lys Lys Glu Phe Glu Thr Ser Asn Gly Asp Ser Leu Leu Gly
580 585 590
Leu Pro Glu Gly Ala Leu Ile Ser Lys Cys Ser Arg Glu Lys Asn Lys
595 600 605
Pro Gln Arg Ser Leu Val Cys Gly Ser Lys Val Lys Leu Cys Tyr Ile
610 615 620
Gly Ala Gly Asp Glu Glu Lys Arg Ser Asp Ser Ile Ser Ile Cys Thr
625 630 635 640
Thr Ser Asp Asp Gly Ser Ser Asp Leu Asp Pro Ile Glu His Ser Ser
645 650 655
Glu Ser Asp Asn Ser Val Leu Glu Ile Pro Asp Ala Phe Asp Arg Thr
660 665 670
Glu Asn Met Leu Ser Met Gln Lys Asn Glu Lys Ile Lys Tyr Ser Arg
675 680 685
Phe Ala Ala Thr Asn Thr Arg Val Lys Ala Lys Gln Lys Pro Leu Ile
690 695 700
Ser Asn Ser His Thr Asp His Leu Met Gly Cys Thr Lys Ser Ala Glu
705 710 715 720
Pro Gly Thr Glu Thr Ser Gln Val Asn Leu Ser Asp Leu Lys Ala Ser
725 730 735
Thr Leu Val His Lys Pro Gln Ser Asp Phe Thr Asn Asp Ala Leu Ser
740 745 750
Pro Lys Phe Asn Leu Ser Ser Ser Ile Ser Ser Glu Asn Ser Leu Ile
755 760 765
Lys Gly Gly Ala Ala Asn Gln Ala Leu Leu His Ser Lys Ser Lys Gln
770 775 780
Pro Lys Phe Arg Ser Ile Lys Cys Lys His Lys Glu Asn Pro Val Met
785 790 795 800
Ala Glu Pro Pro Val Ile Asn Glu Glu Cys Ser Leu Lys Cys Cys Ser
805 810 815
Ser Asp Thr Lys Gly Ser Pro Leu Ala Ser Ile Ser Lys Ser Gly Lys
820 825 830
Val Asp Gly Leu Lys Leu Leu Asn Asn Met His Glu Lys Thr Arg Asp
835 840 845
Ser Ser Asp Ile Glu Thr Ala Val Val Lys His Val Leu Ser Glu Leu
850 855 860
Lys Glu Leu Ser Tyr Arg Ser Leu Gly Glu Asp Val Ser Asp Ser Gly
865 870 875 880
Thr Ser Lys Pro Ser Lys Pro Leu Leu Phe Ser Ser Ala Ser Ser Gln
885 890 895
Asn His Ile Pro Ile Glu Pro Asp Tyr Lys Phe Ser Thr Leu Leu Met
900 905 910
Met Leu Lys Asp Met His Asp Ser Lys Thr Lys Glu Gln Arg Leu Met
915 920 925
Thr Ala Gln Asn Leu Val Ser Tyr Arg Ser Pro Gly Arg Gly Asp Cys
930 935 940
Ser Thr Asn Ser Pro Val Gly Val Ser Lys Val Leu Val Ser Gly Gly
945 950 955 960
Ser Thr His Asn Ser Glu Lys Lys Gly Asp Gly Thr Gln Asn Ser Ala
965 970 975
Asn Pro Ser Pro Ser Gly Gly Asp Ser Ala Leu Ser Gly Glu Leu Ser
980 985 990
Ala Ser Leu Pro Gly Leu Leu Ser Asp Lys Arg Asp Leu Pro Ala Ser
995 1000 1005
Gly Lys Ser Arg Ser Asp Cys Val Thr Arg Arg Asn Cys Gly Arg Ser
1010 1015 1020
Lys Pro Ser Ser Lys Leu Arg Asp Ala Phe Ser Ala Gln Met Val Lys
1025 1030 1035 1040
Asn Thr Val Asn Arg Lys Ala Leu Lys Thr Glu Arg Lys Arg Lys Leu
1045 1050 1055
Asn Gln Leu Pro Ser Val Thr Leu Asp Ala Val Leu Gln Gly Asp Arg
1060 1065 1070
Glu Arg Gly Gly Ser Leu Arg Gly Gly Ala Glu Asp Pro Ser Lys Glu
1075 1080 1085
Asp Pro Leu Gln Ile Met Gly His Leu Thr Ser Glu Asp Gly Asp His
1090 1095 1100
Phe Ser Asp Val His Phe Asp Ser Lys Val Lys Gln Ser Asp Pro Gly
1105 1110 1115 1120
Lys Ile Ser Glu Lys Gly Leu Ser Phe Glu Asn Gly Lys Gly Pro Glu
1125 1130 1135
Leu Asp Ser Val Met Asn Ser Glu Asn Asp Glu Leu Asn Gly Val Asn
1140 1145 1150
Gln Val Val Pro Lys Lys Arg Trp Gln Arg Leu Asn Gln Arg Arg Thr
1155 1160 1165
Lys Pro Arg Lys Arg Met Asn Arg Phe Lys Glu Lys Glu Asn Ser Glu
1170 1175 1180
Cys Ala Phe Arg Val Leu Leu Pro Ser Asp Pro Val Gln Glu Gly Arg
1185 1190 1195 1200
Asp Glu Phe Pro Glu His Arg Thr Pro Ser Ala Ser Ile Leu Glu Glu
1205 1210 1215
Pro Leu Thr Glu Gln Asn His Ala Asp Cys Leu Asp Ser Ala Gly Pro
1220 1225 1230
Arg Leu Asn Val Cys Asp Lys Ser Ser Ala Ser Ile Gly Asp Met Glu
1235 1240 1245
Lys Glu Pro Gly Ile Pro Ser Leu Thr Pro Gln Ala Glu Leu Pro Glu
1250 1255 1260
Pro Ala Val Arg Ser Glu Lys Lys Arg Leu Arg Lys Pro Ser Lys Trp
1265 1270 1275 1280
Leu Leu Glu Tyr Thr Glu Glu Tyr Asp Gln Ile Phe Ala Pro Lys Lys
1285 1290 1295
Lys Gln Lys Lys Val Gln Glu Gln Val His Lys Val Ser Ser Arg Cys
1300 1305 1310
Glu Glu Glu Ser Leu Leu Ala Arg Gly Arg Ser Ser Ala Gln Asn Lys
1315 1320 1325
Gln Val Asp Glu Asn Ser Leu Ile Ser Thr Lys Glu Glu Pro Pro Val
1330 1335 1340
Leu Glu Arg Glu Ala Pro Phe Leu Glu Gly Pro Leu Ala Gln Ser Glu
1345 1350 1355 1360
Leu Gly Gly Gly His Ala Glu Leu Pro Gln Leu Thr Leu Ser Val Pro
1365 1370 1375
Val Ala Pro Glu Val Ser Pro Arg Pro Ala Leu Glu Ser Glu Glu Leu
1380 1385 1390
Leu Val Lys Thr Pro Gly Asn Tyr Glu Ser Lys Arg Gln Arg Lys Pro
1395 1400 1405
Thr Lys Lys Leu Leu Glu Ser Asn Asp Leu Asp Pro Gly Phe Met Pro
1410 1415 1420
Lys Lys Gly Asp Leu Gly Leu Ser Lys Lys Cys Tyr Glu Ala Gly His
1425 1430 1435 1440
Leu Glu Asn Gly Ile Thr Glu Ser Cys Ala Thr Ser Tyr Ser Lys Asp
1445 1450 1455
Phe Gly Gly Gly Thr Thr Lys Ile Phe Asp Lys Pro Arg Lys Arg Lys
1460 1465 1470
Arg Gln Arg His Ala Ala Ala Lys Met Gln Cys Lys Lys Val Lys Asn
1475 1480 1485
Asp Asp Ser Ser Lys Glu Ile Pro Gly Ser Glu Gly Glu Leu Met Pro
1490 1495 1500
His Arg Thr Ala Thr Ser Pro Lys Glu Thr Val Glu Glu Gly Val Glu
1505 1510 1515 1520
His Asp Pro Gly Met Pro Ala Ser Lys Lys Met Gln Gly Glu Arg Gly
1525 1530 1535
Gly Gly Ala Ala Leu Lys Glu Asn Val Cys Gln Asn Cys Glu Lys Leu
1540 1545 1550
Gly Glu Leu Leu Leu Cys Glu Ala Gln Cys Cys Gly Ala Phe His Leu
1555 1560 1565
Glu Cys Leu Gly Leu Thr Glu Met Pro Arg Gly Lys Phe Ile Cys Asn
1570 1575 1580
Glu Cys Arg Thr Gly Ile His Thr Cys Phe Val Cys Lys Gln Ser Gly
1585 1590 1595 1600
Glu Asp Val Lys Arg Cys Leu Leu Pro Leu Cys Gly Lys Phe Tyr His
1605 1610 1615
Glu Glu Cys Val Gln Lys Tyr Pro Pro Thr Val Met Gln Asn Lys Gly
1620 1625 1630
Phe Arg Cys Ser Leu His Ile Cys Ile Thr Cys His Ala Ala Asn Pro
1635 1640 1645
Ala Asn Val Ser Ala Ser Lys Gly Arg Leu Met Arg Cys Val Arg Cys
1650 1655 1660
Pro Val Ala Tyr His Ala Asn Asp Phe Cys Leu Ala Ala Gly Ser Lys
1665 1670 1675 1680
Ile Leu Ala Ser Asn Ser Ile Ile Cys Pro Asn His Phe Thr Pro Arg
1685 1690 1695
Arg Gly Cys Arg Asn His Glu His Val Asn Val Ser Trp Cys Phe Val
1700 1705 1710
Cys Ser Glu Gly Gly Ser Leu Leu Cys Cys Asp Ser Cys Pro Ala Ala
1715 1720 1725
Phe His Arg Glu Cys Leu Asn Ile Asp Ile Pro Glu Gly Asn Trp Tyr
1730 1735 1740
Cys Asn Asp Cys Lys Ala Gly Lys Lys Pro His Tyr Arg Glu Ile Val
1745 1750 1755 1760
Trp Val Lys Val Gly Arg Tyr Arg Trp Trp Pro Ala Glu Ile Cys His
1765 1770 1775
Pro Arg Ala Val Pro Ser Asn Ile Asp Lys Met Arg His Asp Val Gly
1780 1785 1790
Glu Phe Pro Val Leu Phe Phe Gly Ser Asn Asp Tyr Leu Trp Thr His
1795 1800 1805
Gln Ala Arg Val Phe Pro Tyr Met Glu Gly Asp Val Ser Ser Lys Asp
1810 1815 1820
Lys Met Gly Lys Gly Val Asp Gly Thr Tyr Lys Lys Ala Leu Gln Glu
1825 1830 1835 1840
Ala Ala Ala Arg Phe Glu Glu Leu Lys Ala Gln Lys Glu Leu Arg Gln
1845 1850 1855
Leu Gln Glu Asp Arg Lys Asn Asp Lys Lys Pro Pro Pro Tyr Lys His
1860 1865 1870
Ile Lys Val Asn Arg Pro Ile Gly Arg Val Gln Ile Phe Thr Ala Asp
1875 1880 1885
Leu Ser Glu Ile Pro Arg Cys Asn Cys Lys Ala Thr Asp Glu Asn Pro
1890 1895 1900
Cys Gly Ile Asp Ser Glu Cys Ile Asn Arg Met Leu Leu Tyr Glu Cys
1905 1910 1915 1920
His Pro Thr Val Cys Pro Ala Gly Gly Arg Cys Gln Asn Gln Cys Phe
1925 1930 1935
Ser Lys Arg Gln Tyr Pro Glu Val Glu Ile Phe Arg Thr Leu Gln Arg
1940 1945 1950
Gly Trp Gly Leu Arg Thr Lys Thr Asp Ile Lys Lys Gly Glu Phe Val
1955 1960 1965
Asn Glu Tyr Val Gly Glu Leu Ile Asp Glu Glu Glu Cys Arg Ala Arg
1970 1975 1980
Ile Arg Tyr Ala Gln Glu His Asp Ile Thr Asn Phe Tyr Met Leu Thr
1985 1990 1995 2000
Leu Asp Lys Asp Arg Ile Ile Asp Ala Gly Pro Lys Gly Asn Tyr Ala
2005 2010 2015
Arg Phe Met Asn His Cys Cys Gln Pro Asn Cys Glu Thr Gln Lys Trp
2020 2025 2030
Ser Val Asn Gly Asp Thr Arg Val Gly Leu Phe Ala Leu Ser Asp Ile
2035 2040 2045
Lys Ala Gly Thr Glu Leu Thr Phe Asn Tyr Asn Leu Glu Cys Leu Gly
2050 2055 2060
Asn Gly Lys Thr Val Cys Lys Cys Gly Ala Pro Asn Cys Ser Gly Phe
2065 2070 2075 2080
Leu Gly Val Arg Pro Lys Asn Gln Pro Ile Ala Thr Glu Glu Lys Ser
2085 2090 2095
Lys Lys Phe Lys Lys Lys Gln Gln Gly Lys Arg Arg Thr Gln Gly Glu
2100 2105 2110
Ile Thr Lys Glu Arg Glu Asp Glu Cys Phe Ser Cys Gly Asp Ala Gly
2115 2120 2125
Gln Leu Val Ser Cys Lys Lys Pro Gly Cys Pro Lys Val Tyr His Ala
2130 2135 2140
Asp Cys Leu Asn Leu Thr Lys Arg Pro Ala Gly Lys Trp Glu Cys Pro
2145 2150 2155 2160
Trp His Gln Cys Asp Ile Cys Gly Lys Glu Ala Ala Ser Phe Cys Glu
2165 2170 2175
Met Cys Pro Ser Ser Phe Cys Lys Gln His Arg Glu Gly Met Leu Phe
2180 2185 2190
Ile Ser Lys Leu Asp Gly Arg Leu Ser Cys Thr Glu His Asp Pro Cys
2195 2200 2205
Gly Pro Asn Pro Leu Glu Pro Gly Glu Ile Arg Glu Tyr Val Pro Pro
2210 2215 2220
Pro Val Pro Leu Pro Pro Gly Pro Ser Thr His Leu Ala Glu Gln Ser
2225 2230 2235 2240
Thr Gly Met Ala Ala Gln Ala Pro Lys Met Ser Asp Lys Pro Pro Ala
2245 2250 2255
Asp Thr Asn Gln Met Leu Ser Leu Ser Lys Lys Ala Leu Ala Gly Thr
2260 2265 2270
Cys Gln Arg Pro Leu Leu Pro Glu Arg Pro Leu Glu Arg Thr Asp Ser
2275 2280 2285
Arg Pro Gln Pro Leu Asp Lys Val Arg Asp Leu Ala Gly Ser Gly Thr
2290 2295 2300
Lys Ser Gln Ser Leu Val Ser Ser Gln Arg Pro Leu Asp Arg Pro Pro
2305 2310 2315 2320
Ala Val Ala Gly Pro Arg Pro Gln Leu Ser Asp Lys Pro Ser Pro Val
2325 2330 2335
Thr Ser Pro Ser Ser Ser Pro Ser Val Arg Ser Gln Pro Leu Glu Arg
2340 2345 2350
Pro Leu Gly Thr Ala Asp Pro Arg Leu Asp Lys Ser Ile Gly Ala Ala
2355 2360 2365
Ser Pro Arg Pro Gln Ser Leu Glu Lys Thr Ser Val Pro Thr Gly Leu
2370 2375 2380
Arg Leu Pro Pro Pro Asp Arg Leu Leu Ile Thr Ser Ser Pro Lys Pro
2385 2390 2395 2400
Gln Thr Ser Asp Arg Pro Thr Asp Lys Pro His Ala Ser Leu Ser Gln
2405 2410 2415
Arg Leu Pro Pro Pro Glu Lys Val Leu Ser Ala Val Val Gln Thr Leu
2420 2425 2430
Val Ala Lys Glu Lys Ala Leu Arg Pro Val Asp Gln Asn Thr Gln Ser
2435 2440 2445
Lys Asn Arg Ala Ala Leu Val Met Asp Leu Ile Asp Leu Thr Pro Arg
2450 2455 2460
Gln Lys Glu Arg Ala Ala Ser Pro His Gln Val Thr Pro Gln Ala Asp
2465 2470 2475 2480
Glu Lys Met Pro Val Leu Glu Ser Ser Ser Trp Pro Ala Ser Lys Gly
2485 2490 2495
Leu Gly His Met Pro Arg Ala Val Glu Lys Gly Cys Val Ser Asp Pro
2500 2505 2510
Leu Gln Thr Ser Gly Lys Ala Ala Ala Pro Ser Glu Asp Pro Trp Gln
2515 2520 2525
Ala Val Lys Ser Leu Thr Gln Ala Arg Leu Leu Ser Gln Pro Pro Ala
2530 2535 2540
Lys Ala Phe Leu Tyr Glu Pro Thr Thr Gln Ala Ser Gly Arg Ala Ser
2545 2550 2555 2560
Ala Gly Ala Glu Gln Thr Pro Gly Pro Leu Ser Gln Ser Pro Gly Leu
2565 2570 2575
Val Lys Gln Ala Lys Gln Met Val Gly Gly Gln Gln Leu Pro Ala Leu
2580 2585 2590
Ala Ala Lys Ser Gly Gln Ser Phe Arg Ser Leu Gly Lys Ala Pro Ala
2595 2600 2605
Ser Leu Pro Thr Glu Glu Lys Lys Leu Val Thr Thr Glu Gln Ser Pro
2610 2615 2620
Trp Ala Leu Gly Lys Ala Ser Ser Arg Ala Gly Leu Trp Pro Ile Val
2625 2630 2635 2640
Ala Gly Gln Thr Leu Ala Gln Ser Cys Trp Ser Ala Gly Ser Thr Gln
2645 2650 2655
Thr Leu Ala Gln Thr Cys Trp Ser Leu Gly Arg Gly Gln Asp Pro Lys
2660 2665 2670
Pro Glu Gln Asn Thr Leu Pro Ala Leu Asn Gln Ala Pro Ser Ser His
2675 2680 2685
Lys Cys Ala Glu Ser Glu Gln Lys
2690 2695
<210> 4
<211> 2427
<212> PRT
<213> NSD1_2 protein
<400> 4
Met Pro Leu Lys Thr Arg Thr Ala Leu Ser Asp Asp Pro Asp Ser Ser
1 5 10 15
Thr Ser Thr Leu Gly Asn Met Leu Glu Leu Pro Gly Thr Ser Ser Ser
20 25 30
Ser Thr Ser Gln Glu Leu Pro Phe Cys Gln Pro Lys Lys Lys Ser Thr
35 40 45
Pro Leu Lys Tyr Glu Val Gly Asp Leu Ile Trp Ala Lys Phe Lys Arg
50 55 60
Arg Pro Trp Trp Pro Cys Arg Ile Cys Ser Asp Pro Leu Ile Asn Thr
65 70 75 80
His Ser Lys Met Lys Val Ser Asn Arg Arg Pro Tyr Arg Gln Tyr Tyr
85 90 95
Val Glu Ala Phe Gly Asp Pro Ser Glu Arg Ala Trp Val Ala Gly Lys
100 105 110
Ala Ile Val Met Phe Glu Gly Arg His Gln Phe Glu Glu Leu Pro Val
115 120 125
Leu Arg Arg Arg Gly Lys Gln Lys Glu Lys Gly Tyr Arg His Lys Val
130 135 140
Pro Gln Lys Ile Leu Ser Lys Trp Glu Ala Ser Val Gly Leu Ala Glu
145 150 155 160
Gln Tyr Asp Val Pro Lys Gly Ser Lys Asn Arg Lys Cys Ile Pro Gly
165 170 175
Ser Ile Lys Leu Asp Ser Glu Glu Asp Met Pro Phe Glu Asp Cys Thr
180 185 190
Asn Asp Pro Glu Ser Glu His Asp Leu Leu Leu Asn Gly Cys Leu Lys
195 200 205
Ser Leu Ala Phe Asp Ser Glu His Ser Ala Asp Glu Lys Glu Lys Pro
210 215 220
Cys Ala Lys Ser Arg Ala Arg Lys Ser Ser Asp Asn Pro Lys Arg Thr
225 230 235 240
Ser Val Lys Lys Gly His Ile Gln Phe Glu Ala His Lys Asp Glu Arg
245 250 255
Arg Gly Lys Ile Pro Glu Asn Leu Gly Leu Asn Phe Ile Ser Gly Asp
260 265 270
Ile Ser Asp Thr Gln Ala Ser Asn Glu Leu Ser Arg Ile Ala Asn Ser
275 280 285
Leu Thr Gly Ser Asn Thr Ala Pro Gly Ser Phe Leu Phe Ser Ser Cys
290 295 300
Gly Lys Asn Thr Ala Lys Lys Glu Phe Glu Thr Ser Asn Gly Asp Ser
305 310 315 320
Leu Leu Gly Leu Pro Glu Gly Ala Leu Ile Ser Lys Cys Ser Arg Glu
325 330 335
Lys Asn Lys Pro Gln Arg Ser Leu Val Cys Gly Ser Lys Val Lys Leu
340 345 350
Cys Tyr Ile Gly Ala Gly Asp Glu Glu Lys Arg Ser Asp Ser Ile Ser
355 360 365
Ile Cys Thr Thr Ser Asp Asp Gly Ser Ser Asp Leu Asp Pro Ile Glu
370 375 380
His Ser Ser Glu Ser Asp Asn Ser Val Leu Glu Ile Pro Asp Ala Phe
385 390 395 400
Asp Arg Thr Glu Asn Met Leu Ser Met Gln Lys Asn Glu Lys Ile Lys
405 410 415
Tyr Ser Arg Phe Ala Ala Thr Asn Thr Arg Val Lys Ala Lys Gln Lys
420 425 430
Pro Leu Ile Ser Asn Ser His Thr Asp His Leu Met Gly Cys Thr Lys
435 440 445
Ser Ala Glu Pro Gly Thr Glu Thr Ser Gln Val Asn Leu Ser Asp Leu
450 455 460
Lys Ala Ser Thr Leu Val His Lys Pro Gln Ser Asp Phe Thr Asn Asp
465 470 475 480
Ala Leu Ser Pro Lys Phe Asn Leu Ser Ser Ser Ile Ser Ser Glu Asn
485 490 495
Ser Leu Ile Lys Gly Gly Ala Ala Asn Gln Ala Leu Leu His Ser Lys
500 505 510
Ser Lys Gln Pro Lys Phe Arg Ser Ile Lys Cys Lys His Lys Glu Asn
515 520 525
Pro Val Met Ala Glu Pro Pro Val Ile Asn Glu Glu Cys Ser Leu Lys
530 535 540
Cys Cys Ser Ser Asp Thr Lys Gly Ser Pro Leu Ala Ser Ile Ser Lys
545 550 555 560
Ser Gly Lys Val Asp Gly Leu Lys Leu Leu Asn Asn Met His Glu Lys
565 570 575
Thr Arg Asp Ser Ser Asp Ile Glu Thr Ala Val Val Lys His Val Leu
580 585 590
Ser Glu Leu Lys Glu Leu Ser Tyr Arg Ser Leu Gly Glu Asp Val Ser
595 600 605
Asp Ser Gly Thr Ser Lys Pro Ser Lys Pro Leu Leu Phe Ser Ser Ala
610 615 620
Ser Ser Gln Asn His Ile Pro Ile Glu Pro Asp Tyr Lys Phe Ser Thr
625 630 635 640
Leu Leu Met Met Leu Lys Asp Met His Asp Ser Lys Thr Lys Glu Gln
645 650 655
Arg Leu Met Thr Ala Gln Asn Leu Val Ser Tyr Arg Ser Pro Gly Arg
660 665 670
Gly Asp Cys Ser Thr Asn Ser Pro Val Gly Val Ser Lys Val Leu Val
675 680 685
Ser Gly Gly Ser Thr His Asn Ser Glu Lys Lys Gly Asp Gly Thr Gln
690 695 700
Asn Ser Ala Asn Pro Ser Pro Ser Gly Gly Asp Ser Ala Leu Ser Gly
705 710 715 720
Glu Leu Ser Ala Ser Leu Pro Gly Leu Leu Ser Asp Lys Arg Asp Leu
725 730 735
Pro Ala Ser Gly Lys Ser Arg Ser Asp Cys Val Thr Arg Arg Asn Cys
740 745 750
Gly Arg Ser Lys Pro Ser Ser Lys Leu Arg Asp Ala Phe Ser Ala Gln
755 760 765
Met Val Lys Asn Thr Val Asn Arg Lys Ala Leu Lys Thr Glu Arg Lys
770 775 780
Arg Lys Leu Asn Gln Leu Pro Ser Val Thr Leu Asp Ala Val Leu Gln
785 790 795 800
Gly Asp Arg Glu Arg Gly Gly Ser Leu Arg Gly Gly Ala Glu Asp Pro
805 810 815
Ser Lys Glu Asp Pro Leu Gln Ile Met Gly His Leu Thr Ser Glu Asp
820 825 830
Gly Asp His Phe Ser Asp Val His Phe Asp Ser Lys Val Lys Gln Ser
835 840 845
Asp Pro Gly Lys Ile Ser Glu Lys Gly Leu Ser Phe Glu Asn Gly Lys
850 855 860
Gly Pro Glu Leu Asp Ser Val Met Asn Ser Glu Asn Asp Glu Leu Asn
865 870 875 880
Gly Val Asn Gln Val Val Pro Lys Lys Arg Trp Gln Arg Leu Asn Gln
885 890 895
Arg Arg Thr Lys Pro Arg Lys Arg Met Asn Arg Phe Lys Glu Lys Glu
900 905 910
Asn Ser Glu Cys Ala Phe Arg Val Leu Leu Pro Ser Asp Pro Val Gln
915 920 925
Glu Gly Arg Asp Glu Phe Pro Glu His Arg Thr Pro Ser Ala Ser Ile
930 935 940
Leu Glu Glu Pro Leu Thr Glu Gln Asn His Ala Asp Cys Leu Asp Ser
945 950 955 960
Ala Gly Pro Arg Leu Asn Val Cys Asp Lys Ser Ser Ala Ser Ile Gly
965 970 975
Asp Met Glu Lys Glu Pro Gly Ile Pro Ser Leu Thr Pro Gln Ala Glu
980 985 990
Leu Pro Glu Pro Ala Val Arg Ser Glu Lys Lys Arg Leu Arg Lys Pro
995 1000 1005
Ser Lys Trp Leu Leu Glu Tyr Thr Glu Glu Tyr Asp Gln Ile Phe Ala
1010 1015 1020
Pro Lys Lys Lys Gln Lys Lys Val Gln Glu Gln Val His Lys Val Ser
1025 1030 1035 1040
Ser Arg Cys Glu Glu Glu Ser Leu Leu Ala Arg Gly Arg Ser Ser Ala
1045 1050 1055
Gln Asn Lys Gln Val Asp Glu Asn Ser Leu Ile Ser Thr Lys Glu Glu
1060 1065 1070
Pro Pro Val Leu Glu Arg Glu Ala Pro Phe Leu Glu Gly Pro Leu Ala
1075 1080 1085
Gln Ser Glu Leu Gly Gly Gly His Ala Glu Leu Pro Gln Leu Thr Leu
1090 1095 1100
Ser Val Pro Val Ala Pro Glu Val Ser Pro Arg Pro Ala Leu Glu Ser
1105 1110 1115 1120
Glu Glu Leu Leu Val Lys Thr Pro Gly Asn Tyr Glu Ser Lys Arg Gln
1125 1130 1135
Arg Lys Pro Thr Lys Lys Leu Leu Glu Ser Asn Asp Leu Asp Pro Gly
1140 1145 1150
Phe Met Pro Lys Lys Gly Asp Leu Gly Leu Ser Lys Lys Cys Tyr Glu
1155 1160 1165
Ala Gly His Leu Glu Asn Gly Ile Thr Glu Ser Cys Ala Thr Ser Tyr
1170 1175 1180
Ser Lys Asp Phe Gly Gly Gly Thr Thr Lys Ile Phe Asp Lys Pro Arg
1185 1190 1195 1200
Lys Arg Lys Arg Gln Arg His Ala Ala Ala Lys Met Gln Cys Lys Lys
1205 1210 1215
Val Lys Asn Asp Asp Ser Ser Lys Glu Ile Pro Gly Ser Glu Gly Glu
1220 1225 1230
Leu Met Pro His Arg Thr Ala Thr Ser Pro Lys Glu Thr Val Glu Glu
1235 1240 1245
Gly Val Glu His Asp Pro Gly Met Pro Ala Ser Lys Lys Met Gln Gly
1250 1255 1260
Glu Arg Gly Gly Gly Ala Ala Leu Lys Glu Asn Val Cys Gln Asn Cys
1265 1270 1275 1280
Glu Lys Leu Gly Glu Leu Leu Leu Cys Glu Ala Gln Cys Cys Gly Ala
1285 1290 1295
Phe His Leu Glu Cys Leu Gly Leu Thr Glu Met Pro Arg Gly Lys Phe
1300 1305 1310
Ile Cys Asn Glu Cys Arg Thr Gly Ile His Thr Cys Phe Val Cys Lys
1315 1320 1325
Gln Ser Gly Glu Asp Val Lys Arg Cys Leu Leu Pro Leu Cys Gly Lys
1330 1335 1340
Phe Tyr His Glu Glu Cys Val Gln Lys Tyr Pro Pro Thr Val Met Gln
1345 1350 1355 1360
Asn Lys Gly Phe Arg Cys Ser Leu His Ile Cys Ile Thr Cys His Ala
1365 1370 1375
Ala Asn Pro Ala Asn Val Ser Ala Ser Lys Gly Arg Leu Met Arg Cys
1380 1385 1390
Val Arg Cys Pro Val Ala Tyr His Ala Asn Asp Phe Cys Leu Ala Ala
1395 1400 1405
Gly Ser Lys Ile Leu Ala Ser Asn Ser Ile Ile Cys Pro Asn His Phe
1410 1415 1420
Thr Pro Arg Arg Gly Cys Arg Asn His Glu His Val Asn Val Ser Trp
1425 1430 1435 1440
Cys Phe Val Cys Ser Glu Gly Gly Ser Leu Leu Cys Cys Asp Ser Cys
1445 1450 1455
Pro Ala Ala Phe His Arg Glu Cys Leu Asn Ile Asp Ile Pro Glu Gly
1460 1465 1470
Asn Trp Tyr Cys Asn Asp Cys Lys Ala Gly Lys Lys Pro His Tyr Arg
1475 1480 1485
Glu Ile Val Trp Val Lys Val Gly Arg Tyr Arg Trp Trp Pro Ala Glu
1490 1495 1500
Ile Cys His Pro Arg Ala Val Pro Ser Asn Ile Asp Lys Met Arg His
1505 1510 1515 1520
Asp Val Gly Glu Phe Pro Val Leu Phe Phe Gly Ser Asn Asp Tyr Leu
1525 1530 1535
Trp Thr His Gln Ala Arg Val Phe Pro Tyr Met Glu Gly Asp Val Ser
1540 1545 1550
Ser Lys Asp Lys Met Gly Lys Gly Val Asp Gly Thr Tyr Lys Lys Ala
1555 1560 1565
Leu Gln Glu Ala Ala Ala Arg Phe Glu Glu Leu Lys Ala Gln Lys Glu
1570 1575 1580
Leu Arg Gln Leu Gln Glu Asp Arg Lys Asn Asp Lys Lys Pro Pro Pro
1585 1590 1595 1600
Tyr Lys His Ile Lys Val Asn Arg Pro Ile Gly Arg Val Gln Ile Phe
1605 1610 1615
Thr Ala Asp Leu Ser Glu Ile Pro Arg Cys Asn Cys Lys Ala Thr Asp
1620 1625 1630
Glu Asn Pro Cys Gly Ile Asp Ser Glu Cys Ile Asn Arg Met Leu Leu
1635 1640 1645
Tyr Glu Cys His Pro Thr Val Cys Pro Ala Gly Gly Arg Cys Gln Asn
1650 1655 1660
Gln Cys Phe Ser Lys Arg Gln Tyr Pro Glu Val Glu Ile Phe Arg Thr
1665 1670 1675 1680
Leu Gln Arg Gly Trp Gly Leu Arg Thr Lys Thr Asp Ile Lys Lys Gly
1685 1690 1695
Glu Phe Val Asn Glu Tyr Val Gly Glu Leu Ile Asp Glu Glu Glu Cys
1700 1705 1710
Arg Ala Arg Ile Arg Tyr Ala Gln Glu His Asp Ile Thr Asn Phe Tyr
1715 1720 1725
Met Leu Thr Leu Asp Lys Asp Arg Ile Ile Asp Ala Gly Pro Lys Gly
1730 1735 1740
Asn Tyr Ala Arg Phe Met Asn His Cys Cys Gln Pro Asn Cys Glu Thr
1745 1750 1755 1760
Gln Lys Trp Ser Val Asn Gly Asp Thr Arg Val Gly Leu Phe Ala Leu
1765 1770 1775
Ser Asp Ile Lys Ala Gly Thr Glu Leu Thr Phe Asn Tyr Asn Leu Glu
1780 1785 1790
Cys Leu Gly Asn Gly Lys Thr Val Cys Lys Cys Gly Ala Pro Asn Cys
1795 1800 1805
Ser Gly Phe Leu Gly Val Arg Pro Lys Asn Gln Pro Ile Ala Thr Glu
1810 1815 1820
Glu Lys Ser Lys Lys Phe Lys Lys Lys Gln Gln Gly Lys Arg Arg Thr
1825 1830 1835 1840
Gln Gly Glu Ile Thr Lys Glu Arg Glu Asp Glu Cys Phe Ser Cys Gly
1845 1850 1855
Asp Ala Gly Gln Leu Val Ser Cys Lys Lys Pro Gly Cys Pro Lys Val
1860 1865 1870
Tyr His Ala Asp Cys Leu Asn Leu Thr Lys Arg Pro Ala Gly Lys Trp
1875 1880 1885
Glu Cys Pro Trp His Gln Cys Asp Ile Cys Gly Lys Glu Ala Ala Ser
1890 1895 1900
Phe Cys Glu Met Cys Pro Ser Ser Phe Cys Lys Gln His Arg Glu Gly
1905 1910 1915 1920
Met Leu Phe Ile Ser Lys Leu Asp Gly Arg Leu Ser Cys Thr Glu His
1925 1930 1935
Asp Pro Cys Gly Pro Asn Pro Leu Glu Pro Gly Glu Ile Arg Glu Tyr
1940 1945 1950
Val Pro Pro Pro Val Pro Leu Pro Pro Gly Pro Ser Thr His Leu Ala
1955 1960 1965
Glu Gln Ser Thr Gly Met Ala Ala Gln Ala Pro Lys Met Ser Asp Lys
1970 1975 1980
Pro Pro Ala Asp Thr Asn Gln Met Leu Ser Leu Ser Lys Lys Ala Leu
1985 1990 1995 2000
Ala Gly Thr Cys Gln Arg Pro Leu Leu Pro Glu Arg Pro Leu Glu Arg
2005 2010 2015
Thr Asp Ser Arg Pro Gln Pro Leu Asp Lys Val Arg Asp Leu Ala Gly
2020 2025 2030
Ser Gly Thr Lys Ser Gln Ser Leu Val Ser Ser Gln Arg Pro Leu Asp
2035 2040 2045
Arg Pro Pro Ala Val Ala Gly Pro Arg Pro Gln Leu Ser Asp Lys Pro
2050 2055 2060
Ser Pro Val Thr Ser Pro Ser Ser Ser Pro Ser Val Arg Ser Gln Pro
2065 2070 2075 2080
Leu Glu Arg Pro Leu Gly Thr Ala Asp Pro Arg Leu Asp Lys Ser Ile
2085 2090 2095
Gly Ala Ala Ser Pro Arg Pro Gln Ser Leu Glu Lys Thr Ser Val Pro
2100 2105 2110
Thr Gly Leu Arg Leu Pro Pro Pro Asp Arg Leu Leu Ile Thr Ser Ser
2115 2120 2125
Pro Lys Pro Gln Thr Ser Asp Arg Pro Thr Asp Lys Pro His Ala Ser
2130 2135 2140
Leu Ser Gln Arg Leu Pro Pro Pro Glu Lys Val Leu Ser Ala Val Val
2145 2150 2155 2160
Gln Thr Leu Val Ala Lys Glu Lys Ala Leu Arg Pro Val Asp Gln Asn
2165 2170 2175
Thr Gln Ser Lys Asn Arg Ala Ala Leu Val Met Asp Leu Ile Asp Leu
2180 2185 2190
Thr Pro Arg Gln Lys Glu Arg Ala Ala Ser Pro His Gln Val Thr Pro
2195 2200 2205
Gln Ala Asp Glu Lys Met Pro Val Leu Glu Ser Ser Ser Trp Pro Ala
2210 2215 2220
Ser Lys Gly Leu Gly His Met Pro Arg Ala Val Glu Lys Gly Cys Val
2225 2230 2235 2240
Ser Asp Pro Leu Gln Thr Ser Gly Lys Ala Ala Ala Pro Ser Glu Asp
2245 2250 2255
Pro Trp Gln Ala Val Lys Ser Leu Thr Gln Ala Arg Leu Leu Ser Gln
2260 2265 2270
Pro Pro Ala Lys Ala Phe Leu Tyr Glu Pro Thr Thr Gln Ala Ser Gly
2275 2280 2285
Arg Ala Ser Ala Gly Ala Glu Gln Thr Pro Gly Pro Leu Ser Gln Ser
2290 2295 2300
Pro Gly Leu Val Lys Gln Ala Lys Gln Met Val Gly Gly Gln Gln Leu
2305 2310 2315 2320
Pro Ala Leu Ala Ala Lys Ser Gly Gln Ser Phe Arg Ser Leu Gly Lys
2325 2330 2335
Ala Pro Ala Ser Leu Pro Thr Glu Glu Lys Lys Leu Val Thr Thr Glu
2340 2345 2350
Gln Ser Pro Trp Ala Leu Gly Lys Ala Ser Ser Arg Ala Gly Leu Trp
2355 2360 2365
Pro Ile Val Ala Gly Gln Thr Leu Ala Gln Ser Cys Trp Ser Ala Gly
2370 2375 2380
Ser Thr Gln Thr Leu Ala Gln Thr Cys Trp Ser Leu Gly Arg Gly Gln
2385 2390 2395 2400
Asp Pro Lys Pro Glu Gln Asn Thr Leu Pro Ala Leu Asn Gln Ala Pro
2405 2410 2415
Ser Ser His Lys Cys Ala Glu Ser Glu Gln Lys
2420 2425
<210> 5
<211> 8091
<212> DNA
<213> NSD1_1 polynucleotide
<400> 5
atggatcaga cctgtgaact acccagaaga aattgtctgc tgcccttttc caatccagtg 60
aatttagatg cccctgaaga caaggacagc cctttcggta atggtcaatc caatttttct 120
gagccactta atgggtgtac tatgcagtta tcgactgtca gtggaacatc ccaaaatgct 180
tatggacaag attctccatc ttgttacatt ccactgcgga gactacagga tttggcctcc 240
atgatcaatg tagagtattt aaatgggtct gctgatggat cagaatcctt tcaagaccct 300
gaaaaaagtg attcaagagc tcagacgcca attgtttgca cttccttgag tcctggtggt 360
cctacagcac ttgctatgaa acaggaaccc tcttgtaata actcccctga actccaggta 420
aaagtaacaa agactatcaa gaatggcttt ctgcactttg agaattttac ttgtgtggac 480
gatgcagatg tagattctga aatggaccca gaacagccag tcacagagga tgagagtata 540
gaggagatct ttgaggaaac tcagaccaat gccacctgca attatgagac taaatcagag 600
aatggtgtaa aagtggccat gggaagtgaa caagacagca caccagagag tagacacggt 660
gcagtcaaat cgccattctt gccattagct cctcagactg aaacacagaa aaataagcaa 720
agaaatgaag tggacggcag caatgaaaaa gcagcccttc tcccagcccc cttttcacta 780
ggagacacaa acattacaat agaagagcaa ttaaactcaa taaatttatc ttttcaggat 840
gatccagatt ccagtaccag tacattagga aacatgctag aattacctgg aacttcatca 900
tcatctactt cacaggaatt gccattttgt caacctaaga aaaagtctac gccactgaag 960
tatgaagttg gagatctcat ctgggcaaaa ttcaagagac gcccatggtg gccctgcagg 1020
atttgttctg atccgttgat taacacacat tcaaaaatga aagtttccaa ccggaggccc 1080
tatcggcagt actacgtgga ggcttttgga gatccttctg agagagcctg ggtggctgga 1140
aaagcaatcg tcatgtttga aggcagacat caattcgaag agctacctgt ccttaggaga 1200
agagggaaac agaaagaaaa aggatatagg cataaggttc ctcagaaaat tttgagtaaa 1260
tgggaagcca gtgttggact tgcagaacag tatgatgttc ccaaggggtc aaagaaccga 1320
aaatgtattc ctggttcaat caagttggac agtgaagaag atatgccatt tgaagactgc 1380
acaaatgatc ctgagtcaga acatgacctg ttgcttaatg gctgtttgaa atcactggct 1440
tttgattctg aacattctgc agatgagaag gaaaagcctt gcgctaaatc tcgagccaga 1500
aagagctctg ataatccaaa aaggactagt gtgaaaaagg gccacataca atttgaagca 1560
cataaagatg aacggagggg aaagattcca gagaaccttg gcctaaactt tatctctggg 1620
gatatatctg atacgcaggc ctctaatgaa ctttccagga tagcaaatag cctcacaggg 1680
tccaacactg ccccaggaag ttttctgttt tcttcctgtg gaaaaaacac tgcaaagaaa 1740
gaatttgaga cttcaaatgg tgactcttta ttgggcttgc ctgagggtgc tttgatctca 1800
aagtgttctc gagagaagaa taaaccccaa cgaagcctgg tgtgtggttc aaaagtgaag 1860
ctctgctata ttggagcagg tgatgaggaa aagcgaagtg attccattag tatctgtacc 1920
acttctgatg atggaagcag tgacctggat cccatagaac acagctcaga gtctgataac 1980
agtgtccttg aaattccaga tgctttcgat agaacagaga acatgttatc tatgcagaaa 2040
aatgaaaaga taaagtattc taggtttgct gccacaaaca ctagggtaaa agcaaaacag 2100
aagcctctca ttagtaactc acatacagac cacttaatgg gttgtactaa gagtgcagag 2160
cctggaaccg agacgtctca ggttaatctc tctgatctga aggcatctac tcttgttcac 2220
aaaccccagt cagattttac aaatgatgct ctctctccaa aattcaacct gtcatcaagc 2280
atatccagtg agaactcgtt aataaagggt ggggcagcaa atcaagctct attacattcg 2340
aaaagcaaac agcccaagtt ccgaagtata aagtgcaaac acaaagaaaa tccagttatg 2400
gcagaacccc cagttataaa tgaggagtgc agtttgaaat gctgctcttc tgataccaaa 2460
ggctctcctt tggccagcat ttctaaaagt gggaaagtgg atggtctaaa actactgaac 2520
aatatgcatg agaaaaccag ggattcaagt gacatagaaa cagcagtggt gaaacatgtt 2580
ttatccgagt tgaaggaact ctcttacaga tccttaggtg aggatgtcag tgactctgga 2640
acatcaaagc catcaaaacc attacttttc tcttctgctt ctagtcagaa tcacatacct 2700
attgaaccag actacaaatt cagtacattg ctaatgatgt tgaaagatat gcatgatagt 2760
aagacgaagg agcagcggtt gatgactgct caaaacctgg tctcttaccg gagtcctggt 2820
cgtggggact gttctactaa tagtcctgta ggagtctcta aggttttggt ttcaggaggc 2880
tccacacaca attcagagaa aaagggagat ggcactcaga actccgccaa tcctagccct 2940
agtgggggtg actctgcatt atctggcgag ttgtctgctt ccctacctgg cttactgtcc 3000
gacaagagag acctccctgc ttctggtaaa agtcgttcag actgtgttac taggcgcaac 3060
tgtggacgat caaagccttc atccaaattg cgagatgctt tttcagccca aatggtaaag 3120
aacacagtga accgtaaagc cttaaagacc gagcgcaaaa gaaaactgaa tcagcttcca 3180
agtgtgactc ttgatgctgt actgcaggga gaccgagaac gtggaggttc attgagaggt 3240
ggggcagaag atcctagtaa agaggatccc cttcagataa tgggccactt aacaagtgaa 3300
gatggtgacc atttttctga tgtgcatttc gatagcaagg ttaagcaatc tgatcctggt 3360
aaaatttctg aaaaaggact ctcttttgaa aacggaaaag gcccagagct ggactctgta 3420
atgaacagtg agaatgatga actcaatggt gtaaatcaag tggtgcctaa aaagcggtgg 3480
cagcgtttaa accaaaggcg cactaaacct cgtaagcgca tgaacagatt taaagagaaa 3540
gaaaactctg agtgtgcctt tagggtctta cttcctagtg accctgtgca ggaggggcgg 3600
gatgagtttc cagagcatag aactccttca gcaagcatac ttgaggaacc actgacagag 3660
caaaatcatg ctgactgctt agattcagct gggccacggt taaatgtttg tgataaatcc 3720
agtgccagca ttggtgacat ggaaaaggag ccaggaattc ccagtttgac accacaggct 3780
gagctccctg aaccagctgt gcggtcagag aagaaacgcc ttaggaagcc aagcaagtgg 3840
cttttggaat atacagaaga atatgatcag atatttgctc ctaagaaaaa acaaaagaag 3900
gtacaggagc aggtgcacaa ggtaagttcc cgctgtgaag aggaaagcct tctagcccga 3960
ggtcgatcta gtgctcagaa caagcaggtg gacgagaatt ctttgatttc aaccaaagaa 4020
gagcctccag ttcttgaaag ggaggctccg tttttggagg gccccttggc tcagtcagaa 4080
cttggaggtg gacatgctga gttgccgcag ctgaccttgt ctgtgcctgt ggctccggaa 4140
gtctctccac ggcctgccct tgagtctgag gaattgctag ttaaaacgcc aggaaattat 4200
gaaagtaaac gtcaaagaaa accaactaag aaacttcttg aatccaatga tttagaccct 4260
ggatttatgc ccaagaaggg ggaccttggc ctttctaaaa agtgctatga agctggtcac 4320
ctggagaatg gcataactga atcttgtgcc acatcttatt caaaagattt tggtggaggc 4380
actaccaaga tatttgacaa gccaaggaag cgaaaacgac agaggcatgc tgcagccaag 4440
atgcagtgta aaaaagtgaa aaatgatgac tcgtcaaaag agattccagg ctcagaggga 4500
gaactaatgc ctcacaggac ggccacaagc cccaaggaga ctgttgagga aggtgtagaa 4560
cacgatcccg ggatgcctgc ctctaaaaaa atgcagggtg aacgcggtgg aggagctgca 4620
ctcaaggaga atgtctgtca gaattgtgaa aaattgggtg agctgctgtt atgtgaggct 4680
cagtgctgtg gggctttcca cctggagtgc cttggattga ctgagatgcc aagaggaaaa 4740
tttatctgca atgaatgtcg cacaggaatc catacctgtt ttgtatgtaa gcagagtggg 4800
gaagatgtta aaaggtgcct tctacccttg tgtggaaagt tttaccatga agagtgtgtc 4860
cagaagtacc cacccactgt tatgcagaac aagggcttcc ggtgctccct ccacatctgt 4920
ataacctgtc atgctgctaa tccagccaat gtttctgcat ctaaaggtcg gttgatgcgc 4980
tgtgtccgct gtcctgtggc ataccacgcc aatgactttt gcctggctgc tgggtcaaag 5040
atccttgcat ctaatagtat catctgccct aatcacttta cccctaggcg gggctgccga 5100
aatcatgagc atgttaatgt tagctggtgc tttgtgtgct cagaaggagg cagccttctg 5160
tgctgtgatt cttgccctgc tgcttttcat cgtgaatgcc tgaacattga tatccctgaa 5220
ggaaactggt attgcaatga ctgtaaagca ggcaaaaagc cacactacag ggagattgtc 5280
tgggtaaaag ttggacgata caggtggtgg ccagctgaga tctgccatcc tcgagctgtt 5340
ccttccaaca ttgataagat gagacatgat gtgggagagt tcccagtcct cttttttgga 5400
tctaatgact atttgtggac tcaccaggcc cgagtcttcc cttacatgga gggtgacgtg 5460
agcagcaagg ataagatggg caaaggagtg gatgggacat ataaaaaagc tcttcaggaa 5520
gctgcagcaa ggtttgagga attaaaggcc caaaaagagc taagacagct gcaggaagac 5580
cgaaagaatg acaagaagcc accaccttat aaacatataa aggtaaaccg tcctattggc 5640
agggtacaga tcttcactgc agacttatct gaaatacccc gttgcaactg taaagctact 5700
gatgagaacc cctgtgggat agactctgaa tgcatcaacc gcatgctgct ctatgagtgc 5760
caccccacag tgtgtcctgc cggagggcgc tgtcaaaacc agtgcttttc caagcgccaa 5820
tatccagagg ttgaaatttt ccgcacatta cagcggggtt ggggtctacg gacaaaaaca 5880
gatattaaaa agggtgaatt tgtgaatgag tatgtgggtg agcttataga tgaagaagaa 5940
tgcagagctc gaattcgcta tgctcaagaa catgatatca ctaatttcta tatgctcacc 6000
ctagacaaag accgaatcat tgatgctggt cccaaaggaa actatgctcg gttcatgaat 6060
cattgctgcc agcccaactg tgaaacacag aagtggtctg tgaatggaga tacccgtgta 6120
ggcctttttg cactaagtga cattaaagca ggcactgaac ttaccttcaa ctacaaccta 6180
gaatgtcttg ggaatggaaa gactgtttgc aaatgtggag ccccgaactg cagtggcttc 6240
ttgggtgtaa ggccaaagaa tcaacccatt gccacggaag aaaagtcaaa gaaattcaag 6300
aagaagcaac agggaaagcg caggacccag ggtgaaatca caaaggagcg agaagatgag 6360
tgttttagtt gtggggatgc tggccagctc gtctcctgca agaaaccagg ctgcccaaaa 6420
gtttaccacg cagactgtct caatctgacc aagcgaccag cagggaaatg ggaatgtccg 6480
tggcatcagt gtgacatctg cgggaaggaa gcagcctcct tctgtgagat gtgccccagc 6540
tccttttgta agcagcatcg agaagggatg cttttcattt ccaaactgga tgggcgtctg 6600
tcttgtactg agcatgaccc ctgtgggccc aatcctctgg aacctgggga gatccgtgag 6660
tatgtgcctc ccccagtacc gctgcctcca gggccaagca ctcacctggc agagcaatca 6720
acaggaatgg ctgctcaggc acccaaaatg tcagataaac ctcctgctga caccaaccag 6780
atgctgtcgc tctccaaaaa agctctggca gggacttgtc agaggccatt gctacctgaa 6840
agacctcttg agagaactga ctccaggccc cagcctttag ataaggtcag agacctcgct 6900
gggtcaggga ccaaatccca atccttggtt tccagccaga ggccactgga caggccacca 6960
gcagtggcag gaccaagacc ccagctaagc gacaaaccct ctccagtgac cagcccaagc 7020
tcctcaccct cagtcaggtc ccaaccactg gaaagacctc tggggacggc tgacccaagg 7080
ctggataaat ccataggtgc tgccagccca aggccccagt cactggagaa aacctcagtt 7140
cccactggcc tgagacttcc gccgccagac agactgctca ttactagcag tcccaaaccc 7200
cagacttcag acaggcctac tgacaaaccc catgcctctt tgtcccagag actcccacct 7260
cctgagaaag tactatcagc tgtggtccag acccttgtag ctaaagaaaa agcactgagg 7320
cctgtggacc agaatactca gtcaaaaaat agagctgctt tggtgatgga tctcatagac 7380
ctaactcctc gccagaagga gcgggcagct tcacctcatc aggtcacacc acaggctgat 7440
gagaagatgc cagtgttgga gtcaagttca tggcctgcca gcaaaggtct ggggcatatg 7500
ccgagagctg ttgagaaagg ctgtgtgtca gatcctcttc agacatctgg gaaagcagca 7560
gccccttcag aggacccctg gcaagctgtt aaatcactca cccaggccag acttctttct 7620
cagcctcctg ccaaggcctt tttatatgag ccaacaactc aggcctcagg aagagcttct 7680
gcaggggctg agcagacccc agggcctctt agccaatccc cgggcctggt gaagcaggcg 7740
aagcagatgg tcggaggcca gcaactacct gcacttgccg ccaagagtgg gcaatctttt 7800
aggtctctcg ggaaggcccc agcctccctc cccactgaag aaaagaagtt ggtaaccaca 7860
gagcaaagtc cctgggccct gggaaaagcc tcatcacggg cagggctctg gcccatagtg 7920
gctggacaga cactggcaca gtcttgctgg tctgctggga gcacacagac attggcacag 7980
acttgctggt ctcttggaag agggcaagac cccaaaccag agcaaaatac acttccagct 8040
cttaaccagg ctccttccag tcacaagtgt gcagaatcag aacagaagta g 8091
<210> 6
<211> 7284
<212> DNA
<213> NSD1_2 polynucleotide
<400> 6
atgcccctga agacaaggac agccctttcg gatgatccag attccagtac cagtacatta 60
ggaaacatgc tagaattacc tggaacttca tcatcatcta cttcacagga attgccattt 120
tgtcaaccta agaaaaagtc tacgccactg aagtatgaag ttggagatct catctgggca 180
aaattcaaga gacgcccatg gtggccctgc aggatttgtt ctgatccgtt gattaacaca 240
cattcaaaaa tgaaagtttc caaccggagg ccctatcggc agtactacgt ggaggctttt 300
ggagatcctt ctgagagagc ctgggtggct ggaaaagcaa tcgtcatgtt tgaaggcaga 360
catcaattcg aagagctacc tgtccttagg agaagaggga aacagaaaga aaaaggatat 420
aggcataagg ttcctcagaa aattttgagt aaatgggaag ccagtgttgg acttgcagaa 480
cagtatgatg ttcccaaggg gtcaaagaac cgaaaatgta ttcctggttc aatcaagttg 540
gacagtgaag aagatatgcc atttgaagac tgcacaaatg atcctgagtc agaacatgac 600
ctgttgctta atggctgttt gaaatcactg gcttttgatt ctgaacattc tgcagatgag 660
aaggaaaagc cttgcgctaa atctcgagcc agaaagagct ctgataatcc aaaaaggact 720
agtgtgaaaa agggccacat acaatttgaa gcacataaag atgaacggag gggaaagatt 780
ccagagaacc ttggcctaaa ctttatctct ggggatatat ctgatacgca ggcctctaat 840
gaactttcca ggatagcaaa tagcctcaca gggtccaaca ctgccccagg aagttttctg 900
ttttcttcct gtggaaaaaa cactgcaaag aaagaatttg agacttcaaa tggtgactct 960
ttattgggct tgcctgaggg tgctttgatc tcaaagtgtt ctcgagagaa gaataaaccc 1020
caacgaagcc tggtgtgtgg ttcaaaagtg aagctctgct atattggagc aggtgatgag 1080
gaaaagcgaa gtgattccat tagtatctgt accacttctg atgatggaag cagtgacctg 1140
gatcccatag aacacagctc agagtctgat aacagtgtcc ttgaaattcc agatgctttc 1200
gatagaacag agaacatgtt atctatgcag aaaaatgaaa agataaagta ttctaggttt 1260
gctgccacaa acactagggt aaaagcaaaa cagaagcctc tcattagtaa ctcacataca 1320
gaccacttaa tgggttgtac taagagtgca gagcctggaa ccgagacgtc tcaggttaat 1380
ctctctgatc tgaaggcatc tactcttgtt cacaaacccc agtcagattt tacaaatgat 1440
gctctctctc caaaattcaa cctgtcatca agcatatcca gtgagaactc gttaataaag 1500
ggtggggcag caaatcaagc tctattacat tcgaaaagca aacagcccaa gttccgaagt 1560
ataaagtgca aacacaaaga aaatccagtt atggcagaac ccccagttat aaatgaggag 1620
tgcagtttga aatgctgctc ttctgatacc aaaggctctc ctttggccag catttctaaa 1680
agtgggaaag tggatggtct aaaactactg aacaatatgc atgagaaaac cagggattca 1740
agtgacatag aaacagcagt ggtgaaacat gttttatccg agttgaagga actctcttac 1800
agatccttag gtgaggatgt cagtgactct ggaacatcaa agccatcaaa accattactt 1860
ttctcttctg cttctagtca gaatcacata cctattgaac cagactacaa attcagtaca 1920
ttgctaatga tgttgaaaga tatgcatgat agtaagacga aggagcagcg gttgatgact 1980
gctcaaaacc tggtctctta ccggagtcct ggtcgtgggg actgttctac taatagtcct 2040
gtaggagtct ctaaggtttt ggtttcagga ggctccacac acaattcaga gaaaaaggga 2100
gatggcactc agaactccgc caatcctagc cctagtgggg gtgactctgc attatctggc 2160
gagttgtctg cttccctacc tggcttactg tccgacaaga gagacctccc tgcttctggt 2220
aaaagtcgtt cagactgtgt tactaggcgc aactgtggac gatcaaagcc ttcatccaaa 2280
ttgcgagatg ctttttcagc ccaaatggta aagaacacag tgaaccgtaa agccttaaag 2340
accgagcgca aaagaaaact gaatcagctt ccaagtgtga ctcttgatgc tgtactgcag 2400
ggagaccgag aacgtggagg ttcattgaga ggtggggcag aagatcctag taaagaggat 2460
ccccttcaga taatgggcca cttaacaagt gaagatggtg accatttttc tgatgtgcat 2520
ttcgatagca aggttaagca atctgatcct ggtaaaattt ctgaaaaagg actctctttt 2580
gaaaacggaa aaggcccaga gctggactct gtaatgaaca gtgagaatga tgaactcaat 2640
ggtgtaaatc aagtggtgcc taaaaagcgg tggcagcgtt taaaccaaag gcgcactaaa 2700
cctcgtaagc gcatgaacag atttaaagag aaagaaaact ctgagtgtgc ctttagggtc 2760
ttacttccta gtgaccctgt gcaggagggg cgggatgagt ttccagagca tagaactcct 2820
tcagcaagca tacttgagga accactgaca gagcaaaatc atgctgactg cttagattca 2880
gctgggccac ggttaaatgt ttgtgataaa tccagtgcca gcattggtga catggaaaag 2940
gagccaggaa ttcccagttt gacaccacag gctgagctcc ctgaaccagc tgtgcggtca 3000
gagaagaaac gccttaggaa gccaagcaag tggcttttgg aatatacaga agaatatgat 3060
cagatatttg ctcctaagaa aaaacaaaag aaggtacagg agcaggtgca caaggtaagt 3120
tcccgctgtg aagaggaaag ccttctagcc cgaggtcgat ctagtgctca gaacaagcag 3180
gtggacgaga attctttgat ttcaaccaaa gaagagcctc cagttcttga aagggaggct 3240
ccgtttttgg agggcccctt ggctcagtca gaacttggag gtggacatgc tgagttgccg 3300
cagctgacct tgtctgtgcc tgtggctccg gaagtctctc cacggcctgc ccttgagtct 3360
gaggaattgc tagttaaaac gccaggaaat tatgaaagta aacgtcaaag aaaaccaact 3420
aagaaacttc ttgaatccaa tgatttagac cctggattta tgcccaagaa gggggacctt 3480
ggcctttcta aaaagtgcta tgaagctggt cacctggaga atggcataac tgaatcttgt 3540
gccacatctt attcaaaaga ttttggtgga ggcactacca agatatttga caagccaagg 3600
aagcgaaaac gacagaggca tgctgcagcc aagatgcagt gtaaaaaagt gaaaaatgat 3660
gactcgtcaa aagagattcc aggctcagag ggagaactaa tgcctcacag gacggccaca 3720
agccccaagg agactgttga ggaaggtgta gaacacgatc ccgggatgcc tgcctctaaa 3780
aaaatgcagg gtgaacgcgg tggaggagct gcactcaagg agaatgtctg tcagaattgt 3840
gaaaaattgg gtgagctgct gttatgtgag gctcagtgct gtggggcttt ccacctggag 3900
tgccttggat tgactgagat gccaagagga aaatttatct gcaatgaatg tcgcacagga 3960
atccatacct gttttgtatg taagcagagt ggggaagatg ttaaaaggtg ccttctaccc 4020
ttgtgtggaa agttttacca tgaagagtgt gtccagaagt acccacccac tgttatgcag 4080
aacaagggct tccggtgctc cctccacatc tgtataacct gtcatgctgc taatccagcc 4140
aatgtttctg catctaaagg tcggttgatg cgctgtgtcc gctgtcctgt ggcataccac 4200
gccaatgact tttgcctggc tgctgggtca aagatccttg catctaatag tatcatctgc 4260
cctaatcact ttacccctag gcggggctgc cgaaatcatg agcatgttaa tgttagctgg 4320
tgctttgtgt gctcagaagg aggcagcctt ctgtgctgtg attcttgccc tgctgctttt 4380
catcgtgaat gcctgaacat tgatatccct gaaggaaact ggtattgcaa tgactgtaaa 4440
gcaggcaaaa agccacacta cagggagatt gtctgggtaa aagttggacg atacaggtgg 4500
tggccagctg agatctgcca tcctcgagct gttccttcca acattgataa gatgagacat 4560
gatgtgggag agttcccagt cctctttttt ggatctaatg actatttgtg gactcaccag 4620
gcccgagtct tcccttacat ggagggtgac gtgagcagca aggataagat gggcaaagga 4680
gtggatggga catataaaaa agctcttcag gaagctgcag caaggtttga ggaattaaag 4740
gcccaaaaag agctaagaca gctgcaggaa gaccgaaaga atgacaagaa gccaccacct 4800
tataaacata taaaggtaaa ccgtcctatt ggcagggtac agatcttcac tgcagactta 4860
tctgaaatac cccgttgcaa ctgtaaagct actgatgaga acccctgtgg gatagactct 4920
gaatgcatca accgcatgct gctctatgag tgccacccca cagtgtgtcc tgccggaggg 4980
cgctgtcaaa accagtgctt ttccaagcgc caatatccag aggttgaaat tttccgcaca 5040
ttacagcggg gttggggtct acggacaaaa acagatatta aaaagggtga atttgtgaat 5100
gagtatgtgg gtgagcttat agatgaagaa gaatgcagag ctcgaattcg ctatgctcaa 5160
gaacatgata tcactaattt ctatatgctc accctagaca aagaccgaat cattgatgct 5220
ggtcccaaag gaaactatgc tcggttcatg aatcattgct gccagcccaa ctgtgaaaca 5280
cagaagtggt ctgtgaatgg agatacccgt gtaggccttt ttgcactaag tgacattaaa 5340
gcaggcactg aacttacctt caactacaac ctagaatgtc ttgggaatgg aaagactgtt 5400
tgcaaatgtg gagccccgaa ctgcagtggc ttcttgggtg taaggccaaa gaatcaaccc 5460
attgccacgg aagaaaagtc aaagaaattc aagaagaagc aacagggaaa gcgcaggacc 5520
cagggtgaaa tcacaaagga gcgagaagat gagtgtttta gttgtgggga tgctggccag 5580
ctcgtctcct gcaagaaacc aggctgccca aaagtttacc acgcagactg tctcaatctg 5640
accaagcgac cagcagggaa atgggaatgt ccgtggcatc agtgtgacat ctgcgggaag 5700
gaagcagcct ccttctgtga gatgtgcccc agctcctttt gtaagcagca tcgagaaggg 5760
atgcttttca tttccaaact ggatgggcgt ctgtcttgta ctgagcatga cccctgtggg 5820
cccaatcctc tggaacctgg ggagatccgt gagtatgtgc ctcccccagt accgctgcct 5880
ccagggccaa gcactcacct ggcagagcaa tcaacaggaa tggctgctca ggcacccaaa 5940
atgtcagata aacctcctgc tgacaccaac cagatgctgt cgctctccaa aaaagctctg 6000
gcagggactt gtcagaggcc attgctacct gaaagacctc ttgagagaac tgactccagg 6060
ccccagcctt tagataaggt cagagacctc gctgggtcag ggaccaaatc ccaatccttg 6120
gtttccagcc agaggccact ggacaggcca ccagcagtgg caggaccaag accccagcta 6180
agcgacaaac cctctccagt gaccagccca agctcctcac cctcagtcag gtcccaacca 6240
ctggaaagac ctctggggac ggctgaccca aggctggata aatccatagg tgctgccagc 6300
ccaaggcccc agtcactgga gaaaacctca gttcccactg gcctgagact tccgccgcca 6360
gacagactgc tcattactag cagtcccaaa ccccagactt cagacaggcc tactgacaaa 6420
ccccatgcct ctttgtccca gagactccca cctcctgaga aagtactatc agctgtggtc 6480
cagacccttg tagctaaaga aaaagcactg aggcctgtgg accagaatac tcagtcaaaa 6540
aatagagctg ctttggtgat ggatctcata gacctaactc ctcgccagaa ggagcgggca 6600
gcttcacctc atcaggtcac accacaggct gatgagaaga tgccagtgtt ggagtcaagt 6660
tcatggcctg ccagcaaagg tctggggcat atgccgagag ctgttgagaa aggctgtgtg 6720
tcagatcctc ttcagacatc tgggaaagca gcagcccctt cagaggaccc ctggcaagct 6780
gttaaatcac tcacccaggc cagacttctt tctcagcctc ctgccaaggc ctttttatat 6840
gagccaacaa ctcaggcctc aggaagagct tctgcagggg ctgagcagac cccagggcct 6900
cttagccaat ccccgggcct ggtgaagcag gcgaagcaga tggtcggagg ccagcaacta 6960
cctgcacttg ccgccaagag tgggcaatct tttaggtctc tcgggaaggc cccagcctcc 7020
ctccccactg aagaaaagaa gttggtaacc acagagcaaa gtccctgggc cctgggaaaa 7080
gcctcatcac gggcagggct ctggcccata gtggctggac agacactggc acagtcttgc 7140
tggtctgctg ggagcacaca gacattggca cagacttgct ggtctcttgg aagagggcaa 7200
gaccccaaac cagagcaaaa tacacttcca gctcttaacc aggctccttc cagtcacaag 7260
tgtgcagaat cagaacagaa gtag 7284
Claims (9)
- CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 단백질, 또는 상기 단백질을 코딩하는 유전자를 유효성분으로 포함하는, 항암제 내성 억제용 약학적 조성물.
- 제1항에 있어서, 상기 CARD6 단백질은 서열번호 1로 이루어지는 것을 특징으로 하는, 조성물.
- 제1항에 있어서, 상기 CARD6 단백질을 코딩하는 유전자는 서열번호 2로 이루어지는 것을 특징으로 하는, 조성물.
- 제1항에 있어서, 상기 NSD1 단백질은 서열번호 3 또는 4로 이루어지는 것을 특징으로 하는, 조성물.
- 제1항에 있어서, 상기 NSD1 단백질을 코딩하는 유전자는 서열번호 5 또는 6으로 이루어지는 것을 특징으로 하는, 조성물.
- 제1항에 있어서,
상기 항암제는 독소루비신 (doxorubicin)인 것을 특징으로 하는, 조성물.
- 제1항에 있어서, 상기 조성물은 교아세포종 (glioblastoma)에 적용되는 것을 특징으로 하는, 조성물.
- 하기 단계를 포함하는 항암제 내성 억제물질 스크리닝 방법:
a) in vitro 상에서 암세포에 후보 물질을 처리하는 단계;
b) 상기 암세포의 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 측정하는 단계; 및
c) 비처리군에 비해 CARD6 (caspase activation and recruitment domain family, member 6) 또는 NSD1 (nuclear receptor binding SET domain protein 1) 발현을 증진시키는 물질을 항암제 내성 억제물질로 선정하는 단계.
- 제8항에 있어서,
상기 암세포는 교아세포종 (glioblastoma) 세포인 것을 특징으로 하는, 스크리닝 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160179400A KR20180075265A (ko) | 2016-12-26 | 2016-12-26 | 항암제 내성 특이 유전자 및 이의 용도 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160179400A KR20180075265A (ko) | 2016-12-26 | 2016-12-26 | 항암제 내성 특이 유전자 및 이의 용도 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180075265A true KR20180075265A (ko) | 2018-07-04 |
Family
ID=62913357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160179400A KR20180075265A (ko) | 2016-12-26 | 2016-12-26 | 항암제 내성 특이 유전자 및 이의 용도 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20180075265A (ko) |
-
2016
- 2016-12-26 KR KR1020160179400A patent/KR20180075265A/ko not_active Application Discontinuation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220389519A1 (en) | Biomarkers predictive of anti-immune checkpoint response | |
KR20170126443A (ko) | 담관암에 대한 치료제 | |
Uppal et al. | The bromodomain protein 4 contributes to the regulation of alternative splicing | |
KR20200003422A (ko) | 인간 ezh2의 억제제 및 이의 사용 방법 | |
KR20050074468A (ko) | 비-소세포성 폐암을 진단하는 방법 | |
WO2020081556A2 (en) | Non-canonical swi/snf complex and uses thereof | |
US20220193193A1 (en) | Methods for identification, assessment, prevention, and treatment of metabolic disorders using slit2 | |
Orban et al. | Juvenile amyotrophic lateral sclerosis | |
WO2021183218A1 (en) | Compositions and methods for modulating the interaction between ss18-ssx fusion oncoprotein and nucleosomes | |
AU2014329606B2 (en) | Methods for the identification, assessment, prevention, and treatment of neurological disorders and diseases using Fndc5 | |
US20090136482A1 (en) | Drug target protein and target gene, and screening method | |
JP2005514910A (ja) | 乳癌の処置に対する遺伝子標的を同定するための方法および試薬 | |
JP2002532515A (ja) | 蛋白質チロシンホスファターゼtc−ptpの治療的および診断的利用 | |
AU2006214489A1 (en) | Metabolic-based methods for modulating gene expression | |
Shi et al. | Overexpression of ZNRD1 promotes multidrug-resistant phenotype of gastric cancer cells through upregulation of P-glycoprotein | |
KR20180075265A (ko) | 항암제 내성 특이 유전자 및 이의 용도 | |
US20040248139A1 (en) | Eit-6, a polypeptide encoded by an estrogen regulated gene | |
WO2023099929A1 (en) | Methods for treating notch1-driven cancers | |
JP2023510297A (ja) | アルツハイマー病の治療 | |
JP2024052068A (ja) | がんの治療に用いるための組成物 | |
KR101734652B1 (ko) | 독소루비신 내성 관련 유전자 및 이의 용도 | |
KR20220145688A (ko) | 대장암 진단용 바이오마커 및 대장암 예방 또는 치료용 약학적 조성물 | |
JP5827322B2 (ja) | 癌の治療方法 | |
KR20210035643A (ko) | Myo1d의 발현 억제제를 유효성분으로 포함하는 암 예방 또는 치료용 약학 조성물 | |
STAT | Activating STAT6 mutations in follicular lymphoma |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |