CN115461475A - Myc癌基因的靶向mb2及其与癌症中的trrap的相互作用 - Google Patents

Myc癌基因的靶向mb2及其与癌症中的trrap的相互作用 Download PDF

Info

Publication number
CN115461475A
CN115461475A CN202080095193.7A CN202080095193A CN115461475A CN 115461475 A CN115461475 A CN 115461475A CN 202080095193 A CN202080095193 A CN 202080095193A CN 115461475 A CN115461475 A CN 115461475A
Authority
CN
China
Prior art keywords
myc
trrap
cancer
leu
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080095193.7A
Other languages
English (en)
Inventor
E·J·费里斯
M·D·科尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dartmouth College
Original Assignee
Dartmouth College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dartmouth College filed Critical Dartmouth College
Publication of CN115461475A publication Critical patent/CN115461475A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/41Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having five-membered rings with two or more ring hetero atoms, at least one of which being nitrogen, e.g. tetrazole
    • A61K31/425Thiazoles
    • A61K31/427Thiazoles not condensed and containing further heterocyclic rings
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/41Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having five-membered rings with two or more ring hetero atoms, at least one of which being nitrogen, e.g. tetrazole
    • A61K31/41641,3-Diazoles
    • A61K31/41841,3-Diazoles condensed with carbocyclic rings, e.g. benzimidazoles
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/435Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with one nitrogen as the only ring hetero atom
    • A61K31/44Non condensed pyridines; Hydrogenated derivatives thereof
    • A61K31/4427Non condensed pyridines; Hydrogenated derivatives thereof containing further heterocyclic ring systems
    • A61K31/4439Non condensed pyridines; Hydrogenated derivatives thereof containing further heterocyclic ring systems containing a five-membered ring with nitrogen as a ring hetero atom, e.g. omeprazole
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/435Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with one nitrogen as the only ring hetero atom
    • A61K31/47Quinolines; Isoquinolines
    • A61K31/4709Non-condensed quinolines and containing further heterocyclic rings
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/50Pyridazines; Hydrogenated pyridazines
    • A61K31/501Pyridazines; Hydrogenated pyridazines not condensed and containing further heterocyclic rings
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/50Pyridazines; Hydrogenated pyridazines
    • A61K31/502Pyridazines; Hydrogenated pyridazines ortho- or peri-condensed with carbocyclic ring systems, e.g. cinnoline, phthalazine
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/505Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim
    • A61K31/517Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim ortho- or peri-condensed with carbocyclic ring systems, e.g. quinazoline, perimidine
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/505Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim
    • A61K31/519Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim ortho- or peri-condensed with heterocyclic rings
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5011Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing antineoplastic activity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • G01N33/5023Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on expression patterns
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/536Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase
    • G01N33/542Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase with steric inhibition or signal modification, e.g. fluorescent quenching
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/02Screening involving studying the effect of compounds C on the interaction between interacting molecules A and B (e.g. A = enzyme and B = substrate for A, or A = receptor and B = ligand for the receptor)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Toxicology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Organic Chemistry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

提供了用于鉴定致癌转录因子MYC与其辅因子TRRAP之间相互作用的抑制剂的方法和组合物。这些方法涉及用于探测MYC和TRRAP之间的相互作用以及用于鉴定MYC‑TRRAP相互作用的抑制剂的基于细胞的和体外的方法。还提供了用作MYC和TRRAP之间的相互作用的抑制剂的化合物,以及从此类化合物开发癌症治疗剂的方法,所述方法包括用于衍生此类抑制剂和用于测试抑制剂以及衍生抑制剂治疗受试者的癌症的能力的方法。本文提供的方法、化合物和组合物可提供各种优势,诸如靶向癌症中的致癌转录因子MYC的手段。

Description

MYC癌基因的靶向MB2及其与癌症中的TRRAP的相互作用
相关申请
本申请要求2019年12月2日提交的美国临时申请号62/942,734的优先权,所述临时申请的内容通过引用整体并入本文。
联邦资助研究声明
本发明根据美国国家卫生研究所国家癌症研究所(National Cancer Instituteof the National Institutes of Health)授予的授权号5R01CA055248-25下的政府资助产生。美国政府享有本发明的某些权利。
对序列表的引用
本申请含包括序列表,所述序列表以ASCII格式通过EFS-Web提交并且由此通过引用整体并入。所述ASCII副本创建于2019年12月2日,命名为1143252o004400.txt,并且大小为61.3KB。
技术领域
本公开通常涉及癌症治疗领域,并且更具体地,涉及用于鉴定MYC和TRRAP之间相互作用的抑制剂的方法。因此,本公开涉及用于探测MYC和TRRAP之间相互作用的基于细胞的和体外的方法和组合物。本公开通常还涉及用作MYC和TRRAP之间相互作用的抑制剂的化学化合物及其衍生物、包含此类抑制剂的治疗组合物、以及使用其用于治疗受试者的癌症的方法。
背景技术
癌细胞通过由多个遗传和表观遗传异常的逐步积累驱动的多阶段过程进化。尽管致癌过程很复杂,但该过程很脆弱:癌细胞的生长和存活可能会因单个癌基因的失活而受损(1)。改变的转录程序还可以使癌细胞高度依赖某些基因表达调控子(2)。因此,对细胞增殖机制的研究带来了发现新疗法的希望。对肿瘤基因组的广泛研究揭示了影响正常转录控制的复发性体细胞突变(2)。这些中的一种是MYC,即转录的主要调控子。MYC在致癌过程中发挥着核心作用,并且是扰乱失调转录程序的药物最想要的靶点。事实上许多癌细胞在没有MYC的情况下无法存活-即被称为“MYC成瘾”的现象为开发MYC-特异性靶向疗法提供了一个令人信服的案例。
MYC转录因子
MYC表达失调是70%的所有癌症(3)的标志,并且MYC是人癌症中最常扩增的基因。此外,致癌信号传导通路中的多种突变可导致MYC过表达(4,5)。MYC蛋白水平相对较小的变化可以促进或阻止致癌转化或癌症发展。MYC的生物学功能可能比任何其他基因的生物学功能更广泛。这些功能包括控制细胞增殖、促进致癌转化、诱导肿瘤形成、阻断分化、诱导细胞凋亡、诱导G2阻滞和改变癌症的遗传易感性等(6)。
MYC家族有三个成员:c-MYC(MYC)、N-MYC(或MYCN)和L-MYC(或MYCL)。在生物体的生命中,MYC在所有增殖细胞中普遍表达,而MYCN通常与MYC在干细胞和其他原始谱系中共同表达(7,8)。虽然MYCN在一部分肿瘤中扩增,但MYC是癌症中最常见的失调基因(9,10)。虽然MYC家族的所有三个成员在细胞表达和染色体基因座上都不同,但它们的蛋白产物主要由相同的两个结构域组成:一个N端反式激活结构域和一个C端DNA结合结构域。所有MYC家族蛋白的C末端都是高度保守的,并且包括一个碱性螺旋-环-螺旋/亮氨酸拉链(bHLH/LZ)基序,并且该碱性区域是与DNA进行序列特异性相互作用所需的(11,12)。MYC家族成员的N末端有四个主要的保守结构区域。这些区域被称为MYC同源框1至4(MB1-4)(13)。MB,尤其是MB2,在进化上高度保守,从人延伸到海绵(14)。MB2对于MYC的“经典”靶基因的反式激活和抑制都是必需的(15-17)。
由于MYC没有固有的酶活性,所以有时被认为是“不可成药的”(18,19)。然而,涉及MYC的蛋白质-蛋白质相互作用(PPI)有望被治疗性靶向。MYC DNA-结合结构域与MAX异二聚化,并且一起与DNA形成紧密复合物。几个实验室试图找到抑制MYC:MAX相互作用的小分子,但成功有限(18-20)。靶向这种蛋白质-蛋白质界面的一个困难是它涉及整个bHLH和LZ结构域的广泛接触,并且无数其他转录因子共享这些基序(11)。因此,很难抑制MYC:MAX异二聚体而不对其他HLH、LZ或卷曲螺旋蛋白产生脱靶副作用。
转化/转录结构域相关蛋白(TRRAP)
MYC反式激活结构域(TAD)也参与多种PPI,包括与转化/转录结构域相关蛋白(TRRAP)的相互作用。TRRAP已被证明是关键的MYC辅因子(21-23),并且MYC:TRRAP结合需要MB2(23,24)。TRRAP是各种组蛋白-乙酰化(HAT)复合物的成员,有助于转录因子(如MYC)控制基因表达。TRRAP作为重要的MYC辅因子的鉴定建立了与含有GCN5和TIP60的HAT复合物的联系,并且为MYC的功能提供了重要的机制见解(17,19,22,23,25)。TRRAP是一种高度保守的434Kba蛋白,属于磷酸肌醇3-激酶相关激酶(PIKK)家族,包括mTOR、DNA PKcs、ATM/Tel1、ATR/Mec1和SM 73G-1(26,27)。PIKK是参与转录调控、DNA修复、细胞生长、代谢控制和mRNA监测的激酶,但TRRAP缺乏激酶结构域并且在整个进化过程中没有酶促活性(22,28)。相反,TRRAP被认为起到支架、桥接转录因子和染色质修饰复合物的作用(29,30)。TRRAP是一种必需基因,并且其破坏会导致小鼠早期胚胎死亡(25,31)。TRRAP突变与肿瘤发生有关,并且一些模型将TRRAP描述为癌基因(32,33)。很难调和TRRAP仅仅作为支架的拟议功能与关于其在细胞周期和疾病中作用的观察结果。有必要进一步研究TRRAP的生物学功能。
TRRAP是大量的并且参与各种兆道尔顿大小的蛋白质复合物。它是STAGA和NuA4HAT复合物的亚基,分别含有GCN5和Tip60(19,25,34)。虽然它缺乏催化活性,但TRRAP对转录辅激活因子功能至关重要,并且使STAGA和NuA4的活性能够针对特定基因以刺激它们的表达(35)。这些复合物使用TRRAP介导它们与转录因子(如MYC、E2F、E1A和p53)的相互作用,使其成为所有真核生物中的保守激活剂靶点(23,36,37)。通过使基因启动子周围的组蛋白修饰和组蛋白尾部上赖氨酸残基的高度乙酰化成为可能,TRRAP对DNA的募集导致转录激活(22,38)。
最近,据报道,酿酒酵母(Saccharomyces cerevisiae)Tra1p的Cryo-EM结构为
Figure BDA0003774183670000021
分辨率,揭示了广泛的α-螺旋螺线管网络(40)。建立了一个原子模型,其中3474个残基分配有可见的侧链,但在重建过程中没有解析270个残基。这些未解析的残基分布在含有环或无序区的链断裂处。Tra1p被发现具有从N端到C端依次排列的HEAT、FAT、FRB、激酶和FATC结构域,这是PIKK家族蛋白的特征(26,27)。与Tra1p对齐的TRRAP二级结构的预测揭示了98%的螺旋重复重叠,尽管这两种蛋白质的序列只有27%同一(41)。
MYC:TRRAP相互作用
该MYC:TRRAP相互作用已被粗略地作图(23,39),然而,尚未描述此PPI的精确结构域。McMahon等人确定MB2是MYC:TRRAP相互作用所需的(39),但没有描述足以用于TRRAP结合的最小MYC结构域。同样,尚未描述TRRAP的最小足够MYC结合结构域。鉴定MYC:TRRAP PPI所需的这些最小结构域对于进一步研究很重要。因此,需要进一步描述MYC:TRRAP相互作用。更重要的是,需要鉴定和开发可以治疗性靶向癌症中的MYC并且特别是抑制MYC:TRRAP相互作用的小分子。因此,在本文的目的中,本文的一个目的是为此目的提供方法、化合物和组合物。
发明内容
本公开通常涉及一种用于鉴定MYC转录因子和转化/转录结构域相关蛋白(TRRAP)之间的结合相互作用的抑制剂的方法。该方法可以包括(a)形成具有MYC:TRRAP结合相互作用的MYC:TRRAP复合物;(b)直接和/或间接检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用以确定MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的基线测量;(c)在形成具有MYC:TRRAP结合相互作用的MYC:TRRAP复合物之前或之后引入化学化合物;以及(d)与基线测量相比,确定在引入化学化合物后MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的不存在或降低,其中MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的不存在或降低指示该化学化合物是MYC和TRRAP之间结合相互作用的抑制剂。
在一些实施方案中,MYC可包含与SEQ ID NO:2或另一哺乳动物MYC氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、或至少99%同一的氨基酸序列。在一些实施方案中,TRRAP可包含与SEQ ID NO:4或另一哺乳动物TRRAP氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、或至少99%同一的氨基酸序列。
在一些实施方案中,该MYC:TRRAP复合物可以在体外环境中形成。在一些实施方案中,可以在细胞中形成该MYC:TRRAP复合物。该细胞可以选自人细胞、哺乳动物细胞、昆虫细胞、酵母细胞和细菌细胞。在一些实施方案中,该MYC:TRRAP复合物可以在选自秀丽隐杆线虫、黑腹果蝇、斑马鱼、啮齿动物和非人灵长类动物的非人动物中形成。在一些实施方案中,该MYC:TRRAP复合物可以由内源性MYC和内源性TRRAP形成。在一些实施方案中,该MYC:TRRAP复合物可以由内源性MYC和外源TRRAP或外源TRRAP片段形成。在一些实施方案中,该MYC:TRRAP复合物可以由内源性TRRAP和外源MYC或外源MYC片段形成。在一些实施方案中,该MYC:TRRAP复合物可以由外源MYC或外源MYC片段和外源TRRAP或外源TRRAP片段形成。在一些实施方案中,可以将外源MYC或外源MYC片段引入细胞中或者可以从可以引入细胞中或非人动物中的外源核酸表达。在一些实施方案中,可以将外源TRRAP或外源TRRAP片段引入细胞中或者可以从可以引入细胞中或非人动物中的外源核酸表达。在一些实施方案中,该外源核酸可以选自DNA、RNA、mRNA、质粒、载体、和病毒构建体。在一些实施方案中,该细胞或非人动物可以被遗传工程化以表达外源MYC、外源MYC片段、外源TRRAP、和/或外源TRRAP片段。
在一些实施方案中,该MYC:TRRAP复合物可包含全长MYC和全长TRRAP。在一些实施方案中,该MYC:TRRAP复合物可包含MYC片段和TRRAP片段。在一些实施方案中,该MYC:TRRAP复合物可包含全长MYC和TRRAP片段。在一些实施方案中,该MYC:TRRAP复合物可包含MYC片段和全长TRRAP。在一些实施方案中,该MYC:TRRAP复合物可包含MYC-TRRAP融合物,该融合物包含全长MYC、接头和全长TRRAP。在一些实施方案中,该MYC:TRRAP复合物可包含MYC-TRRAP融合物,该融合物包含MYC片段、接头和TRRAP片段。在一些实施方案中,该MYC:TRRAP复合物可包含MYC-TRRAP融合物,该融合物包含全长MYC、接头和TRRAP片段。在一些实施方案中,该MYC:TRRAP复合物可包含MYC-TRRAP融合物,该融合物包含MYC片段、接头和全长TRRAP。在一些实施方案中,该MYC片段可包含最小MYC区域。在一些实施方案中,该最小MYC区域可以是MYC MB2结构域。在一些实施方案中,该TRRAP片段可包含最小TRRAP区域。在一些实施方案中,该最小TRRAP区域可以是TRRAP 2033-2088区域。在一些实施方案中,该接头可包含SEQ ID NO:5的氨基酸序列。
在一些实施方案中,该全长MYC可包含亲和标签、可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段。在一些实施方案中,该MYC片段可包含亲和标签、可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段。在一些实施方案中,该全长TRRAP可包含亲和标签、可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段。在一些实施方案中,该TRRAP片段可包含亲和标签、可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段。
在一些实施方案中,该MYC片段可以是MYC 129-145片段(即,MYC MB2片段或MB2结构域)。在一些实施方案中,MYC 129-145片段可包含与SEQ ID NO:6或与来自非人哺乳动物物种的相应MYC 129-145氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、或至少99%同一的氨基酸序列,该来自非人哺乳动物物种的相应MYC氨基酸序列通过将一种或多种非人哺乳动物物种的MYC氨基酸序列与SEQ ID NO:2对齐并且选择与SEQ ID NO:2的氨基酸残基129-145对齐的氨基酸残基获得。
在一些实施方案中,该MYC片段可以是MYC 1-190片段。在一些实施方案中,MYC 1-190片段可包含与SEQ ID NO:7或与来自非人哺乳动物物种的相应MYC 1-190氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、或至少99%同一的氨基酸序列,该来自非人哺乳动物物种的相应MYC氨基酸序列通过将一种或多种非人哺乳动物物种的MYC氨基酸序列与SEQ ID NO:2对齐并且选择与SEQ ID NO:2的氨基酸残基1-190对齐的氨基酸残基获得。
在一些实施方案中,该MYC片段可以是MYC 120-161片段。在一些实施方案中,MYC120-161片段可包含与SEQ ID NO:8或与来自非人哺乳动物物种的相应MYC 120-161氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、或至少99%同一的氨基酸序列,该来自非人哺乳动物物种的相应MYC氨基酸序列通过将一种或多种非人哺乳动物物种的MYC氨基酸序列与SEQ ID NO:2对齐并且选择与SEQ IDNO:2的氨基酸残基120-161对齐的氨基酸残基获得。
在一些实施方案中,该TRRAP片段可以是TRRAP 2033-2088片段。在一些实施方案中,TRRAP 2033-2088片段可包含与SEQ ID NO:9或与来自非人哺乳动物物种的相应TRRAP2033-2088氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、或至少99%同一的氨基酸序列,该来自非人哺乳动物物种的相应MYC氨基酸序列通过将一种或多种非人哺乳动物物种的TRRAP氨基酸序列与SEQ IDNO:4对齐并且选择与SEQ ID NO:4的氨基酸残基2033-2088对齐的氨基酸残基获得。
在一些实施方案中,该TRRAP片段可以是TRRAP 2033-2283片段。在一些实施方案中,TRRAP 2033-2283片段可包含与SEQ ID NO:10或与来自非人哺乳动物物种的相应TRRAP2033-2283氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、或至少99%同一的氨基酸序列,该来自非人哺乳动物物种的相应MYC氨基酸序列通过将一种或多种非人哺乳动物物种的TRRAP氨基酸序列与SEQ ID NO:4对齐并且选择与SEQ ID NO:4的氨基酸残基2033-2283对齐的氨基酸残基获得。
在一些实施方案中,该化学化合物可以是分离的化学化合物。在一些实施方案中,该化学化合物可以包含在化学化合物的混合物中。在一些实施方案中,该化学化合物可包括小分子有机化学化合物。在一些实施方案中,该化学化合物可以选自小分子化学化合物库。在一些实施方案中,可以以10nM至100μM范围内的各种浓度引入该化学化合物。在一些实施方案中,该方法可以还包括确定该化学化合物的IC50值。在一些实施方案中,可以以25μM的浓度引入该化学化合物。在一些实施方案中,该化学化合物可以选自表1中列出的化学化合物。在一些实施方案中,该方法可以还包括设计、合成和测试衍生自表1中列出的化学化合物中的一种或多种的化学化合物抑制MYC和TRRAP之间的结合相互作用的能力。
在一些实施方案中,该方法可以还包括通过测试该化学化合物抑制MYC和MYC相关因子MAX之间的结合相互作用的能力来确定化学化合物抑制MYC和TRRAP之间的结合相互作用的特异性。
在一些实施方案中,该方法可以还包括基于细胞的蛋白质-片段互补测定以检测该MYC:TRRAP复合物和/或该MYC:TRRAP结合相互作用。
在一些实施方案中,基于细胞的蛋白质-片段互补测定可以是发光互补测定。在一些实施方案中,发光互补测定可以包括:a.SmB-萤光素酶-MYC融合物,其包含N-末端SmB-萤光素酶片段和C-末端全长MYC或C-末端MYC片段;以及b.包含N-末端TRRAP片段和C-末端LgB-萤光素酶片段的TRRAP-LgB-萤光素酶融合物;其中SmB-萤光素酶-MYC融合物和TRRAP-LgB-萤光素酶融合物形成MYC:TRRAP复合物,由此SmB-萤光素酶片段和LgB-萤光素酶片段形成功能性萤光素酶,该功能性萤光素酶在萤光素酶底物存在下产生发光信号。在一些实施方案中,该MYC片段可以是MYC 1-190片段并且该TRRAP片段可以是TRRAP 2033-2283片段。在一些实施方案中,该功能性萤光素酶可以是衍生自深海细脚刺虾(Oplophorusgracilirostris)的19.1kDa萤光素酶。在一些实施方案中,SmB-萤光素酶-MYC融合物和TRRAP-LgB-萤光素酶融合物可各自在来自包含组成型启动子的哺乳动物表达载体的细胞中表达。在一些实施方案中,该启动子可以是CMV启动子。在一些实施方案中,SmB-萤光素酶-MYC融合物的表达水平和TRRAP-LgB-萤光素酶融合物的表达水平可以基本上相等。在一些实施方案中,细胞可以是HeLa细胞或Expi 293细胞或Expi 293细胞悬液。在一些实施方案中,该萤光素酶底物可以是呋喃嗪(furimazine)。在一些实施方案中,发光互补测定可还包括检测由直接抑制SmB-萤光素酶和LgB-萤光素酶片段的萤光素酶活性或由抑制SmB-萤光素酶和LgB-萤光素酶片段的互补引起的假阳性结果。在一些实施方案中,该细胞可以进一步表达荧光报告物,其中使用该荧光报告物来归一化转染效率和细胞数。在一些实施方案中,该荧光报道分子可以是EGFP。在一些实施方案中,可以以10nM至100μM范围内的各种浓度引入该化学化合物。在一些实施方案中,该方法可以还包括确定该化学化合物的IC50值。在一些实施方案中,可以以25μM的浓度引入化学化合物并且可以将发光信号降低至少50%。在一些实施方案中,该化学化合物可以选自表1、表2、表5中列出的化学化合物或可以包含表4中列出的4种通用结构之一。在一些实施方案中,该方法可以还包括设计、合成和测试衍生自表1、表2、表5中列出的化学化合物中的一种或多种的化学化合物或包含表4中列出的4种通用结构之一的化学化合物抑制MYC和TRRAP之间的结合相互作用的能力。
在一些实施方案中,该方法可以还包括从细胞中共纯化该MYC:TRRAP复合物以检测该MYC:TRRAP复合物和/或该MYC:TRRAP结合相互作用。这些细胞可以选自人细胞、哺乳动物细胞、昆虫细胞、酵母细胞和细菌细胞。
在一些实施方案中,该方法可以还包括从细胞裂解物中共免疫沉淀该MYC:TRRAP复合物以检测该MYC:TRRAP复合物和/或该MYC:TRRAP结合相互作用。该细胞裂解物可以选自人细胞裂解物、哺乳动物细胞裂解物、昆虫细胞裂解物、酵母细胞裂解物、和细菌细胞裂解物。在一些实施方案中,该共免疫沉淀可包含具有第一亲和标签的全长MYC或MYC片段和具有第二亲和标签的全长TRRAP或TRRAP片段,并且其中:a.具有第一亲和标签的全长MYC或MYC片段和具有第二亲和标签的全长TRRAP或TRRAP片段在细胞中共表达:以及b.第一亲和标签和第二亲和标签不同。在一些实施方案中,共免疫沉淀可包含:a.具有第一亲和标签的全长MYC或MYC片段,其中具有第一亲和标签的全长MYC或MYC片段在细胞中表达并且共免疫沉淀内源性TRRAP;或b.具有第一亲和标签的全长TRRAP或TRRAP片段;其中具有第一亲和标签的全长TRRAP或TRRAP片段在细胞中表达并且共免疫沉淀内源性MYC。在一些实施方案中,该第一亲和标签和该第二亲和标签可以选自PYO标签和FLAG标签,任选地其中该第一亲和标签和该第二亲和标签不同。在一些实施方案中,可以使用抗MYC抗体、抗TRRAP抗体、抗FLAG抗体、和/或抗PYO抗体通过蛋白质印迹分析检测MYC:TRRAP复合物。在一些实施方案中,该MYC片段可以是MYC1-190片段并且该TRRAP片段可以是TRRAP 2033-2283片段。在一些实施方案中,该细胞裂解物可以是人细胞裂解物。在一些实施方案中,该细胞裂解物可以是HEK293T细胞裂解物。
在一些实施方案中,蛋白质稳定添加剂可以选自乙二醇(EG)、2,2,2-三氟乙醇(TFE)和氘化TFE(TFE-d2)、或这些的任何组合。在一些实施方案中,蛋白质稳定添加剂在体外环境中的浓度范围可以为约5%(v/v)至约50%(v/v)。在一些实施方案中,蛋白质稳定添加剂在体外环境中的浓度范围可以为约20%(v/v)至约30%(v/v)。
在一些实施方案中,该方法可以还包括体外下拉测定以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。在一些实施方案中,体外下拉测定可包含由MYC-TRRAP融合物形成的MYC:TRRAP复合物,其中MYC-TRRAP融合物包含至少一个亲和标签。在一些实施方案中,MYC-TRRAP融合物可包含MYC 1-190片段、接头、TRRAP2033-2088片段、和亲和标签。在一些实施方案中,该方法可以还包括在接头内的蛋白酶切割位点对MYC:TRRAP融合物进行蛋白水解切割。蛋白酶切割位点可以是MYC:TRRAP融合中的任何独特的蛋白酶切割位点。在一些实施方案中,该蛋白酶切割位点可以是3C蛋白酶切割位点或TEV切割位点。
在一些实施方案中,该方法可以还包括核磁共振(NMR)测定以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。在一些实施方案中,该NMR测定可以包含:a.由MYC-TRRAP融合形成的MYC:TRRAP复合物;b.1H,15N-HSQC NMR;以及c.一个或多个指示MYC w135化学环境的化学位移峰;其中当MYC:TRRAP结合相互作用存在时与MYC:TRRAP结合相互作用不存在时相比,一个或多个化学位移峰是不同的。在一些实施方案中,该MYC-TRRAP融合物可包含MYC 120-161片段、接头、和TRRAP 2033-2088片段。
在一些实施方案中,该方法可以还包括MYC W135的固有荧光以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用,其中当MYC:TRRAP结合相互作用存在时与MYC:TRRAP结合相互作用不存在时相比,MYC W135的固有荧光是不同的。
在一些实施方案中,该方法可以还包括MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的计算机计算分析。
在一些实施方案中,基于细胞的蛋白质-片段互补测定可以是生物分子荧光互补(BiFC)测定。
在一些实施方案中,该方法可还包括尺寸排阻色谱以检测该MYC:TRRAP复合物和/或该MYC:TRRAP结合相互作用。
在一些实施方案中,该方法可以还包括生物发光共振能量转移(BRET)以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。
在一些实施方案中,该方法可以还包括荧光共振能量转移(FRET)以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。
在一些实施方案中,该方法可以还包括荧光偏振(FP)和/或荧光各向异性(FA)以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。
在一些实施方案中,该方法可以还包括表面等离子共振(SPR)以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。
在一些实施方案中,该方法可以还包括天然聚丙烯酰胺凝胶电泳(PAGE)以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。
在一些实施方案中,该方法可以还包括蛋白质微阵列以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。
在一些实施方案中,该方法可以还包括微流体测定以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。
在一些实施方案中,该方法可以还包括电子显微术以检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用。
此外,本公开通常涉及一种用于开发癌症治疗剂的方法,其包括:a.通过本文所述的任何方法鉴定MYC和TRRAP之间的结合相互作用的抑制剂;b.任选地衍生所鉴定的抑制剂以产生衍生抑制剂并且测试衍生抑制剂抑制MYC和TRRAP之间的结合相互作用的能力;以及c.测试该抑制剂或该衍生抑制剂治疗受试者癌症的能力。
此外,本公开通常涉及一种用于治疗患有至少一种癌症的受试者的方法,其包括向受试者施用治疗有效量的化学化合物,其中该化学化合物已通过本文所述的任何方法被鉴定为MYC和TRRAP之间的结合相互作用的抑制剂。
在一些实施方案中,该受试者可以是选自啮齿动物、非人灵长类动物和人的哺乳动物。在一些实施方案中,该受试者可以是人。在一些实施方案中,至少一种癌症可以选自以下中的一种或多种:腺组织中的腺癌、器官胚胎组织中的胚细胞瘤、上皮组织中的癌、形成血细胞的组织中的白血病、淋巴组织中的淋巴瘤、骨髓中的骨髓瘤、结缔或支持组织中的肉瘤、肾上腺癌、AIDS相关淋巴瘤、卡波西肉瘤、膀胱癌、骨癌、脑癌、乳腺癌、类癌瘤、宫颈癌、化疗抗性癌症、结肠癌、子宫内膜癌、食道癌、胃癌、头癌、颈癌、肝胆管癌、肾癌、白血病、肝癌、肺癌、淋巴瘤、霍奇金病、非霍奇金淋巴瘤、转移癌、神经系统肿瘤、口腔癌、卵巢癌、胰腺癌、前列腺癌、直肠癌、皮肤癌、胃部癌症、睾丸癌、甲状腺癌、尿道癌、骨髓癌、多发性骨髓瘤、转移到骨的肿瘤、浸润神经和中空内脏的肿瘤以及神经结构附近的肿瘤。
此外,本公开通常涉及一种用作MYC和TRRAP之间的结合相互作用的抑制剂的化学化合物,其中该化学化合物选自表1中列出的化学化合物。在一些实施方案中,该化学化合物可以是:
Figure BDA0003774183670000061
或其衍生物。
在一些实施方案中,该化学化合物可以是表1、表2、表5中列出的化学化合物的衍生物或包含表4中列出的4种通用结构之一的化学化合物。
此外,本公开通常涉及一种包含如本文所述的化学化合物和药学上合适的载体的组合物。在一些实施方案中,该组合物可包含如本文所述的化学化合物的衍生物和药学上合适的载体。
此外,本公开通常涉及一种用于治疗患有至少一种癌症的受试者的方法,其包括施用治疗有效量的如本文所述的化学化合物。在一些实施方案中,用于治疗患有至少一种癌症的受试者的方法可以包括施用治疗有效量的如本文所述的化学化合物的衍生物。
在一些实施方案中,该受试者可以是选自啮齿动物、非人灵长类动物和人的哺乳动物。在一些实施方案中,该受试者可以是人。在一些实施方案中,至少一种癌症可以选自以下中的一种或多种:腺组织中的腺癌、器官胚胎组织中的胚细胞瘤、上皮组织中的癌、形成血细胞的组织中的白血病、淋巴组织中的淋巴瘤、骨髓中的骨髓瘤、结缔或支持组织中的肉瘤、肾上腺癌、AIDS相关淋巴瘤、卡波西肉瘤、膀胱癌、骨癌、脑癌、乳腺癌、类癌瘤、宫颈癌、化疗抗性癌症、结肠癌、子宫内膜癌、食道癌、胃癌、头癌、颈癌、肝胆管癌、肾癌、白血病、肝癌、肺癌、淋巴瘤、霍奇金病、非霍奇金淋巴瘤、转移癌、神经系统肿瘤、口腔癌、卵巢癌、胰腺癌、前列腺癌、直肠癌、皮肤癌、胃部癌症、睾丸癌、甲状腺癌、尿道癌、骨髓癌、多发性骨髓瘤、转移到骨的肿瘤、浸润神经和中空内脏的肿瘤以及神经结构附近的肿瘤。
附图说明
图IA-图1C呈现了有关MYC:TRRAP的最小交互结构域的数据。(A)将TRRAP的231个指示区域克隆到CMV-FLAG表达载体中。蛋白质与PYO标记的全长MYC(1-439)共表达,然后用抗PYO珠对MYC进行IPed。通过蛋白质印迹用抗FLAG评估Co-IP。最关键的结合结构域位于残基1997-2088内。(B)将全长TRRAP(1-3830)和TRRAPΔ2033-2088克隆到CMV-FLAG表达载体中并且转染到HEK293T细胞中。蛋白质与PYO237标记的全长MYC共表达,然后用抗PYO珠对MYC进行IPed。通过蛋白质印迹评价Co-IP。TRRAPΔ2033-2088显示与MYC的结合降低。(C)将全长MYC、MYC AMB2、MYC 1-190和MYC 1-190AMB2克隆到CMV-PYO表达载体中并且转染到HEK293T细胞中。蛋白质与FLAG标记的TRRAP 2033-2283共表达,然后用抗PYO珠对MYC进行IPed。通过蛋白质印迹评价Co-IP。TRRAP 2033-2283显示与全长MYC相等的co-IP,与MYC 1-190一样,并且都需要MB2。
图2A-图2B呈现了关于内源性co-IP确认的数据。(A)将MYC 1-190和MYC 1-190ΔMB2克隆到CMV-PYO表达载体中并且转染到HEK293T细胞中,然后用抗PYO珠对MYC进行IPed。通过蛋白质印迹评价内源性TRRAP的Co-IP。用MYC 1-190对内源性TRRAP进行co-IP,但需要MB2。(B)MYC、MYCΔMB2和MYC W135G被克隆到CMV-PYO表达载体中并且转染到HEK293T细胞中,然后用抗PYO珠对MYC进行IPed。通过蛋白质印迹评价内源性TRRAP的Co-IP。可以用MYC对内源性TRRAP进行co-IP,并且需要MB2和W135。
图3A-图3B呈现了关于蛋白质纯化策略的数据。(A)一般蛋白质纯化策略涉及在大肠杆菌中产生由修饰的pGEX载体表达的蛋白质构建体,该载体含有N-末端GST标签和C-末端TS标签。(B)生产和裂解后的考马斯染色SDS-PAGE,澄清的裂解物经过谷胱甘肽柱并且洗脱蛋白质构建体。然后将其加载到
Figure BDA0003774183670000072
XT柱上并且用生物素进行第二次洗脱。然后将洗脱液进行TEV蛋白酶的切割反应,在4℃下进行16小时。接下来,在琼脂糖谷胱甘肽珠上去除GST标签和TEV蛋白酶。随后去除了
Figure BDA0003774183670000071
XT珠上的TS标签。最后,将样品加载到SEC柱上。在最后的纯化步骤之后,将其浓缩、快速冷冻并且储存在-80℃。
图4A-图4C呈现了关于MYC:TRRAP复合物的数据不会在体外形成。(A)MYC 1-190与TRRAP 2033-2088在体外以10μM混合的CD光谱。(B)MYC 1-190ΔMB2与TRRAP 2033-2088在体外以10μM混合的CD光谱。在将MYC 1-190或MYC 1-190ΔMB2与TRRAP 2033-2088混合后,CD光谱显示二级结构没有增益。(C)TRRAP 2033-2088与各50μM的MYC 1-190和MYC 1-190AMB2混合的TS标签下拉的考马斯染色SDS-PAGE。该结果表明MYC 1-190和TRRAP 2033-2088在体外混合时不会相互作用。
图5A-图5K呈现了有关添加剂对MYC和TRRAP影响的数据。(A-K)MYC 1-190、MYC 1-190与TRRAP 2033-2088混合的CD光谱,并且TRRAP 2033-2088具有指定浓度的指示添加剂。
图6A-图6D呈现了关于乙二醇对MYC和TRRAP影响的数据。(A-C)MYC 1-190、TRRAP2033-2088和BSA的CD光谱。实线表示在1X PBS中进行的测量;虚线表示在30%EG中进行的测量。在EG存在下观察到MYC的α-螺旋特征和(在较小程度上)TRRAP的显著增加。然而,BSA(一种高度α-螺旋折叠良好的蛋白质)似乎不受EG存在的影响。(D)MYC 1-190(黑色)、TRRAP2033-2088(灰色)和MYC 1-190与TRRAP 2033-2088(黑色虚线)在30%EG中混合的SECλ280光谱,均为100μM。MYC和TRRAP在1X PBS中测量的预期流体动力学半径均未显示任何变化。混合样品没有任何可测量的三次峰,指示MYC和TRRAP之间存在关联。
图7A-图7B呈现了关于EG对MYC-TRRAP的影响的数据。(A)30%EG中两种MYC-TRRAP融合蛋白的CD光谱:黑色MYC 1-190-TRRAP 2033-2088和红色MYC 1-190ΔMB2-TRRAP2033-2088。EG对含MB2的融合蛋白的影响更为深远,指示α-螺旋特征的特定增益。(B)两个3C蛋白酶可切割融合蛋白的下拉的考马斯染色SDS-PAGE。MYC 1-190-TRRAP 2033-2088-TS和MYC 1-190ΔMB2-TRRAP2033-2088-TS在1X PBS或30%EG中孵育。在3C切割接头后,用
Figure BDA0003774183670000081
珠将TRRAP结构域拉下,并用1X PBS洗掉EG。与30%EG中的MYC 1-190ΔMB2相比,在30%EG存在但在PBS中不存在时,MYC 1-190显示与TRRAP 2033-2088的结合增强。
图8A-图8D呈现了有关内源性co-IP确认的数据。(A)710 MYC 1-190、MYC 1-190ΔMB2、MYC 120-161和TRRAP 2033-2088的CD光谱证明所有四个本质上都是无序的。在208nm、215nm和222nm波长处缺乏显著的最小值表明这些构建体缺乏有序的二级结构。曲线的整体形状也证实了这一点,在202nm处具有最小值。然而,在MYC 1-190和MYC 120-161在222nm处观察到的轻微最小值表明可能存在一些α-螺旋结构元素。(B)MYC 120-161-TRRAP 2033-2088在0%-90%(v/v)TFE中的CD光谱。增加TFE浓度通过增加颜色的暗度来指示。随着浓度的每次增加,TFE都会引起α-螺旋二级结构的增益。(C,D)MYC 120-161在1X PBS(左)和30%TFE-d2(右)中的1H-NMR光谱。底部面板从上述光谱的6-10ppm放大。PBS中MYC 120-161的光谱指示,基于严重重叠峰的大簇,存在显著非结构化元素。然而,在存在TFE的情况下,峰变得分散良好,并且可以区分各个峰,这指示蛋白质折叠良好。
图9A-图9B呈现了关于MYC 120-161与MYC 120-161-TRRAP 2033-2088中W135环境的数据。(A)MYC 120-161在30%TFE-d2中的1H,15N-HSQC光谱。(B)MYC 120-161-TRRAP2033-2088在30%TFE-d2中的1H,15N-HSQC光谱。W135在MYC-TRRAP融合光谱中的峰位移指示结合事件。峰的分裂表明两种稳定的构象:结合态和非结合态。
图10A-图10B呈现了关于MYC和TRRAP对组合用于发光互补测定的数据。(A)使用具有NanoBiT标签、LgB和SmB的MYC 1-190和TRRAP 2033-2283创建了四个构建体。显示了所有可能导致发光互补的八种组合。这些组合中的每一种都被转染到HeLa细胞中,并且测量发光以确定哪一对具有最佳信噪比。(B)具有TRRAP 2033-2283(顶部)和MYC 1-190和TRRAP2033-2283(底部)的全长MYC对,可提供最佳信噪比发光。
图11提供了有关MYC对细胞中MB2的依赖性的数据。用指示MYC和TRRAP 2033-2283对或过量LgB转染的HeLa细胞的发光测量。每个MYC构建体使用相同量的DNA。该图显示了MYC对MB2对TRRAP结合的依赖性以及MYC和MYCΔMB2的相等表达。
图12呈现了有关MYC 1-190对细胞中MB2的依赖性的数据。用指示MYC 1-190和TRRAP 2033-2283对或过量LgB转染的HeLa细胞的发光测量。每个MYC 1-190构建体使用相同量的DNA。该图显示了MYC 1-190对MB2的TRRAP结合依赖性以及与MYC 1-190相比MYC 1-190ΔMB2的更高表达。
图13呈现了有关归一化MYC 1-190对细胞中MB2的依赖性的数据。用指示MYC 1-190和TRRAP 2033-2283对或过量LgB转染的HeLa细胞的发光测量。转染MYC 1-190的DNA是MYC 1-190ΔMB2构建体的七倍。该图显示了MYC 1-190对MB2的TRRAP结合依赖性以及MYC1-190和MYC 1-190ΔMB2的相等表达。
图14呈现了有关TRRAP对细胞中TRRAP 2033-2088的依赖性的数据。用指示MYC 1-190和TRRAP 2033-2283对或过量SmB转染的HeLa细胞的发光测量。与MYC构建体相比,每个TRRAP构建体转染的DNA多九倍。该图显示了TRRAP 2033-2283对2033-2088的MYC结合依赖性以及TRRAP 2033-2283和TRRAP 2088-2283的相等表达。
图15呈现了有关MYC取代突变对TRRAP结合的影响的数据。用TRRAP 2033-2283和指示MYC 1-190或突变对转染的HeLa细胞的发光测量。转染MYC 1-190和除MYC 1-190ΔMB2之外的所有其他突变体的DNA增加了七倍。该图证实了MYC 1-190对W135的TRRAP结合的依赖性并且显示了其他点突变对相互作用的影响。
图16呈现了在发光互补测定中有关MYC:TRRAP小分子抑制剂的数据。化合物1-25的结构示于表1中。
图17呈现了有关抑制剂对内源性MYC和TRRAP的影响的数据。来自图16关于指示内源性蛋白质的化合物1-17的作用的蛋白质印迹分析。在分析之前,将HeLa细胞在每种指示化合物的存在下以25μM孵育2小时。
图18A-图18H呈现了有关NCI60 GI50与来自图16的示例性化合物的MYC表达的相关性的数据。
图19呈现了有关抑制剂对内源性MYC:TRRAP Co-IP的影响的数据。确定来自图16关于指示内源性复合物的化合物的作用的co-IP实验的蛋白质印迹分析。在分析之前,将HeLa细胞在每种指示化合物的存在下以25μM孵育2小时。
图20提供了有关MYC:TRRAP Co-IP抑制量化的数据。图19中呈现的图像的LI-COR
Figure BDA0003774183670000091
激光密度量化图。
图21呈现了总结来自图16的化合物的热图,图16显示内源性MYC:TRRAP复合物的co-IP抑制。
图22A-图22E呈现的数据证明了MYC:TRRAP抑制剂对浓度的依赖性。(A-E)MYC:TRRAP细胞内发光互补抑制测量,在不同浓度的指示化合物下孵育。
图23包含比较使用内源性全长MYC和TRRAP的免疫沉淀实验中前17个命中的co-IP测定实验的结果。在这些实验中,在25μM的每种前17种化合物的存在下,用抗MYC珠免疫沉淀免疫复合物。在细胞中(将化合物添加到细胞培养基中)或在体外(将化合物直接添加到预洗珠上的纯化复合物中)进行实验。将TRRAP的免疫沉淀相对于MYC的免疫沉淀归一化。如其中所示,化合物10(NSC657456)表现出最大的抑制活性。
图24含有比较结构与化合物10相似的化合物对MYC:TRRAP抑制活性的影响的实验结果,其表明即使先导化合物化学结构的小变化也可以破坏或消除MYC:TRRAP抑制活性。在这些实验中,具有与化合物10(NSC657456)相似结构的化合物通过如下所述的发光测定和co-IP测定进行筛选。将测量与DMSO载体对照进行比较。如其中所示,化合物NSC657456将MYC:TRRAP复合物形成抑制了70%,而结构相似的化合物NSC657457仅将MYC:TRRAP复合物形成抑制了20%。
图25包含显示相似性筛选增加MYC:TRRAP抑制活性的实验结果。对用SmB-MYC 1-190和TRRAP 2033-2283-LgB转染并且与指示浓度的每种指示化合物一起孵育的HeLa细胞进行发光测量。原始化合物10是NSC657456(图23、24)。该化合物集的设计与NSC657456具有>80%相似性。
图26:包含证明NSC657587有效抑制MYC:TRRAP复合物的实验结果,并且其中将测量值相对于MYC和TRRAP的蛋白质水平归一化。如其中所示,NSC657587对MYC:TRRAP的抑制具有最低的IC50,通过细胞内发光互补测定(4.7μM;顶部)在细胞内进行测量,以及通过coIP(3.7μM;底部)在体外进行测量。这代表NSC657456的活性增加了约10倍。
图27含有使用Expi293细胞(从ThermoFisher获得)的转染方案的示意图,其显示这些细胞比HeLa细胞引发约100倍的发光信号,同时保持相同的信噪比。
具体实施方式
I.综述
提供了用于鉴定致癌转录因子MYC与其辅因子TRRAP之间相互作用的抑制剂的方法和组合物。通常,该方法涉及形成具有MYC:TRRAP结合相互作用的MYC:TRRAP复合物,直接和/或间接检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用以确定MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的基线测量,在形成具有MYC:TRRAP结合相互作用的MYC:TRRAP复合物之前或之后引入化学化合物,并且确定与基线测量相比引入化学化合物后的MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的不存在或降低,其中MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的不存在或降低指示化学化合物是MYC和TRRAP之间的结合相互作用的抑制剂。
本公开特别考虑了几种方法,由此可以筛选和测试化学化合物抑制MYC和TRRAP之间的相互作用的能力。该方法涉及用于形成和检测MYC和TRRAP之间的相互作用以及用于鉴定MYC-TRRAP相互作用的抑制剂的基于细胞和体外的方法。
基于细胞的方法可包括蛋白质-片段互补测定,诸如发光互补测定。该细胞可以选自人细胞、哺乳动物细胞、昆虫细胞、酵母细胞和细菌细胞。基于细胞的方法还可包括选自秀丽隐杆线虫(C.eleganx)、黑腹果蝇(D.melanogaster)、斑马鱼、啮齿动物和非人灵长类动物的非人动物体内的细胞。
基于细胞的方法还可以包括基于细胞和体外步骤,诸如从细胞裂解物中共同纯化内源性MYC和TRRAP。基于细胞的方法可以包括外源MYC和TRRAP、MYC和TRRAP片段、或来自细胞裂解物的MYC-TRRAP融合物的细胞共表达和共纯化。基于细胞的方法可以包括来自细胞裂解物的标记的MYC和TRRAP的细胞共表达和共免疫沉淀。
该体外方法可包括在任何体外环境中形成和检测MYC:TRRAP复合物,并且可以包括本领域已知的任何蛋白质-蛋白质相互作用测定。例如,体外方法可包括下拉测定、NMR测定、内在荧光测定、生物分子荧光互补(BiFC)测定、尺寸排阻色谱、生物发光共振能量转移(BRET)测定、荧光共振能量转移(FRET)测定、荧光偏振(FP)和/或荧光各向异性(FA)测定、表面等离子共振(SPR)、天然聚丙烯酰胺凝胶电泳(PAGE)、蛋白质微阵列、微流体测定和电子显微术。
该体外方法可以还包括具有接头的MYC-TRRAP融合体,该接头具有蛋白酶切割位点,诸如3C蛋白酶切割位点。该体外方法还可以包括蛋白质稳定添加剂,诸如乙二醇(EG)、2,2,2-三氟乙醇(TFE)和氘代TFE(TFE-d2)、或这些的任何组合。蛋白质稳定添加剂的特性和浓度可以使用圆二色性来确定。例如,蛋白质稳定添加剂的浓度范围为约5%(v/v)至约50%(v/v)、或约20%(v/v)至约30%(v/v)。
还预期该方法可涉及MYC:TRRAP复合物的计算机计算分析和化学化合物的计算机筛选以破坏MYC:TRRAP复合物的能力。
还提供了用作MYC/TRRAP相互作用的抑制剂的化合物,以及从此类化合物开发癌症治疗剂的方法,包括衍生此类抑制剂和测试抑制剂和衍生抑制剂治疗受试者癌症的能力的方法。本文提供的方法、化合物和组合物可以提供各种优势,诸如靶向癌症中的致癌转录因子MYC的手段。
致癌作用起源于细胞水平。复杂且相互关联的信号传导网络控制着细胞过程,如生长和增殖,并且对外部和内部刺激作出响应。这些信号传导通路被癌细胞劫持并且被解除调控以赋予增殖优势。癌细胞通过由多个遗传和表观遗传异常的逐步积累驱动的多阶段过程进化。尽管致癌过程很复杂,但该过程很脆弱:癌细胞的生长和存活可能会因单个癌基因的失活而受损(1)。改变的转录程序还可以使癌细胞高度依赖某些基因表达调控子(2)。因此,对细胞增殖机制的研究带来了发现新疗法的希望。对肿瘤基因组进行测序的广泛研究揭示了影响正常转录控制的复发性体细胞突变(2)。其中之一,转录的主要调节剂是MYC。它在致癌过程中发挥着核心作用并且是新一代药物的吸引力目标,这些药物会扰乱失调转录程序。许多癌细胞在没有MYC的情况下无法生存这种现象被称为“MYC成瘾”为开发MYC特异性靶向疗法提供了一个如本文所公开的令人信服的案例。
将癌症依赖性用于医疗目的已经导致了基于机制的靶向治疗的发展。靶向治疗不是干扰所有快速分裂的细胞(化疗),而是通过干扰致癌作用所需的途径来特异性地阻止癌细胞的生长。大量研究表明,MYC对肿瘤发生和疾病进展是独特且必不可少的,因此是靶向抑制的良好候选者(1)。TRRAP是MYC MB2辅因子,因此治疗性靶向MB2将涉及其与本文公开的TRRAP的相互作用。
虽然人MYC由439个氨基酸组成,但TRRAP更大(3859个残基)。本文公开的它们各自的结合区域和最小相互作用结构域的鉴定极大地促进了它们相互作用的研究。如本文所公开,MYC 1-190和TRRAP 2033-2283显示出与其全长对应物相似的相互作用特征,通过co-IP或细胞内PPI发光互补测量。这些小的MYC和TRRAP构建体使得能够对MYC和TRRAP之间的相互作用进行结构研究,并开发出一种用于鉴定所述相互作用的抑制剂,诸如小分子抑制剂的方法,如本文所公开的。
应当理解,这里描述的特定实施例是通过说明而不是限制的方式示出的。本公开的主要特征可以在不脱离本公开的范围的情况下用于各种实施方案中。本领域技术人员将会认识到或将能够确定仅使用至多常规实验,就能实现本文所述的具体实施方案的许多等效物。此类等效物被认为在本公开的范围内并且由所附权利要求覆盖。
本说明书中提及的所有出版物和专利申请均指示本发明所属领域的技术人员的技术水平。所有出版物和专利申请均以引用的方式并入本文,其程度如同各个单独的出版物或专利申请具体地和单独地指示为以引用的方式并入。
除非另外定义,否则本文所用的所有技术性和科学性术语具有与本公开所属领域中的技术人员通常所理解的相同的含义。如果本文中的术语有多个定义,则以此节的定义为准。在提及URL或其他此类标识符或地址的情况下,应理解此类标识符能发生变化,并且互联网上的特定信息可以来来去去,但可以通过搜索互联网找到等效信息。对此的引用证明了此类信息的可用性和公开传播。
如本文所用,单数形式“一种(a或an)”和“所述/该(the)”可表示“一”,但也包括复数个指示物,诸如“一个或多个”和“至少一个”,除非上下文另有明确指示。除非另有明确指示,否则本文中使用的所有技术和科学术语具有与本发明所属领域中的普通技术人员通常所理解的相同的含义。
如本文所用,权利要求中的术语“或”用于表示“和/或”,除非明确指示仅提及替代方案或这些替代方案是相互排斥的,尽管本公开支持仅提及替代方案和“和/或”的定义。
在本申请中,术语“约”用于指示值包括装置误差的固有变化、用于确定值的方法、或研究对象之间存在的差异。
如本文所用,诸如但不限于“约”、“基本上(substantial或substantially)”的近似词是指这样一种情况,当如此修改时,被理解为不一定是绝对的或完美的,但将被认为与本领域普通技术人员的距离足够近,以保证将该条件指定为存在。描述可以改变的程度将取决于可以进行多大的改变并且仍然具有本领域普通技术人员将修改的特征识别为仍然具有未修改的特征的所需特征和能力的程度。通常,但根据前面的讨论,本文中由近似词(诸如“约”)修饰的数值可能与所述值相差至少±1、2、3、4、5、6、7、8、9、10、11、12、13、14或15%。
如本文所用,词“包含(comprising)”(以及包含的任何形式,诸如“包含(comprise)”和“包含(comprises)”)、“具有(having)”(以及具有的任何形式,诸如“具有(have)”和“具有(has)”)、“包括(including)”(以及包括的任何形式,诸如“包括(includes)”和“包括(include)”),或“含有(containing)”(以及含有的任何形式,诸如“包含(contains)”和“含有(contain)”)为包括性的或开放式的并且不排除附加的、未提及的要素或方法步骤。
如本文所用,术语“或其组合”是指该术语之前所列项目的所有排列和组合。例如,“A、B、C或其组合”旨在包括以下至少一项:A、B、C、AB、AC、BC或ABC,如果顺序在特定上下文中很重要,则还包括BA、CA、CB、CBA、BCA、ACB、BAC或CAB。继续这个例子,明确包括的是含有一个或多个项目或术语的重复的组合,诸如BB、AAA、AB、BBC、AAABCCCC、CBBAAA、CABABB等。本领域技术人员将理解,通常对任何组合中的项目或术语的数量没有限制,除非从上下文中另外显而易见。
如本文所用,“治疗(treatment)”(及其语法变体,诸如“治疗(treat)”或“治疗(treating)”)是指完全或部分改善或减少疾病或病患或病症,或症状、副作用或结果,或与之相关的表型。理想的治疗效果包括但不限于:防止疾病的发生或复发、缓解症状、消除疾病的任何直接或间接的病理学后果、防止转移、降低疾病进展的速率、改善或减轻疾病状态以及缓解或改善预后。这些术语并不意味着必须完全治愈疾病或完全消除任何症状或对所有症状或结果的一个或多个影响。
在施用的情况下,剂(例如药物制剂、细胞、或组合物)的“有效量”是指在必要的剂量/量和时间段内达到预期结果(诸如单独或与其他活性剂组合的治疗或预防结果)的有效量。
剂例如药物制剂或细胞的“治疗有效量”是指在必要的剂量和时间段内有效达到所需治疗结果的量,诸如用于治疗疾病、病患、或病症,和/或治疗的药代动力学或药效学效果。治疗有效量可以根据诸如受试者的疾病状态、年龄、性别和体重以及所施用的细胞群等因素而变化。在一些实施方案中,所提供的方法涉及以有效量施用细胞和/或组合物,例如,单独的治疗有效量或与其他活性剂或疗法组合,例如,用于癌症治疗的那些。
“预防有效量”是指达到预期预防效果所需的剂量和时间段的有效量。通常但不是必须的,由于在疾病之前或疾病早期在受试者中使用预防剂量,因此预防有效量将小于治疗有效量。在较低肿瘤负荷的情况下,在某些方面预防有效量将高于治疗有效量。
如本文所用,“抑制”功能或活性是当与除了所关注条件或参数之外的其他相同条件相比时,或可替代地与另一条件相比时降低功能或活性。例如,与不存在细胞时肿瘤的生长速率相比,抑制肿瘤生长的细胞降低了肿瘤的生长速率。
如本文所用,“Expi293”或“Expi293F”细胞是指衍生自293细胞系的细胞,其是Expi293 Expression
Figure BDA0003774183670000121
(ThermoFisher Scientific)的核心组分。它们的细胞维持在悬浮培养中并且将在Expi293 Expression
Figure BDA0003774183670000122
中生长至高密度。与标准293细胞系相比,Expi293F细胞具有高度可转染性,并在瞬时蛋白质表达中产生更高的蛋白质产量。这些细胞也可从cGMP库(货号100044202)获得。
如本文所用,“MYC”及其其他形式(包括“Myc”和“myc”)是指MYC转录因子蛋白、转录物(mRNA)和/或人(NCBI GeneID No.4609)或任何其他哺乳动物物种的表达所述蛋白的基因,包括其所有同工型及其等位基因变体。MYC也称为MRTL、MYCC、bHLHe39、和c-MYC。MYC可以具有与SEQ ID NO:1或任何其他哺乳动物MYC cDNA序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、至少99%同一或更多的cDNA核苷酸序列。MYC可以具有与SEQ ID NO:2或任何其他哺乳动物MYC氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、至少99%同一或更多的氨基酸序列。MYC可以单独表达,也可以表达为与TRRAP或TRRAP片段、MAX或MAX片段、亲和标签、可检测标记、和/或不同蛋白质、蛋白质结构域、或用于纯化、鉴定和/或互补的蛋白质片段的融合物。
如本文所用,“TRRAP”及其其他形式(包括“Trrap”和“trap”)是指“转化/转录结构域相关蛋白”蛋白、转录物(mRNA)和/或人(NCBI GeneID No.8295)或任何其他哺乳动物物种的表达所述蛋白的基因,包括所有同工型及其等位基因变体。TRRAP也称为DEDDFA、PAF350/400、PAF400、STAF40、TR-AP、和Tra1。TRRAP可以具有与SEQ ID NO:3或任何其他哺乳动物TRRAP cDNA序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、至少99%同一或更多的cDNA核苷酸序列。TRRAP可以具有与SEQID NO:4或任何其他哺乳动物TRRAP氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、至少99%同一或更多的氨基酸序列。TRRAP可以单独表达,也可以表达为与MYC或MYC片段、亲和标签、可检测标记、和/或不同蛋白质、蛋白质结构域、或用于纯化、鉴定和/或互补的蛋白质片段的融合物。
如本文所用,“MAX”及其其他形式是指“MYC相关因子X”蛋白,转录物(mRNA)和/或人(NCBI GeneID No.4149)或任何其他哺乳动物物种的基因表达所述蛋白,包括所有同工型及其等位基因变体。MAX也称为bHLHd4。MAX可以具有与SEQ ID NO:11或任何其他哺乳动物MAX cDNA序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、至少99%同一或更多的cDNA核苷酸序列。MAX可以具有与SEQ ID NO:12或任何其他哺乳动物MAX氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一、至少99%同一或更多的氨基酸序列。MAX可以单独表达,也可以表达为与MYC或MYC片段、亲和标签、可检测标记、和/或不同蛋白质、蛋白质结构域、或用于纯化、鉴定和/或互补的蛋白质片段的融合物。
如本文所用,“MYC片段”是指来自任何哺乳动物物种的任何可溶性MYC蛋白质片段,其包含定义为MYC MB2结构域的最小MYC区域并且能够与TRRAP或来自相同和/或不同种类的TRRAP片段形成结合相互作用。MYC片段可以单独表达,也可以表达为与TRRAP或TRRAP片段、亲和标签、可检测标记、和/或不同蛋白质、蛋白质结构域、或用于纯化、鉴定和/或互补的蛋白质片段的融合物。
如本文所用,“MYC 129-145”片段、结构域或区域(即,“MYC MB2”片段、结构域或区域或“最小MYC区域”)是指MYC蛋白片段、结构域、或区域具有与SEQ ID NO:6或通过将一个或多个非人哺乳动物物种的MYC氨基酸序列与SEQ ID NO:2比对并且选择与SEQ ID NO:2的氨基酸残基129-145比对的氨基酸残基获得的非人哺乳动物物种的相应MYC129-145氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一或至少99%同一的氨基酸序列。MYC 129-145片段可以单独表达为分离的结构域,也可以表达为更大的MYC片段或结构域内的MYC 129-145区域。MYC 129-145片段可以表达为与TRRAP或TRRAP片段、亲和标签、可检测标记、和/或不同蛋白质、蛋白质结构域、或用于纯化、鉴定和/或互补的蛋白质片段的融合物。缺失了MYC MB2结构域或区域的MYC蛋白或MYC片段(即,MYCΔMB2或MYCΔ129-145)可以单独表达或可以表达为具有TRRAP或TRRAP片段、具有亲和标签、具有可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段的融合物。
如本文所用,“MYC 1-190”片段、结构域或区域是指MYC蛋白片段、结构域、或区域具有与SEQ ID NO:7或通过将一个或多个非人哺乳动物物种的MYC氨基酸序列与SEQ IDNO:2比对并且选择与SEQ ID NO:2的氨基酸残基1-190比对的氨基酸残基获得的非人哺乳动物物种的相应MYC 1-190氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一或至少99%同一的氨基酸序列。MYC 1-190片段可以单独表达为分离的结构域,也可以表达为更大的MYC片段或结构域内的MYC 1-190区域。MYC 1-190片段可以表达为与TRRAP或TRRAP片段、亲和标签、可检测标记、和/或不同蛋白质、蛋白质结构域、或用于纯化、鉴定和/或互补的蛋白质片段的融合物。缺失了MYC 1-190结构域或区域的MYC蛋白或MYC片段(即,MYCΔ1-190)可以单独表达或可以表达为具有TRRAP或TRRAP片段、具有亲和标签、具有可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段的融合物。
如本文所用,“MYC 120-161”片段、结构域或区域是指MYC蛋白片段、结构域、或区域具有与SEQ ID NO:8或通过将一个或多个非人哺乳动物物种的MYC氨基酸序列与SEQ IDNO:2比对并且选择与SEQ ID NO:2的氨基酸残基120-161比对的氨基酸残基获得的非人哺乳动物物种的相应MYC 120-161氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一或至少99%同一的氨基酸序列。MYC 120-161片段可以单独表达为分离的结构域,也可以表达为更大的MYC片段或结构域内的MYC 120-161区域。MYC 120-161片段可以表达为与TRRAP或TRRAP片段、亲和标签、可检测标记、和/或不同蛋白质、蛋白质结构域、或用于纯化、鉴定和/或互补的蛋白质片段的融合物。缺失了MYC 120-161结构域或区域的MYC蛋白或MYC片段(即,MYCΔ120-161)可以单独表达或可以表达为具有TRRAP或TRRAP片段、具有亲和标签、具有可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段的融合物。
如本文所用,“TRRAP片段”是指来自任何哺乳动物物种的任何可溶性TRRAP蛋白质片段,其包含定义为TRRAP 2033-2088区域的最小TRRAP区域并且能够与MYC或来自相同和/或不同种类的MYC片段形成结合相互作用。TRRAP片段可以单独表达或可以表达为具有MYC或MYC片段、具有亲和标签、具有可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段的融合物。
如本文所用,“最小TRRAP区域”或“TRRAP 2033-2088区域”是指与SEQ ID NO:9或通过将一个或多个非人哺乳动物物种的MYC氨基酸序列与SEQ ID NO:4比对并且选择与SEQID NO:4的氨基酸残基2033-2088比对的氨基酸残基获得的非人哺乳动物物种的相应TRRAP2033-2088氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一或至少99%同一的氨基酸序列。该TRRAP 2033-2088区域可以单独表达为分离的TRRAP 2033-2088结构域,也可以表达为更大的TRRAP片段内的TRRAP 2033-2088区域。TRRAP 2033-2088片段可以表达为具有MYC或MYC片段、具有亲和标签、具有可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段的融合物。缺失了TRRAP 2033-2088结构域或区域的TRRAP蛋白或TRRAP片段(即,TRRAPΔ2033-2088)可以单独表达或可以表达为具有MYC或MYC片段、具有亲和标签、具有可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段的融合物。
如本文所用,“TRRAP 2033-2283”片段、结构域或区域是指TRRAP蛋白片段、结构域、或区域具有与SEQ ID NO:10或通过将一个或多个非人哺乳动物物种的TRRAP氨基酸序列与SEQ ID NO:4比对并且选择与SEQ ID NO:4的氨基酸残基2033-2283比对的氨基酸残基获得的非人哺乳动物物种的相应TRRAP 2033-2283氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一或至少99%同一的氨基酸序列。TRRAP 2033-2283片段可以单独表达为分离的结构域,也可以表达为更大的TRRAP片段或结构域内的TRRAP 2033-2283区域。TRRAP 2033-2283片段可以表达为具有MYC或MYC片段、具有亲和标签、具有可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段的融合物。缺失了TRRAP 2033-2283结构域或区域的TRRAP蛋白或TRRAP片段(即,TRRAPΔ2033-2283)可以单独表达或可以表达为具有MYC或MYC片段、具有亲和标签、具有可检测标记和/或可用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段的融合物。
II.鉴定MYC和TRRAP之间的相互作用的抑制剂的方法
A.MYC:TRRAP结合相互作用的鉴定和表征
提供了一种用于鉴定致癌转录因子MYC与其辅因子TRRAP之间相互作用的抑制剂的方法。通常,该方法涉及形成具有MYC:TRRAP结合相互作用的MYC:TRRAP复合物,直接和/或间接检测MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用以确定MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的基线测量,在形成具有MYC:TRRAP结合相互作用的MYC:TRRAP复合物之前或之后引入化学化合物,并且确定与基线测量相比引入化学化合物后的MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的不存在或降低,其中MYC:TRRAP复合物和/或MYC:TRRAP结合相互作用的不存在或降低指示化学化合物是MYC和TRRAP之间的结合相互作用的抑制剂。
B.基于细胞的方法
上述一般方法可包括用于形成和鉴定MYC:TRRAP结合相互作用以及筛选化学化合物以抑制MYC和TRRAP之间的结合相互作用的能力的基于细胞的方法。基于细胞的方法可以包括蛋白质-片段互补测定(PCA)。PCA是一种鉴定和量化蛋白质-蛋白质相互作用的方法。在PCA中,所关注蛋白质(“诱饵”和“猎物”)各自与作为报告基因的第三蛋白质的片段共价连接。诱饵和猎物蛋白之间的相互作用使报告蛋白的片段非常接近,从而使它们形成可以测量其活性的功能性报告蛋白。这一原理可以应用于许多不同的报告蛋白,并且是PCA测定的基础,诸如酵母双杂交系统,一种典型的PCA测定。
蛋白质-片段互补测定也可以是发光互补测定,即由Promega Corporation开发的称为
Figure BDA0003774183670000141
Binary Technology
Figure BDA0003774183670000142
的分裂萤光素酶系统。该测定是使用一种新的19.1kDa、单体、高度可溶且稳定、不依赖ATP的萤光素酶,称为
Figure BDA0003774183670000143
作为报告蛋白建立的(65)。
Figure BDA0003774183670000144
酶分为两部分:大BiT(LgB;18kDa)和小BiT(SmB;11个氨基酸肽)。这些被用作两种所关注蛋白质的标签;蛋白质二聚化后,标签互补并形成高活性萤光素酶酶。
使用形成MYC和TRRAP复合物的最小结构域,每个都移植到LgB和SmB标签,开发了一种细胞内发光互补系统,可用于测量MYC和TRRAP突变体的直接结合相互作用或通过小分子化学化合物的结合抑制。
该细胞可以选自人细胞、哺乳动物细胞、昆虫细胞、酵母细胞和细菌细胞。基于细胞的方法还可包括选自秀丽隐杆线虫(C.elegans)、黑腹果蝇(D.melanogaster)、斑马鱼、啮齿动物和非人灵长类动物的非人动物体内的细胞。
基于细胞的方法还可以包括基于细胞和体外步骤,诸如从细胞裂解物中共同纯化内源性MYC和TRRAP。基于细胞的方法可以包括外源MYC和TRRAP、MYC和TRRAP片段、或来自细胞裂解物的MYC-TRRAP融合物的细胞共表达和共纯化。基于细胞的方法可以包括来自细胞裂解物的标记的MYC和TRRAP的细胞共表达和共免疫沉淀。
C.体外方法
上述一般方法可包括用于形成和鉴定MYC:TRRAP结合相互作用以及筛选化学化合物以抑制MYC和TRRAP之间的结合相互作用的能力的体外方法。该体外方法可包括在任何体外环境中形成和检测MYC:TRRAP复合物,并且可以包括本领域已知的任何蛋白质-蛋白质相互作用测定。例如,体外方法可包括下拉测定、NMR测定、内在荧光测定、生物分子荧光互补(BiFC)测定、尺寸排阻色谱、生物发光共振能量转移(BRET)测定、荧光共振能量转移(FRET)测定、荧光偏振(FP)和/或荧光各向异性(FA)测定、表面等离子共振(SPR)、天然聚丙烯酰胺凝胶电泳(PAGE)、蛋白质微阵列、微流体测定和电子显微术。
该体外方法可以还包括具有接头的MYC-TRRAP融合体,该接头具有独特的蛋白酶切割位点,诸如3C蛋白酶切割位点或TEV蛋白酶切割位点。该体外方法还可以包括蛋白质稳定添加剂,诸如乙二醇(EG)、2,2,2-三氟乙醇(TFE)和氘代TFE(TFE-d2)、或这些的任何组合。蛋白质稳定添加剂的特性和浓度可以使用圆二色性来确定。例如,蛋白质稳定添加剂的浓度范围为约5%(v/v)至约50%(v/v)、或约20%(v/v)至约30%(v/v)。
D.计算机方法
还预期该方法可涉及MYC:TRRAP复合物的计算机计算分析和化学化合物的计算机筛选以破坏MYC:TRRAP复合物的能力。
E..化学化合物及其衍生物
还提供了用作MYC和TRRAP之间的相互作用的抑制剂的化合物,以及从此类化合物开发癌症治疗剂的方法,这些方法包括用于衍生此类抑制剂和用于测试所述抑制剂以及衍生抑制剂治疗受试者的癌症的能力的方法。本文提供的方法、化合物和组合物可以提供各种优势,诸如靶向癌症中的致癌转录因子MYC的手段。
化学化合物可以选自任何小分子有机化学化合物。该化学化合物可以选自化学化合物库,诸如来自NCI/DTP开放化学资源库。实施例如下所述。
批准的肿瘤药物集VIII:一集FDA批准的抗癌药物由133种剂组成。
多样性集VI:多样性集VI由使用程序Chem-X(Oxford Molecular Group)和催化剂(Accelrys,Inc.)衍生自140,000种化合物的1584种化合物组成。这些程序使用定义的药效团中心和定义的距离间隔来创建一集有限的三维、3点药效团,从而产生超过1,000,000个可能的药效团。
机械集IV:该机械集IV由衍生自已在NCI人肿瘤60细胞系筛选中进行了测试的37,836种化合物的811种化合物组成。选择这种机械多样性集来代表广泛的生长抑制模式。
天然产物集IV:该天然产物集IV由按来源、纯度、结构多样性、和化合物的可用性选择的419种化合物组成。
用作MYC和TRRAP之间的相互作用的抑制剂的化学化合物可以包括表1中列出的任何化合物及其衍生物,
表1:抑制MYC/TRRAP相互作用的示例性化学化合物
Figure BDA0003774183670000151
Figure BDA0003774183670000161
Figure BDA0003774183670000171
Figure BDA0003774183670000181
Figure BDA0003774183670000191
Figure BDA0003774183670000201
Figure BDA0003774183670000211
Figure BDA0003774183670000221
表2:抑制MYC/TRRAP相互作用的示例性化学化合物
Figure BDA0003774183670000222
Figure BDA0003774183670000231
Figure BDA0003774183670000241
Figure BDA0003774183670000251
Figure BDA0003774183670000261
Figure BDA0003774183670000271
Figure BDA0003774183670000281
Figure BDA0003774183670000291
该化学化合物也可以是表1或表2中列出的化学化合物的衍生物,诸如其中的化合物1或化合物10。衍生小分子有机化合物的方法在本领域中是众所周知的。例如,化合物10是从靛红衍生的腙,并且这种类型的先导化合物的变体很容易通过简单的缩合化学获得(方案1):
Figure BDA0003774183670000301
靛红衍生物的制备:MedChemComm 2019,10.351-368.
值得注意的是,腙是存在于已批准药物(例如,艾曲波帕和依达拉奉)以及许多研究和实验药物(例如,左西孟旦、他兰帕奈、卡巴唑铬、安巴松)中的官能团。重要的是,靛红衍生的腙也被称为实验药物(DrugBank:美替沙腙),这一事实支持进一步研究化合物10作为开发靶向MYC治疗癌症的先导化合物。
III.实施例
以下实施例仅仅出于说明性目的提供,并且不旨在限制。
实施例1:指示实验的材料和方法
细胞培养
将来自
Figure BDA0003774183670000303
(CRL-3216TM)的HEK293T细胞维持在补充有10%胎牛血清和预防性PlasmocinTM(InvivoGen)的DMEM中,以防止支原体污染。HEK293T细胞系是人胚肾293细胞的高度可转染衍生物并且含有SV40 T抗原。
Figure BDA0003774183670000302
支原体PCR检测试剂盒(MilliporeSigma)用于每六个月检查一次支原体污染。
缺失作图共免疫沉啶
如前所述(23),将指示的TRRAP构建体克隆到含有N-末端FLAG标签的CMV驱动的质粒中。全长野生型(WT)MYC和MYC AMB2(Δ129-145),以及指示的MYC构建体被克隆到相同但反而含有G1u-G1u(PYO)标签的CMV驱动质粒中。按照方案使用LipoD293TM体外DNA转染试剂(SignaGen)将HEK293T细胞与等量的每种质粒共转染。在转染前16-20小时将细胞进行未汇合涂铺。24小时后,在补充有用于免疫沉淀和共免疫沉淀的1mM PMSF、10μM亮抑酶肽、10μM胃酶抑素A和10μg/mL抑肽酶的F缓冲液(10mM TRIS pH 7.5、50mMNaCl、30mM焦磷酸钠、5mMZnCl2、10%甘油、1%Triton-X、50mMNaF)中裂解细胞。使用抗-FLAG(Sigma Aldrich)、抗-PYO(Covance)或抗-MYC(C33 Santa Cruz Biotechnology)琼脂糖预缀合珠进行免疫沉淀。使用以下抗体通过蛋白质印迹分析共免疫沉淀:MYC(sc-764 Santa CruzBiotechnology)、TRRAP(A301-132A Bethel Laboratories)、FLAG(F7425Sigma Aldrich)、和PYO(Covance)。
蛋白质产生和纯化
将指示的MYC或TRRAP构建体或MYC-TRRAP融合物克隆到含有来自IBA LifeSciences的额外C-末端TwinStrep标签II(TS)的经修饰的pGEX 6P-1载体中。用这些载体中的每一种转化BL21(DE3)大肠杆菌并且储存在-80℃的25%甘油溶液中。通过将少量甘油原液添加到含有50ug/mL氨苄青霉素的25mL Terrific Broth(TB;BD Biosciences)中制备起子培养物。接下来,将该培养物在摇床中以37℃/250RPM孵育过夜,然后分成五个2L烧瓶,其含有500mL补充有氨苄青霉素的TB。待培养物的OD达到2.0后,将烧瓶置于冰浴中直至培养物温度达到16℃。最后,加入异丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)至终浓度为1 mM,并且将培养物在摇床中以16℃/250RPM孵育20-24小时。随后将培养物在4℃,6,000RCF下离心20分钟,并且将沉淀储存在-80℃直至纯化。
将冷冻颗粒重新悬浮在250mL用于MYC构建体的溶解度优化缓冲液中进行裂解,该缓冲液含有:100mM TRIS、150mM NaCl、5%乙二醇(EG)、1mM EDTA、1mM TCEP、和0.02%NaN3。此外,添加1mg/mL溶菌酶,并且蛋白酶抑制剂包括:1mM PMSF、10μM亮抑酶肽、10μM胃酶抑素A、和10μg/mL抑肽酶。将裂解物在冰上保持30分钟,用Branson 250超声波仪以70%的振幅超声处理3分钟(10秒开启,10秒关闭循环),并旋转>100,000RCF 60分钟。收集裂解物,并且丢弃沉淀。使用NGC色谱系统(Bio-Rad),使用5mL GSTrap(GE Healthcare)亲和柱从裂解物中纯化指示的GST融合构建体。在用相同的裂解缓冲液(不含溶菌酶和蛋白酶抑制剂但补充有20mM还原型谷胱甘肽)洗脱后,将洗脱液在HRV-3C蛋白酶(ThermoFisher)存在下孵育过夜以去除GST标签。然后,使用相同的色谱系统将该反应的产物加载到5mLStrepTactin
Figure BDA0003774183670000313
柱(IBA Life Sciences)上。用与上述相同的缓冲液洗涤后,用50mM生物素洗脱构建体。然后将该洗脱液与Ac-TEV蛋白酶(ThermoFisher)一起孵育以去除TS标签。该反应的产物通过Ni-NTA重力柱(QIAGEN)以去除Ac-TEV蛋白酶。将流出液浓缩并且加载到先前用1X PBS平衡的SEC Superdex 200 16/600柱(GE Healthcare)上。洗脱后,使用SDS-PAGE确认纯度(图3B)。使用光谱分析定量蛋白质浓度,并且将等分试样在液体N2中快速冷冻并且储存在-80℃。
完全如上纯化15N-标记的蛋白质。然而,在大肠杆菌中的表达不同。将起子添加到250mL的TB中;孵育培养物直至达到OD为4.0。然后,将细菌在500RCF下离心20分钟以去除TB培养基。然后将沉淀重新悬浮在含有0.75g 15NH4C1和未标记葡萄糖的基本培养基(M9培养基)中。然后将培养物与1mM IPTG一起孵育以进行蛋白质诱导并且如上文所述收获。
圆二色光谱
在具有或不具有所示添加剂的1X PBS中测量所示蛋白质构建体(1μM)的二级结构。在Jasco J-185仪器中,使用10mm光谱纯石英比色皿(VWR)在25℃下从200到250nm获得CD光谱。使用公式1计算平均残基椭圆率(MRE):
Figure BDA0003774183670000311
其中[θ]是MRE,θ是测量的椭圆率,单位为毫度,M是平均分子量,单位为g/mol,L是样品池的路径长度,单位为厘米,并且C是蛋白质的浓度,单位为g/L。
体外下拉
将指定的纯化的MYC和C-末端TS标记的TRRAP蛋白构建体以各50μM混合并且在1XPBS中存在
Figure BDA0003774183670000312
珠的情况下在室温下孵育2小时。下拉后,结合蛋白用50mM生物素洗脱并且用考马斯染色的SDS-PAGE分析。对于MYC-TRRAP融合蛋白,在用HRV-3C切割接头之前,将指定的构建体在1X PBS中在具有和不具有30%乙二醇(EG)的情况下孵育30分钟。之后,同样的下拉和分析随之而来。
乙二醇中的尺寸排阻色谱
与NGC色谱系统(Bio-Rad)连接的Superdex 200 16/600柱(GE Healthcare)的使用如上。该柱首先在补充有30%EG的1X PBS中平衡。将指示的蛋白质构建体加载到柱子上并且实时收集λ280光谱。由于系统压力高,该方法的流速必须降低至0.5mL/min。
NMR光谱
1H测量和1H,15N-HSQC测量均在25℃下使用配备标准探头的500MHz Bruker NMR光谱仪使用3mm样品管记录。在1X PBS中或有30%TFE-d2的情况下记录未标记的MYC 120-161 1H光谱。在具有30%TFE-d2的1X PBS中记录MYC 120-161和MYC 120-161-TRRAP 2033-2088的1H,15N-HSQC光谱。使用TopSpin 4.0(Bruker)处理数据并且使用NMRFAM-SPARKY软件进行可视化(42)。
细胞内PPI发光互补
涂铺在Greiner 96孔TC级、底部透明的白色板上的HeLa细胞用于以下测量。在涂铺细胞之前,使用LipoD293TM进行反向转染。bluescript KS+质粒(Addgene)用作转染的载体DNA,并且pcDNA3.1 EGFP质粒(ThermoFisher)用作荧光报告子。白色反光膜(USAScientific)用于覆盖板的底部以进行发光测量。黑色吸光膜用于覆盖板的顶部以进行荧光测量。所有测量均在SpectraMax i3仪器(Molecular Devices)上进行。
首先,确定了LgB和SmB互补不会自发发生的可用表达范围。在CMV驱动的LgB质粒和SmB过量的DNA量(每孔1-100ng)的增加下进行转染,反之亦然。注意到可用范围的背景发光和大量过量的LgB或SmB所需的DNA量。接下来,使用大量过量LgB或SmB的互补来确定指示的MYC和TRRAP构建体中的每一个的表达,每个孔的DNA量范围为:10-100ng。计算了平衡每个MYC和TRRAP对表达的DNA的最佳比率。然后,计算指示的MYC和TRRAP对的信噪比,并且选择具有最高比率的对。最后,选择的对用于确定最佳DNA转染混合物。对于96孔板中的每个孔,确定为6.7ng的具有MYC构建体的质粒、60ng的具有TRRAP构建体的质粒和33.3ng的pcDNA 3.1EGFP质粒。除非另有指示,否则这些是用于此类测定的转染DNA的比率。
使用上述最佳比率,使用细胞内发光互补测量由点突变对MYC 1-190引起的TRRAP结合变化。将指示突变克隆到SmB-MYC 1-190中并且用TRRAP 2033-2283-LgB和EGFP转染到HeLa细胞中。如上文所述在转染后48小时测量发光。
筛选NCI小分子化学文库集
如上所述,使用LipoD293TM在CMV驱动的质粒中以上述相同的优化比率的SmB-MYC1-190、TRRAP 2033-2283-LgB、和EGFP的混合物转染HeLa细胞。转染两天后。将每个孔中的培养基更换为含有25μM的来自NCI集的每种化合物的新鲜培养基。将细胞与每种化合物一起孵育2小时,并且记录每个孔的发光和荧光测量值。将发光的变化归一化至荧光。以下预涂铺的化合物集从NCI/DTP化学资源库获得并且用于此筛选:
批准的肿瘤药物集VIII:
批准的肿瘤药物集VIII中的化合物在Greiner 650201 96-孔PP U型-底板中递送。每个孔含有20μL在DMSO中的10mM的化合物。该集中的所有专有剂均通过商业渠道获得。发现所有化合物都具有令人满意的纯度和特性。
多样性集VI:
NCI的多样性集VI中的化合物在Greiner 650201 96-孔PP U型-底板中递送。每个孔含有20μL在DMSO中的10mM的化合物。经由LC/质谱法检查所有化合物的纯度,并且发现其纯度为90%或更高。
机械集IV:
机械集IV中的化合物在Greiner 650201 96-孔PP U型-底板中递送。每个孔含有20μL在DMSO中的1mM的化合物。
天然产物集IV:
天然产物集IV中的化合物排列在两个384孔聚丙烯(PP)微量滴定板上。每孔含0.20μmol化合物加1μL甘油;通过向每个孔中加入19μL DMSO,获得20μL的每种化合物的10mM溶液。
统计学
所有实验至少重复3次。进行未配对学生t检验以确定标准偏差和统计学显著性。P值≤0.05被认为具有统计学显著性。误差条代表SEM。
实施例2:对MYC:TRRAP相互作用进行作图
MYC:TRRAP相互作用的作图始于TRRAP残基1899-2401内的一系列外部和内部缺失(39)。这些缺失是使用脯氨酸残基作为边界构建的,所述边界主要对应于HEAT重复边界(41)。通过一系列共免疫沉淀实验,确定了TRRAP中最关键的MYC相互作用区域位于残基1997-2088内,没有它,TRRAP:MYC相互作用就不会在瞬时测定中发生(图1A)。尽管MYC蛋白的瞬时表达和这些TRRAP构建体差异很大,但仍然清楚的是,缺乏TRRAP残基1997-2088的构建体是最有缺陷的MYC粘合剂。这些TRRAP结构与Knutson和Hahn以及Diaz-Santin等人描述的结果一致(40,41)。最关键区域的结构预测表明它本质上是无序的,与其侧翼区域不同。
为了验证上面的作图数据,用全长蛋白质研究了类似的结构域依赖性。创建了全长TRRAP(1-3830)的表达构建体,以及仅缺乏预测的固有无序结构域(氨基酸2033-2088)的相似构建体。因此,后者在TRRAP内的天然3830个氨基酸中仅缺乏55个氨基酸。图1B显示了这种小的缺失突变体对于与全长MYC的相互作用是有缺陷的。在这个实验中,瞬时表达对于使用的每个构建体都是一致的。因此,TRRAP中固有的无序区域(2033-2088)对于MYC相互作用是必需的。对人细胞中MYC:TRRAP相互作用所必需的清晰区域的鉴定与先前发表的作图研究得出的结论不一致(39)。此处提供的数据表明,当在细菌中产生时,TRRAP的该区域内存在溶解度和/或构象差异,这可能是这两个作图研究之间不一致的原因。
对MYC(1-439)进行了类似的作图研究,以确定其与TRRAP相互作用的结构域。稳定的结合似乎需要MYC的氨基酸1-190,其包含大部分TAD。重要的是,该结构域内MB2(17个氨基酸)的内部缺失很大程度上消除了TRRAP结合,这与早期研究一致(图1C)(23)。稳定相互作用所需的TRRAP和MYC两者中相对较大的结构域可能表明延伸的蛋白质-蛋白质界面,尽管也可能需要较大的结构域来确保小的蛋白质-蛋白质界面的正确折叠。事实上每个结构域内的小缺失可以消除结合(即,TRRAP 2033-2088和MYC MB2),指示了这些小区域可能是最关键的结合位点并且因此是最关键的小分子靶向的结合位点。
为了验证MYC的最小相互作用结构域(即MYC 1-190),进行了co-IP实验,测试了该结构域与内源性TRRAP的结合。MYC 1-190与内源性TRRAP进行co-IP,并且这种相互作用需要MB2(图2A)。最后,执行另一个co-IP实验以测试MB2 W135氨基酸的重要性(图2B),这对于MYC驱动的细胞转化至关重要(21、23)。结果指示,MYC的W135对于复合物的co-IP是必不可少的。
实施例3:MYC和TRRAP的二级结构
为了进一步了解MYC:TRRAP的二级结构,我们在大肠杆菌中大量产生纯蛋白质构建体(图3A)。这涉及使用GST N末端标签和C末端TS标签的顺序亲和纯化。去除标签后,使用尺寸排阻色谱(SEC)评估蛋白质构建体的单体状态和缓冲液交换。这导致非常纯且高度浓缩的蛋白质构建体满足结构测定实验的要求(图3B)。
通过CD光谱评价MYC TAD和TRRAP 2033-2088的二级结构(图4A)。尽管怀疑TRRAP2033-2088本质上是无序的,但对其实际结构构象一无所知(41)。CD测量揭示了,TRRAP的这个结构域实际上是一个IDR,缺乏任何可测量的α-螺旋或β-折叠二级结构。MYC TAD也被描述为IDR,但曾经研究过的最大结构域是MYC 1-143(43)。MYC 1-190的CD光谱证实MYC TAD在很大程度上是无序的,但具有一些螺旋特征,与先前的发现一致(43,44)。然而,MB2的缺失去除了222nm处的最小值,同时保留了208nm处的最小值(图4B)。这表明MB2含有一些归因于MYC TAD的α-螺旋元素。假设MYC和TRRAP在结合后获得稳定的构象,CD用于测试在混合MYC 1-190和TRRAP 2033-2088后新获得的二级结构是否有任何增益。图4B显示了当这两种构建体以1∶1的摩尔比在体外混合时二级结构没有增益。浓度在1-10μM之间时测量没有变化。最后,用纯化的蛋白质执行co-IP实验以确定MYC 1-190和MYC 1-190ΔMB2在与TRRAP2033-282 2088的结合方面是否表现出任何差异。蛋白质以1∶1的摩尔比(每种50μM)混合。通过考马斯染色的SDS-PAGE测定结合(图4C)。TRRAP 2033-2088与任一MYC构建体的结合没有差异。这表明MYC 1-190在体外不会形成复合物。
实施例4:在MYC:TRRAP上有序结构的诱导
我们探索了替代条件以帮助在体外形成蛋白质复合物。虽然MYC和TRRAP的相互作用区域都是IDR,但在二聚化后可能会出现有序的构象。文献中已经描述了稳定相互作用的不同方法。两个先例是MYC:MAX晶体结构和最新p53 TAD的NMR结构,它们都从初级融合构建体中产生了蛋白质-蛋白质复合物(11,45)。此外,我们测试了可以在MYC、TRRAP和/或MYC:TRRAP复合物中诱导二级结构的添加剂或分子伴侣。为了测试不同的分子伴侣,每个构建体的二级结构在添加剂存在下通过CD光谱进行表征。这些构建体包括:MYC 1-190、TRRAP2033-2088和在体外与TRRAP 2033-2088混合的MYC 1-190(图5A-图5K)。测试的添加剂主要包括渗透剂,以及一些金属离子和有机溶剂。表2总结了这些测量的结果。
表3.添加剂对MYC:TRRAP的影响
Figure BDA0003774183670000331
Figure BDA0003774183670000341
在测试的添加剂中,乙二醇(EG)和2,2,2-三氟乙醇(TFE)分别产生了最特殊的效果和最大的二级结构增益。EG在MYC和TRRAP两者中诱导二级结构变化,但在BSA中不(图6A-图6C)。为了测试EG是否可以诱导MYC:TRRAP复合物,含有在30%EG中的MYC 1-190、TRRAP2033-2088、和与TRRAP 2033-2088混合的MYC 1-190(各100μM)的样品在用30%EG平衡的SEC柱上运行(图6D)。使用混合样品仅观察到两个峰,证实EG不会诱导MYC:TRRAP复合物。
MYC-MAx和p53-CBP结构表明可以使用共价接头建立两个IDR的复合物。因此,TRRAP和MYC的最小相互作用区域的表达是作为由计算设计的柔性接头(GSGSAGSAAGSGEFG)分开的融合蛋白产生的(在46中进行了综述)。使用CD光谱法将EG对MYC-TRRAP融合蛋白的影响与MYCΔMB2-TRRAP进行比较(图7A)。EG对含有MB2的融合蛋白的二级结构有更深远的影响。这指示可能需要融合蛋白在体外形成稳定的MB2依赖性MYC:TRRAP复合物。为了测试是否正在形成复合物,产生了在MYC和TRRAP结构域之间具有可切割的3C蛋白酶位点的两种融合蛋白,即MYC1-190-TRRAP2033-2088-TS和MYC 1-190ΔMB2-TRRAP2033-337 2088-TS。在添加EG之后,接头被切割,并且任何潜在的复合物通过下拉实验、随后通过考马斯染色的SDS-PAGE来评估(图7B)。这些结果表明,MYC:TRRAP复合物仅在EG存在的情况下形成,并且在接头切割和EG去除后该复合物保持结合。此外,该复合物需要MB2,与体内形成的复合物一致。这些结果指向了一种类似天然的复合物,它是在柔性接头和稳定添加剂的帮助下在体外形成的。
实施例5:MYC对比MYC-TRRAP的1H,15N-HSQC光谱
由于MYC的W135对于细胞转化和MYC:TRRAP相互作用至关重要,因此分配W135的MYC的1H,15N-HSQC对于筛选癌症中MYC活性的抑制剂非常有用。色氨酸侧链中的吲哚N-H对使其在HSQC光谱中的化学位移峰具有独特且特殊的外观。因此,MYC的HSQC光谱可以分配有W135侧链N-H对,而不必分配所有其他峰。
由于TFE在通过CD测量的MYC中的二级结构中诱导最高增益(表2),因此进行了NMR实验以表征在TFE-d2存在下MYC 120-161和MYC 120-161-TRRAP 2033-2088的结构元素。选择这些构建体是因为MYC的w135是该区段内唯一的色氨酸残基,并且MYCTAD的该区域具有最稳定的二级结构元素,即使在PBS中也是如此(图8A)。因此,MYC 120-161-TRRAP 2033-2088的CD测量是在TFE浓度从10%-90%(v/v)增加的情况下进行的(图8B)。这些测量表明,在存在0-20%TFE的情况下,所得复合物过于非结构化,而无法进行进一步测量。然而,该复合物在20-30%TFE存在下表现出高度α-螺旋特征。在TFE浓度增加到30%以上后,二级结构的增益最小。
在进行HSQC测量之前,收集简单的一维1H-NMR光谱以确认MYC 120-161在30%(v/v)TFE-d2存在下具有可测量的W135信号。如图8C-图8D所示,与色氨酸残基侧链一致的化学位移峰(约9.8ppm)仅在TFE存在下出现。此外,与PBS(图8C)相比,TFE(图8D)中6-10ppm之间的峰分散证明MYC 120-161从展开状态转变为折叠状态。
接下来,比较15N MYC 120-161和MYC 120-161-TRRAP 2033-2088的HSQC测量以执行W135的分配并且确定是否可以发生结合事件(图9A-图9B)。在含有54个残基的MYC单独构建体中,使用NMRFAM-SPARKY的自动峰值拾取(APES)实用程序解析了65个峰值(47)。它含有1个P、1个R、2个N、3个Q、1个W,并且没有H残基。5N和Q侧链N-H对与108-112ppm 15N和6-7.5ppm 1H区域中的预测峰完全匹配。这些峰是具有相同氮化学位移的双峰质子峰。W135N-H侧链对具有约127ppm的氮化学位移和约9.8ppm的氢化学位移,为N-H吲哚对所特有(图9A)。
在127个残基的MYC-TRRAP构建体中,122个峰如上解析(图9B)。然而,该构建体含有3个P、6个R、4个N、5个Q、1个W,并且没有H残基。更重要的是,W135 N-H侧链对具有分裂峰共振,表明它存在于两种不同的环境中,并因此该构建体可能有两种不同的构象。考虑到这两个光谱,分裂峰的两个化学位移之一可以代表两个构象中的每一个。由于TRRAP结合需要W135(图2B),这两种构象为TFE中存在结合和未结合的MYC:TRRAP状态提供了证据。这两个峰的强度比是结合和未结合复合物比率的指标。这些测量验证了之前的数据,并且确认MYC:TRRAP的稳定3D结构可以在TFE存在的情况下存在。W135的化学位移峰在MYC 120-161和MYC 120-161-TRRAP 2033-2088的背景下的分配指示它可用于检测MYC:TRRAP结合相互作用和用于确定配体筛选测定中这种相互作用的降低或不存在以鉴定MYC和TRRAP之间的结合相互作用的抑制剂。
实施例6:细胞内发光互补测定
缺失作图能够识别MYC和TRRAP的最小相互作用结构域。通过减小结合复合物的大小,现在可以准确地测定小分子相互作用。为此,使用了细胞内发光互补测定,即由PromegaCorporation开发的称为
Figure BDA0003774183670000356
Binary Technology
Figure BDA0003774183670000351
的分裂萤光素酶系统。该测定是使用一种新的19.1kDa、单体、高度可溶且稳定、非ATP依赖性的萤光素酶酶,称为
Figure BDA0003774183670000352
建立的(65)。
Figure BDA0003774183670000353
酶分为两部分:大BiT(LgB;18kDa)和小BiT(SmB;11个氨基酸肽)。这些被用作两种所关注蛋白质的标签;蛋白质二聚化后,标签互补并形成高活性萤光素酶酶。
使用形成MYC和TRRAP复合物的最小结构域(每个都移植到LgB和SmB标签),开发了一种细胞内发光互补系统,其可用于测量MYC和TRRAP突变体的直接结合相互作用或小分子对结合的抑制。在进行发光测量之前,优化了标签结合结构域复合物的方向和蛋白质表达水平。这些测量揭示了癌症中相互作用和MYC生物学的新方面。后来,该测定适用于筛选MYC:TRRAP相互作用的小分子抑制剂。从NCI/DTP开放化学资源库(NCI/DTP Open ChemicalRepository,http://dtp.cancer.gov)收到了几个化合物库。将在实施例7中进一步讨论该筛选的结果和细节。
建立细胞内发光互补测定
生物发光方法具有高灵敏度和宽动态范围,已被证明可用于许多应用,包括结合测定和药物发现。天然酶和底物已逐渐适应现有方法,从而获得巨大优势。利用深海虾萤光素酶,深海细脚刺虾(Oplophoms gracilirostris)的定向进化,Promega公司设计了一种新型生物发光系统(65)。得到的
Figure BDA0003774183670000357
酶是一种19.1kDa的蛋白质,当添加新的底物呋喃嗪时会产生发光型发光(半衰期>2小时)。进一步的研究导致了
Figure BDA0003774183670000354
的产生,这是该系统的分裂版本,旨在测量活细胞中的PPI。与co-IP和其他结合测定不同,
Figure BDA0003774183670000355
系统无需细胞裂解即可进行量化测量。具体来说,活细胞被瞬时转染以表达两种载体:一种含有具有发光标签的MYC;另一种含有具有发光标签的TRRAP。仅在存在MYC:TRRAP相互作用的情况下,在
Figure BDA0003774183670000358
酶互补后观察到发光。LgB和SmB标签之间的亲和力较低;只有将它们拉近,才能产生互补。为了防止NanoBiT标签的非特异性缔合并且确保只有MYC和TRRAP的特异性和直接相互作用会导致发光,在这种类型的测定中只应使用低水平的表达。因此,必须选择合适的表达载体和哺乳动物启动子。根据制造商的建议,将全长MYC和MYC 1-190,以及TRRAP2033-2283和TRRAP 2033-2088分别克隆到四个含有单纯疱疹病毒-1胸苷激酶(HSV-TK)启动子的哺乳动物表达载体中。全长TRRAP被克隆到两个仅含有LgB或SmB的N末端标签的载体中。HSV-TK是低表达的组成型启动子,与CMV驱动的载体相比,其表达水平低至约100倍。四个载体中的每一个都有N末端LgB或SmB标签,或C末端LgB或SmB标签。有必要优化标签的取向以优化测定的信噪比。图10A总结了具有LgB和SmB标签的MYC和TRRAP对的所有八种可能组合。
在具有HSV-TK启动子的载体中的这些构建体对在转染后48小时都没有产生可检测的发光。我们推断必需更高表达的启动子。因此,包括标签在内的所有构建体都被移入CMV驱动的哺乳动物表达载体中。使用该表达系统可检测到发光。然而,必须控制转染效率和细胞数的差异。为此,将含有EGFP的pcDNA3.1质粒与所有LgB和SmB对进行共转染。在每次发光测量后立即进行荧光测量并且用于归一化。
在起始发光测量期间,很明显大多数构建体具有不同水平的蛋白质表达,并且鉴于它们的低表达水平,这种差异尤其明显。因此,有必要测量每个MYC和TRRAP构建体的差异蛋白质表达水平。不幸的是,表达水平对于蛋白质印迹或细胞内蛋白质测定来说太低了。在任何这些方法中获得可靠信号所需的表达量超过了发光测定的饱和点。在发光测定范围之外进行测量证明,在任何过表达系统中观察到的构建体之间的表达水平差异与低表达测定中的那些值无关。因此,需要一种测量低蛋白质表达水平的方法。
理想情况下,相同的发光系统可以测量蛋白质水平以及MYC和TRRAP构建体的结合。我们确定过量的LgB或SmB可以与低表达的MYC或TRRAP LgB/SmB融合蛋白互补,以提供指示构建体相对表达水平的可量化发光信号。由于SmB太小而无法单独表达,因此从Promega获得了Halo标签-SmB的融合物。在存在任何互补融合构建体的情况下过表达LgB或Halo-SmB允许量化融合构建体表达。这允许调整DNA转染方案以平衡细胞表达水平。
现在细胞以等量表达每个构建体,在每个MYC和TRRAP对中测定信噪比。作为结果选择的对显示在图10B中。幸运的是,相同的载体对对于具有TRRAP 2033-2283的MYC 1-190和具有TRRAP 2033-2283的全长MYC来说是最佳的,从而可以进行直接比较。标记的N末端区域在全长MYC和MYC 1-190中是相同的。TRRAP的C末端区域也是如此,简化了两对的比较。
当与全长MYC或MYC 1-190共转染时,另外两个TRRAP构建体、全长TRAAP和氨基酸2033-2088不产生可测量的发光。TRRAP 2033-2088在瞬时转染和co-IP任一种时也没有显示任何结合;也许这个TRRAP区域对于MYC结合是必需的,但还不够。另一方面,全长TRRAP已被证明用全长MYC和MYC 1-190进行co-IP。然而,LgB/SmB标签需要使用优化的15个残基接头。TRRAP的N-末端可能离MYC相互作用结构域足够远,以致于萤光素酶酶的互补需要长得多的接头区域。
在使用与全长MYC或MYC 1-190共转染的TRRAP 2033-2283获得可重复的发光互补测量后,重复该方案,并从各自的MYC构建体中去除MB2。图11、图12和图13显示了这些实验的结果。对于MYC和MYC 1-190两者,与TRRAP的结合是MB2依赖性的。MYC 1-190显示了对MB2的更多依赖性,可能是因为它缺乏参与二次接触的残基。然而,直接比较MYC和MYC 1-190显示相同水平的发光,这与实施例2中呈现的co-IP实验的结果一致。
MYC、MYCΔMB2和MYC 1-190之间的表达没有可测量的差异。然而,MYC 1-190ΔMB2表达高于其余构建体(图12)。调整其转染方案,直到MYC 1-190ΔMB2表达与MYC 1-190相同量的蛋白质(图13)。鉴于其对MB2的依赖性更大,选择MYC 1-190和TRRAP 2033-2283对进行进一步实验,即研究点突变和小分子抑制剂。
首先,考虑到TRRAP 2033-2088构建体未能产生发光互补,必须确认MYC:TRRAP对TRRAP 2033-2088的依赖性。将TRRAP 2033-2283的体内结合测量与缺乏MYC结合区的相似构建体TRRAP 2088-2283进行比较(图14)。与MB2一样,TRRAP 2033-2088的不存在会减少结合,这与co-IP实验一致。值得注意的是,两种TRRAP构建体的表达都显著低于MYC构建体的表达转染了900%以上的DNA以产生相似的表达水平。
这些实验证实萤光素酶测定可用于评估MYC:TRRAP结合的差异变化。因此,它们还可用于测试小分子化学文库并鉴定MYC:TRRAP相互作用的抑制剂。
测量MYC:TRRAP相互作用的关键因素
当TRRAP 2033-2283与MYC 1-190对比MYC 1-190ΔMB2共转染时,观察到发光互补的10倍差异。鉴于这种差异的大小,可以以高灵敏度检测由点突变引起的非常小的亲和力变化。虽然co-IP实验对这种应用无效,但生物发光的宽动态范围使其成为合适的测定。
在MYC 1-190中产生了一系列点突变,并且经由发光互补测量了TRRAP 2033-2283结合的任何变化。关键残基被丙氨酸残基(D132、C133、M134、W135、S136和F138)或谷氨酸(W135)取代。此外,筛选了癌症中最常见的两种MYC突变(T58I/A/P/N和S146L)(66、67)。通过EGFP测量的荧光用于通过校正蛋白质表达水平来归一化发光测量(图15)。用先前描述的基于发光的测定确定每个构建体的表达水平。
主要保守MB2残基(D132A、C133A、M134A、W135A、S136A、F138A和W135E)的取代证实了它们在MYC:TRRAP相互作用中的相对重要性。发光互补的减少指示可能直接参与MYC和TRRAP之间接触的残基。在W135A和W135E的情况下,W135再次被证明是必不可少的。M134A也导致发光互补显著降低,但不如W135A/E那么多。C133A似乎不影响结合。一项新发现,F138A显示出与W135A相同的发光减少。这表明F138可能有意义地参与了MYC:TRRAP相互作用。非常出乎意料的是,D132A和S136A产生了显著的发光增加,表明MYC:TRRAP的亲和力增加。
使用相同的细胞内发光互补测定测试了癌症中最常见和复发的两种MYC突变,即T58I/A/P/N和S146L。图15显示了T58I在TRRAP结合中没有产生变化,尽管表达显著增加。S146L产生发光互补的显著增加,表明TRRAP结合增加。这些数据可能指示先前未描述的功能获得突变与MYC:TRRAP结合之间的联系,这是第一个报告的此类联系。
实施例7:在细胞内发光互补测定中筛选小分子NCI化学文库
开发细胞内MYC和TRRAP PPI发光测定的目标是创建用于药物发现的主要筛选。为此,向NCI/DTP开放化学资源库(NCI/DTP Open Chemical Repository)请求了四个小分子化学文库。下面列出了这些:
经批准的肿瘤药物集VIII:
FDA批准的抗癌药物集由133种剂组成
多样性集VI:
多样性集VI由使用程序Chem-X(Oxford Molecular Group)和催化剂(Accelrys,Inc.)衍生自140,000种化合物的1584种化合物组成。这些程序使用定义的药效团中心和定义的距离间隔来创建有限集的三维、3点药效团,从而产生超过1,000,000个可能的药效团。
机械集IV:
机械集IV由已在NCI人肿瘤60细胞系筛选中进行了测试的衍生自37,836种化合物的811种化合物组成。选择这种机械多样性集来代表广泛的生长抑制模式。
天然产物集IV:
天然产物集IV由按化合物的来源、纯度、结构多样性、和可用性选择的419种化合物组成。
这些化学集用于发现MYC:TRRAP复合物的新型小分子抑制剂。将SmB-MYC 1-190、TRRAP 2033-2283-LgB、和EGFP转染到HeLa细胞中。转染后两天,将化合物以25μM添加到培养基中,并且将细胞孵育2小时。记录含有一种化合物的每个孔的发光和荧光。将发光测量的变化归一化至荧光测量。
之后,仅考虑将发光水平降低至<50%RLU的分子。这种46种化合物的集在10μM下与表达载体的细胞一起孵育。测量发光互补并且在一式三份测量中重复。此外,将表达单独的LgB和SmB的HeLa细胞与相同的化合物一起孵育,以排除由于抑制萤光素酶或其互补导致的潜在人为结果。未进一步考虑在该对照测定期间诱导任何显著发光降低(<0.6)的分子。在2947个分子中,选择了17个进行进一步测试,并从NCI/DTP开放化学资源库订购。图16描述了这些选择的化合物。
HeLa细胞接受与这17种化合物中的每一种一起孵育2小时的效果。图17呈现了这些化合物对内源性MYC、TRRAP、MAX和GAPDH蛋白质的影响的蛋白质印迹。MAX蛋白质水平不受影响。除了7和11之外的所有化合物对MYC或TRRAP的水平没有影响,这表明它们的影响可能是由于MYC:TRRAP复合物的抑制。然而,通过化合物7或11的存在观察到的MYC或MYC:TRRAP特异性效应可以为调控MYC和TRRAP蛋白质水平所涉及的机制提供有趣的见解。
NCI报告并免费分享与NCI60细胞系组一起孵育的这些化合物中的每一种的GI50值。他们还报告了同一细胞系组的MYC蛋白质表达数据。MYC表达和GI50值之间可能存在相关性,可以帮助预测细胞系对每种化合物的灵敏性。需要高水平MYC的细胞系可能对MYC:TRRAP抑制剂更灵敏。图18A-图18H呈现了来自图16的一些化合物,它们显示GI50和MYC蛋白值表达之间的显著相关性,而其他则没有。
化合物1、3和4在结构上是相关的,但显示出非常不同的GI50范围和与MYC表达的相关性水平(分别为图18A、图18C、和图18D)。化合物2、15和17在它们的GI50和MYC表达之间显示出显著的相关性(分别为图18B、图18G和图18H)。然而,这些化合物在结构上并不相似,这表明每种化合物都可能以不同的方式影响MYC:TRRAP相互作用。这些化合物中可能存在一些常见的几何基序,并因此有必要对其作用机制进行更全面的评价。
实施例8:在MYC和TRRAP之间的结合相互作用的抑制剂存在下内源性MYC:TRRAP复 合物的Co-IP测定
进行内源性MYC:TRRAP复合物的Co-IP实验以验证MYC:TRRAP细胞内发光互补筛选的结果。在分析之前,将HeLa细胞再次接受与图16中的17种化合物中的每一种一种孵育2小时的作用。图19、图20和图21呈现了这些化合物对内源性MYC:TRRAP和MYC:MAX复合物的影响。和以前一样,除了7和11之外的所有化合物都对MYC或TRRAP的水平没有影响。与化合物1、2、4-6和8一起孵育显示MYC:TRRAP co-IP而非MYC:MAX的特定降低,而与化合物3、9、10和12-17一起孵育未显示MYC:TRRAP co-IP中的任何降低。与一些通过细胞内发光互补筛选评分为阳性的化合物一起孵育对内源性MYC:TRRAP复合物具有预期的影响。这验证了初步的化合物筛选,并且呈现了努力在癌症中治疗性靶向MYC的重要里程碑的完成。
实施例9:MYC和TRRAP之间的结合相互作用抑制剂的抑制浓度曲线和IC50的测定
在化合物1、2、4、7和8的不同浓度下进行MYC:TRRAP细胞内发光互补抑制测量以建立每种化合物的抑制浓度曲线和IC50(图22)。与所有化合物一起孵育显示出与原始大规模筛选相似的抑制作用,验证了这些结果。有趣的是,化合物2对NCI60细胞系组具有类似的平均GI50,并对MYC:TRRAP细胞内发光互补抑制具有类似的平均IC50。这表明内源性MYC:TRRAP复合物的抑制可能是该化合物对那些细胞系的生长抑制作用的作用机制。尽管需要更多的实验来进一步描述所有这些化合物的作用机制,但这些结果提供了令人信服的证据,表明可以使用所公开的测定获得用于治疗癌症的新型MYC抑制剂。
实施例10:其他抑制性化合物和先导化合物“衍生物”的进一步筛选
使用上述发光测定作为MYC:TRRAP相互作用的读数,我们使用机器人液体处理器评价了2987种其他化合物(25μM)。针对萤光素酶酶本身的任何活性以及对融合蛋白表达的任何影响,对所有初级命中进行了反筛选。我们设定了50%抑制的阈值以进一步考虑化合物。2987人中只有17人通过了所有这些标准(0.6%)。在这些中,四种化合物在体外使TRRAP与MYC解离并且抑制细胞中的MYC:TRRAP co-IP(图23,下图)。在用于本实验的短暂(2小时)处理中测试的浓度下,测试的化合物中没有一种具有明显毒性,这从稳定的MYC表达中可以看出。
当这些化合物被进一步表征时,化合物10(NSC657456)(图24,左下)在多个测定中给出了最一致的MYC:TRRAP结合抑制(约50%)。基于此,我们得出结论,该化合物是用于进一步化学修饰的良好候选者。相反,当我们表征其他化合物如NSC657457时,尽管它们在结构上与NSC657456非常相似,但我们观察到它们不抑制内源性MYC:TRRAP相互作用(图24)。
我们接下来筛选了一集与化合物10(NSC657456)结构密切相关的化合物。我们希望这个衍生化合物子集能够鉴定更有效的MYC:TRRAP复合物抑制剂。可替代地,我们的想法是,导致NSC657456抑制能力破坏的化学修饰也将提供有用的信息,因为这可以进一步阐明抑制MYC:TRRAP相互作用所必需的最重要的化学官能团。
特别地,我们组装了一个基于相似性的小分子集,其由40种化合物组成,与化合物10(NSC657456)的相似性>80%。这是通过使用NCBI PubChem搜索NCI DTP Open Compound收集的约250,000种化合物及其子结构来完成的。我们从NCI获得这些“衍生物”化合物,并且使用细胞内发光互补测定在三种不同浓度下对其进行测定,以鉴定任何具有更高亲和力和特异性的精制分子。
该测定鉴定出化合物NSC657587,其以低于NSC657456(3-5μM;图25、26)的浓度抑制MYC:TRRAP复合物形成。这两种化合物的区别在于苯环上有单个溴(Br)基团(图25)。这些数据表明,使用小分子相似性筛选可以增加对已经建立的MYC:TRRAP相互作用抑制剂的亲和力。因此,我们已经鉴定了一种化合物,其作用浓度与最好的MYC:MAX抑制剂相似,只需要两次迭代。
正如我们所希望的那样,这些结果进一步帮助我们确定了初步的构效关系(SAR)和参与MYC:TRRAP抑制的最关键化学基团。该信息可用于合理设计具有高得多的亲和力的新抑制剂。简而言之,NSC657456和NSC657587都是衍生自靛红的腙。这些类型的官能团通常存在于批准的药物以及实验和研究化合物中。对靛红结构的修饰导致这些化合物对MYC:TRRAP相互作用的抑制能力极其灵敏的变化(图24),表明它是最重要的区域。此外,这些化合物的变体很容易通过简单的缩合化学获得。在核心官能团之外引入进一步的修饰可以增加我们示例性先导化合物的亲和力。
特别地,表1和表2中的化合物10(NSC 657456)和化合物1(NSC 657587)的其他衍生物,并且特别是具有下表4和表5中列出的4个核心结构的化合物,应导致鉴定可用于癌症治疗的其他新型MYC抑制剂。
Figure BDA0003774183670000391
在上述结构中,“R”取代基,即R1、R2和R3,任选地在每次出现时独立选自键、H、取代或未取代的以下项:烷基、烯基、炔基、苯基、羟基、羰基、醛、卤代甲酰基、碳酸酯、羧酸酯、羧基、烷氧碳酰、甲氧基、氢过氧基、过氧基、醚、半缩醛、半缩酮、缩醛、原酸酯、亚甲二氧基、原碳酸酯、羧酸酐、哌啶、吡啶、吡咯烷、噻唑、咪唑、吲哚、四唑、甲酰胺、伯胺、仲胺、叔胺、季胺、伯酮亚胺、仲酮亚胺、伯醛亚胺、仲醛亚胺、酰亚胺、叠氮化物、偶氮、氰酸酯、异氰酸酯、硝酸酯、腈、异腈、亚硝基氧基、硝基、亚硝基、肟、吡啶基、氨基甲酸酯、巯基、硫化物、二硫化物、亚磺酰基、磺酰基、亚磺基、磺基、硫氰酸酯、异硫氰酸酯、硫代碳酰基、硫代羟S-酸、硫代羟O-酸、硫醇酯、硫羰酸酯、碳二硫代酸、碳二硫基、膦基、膦酰基、磷酸酯、卤代、氟、氯、溴、碘、或任何药物样部分或片段。
具有上述4种核心结构之一的特定衍生物,应导致鉴定其他新型MYC抑制剂,包含在下表5中:
Figure BDA0003774183670000411
实施例11:用于鉴定抑制性化合物的改进转染方案
使用来自ThermoFisher的Expi293细胞,开发了新的转染方案(示意性地示于图27),其在保持相同信噪比的同时,可引发多出100倍的发光信号。特别地,如图27所示,使用293细胞的悬液(所述细胞悬液使用CO2摇床孵育箱培养)提供了高转染效率并且进一步有利地这些细胞可以生长至6000个细胞/uL。相比之下,当我们使用HeLa细胞时,我们通常在8uL中每孔(在1536个板中)涂铺约5000个细胞;相比之下,使用Expi 293细胞,我们能够在4uL中每孔涂铺20,000个细胞。
这将提供高得多的信号并将所需的
Figure BDA0003774183670000421
量降低至少一半,从而导致每个板的成本降低。此外,与HeLa细胞不同的是,Expi 293细胞在添加用于筛选的化合物之前不需要取出或附着在基质上。因此,我们能够以大体积转染细胞并且将细胞涂铺到已经含有化合物的孔中,从而可以在一天内而不是两天内自动化获得所有测量。
此外,使用Expi 293细胞悬液可缩短整合时间。特别是对于图27中所示的测量,HeLa细胞使用2秒整合时间(每次测量2秒),而Expi 293细胞使用0.5秒整合时间。这是可行的,因为使用转染的Expi 293细胞的信号要高得多,这大大降低了每个板所需的整合时间。Expi 293细胞可用于细胞和体外测量。
以下参考文献和本申请中引用的其他参考文献通过引用整体并入本文。
参考文献
1.Weinstein IB and Joe A,Felsher D.“Oncogene Addiction″,2008,CancerRes.68(9):3077-80.
2.Bradner JE and Hnisz D,Young RA.,“Transcriptional Addiction inCancer”,2017,Cell Feb;168(4):629-43.
3.Dang CV et al.,.“The c-Myc target gene network”,2006,Semin CancerBiol.16(4):253—64.
4.Shachaf CM et al.,“Genomic and proteomic analysis reveals athreshold level of MYC required for tumor maintenance”,Cancer Res.2008Jul 1;68(13):5132-42.
5.Yekkala K and Baudino TA,“lnhibition of intestinal polyposis withreduced angiogenesis in ApcMin/+mice due to decreases in c-Myc expression”,2007,Mol Cancer Res 5(12):1296-303.
6.Meyer N and Penn LZ,“Reflecting on 25years with MYC”,2008,Nat Rev.8(12):976-90.
7.Charron J et al.,“Embryonic lethality in mice homozygous for atargeted disruption of the N-myc gene″,1992,Genes Dev.6(12A):2248-57.
8.Knoepfler PS et al.,“N-myc is essential during neurogenesis for therapid expansion of progenitor cell populatians and the inhibition of neuronaldifferentiation”,2002,Genes Dev.16(20):2699-712.
9.Beroukhim R et al.”The landscape of somatic copy-number alterationacross human cancers”,2010,Nature.463(7283):899-905.
10.Nair SK and Burley SK,“X-ray structures of Myc-Max 547and Mad-Maxrecognizing DNA:Molecular bases of regulation by proto-oncogenictranscription factors”,2003,Cell 112(2):193-205.
11.Brownlie P et al.“The crystal structure of an intact human Max-DNAcomplex:new insights into mechanisms of transcriptional control”1997,Structure 5(4):509-20.
12.Cole MD and Cowling VH,“Transcription-independent functions ofMYC:regulation of translation and DNA replication″,2008,Nat Rev Mol cellBiol.9(10):810-5.
13.Brown SJ,Cole MD,Erives AJ,“Evolution of the holozoan ribosomebiogenesis regulon”,2008,BMC Genomics 9:442.
14.Cowling VH et al.,“A conserved Myc protein domain,MBIV,regulatesDNA binding,apoptosis,transformation,and G2 arrest”,Mol Cell Biol.2006Jun;26(11):4226-39.
15.McKeown MR and Bradner JE,“Therapeutic strategies to inhibit MYC”,2014,Cold Spring Harb Perspect Med.4(10).
16.NikiforovMA etal.,“TRRAP dependent and TRRAP-independenttranscriptiohal activation by Myc family oncoproteins”,2002,Mol cell Biol.22(14):5054-63.
17.Carabet LA et al.,“The rapeutic Inhibition of Myc inCancer.Structural Bases and computer-Aided Drug Discovery Approaches”,2018,Int J Mol Sci.20(1).
18.Posternak V and Cole MD,“Strategically targeting MYC in cancer”,F1000 Research.2016;5.
19.Whitfield JR et al.,“Strategies to lnhibit Myc and Their ClinicalApplicability”,2017,Front Cell Dev Biol.5:10.
20.Brough DE et al.,“An essential domain of the c-myc proteininteracts with a nuclearfactor that is also required for E1A-mediatedtransformation”,1995 Mol Cell Biol.15(3):1536-44.
21.Dang CV.“MYC on the path to cancer”,2012Cell149(1):22-35.
22.Cowling VH,Cole MD,“Mechanism of transcriptional 573 activation bythe Myc oncoproteins”,2006,Semin Cancer Biol.16(4):242-52.
23.McMahon SB et al.,“The novel ATM576related protein TRRAP is anessential cofactor for the c-Myc and E2F oncoproteins”,1998 Cell 94(3):363-74.
24.Kalkat M et al.,“MYC Protein lnteractome Profiling RevealsFunctionally Distinct Regions that Cooperate to Drive Tumorigenesis”,2018,MolCell72(5):836-848.e7.
25.Murr R et al.,“Orchestration of chromatin-based processes:mind theTRRAP”,2007,Oncogene 26(37):5358-72.
26.
Figure BDA0003774183670000441
D,Williams RL,“PIKKs--the solenoid nest where partners andkinases meet”2014,Curr Opin Struct Biol.29:134-42.
27.
Figure BDA0003774183670000442
H,Halazonetis TD,“Emerging common themes in regulation ofPIKKs and PI3Ks”,2009,EMBO J.28(20):3067-73.
28.Saleh A et al.,“Tra1p is a component of the yeast Ada.Spttranscriptional regulatory complexes”,1998,J BiolChem.273(41):26559-65.
29.Doyon Y,
Figure BDA0003774183670000443
J,“The highly conserved and multifunctional NuA4 HATcomplex”,2004,Curr Opin Genet Dev.14(2):147-54.
30.Grant PA,Schieltz D,Pray-Grant MG,Yates JR,Workman JL.The ATM-related cofactor Tra1 is a component of the purified SAGA complex.MolCell.1998Dec;2(6):863-7.
31.Herceg Z et al.,“Disruption of Trrap causes early embryoniclethality and defects in cell cycle progression”,2001 Nat Genet.29(2):206-212
32.Murugan et al.,“Mutational analysis of the GNA11,MMP27,FGD1,TRRAPand GRM3 genes in thyroid cancer”,2013,Oncol Lett.6(2):437-41.
33.Wei X et al.,“599 Exome sequencing identifies GRIN2A as frequentlymutated in melanoma″,2011,Nat Genet.43(5):442-6.
34.McMahon SB et al.,“The essential cofactor TRRAP recruits thehistone acetyltransferase hGCN5 to c-Myc”,2000,MolCellBiol.20(2):556-62.
35.Brown CE et al.,“Recruitment of HAT complexes by direct activatorinteractions with the ATM-related Tral subunit”,2001,Science.292(5525):2333-7.
36.Ard PG et al.,“Transcriptional regulation of the mdm2 oncogene byp53 requires TRRAP acetyltransferase complexes”,2002,Mol Cell Biol.22(16):5650-61.
37.Lang SE,Hearing P,“The adenovirus E1A oncoprotein recruits thecellular TRRAP/GCN5 histone acetyltransferase complex”,2003,Oncogene 22(18):2836-41.
38.Das C,Tyler JK,“Histone exchange and histone modifications duringtranscription and aging”,2013,Biochim Biophys Acta.1819(3-4):332-42.
39.Park J,et al.,“The ATM-related domain of TRRAP is required forhistone acetyltransferase recruitment and Myc-dependent oncogenesis”,2001,Genes Dev.15(13):1619-24.
40.Díaz-Santin LM et al.,“Cryo-EM structure of the SAGA and NuA4coactivator subunit Tra1 at 3.7angstrom resolution”2017,eLife 02:6.
41.Knutson BA,Hahn S,“Domains of Tra1 important for activatorrecruitment and transcription coactivator functions of SAGA and NuA4complexes”,2011,Mol Cell Biol.31(4):818-31.
42.Lee W et al.,“Integrative NMR for biomolecular research”,2016,JBiomol NMR.64(4):307-32.
43.McEwan IJ et al.,“Functional interaction of the c-Myctransactivation domain with the TATA binding protein:evidence for an inducedfit model of transactivation domain folding”,1996,Biochemistry,35(29):9584-93.
44.Tu WB et al.,“Myc and its interactors take shape”2015 BiochimBiophys Acta BBA-Gene Regul Mech.1849(5):469-83.
45.Krois AS et al.,“Recognition of the disordered p53 transactivationdomain by the transcriptional adapter zinc finger domains of CREB-bindingprotein”,2016,Proc Natl Acad Sci.113(13):E1853-62.
46.Chen X,et al.,“Fusion proteinlinkers:property,design andfunctionality”,2013,Adv Drug Deliv Rev 65(10):1357-69.
47.Lee W et al.,“PONDEROSA,an automated 3D-NOESY peak pickingprogram,enables automated protein structure determination”,2011,Bioinformatics 27(12):1727-8.
48.Neidigh JW,et al.,“Exendin-4 and glucagon-like peptide-1:NMRstructural comparisons in the solution and micelle-associated states”,2001,Biochemistry 40(44):13188-200.
49.Upadhyay V et al.,“Recovery of bioactive protein from bacterialinclusion bodies using trifluoroethanol as solubilization agent”,2016,MicrobCell Factories 15:100.
50.Sonnichsen FD et al.,“Effect of trifluoroethanol on proteinsecondary structure:an NMR and CD study using a synthetic actin peptide”,1992,Biochemistry 31(37):8790-8.
51.Gast K et al.,“Trifluoroethanol-induced conformational transitionsof proteins:lnsights gained from the differences between α-lactalbumin andribonuclease A”,2008,Protein Sci.8(3):625-34.
52.Felsher DW,“MYC 1nactivation Elicits Oncogene Addiction throughBoth Tumor Cell-Intrinsic and Host-Dependent Mechanisms”,2010,Genes Cancer 1(6):597-604.
53.Fiorentino FP et al.,“Growth suppression by MYC inhibition insmall cell lung cancer cells with TP53 and RB1 inactivation”,2016,Oncotarget7(21):31014-28.
54.Soucek L et al.,“Inhibition of Myc family proteins eradicatesKRas-driven Iung cancer in mice”.2013,Genes Dev.27(5):504-13.
55.Wang X et al.,“Architecture of the Saccharomyces cerevisiae NuA4/TIP60 complex”,2018,Nat Commun 9(1):1147.
56.Rivera-calzada A,et al.,“Structure and Assembly of the PI3K-likeProtein Kinases(PlKKs)Revealed by Electron Microscopy”,2015,AIMS Biophys 2(2):36-57.
57.Sibanda BL et al.,“DNA-PKcs structure suggests an allostericmechanism modulating DNA double-strand break repair”,2017 Science 355(6324):520-4.
58.Daub H et al.,“Kinase-selective enrichment enables quantitativephosphoproteomics of the kinome across the cell cycle”,2008,Mol Cell31(3):438-48.
59.Dephoure N et al.,“A quantitative atlas of mitoticphosphorylation″,2008,Proc Natl Acad 5ci U S A.105(31):10762-7.
60.Zhou H et al.,“Toward a comprehensive characterization of a humancancer cell phosphoproteome”,2013,J Proteome Res 12(1):260-71.
61.Allard S et al.,“NuA4,an essential transcription adaptor/histoneH4 acetyltransferase complex containing Esa1p and the ATM-related cofactorTra1p”,1999,EMBOJ 18(18):5108-19.
62.Grant PA et al.,“Yeast Gcn5 functions in two multisubunitcomplexes to acetylate nucleosomal histones:characterization of an Adacomplex and the SAGA(Spt/Ada)complex”,1997,Genies Dev.11(13):1640-50.
63.
Figure BDA0003774183670000461
J et al.,“Basic analysis of transcription factor binding tonucleosomes”,1995,In:Methods in Molecular Genetics Elsevier;pp.108-28.
64.Drozdetskiy A et al.,“Pred4:a protein secondary structureprediction server”,2015,Nucleic Acids Res 43(W1):W389-94.
65.Hall,M.P et al.,“Engineered luciferase reporter from a deep seashrimp utilizing a novel imidazopyrazinone substrate”,2012,ACS Chem.Biol.7,1848-1857.
66.Cerami J et al.“The cBio Cancer Genomics Portal:An Open Platformfor Exploring Multidimensional Cancer Genomics Data:Figure 1”,2012,CancerDiscov.2,401-404.
67.Gao,J et al.“Integrative analysis of complex cancer genomics andclinical profiles using the cBioPortal”,2013,Sci.Signal.6:11.
序列表
<110> 达特茅斯学院董事会(The Trustees of Dartmouth College)
<120> MYC癌基因的靶向MB2及其与癌症中的TRRAP的相互作用
<130> 1143252.004413
<140> 待分配
<141> 随同
<150> 62/942,734
<151> 2019-12-02
<160> 12
<170> PatentIn version 3.5
<210> 1
<211> 1317
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人MYC cDNA序列
<400> 1
atgcccctca acgttagctt caccaacagg aactatgacc tcgactacga ctcggtgcag 60
ccgtatttct actgcgacga ggaggagaac ttctaccagc agcagcagca gagcgagctg 120
cagcccccgg cgcccagcga ggatatctgg aagaaattcg agctgctgcc caccccgccc 180
ctgtccccta gccgccgctc cgggctctgc tcgccctcct acgttgcggt cacacccttc 240
tcccttcggg gagacaacga cggcggtggc gggagcttct ccacggccga ccagctggag 300
atggtgaccg agctgctggg aggagacatg gtgaaccaga gtttcatctg cgacccggac 360
gacgagacct tcatcaaaaa catcatcatc caggactgta tgtggagcgg cttctcggcc 420
gccgccaagc tcgtctcaga gaagctggcc tcctaccagg ctgcgcgcaa agacagcggc 480
agcccgaacc ccgcccgcgg ccacagcgtc tgctccacct ccagcttgta cctgcaggat 540
ctgagcgccg ccgcctcaga gtgcatcgac ccctcggtgg tcttccccta ccctctcaac 600
gacagcagct cgcccaagtc ctgcgcctcg caagactcca gcgccttctc tccgtcctcg 660
gattctctgc tctcctcgac ggagtcctcc ccgcagggca gccccgagcc cctggtgctc 720
catgaggaga caccgcccac caccagcagc gactctgagg aggaacaaga agatgaggaa 780
gaaatcgatg ttgtttctgt ggaaaagagg caggctcctg gcaaaaggtc agagtctgga 840
tcaccttctg ctggaggcca cagcaaacct cctcacagcc cactggtcct caagaggtgc 900
cacgtctcca cacatcagca caactacgca gcgcctccct ccactcggaa ggactatcct 960
gctgccaaga gggtcaagtt ggacagtgtc agagtcctga gacagatcag caacaaccga 1020
aaatgcacca gccccaggtc ctcggacacc gaggagaatg tcaagaggcg aacacacaac 1080
gtcttggagc gccagaggag gaacgagcta aaacggagct tttttgccct gcgtgaccag 1140
atcccggagt tggaaaacaa tgaaaaggcc cccaaggtag ttatccttaa aaaagccaca 1200
gcatacatcc tgtccgtcca agcagaggag caaaagctca tttctgaaga ggacttgttg 1260
cggaaacgac gagaacagtt gaaacacaaa cttgaacagc tacggaactc ttgtgcg 1317
<210> 2
<211> 439
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人MYC氨基酸序列
<400> 2
Met Pro Leu Asn Val Ser Phe Thr Asn Arg Asn Tyr Asp Leu Asp Tyr
1 5 10 15
Asp Ser Val Gln Pro Tyr Phe Tyr Cys Asp Glu Glu Glu Asn Phe Tyr
20 25 30
Gln Gln Gln Gln Gln Ser Glu Leu Gln Pro Pro Ala Pro Ser Glu Asp
35 40 45
Ile Trp Lys Lys Phe Glu Leu Leu Pro Thr Pro Pro Leu Ser Pro Ser
50 55 60
Arg Arg Ser Gly Leu Cys Ser Pro Ser Tyr Val Ala Val Thr Pro Phe
65 70 75 80
Ser Leu Arg Gly Asp Asn Asp Gly Gly Gly Gly Ser Phe Ser Thr Ala
85 90 95
Asp Gln Leu Glu Met Val Thr Glu Leu Leu Gly Gly Asp Met Val Asn
100 105 110
Gln Ser Phe Ile Cys Asp Pro Asp Asp Glu Thr Phe Ile Lys Asn Ile
115 120 125
Ile Ile Gln Asp Cys Met Trp Ser Gly Phe Ser Ala Ala Ala Lys Leu
130 135 140
Val Ser Glu Lys Leu Ala Ser Tyr Gln Ala Ala Arg Lys Asp Ser Gly
145 150 155 160
Ser Pro Asn Pro Ala Arg Gly His Ser Val Cys Ser Thr Ser Ser Leu
165 170 175
Tyr Leu Gln Asp Leu Ser Ala Ala Ala Ser Glu Cys Ile Asp Pro Ser
180 185 190
Val Val Phe Pro Tyr Pro Leu Asn Asp Ser Ser Ser Pro Lys Ser Cys
195 200 205
Ala Ser Gln Asp Ser Ser Ala Phe Ser Pro Ser Ser Asp Ser Leu Leu
210 215 220
Ser Ser Thr Glu Ser Ser Pro Gln Gly Ser Pro Glu Pro Leu Val Leu
225 230 235 240
His Glu Glu Thr Pro Pro Thr Thr Ser Ser Asp Ser Glu Glu Glu Gln
245 250 255
Glu Asp Glu Glu Glu Ile Asp Val Val Ser Val Glu Lys Arg Gln Ala
260 265 270
Pro Gly Lys Arg Ser Glu Ser Gly Ser Pro Ser Ala Gly Gly His Ser
275 280 285
Lys Pro Pro His Ser Pro Leu Val Leu Lys Arg Cys His Val Ser Thr
290 295 300
His Gln His Asn Tyr Ala Ala Pro Pro Ser Thr Arg Lys Asp Tyr Pro
305 310 315 320
Ala Ala Lys Arg Val Lys Leu Asp Ser Val Arg Val Leu Arg Gln Ile
325 330 335
Ser Asn Asn Arg Lys Cys Thr Ser Pro Arg Ser Ser Asp Thr Glu Glu
340 345 350
Asn Val Lys Arg Arg Thr His Asn Val Leu Glu Arg Gln Arg Arg Asn
355 360 365
Glu Leu Lys Arg Ser Phe Phe Ala Leu Arg Asp Gln Ile Pro Glu Leu
370 375 380
Glu Asn Asn Glu Lys Ala Pro Lys Val Val Ile Leu Lys Lys Ala Thr
385 390 395 400
Ala Tyr Ile Leu Ser Val Gln Ala Glu Glu Gln Lys Leu Ile Ser Glu
405 410 415
Glu Asp Leu Leu Arg Lys Arg Arg Glu Gln Leu Lys His Lys Leu Glu
420 425 430
Gln Leu Arg Asn Ser Cys Ala
435
<210> 3
<211> 11490
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人TRRAP cDNA序列
<400> 3
atggcgtttg ttgcaacaca gggggccacg gtggttgacc agaccacttt gatgaaaaag 60
taccttcagt ttgtggcagc tctcacagat gtgaatacac ctgatgaaac aaagttgaaa 120
atgatgcaag aagttagtga aaattttgag aatgtcacgt catctcctca gtattctaca 180
ttcctagaac atatcatccc tcgattcctt acatttctcc aagatggaga agttcagttt 240
cttcaggaga aaccagcaca gcaactgcgg aagctcgtac ttgaaataat tcatagaata 300
ccaaccaacg aacatcttcg tcctcacaca aaaaatgttt tgtctgtgat gtttcgcttt 360
ttagagacgg aaaatgaaga aaatgttctt atttgtctaa gaataattat tgagctacac 420
aaacagttca ggccaccgat cacacaagaa attcatcatt ttctggattt tgtgaaacag 480
atttacaagg agcttccaaa agtagtgaac cgctactttg agaaccctca agtgatcccc 540
gagaacacag tgcctccccc agaaatggtt ggtatgataa caacgattgc tgtgaaagtc 600
aacccggagc gtgaggacag tgagactcga acacattcca tcattccgag gggatcactt 660
tctctgaaag tgttggcaga attgcccatt attgttgttt taatgtatca gctctacaaa 720
ctgaacatcc acaatgttgt tgctgagttt gtgcccttga tcatgaacac cattgccatt 780
caggtgtctg cacaagcgag gcaacataag ctttacaaca aggagttgta tgctgacttc 840
attgctgctc agattaaaac attgtcattt ttagcttaca ttatcaggat ttaccaggag 900
ttggtgacta agtattctca gcagatggtg aaaggaatgc tccagttact ttcaaattgt 960
ccagcagaga ctgcacacct cagaaaggag cttctgattg ctgccaaaca catcctcacc 1020
acagagctga gaaaccagtt cattccttgc atggacaagc tgtttgatga atccatacta 1080
attggctcag gatatactgc cagagagact ctaaggcccc tcgcctacag cacgctggcc 1140
gacctcgtgc accatgtccg ccagcacctg cccctcagcg acctctccct cgccgtccag 1200
ctcttcgcca agaacatcga cgatgagtcc ctgcccagca gcatccagac catgtcctgc 1260
aagctcctgc tgaacctggt ggactgcatc cgttccaaga gcgagcagga gagtggcaat 1320
gggagagacg tcctgatgcg gatgctggag gttttcgttc tcaaattcca cacaattgct 1380
cggtaccagc tctctgccat ttttaagaag tgtaagcctc agtcagaact tggagccgtg 1440
gaagcagctc tgcctggggt gcccactgcc cctgcagctc ctggccctgc tccctcccca 1500
gcccctgtcc ctgccccacc tccacccccg cccccacccc cacctgccac ccctgtgacc 1560
ccggcccccg tgcctccctt cgagaagcaa ggagaaaagg acaaggaaga caagcagaca 1620
ttccaagtca cagactgtcg aagtttggtc aaaaccttgg tgtgtggtgt caagacaatc 1680
acgtggggca taacatcatg caaagcacct ggtgaagctc agttcattcc caacaagcag 1740
ttacaaccca aagagacaca gatttacatc aaacttgtga aatatgcaat gcaagcttta 1800
gatatttatc aggtccagat agcaggaaat ggacagacat acatccgtgt ggccaactgc 1860
cagactgtga gaatgaaaga ggagaaggag gtattggagc atttcgctgg tgtgttcaca 1920
atgatgaacc ccttaacgtt caaagaaatc ttccaaacta cggtccctta tatggtggag 1980
agaatctcaa aaaattatgc tcttcagatt gttgccaatt ccttcttggc aaatcctact 2040
acctctgctc tgtttgctac gattctggtg gaatatctcc ttgatcgcct gccagaaatg 2100
ggctccaacg tggagctctc caacctgtac ctcaagctgt tcaagctggt ctttggctct 2160
gtctccctct ttgcagctga aaatgaacaa atgctgaagc ctcacttgca caagattgtg 2220
aacagctcta tggagctcgc gcagactgcc aaggaaccct acaactactt cttgctgcta 2280
cgggcgctgt ttcgctctat tggtggaggt agccacgatc tcttgtatca ggagttcttg 2340
cctctccttc caaacctcct gcaagggctg aacatgcttc agagtggcct gcacaagcag 2400
cacatgaagg acctctttgt ggagctgtgt ctcaccgtcc ctgtgcggct gagctcgctt 2460
ttgccgtacc tgcccatgct tatggatccc ttggtgtctg cactcaatgg gtctcagaca 2520
ttggtcagcc aaggcctcag gacgctggag ctgtgtgtgg acaacctgca gcccgacttc 2580
ctctacgacc acatccagcc ggtgcgcgca gagctcatgc aggctctgtg gcgcacctta 2640
cgcaaccctg ctgacagcat ctcccacgtg gcctaccgtg tgctcggtaa gtttggcggc 2700
agtaacagga agatgctgaa ggagtcgcag aagctgcact acgttgtgac cgaggttcag 2760
ggccccagca tcactgtgga gttttccgac tgcaaagctt ctctccagct ccccatggag 2820
aaggccattg aaactgctct ggactgcctg aaaagcgcca acactgagcc ctactaccgg 2880
aggcaggcgt gggaagtgat caaatgcttc ctggtggcca tgatgagcct ggaggacaac 2940
aagcacgcac tctaccagct cctggcacac cccaacttta cagaaaagac catccccaat 3000
gttatcatct cacatcgcta caaagcccag gacactccag cccggaagac ttttgagcag 3060
gccctgacag gcgccttcat gtctgctgtc attaaggacc tgcggcccag cgccctgccc 3120
tttgtcgcca gcttgatccg ccactatacg atggtggcag tcgcccagca gtgtggccct 3180
ttcttgctgc cttgctacca ggtgggcagc cagcccagca cagccatgtt tcacagtgaa 3240
gaaaatggct cgaaaggaat ggatcctttg gttctcattg atgcaattgc tatttgtatg 3300
gcatatgaag aaaaggagct ttgcaaaatc ggggaggtgg ccctagctgt gatatttgat 3360
gttgcaagta tcatcctggg ctccaaggag agggcctgcc agctgcccct gttttcttac 3420
atcgtggagc gcctgtgtgc atgttgttat gaacaggcgt ggtatgcaaa gctggggggt 3480
gtggtgtcta ttaagtttct catggagcgg ctgcctctca cttgggttct ccagaaccag 3540
cagacattcc tgaaagcact tctctttgtc atgatggact taactggaga ggtttccaat 3600
ggggcagtcg ctatggcaaa gaccacgctg gagcagcttc tgatgcggtg cgcaacgcct 3660
ttaaaagacg aggagagagc cgaagagatc gtggccgccc aggaaaagtc tttccaccat 3720
gtgacacacg acttggttcg agaagtcacc tctccaaact ccactgtgag gaagcaggcc 3780
atgcattcgc tgcaggtgtt ggcccaggtc actgggaaga gtgtcacggt gatcatggaa 3840
ccccacaaag aggtcctgca ggatatggtc ccccctaaga agcacctgct ccgacaccag 3900
cctgccaacg cacagattgg cctgatggag gggaacacgt tctgtaccac gttgcagccc 3960
aggctcttca caatggacct taacgtggtg gagcataagg tgttctacac agagctgttg 4020
aatttgtgtg aggctgaaga ttcagcttta acaaagctgc cctgttataa aagccttccg 4080
tcactcgtac ctttacgaat tgcggcatta aatgcacttg ctgcctgcaa ttaccttcct 4140
cagtccaggg agaaaatcat cgctgcactc ttcaaagccc tgaattccac caatagtgag 4200
ctccaagagg ccggagaagc ctgtatgaga aagtttttag aaggtgctac catagaagtc 4260
gatcaaatcc acacacatat gcgacctttg ctgatgatgc tgggagatta ccggagcttg 4320
acgctgaatg ttgtgaatcg cctgacttcg gtcacgaggc tcttcccaaa ttccttcaat 4380
gataaatttt gtgatcagat gatgcaacat ctgcgcaagt ggatggaagt ggtggtgatc 4440
acccacaaag ggggccagag gagcgacgga aacgaaatga agatttgctc agcaattata 4500
aacctttttc atctgatccc ggctgctcct cagacactgg tgaagccttt gctagaggtt 4560
gtcatgaaaa cggagcgggc gatgctgatc gaggcgggga gtccattccg agagcccctg 4620
atcaagttcc tgactcgaca tccctcgcag acagtggagc tgttcatgat ggaagccaca 4680
ctgaacgatc cccagtggag cagaatgttt atgagttttt taaaacacaa agacgccaga 4740
cctctgcggg atgtgctggc tgccaacccc aacaggttca tcaccctgct gctgccgggg 4800
ggtgcccaga cggctgtgcg ccccggttcg cccagcacca gcaccatgcg cctggacctc 4860
cagttccagg ccatcaagat cataagcatt atagtgaaaa acgatgactc ctggctggcc 4920
agccagcact ctctggtgag ccagttgcga cgtgtgtggg tgagtgagaa cttccaagag 4980
aggcaccgca aggagaacat ggcagccacc aactggaagg agcccaagct gctggcctac 5040
tgcctgctga actactgcaa aaggaattac ggagatatag aattgctgtt ccagctgctc 5100
cgagccttta ctggtcgttt tctctgcaac atgacattct taaaagagta tatggaggaa 5160
gagattccca aaaattacag catcgctcag aaacgtgccc tgttctttcg ctttgtagac 5220
ttcaacgacc ccaacttcgg agatgaatta aaagctaaag ttctgcagca tatcttgaat 5280
cctgctttct tgtacagctt tgagaagggg gaaggagagc agctcttggg acctcccaat 5340
ccagaaggag ataacccaga aagcatcacc agtgtgttta ttaccaaggt cctggacccc 5400
gagaagcagg cggacatgct ggactcgctg cggatctacc tgctgcagta cgccacgctg 5460
ctggtggagc acgcccccca ccacatccat gacaacaaca agaaccgcaa cagcaagctg 5520
cgccgcctca tgaccttcgc ctggccctgc ctgctctcca aggcctgcgt ggacccagcc 5580
tgcaagtaca gcggacactt gctcctggcg cacattatcg ccaaattcgc catacacaag 5640
aagatcgtcc tgcaggtttt tcatagtctc ctcaaggctc acgcaatgga agctcgagcg 5700
atcgtcagac aggcgatggc cattctgacc ccggcggtgc cggccaggat ggaggacggg 5760
caccagatgc tgacccactg gacccggaag atcattgtgg aggaggggca caccgtcccg 5820
cagctggtcc acattctgca cctgatagtg caacacttca aggtgtacta cccggtacgg 5880
caccacttgg tgcagcacat ggtgagcgcc atgcagaggc tgggcttcac gcccagtgtc 5940
accatcgagc agaggcggct ggccgtggac ctgtctgaag tcgtcatcaa gtgggagctg 6000
cagaggatca aggaccagca gccggattca gatatggacc caaattccag tggagaagga 6060
gtcaattctg tctcatcctc cattaagaga ggcctgtccg tggattctgc ccaggaagtg 6120
aaacgcttta ggacggccac cggagccatc agtgcagtct ttgggaggag ccagtcgcta 6180
cctggagcag actctctcct cgccaagccc attgacaagc agcacacaga cactgtggtg 6240
aacttcctta tccgcgtggc ctgtcaggtt aatgacaaca ccaacacagc ggggtcccct 6300
ggggaggtgc tctctcgccg gtgtgtgaac cttctgaaga ctgcgttgcg gccagacatg 6360
tggcccaagt ccgaactcaa gctgcagtgg ttcgacaagc tgctgatgac tgtggagcag 6420
ccaaaccaag tgaactatgg gaatatctgc acgggcctag aagtgctgag cttcctgcta 6480
actgtcctcc agtccccagc catcctcagt agcttcaaac ctctgcagcg tggaattgcc 6540
gcctgcatga catgtggaaa caccaaggtg ttgcgagccg tccacagcct tctctcgcgc 6600
ctgatgagca ttttcccaac agagccgagt acttccagtg tggcctccaa atatgaagag 6660
ctggagtgcc tctacgcagc cgtcggaaag gtcatctatg aagggctcac caactacgag 6720
aaggccacca atgccaatcc ctcccagctc ttcgggaccc ttatgatcct caagtctgcc 6780
tgcagcaaca accccagcta catagacagg ctgatctccg tctttatgcg ctccctgcag 6840
aagatggtcc gggagcattt aaaccctcag gcagcgtcag gaagcaccga agccacctca 6900
ggtacaagcg agctggtgat gctgagtctg gagctggtga agacgcgcct ggcagtgatg 6960
agcatggaga tgcggaagaa cttcatccag gccatcctga catccctcat cgaaaaatca 7020
ccagatgcca aaatcctccg ggctgtggtc aaaatcgtgg aagaatgggt caagaataac 7080
tccccaatgg cagccaatca gacacctaca ctccgggaga agtccatttt gcttgtgaag 7140
atgatgactt acatagaaaa acgctttccg gaagaccttg aattaaatgc ccagttttta 7200
gatcttgtta actatgtcta cagggatgag accctctctg gcagcgagct gacggcgaaa 7260
cttgagcctg cctttctctc tgggctgcgc tgtgcccagc cactcatcag ggcaaagttt 7320
ttcgaggttt ttgacaactc catgaaacgt cgtgtctacg agcgcttgct ctatgtgacc 7380
tgttcgcaga actgggaagc catggggaac cacttctgga tcaagcagtg cattgagctg 7440
cttctggccg tgtgtgagaa gagcaccccc attggcacca gctgccaagg agccatgctc 7500
ccgtccatca ccaacgtcat caacctggcc gatagccacg accgtgccgc cttcgccatg 7560
gtcacacatg tcaagcagga gccccgggag cgggagaaca gcgagtccaa agaggaggat 7620
gtagagatag acatcgaact agctcctggg gatcagacca gcacgcccaa aaccaaagaa 7680
ctttcagaaa aggacattgg aaaccagctg cacatgctaa ccaacaggca cgacaagttt 7740
ctggacactc tccgagaggt gaagactgga gcgctgctca gcgctttcgt tcagctgtgc 7800
cacatttcca cgacgctggc agagaagacg tgggtccagc ttttccccag attgtggaag 7860
atcctctctg acagacagca gcatgcactc gcgggtgaga taagtccatt tctgtgcagc 7920
ggcagtcacc aggtgcagcg ggactgccag cccagcgcgc tgaactgctt tgtggaagcc 7980
atgtcccagt gcgtgccgcc aatccccatc cgaccctgcg tcctgaagta cctggggaag 8040
acacacaacc tctggttccg gtccacgctg atgttggagc accaggcttt tgaaaagggt 8100
ctgagtcttc agattaagcc gaagcaaaca acggagtttt atgagcagga gagcatcacc 8160
ccgccgcagc aggagatact ggattccctt gcggagcttt actccctgtt acaagaggaa 8220
gatatgtggg ctggtctgtg gcagaagcgg tgcaagtact cggagacagc gactgcgatt 8280
gcttacgagc agcacgggtt ctttgagcag gcacaagaat cctatgaaaa ggcaatggat 8340
aaagccaaaa aagaacatga gaggagtaac gcctcccctg ctattttccc tgaataccag 8400
ctctgggaag accactggat tcgatgctcc aaggaattga accagtggga agccctgacg 8460
gagtacggtc agtccaaagg ccacatcaac ccctacctcg tcctggagtg cgcctggcgg 8520
gtgtccaact ggactgccat gaaggaggcg ctggtgcagg tggaagtgag ctgtccgaag 8580
gagatggcct ggaaggtgaa catgtaccgc ggatacctgg ccatctgcca ccccgaggag 8640
cagcagctca gcttcatcga gcgcctggtg gagatggcca gcagcctggc catccgcgag 8700
tggcggcggc tgccccacgt agtgtcccac gtgcacacgc ctctcctaca ggcagcccag 8760
caaatcatcg aactccagga agctgcacaa atcaacgcag gcttacagcc aaccaacctg 8820
ggaaggaaca acagcctgca cgacatgaag acggtggtga agacctggag gaaccgactg 8880
cccatcgtgt ctgacgactt gtcccactgg agcagcatct tcatgtggag gcagcatcat 8940
taccaggcga ttgtaactgc ctatgagaat agctctcagc atgatcccag ttcaaataac 9000
gctatgcttg gggttcatgc atcagcttca gcgatcatcc agtatggaaa aatcgcccgg 9060
aaacaaggac tggtcaatgt agctctggat atattaagtc ggattcatac tattccaact 9120
gttcctatcg tggattgctt ccagaagatt cgacagcaag ttaaatgcta cctccagctg 9180
gcaggcgtca tgggcaaaaa cgagtgcatg cagggccttg aagttattga atctacaaat 9240
ttaaaatact tcacaaaaga gatgacagcc gaattttatg cactgaaggg aatgttcttg 9300
gctcagatca acaagtccga ggaggcaaac aaagccttct ctgcagctgt gcagatgcac 9360
gatgtgctgg tgaaagcctg ggccatgtgg ggcgactacc tggagaacat ctttgtgaag 9420
gagcggcagc tgcacctggg cgtgtctgcc atcacctgct acctgcacgc ctgccggcat 9480
cagaacgaga gcaaatcgag gaaatactta gccaaggtgc tgtggctttt gagttttgat 9540
gatgacaaaa acactttggc agatgccgtc gacaagtact gcattggtgt gccacccatc 9600
cagtggctgg cctggatccc acagctgctc acctgcctgg ttggctcgga gggaaagctg 9660
ctcttgaacc tcattagcca ggttggacgc gtgtatcccc aagcggtcta ctttcccatc 9720
cggaccctgt acctgaccct gaaaatagaa cagcgggaac gctacaagag cgatccaggg 9780
cccataagag caacagcacc catgtggcgc tgcagccgaa tcatgcacat gcagcgagag 9840
ctccacccca cccttctgtc ttccctggaa ggcatcgtcg atcagatggt ctggttcaga 9900
gaaaattggc atgaagaggt tctcaggcag ctccaacagg gcctggcgaa atgttactcc 9960
gtggcgtttg agaaaagtgg agcggtgtcc gatgctaaaa tcacccccca cactctcaat 10020
tttgtgaaga agttggtgag cacgtttggg gtgggcctgg agaatgtgtc caacgtctcg 10080
accatgttct ccagcgcagc ctctgagtct ctggcccggc gggcgcaggc cactgcacaa 10140
gaccctgtct ttcagaagct gaaaggccag ttcacgacgg attttgactt cagcgttcca 10200
ggatccatga agcttcataa tcttatttct aagttgaaaa agtggatcaa aatcttggag 10260
gccaagacca agcaactccc caaattcttc ctcatagagg aaaagtgccg gttcttgagc 10320
aatttctcgg cacagacagc tgaagtggaa attcctgggg agtttctgat gccaaagcca 10380
acgcattatt acatcaagat tgcacggttc atgccccggg tagagattgt gcagaagcac 10440
aacaccgcag cccggcggct gtacatccgg ggacacaatg gcaagatcta cccatacctc 10500
gtcatgaacg acgcctgcct cacagagtca cggcgagagg agcgtgtgtt gcagctgctg 10560
cgtctgctga acccctgttt ggagaagaga aaggagacca ccaagaggca cttgtttttc 10620
acagtgcccc gggttgtggc agtttcccca cagatgcgcc tcgtggagga caacccctct 10680
tcactttccc ttgtggagat ctacaagcag cgctgcgcca agaagggcat cgagcatgac 10740
aaccccatct cccgttacta tgaccggctg gctacggtgc aggcgcgggg aacccaagcc 10800
agccaccagg tcctccgcga catcctcaag gaggttcaga gtaacatggt gccgcgcagc 10860
atgctcaagg agtgggcgct gcacaccttc cccaatgcca cggactactg gacgttccgg 10920
aagatgttca ccatccagct ggctctgata ggcttcgcgg aattcgtcct gcatttaaat 10980
agactcaacc ccgagatgtt acagatcgct caggacactg gcaaactgaa tgttgcctac 11040
tttcgatttg acataaacga cgcgactgga gacctggatg ccaaccgtcc tgtcccattt 11100
cgactcacgc ccaacatttc tgagtttctg accaccatcg gggtctccgg cccgttgaca 11160
gcgtccatga ttgcggtcgc ccggtgcttc gcccagccaa actttaaggt ggatggcatt 11220
ctgaaaacgg ttctccggga cgagatcatt gcttggcaca aaaaaacaca agaggacacg 11280
tcctctcctc tctcggccgc cgggcagcca gagaacatgg acagccagca actggtgtcc 11340
ctggttcaga aagccgtcac cgccatcatg acccgcctgc acaacctcgc ccagttcgaa 11400
ggcggggaaa gcaaggtgaa caccctggtg gccgcggcaa acagcctgga caatctgtgc 11460
cgcatggacc ccgcctggca cccctggctg 11490
<210> 4
<211> 3830
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人TRRAP氨基酸序列
<400> 4
Met Ala Phe Val Ala Thr Gln Gly Ala Thr Val Val Asp Gln Thr Thr
1 5 10 15
Leu Met Lys Lys Tyr Leu Gln Phe Val Ala Ala Leu Thr Asp Val Asn
20 25 30
Thr Pro Asp Glu Thr Lys Leu Lys Met Met Gln Glu Val Ser Glu Asn
35 40 45
Phe Glu Asn Val Thr Ser Ser Pro Gln Tyr Ser Thr Phe Leu Glu His
50 55 60
Ile Ile Pro Arg Phe Leu Thr Phe Leu Gln Asp Gly Glu Val Gln Phe
65 70 75 80
Leu Gln Glu Lys Pro Ala Gln Gln Leu Arg Lys Leu Val Leu Glu Ile
85 90 95
Ile His Arg Ile Pro Thr Asn Glu His Leu Arg Pro His Thr Lys Asn
100 105 110
Val Leu Ser Val Met Phe Arg Phe Leu Glu Thr Glu Asn Glu Glu Asn
115 120 125
Val Leu Ile Cys Leu Arg Ile Ile Ile Glu Leu His Lys Gln Phe Arg
130 135 140
Pro Pro Ile Thr Gln Glu Ile His His Phe Leu Asp Phe Val Lys Gln
145 150 155 160
Ile Tyr Lys Glu Leu Pro Lys Val Val Asn Arg Tyr Phe Glu Asn Pro
165 170 175
Gln Val Ile Pro Glu Asn Thr Val Pro Pro Pro Glu Met Val Gly Met
180 185 190
Ile Thr Thr Ile Ala Val Lys Val Asn Pro Glu Arg Glu Asp Ser Glu
195 200 205
Thr Arg Thr His Ser Ile Ile Pro Arg Gly Ser Leu Ser Leu Lys Val
210 215 220
Leu Ala Glu Leu Pro Ile Ile Val Val Leu Met Tyr Gln Leu Tyr Lys
225 230 235 240
Leu Asn Ile His Asn Val Val Ala Glu Phe Val Pro Leu Ile Met Asn
245 250 255
Thr Ile Ala Ile Gln Val Ser Ala Gln Ala Arg Gln His Lys Leu Tyr
260 265 270
Asn Lys Glu Leu Tyr Ala Asp Phe Ile Ala Ala Gln Ile Lys Thr Leu
275 280 285
Ser Phe Leu Ala Tyr Ile Ile Arg Ile Tyr Gln Glu Leu Val Thr Lys
290 295 300
Tyr Ser Gln Gln Met Val Lys Gly Met Leu Gln Leu Leu Ser Asn Cys
305 310 315 320
Pro Ala Glu Thr Ala His Leu Arg Lys Glu Leu Leu Ile Ala Ala Lys
325 330 335
His Ile Leu Thr Thr Glu Leu Arg Asn Gln Phe Ile Pro Cys Met Asp
340 345 350
Lys Leu Phe Asp Glu Ser Ile Leu Ile Gly Ser Gly Tyr Thr Ala Arg
355 360 365
Glu Thr Leu Arg Pro Leu Ala Tyr Ser Thr Leu Ala Asp Leu Val His
370 375 380
His Val Arg Gln His Leu Pro Leu Ser Asp Leu Ser Leu Ala Val Gln
385 390 395 400
Leu Phe Ala Lys Asn Ile Asp Asp Glu Ser Leu Pro Ser Ser Ile Gln
405 410 415
Thr Met Ser Cys Lys Leu Leu Leu Asn Leu Val Asp Cys Ile Arg Ser
420 425 430
Lys Ser Glu Gln Glu Ser Gly Asn Gly Arg Asp Val Leu Met Arg Met
435 440 445
Leu Glu Val Phe Val Leu Lys Phe His Thr Ile Ala Arg Tyr Gln Leu
450 455 460
Ser Ala Ile Phe Lys Lys Cys Lys Pro Gln Ser Glu Leu Gly Ala Val
465 470 475 480
Glu Ala Ala Leu Pro Gly Val Pro Thr Ala Pro Ala Ala Pro Gly Pro
485 490 495
Ala Pro Ser Pro Ala Pro Val Pro Ala Pro Pro Pro Pro Pro Pro Pro
500 505 510
Pro Pro Pro Ala Thr Pro Val Thr Pro Ala Pro Val Pro Pro Phe Glu
515 520 525
Lys Gln Gly Glu Lys Asp Lys Glu Asp Lys Gln Thr Phe Gln Val Thr
530 535 540
Asp Cys Arg Ser Leu Val Lys Thr Leu Val Cys Gly Val Lys Thr Ile
545 550 555 560
Thr Trp Gly Ile Thr Ser Cys Lys Ala Pro Gly Glu Ala Gln Phe Ile
565 570 575
Pro Asn Lys Gln Leu Gln Pro Lys Glu Thr Gln Ile Tyr Ile Lys Leu
580 585 590
Val Lys Tyr Ala Met Gln Ala Leu Asp Ile Tyr Gln Val Gln Ile Ala
595 600 605
Gly Asn Gly Gln Thr Tyr Ile Arg Val Ala Asn Cys Gln Thr Val Arg
610 615 620
Met Lys Glu Glu Lys Glu Val Leu Glu His Phe Ala Gly Val Phe Thr
625 630 635 640
Met Met Asn Pro Leu Thr Phe Lys Glu Ile Phe Gln Thr Thr Val Pro
645 650 655
Tyr Met Val Glu Arg Ile Ser Lys Asn Tyr Ala Leu Gln Ile Val Ala
660 665 670
Asn Ser Phe Leu Ala Asn Pro Thr Thr Ser Ala Leu Phe Ala Thr Ile
675 680 685
Leu Val Glu Tyr Leu Leu Asp Arg Leu Pro Glu Met Gly Ser Asn Val
690 695 700
Glu Leu Ser Asn Leu Tyr Leu Lys Leu Phe Lys Leu Val Phe Gly Ser
705 710 715 720
Val Ser Leu Phe Ala Ala Glu Asn Glu Gln Met Leu Lys Pro His Leu
725 730 735
His Lys Ile Val Asn Ser Ser Met Glu Leu Ala Gln Thr Ala Lys Glu
740 745 750
Pro Tyr Asn Tyr Phe Leu Leu Leu Arg Ala Leu Phe Arg Ser Ile Gly
755 760 765
Gly Gly Ser His Asp Leu Leu Tyr Gln Glu Phe Leu Pro Leu Leu Pro
770 775 780
Asn Leu Leu Gln Gly Leu Asn Met Leu Gln Ser Gly Leu His Lys Gln
785 790 795 800
His Met Lys Asp Leu Phe Val Glu Leu Cys Leu Thr Val Pro Val Arg
805 810 815
Leu Ser Ser Leu Leu Pro Tyr Leu Pro Met Leu Met Asp Pro Leu Val
820 825 830
Ser Ala Leu Asn Gly Ser Gln Thr Leu Val Ser Gln Gly Leu Arg Thr
835 840 845
Leu Glu Leu Cys Val Asp Asn Leu Gln Pro Asp Phe Leu Tyr Asp His
850 855 860
Ile Gln Pro Val Arg Ala Glu Leu Met Gln Ala Leu Trp Arg Thr Leu
865 870 875 880
Arg Asn Pro Ala Asp Ser Ile Ser His Val Ala Tyr Arg Val Leu Gly
885 890 895
Lys Phe Gly Gly Ser Asn Arg Lys Met Leu Lys Glu Ser Gln Lys Leu
900 905 910
His Tyr Val Val Thr Glu Val Gln Gly Pro Ser Ile Thr Val Glu Phe
915 920 925
Ser Asp Cys Lys Ala Ser Leu Gln Leu Pro Met Glu Lys Ala Ile Glu
930 935 940
Thr Ala Leu Asp Cys Leu Lys Ser Ala Asn Thr Glu Pro Tyr Tyr Arg
945 950 955 960
Arg Gln Ala Trp Glu Val Ile Lys Cys Phe Leu Val Ala Met Met Ser
965 970 975
Leu Glu Asp Asn Lys His Ala Leu Tyr Gln Leu Leu Ala His Pro Asn
980 985 990
Phe Thr Glu Lys Thr Ile Pro Asn Val Ile Ile Ser His Arg Tyr Lys
995 1000 1005
Ala Gln Asp Thr Pro Ala Arg Lys Thr Phe Glu Gln Ala Leu Thr
1010 1015 1020
Gly Ala Phe Met Ser Ala Val Ile Lys Asp Leu Arg Pro Ser Ala
1025 1030 1035
Leu Pro Phe Val Ala Ser Leu Ile Arg His Tyr Thr Met Val Ala
1040 1045 1050
Val Ala Gln Gln Cys Gly Pro Phe Leu Leu Pro Cys Tyr Gln Val
1055 1060 1065
Gly Ser Gln Pro Ser Thr Ala Met Phe His Ser Glu Glu Asn Gly
1070 1075 1080
Ser Lys Gly Met Asp Pro Leu Val Leu Ile Asp Ala Ile Ala Ile
1085 1090 1095
Cys Met Ala Tyr Glu Glu Lys Glu Leu Cys Lys Ile Gly Glu Val
1100 1105 1110
Ala Leu Ala Val Ile Phe Asp Val Ala Ser Ile Ile Leu Gly Ser
1115 1120 1125
Lys Glu Arg Ala Cys Gln Leu Pro Leu Phe Ser Tyr Ile Val Glu
1130 1135 1140
Arg Leu Cys Ala Cys Cys Tyr Glu Gln Ala Trp Tyr Ala Lys Leu
1145 1150 1155
Gly Gly Val Val Ser Ile Lys Phe Leu Met Glu Arg Leu Pro Leu
1160 1165 1170
Thr Trp Val Leu Gln Asn Gln Gln Thr Phe Leu Lys Ala Leu Leu
1175 1180 1185
Phe Val Met Met Asp Leu Thr Gly Glu Val Ser Asn Gly Ala Val
1190 1195 1200
Ala Met Ala Lys Thr Thr Leu Glu Gln Leu Leu Met Arg Cys Ala
1205 1210 1215
Thr Pro Leu Lys Asp Glu Glu Arg Ala Glu Glu Ile Val Ala Ala
1220 1225 1230
Gln Glu Lys Ser Phe His His Val Thr His Asp Leu Val Arg Glu
1235 1240 1245
Val Thr Ser Pro Asn Ser Thr Val Arg Lys Gln Ala Met His Ser
1250 1255 1260
Leu Gln Val Leu Ala Gln Val Thr Gly Lys Ser Val Thr Val Ile
1265 1270 1275
Met Glu Pro His Lys Glu Val Leu Gln Asp Met Val Pro Pro Lys
1280 1285 1290
Lys His Leu Leu Arg His Gln Pro Ala Asn Ala Gln Ile Gly Leu
1295 1300 1305
Met Glu Gly Asn Thr Phe Cys Thr Thr Leu Gln Pro Arg Leu Phe
1310 1315 1320
Thr Met Asp Leu Asn Val Val Glu His Lys Val Phe Tyr Thr Glu
1325 1330 1335
Leu Leu Asn Leu Cys Glu Ala Glu Asp Ser Ala Leu Thr Lys Leu
1340 1345 1350
Pro Cys Tyr Lys Ser Leu Pro Ser Leu Val Pro Leu Arg Ile Ala
1355 1360 1365
Ala Leu Asn Ala Leu Ala Ala Cys Asn Tyr Leu Pro Gln Ser Arg
1370 1375 1380
Glu Lys Ile Ile Ala Ala Leu Phe Lys Ala Leu Asn Ser Thr Asn
1385 1390 1395
Ser Glu Leu Gln Glu Ala Gly Glu Ala Cys Met Arg Lys Phe Leu
1400 1405 1410
Glu Gly Ala Thr Ile Glu Val Asp Gln Ile His Thr His Met Arg
1415 1420 1425
Pro Leu Leu Met Met Leu Gly Asp Tyr Arg Ser Leu Thr Leu Asn
1430 1435 1440
Val Val Asn Arg Leu Thr Ser Val Thr Arg Leu Phe Pro Asn Ser
1445 1450 1455
Phe Asn Asp Lys Phe Cys Asp Gln Met Met Gln His Leu Arg Lys
1460 1465 1470
Trp Met Glu Val Val Val Ile Thr His Lys Gly Gly Gln Arg Ser
1475 1480 1485
Asp Gly Asn Glu Met Lys Ile Cys Ser Ala Ile Ile Asn Leu Phe
1490 1495 1500
His Leu Ile Pro Ala Ala Pro Gln Thr Leu Val Lys Pro Leu Leu
1505 1510 1515
Glu Val Val Met Lys Thr Glu Arg Ala Met Leu Ile Glu Ala Gly
1520 1525 1530
Ser Pro Phe Arg Glu Pro Leu Ile Lys Phe Leu Thr Arg His Pro
1535 1540 1545
Ser Gln Thr Val Glu Leu Phe Met Met Glu Ala Thr Leu Asn Asp
1550 1555 1560
Pro Gln Trp Ser Arg Met Phe Met Ser Phe Leu Lys His Lys Asp
1565 1570 1575
Ala Arg Pro Leu Arg Asp Val Leu Ala Ala Asn Pro Asn Arg Phe
1580 1585 1590
Ile Thr Leu Leu Leu Pro Gly Gly Ala Gln Thr Ala Val Arg Pro
1595 1600 1605
Gly Ser Pro Ser Thr Ser Thr Met Arg Leu Asp Leu Gln Phe Gln
1610 1615 1620
Ala Ile Lys Ile Ile Ser Ile Ile Val Lys Asn Asp Asp Ser Trp
1625 1630 1635
Leu Ala Ser Gln His Ser Leu Val Ser Gln Leu Arg Arg Val Trp
1640 1645 1650
Val Ser Glu Asn Phe Gln Glu Arg His Arg Lys Glu Asn Met Ala
1655 1660 1665
Ala Thr Asn Trp Lys Glu Pro Lys Leu Leu Ala Tyr Cys Leu Leu
1670 1675 1680
Asn Tyr Cys Lys Arg Asn Tyr Gly Asp Ile Glu Leu Leu Phe Gln
1685 1690 1695
Leu Leu Arg Ala Phe Thr Gly Arg Phe Leu Cys Asn Met Thr Phe
1700 1705 1710
Leu Lys Glu Tyr Met Glu Glu Glu Ile Pro Lys Asn Tyr Ser Ile
1715 1720 1725
Ala Gln Lys Arg Ala Leu Phe Phe Arg Phe Val Asp Phe Asn Asp
1730 1735 1740
Pro Asn Phe Gly Asp Glu Leu Lys Ala Lys Val Leu Gln His Ile
1745 1750 1755
Leu Asn Pro Ala Phe Leu Tyr Ser Phe Glu Lys Gly Glu Gly Glu
1760 1765 1770
Gln Leu Leu Gly Pro Pro Asn Pro Glu Gly Asp Asn Pro Glu Ser
1775 1780 1785
Ile Thr Ser Val Phe Ile Thr Lys Val Leu Asp Pro Glu Lys Gln
1790 1795 1800
Ala Asp Met Leu Asp Ser Leu Arg Ile Tyr Leu Leu Gln Tyr Ala
1805 1810 1815
Thr Leu Leu Val Glu His Ala Pro His His Ile His Asp Asn Asn
1820 1825 1830
Lys Asn Arg Asn Ser Lys Leu Arg Arg Leu Met Thr Phe Ala Trp
1835 1840 1845
Pro Cys Leu Leu Ser Lys Ala Cys Val Asp Pro Ala Cys Lys Tyr
1850 1855 1860
Ser Gly His Leu Leu Leu Ala His Ile Ile Ala Lys Phe Ala Ile
1865 1870 1875
His Lys Lys Ile Val Leu Gln Val Phe His Ser Leu Leu Lys Ala
1880 1885 1890
His Ala Met Glu Ala Arg Ala Ile Val Arg Gln Ala Met Ala Ile
1895 1900 1905
Leu Thr Pro Ala Val Pro Ala Arg Met Glu Asp Gly His Gln Met
1910 1915 1920
Leu Thr His Trp Thr Arg Lys Ile Ile Val Glu Glu Gly His Thr
1925 1930 1935
Val Pro Gln Leu Val His Ile Leu His Leu Ile Val Gln His Phe
1940 1945 1950
Lys Val Tyr Tyr Pro Val Arg His His Leu Val Gln His Met Val
1955 1960 1965
Ser Ala Met Gln Arg Leu Gly Phe Thr Pro Ser Val Thr Ile Glu
1970 1975 1980
Gln Arg Arg Leu Ala Val Asp Leu Ser Glu Val Val Ile Lys Trp
1985 1990 1995
Glu Leu Gln Arg Ile Lys Asp Gln Gln Pro Asp Ser Asp Met Asp
2000 2005 2010
Pro Asn Ser Ser Gly Glu Gly Val Asn Ser Val Ser Ser Ser Ile
2015 2020 2025
Lys Arg Gly Leu Ser Val Asp Ser Ala Gln Glu Val Lys Arg Phe
2030 2035 2040
Arg Thr Ala Thr Gly Ala Ile Ser Ala Val Phe Gly Arg Ser Gln
2045 2050 2055
Ser Leu Pro Gly Ala Asp Ser Leu Leu Ala Lys Pro Ile Asp Lys
2060 2065 2070
Gln His Thr Asp Thr Val Val Asn Phe Leu Ile Arg Val Ala Cys
2075 2080 2085
Gln Val Asn Asp Asn Thr Asn Thr Ala Gly Ser Pro Gly Glu Val
2090 2095 2100
Leu Ser Arg Arg Cys Val Asn Leu Leu Lys Thr Ala Leu Arg Pro
2105 2110 2115
Asp Met Trp Pro Lys Ser Glu Leu Lys Leu Gln Trp Phe Asp Lys
2120 2125 2130
Leu Leu Met Thr Val Glu Gln Pro Asn Gln Val Asn Tyr Gly Asn
2135 2140 2145
Ile Cys Thr Gly Leu Glu Val Leu Ser Phe Leu Leu Thr Val Leu
2150 2155 2160
Gln Ser Pro Ala Ile Leu Ser Ser Phe Lys Pro Leu Gln Arg Gly
2165 2170 2175
Ile Ala Ala Cys Met Thr Cys Gly Asn Thr Lys Val Leu Arg Ala
2180 2185 2190
Val His Ser Leu Leu Ser Arg Leu Met Ser Ile Phe Pro Thr Glu
2195 2200 2205
Pro Ser Thr Ser Ser Val Ala Ser Lys Tyr Glu Glu Leu Glu Cys
2210 2215 2220
Leu Tyr Ala Ala Val Gly Lys Val Ile Tyr Glu Gly Leu Thr Asn
2225 2230 2235
Tyr Glu Lys Ala Thr Asn Ala Asn Pro Ser Gln Leu Phe Gly Thr
2240 2245 2250
Leu Met Ile Leu Lys Ser Ala Cys Ser Asn Asn Pro Ser Tyr Ile
2255 2260 2265
Asp Arg Leu Ile Ser Val Phe Met Arg Ser Leu Gln Lys Met Val
2270 2275 2280
Arg Glu His Leu Asn Pro Gln Ala Ala Ser Gly Ser Thr Glu Ala
2285 2290 2295
Thr Ser Gly Thr Ser Glu Leu Val Met Leu Ser Leu Glu Leu Val
2300 2305 2310
Lys Thr Arg Leu Ala Val Met Ser Met Glu Met Arg Lys Asn Phe
2315 2320 2325
Ile Gln Ala Ile Leu Thr Ser Leu Ile Glu Lys Ser Pro Asp Ala
2330 2335 2340
Lys Ile Leu Arg Ala Val Val Lys Ile Val Glu Glu Trp Val Lys
2345 2350 2355
Asn Asn Ser Pro Met Ala Ala Asn Gln Thr Pro Thr Leu Arg Glu
2360 2365 2370
Lys Ser Ile Leu Leu Val Lys Met Met Thr Tyr Ile Glu Lys Arg
2375 2380 2385
Phe Pro Glu Asp Leu Glu Leu Asn Ala Gln Phe Leu Asp Leu Val
2390 2395 2400
Asn Tyr Val Tyr Arg Asp Glu Thr Leu Ser Gly Ser Glu Leu Thr
2405 2410 2415
Ala Lys Leu Glu Pro Ala Phe Leu Ser Gly Leu Arg Cys Ala Gln
2420 2425 2430
Pro Leu Ile Arg Ala Lys Phe Phe Glu Val Phe Asp Asn Ser Met
2435 2440 2445
Lys Arg Arg Val Tyr Glu Arg Leu Leu Tyr Val Thr Cys Ser Gln
2450 2455 2460
Asn Trp Glu Ala Met Gly Asn His Phe Trp Ile Lys Gln Cys Ile
2465 2470 2475
Glu Leu Leu Leu Ala Val Cys Glu Lys Ser Thr Pro Ile Gly Thr
2480 2485 2490
Ser Cys Gln Gly Ala Met Leu Pro Ser Ile Thr Asn Val Ile Asn
2495 2500 2505
Leu Ala Asp Ser His Asp Arg Ala Ala Phe Ala Met Val Thr His
2510 2515 2520
Val Lys Gln Glu Pro Arg Glu Arg Glu Asn Ser Glu Ser Lys Glu
2525 2530 2535
Glu Asp Val Glu Ile Asp Ile Glu Leu Ala Pro Gly Asp Gln Thr
2540 2545 2550
Ser Thr Pro Lys Thr Lys Glu Leu Ser Glu Lys Asp Ile Gly Asn
2555 2560 2565
Gln Leu His Met Leu Thr Asn Arg His Asp Lys Phe Leu Asp Thr
2570 2575 2580
Leu Arg Glu Val Lys Thr Gly Ala Leu Leu Ser Ala Phe Val Gln
2585 2590 2595
Leu Cys His Ile Ser Thr Thr Leu Ala Glu Lys Thr Trp Val Gln
2600 2605 2610
Leu Phe Pro Arg Leu Trp Lys Ile Leu Ser Asp Arg Gln Gln His
2615 2620 2625
Ala Leu Ala Gly Glu Ile Ser Pro Phe Leu Cys Ser Gly Ser His
2630 2635 2640
Gln Val Gln Arg Asp Cys Gln Pro Ser Ala Leu Asn Cys Phe Val
2645 2650 2655
Glu Ala Met Ser Gln Cys Val Pro Pro Ile Pro Ile Arg Pro Cys
2660 2665 2670
Val Leu Lys Tyr Leu Gly Lys Thr His Asn Leu Trp Phe Arg Ser
2675 2680 2685
Thr Leu Met Leu Glu His Gln Ala Phe Glu Lys Gly Leu Ser Leu
2690 2695 2700
Gln Ile Lys Pro Lys Gln Thr Thr Glu Phe Tyr Glu Gln Glu Ser
2705 2710 2715
Ile Thr Pro Pro Gln Gln Glu Ile Leu Asp Ser Leu Ala Glu Leu
2720 2725 2730
Tyr Ser Leu Leu Gln Glu Glu Asp Met Trp Ala Gly Leu Trp Gln
2735 2740 2745
Lys Arg Cys Lys Tyr Ser Glu Thr Ala Thr Ala Ile Ala Tyr Glu
2750 2755 2760
Gln His Gly Phe Phe Glu Gln Ala Gln Glu Ser Tyr Glu Lys Ala
2765 2770 2775
Met Asp Lys Ala Lys Lys Glu His Glu Arg Ser Asn Ala Ser Pro
2780 2785 2790
Ala Ile Phe Pro Glu Tyr Gln Leu Trp Glu Asp His Trp Ile Arg
2795 2800 2805
Cys Ser Lys Glu Leu Asn Gln Trp Glu Ala Leu Thr Glu Tyr Gly
2810 2815 2820
Gln Ser Lys Gly His Ile Asn Pro Tyr Leu Val Leu Glu Cys Ala
2825 2830 2835
Trp Arg Val Ser Asn Trp Thr Ala Met Lys Glu Ala Leu Val Gln
2840 2845 2850
Val Glu Val Ser Cys Pro Lys Glu Met Ala Trp Lys Val Asn Met
2855 2860 2865
Tyr Arg Gly Tyr Leu Ala Ile Cys His Pro Glu Glu Gln Gln Leu
2870 2875 2880
Ser Phe Ile Glu Arg Leu Val Glu Met Ala Ser Ser Leu Ala Ile
2885 2890 2895
Arg Glu Trp Arg Arg Leu Pro His Val Val Ser His Val His Thr
2900 2905 2910
Pro Leu Leu Gln Ala Ala Gln Gln Ile Ile Glu Leu Gln Glu Ala
2915 2920 2925
Ala Gln Ile Asn Ala Gly Leu Gln Pro Thr Asn Leu Gly Arg Asn
2930 2935 2940
Asn Ser Leu His Asp Met Lys Thr Val Val Lys Thr Trp Arg Asn
2945 2950 2955
Arg Leu Pro Ile Val Ser Asp Asp Leu Ser His Trp Ser Ser Ile
2960 2965 2970
Phe Met Trp Arg Gln His His Tyr Gln Ala Ile Val Thr Ala Tyr
2975 2980 2985
Glu Asn Ser Ser Gln His Asp Pro Ser Ser Asn Asn Ala Met Leu
2990 2995 3000
Gly Val His Ala Ser Ala Ser Ala Ile Ile Gln Tyr Gly Lys Ile
3005 3010 3015
Ala Arg Lys Gln Gly Leu Val Asn Val Ala Leu Asp Ile Leu Ser
3020 3025 3030
Arg Ile His Thr Ile Pro Thr Val Pro Ile Val Asp Cys Phe Gln
3035 3040 3045
Lys Ile Arg Gln Gln Val Lys Cys Tyr Leu Gln Leu Ala Gly Val
3050 3055 3060
Met Gly Lys Asn Glu Cys Met Gln Gly Leu Glu Val Ile Glu Ser
3065 3070 3075
Thr Asn Leu Lys Tyr Phe Thr Lys Glu Met Thr Ala Glu Phe Tyr
3080 3085 3090
Ala Leu Lys Gly Met Phe Leu Ala Gln Ile Asn Lys Ser Glu Glu
3095 3100 3105
Ala Asn Lys Ala Phe Ser Ala Ala Val Gln Met His Asp Val Leu
3110 3115 3120
Val Lys Ala Trp Ala Met Trp Gly Asp Tyr Leu Glu Asn Ile Phe
3125 3130 3135
Val Lys Glu Arg Gln Leu His Leu Gly Val Ser Ala Ile Thr Cys
3140 3145 3150
Tyr Leu His Ala Cys Arg His Gln Asn Glu Ser Lys Ser Arg Lys
3155 3160 3165
Tyr Leu Ala Lys Val Leu Trp Leu Leu Ser Phe Asp Asp Asp Lys
3170 3175 3180
Asn Thr Leu Ala Asp Ala Val Asp Lys Tyr Cys Ile Gly Val Pro
3185 3190 3195
Pro Ile Gln Trp Leu Ala Trp Ile Pro Gln Leu Leu Thr Cys Leu
3200 3205 3210
Val Gly Ser Glu Gly Lys Leu Leu Leu Asn Leu Ile Ser Gln Val
3215 3220 3225
Gly Arg Val Tyr Pro Gln Ala Val Tyr Phe Pro Ile Arg Thr Leu
3230 3235 3240
Tyr Leu Thr Leu Lys Ile Glu Gln Arg Glu Arg Tyr Lys Ser Asp
3245 3250 3255
Pro Gly Pro Ile Arg Ala Thr Ala Pro Met Trp Arg Cys Ser Arg
3260 3265 3270
Ile Met His Met Gln Arg Glu Leu His Pro Thr Leu Leu Ser Ser
3275 3280 3285
Leu Glu Gly Ile Val Asp Gln Met Val Trp Phe Arg Glu Asn Trp
3290 3295 3300
His Glu Glu Val Leu Arg Gln Leu Gln Gln Gly Leu Ala Lys Cys
3305 3310 3315
Tyr Ser Val Ala Phe Glu Lys Ser Gly Ala Val Ser Asp Ala Lys
3320 3325 3330
Ile Thr Pro His Thr Leu Asn Phe Val Lys Lys Leu Val Ser Thr
3335 3340 3345
Phe Gly Val Gly Leu Glu Asn Val Ser Asn Val Ser Thr Met Phe
3350 3355 3360
Ser Ser Ala Ala Ser Glu Ser Leu Ala Arg Arg Ala Gln Ala Thr
3365 3370 3375
Ala Gln Asp Pro Val Phe Gln Lys Leu Lys Gly Gln Phe Thr Thr
3380 3385 3390
Asp Phe Asp Phe Ser Val Pro Gly Ser Met Lys Leu His Asn Leu
3395 3400 3405
Ile Ser Lys Leu Lys Lys Trp Ile Lys Ile Leu Glu Ala Lys Thr
3410 3415 3420
Lys Gln Leu Pro Lys Phe Phe Leu Ile Glu Glu Lys Cys Arg Phe
3425 3430 3435
Leu Ser Asn Phe Ser Ala Gln Thr Ala Glu Val Glu Ile Pro Gly
3440 3445 3450
Glu Phe Leu Met Pro Lys Pro Thr His Tyr Tyr Ile Lys Ile Ala
3455 3460 3465
Arg Phe Met Pro Arg Val Glu Ile Val Gln Lys His Asn Thr Ala
3470 3475 3480
Ala Arg Arg Leu Tyr Ile Arg Gly His Asn Gly Lys Ile Tyr Pro
3485 3490 3495
Tyr Leu Val Met Asn Asp Ala Cys Leu Thr Glu Ser Arg Arg Glu
3500 3505 3510
Glu Arg Val Leu Gln Leu Leu Arg Leu Leu Asn Pro Cys Leu Glu
3515 3520 3525
Lys Arg Lys Glu Thr Thr Lys Arg His Leu Phe Phe Thr Val Pro
3530 3535 3540
Arg Val Val Ala Val Ser Pro Gln Met Arg Leu Val Glu Asp Asn
3545 3550 3555
Pro Ser Ser Leu Ser Leu Val Glu Ile Tyr Lys Gln Arg Cys Ala
3560 3565 3570
Lys Lys Gly Ile Glu His Asp Asn Pro Ile Ser Arg Tyr Tyr Asp
3575 3580 3585
Arg Leu Ala Thr Val Gln Ala Arg Gly Thr Gln Ala Ser His Gln
3590 3595 3600
Val Leu Arg Asp Ile Leu Lys Glu Val Gln Ser Asn Met Val Pro
3605 3610 3615
Arg Ser Met Leu Lys Glu Trp Ala Leu His Thr Phe Pro Asn Ala
3620 3625 3630
Thr Asp Tyr Trp Thr Phe Arg Lys Met Phe Thr Ile Gln Leu Ala
3635 3640 3645
Leu Ile Gly Phe Ala Glu Phe Val Leu His Leu Asn Arg Leu Asn
3650 3655 3660
Pro Glu Met Leu Gln Ile Ala Gln Asp Thr Gly Lys Leu Asn Val
3665 3670 3675
Ala Tyr Phe Arg Phe Asp Ile Asn Asp Ala Thr Gly Asp Leu Asp
3680 3685 3690
Ala Asn Arg Pro Val Pro Phe Arg Leu Thr Pro Asn Ile Ser Glu
3695 3700 3705
Phe Leu Thr Thr Ile Gly Val Ser Gly Pro Leu Thr Ala Ser Met
3710 3715 3720
Ile Ala Val Ala Arg Cys Phe Ala Gln Pro Asn Phe Lys Val Asp
3725 3730 3735
Gly Ile Leu Lys Thr Val Leu Arg Asp Glu Ile Ile Ala Trp His
3740 3745 3750
Lys Lys Thr Gln Glu Asp Thr Ser Ser Pro Leu Ser Ala Ala Gly
3755 3760 3765
Gln Pro Glu Asn Met Asp Ser Gln Gln Leu Val Ser Leu Val Gln
3770 3775 3780
Lys Ala Val Thr Ala Ile Met Thr Arg Leu His Asn Leu Ala Gln
3785 3790 3795
Phe Glu Gly Gly Glu Ser Lys Val Asn Thr Leu Val Ala Ala Ala
3800 3805 3810
Asn Ser Leu Asp Asn Leu Cys Arg Met Asp Pro Ala Trp His Pro
3815 3820 3825
Trp Leu
3830
<210> 5
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 柔性接头
<400> 5
Gly Ser Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Phe Gly
1 5 10 15
<210> 6
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人MYC 129-145 (MB2)氨基酸序列
<400> 6
Ile Ile Gln Asp Cys Met Trp Ser Gly Phe Ser Ala Ala Ala Lys Leu
1 5 10 15
Val
<210> 7
<211> 190
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人MYC 1-190氨基酸序列
<400> 7
Met Pro Leu Asn Val Ser Phe Thr Asn Arg Asn Tyr Asp Leu Asp Tyr
1 5 10 15
Asp Ser Val Gln Pro Tyr Phe Tyr Cys Asp Glu Glu Glu Asn Phe Tyr
20 25 30
Gln Gln Gln Gln Gln Ser Glu Leu Gln Pro Pro Ala Pro Ser Glu Asp
35 40 45
Ile Trp Lys Lys Phe Glu Leu Leu Pro Thr Pro Pro Leu Ser Pro Ser
50 55 60
Arg Arg Ser Gly Leu Cys Ser Pro Ser Tyr Val Ala Val Thr Pro Phe
65 70 75 80
Ser Leu Arg Gly Asp Asn Asp Gly Gly Gly Gly Ser Phe Ser Thr Ala
85 90 95
Asp Gln Leu Glu Met Val Thr Glu Leu Leu Gly Gly Asp Met Val Asn
100 105 110
Gln Ser Phe Ile Cys Asp Pro Asp Asp Glu Thr Phe Ile Lys Asn Ile
115 120 125
Ile Ile Gln Asp Cys Met Trp Ser Gly Phe Ser Ala Ala Ala Lys Leu
130 135 140
Val Ser Glu Lys Leu Ala Ser Tyr Gln Ala Ala Arg Lys Asp Ser Gly
145 150 155 160
Ser Pro Asn Pro Ala Arg Gly His Ser Val Cys Ser Thr Ser Ser Leu
165 170 175
Tyr Leu Gln Asp Leu Ser Ala Ala Ala Ser Glu Cys Ile Asp
180 185 190
<210> 8
<211> 42
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人MYC 120-161氨基酸序列
<400> 8
Asp Asp Glu Thr Phe Ile Lys Asn Ile Ile Ile Gln Asp Cys Met Trp
1 5 10 15
Ser Gly Phe Ser Ala Ala Ala Lys Leu Val Ser Glu Lys Leu Ala Ser
20 25 30
Tyr Gln Ala Ala Arg Lys Asp Ser Gly Ser
35 40
<210> 9
<211> 56
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人TRRAP 2033-2088氨基酸序列
<400> 9
Ser Val Asp Ser Ala Gln Glu Val Lys Arg Phe Arg Thr Ala Thr Gly
1 5 10 15
Ala Ile Ser Ala Val Phe Gly Arg Ser Gln Ser Leu Pro Gly Ala Asp
20 25 30
Ser Leu Leu Ala Lys Pro Ile Asp Lys Gln His Thr Asp Thr Val Val
35 40 45
Asn Phe Leu Ile Arg Val Ala Cys
50 55
<210> 10
<211> 251
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人TRRAP 2033-2283氨基酸序列
<400> 10
Ser Val Asp Ser Ala Gln Glu Val Lys Arg Phe Arg Thr Ala Thr Gly
1 5 10 15
Ala Ile Ser Ala Val Phe Gly Arg Ser Gln Ser Leu Pro Gly Ala Asp
20 25 30
Ser Leu Leu Ala Lys Pro Ile Asp Lys Gln His Thr Asp Thr Val Val
35 40 45
Asn Phe Leu Ile Arg Val Ala Cys Gln Val Asn Asp Asn Thr Asn Thr
50 55 60
Ala Gly Ser Pro Gly Glu Val Leu Ser Arg Arg Cys Val Asn Leu Leu
65 70 75 80
Lys Thr Ala Leu Arg Pro Asp Met Trp Pro Lys Ser Glu Leu Lys Leu
85 90 95
Gln Trp Phe Asp Lys Leu Leu Met Thr Val Glu Gln Pro Asn Gln Val
100 105 110
Asn Tyr Gly Asn Ile Cys Thr Gly Leu Glu Val Leu Ser Phe Leu Leu
115 120 125
Thr Val Leu Gln Ser Pro Ala Ile Leu Ser Ser Phe Lys Pro Leu Gln
130 135 140
Arg Gly Ile Ala Ala Cys Met Thr Cys Gly Asn Thr Lys Val Leu Arg
145 150 155 160
Ala Val His Ser Leu Leu Ser Arg Leu Met Ser Ile Phe Pro Thr Glu
165 170 175
Pro Ser Thr Ser Ser Val Ala Ser Lys Tyr Glu Glu Leu Glu Cys Leu
180 185 190
Tyr Ala Ala Val Gly Lys Val Ile Tyr Glu Gly Leu Thr Asn Tyr Glu
195 200 205
Lys Ala Thr Asn Ala Asn Pro Ser Gln Leu Phe Gly Thr Leu Met Ile
210 215 220
Leu Lys Ser Ala Cys Ser Asn Asn Pro Ser Tyr Ile Asp Arg Leu Ile
225 230 235 240
Ser Val Phe Met Arg Ser Leu Gln Lys Met Val
245 250
<210> 11
<211> 480
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人MAX cDNA序列
<400> 11
atgagcgata acgatgacat cgaggtggag agcgacgaag agcaaccgag gtttcaatct 60
gcggctgaca aacgggctca tcataatgca ctggaacgaa aacgtaggga ccacatcaaa 120
gacagctttc acagtttgcg ggactcagtc ccatcactcc aaggagagaa ggcatcccgg 180
gcccaaatcc tagacaaagc cacagaatat atccagtata tgcgaaggaa aaaccacaca 240
caccagcaag atattgacga cctcaagcgg cagaatgctc ttctggagca gcaagtccgt 300
gcactggaga aggcgaggtc aagtgcccaa ctgcagacca actacccctc ctcagacaac 360
agcctctaca ccaacgccaa gggcagcacc atctctgcct tcgatggggg ctcggactcc 420
agctcggagt ctgagcctga agagccccaa agcaggaaga agctccggat ggaggccagc 480
<210> 12
<211> 160
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人MAX氨基酸序列
<400> 12
Met Ser Asp Asn Asp Asp Ile Glu Val Glu Ser Asp Glu Glu Gln Pro
1 5 10 15
Arg Phe Gln Ser Ala Ala Asp Lys Arg Ala His His Asn Ala Leu Glu
20 25 30
Arg Lys Arg Arg Asp His Ile Lys Asp Ser Phe His Ser Leu Arg Asp
35 40 45
Ser Val Pro Ser Leu Gln Gly Glu Lys Ala Ser Arg Ala Gln Ile Leu
50 55 60
Asp Lys Ala Thr Glu Tyr Ile Gln Tyr Met Arg Arg Lys Asn His Thr
65 70 75 80
His Gln Gln Asp Ile Asp Asp Leu Lys Arg Gln Asn Ala Leu Leu Glu
85 90 95
Gln Gln Val Arg Ala Leu Glu Lys Ala Arg Ser Ser Ala Gln Leu Gln
100 105 110
Thr Asn Tyr Pro Ser Ser Asp Asn Ser Leu Tyr Thr Asn Ala Lys Gly
115 120 125
Ser Thr Ile Ser Ala Phe Asp Gly Gly Ser Asp Ser Ser Ser Glu Ser
130 135 140
Glu Pro Glu Glu Pro Gln Ser Arg Lys Lys Leu Arg Met Glu Ala Ser
145 150 155 160

Claims (24)

1.一种用于鉴定抑制MYC转录因子和转化/转录结构域相关蛋白(TRRAP)之间结合相互作用的化学化合物的方法,其包括:
a)形成具有MYC:TRRAP结合相互作用的MYC:TRRAP复合物;
b)直接和/或间接检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用以确定所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用的基线测量;
c)在形成具有MYC:TRRAP结合相互作用的MYC:TRRAP复合物之前或之后引入化合物;以及
d)与所述基线测量相比,确定在引入所述化学化合物后所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用的不存在或降低,其中所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用的不存在或降低指示所述化学化合物是MYC和TRRAP之间结合相互作用的抑制剂。
2.如权利要求1所述的方法,其包括以下中的一项或多项:
(i)MYC包含与SEQ ID NO:2或另一哺乳动物MYC氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一或至少99%同一的氨基酸序列;
(ii)TRRAP包含与SEQ ID NO:4或另一哺乳动物TRRAP氨基酸序列至少75%同一、至少80%同一、至少85%同一、至少90%同一、至少95%同一、至少98%同一或至少99%同一的氨基酸序列;
(iii)所述MYC:TRRAP复合物在体外环境,细胞中,或在选自秀丽隐杆线虫、黑腹果蝇、斑马鱼、啮齿动物和非人灵长类动物的非人动物中形成;
(iv)(iii)中的所述细胞选自人细胞、哺乳动物细胞、昆虫细胞、酵母细胞和细菌细胞;
(v)所述细胞是HeLa细胞、293细胞、Expi293细胞或Expi293细胞悬液;
(vi)所述化合物为小分子,任选地包括腙、脲、硫脲、酮、糖、脂质、氨基酸、脂肪酸、核苷酸、肽、苯酚、醇、聚酮、糖苷、生物碱、吩嗪、聚酮、萜烯、四吡咯;
(vii)所述化合物为表1、表2或表5中化合物之一和/或为包含表4中所示的通用结构之一的化合物,任选地其中“R”取代基,即R1、R2和R3,在每次出现时选自键、H、取代或未取代的以下项:烷基、烯基、炔基、苯基、羟基、羰基、醛、卤代甲酰基、碳酸酯、羧酸酯、羧基、烷氧碳酰、甲氧基、氢过氧基、过氧基、醚、半缩醛、半缩酮、缩醛、原酸酯、亚甲二氧基、原碳酸酯、羧酸酐、哌啶、吡啶、吡咯烷、噻唑、咪唑、吲哚、四唑、甲酰胺、伯胺、仲胺、叔胺、季胺、伯酮亚胺、仲酮亚胺、伯醛亚胺、仲醛亚胺、酰亚胺、叠氮化物、偶氮、氰酸酯、异氰酸酯、硝酸酯、腈、异腈、亚硝基氧基、硝基、亚硝基、肟、吡啶基、氨基甲酸酯、巯基、硫化物、二硫化物、亚磺酰基、磺酰基、亚磺基、磺基、硫氰酸酯、异硫氰酸酯、硫代碳酰基、硫代羟S-酸、硫代羟O-酸、硫醇酯、硫羰酸酯、碳二硫代酸、碳二硫基、膦基、膦酰基、磷酸酯、卤代、氟、氯、溴、碘、或任何药物样部分或片段;或
(viii)或前述项的任何组合。
3.如权利要求1或2所述的方法,其中所述MYC:TRRAP复合物包含:
全长MYC或MYC片段和全长TRRAP或TRRAP片段;或
MYC-TRRAP融合物,其包含:
所述全长MYC或所述MYC片段,
接头,以及
所述全长TRRAP或所述TRRAP片段;
其中所述MYC片段包含最小MYC区域并且所述TRRAP片段包含最小TRRAP区域,其中:
所述最小MYC区域是MYC MB2结构域;并且
所述最小TRRAP区域是TRRAP 2033-2088区域;并且
其中所述全长MYC、所述MYC片段、所述全长TRRAP、和所述TRRAP片段中任一项或多项任选地包含:
亲和标签,
可检测标记,和/或
用于纯化、鉴定和/或互补的不同蛋白质、蛋白质结构域、或蛋白质片段。
4.如前述权利要求中任一项所述的方法,其中
(i)所述化学化合物被分离或包含在化学化合物的混合物中;
(ii)所述化学化合物包括小分子有机化学化合物;和/或
(iii)所述化学化合物选自小分子化学化合物文库;
(iv)或前述项的任何组合。
5.如前述权利要求中任一项所述的方法,所述方法还包括:
(i)通过测试所述化学化合物在至少一个体外或体内测定中抑制MYC和MYC相关因子MAX之间的结合相互作用的能力,确定所述化学化合物抑制MYC和TRRAP之间的结合相互作用的特异性;
(ii)进行基于细胞的蛋白质-片段互补测定以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(iii)进行基于细胞的蛋白质-片段互补测定以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用,其中所述基于细胞的蛋白质-片段互补测定是发光互补测定;
(iv)进行基于细胞的蛋白质-片段互补测定以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用,其中所述基于细胞的蛋白质-片段互补测定是发光互补测定,其中所述发光互补测定包括:
SmB-萤光素酶-MYC融合物,其包含N-末端SmB-萤光素酶片段和C-末端全长MYC或C-末端MYC片段;以及
TRRAP-LgB-萤光素酶融合物,其包含N-末端TRRAP片段和C-末端LgB-萤光素酶片段;
其中所述SmB-萤光素酶-MYC融合物和所述TRRAP-LgB-萤光素酶融合物形成所述MYC:TRRAP复合物,由此所述SmB-萤光素酶片段和所述LgB-萤光素酶片段形成功能性萤光素酶酶,所述功能性萤光素酶在存在萤光素酶底物的情况下产生发光信号。
6.如前述权利要求中任一项所述的方法,其中
(i)所述MYC片段是MYC 1-190片段,并且所述TRRAP片段是TRRAP 2033-2283片段;
(ii)所述功能性萤光素酶酶是衍生自深海细脚刺虾的19.1kDa萤光素酶酶;
(iii)所述SmB-萤光素酶-MYC融合物和所述TRRAP-LgB-萤光素酶融合物分别在来自哺乳动物表达载体的细胞中表达,所述哺乳动物表达载体包含组成型启动子,任选CMV启动子;
(iv)所述SmB-萤光素酶-MYC融合物的表达水平与所述TRRAP-LgB-萤光素酶融合物的表达水平基本相等;
(v)所述细胞包括HeLa细胞;
(vi)所述细胞包括Epti293细胞或Expi293细胞悬液;
(v)所述萤光素酶底物是呋喃嗪;
(vi)所述发光互补测定还包括检测由直接抑制所述SmB-萤光素酶和LgB-萤光素酶片段的萤光素酶活性或通过抑制所述SmB-萤光素酶和LgB-萤光素酶片段的互补而引起的假阳性结果;
(vii)所述细胞进一步表达荧光报告子,其中使用所述荧光报告子来归一化转染效率和细胞数,任选地其中所述荧光报告子是EGFP;
(viii)以不同浓度引入所述化学化合物,任选范围为10nM至100uM;
(ix)所述方法包括确定测试的一种或多种化学化合物的IC50值;
(x)以一定浓度引入的所述化学化合物将所述发光信号降低至少50%;
(xi)以1-500μM、5-100μM、10-50μM或25μM的浓度引入所述化学化合物,其任选地将所述发光信号降低至少20%、30%、40%或50%;
(xii)所述测定使用293个细胞的转染悬液,任选地以每孔约10,000-20,000个细胞涂铺;
(xiii)所述测定使用转染的Expi 293细胞悬液,任选地使用CO2摇床孵育箱培养,进一步任选地其中每板使用约4uL体积的约20,000个细胞,从而当这些细胞用于高通量筛选方法时,与转染的HeLa细胞相比,将检测所需的Nanoglo量降低和/或将整合时间减少约4倍(例如,每次测量约2秒,相比之下,Expi 293细胞每次测量0.5秒);或
(xiv)(i)至(xiii)的任何组合。
7.如前述权利要求中任一项所述的方法,其中在体外或体内肿瘤模型中,评估已鉴定为降低所述MYC:TRRAP复合物的形成和/或阻断所述MYC:TRRAP结合相互作用的化合物的抗肿瘤功效。
8.如前述权利要求中任一项所述的方法,其中在体外或体内肿瘤模型中,评估化合物的抗肿瘤功效,所述化合物包括或衍生自表1、2、4或5中列出的化学化合物中的一种或多种,任选地其中所述“R”取代基,即R1、R2和R3,在每次出现时选自键、H、取代或未取代的以下项:烷基、烯基、炔基、苯基、羟基、羰基、醛、卤代甲酰基、碳酸酯、羧酸酯、羧基、烷氧碳酰、甲氧基、氢过氧基、过氧基、醚、半缩醛、半缩酮、缩醛、原酸酯、亚甲二氧基、原碳酸酯、羧酸酐、哌啶、吡啶、吡咯烷、噻唑、咪唑、吲哚、四唑、甲酰胺、伯胺、仲胺、叔胺、季胺、伯酮亚胺、仲酮亚胺、伯醛亚胺、仲醛亚胺、酰亚胺、叠氮化物、偶氮、氰酸酯、异氰酸酯、硝酸酯、腈、异腈、亚硝基氧基、硝基、亚硝基、肟、吡啶基、氨基甲酸酯、巯基、硫化物、二硫化物、亚磺酰基、磺酰基、亚磺基、磺基、硫氰酸酯、异硫氰酸酯、硫代碳酰基、硫代羟S-酸、硫代羟O-酸、硫醇酯、硫羰酸酯、碳二硫代酸、碳二硫基、膦基、膦酰基、磷酸酯、卤代、氟、氯、溴、碘、或任何药物样部分或片段。
9.如前述权利要求中任一项所述的方法,其中(i)评估化学化合物降低所述MYC:TRRAP复合物形成和/或阻断所述MYC:TRRAP结合相互作用的能力,所述化学化合物包括或衍生自表1、2、3或4中列出的化学化合物中的一种或多种,任选地其中所述“R”取代基,即R1、R2和R3,在每次出现时独立地选自键、H、取代或未取代的以下项:烷基、烯基、炔基、苯基、羟基、羰基、醛、卤代甲酰基、碳酸酯、羧酸酯、羧基、烷氧碳酰、甲氧基、氢过氧基、过氧基、醚、半缩醛、半缩酮、缩醛、原酸酯、亚甲二氧基、原碳酸酯、羧酸酐、哌啶、吡啶、吡咯烷、噻唑、咪唑、吲哚、四唑、甲酰胺、伯胺、仲胺、叔胺、季胺、伯酮亚胺、仲酮亚胺、伯醛亚胺、仲醛亚胺、酰亚胺、叠氮化物、偶氮、氰酸酯、异氰酸酯、硝酸酯、腈、异腈、亚硝基氧基、硝基、亚硝基、肟、吡啶基、氨基甲酸酯、巯基、硫化物、二硫化物、亚磺酰基、磺酰基、亚磺基、磺基、硫氰酸酯、异硫氰酸酯、硫代碳酰基、硫代羟S-酸、硫代羟O-酸、硫醇酯、硫羰酸酯、碳二硫代酸、碳二硫基、膦基、膦酰基、磷酸酯、卤代、氟、氯、溴、碘、或任何药物样部分或片段,以及(ii)如果它降低所述MYC:TRRAP复合物的形成和/或抑制MYC和TRRAP之间的结合相互作用,则在体外或体内肿瘤模型中,进一步评估其抗肿瘤功效。
10.如前述权利要求中任一项所述的方法,其包括以下中的一项或多项:
(i)从细胞中共同纯化所述MYC:TRRAP复合物以检测所述MYC:TRRAP复合物和/或其量和/或检测所述化合物对所述MYC:TRRAP结合相互作用的影响;
(ii)所述细胞选自人细胞、哺乳动物细胞、昆虫细胞、酵母细胞和细菌细胞;
(iii)所述细胞为HeLa细胞、293细胞或Expi 293细胞;
(iv)从细胞裂解物中对所述MYC:TRRAP复合物进行共免疫沉淀以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(v)所述共免疫沉淀的MYC:TRRAP复合物包含具有第一亲和标签的全长MYC或MYC片段和具有第二亲和标签的全长TRRAP或TRRAP片段,并且其中所述具有第一亲和标签的全长MYC或MYC片段和所述具有第二亲和标签的全长TRRAP或TRRAP片段在所述细胞中共表达;并且所述第一亲和标签和所述第二亲和标签不同;
(vi)所述共免疫沉淀的MYC:TRRAP复合物包含具有第一亲和标签的全长MYC或MYC片段,其中所述具有第一亲和标签的全长MYC或MYC片段在所述细胞中表达并且共免疫沉淀内源性TRRAP;或所述具有第一亲和标签的全长TRRAP或TRRAP片段,其中所述具有第一亲和标签的全长TRRAP或TRRAP片段在所述细胞中表达并且共免疫沉淀内源性MYC;
(vii)所述共免疫沉淀的MYC:TRRAP复合物中的所述第一亲和标签和所述第二亲和标签选自PYO标签和FLAG标签,其中所述第一亲和标签和所述第二亲和标签不同;
(viii)使用抗MYC抗体、抗TRRAP抗体、抗FLAG抗体和/或抗PYO抗体通过蛋白质印迹分析检测所述MYC:TRRAP复合物;
(ix)所述MYC:TRRAP复合物中的所述MYC片段是MYC 1-190片段并且所述TRRAP片段是TRRAP 2033-2283片段;
(x)所述细胞裂解物任选地选自人细胞裂解物、哺乳动物细胞裂解物、昆虫细胞裂解物、酵母细胞裂解物和细菌细胞裂解物;
(xi)所述细胞裂解物是HeLa、HEK293T、293或Expi293细胞裂解物;
(xii)所述体外环境包含蛋白质稳定添加剂,其任选地选自乙二醇(EG)、2,2,2-三氟乙醇(TFE)、和氘代TFE(TFE-d2)、或其任何组合;
(xiii)如果存在的话,所述蛋白质稳定添加剂任选地在所述体外环境中具有约5%(v/v)至约50%(v/v)范围内的浓度;
(xiv)如果存在的话,所述蛋白质稳定添加剂任选地在所述体外环境中具有约20%(v/v)至约30%(v/v)范围内的浓度;
(xv)所述方法包括用以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用的体外下拉测定,任选地其中所述体外下拉测定包括由所述MYC-TRRAP融合物形成的所述MYC:TRRAP复合物,其中所述MYC-TRRAP融合物包含至少一个亲和标签;
(xvi)所述MYC:TRRAP复合物中的所述MYC-TRRAP融合物包含MYC 1-190片段、接头、TRRAP 2033-2088片段、和亲和标签;
(xvii)所述方法包括在所述接头内的蛋白酶切割位点处对所述MYC:TRRAP融合物进行蛋白水解切割,任选地其中所述蛋白酶切割位点是3C蛋白酶切割位点;
(xviii)所述方法包括核磁共振(NMR)测定以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;任选地其中所述NMR测定检测由所述MYC-TRRAP融合物形成的所述MYC:TRRAP复合物,1H,15N-HSQC NMR;和一个或多个指示MYC W135的化学环境的化学位移峰,其中与所述MYC:TRRAP结合相互作用不存在时相比,当所述MYC:TRRAP结合相互作用存在时,所述化学位移峰中至少一个不同;
(xix)所述MYC-TRRAP融合物包含MYC 120-161片段、接头、和TRRAP 2033-2088片段;
(xx)所述方法还包括测量MYC W135的固有荧光以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用,并且其中与所述MYC:TRRAP结合相互作用不存在时相比,当所述MYC:TRRAP结合相互作用存在时,MYC W135的固有荧光不同;
(xxi)所述方法还包括所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用的计算机计算分析;
(xxii)所述基于细胞的蛋白质-片段互补测定是生物分子荧光互补(BiFC)测定;
(xxiii)所述方法包括尺寸排除色谱法以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(xxiv)所述方法包括生物发光共振能量转移(BRET)以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(xxv)所述方法包括使用荧光共振能量转移(FRET)以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(xxvi)所述方法包括荧光极化(FP)和/或荧光各向异性(FA)以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(xxvii)所述方法包括表面等离子体共振(SPR)以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(xxviii)所述方法包括天然聚丙烯酰胺凝胶电泳(PAGE)以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(xxix)所述方法包括使用蛋白质微阵列以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(xxx)所述方法包括使用微流体测定以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(xxxi)所述方法包括使用电子显微术以检测所述MYC:TRRAP复合物和/或所述MYC:TRRAP结合相互作用;
(xxxii)所述方法包括(i)至(xxxi)的任何组合。
11.一种用于产生用于治疗癌症的潜在用途的MYC:TRRAP复合物抑制剂化合物的方法,其包括:
(i)任选地通过如前述权利要求中任一项所述的方法鉴定MYC和TRRAP之间的结合相互作用的抑制剂;
(ii)任选地衍生所鉴定的抑制剂以产生衍生抑制剂并且测试所衍生抑制剂抑制MYC和TRRAP之间的结合相互作用的能力;以及
(iii)在体外和/或体内肿瘤模型中,测试MYC和TRRAP相互作用的抑制剂或所鉴定抑制剂的衍生物治疗癌症或杀死肿瘤细胞的能力。
12.一种用于治疗患有至少一种癌症或初癌的受试者或任选地因为遗传风险因素、既往癌症和/或与癌症相关的生物标记物的表达而癌症风险增加的受试者的方法,其包括向所述受试者施用治疗有效量的化学化合物,其中所述化学化合物已被鉴定为MYC和TRRAP之间的结合相互作用的抑制剂,任选地通过如前述权利要求中任一项所述。
13.如前述权利要求中任一项所述的方法,其中所述受试者是选自啮齿动物、非人灵长类动物和人的哺乳动物,优选人。
14.一种用于治疗患有至少一种癌症或初癌的受试者或任选地因为遗传风险因素、既往癌症和/或与癌症相关的生物标记物的表达而癌症风险增加的受试者的方法,其包括向所述受试者施用治疗有效量的化学化合物,其中所述化学化合物已被鉴定为MYC和TRRAP之间的结合相互作用的抑制剂和/或选自表1、2、4或5中任一个所示的化合物中的任一种或具有表1、2、4或5中任一个所示的化合物中任一种的通用结构和/或包含其衍生物,任选地其中“R”取代基,即R1、R2和R3,在每次出现时选自键、H、取代或未取代的以下项:烷基、烯基、炔基、苯基、羟基、羰基、醛、卤代甲酰基、碳酸酯、羧酸酯、羧基、烷氧碳酰、甲氧基、氢过氧基、过氧基、醚、半缩醛、半缩酮、缩醛、原酸酯、亚甲二氧基、原碳酸酯、羧酸酐、哌啶、吡啶、吡咯烷、噻唑、咪唑、吲哚、四唑、甲酰胺、伯胺、仲胺、叔胺、季胺、伯酮亚胺、仲酮亚胺、伯醛亚胺、仲醛亚胺、酰亚胺、叠氮化物、偶氮、氰酸酯、异氰酸酯、硝酸酯、腈、异腈、亚硝基氧基、硝基、亚硝基、肟、吡啶基、氨基甲酸酯、巯基、硫化物、二硫化物、亚磺酰基、磺酰基、亚磺基、磺基、硫氰酸酯、异硫氰酸酯、硫代碳酰基、硫代羟S-酸、硫代羟O-酸、硫醇酯、硫羰酸酯、碳二硫代酸、碳二硫基、膦基、膦酰基、磷酸酯、卤代、氟、氯、溴、碘、或任何药物样部分或片段,已确定所述衍生物抑制MYC和TRRAP之间的结合相互作用。
15.如前述权利要求中任一项所述的治疗方法,其中所述受试者是人。
16.如前述权利要求中任一项所述的治疗方法,其中所述至少一种癌症选自以下中的一种或多种:腺组织中的腺癌、器官胚胎组织中的胚细胞瘤、上皮组织中的癌、形成血细胞的组织中的白血病、淋巴组织中的淋巴瘤、骨髓中的骨髓瘤、结缔或支持组织中的肉瘤、肾上腺癌、AIDS相关淋巴瘤、卡波西肉瘤、膀胱癌、骨癌、脑癌、乳腺癌、类癌瘤、宫颈癌、化疗抗性癌症、结肠癌、子宫内膜癌、食道癌、胃癌、头癌、颈癌、肝胆管癌、肾癌、白血病、肝癌、肺癌、淋巴瘤、霍奇金病、非霍奇金淋巴瘤、转移癌、神经系统肿瘤、口腔癌、卵巢癌、胰腺癌、前列腺癌、直肠癌、皮肤癌、胃部癌症、睾丸癌、甲状腺癌、尿道癌、骨髓癌、多发性骨髓瘤、转移到骨的肿瘤、浸润神经和中空内脏的肿瘤以及神经结构附近的肿瘤。
17.一种用作MYC和TRRAP之间的结合相互作用的抑制剂的化学化合物,其中所述化学化合物选自表1、表2、表4或表5中列出的化学化合物和/或具有表1、表2、表4或表5中所示的通用核心结构,任选地其中其“R”取代基,即R1、R2和R3,在每次出现时独立地选自键、H、取代或未取代的以下项:烷基、烯基、炔基、苯基、羟基、羰基、醛、卤代甲酰基、碳酸酯、羧酸酯、羧基、烷氧碳酰、甲氧基、氢过氧基、过氧基、醚、半缩醛、半缩酮、缩醛、原酸酯、亚甲二氧基、原碳酸酯、羧酸酐、哌啶、吡啶、吡咯烷、噻唑、咪唑、吲哚、四唑、甲酰胺、伯胺、仲胺、叔胺、季胺、伯酮亚胺、仲酮亚胺、伯醛亚胺、仲醛亚胺、酰亚胺、叠氮化物、偶氮、氰酸酯、异氰酸酯、硝酸酯、腈、异腈、亚硝基氧基、硝基、亚硝基、肟、吡啶基、氨基甲酸酯、巯基、硫化物、二硫化物、亚磺酰基、磺酰基、亚磺基、磺基、硫氰酸酯、异硫氰酸酯、硫代碳酰基、硫代羟S-酸、硫代羟O-酸、硫醇酯、硫羰酸酯、碳二硫代酸、碳二硫基、膦基、膦酰基、磷酸酯、卤代、氟、氯、溴、碘、或任何药物样部分或片段。
18.如前述权利要求中任一项所述的化学化合物,其中所述化学化合物是
Figure FDA0003774183660000061
19.如前述权利要求中任一项所述的化学化合物,其中所述化学化合物是在表1、2、4或5中列出的化学化合物的衍生物,任选地其中所述“R”取代基,即R1、R2和R3,在每次出现时任选地选自键、H、取代或未取代的以下项:烷基、烯基、炔基、苯基、羟基、羰基、醛、卤代甲酰基、碳酸酯、羧酸酯、羧基、烷氧碳酰、甲氧基、氢过氧基、过氧基、醚、半缩醛、半缩酮、缩醛、原酸酯、亚甲二氧基、原碳酸酯、羧酸酐、哌啶、吡啶、吡咯烷、噻唑、咪唑、吲哚、四唑、甲酰胺、伯胺、仲胺、叔胺、季胺、伯酮亚胺、仲酮亚胺、伯醛亚胺、仲醛亚胺、酰亚胺、叠氮化物、偶氮、氰酸酯、异氰酸酯、硝酸酯、腈、异腈、亚硝基氧基、硝基、亚硝基、肟、吡啶基、氨基甲酸酯、巯基、硫化物、二硫化物、亚磺酰基、磺酰基、亚磺基、磺基、硫氰酸酯、异硫氰酸酯、硫代碳酰基、硫代羟S-酸、硫代羟O-酸、硫醇酯、硫羰酸酯、碳二硫代酸、碳二硫基、膦基、膦酰基、磷酸酯、卤代、氟、氯、溴、碘、或任何药物样部分或片段。
20.一种组合物,其包含如前述权利要求中任一项所述的化学化合物和药学上合适的载体。
21.一种用于治疗患有至少一种癌症或初癌的受试者或任选地因为遗传风险因素、既往癌症和/或与癌症相关的生物标记物的表达而癌症风险增加的受试者的方法,所述方法包括施用治疗有效量的如前述权利要求中任一项所述的化学化合物,任选地其中所述化学化合物包含在表1、2、4或5中列出的化学化合物中或者是表1、2、4或5中列出的化学化合物的衍生物,任选地其中“R”取代基,即R1、R2和R3,在每次出现时选自键、H、取代或未取代的以下项:烷基、烯基、炔基、苯基、羟基、羰基、醛、卤代甲酰基、碳酸酯、羧酸酯、羧基、烷氧碳酰、甲氧基、氢过氧基、过氧基、醚、半缩醛、半缩酮、缩醛、原酸酯、亚甲二氧基、原碳酸酯、羧酸酐、哌啶、吡啶、吡咯烷、噻唑、咪唑、吲哚、四唑、甲酰胺、伯胺、仲胺、叔胺、季胺、伯酮亚胺、仲酮亚胺、伯醛亚胺、仲醛亚胺、酰亚胺、叠氮化物、偶氮、氰酸酯、异氰酸酯、硝酸酯、腈、异腈、亚硝基氧基、硝基、亚硝基、肟、吡啶基、氨基甲酸酯、巯基、硫化物、二硫化物、亚磺酰基、磺酰基、亚磺基、磺基、硫氰酸酯、异硫氰酸酯、硫代碳酰基、硫代羟S-酸、硫甲O-酸、硫醇酯、硫羰酸酯、碳二硫代酸、碳二硫基、膦基、膦酰基、磷酸酯、卤代、氟、氯、溴、碘、或任何药物样部分或片段。
22.如前述权利要求中任一项所述的方法,其中所述受试者是选自啮齿动物、非人灵长类动物和人的哺乳动物。
23.如前述权利要求中任一项所述的方法,其中所述受试者是人。
24.如前述权利要求中任一项所述的方法,其中所述至少一种癌症选自以下中的一种或多种:腺组织中的腺癌、器官胚胎组织中的胚细胞瘤、上皮组织中的癌、形成血细胞的组织中的白血病、淋巴组织中的淋巴瘤、骨髓中的骨髓瘤、结缔或支持组织中的肉瘤、肾上腺癌、AIDS相关淋巴瘤、卡波西肉瘤、膀胱癌、骨癌、脑癌、乳腺癌、类癌瘤、宫颈癌、化疗抗性癌症、结肠癌、子宫内膜癌、食道癌、胃癌、头癌、颈癌、肝胆管癌、肾癌、白血病、肝癌、肺癌、淋巴瘤、霍奇金病、非霍奇金淋巴瘤、转移癌、神经系统肿瘤、口腔癌、卵巢癌、胰腺癌、前列腺癌、直肠癌、皮肤癌、胃部癌症、睾丸癌、甲状腺癌、尿道癌、骨髓癌、多发性骨髓瘤、转移到骨的肿瘤、浸润神经和中空内脏的肿瘤以及神经结构附近的肿瘤。
CN202080095193.7A 2019-12-02 2020-12-02 Myc癌基因的靶向mb2及其与癌症中的trrap的相互作用 Pending CN115461475A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962942734P 2019-12-02 2019-12-02
US62/942,734 2019-12-02
PCT/US2020/062870 WO2021113347A1 (en) 2019-12-02 2020-12-02 Targeting mb2 of the myc oncogene and its interaction with trrap in cancer

Publications (1)

Publication Number Publication Date
CN115461475A true CN115461475A (zh) 2022-12-09

Family

ID=76221964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080095193.7A Pending CN115461475A (zh) 2019-12-02 2020-12-02 Myc癌基因的靶向mb2及其与癌症中的trrap的相互作用

Country Status (5)

Country Link
US (1) US20230044407A1 (zh)
EP (1) EP4065160A4 (zh)
CN (1) CN115461475A (zh)
CA (1) CA3159980A1 (zh)
WO (1) WO2021113347A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116908444A (zh) * 2023-09-13 2023-10-20 中国医学科学院北京协和医院 血浆max自身抗体在晚期非小细胞肺癌pd-1单抗联合化疗治疗预后预测中的应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023028508A2 (en) * 2021-08-25 2023-03-02 Trustees Of Dartmouth College Myc:trrap inhibitors and uses thereof

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050186604A1 (en) * 2004-01-27 2005-08-25 Southern Methodist University Aberrant Myc/TIP60 interactions as a target for anti-cancer therapeutics
EP1595945A1 (en) * 2004-05-14 2005-11-16 Boehringer Ingelheim International GmbH Screening method for identifying compounds that have the ability to inhibit the activity of Myc
WO2008023840A2 (en) * 2006-08-25 2008-02-28 Oncotherapy Science, Inc. Prognostic markers and therapeutic targets for lung cancer
US9567301B2 (en) * 2012-11-02 2017-02-14 Dana-Farber Cancer Institute, Inc. Pyrrol-1-yl benzoic acid derivatives useful as myc inhibitors
US9884047B1 (en) * 2017-06-26 2018-02-06 Macau University Of Science And Technology Method of treating lung cancer

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116908444A (zh) * 2023-09-13 2023-10-20 中国医学科学院北京协和医院 血浆max自身抗体在晚期非小细胞肺癌pd-1单抗联合化疗治疗预后预测中的应用
CN116908444B (zh) * 2023-09-13 2023-12-19 中国医学科学院北京协和医院 血浆max自身抗体在晚期非小细胞肺癌pd-1单抗联合化疗治疗预后预测中的应用

Also Published As

Publication number Publication date
EP4065160A1 (en) 2022-10-05
EP4065160A4 (en) 2024-04-03
US20230044407A1 (en) 2023-02-09
WO2021113347A1 (en) 2021-06-10
CA3159980A1 (en) 2021-06-10

Similar Documents

Publication Publication Date Title
US9810690B2 (en) Method for screening inhibitors of Ras
Pearl et al. The Hsp90 molecular chaperone: an open and shut case for treatment
White et al. Peptide library approach to uncover phosphomimetic inhibitors of the BRCA1 C-terminal domain
US10562945B2 (en) Specific active site inhibitors of enzymes or substrate binding partners and methods of producing same
CN115461475A (zh) Myc癌基因的靶向mb2及其与癌症中的trrap的相互作用
Mackie et al. Selective peptidomimetic inhibitors of NTMT1/2: rational design, synthesis, characterization, and crystallographic studies
US20030059917A1 (en) PAS kinase
Wei et al. Phosphorylation-regulated HMGA1a-P53 interaction unveils the function of HMGA1a acidic tail phosphorylations via synthetic proteins
Aboualizadeh et al. Mapping the phospho-dependent ALK interactome to identify novel components in ALK signaling
JP2003532428A (ja) 抗癌剤をスクリーニングするための酵素的アッセイ
EP2329264B1 (en) Method for determining sumoylation
AU2003270848A1 (en) Identification of kinase inhibitors
EP4172172A1 (en) Cross-linking methods
Zhou Profiling Substrate Proteins of Ring and RBR type E3 ligases by Orthogonal Ubiquitin Transfer and the Development of a Peptide Activator Targeting HECT-type E3 ligase
Chuong Inhibiting Smurf1: Biological and Mechanistic Approach
Serrano PCAF, SIRT1 and the regulation of substrate acetylation
Chen Understanding substrate recruitment by BTB-Kelch family E3 ligases
Ngow Structural characterization of vaccinia-related kinase 1 (VRK1), a histone mitotic kinase
Wesley Characterization of Chromatin Interactions using TR-FRET
Feris TRRAPing MYC: Aiming at a Moving Target
Kesavan Chemical Biology Strategies for the Control of Protein Function and the Interrogation of Cyclin/CDK Interactions
He A Novel Intramolecular Interaction in P53
Chen DECIPHERING THE ROLE OF⍺-N-TERMINAL METHYLATION IN MODULATING YEAST PROTEIN FUNCTION INCLUDING THE MULTITASKING STRESS RESPONSE PROTEIN, HSP31
Shi Peptide substrate-assisted study of O-GlcNAc transferase and O-GlcNAcylation
Cuijpers Regulation of cell cycle progression by small ubiquitin-like modifiers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination