CN113164622A - 通过调节凝聚物来调节基因转录的方法和测定 - Google Patents

通过调节凝聚物来调节基因转录的方法和测定 Download PDF

Info

Publication number
CN113164622A
CN113164622A CN201980034629.9A CN201980034629A CN113164622A CN 113164622 A CN113164622 A CN 113164622A CN 201980034629 A CN201980034629 A CN 201980034629A CN 113164622 A CN113164622 A CN 113164622A
Authority
CN
China
Prior art keywords
coacervate
aggregate
factor
component
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980034629.9A
Other languages
English (en)
Inventor
理查德·A·杨
菲利普·A·夏普
奥鲁普·K·查克拉博蒂
亚历山德拉·达尔阿涅塞
克里希纳·什里尼瓦斯
布莱恩·J·亚伯拉罕
安·博伊亚
艾略特·科菲
丹尼尔·S·戴
阳·E·郭
南希·M·汉内特
彤·艾恩·里
查尔斯·H·里
艾萨克·克莱因
约翰·C·曼特加
本杰明·R·萨巴里
朱里恩·舒伊杰斯
亚伯拉罕·S·温特劳布
艾丽西亚·V·扎穆迪奥
莉娜·K·阿费扬
奥兹古尔·奥克苏兹
乔纳森·E·亨宁格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Whitehead Institute for Biomedical Research
Massachusetts Institute of Technology
Original Assignee
Whitehead Institute for Biomedical Research
Massachusetts Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Whitehead Institute for Biomedical Research, Massachusetts Institute of Technology filed Critical Whitehead Institute for Biomedical Research
Publication of CN113164622A publication Critical patent/CN113164622A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/531Production of immunochemical test materials
    • G01N33/532Production of labelled immunochemicals
    • G01N33/535Production of labelled immunochemicals with enzyme label or co-enzymes, co-factors, enzyme inhibitors or enzyme substrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Epidemiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本文描述通过调节凝聚物形成、组成、维持、溶解和调控来调节基因调控的组合物和方法。

Description

通过调节凝聚物来调节基因转录的方法和测定
相关申请
本申请要求2018年3月23日提交的美国临时申请号62/647,613、2018年3月26日提交的美国临时申请号62/648,377、2018年8月24日提交的美国临时申请号62/722,825、2018年10月29日提交的美国临时申请号62/752,332;2019年3月17日提交的美国临时申请号62/819,662和2019年3月18日提交的美国临时申请号62/820,237的权益,所有所述美国临时申请的内容均由此以引用的方式整体并入。
政府支持
本发明在政府支持下以由美国国家卫生研究院(National Institutes ofHealth)授权的授权号HG002668、CA042063、T32CA009172、GM117370、GM008759和GM123511和由美国国家科学基金会(National Science Foundation)授权的授权号1743900进行。美国政府享有本发明的某些权利。
发明背景
基因表达的调控需要转录装置有效地被募集至特定基因组位点。DNA结合转录因子(TF)通过在增强子和启动子近端元件处占据特定DNA序列并且募集转录机构至这些位点处来确保这一特异性。TF典型地由一个或多个DNA结合域(DBD)和一个或多个独立活化域(AD)组成。虽然TF DBD的结构和功能得到充分证明,但对于AD的结构和这些域如何与共活化子相互作用以驱动基因表达的了解相当少。
TF DBD的结构和其与同源DNA序列的相互作用已在原子分辨率下针对多种TF加以描述,并且TF一般根据其DBD的结构特征进行分类。例如,DBD可由锌-配位、碱性螺旋-环-螺旋、碱性-白氨酸拉链或螺旋-转角-螺旋DNA-结合结构组成。这些DBD选择性地结合介于大约4-12bp范围内的特定DNA序列,并且受到数百种TF青睐的DNA结合序列已经得到描述。多种不同TF分子典型地在任一种增强子或启动子近端元件处结合在一起。例如,至少八种不同TF分子结合IFN-β增强子的50bp核心组分(Panne等人,2007)。
由DBD锚定于适当位置中,AD与共活化子相互作用,所述共活化子整合来自多种TF的信号以调控转录输出。与结构化DBD形成对比,大多数TF的AD是无法顺从结晶学的低复杂度氨基酸序列。这些固有无序区或域(IDR)因此已通过其氨基酸概况分类为酸性、富脯氨酸、富丝氨酸/苏氨酸或富谷酰胺;或通过其假设形状分类为酸斑、阴性长链或肽套索(Hahn和Young,2011;Mitchell和Tjian,1989;Roberts,2000;Sigler,1988;Staby等人,2017;Triezenberg,1995)。出乎意料地,数百种TF被认为与同一小集合的共活化子复合物相互作用,所述共活化子复合物尤其包括介体和p300。在TF当中,共享很少序列同源性的AD是功能上可互换的;这一可互换性无法由蛋白质-蛋白质相互作用的传统锁钥模型容易地解释。因此,数百种不同TF的不同活化域如何与相似小集合的共活化子相互作用仍为一个难题。
增强子是由转录因子和转录装置中用于调控细胞类型特异性基因的表达的其他组分结合的基因调控元件。超级增强子(SE)是由异常高密度的转录装置占据的增强子的团簇,其调控在细胞身份中具有尤其重要作用的基因。
果蝇中的开创性遗传学研究显示,转录因子和信号传导因子在发育的控制中发挥根本上重要作用。多项后续研究已产生如下理解,即定义各细胞的身份的基因表达程序由以下控制:谱系和细胞类型特异性主要TF,其建立细胞类型特异性增强子;和信号传导因子,其携带细胞外信息至这些增强子。
转分化和重编程实验的结果主张少量主要TF支配细胞类型特异性基因表达的控制。尽管数百种TF在各细胞类型中表达,仅必需少数使细胞获得新身份,如通过TF MyoD将细胞转分化成肌肉样细胞的能力(Weintraub等人(1989)Proc.Natl.Acad.Sci.86,5434–5438)和TF Oct4、Nanog、Klf4和Myc将纤维母细胞重编程成诱导性多能干细胞的能力(Takahashi等人(2006)Cell 126,663–676所证明。这些主要TF通过在细胞身份中具有突出作用的基因处建立增强子和通常增强子的团簇(称作超级增强子)来支配基因表达程序的控制。
细胞依赖于信号传导途径来维持其身份和响应细胞外环境。在哺乳动物发育过程的控制中发挥突出作用的信号传导途径包括WNT、TGF-β和JAK/STAT途径。在这些途径中的每一者中,细胞外配体由特异性受体识别,所述特异性受体转导通过其他蛋白质的信号至信号传导因子的集合,所述信号传导因子进入细胞核并且结合于基因组中的信号反应元件。在给定细胞类型中,这些信号传导因子结合于大量推定信号反应元件的小子集,所述小子集青睐于结合存在于那一细胞类型的活性增强子中的那些,因此允许针对在广泛细胞类型中表达的信号传导因子的细胞类型特异性反应。
由RNA聚合酶II(Pol II)合成mRNA前体涉及转录起始复合物的形成和转变为延伸复合物。Pol II的大的亚单元含有固有无序C端域(CTD),所述域在起始-延伸转变期间通过细胞周期素依赖性激酶(CDK)磷酸化,因此影响CTD与起始或RNA剪切装置的不同组分的相互作用。近期观察结果表明,这一模型仅提供CTD磷酸化的效应的部分图片。
染色质一般分类为以下分类:常染色质,其不太紧致并且富基因;和异染色质,其高度紧致并且贫基因1。组成性异染色质在如卫星DNA和转座子的重复元件处组装。异染色质在抑制重复元件之间的重组、限制活性转座子的转录、结构化着丝粒DNA和抑制跨发育谱系的基因表达中发挥重要作用。
需要进一步研究以阐明如与TF和信号传导因子的多样性相关,以及针对异染色质和在mRNA起始和延伸期间的基因表达控制的机制。
发明内容
本文所述的工作已鉴定出具有多种组分并且包括天然存在的凝聚物(condensate)和合成或人工凝聚物两者的凝聚物的存在和效用。本文描述凝聚物和其组分、鉴定调节凝聚物结构和功能的剂的方法和针对治疗效应调节凝聚物功能/活性的方法,以及其他相关组合物和方法。
一般来说,本公开涉及转录凝聚物、异染色质凝聚物和与mRNA起始或延伸复合物物理缔合的凝聚物的调节、形成和用途。本公开还涉及如下发现,即核受体、信号传导因子和甲基-DNA结合因子相互作用并且修饰凝聚物。如由以下描述应显而易知,凝聚物可通过例如修饰凝聚物的组分的类型、量或属性或用剂调节。将凝聚物用于筛选方法会提供一种用于发现治疗剂的适用工具,其可更精确地反映细胞内基因表达控制。
转录凝聚物是出现于转录位点处的相分离的多分子组装体并且是多种组分的高密度协作组装体,所述组分可包括转录因子、辅因子、染色质调控因子、DNA、非编码RNA、新生RNA和RNA聚合酶II(图1)。在一些情况下,转录凝聚物通过超级增强子组装体形成。多种疾病通过这些核酸和蛋白质组分的改变引起或与其相关,并且治疗介入可通过改变凝聚物的转录输出来提供。如本文所用,“异染色质凝聚物”是与异染色质物理缔合(例如,出现于其上)的相分离的多分子组装体。在本发明的一些方面,描述与mRNA起始或延伸复合物物理缔合的凝聚物。如本文所用,这些凝聚物(即,与mRNA起始或延伸复合物物理缔合的凝聚物)是出现于相关复合物处的相分离的多分子组装体。在一些实施方案中,与延伸复合物物理缔合的凝聚物包含剪切因子。如本文所用,合成转录凝聚物是指包含转录凝聚物组分的非天然存在的凝聚物。
本文所述的结果部分地支持如下模型,其中转录因子与介体相互作用并且通过其活化域与这一共活化子形成相分离凝聚物的能力活化基因。与共活化子形成相分离凝聚物的这一过程在包括自身免疫、癌症和神经变性在内的多种疾病中受到扰乱。例如,恶性转化可在其他过程中通过以下发生:不适当地活化细胞生存或增生途径的融合致癌转录因子的产生、未在正常组织中表达的转录因子的不适当产生或募集转录因子至先前沉默致癌基因的增强子区的突变。扰乱这些活化域或凝聚物的其他组分的功能会提供中断转录因子的活性的机制。
本文尤其描述如下疾病,其可涉及通过增强或减少转录凝聚物形成、组成、维持、溶解和调控来调节转录的凝聚物、测定和方法。在一些方面,转录凝聚物包含核受体,例如在同源配体不存在下活化转录的核激素受体或突变型核激素受体。在一些方面,凝聚物(例如,转录异染色质和/或与mRNA起始或延伸复合物物理缔合的凝聚物)包含信号传导因子、甲基-DNA结合蛋白(例如,甲基CpG结合蛋白)、基因沉默因子(例如,抑制因子、抑制性异染色质因子)、RNA聚合酶(例如,Pol II、磷酸化Pol II、脱磷酸化Pol II)或剪切因子。本发明的一些方面涉及通过施用调节凝聚物形成、组成、维持、溶解、活性或调控的剂来治疗疾病和疾患。在本文所述方法的一些实施方案中,并未知晓所施用的剂是否适用于治疗靶向疾病。
本发明的一些方面针对一种调节一种或多种基因(例如,细胞中的一种或多种基因)的转录的方法,所述方法包括调节与所述一种或多种基因缔合的凝聚物(例如,转录凝聚物)的形成、组成、维持、溶解、活性和/或调控。在一些实施方案中,所述凝聚物(例如,转录凝聚物)通过增加或减少与所述凝聚物缔合的组分的价态来调节。
如本文所用,短语“与凝聚物缔合的组分”等和短语“凝聚物组分”等是指肽、蛋白质、核酸、信号传导分子、脂质等,其为凝聚物的一部分或具有作为凝聚物(例如,转录凝聚物)的一部分的能力。在一些实施方案中,所述组分在所述凝聚物内。在一些实施方案中,所述组分在所述凝聚物的表面上。在一些实施方案中,所述组分是凝聚物形成或稳定性所必需。在一些实施方案中,所述组分并非凝聚物形成或稳定性所必需。在一些实施方案中,所述组分是蛋白质或肽并且包含一个或多个固有有序域(例如,转录因子的活化域的IDR、与转录因子的活化域的IDR相互作用的IDR、信号传导因子的IDR、甲基-DNA结合蛋白的IDR、基因沉默因子的IDR、聚合酶的IDR、剪切因子的IDR)。在一些实施方案中,所述组分是凝聚物的非结构成员(例如,非凝聚物完整性所必需)并且有时被称作客户组分。在一些实施方案中,凝聚物包含1、2、3、4、5、6、7、8、9、10种或更多种组分,由其组成,或基本上由其组成。在一些实施方案中,凝聚物(例如,合成转录凝聚物(合成转录凝聚物有时在本文中被称作“人工凝聚物”)不包含核酸。在一些实施方案中,凝聚物(例如,合成转录凝聚物)不包含RNA。在一些实施方案中,所述组分是蛋白质或核酸的片段。
在一些实施方案中,所述组分是选自由DNA序列(例如,增强子DNA序列、甲基化DNA序列、超级增强子DNA序列、转录基因的3’末端、信号反应元件、激素反应元件)、转录因子、基因沉默因子、剪切因子、延伸因子、起始因子、组蛋白(例如,修饰的组蛋白)、辅因子、RNA(例如,ncRNA)、介体和RNA聚合酶(例如,RNA聚合酶II)组成的组。在一些实施方案中,所述辅因子包含LXXLL基序。在一些实施方案中,所述辅因子包含LXXLL基序并且当结合于配体(例如,同源配体、天然存在的配体、合成配体)时,关于TF(例如,核受体、主转录因子)具有增加的价态。具有LXXLL基序的辅因子是本领域中已知的。在一些实施方案中,所述组分是包含IDR和LXXLL基序的辅因子的片段。在一些实施方案中,所述组分并非核受体配体。在一些实施方案中,所述组分并非脂质。在一些实施方案中,所述组分是蛋白质或核酸。
在一些实施方案中,所述凝聚物通过使所述凝聚物接触与所述凝聚物的组分的一个或多个固有无序域相互作用的剂来调节。在一些实施方案中,与所述剂接触的所述凝聚物的组分是信号传导因子、甲基-DNA结合蛋白、基因沉默因子、RNA聚合酶、剪切因子、BRD4、介体、介体组分、MED1、MED15、转录因子、RNA聚合酶或核受体配体(例如,激素)。在一些实施方案中,所述组分是列于表S1中的蛋白质。
在一些实施方案中,与所述剂接触的所述凝聚物的组分是选自由TCF7L2、TCF7、TCF7L1、LEF1、β-连环蛋白、SMAD2、SMAD3、SMAD4、STAT1、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6和NF-κB组成的组的信号传导因子。在一些实施方案中,所述信号传导因子包含一个或多个固有无序域。在一些实施方案中,所述信号传导因子优先地结合于与所述凝聚物缔合的一种或多种信号反应元件或介体。在一些实施方案中,所述凝聚物包含主转录因子。
在一些实施方案中,与所述剂接触的所述凝聚物的组分是优先地结合于甲基化DNA的甲基-DNA结合蛋白。在一些实施方案中,所述甲基-DNA结合蛋白是MECP2、MBD1、MBD2、MBD3或MBD4。在一些实施方案中,所述甲基-DNA结合蛋白与基因沉默相关。在一些实施方案中,所述组分是与异染色质缔合的抑制因子。在一些实施方案中,所述甲基-DNA结合蛋白是HP1α、TBL1R(转导蛋白β样蛋白)、HDAC3(组蛋白脱乙酰基酶3)或SMRT(视黄酸和甲状腺受体的沉默介体)。
在一些实施方案中,与所述剂接触的所述凝聚物的组分是与mRNA起始和延伸相关的RNA聚合酶。在一些实施方案中,所述RNA聚合酶是RNA聚合酶II或RNA聚合酶II C端区。在一些实施方案中,所述RNA聚合酶II C端区包含固有无序区(IDR)。在一些实施方案中,所述IDR包含磷酸化位点。在一些实施方案中,所述组分是选自SRSF2、SRRM1或SRSF1的剪切因子。
在一些实施方案中,与所述剂接触的所述凝聚物的组分是转录因子。在一些实施方案中,所述转录因子是OCT4、p53、MYC或GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子或核受体(例如,核激素受体、雌激素受体、视黄酸受体-α)。在本文所公开的方法的一些实施方案中,所述转录因子是Lambert等人,Cell.2018年2月8日;172(4):650-665中鉴定的人类转录因子。在一些实施方案中,所述核受体当结合于同源配体时活化转录。在一些实施方案中,所述核受体是在同源配体不存在下活化转录,或在同源配体不存在下具有高于天然配体(例如,同源配体)存在下的野生型核受体的转录活性水平(例如,至少1.5倍、至少2倍、至少3倍或更多倍)的突变型核受体。在一些实施方案中,所述核受体是在同源配体存在下调节转录至不同于野生型核受体的程度的突变型核转录因子。在一些实施方案中,所述转录因子是融合致癌转录因子或公开于表S3中的转录因子。在一些实施方案中,所述融合致癌转录因子是选自MLL-重排、EWS-FLI、ETS融合物、BRD4-NUT和NUP98融合物。所述致癌转录因子可以是本领域中鉴定的任何致癌转录因子。
在一些实施方案中,与所述凝聚物的组分的一个或多个固有无序域相互作用的剂是或包含肽、核酸或小分子。在一些实施方案中,所述剂包含富集酸性氨基酸的肽(例如,具有净负电荷的肽、富集谷氨酸和/或天冬氨酸的肽)。在一些实施方案中,所述剂是信号传导因子模拟物。在一些实施方案中,所述剂是信号传导因子拮抗剂。在一些实施方案中,所述剂包含低磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。在一些实施方案中,所述剂优先地结合低磷酸化Pol II CTD。在一些实施方案中,所述剂结合甲基化DNA。在一些实施方案中,所述剂结合甲基-DNA结合蛋白。
在一些实施方案中,与所述剂接触会使所述凝聚物稳定化或溶解,由此调节所述一种或多种基因的转录。在一些实施方案中,所述凝聚物通过调节与所述凝聚物缔合的转录因子与所述凝聚物的组分(例如,并非转录因子的与所述凝聚物缔合的组分)的结合来调节。在一些实施方案中,所述凝聚物的组分是共活化子、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶或辅因子。在一些实施方案中,所述凝聚物的组分是核受体配体或信号传导因子。在一些实施方案中,所述共活化子、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶或辅因子是介体、介体组分、MED1、MED15、p300、BRD4、β-连环蛋白、STAT3、SMAD3、NF-kB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1或TFIID。在一些实施方案中,所述核受体配体是激素。在一些实施方案中,所述转录因子是OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子。在一些实施方案中,所述转录因子与所述凝聚物的组分的结合通过使所述转录因子或所述凝聚物与剂(例如,肽、核酸或小分子)接触来调节。在一些实施方案中,所述转录因子与所述凝聚物的组分的结合通过使所述转录因子的活化域(例如,所述活化域的IDR)与剂(例如,肽、核酸或小分子)接触来调节。
在一些实施方案中,所述转录凝聚物通过调节配体与作为转录凝聚物的一部分或能够作为转录凝聚物的一部分的核受体的结合来调节。在一些实施方案中,所述配体是激素(例如,雌激素)。在一些实施方案中,所述配体的结合用剂(例如,肽、核酸或小分子)调节。在一些实施方案中,所述转录凝聚物通过调节核受体与所述转录凝聚物的组分的结合来调节。在一些实施方案中,所述转录凝聚物的组分是共活化子、辅因子或核受体配体(例如,激素)。在一些实施方案中,所述共活化子、辅因子或核受体配体是介体组分或激素。在一些实施方案中,所述核受体(例如,突变型核受体)在不结合于同源配体的情况下活化转录。在一些实施方案中,所述核受体与所述组分的缔合用剂调节。在一些实施方案中,凝聚物的转录活性通过调节核受体与另一凝聚物组分(例如,介体组分)的结合来调节。
在一些实施方案中,所述凝聚物(例如,转录凝聚物)通过调节信号传导因子与所述转录凝聚物的组分的结合来调节。在一些实施方案中,所述组分是介体、介体组分或转录因子。在一些实施方案中,所述凝聚物与超级增强子缔合。在一些实施方案中,调节所述凝聚物会调节一种或多种致癌基因的表达。在一些实施方案中,所述信号传导因子与致癌信号传导途径缔合。在一些实施方案中,所述凝聚物包含异常水平的信号传导因子(即,如与健康或非抗性细胞相比增加或减少水平的信号传导因子)。
在一些实施方案中,所述凝聚物通过调节甲基-DNA结合蛋白与所述凝聚物的组分或与甲基化DNA的结合来调节。在一些实施方案中,所述凝聚物通过调节基因沉默因子与所述凝聚物的组分的结合来调节。在一些实施方案中,所述凝聚物通过调节RNA聚合酶与所述转录因子的组分的结合来调节。在一些实施方案中,所述凝聚物通过调节剪切因子与所述转录因子的组分的结合来调节。
在一些实施方案中,所述凝聚物通过调节与所述凝聚物缔合的组分(例如,客户组分、非结构组分)的量来调节。在一些实施方案中,所述组分(例如,转录组分)是一种或多种转录辅因子和/或转录因子(例如,信号传导因子)和/或核受体配体(例如,激素)。在一些实施方案中,所述组分是介体、介体组分、MED1、MED15、p300、BRD4、TFIID、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1或激素。在一些实施方案中,所述组分可以是介体、介体组分、MED1、MED15、p300、BRD4、TFIID或核受体配体。在一些实施方案中,所述组分是转录因子(例如,OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子)。
在一些实施方案中,与所述凝聚物缔合的组分的量通过与降低或消除所述组分与所述凝聚物所缔合的其他组分之间的相互作用的剂接触来调节。在一些实施方案中,所述剂靶向与所述凝聚物缔合的组分的相互作用域。在一些实施方案中,所述相互作用域是固有无序域或区(IDR)。在一些实施方案中,所述IDR是在转录因子的活化域中。
在一些实施方案中,调节所述凝聚物(例如,转录凝聚物)会调节一种或多种信号传导途径。在一些实施方案中,所述信号传导途径促进疾病发病机理(例如,癌症发病机理)。在一些实施方案中,所述信号传导途径涉及激素信号传导。在一些实施方案中,所述信号传导途径包含作为所述凝聚物的组分的信号传导因子。在一些实施方案中,所述信号传导因子是选自由TCF7L2、TCF7、TCF7L1、LEF1、β-连环蛋白、SMAD2、SMAD3、SMAD4、STAT1、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6和NF-κB组成的组。在一些实施方案中,所述信号传导途径涉及核受体(例如,核激素受体)。在一些实施方案中,调节所述凝聚物会调节所述凝聚物与一种或多种核孔蛋白之间的相互作用。在一些实施方案中,所述凝聚物与所述一种或多种核孔蛋白之间的相互作用的调节可调节核信号传导、mRNA输出和/或mRNA翻译。在一些实施方案中,调节所述凝聚物会调节所述凝聚物与甲基-DNA结合蛋白之间的相互作用。在一些实施方案中,调节所述凝聚物会调节所述凝聚物与基因沉默因子之间的相互作用。在一些实施方案中,调节所述凝聚物会调节位于异染色质中的一种或多种基因的抑制或活化。在一些实施方案中,调节所述凝聚物会调节所述凝聚物与剪切因子、起始因子或延伸因子之间的相互作用。在一些实施方案中,调节所述凝聚物会调节所述凝聚物与RNA聚合酶之间的相互作用。在一些实施方案中,调节所述凝聚物会调节mRNA起始或延伸。在一些实施方案中,调节所述凝聚物会调节mRNA剪切。在一些实施方案中,调节所述凝聚物会调节炎症反应(例如,对病毒或细菌的炎症反应)。在一些实施方案中,调节所述凝聚物会调节(例如,降低或消除)癌症的活力或生长。在一些实施方案中,调节凝聚物会治疗或预防雷特综合征(Rett syndrome)或MeCP2过表达综合征。在一些实施方案中,调节凝聚物会治疗或预防与异常mRNA起始、延伸或剪切相关的疾患。
在一些实施方案中,所述凝聚物通过改变与所述凝聚物缔合的核苷酸序列来调节。改变可包括添加或缺失核苷酸或表观遗传修饰(例如,增加或减少或修饰DNA甲基化)。在一些实施方案中,所述核苷酸序列的改变包含DNA、RNA或蛋白质系栓于所述核苷酸序列。在一些实施方案中,使用催化无活性位点特异性核酸内切酶(例如,dCas)将DNA、RNA或蛋白质系栓于所述核苷酸序列。在一些实施方案中,所述凝聚物通过将DNA、RNA或蛋白质系栓于所述凝聚物来调节。在一些实施方案中,修饰激素反应性元件或信号传导反应性元件。在一些实施方案中,所述凝聚物通过甲基化或脱甲基化与所述凝聚物缔合的DNA来调节。在一些实施方案中,所述凝聚物通过使组分磷酸化或脱磷酸化来调节。在一些实施方案中,所述组分是RNA聚合酶。
在一些实施方案中,所述凝聚物通过使所述凝聚物与外源RNA接触来调节。在一些实施方案中,所述凝聚物通过使与所述凝聚物缔合的一种或多种RNA(例如,凝聚物组分)稳定化来调节。在一些实施方案中,所述凝聚物通过调节与所述凝聚物缔合的RNA的水平来调节。
在一些方面,细胞中的RNA加工通过改变凝聚物而发生改变。在一些实施方案中,RNA加工通过抑制或增强所述转录凝聚物与一种或多种RNA加工装置凝聚物的融合而发生改变。在一些实施方案中,RNA加工包含剪切、添加5’帽、3’和/或聚腺苷酸化。在一些实施方案中,调节RNA聚合酶II(Pol II)对与起始复合物或延伸复合物缔合的凝聚物的亲和力。在一些实施方案中,所述亲和力通过磷酸化或脱磷酸化PolII(例如,磷酸化或脱磷酸化PolII的固有无序C端域)来调节。
在一些实施方案中,凝聚物通过调节与凝聚物缔合的超级增强子(例如,在凝聚物内的超级增强子、具有凝聚物依赖性转录活性的超级增强子)的修饰剂/去修饰剂比率来调节。在一些实施方案中,凝聚物通过调节组分的修饰/去修饰(例如,调节蛋白质、肽、DNA或RNA组分的磷酸化或乙酰化)来调节。在一些实施方案中,凝聚物通过抑制或增强修饰剂/去修饰剂的表达或活性(例如,由此调节凝聚物组分的稳定性、定位和/或结合活性)来调节。例如,磷酸化或脱磷酸化某些蛋白质可影响其与其他分子实体(例如,凝聚物组分)相互作用的能力。在一些实施方案中,所述修饰/去修饰可使凝聚物组分从蛋白质解离,所述蛋白质在其他情况下使凝聚物组分保持于细胞质中并且使凝聚物组分易位至其中其可参与凝聚物的细胞核。因此,在一些实施方案中,修饰凝聚物形成、稳定性、组成、维持、溶解或活性包含抑制或活化凝聚物组分的修饰剂/去修饰剂。在一些实施方案中,所述修饰剂是激酶并且抑制所述修饰剂的剂是激酶抑制剂。
在一些实施方案中,凝聚物通过使所述凝聚物与结合于与所述凝聚物缔合的组分的固有无序域的剂接触来调节。在一些实施方案中,所述组分是介体、介体组分、MED1、MED15、p300、BRD4、TFIID、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1或SRSF1。在一些实施方案中,所述组分是核受体配体或其片段(例如,激素)。在一些实施方案中,所述组分是信号传导因子或其片段。在一些实施方案中,所述组分是甲基结合蛋白或抑制剂或其片段。在一些实施方案中,所述组分是RNA聚合酶、剪切因子、起始因子、延伸因子或其片段。在一些实施方案中,所述组分列于表S1中。在一些实施方案中,所述组分是转录因子(例如,OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子)。在一些实施方案中,所述IDR位于转录因子的活化域中。在本文所公开的方法和组合物的一些实施方案中,所述组分是核受体或核受体中包含活化域或活化域IDR的片段。在一些实施方案中,所述剂是多价的。在一些实施方案中,所述剂是二价的。在一些实施方案中,所述剂还结合于所述组分的非固有无序域或结合于与所述凝聚物缔合的第二组分。在一些实施方案中,所述剂可改变或破坏所述凝聚物的组分之间的相互作用。在一些实施方案中,所述剂可使所述凝聚物的组分之间的相互作用稳定化或增强。在一些实施方案中,所述剂结合于两种或更多种组分的非无序区(例如,增强所述组分的IDR相互作用)。
在一些实施方案中,可通过将一种或多种凝聚物组分系栓于基因组DNA而引起、增强或稳定化所述凝聚物的形成。在一些实施方案中,这些组分包含DNA、RNA和/或蛋白质。在一些实施方案中,所述组分包含介体、介体组分、MED1、MED15、p300、BRD4、核受体配体、信号传导因子、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1或TFIID。在一些实施方案中,所述组分是转录因子(例如,OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子)。在一些实施方案中,所述组分使用催化无活性位点特异性核酸内切酶(例如,dCas)进行系栓。
在一些实施方案中,所述凝聚物通过将所述凝聚物的一种或多种组分隔绝于第二凝聚物中来调节。在一些实施方案中,所述第二凝聚物的形成通过使细胞与外源肽、核酸和/或蛋白质接触而被诱导。在一些实施方案中,所述隔绝的组分是转录因子(例如,OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子)。在一些实施方案中,所述隔绝的组分是Myc。在一些实施方案中,所述隔绝的组分是野生型蛋白质的突变形式。在一些实施方案中,所述隔绝的组分是在疾病状态(例如,癌症)中过表达的组分。在一些实施方案中,所述隔绝的组分是核受体(例如,所述核受体的突变形式、与疾病状态相关的核受体的突变形式)。在一些实施方案中,所述隔绝的组分是核受体配体、信号传导因子、甲基-DNA结合蛋白、剪切因子、起始因子、延伸因子、基因沉默因子或RNA聚合酶。
在一些实施方案中,所述凝聚物通过调节与所述凝聚物(例如,所述凝聚物的组分)缔合的ncRNA的水平或活性来调节。在一些实施方案中,ncRNA的水平或活性通过使ncRNA与结合ncRNA的反义寡核苷酸、RNase或化合物接触来调节。在一些实施方案中,ncRNA是增强子RNA(eRNA)。在一些实施方案中,ncRNA是转移RNA(tRNA)、核糖体RNA(rRNA)、微小RNA、siRNA、piRNA、snoRNA、snRNA、exRNA、scaRNA、Xist或HOTAIR。
在一些实施方案中,本文所述的方法治疗由凝聚物形成、组成、维持、溶解或调控引起或依赖于凝聚物形成、组成、维持、溶解或调控的疾病或降低所述疾病的可能性。在一些实施方案中,本文所述的方法治疗癌症或降低癌症的可能性。在一些实施方案中,所述癌症与凝聚物组分(例如,核受体)中的突变相关。在一些实施方案中,本文所述的方法治疗与核受体(例如,突变型核受体)相关的疾病或降低所述疾病的可能性。在一些实施方案中,本文所述的方法治疗与异常蛋白质表达相关的疾病(例如,引起病理水平的蛋白质的疾病)或降低所述疾病的可能性。在一些实施方案中,本文所述的方法治疗与异常信号传导相关的疾病或降低所述疾病的可能性。在一些实施方案中,本文所述的方法降低炎症。在一些实施方案中,本文所述的方法修饰细胞状态。在一些实施方案中,本文所述的方法治疗与不适当地活化细胞生存或增生途径的融合致癌转录因子的产生、未在正常组织中表达的转录因子的不适当产生或募集转录因子至先前沉默致癌基因的增强子区的突变相关的疾病或降低所述疾病的可能性。在一些实施方案中,本文所述的方法修饰细胞身份。在一些实施方案中,本文所述的方法治疗与甲基-DNA结合蛋白的异常表达或活性(例如,如与参考或对照水平相比增加或减少的水平)相关的疾病。在一些实施方案中,本文所述的方法治疗与异常mRNA起始或延伸(例如,如与参考或对照水平相比增加或减少的mRNA起始或延伸)相关的疾病。在一些实施方案中,本文所述的方法治疗与异常mRNA剪切(例如,如与参考或对照水平相比增加或减少的mRNA剪切)相关的疾病。
本发明的一些方面针对一种鉴定调节凝聚物(例如,转录凝聚物)的凝聚物形成、稳定性、活性(例如,mRNA起始或延伸活性、基因沉默活性)或形态的剂的方法,所述方法包括提供具有凝聚物的细胞、使所述细胞与测试剂接触、测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性、活性或形态。在一些实施方案中,所述凝聚物具有可检测标签(即,可检测标记)并且所述可检测标签用于测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性、活性或形态。在一些实施方案中,所述可检测标签是荧光标签。在一些实施方案中,所述可检测标签是酶标签,例如荧光素酶。在一些实施方案中,所述可检测标签是表位标签。在一些实施方案中,使用选择性地结合于所述凝聚物的抗体来测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性、活性或形态。在一些实施方案中,使用显微术来执行测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性、活性或形态的步骤。在一些实施方案中,所述凝聚物包含突变型组分(例如,核受体或其片段的突变形式、当结合于同源配体时具有不同于野生型受体或其片段的活性或活性水平的核受体的突变形式、突变型信号传导因子或其片段、突变型甲基-DNA结合蛋白或其片段)。在上文的一些实施方案中,细胞不具有凝聚物,所述方法包括鉴定引起所述细胞中的凝聚物形成的剂。在一些实施方案中,凝聚物在细胞中不可检测并且所述方法包括鉴定使所述凝聚物可检测的剂(例如,所述凝聚物变得充分大以进行检测)。在一些实施方案中,细胞具有凝聚物并且所述方法包括鉴定引起另一凝聚物的形成的剂。
在一些实施方案中,所述凝聚物(例如,转录凝聚物)的组分是信号传导因子或包含IDR的其片段。在一些实施方案中,所述凝聚物与一种或多种信号反应元件缔合。在一些实施方案中,所述信号传导因子与疾病相关的信号传导途径缔合。在一些实施方案中,所述疾病是癌症。在一些实施方案中,所述凝聚物调节致癌基因的转录。在一些实施方案中,所述凝聚物与超级增强子缔合。在一些实施方案中,所述凝聚物的组分是甲基-DNA结合蛋白或包含C端IDR的其片段,或抑制因子或包含IDR的其片段。在一些实施方案中,所述凝聚物与甲基化DNA或异染色质缔合。在一些实施方案中,所述凝聚物包含异常水平或活性的甲基-DNA结合蛋白。在一些实施方案中,所述细胞是本文所提及的任何类型的细胞。在一些实施方案中,所述细胞是神经细胞。在一些实施方案中,所述细胞源于(例如,经由源于受试者细胞的诱导性多能干细胞)具有雷特综合征或MeCP2过表达综合征的受试者。
在一些实施方案中,评估所述剂对与所述凝聚物缔合的基因的表达的抑制。在一些实施方案中,所述凝聚物的组分是剪切因子或包含IDR的其片段,或RNA聚合酶或包含IDR的其片段。在一些实施方案中,所述凝聚物与转录起始复合物或延伸复合物缔合。在一些实施方案中,所述细胞还包含细胞周期素依赖性激酶。在一些实施方案中,所述RNA聚合酶是RNA聚合酶II(Pol II)。在一些实施方案中,评估通过与所述剂接触而引起的与所述凝聚物相关的RNA转录起始活性的变化。在一些实施方案中,评估通过与所述剂接触而引起的与所述凝聚物物理缔合的RNA延伸或剪切活性的变化。
本发明的一些方面针对一种鉴定调节凝聚物形成、稳定性或形态的剂的方法,所述方法包括提供体外凝聚物并且评估所述体外凝聚物的一种或多种物理特性,使所述体外凝聚物与测试剂接触,和评估所述测试剂是否引起所述体外凝聚物的所述一种或多种物理特性的变化。在一些实施方案中,所述一种或多种物理特性与所述体外凝聚物引起或增加或减少细胞中基因的表达的能力相关。在一些实施方案中,所述一种或多种物理特性与所述体外凝聚物引起或增加或减少RNA剪切的能力相关。在一些实施方案中,所述一种或多种物理特性包含大小、浓度、渗透性、形态或粘度。在一些实施方案中,所述测试剂是或包含小分子、肽、RNA或DNA。在一些实施方案中,所述体外凝聚物包含DNA、RNA和蛋白质。在一些实施方案中,所述体外凝聚物包含DNA和蛋白质,由DNA和蛋白质组成,或基本上由DNA和蛋白质组成。在一些实施方案中,所述体外凝聚物包含RNA和蛋白质,由RNA和蛋白质组成,或基本上由RNA和蛋白质组成。在一些实施方案中,所述体外凝聚物包含蛋白质,由蛋白质组成,或基本上由蛋白质组成。在一些实施方案中,所述体外凝聚物包含固有无序区或域(例如,包含一个或多个固有无序区或域的蛋白质、肽或其片段或衍生物)。在一些实施方案中,所述体外凝聚物通过微弱蛋白质-蛋白质相互作用(例如,容易受到扰乱的相互作用、容易受到扰乱并且短暂的相互作用、具有微摩尔浓度范围内的Kd的相互作用、具有微摩尔浓度范围内的Kd并且短暂的相互作用)形成。在一些实施方案中,所述体外凝聚物包含(固有无序域)-(诱导性低聚域)融合蛋白。在一些实施方案中,所述体外凝聚物模拟细胞中发现的转录凝聚物。在一些实施方案中,所述体外凝聚物模拟异染色质凝聚物(例如,异染色质凝聚物沉默基因表达)。在一些实施方案中,所述体外凝聚物包含甲基化DNA。在一些实施方案中,所述体外凝聚物模拟mRNA起始或延伸复合物。在一些实施方案中,所述体外凝聚物包含信号反应元件。在一些实施方案中,所述凝聚物是在液体小液滴中(例如,体外、合成转录凝聚物)。
在一些实施方案中,所述凝聚物的组分是信号传导因子或包含IDR的其片段。在一些实施方案中,所述凝聚物与一种或多种信号反应元件缔合。在一些实施方案中,所述信号传导因子与疾病相关的信号传导途径缔合。在一些实施方案中,所述疾病是癌症。在一些实施方案中,所述凝聚物调节致癌基因的转录。在一些实施方案中,所述凝聚物与超级增强子缔合。在一些实施方案中,所述凝聚物的组分是甲基-DNA结合蛋白或包含C端IDR的其片段,或抑制因子或包含IDR的其片段。在一些实施方案中,所述凝聚物与甲基化DNA或异染色质缔合。在一些实施方案中,所述凝聚物包含异常水平或活性的甲基-DNA结合蛋白。在一些实施方案中,所述细胞具有本文所提及或本领域中已知的任何细胞类型。在一些实施方案中,所述细胞是神经细胞。在一些实施方案中,所述细胞源于(例如,经由源于受试者细胞的诱导性多能干细胞)具有雷特综合征或MeCP2过表达综合征的受试者。
在一些实施方案中,评估所述剂对与所述凝聚物缔合的基因的表达的抑制。在一些实施方案中,所述凝聚物的组分是剪切因子或包含IDR的其片段,或RNA聚合酶或包含IDR的其片段。在一些实施方案中,所述凝聚物与转录起始复合物或延伸复合物缔合。在一些实施方案中,所述细胞还包含细胞周期素依赖性激酶。在一些实施方案中,所述RNA聚合酶是RNA聚合酶II(Pol II)。在一些实施方案中,评估通过与所述剂接触而引起的与所述凝聚物相关的RNA转录起始活性的变化。在一些实施方案中,评估通过与所述剂接触而引起的与所述凝聚物相关的RNA延伸或剪切活性的变化。
本发明的一些方面针对一种鉴定调节凝聚物形成、稳定性、功能或形态的剂的方法,所述方法包括提供具有报告基因的凝聚物依赖性表达的细胞,使所述细胞与测试剂接触,和评估所述报告基因的表达。
在鉴定本文所公开的剂的方法的一些实施方案中,所述凝聚物包含核受体(例如,核激素受体)或包含活化域IDR的其片段。在一些实施方案中,所述核受体当结合于同源配体时活化转录。在一些实施方案中,所述核受体在不结合于同源配体的情况下活化转录。在一些实施方案中,通过所述核受体(例如,突变型核受体)活化的转录的水平不同(例如,1.5倍、2倍、3倍、4倍、5倍不同)于野生型核受体或未与疾病或疾患相关的核受体形式。在一些实施方案中,所述核受体是核激素受体。在一些实施方案中,所述核受体具有突变。在一些实施方案中,所述突变与疾病或疾患相关。在一些实施方案中,所述疾病或疾患是癌症(例如,乳腺癌或白血病)。
在一些实施方案中,包含具有核受体的凝聚物的本文所公开的方法还包含配体(例如,所述凝聚物中的配体、测定混合物中的配体)的存在。在一些实施方案中,使用包含配体的测定来鉴定抑制凝聚物形成的剂,所述凝聚物形成将通过所述配体促进或与所述配体加成性或协同性起作用以促进凝聚物形成/稳定性、功能或形态。配体可以是天然存在的内源配体(例如,同源配体)或在结构上不同于天然存在的内源配体的配体(例如,合成配体)。
在鉴定本文所公开的剂的方法的一些实施方案中,所述凝聚物包含展现一种或多种异常特性(例如,异常凝聚物形成、稳定性、功能或形态)的突变型凝聚物组分(例如,突变型TF、突变型NR),并且所述测定包含鉴定至少部分地标准化所述特性的剂。在鉴定本文所公开的剂的方法的一些实施方案中,所述凝聚物包含展现一种或多种异常特性的突变型NR并且所述测定在配体存在下执行,所述配体当与所述NR接触时使得异常特性得以展现。所述测定可用于鉴定标准化异常特性的剂。
本发明的一些方面针对一种包含DNA、RNA和蛋白质的分离的合成转录凝聚物。本发明的一些方面针对一种包含DNA和蛋白质的分离的合成转录凝聚物。在一些实施方案中,液体小液滴包含所述分离的合成转录凝聚物。本发明的一些方面针对一种分离的合成凝聚物,其包含异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物所特有的蛋白质。本发明的一些方面针对一种分离的合成凝聚物,其包含异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物所特有的DNA和蛋白质。在一些实施方案中,液体小液滴包含所述分离的合成凝聚物。
本发明的一些方面针对一种融合蛋白,其包含转录凝聚物组分(例如,转录因子或其片段、包含活化域或活化域IDR的转录因子片段)和赋予诱导性低聚的域。本发明的一些方面针对一种融合蛋白,其包含异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物的组分。所述融合蛋白还可包含可检测标签(例如,荧光标签)。在一些实施方案中,赋予诱导性低聚的域可用小分子、蛋白质或核酸诱导。在一些实施方案中,凝聚物形成可用小分子、蛋白质、核酸或光诱导。
本发明的一些方面针对检测(例如,肉眼观察)凝聚物(例如,转录凝聚物、异染色质凝聚物、与mRNA起始或延伸复合物缔合的凝聚物)的方法。在一些方面,可肉眼观察转录凝聚物的形成、形态或溶解。在一些实施方案中,肉眼观察转录凝聚物可适用于筛选调节所述凝聚物的剂。在一些方面,可肉眼观察凝聚物(例如,异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物)的形成、形态或溶解。在一些实施方案中,肉眼观察凝聚物(例如,异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物)可适用于筛选调节所述凝聚物的剂。在一些实施方案中,方法包括监测凝聚物形成或溶解的速率。在一些实施方案中,方法包括鉴定增加或减少凝聚物形成或溶解的速率的剂。
本发明的一些方面针对一种调节mRNA起始的方法,所述方法包括调节与mRNA起始物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。在一些实施方案中,调节mRNA起始也会调节mRNA延伸、剪切或加帽。在一些实施方案中,调节与mRNA起始物理缔合的凝聚物的形成、组成、维持、溶解和/或调控会调节mRNA转录速率。在一些实施方案中,调节与mRNA起始物理缔合的凝聚物的形成、组成、维持、溶解和/或调控会调节基因产物的水平。
在一些实施方案中,与mRNA起始物理缔合的凝聚物的形成、组成、维持、溶解和/或调控是用剂调节。所述剂不受限制并且可以是本文所述的任何剂。在一些实施方案中,所述剂包含低磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。在一些实施方案中,所述剂优先地结合低磷酸化Pol II CTD。
本发明的一些方面针对一种调节mRNA延伸的方法,所述方法包括调节与mRNA延伸复合物物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。在一些实施方案中,调节mRNA延伸也会调节mRNA起始。在一些实施方案中,调节与mRNA延伸物理缔合的凝聚物的形成、组成、维持、溶解和/或调控会调节mRNA的共转录加工。在一些实施方案中,调节与mRNA延伸物理缔合的凝聚物的形成、组成、维持、溶解和/或调控会调节mRNA剪切变体的数目或相对比例。在一些实施方案中,与mRNA延伸物理缔合的凝聚物的形成、组成、维持、溶解和/或调控是用剂调节。所述剂不受限制并且可以是本文所公开的任何剂。在一些实施方案中,所述剂包含磷酸化或低磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。在一些实施方案中,所述剂优先地结合磷酸化或低磷酸化Pol II CTD。
本发明的一些方面涉及一种调节凝聚物的形成、组成、维持、溶解和/或调控的方法,所述方法包括调节凝聚物组分的磷酸化或脱磷酸化。在一些实施方案中,所述组分是RNA聚合酶II或RNA聚合酶II C端区。
本发明的一些方面涉及一种治疗与异常mRNA加工相关的疾病或疾患或降低所述疾病或疾患的可能性的方法,所述方法包括调节与mRNA延伸物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。
本发明的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供具有凝聚物的细胞、使所述细胞与测试剂接触和测定与所述测试剂的接触是否会调节所述凝聚物的形成、稳定性或形态,其中所述凝聚物包含低磷酸化RNA聚合酶II C端域(Pol II CTD)、磷酸化RNA聚合酶II C端域(Pol II CTD)、剪切因子或其功能片段。在鉴定剂或筛选调节与疾病或疾患相关(例如,具有异常水平、特性或活性)的凝聚物的形成、组成、维持、溶解、活性和/或调控的剂的本文所公开的方法的一些实施方案中,并未知晓所述剂是否适用于治疗所述疾病或疾患。
本发明的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供体外凝聚物并且评估所述体外凝聚物的一种或多种物理特性、使所述体外凝聚物与测试剂接触和评估与所述测试剂的接触是否会引起所述体外凝聚物的所述一种或多种物理特性的变化,其中所述凝聚物包含低磷酸化RNA聚合酶II C端域(Pol IICTD)、磷酸化RNA聚合酶II C端域(Pol II CTD)、剪切因子或其功能片段。
本发明的一些方面涉及一种分离的合成凝聚物,其包含低磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。本发明的一些方面涉及一种分离的合成凝聚物,其包含磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。本发明的一些方面涉及一种分离的合成凝聚物,其包含剪切因子或其功能片段。
本发明的一些方面涉及一种调节一种或多种基因的转录的方法,所述方法包括调节异染色质凝聚物的形成、组成、维持、溶解和/或调控。在一些实施方案中,调节所述异染色质凝聚物会使所述一种或多种基因的转录的抑制增加或稳定化。在一些实施方案中,调节所述异染色质凝聚物会减少所述一种或多种基因的转录的抑制。在一些实施方案中,调节与异染色质缔合的多种基因的转录。在一些实施方案中,异染色质凝聚物的形成、组成、维持、溶解和/或调控是用剂调节。在一些实施方案中,所述剂包含肽、核酸或小分子,或由肽、核酸或小分子组成。在一些实施方案中,所述剂结合甲基化DNA、甲基-DNA结合蛋白或基因沉默因子。
本发明的一些方面涉及一种调节基因沉默的方法,所述方法包括调节异染色质凝聚物的形成、组成、维持、溶解和/或调控。在一些实施方案中,基因沉默经过稳定化或有所增加。在一些实施方案中,基因沉默有所减少。在一些实施方案中,基因沉默是用剂调节。
本发明的一些方面涉及一种治疗与异常基因沉默(例如,如与对照或参考水平相比增加或减少的基因沉默)相关的疾病或疾患或降低所述疾病或疾患的可能性的方法,所述方法包括调节异染色质凝聚物的形成、组成、维持、溶解和/或调控。在一些实施方案中,与异常基因沉默相关的疾病或疾患是与甲基-DNA结合蛋白的异常表达或活性相关。在一些实施方案中,与异常基因沉默相关的疾病或疾患是雷特综合征或MeCP2过表达综合征。
本发明的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供具有凝聚物的细胞、使所述细胞与测试剂接触和测定与所述测试剂的接触是否会调节所述凝聚物的形成、稳定性或形态,其中所述凝聚物包含MeCP2或包含MeCP2的C端固有无序区的其片段,或抑制因子。在一些实施方案中,所述凝聚物与异染色质缔合。在一些实施方案中,所述凝聚物与甲基化DNA缔合。
本发明的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供体外凝聚物并且评估所述体外凝聚物的一种或多种物理特性、使所述体外凝聚物与测试剂接触和评估与所述测试剂的接触是否会引起所述体外凝聚物的所述一种或多种物理特性的变化,其中所述凝聚物包含MeCP2或包含MeCP2的C端固有无序区的其片段,或抑制因子或其功能片段。
本发明的一些方面涉及一种分离的合成凝聚物,其包含MeCP2或包含MeCP2的C端固有无序区的其片段。
本发明的一些方面涉及一种分离的合成凝聚物,其包含抑制因子(本文中有时称作基因沉默因子)或其功能片段。
本发明的一些方面涉及一种调节细胞中一种或多种基因的转录的方法,所述方法包括调节与所述一种或多种基因缔合的凝聚物的组成、维持、溶解和/或调控,其中所述凝聚物包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。在一些实施方案中,所述雌激素受体是突变型雌激素受体。在一些实施方案中,所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性。在一些实施方案中,所述雌激素受体片段包含配体结合域或其功能片段。在一些实施方案中,所述MED1片段包含IDR、LXXLL基序或两者。在一些实施方案中,所述凝聚物与雌激素或其功能片段接触。在一些实施方案中,所述凝聚物与选择性雌激素选择性调节剂(SERM)接触。在一些实施方案中,所述SERM是他莫昔芬(tamoxifen)。在一些实施方案中,所述凝聚物的调节会降低或消除MYC致癌基因的转录。在一些实施方案中,所述细胞是乳腺癌细胞。在一些实施方案中,所述细胞过表达MED1。在一些实施方案中,所述转录凝聚物通过使所述转录凝聚物与剂接触来调节。在一些实施方案中,所述剂会降低或消除ER与MED1之间的相互作用。在一些实施方案中,所述剂会降低或消除ER与雌激素之间的相互作用。在一些实施方案中,所述凝聚物包含突变型ER或其片段并且所述剂会降低所述一种或多种基因的转录。
本发明的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供细胞、使所述细胞与测试剂接触和测定与所述测试剂的接触是否会调节凝聚物的形成、稳定性或形态,其中所述凝聚物包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。在一些实施方案中,所述雌激素受体是突变型雌激素受体。在一些实施方案中,所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性。在一些实施方案中,所述雌激素受体片段包含配体结合域或其功能片段。在一些实施方案中,所述MED1片段包含IDR、LXXLL基序或两者。在一些实施方案中,所述凝聚物与雌激素或其功能片段接触。在一些实施方案中,所述凝聚物与选择性雌激素选择性调节剂(SERM)接触。在一些实施方案中,所述SERM是他莫昔芬或其活性代谢物。在一些实施方案中,所述凝聚物的调节会降低或消除MYC致癌基因的转录。在一些实施方案中,所述细胞是乳腺癌细胞。在一些实施方案中,所述细胞过表达MED1。在一些实施方案中,所述细胞是ER+乳腺癌细胞。在一些实施方案中,所述ER+乳腺癌细胞抵抗他莫昔芬治疗。在一些实施方案中,所述凝聚物包含可检测标记。在一些实施方案中,所述凝聚物的组分包含可检测标记。在一些实施方案中,所述ER或其片段和/或所述MED1或其片段包含可检测标记。在一些实施方案中,所述一种或多种基因包含报告基因。
本发明的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供体外凝聚物、使所述凝聚物与测试剂接触和测定与所述测试剂的接触是否会调节所述凝聚物的形成、稳定性或形态,其中所述凝聚物包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。在一些实施方案中,所述雌激素受体是突变型雌激素受体。在一些实施方案中,所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性。在一些实施方案中,所述雌激素受体片段包含配体结合域或其功能片段。在一些实施方案中,所述MED1片段包含IDR、LXXLL基序或两者。在一些实施方案中,所述凝聚物与雌激素或其功能片段接触。在一些实施方案中,所述凝聚物与选择性雌激素选择性调节剂(SERM)接触。在一些实施方案中,所述SERM是他莫昔芬。在一些实施方案中,所述凝聚物是从细胞分离。在一些实施方案中,所述细胞是乳腺癌细胞。在一些实施方案中,所述细胞过表达MED1。在一些实施方案中,所述细胞是ER+乳腺癌细胞。在一些实施方案中,所述ER+乳腺癌细胞抵抗他莫昔芬治疗。在一些实施方案中,所述凝聚物包含可检测标记。在一些实施方案中,所述凝聚物的组分包含可检测标记。在一些实施方案中,所述ER或其片段和/或所述MED1或其片段包含可检测标记。
本发明的一些方面涉及一种分离的合成转录凝聚物,其包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。在一些实施方案中,所述雌激素受体是突变型雌激素受体。在一些实施方案中,所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性。在一些实施方案中,所述雌激素受体片段包含配体结合域或其功能片段。在一些实施方案中,所述MED1片段包含IDR、LXXLL基序或两者。在一些实施方案中,所述凝聚物包含雌激素或其功能片段。在一些实施方案中,所述凝聚物包含选择性雌激素选择性调节剂(SERM)。
附图说明
本发明的这些和其他特征将通过参考以下具体实施方式以及附图而更充分地加以理解。所述专利或申请文件含有至少一个以彩色制成的图。具有彩色图的这一专利或专利申请公布的拷贝将由事务所在必要费用的要求和支付后提供。
图1-说明作为多种组分的高密度协作组装体的转录凝聚物,所述组分包括转录因子、辅因子、染色质调控因子、DNA、非编码RNA、新生RNA和RNA聚合酶II。
图2A-2B-显示固有无序域或区(IDR)(SEQ ID NO:13)对转录凝聚物形成、维持、溶解或调控的影响。在图2A中,IDR使所述转录凝聚物稳定化。在图2B中,结合IDR或与IDR相互作用的小分子的引入会使所述转录凝聚物去稳定化。图2A-2B中显示的基序YSPTSPS是SEQID NO:13。
图3A-3C-显示超级增强子和典型增强子的模型和特征。图3A是关于典型增强子和超级增强子的协作性的经典模型的示意性描绘。经由协作结合于DNA结合位点实现的高密度转录调控因子(称作“活化子”)被视为促进较高转录输出和增加的对超级增强子处的活化子浓度的敏感性两者。图像根据Lovén等人(2013)加以修改。图3B显示关于RNA聚合酶II(RNA Pol II)和在鼠科动物胚胎干细胞中的POLE4和miR-290-295基因座处所指示的转录辅因子和染色质调控因子的染色质免疫沉淀测序(ChIP-seq)结合概况。转录因子结合概况是TF Oct4、Sox2和Nanog.rpm/bp(每个碱基对每百万个读数)的合并ChIP-seq结合概况。图像根据Hnisz等人(2013)加以修改。图3C显示在人T细胞中的H3K27Ac的ChIP-seq概况上方展示的在RUNX1基因座处的ChIA-PET相互作用。ChIA-PET相互作用指示了在超级增强子内的H3K27Ac占据区与RUNX1的启动子之间的频繁物理接触。
图4A-4C-显示转录控制的简单相分离模型。图4A是可在超级增强子-基因座处形成转录调控因子的相分离多分子复合物的生物系统的示意图。图4B是所述生物系统的简化表示,和可能引起相分离的模型的参数。“M”表示当进行修饰时能够形成交联的残基的修饰。图4C显示转录活性(TA)对用于超级增强子(由N=50条链组成)和典型增强子(由N=10条链组成)的价态参数的依赖性。转录活性(TA)的代理者是定义为交联链的最大团簇的大小,由链的总数定标。价态经过定标,以致实际价态除以参考数字3。实线指示平均值,并且虚线指示50次模拟的标准偏差的两倍。Keq和修饰剂/去修饰剂比率的值保持恒定。HC即希尔系数,其为描述协作行为的经典度量。插图显示希尔系数对所述系统中的链或组分的数目的依赖性。
图5A-5B-显示超级增强子弱点。图5A显示在用所指示浓度的BRD4抑制剂JQ1处理之后IGLL5超级增强子(红色)和PDHX典型增强子(灰色)的增强子活性。增强子活性在人多发性骨髓瘤细胞中以荧光素酶报告基因测定进行测量。注意,与由典型增强子驱动的荧光素酶表达相比,JQ1抑制约50%由低10倍浓度的超级增强子驱动的荧光素酶表达(25nM对250nM)。数据和图像根据Lovén等人(2013)加以修改。图5B显示转录活性(TA)对用于超级增强子(由N=50条链组成)和典型增强子(由N=10条链组成)的去修饰剂/修饰剂比率的依赖性。转录活性(TA)的代理者是定义为交联链的最大团簇的大小,由链的总数定标。实线指示平均值并且虚线指示50次模拟的标准偏差的两倍。Keq和f保持恒定。注意,增加去修饰剂水平等于抑制交联(即,降低价态)。TA被标准化为在log(去修饰剂/修饰剂)=-1.5下的值,并且纵坐标显示以log尺度表示的标准化TA。
图6A-6C-显示转录爆发。图6A是在果蝇胚胎的个别细胞核中的转录活性的代表性迹线。转录活性通过使用荧光探针肉眼观察新生RNA来测量。顶部图显示通过弱增强子产生的代表性迹线,并且底部图显示通过强增强子产生的代表性迹线。数据和图像根据Fukaya等人(2016)加以修改。图6B是超级增强子(N=50条链)和典型增强子(N=10条链)的转录活性(TA)的模拟,其随时间再现弱和强增强子的爆发行为。图6C是通过共享增强子实现的两种基因启动子的同步活化的模型。
图7-显示体内转录控制相分离:在基因调控元件处的相分离复合物的模型。突出显示形成所述复合物的一些候选转录调控因子。P-CTD表示RNA Pol II的磷酸化C端域。还突出显示核小体的化学修饰(乙酰化,Ac;甲基化,Me)。在增强子和启动子处的不同转录会产生可通过RNA剪切因子结合的新生RNA。所述组分之间的潜在相互作用以虚线展示。
图8-显示转录活性(TA)对链数目(N)的依赖性。转录活性(TA)的代理者是定义为交联链的最大团簇的大小,由链的总数定标。实线指示平均值并且虚线指示50次模拟的标准偏差的两倍。所有模拟均在修饰剂/去修饰剂=0.1,Keq=1并且f=5下进行。只要关于SE和典型增强子的N(或组分浓度)的值充分不同,TA水平极其不同。
图9-显示为了研究在修饰剂/去修饰剂平衡的急剧改变(信号的模拟变化)之后的凝胶分解而进行的模拟。转录活性(TA)的代理者是定义为交联链的最大团簇的大小,由链的总数定标。如插图所描绘,修饰剂/去修饰剂水平的比率从0.1翻转(在τ=25下)至0.016并且TA在修饰剂/去修饰剂平衡的变化后τ=50时间单位进行计算。所有模拟均针对N=50(关于SE的模型)和Keq=1进行。实线表示当价态(f)发生变化时在250次重复模拟中计算的TA的最大值的变化。用于确保团簇形成的阈值价态fmin(参见图4C)和用于确保在修饰剂/去修饰剂水平的变化后τ=50时间单位内的稳固分解的fmax(定义为TA<0.5,虚线)得到鉴定。出于说明性目的选择修饰剂/去修饰剂值的变化后τ=50时间单位的特定值,并且测定fmax的值。存在最大价态,凝胶在超过所述最大价态时不会在现实时标中分解,所述定性结果对于这一时标的所选值的变化是稳固的。
图10A-10B-显示超级增强子和典型增强子的噪声特征。图10A显示作为转录活性(TA)的方差进行测量的波动(或转录噪声)对关于SE(N=50)和典型增强子(N=10)的价态的依赖性。转录活性(TA)的代理者是定义为交联链的最大团簇的大小,由链的总数定标。在纵坐标的定义中的尖括号表示在50次重复模拟中的平均值。所有模拟均在修饰剂/去修饰剂=0.1,Keq=1下进行。就SE来说,与典型增强子相比,标准化噪声量值和重要的是显现噪声的价态范围较小。然而,应注意就N的较大值来说,在相分离点附近的绝对噪声量值较大。图10B显示作为转录活性(TA)的方差进行测量的波动(或转录噪声)对N的依赖性,其中f=5(就N=50来说,团簇形成所需的最小价态)。所有模拟均在修饰剂/去修饰剂=0.1并且Keq=1下进行。转录活性(TA)的代理者是定义为交联链的最大团簇的大小,由链的总数定标。在纵坐标的定义中的尖括号表示在50次重复模拟中的平均值。
图11A-11E-显示BRD4和MED1核凝聚物的肉眼观察结果。(图11A)使用结构化照明显微术(SIM)通过免疫荧光(IF)获得的小鼠胚胎干细胞(mESC)中的BRD4和MED1的代表性图像。图像表示8个切片的z-投影(125nm,每一者)。比例尺,5μm。IgG对照物在图S1C中。(图11B)通过SIM成像的固定mESC中的异位表达BRD4-GFP(左侧图,绿色)与MED1(中间图,品红色)的IF之间的共定位的代表性图像。两个通道的合并呈递于右侧图中,其中重叠部分以白色展示。核轮廓作为通过DAPI染色(未示出)测定的蓝色线显示。图像表示单一z-切片(125nm)。比例尺,5μm。(图11C)在固定mESC中通过SIM成像的BRD4(顶部左侧图,绿色)、HP1a(顶部中间图,品红色)和两个通道的合并(顶部左侧图,重叠部分呈白色)的共-IF代表性图像。在固定mESC中通过SIM成像的异位表达HP1a-GFP(底部右侧图,绿色)、MED1的IF(底部中间图,品红色)与两个通道的合并(底部左侧图,重叠部分呈白色)之间的共定位的代表性图像。核轮廓作为通过DAPI染色(未示出)测定的蓝色线显示。图像表示单一z-切片(125nm)。比例尺,5μm。(图11D)通过反褶积显微术成像的已知核凝聚物的标记物FIB1(核仁)、NPAT(组蛋白基因座小体)和HP1a(组成性异染色质)的IF的代表性图像。图像表示8个切片的z-投影(125nm,每一者)。比例尺,5μm。(图11E)核凝聚物的典型数目和大小(直径)。此处产生的值以黑色字体表示;从文献收集的值以蓝色(48)表示。关于大小和数目的值使用FIJI 3D对象计数器插件产生。比例尺,5μm。
图12A-12B-显示BRD4和MED1凝聚物出现于超级增强子缔合的转录位点处。(图12A)如所指示,在与mir290、Esrrb和Klf4缔合的超级增强子(SE)处显示的BRD4、MED1和RNA聚合酶II(RNAPII)的ChIP-seq结合概况。关于各集合,SE(红色)和缔合基因(黑色)的位置在所述集合下方加以指示。x轴表示基因组位置并且ChIP-seq信号富集沿y轴展示为每个碱基对每百万个读数(rpm/bp)。(图12B)如所指示,在固定mESC中通过免疫荧光(IF)和荧光原位杂交(FISH)获得的SE缔合基因mir290、Esrrb或Klf4的BRD4或MED1与新生RNA之间的共定位的代表性图像。样品使用转盘式共聚焦显微术成像。单一z-切片(500nm)针对所指示的IF和FISH个别地呈递并且接着作为两个通道的合并(重叠部分呈白色)呈递。蓝色线突出显示如通过DAPI染色(未示出)指定的核外周。IF和FISH共定位区在“合并”列中以黄色盒突出显示并且在“合并(图像放大)”列中经过放大以展示细节。比例尺,就IF、FISH和合并来说为5μm并且就合并(图像放大)来说为0.5μm。
图13A-13F-显示BRD4和MED1凝聚物展现液体样FRAP动力学。(图13A)表达BRD4-GFP的mESC在BRD4-GFP凝聚物的光漂白之前和之后所指示的时间处的代表性图像。黄色盒突出显示经过光漂白的区。蓝色盒突出显示用于比较的对照区。相对于光漂白(0”)的时间在各图像的下部左侧加以指示。比例尺,5μm。(图13B)(A)中所示的区的延时、特写视图。图A中的经过光漂白的区(图A中的黄色盒)显示于顶部行中。相对于光漂白的时间显示于各视图上方。图A中的对照区(图A中的蓝色盒)显示于底部行中。比例尺,1μm。(图13C)经过定量并且求平均值的荧光恢复。在光漂白之前相对于时间的信号强度显示于y轴中。相对于光漂白的时间显示于x轴中。未处理细胞(黑色)和经寡霉素处理以耗尽ATP的细胞(ATP耗尽,红色)的数据示出。数据显示为平均相对强度±SEM,其中关于未处理细胞,n=9,并且关于ATP耗尽细胞,n=3。(图13D)与(A)相同,但具有表达MED1-GFP的mESC。比例尺,5μm。(图13E)与(B)相同,但具有表达MED1-GFP的mESC。比例尺,1μm。(图13F)与(图13C)相同,但具有表达MED1-GFP的mESC。数据显示为平均相对强度±SEM,其中关于未处理细胞,n=5,并且关于ATP耗尽细胞,n=5。
图14A-14F-显示体外相分离的BRD4和MED1的固有无序区(IDR)。(图14A)标绘针对BRD4(顶部图)和MED1(底部图)中的氨基酸延伸段的固有无序分数(PONDR VSL2)的图。PONDR VSL2分数显示于y轴中。氨基酸位置显示于x轴中。紫色条指示了各蛋白质的固有无序C端域。各固有无序域的开始和末端的氨基酸位置经过注明。(图14B)用于这一原稿中的重组GFP融合蛋白的示意图。紫色盒指示了(图14C)中显示的BRD4(BRD4-IDR)和MED1(MED1-IDR)的固有无序域。浊度增加的肉眼观察结果与小液滴形成相关。示出含有BRD4-IDR(左侧对)、MED1-IDR(中间对)或GFP(右侧对)的管。关于各对,示出缓冲液中PEG-8000(分子拥挤剂)的存在(+)或不存在(-)。空白管包括于各对之间用于比较。(图14D)在不同蛋白质浓度下小液滴形成的代表性图像。BRD4-IDR(顶部行)、MED1-IDR(中间行)或GFP(底部行)添加至小液滴形成缓冲液中达到如所指示的最终浓度。溶液装载至自制室中并且通过在玻璃盖玻片上聚焦的转盘式共聚焦显微术成像。比例尺,5μm。(图14E)在不同盐浓度下小液滴形成的代表性图像。BRD4-IDR(图像的顶部行)或MED1-IDR(图像的底部行)添加至小液滴形成缓冲液中以实现10μM浓度,其中最终NaCl浓度如所指示为50mM、125mM、200mM或350mM。小液滴如(图14D)中进行肉眼观察。比例尺,5μm。(图14F)小液滴可逆性实验的代表性图像。顶部行显示BRD4-IDR的小液滴,所述小液滴被允许形成于小液滴形成缓冲液(20μM蛋白质、75mMNaCl)中并且接着经受稀释或稀释加上盐浓度变化。左列显示来自原始体积的三分之一的代表性小液滴。中间列显示代表用等张溶液1:1稀释的第二个三分之一体积的小液滴。右列显示代表用高盐溶液1:1稀释至425mM NaCl的最终浓度的最终三分之一体积的小液滴。小液滴如(图14D)中进行肉眼观察。比例尺,5μm。
图15A-15H-显示MED1的IDR参与细胞中的相分离。(图15A)optoIDR测定的示意图,描绘了具有所选择的固有无序域(紫色)、在接着暴露于蓝光的细胞中表达的mCherry(红色)和Cry2(橙色)的重组蛋白。(图15B)表达mCherry-Cry2重组蛋白并且每隔2秒经受488nm激光激发持续0(左侧图)或200秒(右侧图)的NIH3T3细胞的代表性图像。比例尺,10μm。(图15C)表达MED1IDR中融合至mCherry-Cry2的一部分(MED1的氨基酸948-1157)(MED1-optoIDR)并且每隔2秒经受488nm激光激发持续0(左侧图)、60秒(中间图)或200秒(右侧图)的NIH3T3细胞的代表性图像。10μm。(图15D)在每隔2秒经受488nm激光激发持续所指示的时间的表达MED1-optoIDR的NIH3T3细胞的细胞核上聚焦的延时图像。比例尺,5μm。黄色盒突出显示其中发生融合事件的数个区之一。(图15E)小液滴融合的延时并且特写视图。示出图D中通过黄色盒突出显示的图像的区,持续延长时帧。在各帧的左下角所指示的时间处截取各帧。比例尺,1μm。(图15F)在蓝光激发不存在下在optoDroplet的光漂白之前(左侧图)、期间(中间图)和之后(右侧图)MED1-optoIDR optoDroplet的代表性图像。黄色盒突出显示经过光漂白的区。蓝色盒突出显示用于比较的对照区。相对于光漂白(0”)的时间在各图像的下部左侧加以指示。比例尺,5μm。(图15G)经过定量并且求平均值的荧光恢复。在光漂白之前相对于时间的信号强度显示于y轴中。相对于光漂白的时间显示于x轴中。数据显示为平均相对强度±SD,其中n=15。(图15H)针对在(图15F)中突出显示的区显示的小液滴回收的延时并且特写视图。相对于光漂白的时间显示于视图上方。比例尺,1μm。
图16A-16C-显示BRD4和MED1核凝聚物的肉眼观察结果。(图16A)在两个基因座处如所指示的BRD4和MED1的ChIP-seq结合概况。关于各图,染色体坐标在底部加以指示并且比例尺包括于左上方。X轴表示基因组位置并且ChIP-seq信号富集沿y轴展示为每百万个读数(rpm)。(图16B)显示在mESC中的BRD4或MED1结合位点处的BRD4(左侧图)和MED1(右侧图)占有率的热图。各图显示针对各BRD4或MED1结合区(列)的4kb窗,定中心于BRD4或MED-1结合区的峰上。红色指示ChIP-seq信号的存在。黑色指示背景。(图16C)使用结构化照明显微术(SIM)用小鼠胚胎干细胞(mESC)中的第二IgG抗体通过免疫荧光进行检测。显示使用IgG(左侧图)、DAPI(中间图)的染色和合并视图(右侧图)。比例尺,5μm。
图17A-17D-显示BRD4和MED1凝聚物出现于超级增强子缔合的转录位点处。(图17A)如所指示,在Nanog基因座处显示的BRD4、MED1和RNA聚合酶II(RNAPII)的ChIP-seq结合概况。X轴表示基因组位置并且ChIP-seq信号富集沿y轴展示为每个碱基对每百万个读数(rpm/bp)。(图17B)如所指示,在固定mESC中通过免疫荧光(IF)和荧光原位杂交(FISH)获得的SE缔合基因Nanog的BRD4或MED1与新生RNA之间的共定位的代表性图像。样品使用转盘式共聚焦显微术成像。顶部行表示关于BRD4的比较。底部行表示关于MED1的比较。关于各行,单一z-切片(500nm)针对IF(左侧图)和FISH(中间图)个别地呈递并且接着作为两个通道的合并(右侧图)呈递。蓝色线突出显示如通过DAPI染色(未示出)指定的核外周。IF和FISH共定位的区通过黄色盒突出显示并且突出显示的区的特写视图显示于最右侧图中。比例尺,就IF、FISH和合并来说为5μm并且就合并(图像放大)来说为0.5μm。(图17C)关于IF与FISH焦点之间的距离的定量的示意图。关于最近焦点分析(顶部图),选择FISH信号与最近IF特征之间的距离。关于随机焦点分析(底部图),选择在5μm半径内的FISH信号与随机IF特征之间的距离。(图17D)在BRD4(顶部行)或MED1(底部行)的IF焦点至如(图17C)中关于在盒形图的各集合的顶部处指示的基因所定义的最近或随机FISH信号之间的距离的盒形图。在各集合的左上方,报告了比较最近与随机的p值(t测试)、所分析的RNA-FISH焦点的数目和独立重复样品的数目。
图18A-18C-显示BRD4和MED1凝聚物展现液体样FRAP动力学。(图18A)显示这些研究中从光漂白恢复的半衰期(T_半)以及BRD4和MED1的表观扩散速率。为了比较,显示先前公开的关于DDX4和NICD的信息。(图18B)经过定量并且求平均值的荧光恢复。在光漂白之前相对于时间的信号强度显示于y轴中。相对于光漂白的时间显示于x轴中。显示关于表达BRD-GFP(蓝色)和表达MED1-GFP(红色)的细胞的数据,所述细胞用PFA处理以固定细胞并且限制蛋白质光漂白后的扩散。数据显示为平均相对强度±SEM。(图18C)随葡萄糖耗尽和使用寡霉素的处理而变的ATP耗尽的定量。
图19A-19D-显示体外相分离的BRD4和MED1的固有无序区(IDR)。(图19A)显示关于BRD4-IDR和MED1-IDR的小液滴的纵横比的分布的盒形图。小液滴的数目经过检查并且示出平均纵横比。盒形图表示第10-90个百分点。(图19B)显示关于BRD4-IDR(左侧图)或MED1-IDR(右侧图)的蛋白质浓度与小液滴大小之间的关系的点图。蛋白质浓度(μM)显示于x轴中并且随2-D图像中的面积而变的小液滴大小显示于y轴中。(图19C)显示在低蛋白质浓度下小型小液滴的存在的图像。(图19D)显示关于BRD4-IDR(左侧图)或MED1-IDR(右侧图)的盐浓度与小液滴大小之间的关系的点图。盐浓度(mM)显示于x轴中并且随2-D图像中的面积而变的小液滴大小显示于y轴中。
图20显示OCT4和介体占据体内超级增强子。ESC中的OCT4和MED1在SE处的ChIP-seq迹线(左列),和具有并行RNA-FISH的OCT4IF,证明了在Esrrb、Nanog、Trim28和Mir290处OCT4的占有率。使用Hoechst染色来测定以蓝色线突出显示的核外周。最右侧两列显示来自至少11张图像的定中心于RNA-FISH焦点上的平均RNA FISH信号和平均OCT4 IF信号。在随机选择的核位置处的平均OCT4 IF信号展示于图27中。
图21A-21I显示MED1凝聚物依赖于体内OCT4结合。(图21A)OCT4降解的示意图。OCT4的C端内源性地双等位基因地经FKBP蛋白标记;当暴露于小分子dTag时,OCT4泛素化并且快速地降解。(图21B)在用DMSO或dTAG处理持续24小时的携带OCT4FKBP标签的ESC中,超级增强子(SE)或典型增强子(TE)驱动基因的OCT4和MED1ChIP-seq读数和RNA-seq读数的log2倍数变化的盒形图表示。(图21C)在Nanog基因座处的OCT4(绿色)和MED1(黄色)ChIP-seq数据的基因组浏览视图。Nanog SE(红色)显示在OCT4降解之后OCT4和MED1结合的90%降低。(图21D)Nanog mRNA的标准化RNA-seq读数计数显示在OCT4降解时的60%降低。(图21E)用DMSO或dTAG处理的携带OCT4FKBP标签的ESC中的OCT4和MED1 IF以及与Nanog基因座的DNA FISH的共聚焦显微术图像。插图表示黄色盒的图像放大视图。合并视图同时展示了所有三个通道(OCT4 IF、MED1 IF和Nanog DNA FISH)。(图21F)与ESC和分化细胞(Diff)中的Mir290SE的OCT4ChIP-qPCR。以相对于ESC中的信号,相对于对照物的富集呈递。误差棒表示来自两个生物重复样品的平均值的标准误差。(图21G)与ESC和分化细胞(Diff)中的Mir290SE的MED1ChIP-qPCR。以相对于ESC中的信号,相对于对照物的富集呈递。误差棒表示来自两个生物重复样品的SEM。(图21H)ESC或分化细胞(Diff)中的Mir290miRNA的标准化RNA-seq读数计数。误差棒表示来自两个生物重复样品的SEM。(图21I)ESC和分化细胞中的MED1 IF和与Mir290基因组基因座的DNA FISH的共聚焦显微术图像。合并(图像放大)表示合并通道中的黄色盒的图像放大视图。
图22A-22E显示OCT4体外形成具有MED1的液体小液滴。(图22A)如通过VSL2算法(www.pondr.com)计算的OCT4的固有无序的图。DNA结合域(DBD)和活化域(AD)在无序分数图上方加以指示(Brehm等人,1997)。(图22B)具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中在所指示的浓度下OCT4-GFP(顶部行)和MED1-IDR-GFP(底部行)的小液滴形成的代表性图像。(图22C)具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中各自在10uM下与GFP或OCT4-GFP混合的MED1-IDR-mCherry的小液滴形成的代表性图像。(图22D)OCT4-GFP和MED1-IDR-mCherry的异型小液滴的FRAP。在相对于光漂白(0)的所指示的时间点处拍摄共聚焦图像。(图22E)具有变化浓度的盐和10%PEG-8000的小液滴形成缓冲液中10uM MED1-IDR-mCherry和OCT4-GFP的小液滴形成的代表性图像。
图23A-23E显示OCT4与MED1的相分离依赖于特异性相互作用。(图23A)通过AD(上部图)中的氨基酸频率定制的氨基酸富集分析。OCT4(下部图)的每个氨基酸残基净电荷分析。(图23B)小液滴形成的代表性图像,其显示Poly-E肽并入至MED1-IDR小液滴中。MED1-GFP和经TMR标记的脯氨酸或谷氨酸十肽(分别为Poly-P和Poly-E)各自以10uM添加至具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中。(图23C)(上部图)OCT4蛋白质的示意图,AD中的水平线标记酸性D残基(蓝色)和酸性E残基(红色)。N-AD中的所有17个酸性残基和C-AD中的6个酸性残基突变为丙氨酸以产生OCT4-酸性突变体。(下部图)小液滴形成的代表性共聚焦图像,其显示所述OCT4-酸性突变体具有减弱的浓缩至MED1-IDR小液滴中的能力。10uM MED1-IDR-mCherry和OCT4-GFP或OCT4-酸性突变体-GFP添加至具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中。(图23D)(上部图)小液滴形成的代表性图像,其显示OCT4而非所述OCT4酸性突变体并入至介体复合物小液滴中。纯化的介体复合物在具有140mM NaCl和10%PEG-8000的小液滴形成缓冲液中与10uM GFP、OCT4-GFP或OCT4-酸性突变体-GFP混合。(下部图)介体复合物小液滴中GFP、OCT4-GFP或OCT4-酸性突变体-GFP的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。(图23E)(顶部图)GAL4活化测定示意图。GAL4荧光素酶报告基因质粒被转染至具有用于GAL4-DBD融合蛋白的表达载体的小鼠ES细胞中。(底部图)AD活性通过用GAL4-DBD、GAL-OCT4-CAD或GAL-OCT4-CAD-酸性突变体转染的小鼠ES细胞的荧光素酶活性来测量。
图24A-24C显示多种TF与介体小液滴相分离。(图24A)(左侧图)多种蛋白质类别的百分比无序(x轴),其针对那一类别的无序蛋白质的累积分数(y轴)作图。(右侧图)转录因子(TF)DNA结合域(DBD)和推定活化域(AD)的无序含量。(图24B)小液滴形成的代表性图像,其测定所指示的TF的同型小液滴形成。重组MYC-GFP(12uM)、p53-GFP(40uM)、NANOG-GFP(10uM)、SOX2-GFP(40uM)、RARa-GFP(40uM)、GATA-2-GFP(40uM)和ER-GFP(40uM)添加至具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中。(图24C)小液滴形成的代表性图像,其显示所有测试的TF均并入至MED1-IDR小液滴中。10uM MED1-IDRmCherry和10uM MYC-GFP、p53-GFP、NANOG-GFP、SOX2-GFP、RARa-GFP、GATA-2-GFP或ER-GFP添加至具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中。
图25A-25E显示雌激素刺激雌激素受体与MED1的相分离。(图25A)雌激素刺激的基因活化的示意图。雌激素通过结合ER的配体结合域(LBD)而促进ER与介体和RNAPII的相互作用,所述配体结合域使MED1-IDR内的LXXLL基序的结合袋暴露。(图25B)用于重组蛋白产生的MED1-IDRXL和MED1-IDR的示意视图。(图25C)小液滴形成的代表性图像,其测定ER-GFP和MED1-IDRXL-mCherry的同型小液滴形成。用具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中的所指示蛋白质浓度执行。(图25D)小液滴形成的代表性共聚焦图像,其显示ER并入至MED1-IDRXL小液滴中并且雌激素的添加显著增强异型小液滴形成。ER-GFP、在雌激素存在下的ER-GFP或GFP与MED1-IDRXL混合。10uM各所指示的蛋白质添加至具有125mMNaCl和10%PEG-8000的小液滴形成缓冲液中。(图25E)ER-GFP、在雌激素存在下的ER-GFP或GFP的MED1-IDRXL小液滴中的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。
图26A-26G显示TF-共活化子相分离依赖于反式活化所需的残基。(图26A)小液滴形成的代表性共聚焦图像,GCN4-GFP或MED15-mCherry添加至具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中。(图26B)小液滴形成的代表性图像,其显示GCN4与MED15形成小液滴。GCN4-GFP和mCherry或GCN4-GFP和MED15-mCherry以10uM添加至具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中并且在具有所指示的滤光片的荧光显微镜中成像。(图26C)(顶部行)由活化域(AD)和DNA结合域(DBD)构成的GCN4蛋白的示意图。AD的疏水性补丁中的芳香族残基由蓝色线标记。所述疏水性补丁中的所有11个芳香族残基均突变为丙氨酸(A)以产生GCN4-芳香族突变体。(底部行)小液滴形成的代表性图像,其显示GCN4芳香族突变体与MED15形成小液滴的能力减弱。GCN4-GFP或GCN4-芳香族突变体-GFP和MED15-mCherry各自以10uM添加至具有125mM NaCl和10%PEG-8000的小液滴形成中。(图26D)(上部图)小液滴形成的代表性图像,其显示GCN4野生型而非GCN4芳香族突变体并入至介体复合物小液滴中。10uM GCN4-GFP或GCN4-芳香族突变体-GFP在具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中与纯化的介体复合物混合。(图26E)(左侧图)Lac测定的示意图。携带Lac操纵子的50,000个重复序列的U2OS细胞用Lac结合域-CFP-AD融合蛋白转染。(右侧图)用所指示的Lac结合蛋白构建体转染的Lac-U2OS细胞中的MED1的IF。(图26F)GAL4活化测定。融合至GAL4DBD的所指示活化域的转录输出,如通过293T细胞中的荧光素酶活性所测量。(图26G)显示在超级增强子处形成相分离凝聚物以驱动基因活化的转录因子和共活化子的模型。在这一模型中,转录凝聚物并入动态和结构化相互作用两者。
图27显示随机焦点分析。定中心于所指示的RNA FISH焦点处的平均荧光(顶部图)对X和Y中随机分布的IF焦点+/-1.5微米(底部图)。彩色比例尺提供荧光强度的任意单位。
图28A-28F显示OCT4降解和ES细胞分化。(图28A)Oct4-FKBP细胞工程改造策略的示意图。V6.5小鼠ES细胞用修复载体和表达Cas9的质粒转染以产生具有用于选择的BFP或RFP的基因敲入基因座(左侧)。针对OCT4点出印迹的WT或未处理OCT4-dTAG ES细胞,其显示大小、HA(在FKBP上)和肌动蛋白的预期转变(右侧)。(图28B)针对用dTag47或媒介物(DMSO)处理的OCT4降解决定子株(dTAG)中的OCT4(左侧图)、MED1(右侧图)和β-肌动蛋白的Western印迹。(图28C)用DMSO处理对用dTAG处理的OCT4-降解决定子细胞中的Nanog DNAFISH焦点内的MED1免疫荧光信号的平均强度。N=5张图像,误差棒是第10个与第90个百分比之间的分布。(图28D)显示用于分化和ES细胞中的OCT4(P1)和MED1(P2)ChIP-qPCR的引物在MiR290基因座处的位置的示意图。(图28E)针对ES细胞或通过LIF戒断分化的细胞中的MED1和β-肌动蛋白的Western印迹。(图28F)ES细胞对通过LIF戒断分化的细胞中的MiR290DNA FISH焦点内的MED1免疫荧光信号的平均强度。N=5张图像,误差棒是第10个与第90个百分比之间的分布。
图29A-29F显示MED1和OCT4小液滴形成。(图29A)在具有10%PEG-8000和125mMNaCl的小液滴形成缓冲液中形成的MED1-IDR-mCherry小液滴中的OCT4-GFP对GFP的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。(图29B)在10%PEG-8000、125mM盐和10uM各蛋白质中形成的MED1-IDR-OCT4小液滴的以平方微米计的面积。(图29C)在10%PEG-8000、125mM和10uM各蛋白质中形成的MED1-IDR-OCT4小液滴的纵横比。N>20,误差棒表示第10个与第90个百分比之间的分布。(图29D)在10%PEG-8000、125mM、225uM或300uM盐和10uM各蛋白质中形成的MED1-IDR-OCT4小液滴的以平方微米计的面积。(图29E)在不具有拥挤剂的情况下在50mM NaCl下针对所指示的蛋白质或蛋白质组合(各自10uM)的小液滴形成的荧光显微术,在所述图的顶部所指示的通道中成像。(图29F)在50mM NaCl下不具有拥挤剂的小液滴形成缓冲液中形成的MED1-IDR-mCherry小液滴中的OCT4-GFP对GFP的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。
图30A-30E显示突变型OCT4的相分离。(图30A)具有10%PEG-8000和125mM NaCl的小液滴形成缓冲液中在所指示的浓度下的所指示的经TMR标记的多肽的荧光显微术。(图30B)在MED1-IDR-mCherry小液滴内的所指示的多肽的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。(图30C)在MED1-IDR-mCherry小液滴内的所指示的蛋白质的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。(图30D)(上部图)OCT4蛋白的示意图,活化域(AD)中的芳香族残基通过蓝色水平线标记。N端活化域(N-AD)中的所有9个酸性残基和C端活化域(C-AD)中的10个酸性残基突变为丙氨酸以产生OCT4-芳香族突变体。(下部图)小液滴形成的代表性共聚焦图像,其显示所述OCT4芳香族突变体仍并入至MED1-IDR小液滴中。MED1-IDR-mCherry和OCT4-GFP或MED1-IDR-mCherry和OCT4-芳香族突变体-GFP各自以10uM添加至具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(图30E)完整介体复合物的小液滴通过集结成粒加以收集并且相等体积的输入、上清液和集结粒在SDS-PAGE凝胶上跑胶并且用sypro ruby染色。存在于集结粒中的介体亚单元在最右列中进行批注。
图31A-31B显示不同TF与介体相分离。(图31A)在MED1-IDR-mCherry小液滴内的所指示的GFP融合TF的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。(图31B)在具有10%PEG-8000和125mM NaCL的小液滴形成缓冲液中形成的异型p53-GFP/MED1-IDR-mCherry小液滴的FRAP,经30秒每秒成像。
图32A显示雌激素受体与MED1相分离。在10uM雌激素存在或不存在下MED1-IDR-mCherry小液滴中的ER-GFP的富集比。小液滴形成于具有125mM NaCl的10%PEG-8000中。N>20,误差棒表示第10个与第90个百分比之间的分布。
图33A-33G显示GCN4和MED15形成相分离小液滴。(图33A)在具有10%PEG-8000和125mM NaCl的小液滴形成缓冲液中,GCN4-GFP小液滴中的mCherry或MED15-mCherry的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。(图33B)在具有10%PEG-8000和125mM NaCl的小液滴形成缓冲液中形成的异型GCN4-GFP/MED15-IDR-mCherry小液滴的FRAP,经30秒每秒成像。(图33C)以所指示的浓度添加至具有10%PEG-8000和125mM盐的小液滴形成缓冲液中的GCN4-GFP和MED15-mCherry的相图。(图33D)来自图33C的GCN4小液滴的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。(图33E)在10%PEG-8000和125mM NaCl中处于所指示的浓度下的GCN4-GFP或GCN4-GFP的芳香族突变体的荧光成像。示出来自GFP通道的图像。(图33F)在具有10%PEG-8000和125mM盐的小液滴形成缓冲液中形成的MED15-mCherry小液滴中的GCN4-GFP或GCN4-GFP的芳香族突变体的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。(图33G)介体复合物小液滴中GFP、GCN4-GFP或GCN4-芳香族突变体-GFP的富集比。N>20,误差棒表示第10个与第90个百分比之间的分布。
图34显示他莫昔芬抑制ER介导的基因活化和ER与MED1的相分离。顶部左侧显示他莫昔芬结合于雌激素受体(ER)的配体结合域(LBD)。底部右侧显示在GAL4反式活化测定中,ER介导的基因活化的转录输出依赖于雌激素并且通过他莫昔芬阻断。左侧是在雌激素存在下含有LXXL结合袋(MED1-IDRXL)形式凝聚物的经GFP标记ER和经mCherry标记MED1-IDR的共聚焦显微术图像,但这一雌激素依赖性凝聚物形成由他莫昔芬阻断。
图35显示已知ER在雌激素刺激时建立超级增强子并且MED1在ER+乳腺癌中过表达(顶部右侧图)。MED1是ER功能和ER+乳腺癌肿瘤生成所需。
图36显示配体结合的NHR(核激素受体(例如,核受体))在诱导性超级增强子处建立转录凝聚物(TC)。这些TC的改变是肿瘤生成的机制。发展的致癌凝聚物是使得细胞在癌症中发展药物抗性的机制并且现有抗肿瘤药物可靶向致癌转录凝聚物。鉴于此,TC是针对致癌-转录因子介导的疾病的合理靶。
图37显示ER凝聚物(左列-绿色)、MED1-IDRXL凝聚物(中间列-红色)和MED1-IDRXL/ER凝聚物(右列-橙色)的共聚焦显微术图像。底部右侧图显示雌激素(10uM)刺激ER并入至MED1-IDRXL凝聚物中。这一并入依赖于MED-IDR中LXXL袋的存在。
图38显示ER凝聚物(左列-绿色)、MED1-IDRXL凝聚物(中间列-红色)和MED1-IDRXL/ER凝聚物(右列-橙色)的共聚焦显微术图像。中间右侧图显示雌激素刺激ER并入至MED1-IDRXL凝聚物中。底部右侧图显示他莫昔芬(100uM)在雌激素(10uM)存在下减弱ER并入至MED1-IDRXL凝聚物中。
图39显示野生型雌激素受体LBD介导的Med1凝聚和基因活化由雌激素刺激并且由他莫昔芬减弱。Lac结合域-CFP-ER活化域融合蛋白被引入至携带Lac操纵子阵列的U2OS细胞中。共聚焦显微术图像的上方集合显示指示所述融合蛋白的CFP信号的图像并且图的下方集合显示关于介体的免疫荧光。引入10nM雌激素(+E)持续45分钟会增加LBD介导的Med1凝聚,而引入1uM他莫昔芬(+T)持续45分钟会减弱LBD介导的Med1凝聚。底部条形图显示转录输出,如通过融合至GAL4DBD的所指示的活化域的荧光素酶活性所测量。引入10nM雌激素(+E)会增加报告基因转录输出,而引入10nM他莫昔芬(+T)不会增加报告基因转录输出。在所述测定中,细胞被剥夺雌激素持续2天并且接着用雌激素或他莫昔芬处理持续24小时。
图40显示内分泌抵抗型患者突变能够引起雌激素独立Med1凝聚和基因活化。Lac结合域-CFP-ER活化域(ER)融合蛋白、Lac结合域-CFP-突变型(Y537S)ER活化域融合蛋白或Lac结合域-CFP-ER突变型(D538G)活化域融合蛋白被引入至携带Lac操纵子阵列的U2OS细胞中。共聚焦显微术图像的上方集合显示CFP信号,其指示在雌激素存在(E+)或不存在(E-)下融合蛋白的存在。雌激素显著增加野生型ER的凝聚物形成,但不会显著影响任一突变体的凝聚物形成。共聚焦显微术图像的下方集合显示在雌激素存在(E+)或不存在(E-)下的介体免疫荧光。雌激素显著增加野生型ER的凝聚物形成,但不会显著影响任一突变体的凝聚物形成。底部条形图显示转录输出,如通过在雌激素存在(E+)或不存在(E-)下融合至GAL4DBD的所指示的活化域的荧光素酶活性所测量。雌激素引起必定大于任一突变体的关于WT ER活化域的转录输出的增加。与图39中相同的实验条件。
图41显示内分泌抵抗型ER患者突变展现配体独立凝聚物形成。共聚焦显微术图像的顶部两行显示在雌激素存在下的MED1/ER凝聚物形成。这一凝聚物形成通过他莫昔芬的进一步添加减弱。底部两行显示MED1/突变型ER(Y537S)凝聚物形成不受他莫昔芬的添加影响。
图42显示雌激素刺激在MYC致癌基因处的MED1凝聚物形成。共聚焦显微术图像的顶部行显示MED1和Myc在雌激素不存在下不会共定位。显微照片的底部行显示在雌激素存在下在MYC处的MED1凝聚物形成。
图43A-43I显示MeCP2和HP1α存在于液体样异染色质凝聚物中。(图43A)鼠科动物ESC中的内源标记MeCP2-GFP和Hoechst DNA染色的活细胞共聚焦显微术。(图43B)鼠科动物ESC中的内源标记HP1α-mCherry和Hoechst DNA染色的活细胞共聚焦显微术。(图43C)鼠科动物ESC中的双重内源标记MeCP2-GFP和HP1α-mCherry的活细胞成像。(图43D)使用经内源标记MeCP2-GFP鼠科动物ESC的FRAP实验的共聚焦显微术图像。漂白后图像显示在光漂白事件之后12秒恢复。(图43E)关于MeCP2-GFP异染色质凝聚物的FRAP数据的定量。光漂白事件发生于t=0s处。展示7个事件的平均值和标准误差。(图43F)使用经内源标记HP1α-mCherry鼠科动物ESC的FRAP实验的共聚焦显微术图像。漂白后图像显示在光漂白事件之后12秒恢复。(图43G)关于HP1α-mCherry异染色质凝聚物的FRAP数据的定量。光漂白事件发生于t=0s处。展示7个事件的平均值和标准误差。(图43H)图展示关于MeCP2和HP1α异染色质凝聚物的光漂白恢复的半衰期。展示7个事件的平均值和标准误差。(图43I)图展示异染色质凝聚物内的MeCP2和HP1α的动态比。展示7个事件的平均值和标准误差。
图44A-44J显示MeCP2形成体外相分离的液体小液滴。(图44A)人MeCP2蛋白的示意图。指示了结构化甲基-结合域(MBD)和固有无序区(IDR-1和IDR-2)。沿所述蛋白质的预测无序分数使用PONDR VSL2算法来计算。每个残基的净电荷使用5个氨基酸的滑动窗来计算。(图44B)使用增加浓度的MeCP2-GFP的小液滴形成测定的共聚焦显微术。(图44C)展示在增加浓度的MeCP2-GFP上的小液滴面积分布的点图。关于各条件,分析400个小液滴。(图44D)展示在增加的蛋白质浓度下小液滴中的MeCP2-GFP的凝聚蛋白质分数的条形图。展示10个图像的平均值和标准偏差。(图44E)体外MeCP2-GFP小液滴融合的延时成像。(图44F)体外MeCP2-GFP小液滴FRAP的成像。(图44G)在小液滴形成反应中在增加的盐浓度存在下执行的使用MeCP2-GFP的小液滴形成测定的共聚焦显微术。(图44H)展示在小液滴形成反应中在增加浓度的NaCl上的小液滴面积分布的点图。关于各条件,分析400个小液滴。(图44I)展示在增加的盐浓度下小液滴中的MeCP2-GFP的凝聚蛋白质分数的条形图。展示10个图像的平均值和标准偏差。(图44J)随蛋白质和盐浓度而变的MeCP2-GFP小液滴形成的相图。阳性条件由经过填充的圆形指示。
图45A-45E显示MeCP2凝聚物形成依赖于C端IDR。(图45A)MeCP2蛋白的示意图,其指示MBD、IDR-1、IDR-2并且展示用于体外小液滴形成和活细胞成像测定的全长(FL)和两种不同的截短蛋白质。线图展示在关于沿MeCP2的各氨基酸位置的RettBASE数据库中发现的在雌性雷特综合征患者中的MECP2编码突变的数目。无义、移码和错义突变的位置在下文中用MeCP2蛋白域的示意图显示。(图45B)使用MeCP2-GFP全长(FL)和IDR截短突变体(ΔIDR-1和ΔIDR-2)的小液滴形成测定的共聚焦显微术。(图45C)在鼠科动物ESC中产生的三种不同的经内源标记MeCP2-GFP株的活细胞共聚焦显微术。FL:全长MeCP2-GFP,ΔIDR-1:IDR-1缺失,和ΔIDR-2:IDR-2缺失。(图45D)相对于不同的经内源标记株的核原生质,在异染色质小体处的MeCP2-GFP分配系数的定量。展示10个细胞的平均值和标准偏差。(图45E)具有全长(FL)、ΔIDR-1和ΔIDR-2的鼠科动物ESC中的主要卫星重复序列表达的RT-qPCR。表达针对FL和Gapdh标准化。展示3个重复样品的平均值和标准偏差。
图46A-46D显示MeCP2凝聚物可区域化异染色质因子。(图46A)核萃取物小液滴形成测定的示意图。(图46B)含有MeCP2-mCherry和MeCP2-ΔIDR-2-mCherry的核萃取物小液滴形成测定的共聚焦显微术图像。小液滴形成通过将萃取物的盐浓度降低至150mM NaCl来启动。(图46C)关于所指示的蛋白质的免疫印迹,其展示在10%输入材料中发现的相对蛋白量和在2700xg下离心之后核萃取物小液滴形成测定的集结粒部分。(图46D)图46C中的免疫印迹的定量。线图显示关于所检察的各蛋白质,在集结粒部分中发现的各小液滴形成反应中的输入的百分比。
图47A-47D显示MeCP2-IDR-2优先地分配至异染色质凝聚物中。(图47A)MeCP2 IDR分配实验的卡通图。关于mCherry-MeCP2-IDR-2或单独mCherry,细胞用表达构建体转染。致力于异染色质凝聚物的能力通过相对于核原生质选择性地分配至异染色质凝聚物中的能力来评估。(图47B)具有MeCP2-IDR-2或mCherry对照物的过表达的鼠科动物ESC的活细胞共聚焦显微术图像。盒指示异染色质凝聚物。(图47C)具有MeCP2-IDR-2或mCherry对照物的过表达的鼠科动物ESC中的异染色质凝聚物的另外的图像放大实例。比例尺表示1μm。(图47D)相对于核原生质在异染色质凝聚物处的分配系数的定量。展示5个重复样品的平均值和标准偏差。
图48A-48F显示MeCP2浓缩于小鼠脑的神经元的异染色质中。(图48A)来自高级嵌合MeCP2-GFP小鼠的经内源标记MeCP2-GFP脑切片的固定细胞共聚焦显微术。使用关于MAP2和PU.1的免疫染色来分别鉴定神经元和小胶质细胞。从2月龄小鼠收集10μm厚度的脑切片。(图48B)神经元和小胶质细胞中每个细胞的MeCP2-GFP凝聚物数目的定量。数据以3个细胞的平均值±标准偏差表示。(图48C)神经元和小胶质细胞中每个细胞的MeCP2-GFP凝聚物数目的定量。数据关于神经元以18种凝聚物的平均值±标准偏差表示并且关于小胶质细胞以28种凝聚物的平均值±标准偏差表示。(图48D)对取自2月龄、经内源标记MeCP2-GFP嵌合小鼠的急性脑切片执行的FRAP实验的活细胞共聚焦显微术图像。漂白后图像展示在光漂白事件之后12秒恢复。(图48E)关于活脑中的MeCP2-GFP异染色质凝聚物的FRAP数据的定量。光漂白事件发生于t=0s处。展示3个事件的平均值和标准误差。(图48F)来自高级嵌合MED1-GFP小鼠的脑切片中的经内源标记MED-GFP的固定细胞共聚焦显微术。从2月龄小鼠收集10μm厚度的脑切片。
图49A-49B显示MeCP2-GFP和HP1α-mCherry凝聚物数目和体积。(图49A)MeCP2-GFP和HP1α-mCherry凝聚物数目/细胞的定量。n=5个细胞。(图49B)MeCP2-GFP和HP1α-mCherry凝聚物体积的定量。MeCP2,n=45种凝聚物。
图50A-50D显示MeCP2形成体外相分离的液体小液滴。(图50A)人MeCP2蛋白的展开示意图,其中根据展示MeCP2的氨基酸位置的残基图,线条图显示人MeCP2蛋白序列的进化保守性。保守性是计算为Jensen-Shannon散度,其中较高值指示较大序列保守性。(图50B)使用160nM MeCP2-GFP的小液滴形成测定的共聚焦显微术图像。(图50C)使用10μM HP1α-mCherry的小液滴形成测定的共聚焦显微术图像。(图50D)随蛋白质和盐浓度而变的MeCP2-GFP小液滴形成的相图的图像。
图51说明细胞核中的信号传导因子和转录凝聚物相互作用。
图52A-52D显示信号传导因子体内在超级增强子处形成信号传导依赖性凝聚物。(图52A)关于β-连环蛋白、STAT3、SMAD3和MED1的免疫荧光,其中关于Nanog新生RNA的并行RNA-FISH证明了在mES细胞中的Nanog超级增强子处存在信号传导因子的凝聚核焦点。细胞在CHIR99021、LIF和活化素A存在下生长持续24小时以在固定之前24小时分别活化WNT、JAK/STAT和TGF-β信号传导途径。使用Hoechst染色来测定以虚线突出显示的核外周。100x物镜用于在转盘式共聚焦显微镜上成像。显示来自至少10张图像的定中心于关于各信号传导因子的RNA-FISH焦点上的平均RNA-FISH信号和平均IF信号。在随机选择的核位置周围的平均信号传导因子IF信号展示于最右侧图中。比例尺指示5μm。(图52B)ChIP-seq迹线,其展示mES中的β-连环蛋白、STAT3、SMAD3和MED1在与Nanog基因缔合的超级增强子处的占有率。读数密度以每仓每百万个读数(rpm/仓)展示并且超级增强子以红色条指示。(图52C)mES细胞在未受刺激或受刺激条件下关于信号传导因子β-连环蛋白、STAT3和SMAD3的免疫荧光。细胞用CHIR99021、LIF或活化素A刺激持续24小时以在固定之前24小时分别活化WNT、JAK/STAT和TGF-β信号传导途径。使用Hoechst染色来测定以虚线突出显示的核外周。100x物镜用于在转盘式共聚焦显微镜上成像。比例尺指示5μm。(图52D)左侧:经mEGFP-β-连环蛋白工程改造的HCT116细胞的FRAP实验的代表性图像。黄色盒突出显示经历靶向漂白的色斑。右侧:关于mEGFP-β-连环蛋白色斑的FRAP数据的定量。漂白事件发生于t=0处。关于漂白区域和未漂白对照物,减去背景的荧光强度相对于漂白前时间点(t=-4s)作图。数据以平均值+/- SEM(N=9)作图。使用具有Airyscan检测器和63x物镜的Zeiss LSM 880共聚焦显微镜拍摄图像。比例尺指示2μm。
图53A-53C显示纯化的信号传导因子可形成体外凝聚物。(图53A)用于这一原稿中的信号传导因子的域结构。DBD:DNA结合域,PID:蛋白质相互作用域,CC:卷曲螺旋域,DD:二聚化域,SH2:Src同源域2。预测固有无序区(IDR)以红色托架指示。(图53B)测试mEGFP-β-连环蛋白、mEGFP-STAT3和mEGFP-SMAD3的同型小液滴形成的小液滴形成测定的浓度系列的代表性共聚焦图像。单独mEGFP作为对照物包括在内(左侧图)。关于信号传导因子的分配比的定量(右侧图)。关于在所测试的所有浓度下采集的至少10张图像,分配比通过将小液滴内部的平均荧光信号除以小液滴外部的平均荧光信号来计算。所有测定均在125mM NaCl存在下执行并且10%PEG-8000用作拥挤剂。比例尺指示2μm。(图53C)关于信号传导因子的稀释小液滴测定。原始小液滴在1.25μM下形成并且成像。剩余反应混合物接着用含有4M NaCl的反应缓冲液稀释2倍以获得2M NaCl的最终盐浓度。展示在稀释之前和之后小液滴的代表性图像。
图54A-54D显示纯化的信号传导因子并入至体外介体凝聚物中。(图54A)添加信号传导因子至预先存在的MED1-IDR小液滴中的示意图。形成mCherry-MED1-IDR小液滴并且放置于玻璃皿中,并且在添加经mEGFP标记的信号传导因子之前和之后成像。(图54B)信号传导因子并入至MED-IDR小液滴中的代表性图像。预先形成的mCherry-MED1-IDR小液滴在经mEGFP标记的信号传导因子溶液的添加前和后成像,持续总计10min。在成像采集开始之后30sec添加信号传导因子。所展示的最后一张图像对应于成像终点。在PEG-8000存在下的10μM MED1-IDR-mCherry用于小液滴形成并且在PEG-8000不存在下添加10uM mEGFP-β-连环蛋白、mEGFP-SMAD3或mEGFP-STAT3。比例尺指示2μm。(图54C)关于预先形成的MED1-IDR-mCherry小液滴计算分配比,所述小液滴使用与B中相同的条件与稀的经GFP标记信号传导因子混合。至少10张图像用于定量。小液滴被召集于合并通道上并且关于在小液滴内部的区域中的经GFP标记因子的信号强度与小液滴外部的区域的强度相比。星号指示通过t测试获得的p值<0.05。(图54D)使用接近生理浓度的β-连环蛋白、STAT3和SMAD3的限制稀释小液滴测定。所指示浓度的信号传导因子添加至单独小液滴形成缓冲液(125mM NaCL和10%PEG-8000)或与10μM MED1-IDR组合的小液滴形成缓冲液中。比例尺指示2μm。
图55A-55E显示β-连环蛋白的相分离依赖于芳香族氨基酸。(图55A)所测试的不同mEGFP-β-连环蛋白截短蛋白的图。(图55B)测试mEGFP-β-连环蛋白、mEGFP-N端-IDR、mEGFP-Armadillo和GFP-C端-IDR的同型小液滴形成的小液滴形成测定的浓度系列的代表性共聚焦图像。小液滴测定在125mM NaCL和10%PEG-8000中执行。(图55C)测试野生型mEGFP-β-连环蛋白、芳香族突变型mEGFP-β-连环蛋白和mEGFP的同型小液滴形成能力的小液滴形成测定的浓度系列的代表性共聚焦图像。小液滴测定在125mM NaCl和10%PEG-8000中执行。比例尺指示1μm。用于上文所示的所述实验中的野生型mEGFP-β-连环蛋白和芳香族至丙氨酸突变体的域结构的示意图。(图55D)使10μM MED1-IDR-mCherry与10μM野生型mEGFP-β-连环蛋白或芳香族突变型mEGFP-β-连环蛋白混合的异型小液滴形成测定的代表性共聚焦图像。比例尺指示1μm。(图55E)关于至少10张图像每一者定量因子的分配比。小液滴被召集于合并通道上并且关于在小液滴内部的区域中的因子的信号强度与小液滴外部的区域的强度相比。
图56A-56C显示β-连环蛋白的寻址和靶基因的活化依赖于芳香族氨基酸。(图56A)ChIP实验的示意图。经TdTomato标记野生型或芳香族突变型β-连环蛋白在多西环素诱导性启动子下稳定地整合于mES细胞中。多西环素在交联之前24小时添加至培养基中。使用针对TdTomato的抗体执行ChIP。TRE=四环素反应性元件。(图56B)(顶部)异位表达的野生型或芳香族突变型β-连环蛋白在Myc、Sp5和Klf4增强子处的ChIP-qPCR。误差棒指示三个重复样品的标准偏差。星号指示通过t测试获得的p值<0.05。(底部)在野生型或芳香族突变型β-连环蛋白的异位表达之后Myc、Sp5和Klf4的mRNA水平的RT-qPCR。误差棒指示三个重复样品的标准偏差。星号指示通过t测试获得的p值<0.05。(图56C)使用含有共有TCF/LEF基序的10个拷贝的合成WNT-报告基因的荧光素酶测定,野生型或芳香族突变型β-连环蛋白在HEK293T细胞中过表达。显示3个生物重复样品的平均值。误差棒显示标准偏差。星号指示通过t测试获得的p值<0.05。
图57A-57E显示β-连环蛋白-凝聚物相互作用可独立于TCF因子发生。(图57A)用Lac结合域-CFP或Lac结合域-CFP-MED1-IDR构建体转染的Lac-U2OS细胞中的β-连环蛋白的免疫荧光,用转盘式共聚焦显微镜上的100x物镜成像。使用Hoechst染色来测定以虚线突出显示的核外周。定量显示CFP焦点中β-连环蛋白的相对强度。比例尺指示5μm。(图57B)用Lac结合域-CFP-MED1-IDR构建体转染的Lac-U2OS细胞中的TCF4的IF。使用转盘式共聚焦显微镜上的100x物镜获得图像。比例尺指示5μm。(图57C)用Lac结合域-CFP或Lac结合域-CFP-MED1-IDR构建体共转染的U2OS 2-6-3细胞中的过表达的经TdTomato标记野生型或芳香族突变型β-连环蛋白的荧光成像,用转盘式共聚焦显微镜上的100x物镜成像。使用Hoechst染色来测定以虚线突出显示的核外周。定量显示所谓的CFP焦点中过表达的β-连环蛋白形式的相对强度。比例尺指示5μm。(图57D)关于在HEK293T细胞中的SOX9、SMAD7、KLF9或GATA3增强子处的β-连环蛋白-GFP-嵌合体的ChIP-qPCR。误差棒显示平均值的标准偏差。星号指示通过t测试获得的p值<0.05。(图57E)与含有共有TCF/LEF基序的10个拷贝的合成WNT-报告基因组合的过表达β-连环蛋白-mEGFP-嵌合体的细胞的荧光素酶测定。显示3个生物重复样品的平均值。误差棒显示标准偏差。星号指示通过t测试获得的p值<0.05。
图58A-58D显示信号传导因子体内在超级增强子处形成信号传导依赖性凝聚物。(图58A)ChIP-seq迹线,其展示β-连环蛋白、STAT3、SMAD3和MED1在miR290基因的超级增强子处的占有率。读数密度以每仓每百万个读数(rpm/仓)展示并且超级增强子以红色条指示。(图58B)关于β-连环蛋白、STAT3、SMAD3和MED1的免疫荧光,其中关于miR290新生RNA的并行RNA-FISH证明了在mES细胞中的miR290超级增强子处存在信号传导因子的凝聚核焦点。细胞在固定之前在CHIR99021、LIF或活化素A存在下生长持续24小时。使用Hoechst染色来测定以虚线突出显示的核外周。100x物镜用于在转盘式共聚焦显微镜上成像。显示来自至少10张图像的定中心于关于各信号传导因子的RNA-FISH焦点上的平均RNA-FISH信号和平均IF信号。在随机选择的核位置处的平均信号传导因子IF信号展示于最右侧图中。比例尺指示5μm。(图58C)关于β-连环蛋白的免疫荧光,其中关于Nanog的并行DNA-FISH证明了在C2C12细胞中的Nanog超级增强子处不存在信号传导因子的核焦点。细胞在固定之前在CHIR99021存在下生长持续24小时。使用Hoechst染色来测定以虚线突出显示的核外周。100x物镜用于在转盘式共聚焦显微镜上成像。显示来自至少10张图像的定中心于关于各信号传导因子的DNA-FISH焦点上的平均DNA-FISH信号和平均IF信号。在随机选择的核位置处的平均信号传导因子IF信号展示于最右侧图中。比例尺指示5μm。(图58D)显示HCT116细胞中与内源β-连环蛋白相比经内源标记mEGFP-β-连环蛋白的水平的Western印迹。
图59显示β-连环蛋白、STAT3和SMAD3的域结构。DBD:DNA结合域,PID:蛋白质相互作用域,CC:卷曲螺旋域,DD:二聚化域,SH2:Src同源域2。预测固有无序区(IDR)以红色标记。使用每个氨基酸PONDR VL3分数来预测无序并且在下文中作图。条形码图指示下文中不同氨基酸的位置。红色盒指示在所述蛋白质的预测IDR中的顶部3种过表达氨基酸。最下方图显示关于预测蛋白质的每个残基的净电荷(NCPR)。
图60A是显示在多西环素诱导性启动子下整合于mES细胞中的野生型和突变型β-连环蛋白的表达水平的western印迹。细胞用1μg/ml多西环素诱导持续24小时并且挑选关于经TdTomato标记β-连环蛋白和个别集落的表达分选的FACS并且生长以产生克隆细胞系。
图61A-61B显示β-连环蛋白的寻址和靶基因的活化依赖于芳香族氨基酸。(图61A)用Lac结合域-CFP-MED1-IDR构建体转染的U2OS2-6-3细胞中的HP1α的IF。使用转盘式共聚焦显微镜上的100x物镜获得图像。比例尺指示5μm。(图61BB)显示HEK293T细胞中野生型β-连环蛋白或IDR-mEGFP-IDR嵌合体蛋白的水平的Western印迹。组蛋白H3用作装载对照物。
图62A-62F显示Pol II的CTD整合并且浓缩于介体凝聚物中。(图62A)描绘从转录起始至延伸的转变和Pol II CTD磷酸化在这一转变中的作用的模型。在起始期间,具有低磷酸化CTD的Pol II与介体相互作用。CTD的CDK7磷酸化导致起始位点下游大约50-100bp的暂停Pol II的形成,并且后续CDK9磷酸化导致暂停释放和延伸。为简便起见,我们显示磷酸化CTD的CDK7和CDK9,导致延伸。在延伸期间,具有磷酸化CTD的Pol II与多种RNA加工因子相互作用。(图62B)小液滴实验的代表性图像,其显示具有融合至GFP的52个七肽重复序列(GFP-CTD52)的重组全长人CTD并入至人类介体复合物小液滴中。纯化的人类介体复合物(约200-300nM;参见方法)在具有135mM单价盐和10%PEG-8000或16%Ficoll-400的小液滴形成缓冲液中与10uM GFP或GFP-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(图62C)小液滴实验的代表性图像,其显示GFP-CTD52并入至MED1-IDR小液滴中。融合至mCherry的纯化的人类MED1-IDR(mCherry-MED1-IDR)在10uM下在具有125mMNaCl和10%PEG-8000或16%Ficoll-400的小液滴形成缓冲液中与3.3uM GFP或GFP-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(图62D)所述CTD浓缩至依赖于CTD重复序列长度的MED1-IDR小液滴中。融合至具有26个(GFP-CTD26)或10个(GFP-CTD10)七肽重复序列的CTD截短突变体的GFP、GFP-CTD52或GFP在10uM下在具有125mM NaCl和16%Ficoll-400的小液滴形成缓冲液中与10uM mCherry-MED1-IDR混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(图62E)在两个全长CTD/MED1-IDR小液滴之间的融合事件的图像。小液滴形成条件与图62D中相同。(图62F)GFP-CTD52和MED1-IDR-mCherry的异型小液滴的FRAP。小液滴形成条件与图62D中相同。
图63A-63D显示CTD的磷酸化降低体外CTD并入至MED1-IDR凝聚物中。(图63A)显示CDK7介导的CTD磷酸化(参见方法)引起CTD并入至MED1-IDR凝聚物中的能力的损失的代表性图像。(左侧)mCherry-MED1-IDR在10uM下在具有125mM NaCl和16%Ficoll-400的小液滴形成缓冲液中与3.3uM GFP、GFP-CTD52或GFP-phospho-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(右侧)MED1-IDR小液滴中具有或不具有CDK7介导的磷酸化的GFP-CTD52的富集比(参见方法)。GFP的富集比被设置为1。盒形图中的盒从第25个百分点延伸至第75个百分点。所述盒中间的线以中值作图。篱值减少至最小值并且增加至最大值。p值通过双尾Student氏t测试来测定。(图63B)显示CDK7介导的CTD磷酸化引起CTD并入至MED1-IDR凝聚物中的能力的损失的代表性图像。(左侧)mCherry-MED1-IDR在10uM下在具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中与3.3uM GFP、GFP-CTD52或GFP-phospho-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(右侧)MED1-IDR小液滴中具有或不具有CDK7介导的磷酸化的GFP-CTD52的富集比,如2a中所展示。(图63C)显示CDK9介导的CTD磷酸化(参见方法)引起CTD并入至MED1-IDR凝聚物中的能力的损失的代表性图像。(左侧)mCherry-MED1-IDR在10uM下在具有125mM NaCl和16%Ficoll-400的小液滴形成缓冲液中与10uM GFP、GFP-CTD52或GFP-phospho-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(右侧)MED1-IDR小液滴中具有或不具有CDK9介导的磷酸化的GFP-CTD52的富集比,如图63A中所展示。(图63D)显示CDK9介导的CTD磷酸化引起CTD并入至MED1-IDR凝聚物中的能力的损失的代表性图像。(左侧)mCherry-MED1-IDR在10uM下在具有125mM NaCl和10%PEG-8000的小液滴形成缓冲液中与10uM GFP、GFP-CTD52或GFP-phospho-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(右侧)MED1-IDR小液滴中具有或不具有CDK9介导的磷酸化的GFP-CTD52的富集比,如图63A中所展示。
图64A-64B显示剪切凝聚物出现于活性超级增强子驱动基因处。(图64A)固定的小鼠胚胎干细胞(mESC)中的SRSF2的代表性免疫荧光(IF)成像,联合Nanog和Trim28的新生RNA的RNA FISH。在右侧的前两列显示定中心于RNA FISH焦点处的平均RNA FISH信号和平均剪切因子IF信号(使用97个Nanog焦点、115个Trim28焦点)。最右列显示关于定中心于随机选择的核位置处的剪切因子的平均IF信号(参见方法)。用于Nanog和Trim28的RNA FISH探针的位置说明于其各自基因模型中。(图64B)固定的mESC中的剪切因子SRRM1和SRSF1的代表性IF成像,联合Nanog和Trim28的新生RNA的RNA FISH。在右侧的前两列显示定中心于RNA FISH焦点处的平均RNA FISH信号和平均剪切因子IF信号(关于SRRM1,使用137个Nanog焦点、209个Trim28焦点;关于SRSF1,使用109个Nanog焦点、248个Trim28焦点)。最右列显示关于定中心于随机选择的核位置处的剪切因子的平均IF信号。
图65A-65F显示磷酸化CTD与SRSF2共定位于mESC中并且体外并入并且浓缩于SRSF2小液滴中。(图65A)mESC中的MED1、SRSF2和Pol II的两种不同磷酸形式(非磷酸化或丝氨酸2磷酸化)在Nanog和Trim28基因座处的代表性ChIP-seq迹线。y轴表示每百万个读数。(图65B)在顶部20%最高度表达基因处,在从转录开始位点(TSS)至转录终止位点(TES)的基因体(具有TSS上游2kb和TES下游2kb)中关于MED1、SRSF2和Pol II的两种不同磷酸形式(非磷酸化或丝氨酸2磷酸化)的平均ChIP-seq每百万个读数(RPM)的Metagene图。(图65C)小液滴实验的代表性图像,其显示当CTD通过CDK7磷酸化时,CTD有效地并入至SRSF2小液滴中。(左侧)融合至mCherry的纯化的人SRSF2(mCherry-SRSF2)在2.4uM下在具有100mMNaCl和16%Ficoll-400的小液滴形成缓冲液中与3.3uM GFP、GFP-CTD52或GFP-phospho-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(右侧)SRSF2小液滴中具有或不具有CDK7介导的磷酸化的GFP-CTD52的富集比(参见方法)。GFP的富集比被设置为1。盒形图中的盒从第25个百分点延伸至第75个百分点。所述盒中间的线以中值作图。篱值减少至最小值并且增加至最大值。p值通过双尾Student氏t测试来测定。(图65D)小液滴实验的代表性图像,其显示当CTD通过CDK7磷酸化时,CTD有效地并入至SRSF2小液滴中。(左侧)mCherry-SRSF2在2.4uM下在具有100mM NaCl和10%PEG-8000的小液滴形成缓冲液中与3.3uM GFP、GFP-CTD52或GFP-phospho-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(右侧)SRSF2小液滴中具有或不具有CDK7介导的磷酸化的GFP-CTD52的富集比,如4c中所展示。(图65E)小液滴实验的代表性图像,其显示当CTD通过CDK9磷酸化时,CTD有效地并入至SRSF2小液滴中。(左侧)mCherry-SRSF2在2.4uM下在具有120mM NaCl和16%Ficoll-400的小液滴形成缓冲液中与10uM GFP、GFP-CTD52或GFP-phospho-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(右侧)SRSF2小液滴中具有或不具有CDK9介导的磷酸化的GFP-CTD52的富集比,如图65C中所展示。(图65F)小液滴实验的代表性图像,其显示当CTD通过CDK9磷酸化时,CTD有效地并入至SRSF2小液滴中。(左侧)mCherry-SRSF2在2.4uM下在具有120mM NaCl和10%PEG-8000的小液滴形成缓冲液中与10uM GFP、GFP-CTD52或GFP-phospho-CTD52混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。(右侧)SRSF2小液滴中具有或不具有CDK9介导的磷酸化的GFP-CTD52的富集比,如图65C中所展示。
图66A-66C显示体外CDK7和CDK9介导的CTD磷酸化,并且通过CDK7介导的CTD并入至MED1-IDR小液滴中的损失是ATP依赖性的。(图66A)显示GFP-CTD52在Ser5和Ser2残基处通过CDK7磷酸化的Western印迹。在各条件中使用等量GFP-CTD52,如通过抗GFP抗体所显示。(图66B)显示GFP-CTD52在Ser5和Ser2残基处通过CDK9磷酸化的Western印迹。在各条件中使用等量GFP-CTD52,如通过抗GFP抗体所显示。(图66C)显示CTD并入至MED1-IDR小液滴中的损失需要CDK7和ATP的代表性图像。已用重组CDK7和/或ATP孵育(参见方法)的GFP-CTD52在10uM下在具有125mM NaCl和16%Ficoll-400的小液滴形成缓冲液中与10uMmCherry-MED1-IDR混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。
图67A-67C显示SRSF2是phospho-CTD相互作用因子,并且通过CDK7介导的增强的CTD并入至SRSF2小液滴中是ATP依赖性的。(图67A)直方图,其显示来自关于使用CTD的不同磷酸形式通过下拉富集的不同介体亚单元、SR家族剪切因子和剪切体组分的质谱分析的平均iBAQ(基于强度的绝对定量)富集分数。显示来自不同分子的介体亚单元。关于剪切因子,显示在Ebmeier等人,(Cell Rep 20,1173-1186(2017))中检测的规范SR蛋白和被视为与Pol II相互作用的剪切体组分。简单说来,从Ebmeier等人(2017)下载所有样品的iBAQ分数。使用非磷酸化全长CTD(Unphos)、TFIIH磷酸化全长CTD(Phospho CDK7)或p-TEFb磷酸化全长CTD(Phospho CDK9)关于下拉对来自多个重复样品的分数求平均值。关于各蛋白质的平均iBAQ分数在y轴上作图。(图67B)用对照siRNA(左侧)或针对所指示因子的siRNA(右侧)转染的C2C12细胞中的剪切因子SRSF2、SRRM1和SRSF1的代表性免疫荧光(IF)成像。(图67C)显示增强的CTD并入至SRSF2凝聚物中需要CDK7和ATP的代表性图像。已用重组CDK7和/或ATP孵育(参见方法)的GFP-CTD52在3.3uM下在具有100mM NaCl和10%PEG-8000的小液滴形成缓冲液中与1.2uM mCherry-SRSF2混合并且在具有所指示的滤光片的荧光显微镜中进行肉眼观察。
图68A-68D显示肿瘤组织和癌细胞中的MYC致癌基因由介体凝聚物占据。(图68A)(左侧)苏木精和曙红染色的ER+人类浸润性乳房导管癌。(右侧)ER+人类乳腺癌组织中的MYC基因座的MED1或ER IF和RNA FISH的共聚焦显微术图像。(图68B)(左侧)在雌激素存在下生长的乳腺癌细胞系MCF7中的MYC基因座的ER或MED1 IF和RNA FISH的共聚焦显微术图像。(右侧)MCF7细胞中的MYC RNA FISH焦点处的MED1(顶部,n=23)或ER(底部,n=18)IF的富集分析和随机焦点分析。(图68C)MCF7细胞中的经mEGFP标记MED1的FRAP。显示于右侧的定量,n=3,平均值(绿色线),最佳拟合线(黑色实线),和95%置信区间(黑色虚线)。(图68D)所指示的癌细胞系中的MYC基因座的MED1 IF和RNA FISH的共聚焦显微术图像。
图69A-69F显示ER与介体形成雌激素依赖性、他莫昔芬敏感性凝聚物。(图69A)(左侧)未受刺激、雌激素刺激或他莫昔芬处理的MCF7细胞中的MYC基因座的MED1 IF和DNAFISH的共聚焦显微术图像。(右侧)显示在雌激素反应性致癌基因处雌激素和他莫昔芬处理对介体凝聚物的影响的模型。(图69B)MCF7细胞中在所指示的条件下的MYC表达的RT-qPCR。(图69C)(左侧)U2OS细胞中的Lac阵列的示意图。(顶部右侧)用MED1 IF显示的具有所指示的配体的Lac-CFP-ER-LBD融合蛋白的共聚焦显微术图像。(底部右侧)在Lac阵列处的MED1富集的定量,n≥8。(图69D)(顶部)经mEGFP-MED1内源标记的U2OS细胞的活细胞成像,所述细胞用LAC-mCherry-ER-LBD转染、用他莫昔芬处理并且在0和30分钟时成像。(底部)富集比的定量,在Lac阵列处,30分钟,具有所指示的配体,n=3。(图69E)(左侧)体外小液滴测定的示意图。(顶部右侧)具有所指示的配体的ER-GFP和MED1-mCherry的体外小液滴测定的共聚焦图像。(底部右侧)小液滴行为的示意图。(图69F)ER-MED1小液滴形成的相图示意图。
图70A-70G显示激素疗法抵抗性ER突变用介体组成性凝聚。(图70A)ER-MED1小液滴形成的相图示意图。(图70B)患者来源的ER点突变和易位的示意图。(图70C-图70D)体外小液滴测定,使用融合至GFP的所指示的ER突变体和具有所指示的配体的MED1-mCherry。(图70E)GAL4反式活化测定的示意图。(图70F-图70G)具有所指示的配体的GAL4-DBD ERLBD野生型或突变型蛋白的反式活化活性,n=9,星号表示在雌激素不存在下相对于ER,p<0.01。
图71A-71G显示MED1过表达促进介体凝聚。(图71A)ER-MED1小液滴形成的相图示意图。(图71B)MCF7细胞或建立的他莫昔芬抵抗性MCF7细胞系中的MED1的Western印迹。(图71C)在所指示的配体存在下在MED1的低(200nM)或高(1600nM)浓度下ER-GFP和MED1-mCherry的小液滴形成测定,在MED1通道中进行肉眼观察。定量显示于下文中,n>20。(图71D)用Lac-ER-LBD融合蛋白转染的U2OS细胞的共聚焦显微术图像(顶部行),随后MED1 IF(底部行)。定量显示于下文中,n≥8。(图71E)在低或高MED1水平存在下、在他莫昔芬存在下执行的使用GAL4-ER LBD的反式活化测定,n=9。(图71F)用他莫昔芬处理的MCF7细胞在WT或高MED1水平下的生存。定量显示于下文中,n=4。(图71G)在高MED1水平存在下的雌激素独立凝聚物形成和致癌基因活化的示意图。
图72A-72C显示肿瘤组织和癌细胞中的MYC致癌基因由介体凝聚物占据。(图72A)来自活组织检查的乳腺癌样本的临床数据。(图72B)显示MED1色斑的ER+乳腺癌活组织检查中的MED1 IF和DAPI染色的共聚焦显微术图像。(图72C)MCF7MED1-mEGFP细胞系中的MED1水平的Western印迹。
图73A-73C显示ER与介体形成雌激素依赖性、他莫昔芬敏感性凝聚物。(图73A)用于产生mEGFP-MED1 U2OS Lac细胞的基因敲入策略的示意图。(图73B)证明经mEGFP标记MED1存在于U2OS-Lac细胞中的Western印迹。(图73C)体外小液滴测定的定量显示于图2E中,n>20。
图74A-74C显示激素疗法抵抗性ER突变用介体组成性凝聚。(图74A)具有热点537和538的ER突变的频率,数据源于cBioPortal数据库中的220名患者。(图74B)并入至具有所指示的配体的MED1小液滴中的ER突变型蛋白的定量,n>20。(图74C)使用MED1 IF的ER点突变体的Lac测定。富集的定量显示于下文中,n≥8。
图75A-75B显示MED1过表达促进介体凝聚。(图75A)使用所指示的配体在增加浓度的MED1下ER-GFP和MED1-mCherry的小液滴形成测定。(图75B)在低或高MED1水平存在下、在配体不存在下执行的使用GAL4-ER LBD的反式活化测定。
具体实施方式
除非另外指示,否则本发明的实践将典型地使用在本领域的技能内的细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组核酸(例如,DNA)技术、免疫学和RNA干扰(RNAi)的常规技术。这些技术中的某些的非限制性描述发现于以下公布中:Ausubel,F.等人(编),Current Protocols in Molecular Biology,Current Protocolsin Immunology,Current Protocols in Protein Science和Current Protocols in CellBiology,均来自John Wiley&Sons,N.Y.,自从2008年12月起的版本;Sambrook,Russell和Sambrook,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring HarborLaboratory Press,Cold Spring Harbor,2001;Harlow,E.和Lane,D.,Antibodies–ALaboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,1988;Freshney,R.I.,“Culture of Animal Cells,A Manual of Basic Technique”,第5版,John Wiley&Sons,Hoboken,NJ,2005。关于治疗剂和人类疾病的非限制性信息发现于Goodman和Gilman的The Pharmacological Basis of Therapeutics,第11版,McGrawHill,2005,Katzung,B.(编)Basic and Clinical Pharmacology,McGraw-Hill/Appleton&Lange;第10版(2006)或第11版(2009年7月)中。关于基因和遗传病症的非限制性信息发现于McKusick,V.A.:Mendelian Inheritance in Man.A Catalog of Human Genes andGenetic Disorders.Baltimore:Johns Hopkins University Press,1998(第12版)或最近在线数据库:Online Mendelian Inheritance in Man,OMIMTM.McKusick-NathansInstitute of Genetic Medicine,Johns Hopkins University(Baltimore,MD)和National Center for Biotechnology Information,National Library of Medicine(Bethesda,MD),自从2010年5月1日起,ncbi.nlm.nih.gov/omim/和Online MendelianInheritance in Animals(OMIA),动物物种(人和小鼠除外)中的基因、遗传病症和品性的数据库,omia.angis.org.au/contact.shtml。本文所提及的所有专利、专利申请和其他公布(例如,科学文章、书籍、网站和数据库)均以引用的方式整体并入。在本说明书与任何所并入的参考文献之间有冲突的情况下,应以本说明书(包括其任何修改,所述修改可基于所并入的参考文献)为准。除非另外指示,否则本文中使用术语的标准公认含义。本文中使用多种术语的标准缩写。
通过靶向凝聚物的组分调节转录
凝聚物蛋白
转录凝聚物的多种蛋白质组分具有固有无序的区,也称作固有无序区(IDR)或固有无序域。这些术语中的每一者均可在本发明中互换使用。异染色质凝聚物和与mRNA起始或延伸复合物物理缔合的凝聚物的多种组分也具有IDR。IDR缺乏稳定二级和三级结构。在一些实施方案中,IDR可通过Ali,M.和Ivarsson,Y.(2018).High-throughput discoveryof functional disordered regions.Molecular Systems Biology,14(5),e8377中公开的方法鉴定。
在本文所述的组合物和方法的一些实施方案中,凝聚物组分是转录因子。如本文所用,“转录因子”(TF)是通过结合于特定DNA序列来调控转录的蛋白质。TF一般含有DNA结合域和活化域。在一些实施方案中,所述转录因子具有活化域中的IDR。在一些实施方案中,所述转录因子(TF)是OCT4、p53、MYC或GCN4、NANOG、MyoD、KLF4、SOX家族转录因子或GATA家族转录因子。在一些实施方案中,所述TF由信号传导因子调控(例如,转录通过TF与信号传导因子的相互作用加以调节)。在一些实施方案中,所述TF是核受体(例如,核激素受体、雌激素受体、视黄酸受体-α)。核受体是进化相关DNA结合转录因子的大型超家族的成员,其展现由五至六个同源域(从N末端至C末端,指定A至F)组成的特征模块结构。NR的活性至少部分地通过多种小分子配体与配体结合域中的袋的结合调控。人类基因组编码约50种NR。NR超家族的成员包括糖皮质激素、盐皮质激素、孕酮、雄激素和雌激素受体、过氧化物酶体增殖剂活化(PPAR)受体、甲状腺激素受体、视黄酸受体、类视黄醇X受体、NR1H和NR1I受体和孤儿核受体(即,直至特定日期尚未鉴定出配体的受体)。在一些实施方案中,核受体(NR)是核受体子家族0成员、核受体子家族1成员、核受体子家族2成员、核受体子家族3成员、核受体子家族4成员、核受体子家族5成员或核受体子家族6成员。在一些实施方案中,核受体是NR1D1(核受体子家族1,D族,成员1)、NR1D2(核受体子家族1,D族,成员2)、NR1H2(核受体子家族1,H族,成员2;同义词:肝X受体β)、NR1H3(核受体子家族1,H族,成员3;同义词:肝X受体α)、NR1H4(核受体子家族1,H族,成员4)、NR1I2(核受体子家族1,I族,成员2;同义词:孕烷X受体)、NR1I3(核受体子家族1,I族,成员3;同义词:组成性雄烷受体)、NR1I4(核受体子家族1,I族,成员4)、NR2C1(核受体子家族2,C族,成员1)、NR2C2(核受体子家族2,C族,成员2)、NR2E1(核受体子家族2,E族,成员1)、NR2E3(核受体子家族2,E族,成员3)、NR2F1(核受体子家族2,F族,成员1)、NR2F2(核受体子家族2,F族,成员2)、NR2F6(核受体子家族2,F族,成员6)、NR3C1(核受体子家族3,C族,成员1;同义词:糖皮质激素受体)、NR3C2(核受体子家族3,C族,成员2;同义词:醛固酮受体、盐皮质激素受体)、NR4A1(核受体子家族4,A族,成员1)、NR4A2(核受体子家族4,A族,成员2)、NR4A3(核受体子家族4,A族,成员3)、NR5A1(核受体子家族5,A族,成员1)、NR5A2(核受体子家族5,A族,成员2)、NR6A1(核受体子家族6,A族,成员1)、NR0B1(核受体子家族0,B族,成员1)、NR0B2(核受体子家族0,B族,成员2)、RARA(视黄酸受体,α)、RARB(视黄酸受体,β)、RARG(视黄酸受体,γ)、RXRA(类视黄醇X受体,α;同义词:核受体子家族2B族成员1)、RXRB(类视黄醇X受体,β;同义词:核受体子家族2B族成员2)、RXRG(类视黄醇X受体,γ;同义词:核受体子家族2B族成员3)、THRA(甲状腺激素受体,α)、THRB(甲状腺激素受体,β)、AR(雄激素受体)、ESR1(雌激素受体1)、ESR2(雌激素受体2;同义词:ERβ)、ESRRA(雌激素相关受体α)、ESRRB(雌激素相关受体β)、ESRRG(雌激素相关受体γ)、PGR(孕酮受体)、PPARA(过氧化物酶体增殖剂活化受体α)、PPARD(过氧化物酶体增殖剂活化受体δ)、PPARG(过氧化物酶体增殖剂活化受体γ)、VDR(维生素D(1,25-二羟基维生素D3)受体)。
在一些实施方案中,所述核受体是通过蛋白水解裂解产生的核受体的天然存在的截短形式,如截短的RXRα或截短的雌激素受体。在一些实施方案中,受体(例如,NR)是HSP70客户蛋白。例如,雄激素受体(AR)和糖皮质激素受体(GR)是HSP70客户蛋白。关于NR的广泛信息可发现于Germain,P.等人,Pharmacological Reviews,58:685-704,2006,其提供核受体命名法和结构的综述;和Pharmacological Reviews的同一期中关于NR子家族的综述的其他文章中。在一些实施方案中,HSP90A客户蛋白是类固醇激素受体(例如,雌激素、孕酮、糖皮质激素、盐皮质激素或雄激素受体)、PPARα或PXR。在一些实施方案中,所述核受体(NR)是配体依赖性NR。配体依赖性NR的特征在于配体与NR的结合会调节NR的活性。在一些实施方案中,配体与配体依赖性NF的结合会引起NR的构象变化,其导致例如NR的核易位、来自NR的一种或多种蛋白质的解离、NR的活化或NR的抑制。在一些实施方案中,NR是在配体结合时缺乏野生型NR的一种或多种活性(例如,NR的核易位、来自NR的一种或多种蛋白质的解离、NR的活化或NR的抑制)的突变体。在一些实施方案中,NR是具有配体结合独立活性(例如,NR的核易位、来自NR的一种或多种蛋白质的解离、NR的活化或NR的抑制)的突变体,所述活性在野生型NR中是配体依赖性的。在一些实施方案中,所述核受体当结合于同源配体时活化转录。在一些实施方案中,所述核受体是突变型核受体,其在同源配体不存在下活化转录。
NR在多种生物过程,尤其如发育、分化、生殖、免疫反应、代谢调控和异生物质代谢中以及在多种病理状态中发挥重要作用。NR表示药物靶的重要类别。NR的药理学调节(例如,通过含有NR的转录凝聚物的调节)可用于多种病症,包括癌症、自身免疫、代谢和炎症/免疫系统病症(例如,关节炎、气喘、过敏),以及移植后免疫抑制以便降低排斥的可能性。除了与内源和/或外源小分子配体相互作用以外,NR也与可调节其活性的多种内源蛋白质(如二聚化搭配物、共活化子、共抑制因子、泛素连接酶、激酶、磷酸酯酶)相互作用。
核受体配体调节一些NR的活性。一些配体刺激NR的活性。所述配体可称作“促效剂”。一些配体在促效剂不存在下不影响NR或其他配体依赖性TF的活性。然而,可称作“拮抗剂”的配体能够经由例如竞争性结合于蛋白质中与促效剂相同的结合位点或通过结合于蛋白质中的不同位点来抑制促效剂的效应。某些NR在促效剂不存在下促进低水平的基因转录(也称作基础或组成性活性)。降低核受体中的这一基础水平的活性的配体可称作反向促效剂。
在一些实施方案中,所述转录因子是列于表S3中的转录因子。在一些实施方案中,所述转录因子是与介体组分(例如,列于表S3中的介体组分)相互作用的转录因子。
在一些实施方案中,所述TF是具有通过信号传导因子调控的活性的TF。在一些实施方案中,所述信号传导因子包含IDR。在一些实施方案中,所述信号传导因子是TCF7L2、TCF7、TCF7L1、LEF1、β-连环蛋白、SMAD2、SMAD3、SMAD4、STAT1、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6或NF-κB。在本文所述的组合物和方法的一些实施方案中,信号传导因子可以是NF-kB、FOXO1、FOXO2、FOXO4、IKKα、CREB、Mdm2、YAP、BAD、p65、p50、GLI1、GLI2、GLI3、YAP、TAZ、TEAD1、TEAD2、TEAD3、TEAD4、STAT1、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6、AP-1、C-FOS、CREB、MYC、JUN、CREB、ELK1、SRF、NOTCH1、NOTCH2、NOTCH3、NOTCH4、RBPJ、MAML1、SMAD2、SMAD3、SMAD4、IRF3、ERK1、ERK2、MYC、TCF7L2、TCF7、TCF7L1、LEF1或β-连环蛋白。
在本文所述的组合物和方法的一些实施方案中,凝聚物组分是列于表S1中的蛋白质。在一些实施方案中,任何本文所述的组合物或方法中的凝聚物组分均包含列于表S1中的蛋白质的IDR。在一些实施方案中,任何本文所述的组合物或方法中的凝聚物组分均与列于表S1中的蛋白质缔合。在一些实施方案中,任何本文所述的组合物或方法中的凝聚物组分均与列于表S1中的蛋白质的IDR缔合。在一些实施方案中,凝聚物组分是列于表S3中的介体组分。
表S1:蛋白质和无序区(IDR):
Figure BDA0002792767850000631
Figure BDA0002792767850000641
Figure BDA0002792767850000651
Figure BDA0002792767850000661
在表S1中,“IDR长度(aa)”通过使%无序乘以蛋白质的总长度来计算。可使用陈述于Potenza等人,“MobiDB 2.0:an improved database of intrinsically disorderedand mobile proteins,”Nucleic Acids Res.2015年1月;43(数据库问题):D315-20中的方法来获得关于给定蛋白质的%无序,所述文献整体并入本文中。
这些无序区中的多种氨基酸序列基序或偏差已得到鉴定。
表S2:基序的列表:
基序_ID 基序 宽度
基序_1 SYSPTSP(SEQ ID NO:1) 7
基序_2 QQQQQ(SEQ ID NO:2) 5
基序_3 PCETHETGTTHTATT(SEQ ID NO:3) 15
基序_4 EEEGEEEEEEE(SEQ ID NO:4) 11
基序_5 MEPAQMEVAQIEPAP(SEQ ID NO:5) 15
基序_6 DKRISICASDKRIAC(SEQ ID NO:6) 15
基序_7 HHHHH(SEQ ID NO:7) 5
基序_8 GRPETPKQK(SEQ ID NO:8) 9
基序_9 FFPQRQF(SEQ ID NO:9) 7
基序_10 QHRLQQAQLLRRRMA(SEQ ID NO:10) 15
基序_11 RKKEKKEKKKKRKKE(SEQ ID NO:11) 15
基序_12 RTPMYGSQTPLHD(SEQ ID NO:12) 13
主张这些基序参与凝聚物形成、维持、溶解或调控。(图2A)。将预期与任一类型的蛋白质基序特异性相互作用的肽、核酸或小化学分子会影响凝聚物形成、组成、维持、溶解或调控并且由此导致改变使用所述基序的凝聚物的转录输出(图2B)。因此,一种或多种基因的表达可通过调节转录凝聚物受到影响。
例如,在一些实施方案中,调节转录凝聚物可调节由增强子或超级增强子(SE)控制的基因表达。如本文所用,“超级增强子”是由异常高密度的转录装置占据的增强子的团簇,某些SE调控在细胞身份中具有尤其重要作用(例如,细胞生长、细胞分化)的基因。本发明涵盖任何增强子或超级增强子的调节。示例性超级增强子公开于2013年10月25日提交的PCT国际申请号PCT/US2013/066957(代理人案号WIBR-137-WO1)中,所述PCT国际申请以引用的方式整体并入本文中。
如本文所用,短语“超级增强子组分”是指如与正常增强子或在超级增强子外部的增强子相比,具有较高局部浓度或在超级增强子处展现较高占有率并且在实施方案中促进所缔合基因的增加的表达的组分,如蛋白质。在一实施方案中,超级增强子组分是核酸(例如RNA,例如从超级增强子转录的eRNA,即eRNA)。在一实施方案中,所述核酸并非染色体核酸。在一实施方案中,所述超级增强子组分牵涉于转录的活化或调控中。在一些实施方案中,所述超级增强子组分包含RNA聚合酶II、介体、粘合素、Nipbl、p300、CBP、Chd7、Brd4以及esBAF(Brg1)或Lsd1-Nurd复合物的组分(例如,RNA聚合酶II)。
在一些实施方案中,所述超级增强子组分是转录因子。在一些实施方案中,所述转录因子是OCT4、p53、MYC或GCN4。在一些实施方案中,所述转录因子具有IDR(例如,所述转录因子的活化域中的IDR)。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的活化域。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的IDR。在一些实施方案中,所述转录因子列于表S3中。在一些实施方案中,所述转录因子是与介体组分(例如,列于表S3中的介体组分)相互作用的转录因子。如本文所用,术语“转录因子”是指使用DNA结合域结合于DNA的特定部分并且作为控制遗传信息从DNA至RNA的转移(或转录)的系统的一部分的蛋白质。如本文所用,转录活化子域(AD)是转录因子中可联合DNA结合域活化启动子的转录的区。在一些实施方案中,所述AD不包含转录因子DNA结合域。在一些实施方案中,所述AD是来自如Violaine Saint-André等人,Gen Res,2015中所定义的人类转录因子。在一些实施方案中,所述AD包含IDR。在一些实施方案中,所述IDR是至少约5、10、15、20、30、40、50、60、75、100、150个或更多个无序氨基酸(例如,相邻无序氨基酸)。在一些实施方案中,如果由D2P2(Oates等人,2013)使用的算法的至少75%预测残基是无序的,那么氨基酸被视为无序氨基酸。在一些实施方案中,可选择所鉴定AD中例如保持全长AD的活化能力的至少30%、40%、50%、60%、70%、80%、90%或90%以上的片段。
如本文所用,“增强子”是指DNA中与蛋白质(例如,转录因子)结合以增强基因的转录的短区。如本文所用,“转录共活化子”是指蛋白质或蛋白质的复合物,其与转录因子相互作用以刺激基因的转录。在一些实施方案中,所述转录共活化子是介体。在一些实施方案中,所述转录共活化子是Med1(基因ID:5469)或MED15。在一些实施方案中,所述转录共活化子是介体组分。如本文所用,“介体组分”包含氨基酸序列与天然存在的介体复合物多肽的氨基酸序列同一的多肽,或由所述多肽组成。所述天然存在的介体复合物多肽可以是例如发现于介体复合物中的大约30种多肽中的任一者,所述介体复合物出现于细胞中或从细胞纯化得到(参见例如Conaway等人,2005;Kornberg,2005;Malik和Roeder,2005)。在一些实施方案中,天然存在的介体组分是Med1-Med 31或本领域中已知的任何天然存在的介体多肽中的任一者。例如,天然存在的介体复合物多肽可以是Med6、Med7、Med10、Med12、Med14、Med15、Med17、Med21、Med24、Med27、Med28或Med30。在一些实施方案中,介体多肽是发现于Med11、Med17、Med20、Med22、Med 8、Med 18、Med 19、Med 6、Med 30、Med 21、Med 4、Med 7、Med 31、Med 10、Med 1、Med 27、Med 26、Med14、Med15复合物中的亚单元。在一些实施方案中,介体多肽是发现于Med12/Med13/CDK8/细胞周期素复合物中的亚单元。介体更详细地描述于PCT国际申请号WO 2011/100374中,所述PCT国际申请的教导以引用的方式整体并入本文中。
与参与凝聚物形成的蛋白质中的任一类型的基序特异性相互作用的肽、核酸或小化学分子(例如,本文所述的化合物、小分子、剂)可引起所述凝聚物中所述化合物的优先积聚,其可用于优先地影响凝聚物相关功能的行为。例如,所述化合物可能使所述凝聚物稳定化或溶解并且因此调节转录。在一些实施方案中,所述化合物可使所述凝聚物稳定化或溶解并且因此调节基因沉默。在一些实施方案中,所述化合物可使所述凝聚物稳定化或溶解并且因此调节mRNA起始或延伸(例如,剪切)。在一些方面,一种方法包括鉴定与列于表S2中的基序物理缔合的化合物。在一些方面,一种方法包括鉴定与核受体AD的IDR物理缔合的化合物。在一些实施方案中,所述核受体是与疾病相关的突变型核受体。在一些实施方案中,所述突变型核受体与乳腺癌相关。在本文所公开的方法和化合物的一些实施方案中,所述核受体是突变型雌激素受体(例如,雌激素受体α)(例如,Y537S ESR1、D538G ESR1)。在一些实施方案中,所述方法包括鉴定与异染色质或基因沉默凝聚物的组分相互作用的化合物(例如,与甲基化DNA、甲基-DNA结合蛋白、抑制因子或在超级增强子中的甲基化DNA相互作用的化合物)。在一些实施方案中,所述方法包括鉴定优先地与同起始或延伸复合物物理缔合的凝聚物相互作用的化合物。
因此,本发明的一些方面针对一种调节细胞中的一种或多种基因的转录的方法,所述方法包括调节与所述一种或多种基因缔合的凝聚物(例如,转录凝聚物)的形成、组成、维持、溶解和/或调控。本发明的一些方面针对一种调节基因沉默(例如,一种或多种基因的转录的抑制、异染色质中的一种或多种基因的转录的抑制)的方法,所述方法包括调节与所述一种或多种基因缔合的凝聚物的形成、组成、维持、溶解和/或调控。本发明的一些方面针对调节mRNA起始或延伸,其包含调节与起始或延伸复合物物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。
如本文所用,“调节(modulating)”(和其动词形式,如“调节(modulates)”)意指引起或促进定性或定量变化、改变或修饰。在不受限制的情况下,所述变化可以是定性或定量方面的增加或减少。
术语“增加的(increased)”、“增加(increase)”或“增强(enhance)”可以是例如增加或增强达统计学显著量。在一些情况下,例如,如与参考水平(例如,对照物)相比,要素可增加或增强达至少约10%、至少约至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约100%,并且应理解这些范围包括其中任何整数量(例如,2%、14%、28%等),为简便起见,其并未详尽列出。在其他情况下,如与参考水平相比,要素可增加或增强达至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约10倍或10倍以上。
术语“减少”、“降低(reduce)”、“降低的(reduced)”、“降低(reduction)”和“抑制”可以是例如相对于参考物(例如,对照物)减少或降低达统计学显著量。在一些情况下,如与参考水平相比,要素可例如减少或降低达至少10%、达至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%,高达并且包括例如如与参考水平相比所述要素完全不存在。应理解这些范围包括其中任何整数量(例如,6%、18%、26%等),为简便起见,其并未详尽列出。
例如,调节基因的转录包括增加或减少基因转录的速率或频率;调节凝聚物的形成包括增加或减少形成速率或是否发生形成;调节凝聚物的组成包括增加或减少与所述凝聚物缔合的组分的水平;调节凝聚物的维持包括增加或减少凝聚物维持的速率;调节凝聚物的溶解包括增加或减少凝聚物溶解的速率和预防或抑制凝聚物溶解;调节凝聚物调控包括修饰凝聚物的细胞调控。调节基因沉默包括增加或降低基因转录的抑制。调节mRNA起始或转录包括增加或减少mRNA转录起始、mRNA延伸和mRNA剪切活性。如本文所用,调节凝聚物包括调节凝聚物的形成、组成、维持、溶解和/或调控中的一者、两者、三者、四者或全部五者。在一些实施方案中,调节凝聚物包括使凝聚物的形态或形状发生变化。
如本文所用,“基因沉默”(有时也称作基因转录抑制)是指降低或消除基因的转录。如与参考水平(例如,未处理对照细胞或凝聚物)相比,基因的转录可降低达至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%、99.5%、99.9%或99.9%以上。在一些实施方案中,基因沉默与异染色质或甲基化基因组DNA相关。在一些实施方案中,基因沉默包含甲基-DNA结合蛋白与甲基化DNA的结合。在一些实施方案中,基因沉默包含修饰染色质。如本文所用,“异染色质”是指不同于正常密度(通常更大)的染色体物质,其中基因的活性受到修饰或受到抑制。在本文中的方法和组合物的一些实施方案中,异染色质是指兼性异染色质,其在特定发育或环境信号传导提示下损失其凝聚结构并且变得具转录活性。
在一些实施方案中,受到调节的一种或多种基因包含致癌基因。示例性致癌基因包括MYC、SRC、FOS、JUN、MYB、RAS、ABL、HOXI1、HOXI1 1L2、TAL1/SCL、LMO1、LMO2、EGFR、MYCN、MDM2、CDK4、GLI1、IGF2、活化EGFR、突变型基因(如FLT3-ITD、突变型TP53、PAX3、PAX7、BCR/ABL、HER2/NEU、FLT3R、FLT6-ITD、SRC、ABL、TAN1、PTC、B-RAF、PML-RAR-α、E2A-PRX1和NPM-ALK),以及PAX和FKHR基因家族的成员的融合物。其他示例性致癌基因是本领域中众所周知的。在一些实施方案中,所述致癌基因是选自由c-MYC和IRF4组成的组。在一些实施方案中,所述基因编码致癌融合蛋白,例如MLL重排、EWS-FLI、ETS融合物、BRD4-NUT、NUP98融合物。
在一些实施方案中,所述一种或多种基因与如癌症(例如,乳腺癌)的疾病的特点相关。在一些实施方案中,所述一种或多种基因与如SNP的疾病相关DNA序列变异相关。在一些实施方案中,所述疾病是阿尔茨海默氏病(Alzheimer’s disease),并且所述基因包含BIN1(例如,具有如SNP的疾病相关DNA序列变异)。在一些实施方案中,所述疾病是1型糖尿病,并且所述一种或多种基因与原代Th细胞相关(例如,具有如SNP的疾病相关DNA序列变异)。在一些实施方案中,所述疾病是系统性红斑狼疮,并且所述一种或多种基因在B细胞生物学中发挥关键作用(例如,具有如SNP的疾病相关DNA序列变异)。在一些实施方案中,所述一种或多种基因与疾病或疾患相关,所述疾病或疾患与编码核受体(例如,核激素受体、配体依赖性核受体)的基因中的突变相关。在一些实施方案中,所述一种或多种基因与所述细胞所特有的特点相关。在一些实施方案中,所述一种或多种基因异常地进行表达或与如SNP的DNA变异相关。“异常地表达”用于指示所关注的一种或多种细胞或体外凝聚物中的基因表达可检测地不同于代表在正常细胞(例如相同细胞类型的正常细胞或就培养细胞来说,在可相当条件下的培养细胞)或未经受测试处理或条件的凝聚物(例如就从细胞分离的凝聚物来说,来自相同细胞类型的正常细胞或就培养细胞来说在可相当条件下的培养细胞的分离的凝聚物)中发现的基因表达的对照水平。在一些实施方案中,所述一种或多种基因与细胞中的异常信号传导相关(例如,与WNT、TGF-β或JAK/STAT途径相关的异常信号传导)。在一些实施方案中,所述一种或多种基因包含具有异常mRNA起始或延伸(例如,异常剪切)的基因。如本文所用,“异常mRNA起始或延伸”可检测地或显著地不同于对照细胞或受试者中的mRNA起始或延伸(例如,高于或低于(如相比,增加或减少)健康细胞或受试者,或不具有特征在于非典型mRNA起始或延伸的疾病或疾患的细胞或受试者)。在一些实施方案中,所述一种或多种基因与疾病或疾患所特有的剪切变体(例如,包含多于或少于不具有所述疾病或疾患的对照受试者中的mRNA序列的mRNA序列的剪切变体)相关。在一些实施方案中,所述一种或多种基因与疾病或病症相关,所述疾病或病症与异常基因沉默相关(例如,如与健康细胞或健康受试者(例如,对照细胞或受试者)中的基因沉默相比,增加或减少的基因沉默)。在一些实施方案中,与异常基因沉默相关的疾病或病症为雷特综合征、MeCP2过表达综合征或MeCP2低表达或活性。MeCP2是指甲基CpG结合蛋白2(人类UniProt ID:P51608)。在一些实施方案中,所述一种或多种基因发现于哺乳动物细胞,例如人类细胞;胎儿细胞;胚胎干细胞或胚胎干细胞样细胞,例如来自脐静脉的细胞,例如来自脐静脉的内皮细胞;肌肉,例如肌小管、胎儿肌肉;血细胞,例如癌性血细胞、胎儿血细胞、单核细胞;B细胞,例如原B细胞;脑,例如星形细胞、脑角形回、脑前尾叶、脑扣带回、脑海马、脑颞叶下方、脑中额叶、脑癌细胞;T细胞,例如原生T细胞、记忆T细胞;CD4阳性细胞;CD25阳性细胞;CD45RA阳性细胞;CD45RO阳性细胞;IL-17阳性细胞;受PMA刺激的细胞;Th细胞;Th17细胞;CD255阳性细胞;CD127阳性细胞;CD8阳性细胞;CD34阳性细胞;十二指肠,例如十二指肠平滑肌组织;骨骼肌组织;成肌细胞;胃,例如胃平滑肌组织,例如胃细胞;CD3阳性细胞;CD14阳性细胞;CD19阳性细胞;CD20阳性细胞;CD34阳性细胞;CD56阳性细胞;前列腺,例如前列腺癌;结肠,例如结肠直肠癌;隐窝细胞,例如结肠隐窝细胞;肠,例如大肠,例如胎儿肠;骨,例如成骨细胞;胰脏,例如胰腺癌;脂肪组织;肾上腺;膀胱;食道;心脏,例如左心室、右心室、左心房、右心房、主动脉;肺,例如肺癌细胞;皮肤,例如纤维母细胞;卵巢;腰肌;乙状结肠;小肠;脾脏;胸腺,例如胎儿胸腺;乳房,例如乳腺癌;子宫颈,例如子宫颈癌;乳腺上皮;肝,例如肝细胞;DND41细胞;GM12878细胞;H1细胞;H2171细胞;HCC1954细胞;HCT-116细胞;HeLa细胞;HepG2细胞;HMEC细胞;HSMM管细胞;HUVEC细胞;IMR90细胞;Jurkat细胞;K562细胞;LNCaP细胞;MCF-7细胞;MM1S细胞;NHLF细胞;NHDF-Ad细胞;RPMI-8402细胞;U87细胞;VACO 9M细胞;VACO 400细胞;或VACO 503细胞。
在一些实施方案中,所述一种或多种基因是与类风湿性关节炎、多发性硬化、系统性硬皮病、原发性胆汁性肝硬化、克罗恩氏病(Crohn′s disease)、格雷夫斯病(Gravesdisease)、白癜风和纤维性颤动相关的疾病相关变异。在一些实施方案中,所述一种或多种基因与发育病症相关。在一些实施方案中,所述一种或多种基因与神经病症或发育神经病症相关。
在一些实施方案中,所述一种或多种基因被视为细胞类型特异性的。细胞类型特异性基因无需仅在单一细胞类型中表达,而可在一种或数种细胞类型中表达,例如多达约5种或约10种在大约200种公认细胞类型(例如,在标准组织学教科书中)和/或成年脊椎动物(例如哺乳动物,例如人)中的最丰富细胞类型外部的不同细胞类型。在一些实施方案中,细胞类型特异性基因是如下基因,其表达水平可用于区别细胞(例如,如本文所公开的细胞,如以下类型之一的细胞)与其他细胞类型的细胞:脂肪细胞(例如,白色脂肪细胞或棕色脂肪细胞)、心肌细胞、软骨细胞、内皮细胞、外分泌腺细胞、纤维母细胞、神经胶质细胞、肝细胞、角化细胞、巨噬细胞、单核细胞、黑素细胞、神经元、嗜中性粒细胞、成骨细胞、破骨细胞、胰岛细胞(例如,β细胞)、骨骼肌细胞、平滑肌细胞、B细胞、浆细胞、T细胞(例如,调控T细胞、细胞毒性T细胞、辅助性T细胞)或树突状细胞。在一些实施方案中,细胞类型特异性基因是谱系特异性的,例如,其对特定谱系(例如,造血、神经、肌肉等)具特异性。在一些实施方案中,细胞类型特异性基因是如下基因,与大多数(例如,至少80%、至少90%)或所有其他细胞类型中相比,其在给定细胞类型中更高度表达。因此,特异性可关于表达水平,例如以低水平广泛表达但在某些细胞类型中高度表达的基因可能被视为对其中高度表达所述基因的那些细胞类型具细胞类型特异性。在一些实施方案中,细胞类型特异性基因是如下基因,与大多数(例如,至少80%、至少90%)或所有其他细胞类型中相比,其在给定细胞类型中较少表达或不表达。因此,特异性可关于表达水平,例如广泛表达但在某些细胞类型中表达低得多的基因可能被视为对其中较少或完全不表达所述基因的那些细胞类型具细胞类型特异性。应理解,表达可基于细胞中的总mRNA表达(任选地包括miRNA转录物、长的非编码RNA转录物和/或其他RNA转录物)和/或基于管家基因的表达标准化。在一些实施方案中,如果与基因在那一物种的成体的至少25%、至少50%、至少75%、至少90%或90%以上细胞类型中或在细胞类型的代表性集合中的平均表达相比,基因在那一细胞中以大或小至少2倍、5倍或至少10倍的水平表达,那么所述基因被视为对特定细胞类型具细胞类型特异性。本领域技术人员应知晓含有关于多种细胞类型的表达数据的数据库,其可用于选择细胞类型特异性基因。在一些实施方案中,细胞类型特异性基因是转录因子。在一些实施方案中,细胞类型特异性基因与胚胎、胎儿或产后发育相关。
在一些实施方案中,所述转录凝聚物通过增加或减少与所述凝聚物缔合的组分(即,凝聚物组分)的价态来调节。在一些实施方案中,异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物通过增加或减少与所述凝聚物缔合的组分(即,凝聚物组分)的价态来调节。如本文所用,“价态”是指用于组分的不同结合搭配物的数目和与一种或多种结合搭配物的结合的强度两者。在一些实施方案中,“与凝聚物缔合的组分”可以是蛋白质、核酸或小分子。在一些实施方案中,所述组分是核酸(例如,RNA、eRNA)。在一实施方案中,所述核酸并非染色体核酸。在一实施方案中,所述组分牵涉于转录的活化或调控中。在一些实施方案中,所述组分包含RNA聚合酶II、介体、粘合素、Nipbl、p300、CBP、Chd7、Brd4和/或esBAF(Brg1)或Lsd1-Nurd复合物的组分(例如,RNA聚合酶II)。在一些实施方案中,所述组分是介体或介体亚单元(例如,Med1)。在一些实施方案中,所述组分是染色质调控因子(例如,BET溴域蛋白BRD4)。在一些实施方案中,所述组分是核受体配体(例如,激素)。在一些实施方案中,所述组分是信号传导因子。在一些实施方案中,所述组分是甲基-DNA结合蛋白。在一些实施方案中,所述组分是基因沉默因子。在一些实施方案中,所述组分是剪切因子。在一些实施方案中,所述组分是mRNA起始或延伸复合物(即,装置)的组分。在一些实施方案中,所述组分是RNA聚合酶。在一些实施方案中,所述组分是或包含如下酶,所述酶添加官能团(例如,甲基或乙酰基)、从染色质组分(例如,DNA或组蛋白)检测或读取或移除官能团(例如,甲基或乙酰基)。在一些实施方案中,所述组分是或包含如下酶,所述酶改变、读取或检测染色质组分(例如,DNA或组蛋白)的结构,例如DNA甲基化酶或脱甲基化酶、组蛋白甲基化酶或脱甲基化酶或组蛋白乙酰化酶或脱乙酰化酶,其书写、读取或抹除组蛋白标记(例如,H3K4me1或H3K27Ac)。在一些实施方案中,所述组分是或包含如下酶,所述酶添加官能团(例如,甲基或乙酰基)、从染色质组分(例如,DNA或组蛋白)检测或读取或移除官能团(例如,甲基或乙酰基)。在一些实施方案中,所述组分是或包含发育至或维持所选择的细胞状态或特性(例如分化、发育或疾病状态,例如癌状态或增生倾向或经历细胞凋亡的倾向)所需的蛋白质。在一些实施方案中,所述疾病状态是增生性疾病、炎症疾病、心血管疾病、神经疾病或传染病。在一些实施方案中,所述组分并非如本文所述的酶。在一些实施方案中,所述组分并非DNA甲基化酶或脱甲基化酶、组蛋白甲基化酶或脱甲基化酶和/或组蛋白乙酰化酶或脱乙酰化酶。
在一些实施方案中,所述组分是转录因子。在一些实施方案中,所述转录因子是OCT4、p53、MYC或GCN4、NANOG、MyoD、KLF4、SOX家族转录因子(例如,SRY、SOX1、SOX2、SOX3、SOX14、SOX21、SOX4、SOX11、SOX12、SOX5、SOX6、SOX13、SOX8、SOX9、SOX10、SOX7、SOX17、SOX18、SOX15、SOX30)、GATA家族转录因子(例如,GATA 1-6)或核受体(例如,核激素受体、雌激素受体、视黄酸受体-α)。在一些实施方案中,所述转录因子具有IDR(例如,所述转录因子的活化域中的IDR)。在一些实施方案中,所述核受体当结合于同源配体时活化转录。在一些实施方案中,所述核受体是突变型核受体,其在同源配体不存在下活化转录。在一些实施方案中,所述TF通过信号传导因子调控(例如,转录通过TF与信号传导因子的相互作用调节)。
在一些实施方案中,所述组分(例如,异染色质组分)是基因沉默因子或其突变体形式。在一些实施方案中,所述异染色质组分是ATRX、MECP2、WRN、DNMT1、DNMT3B、EZH2、HP1、D4Z4、ICR、核纤层蛋白A、WRN、突变型ICR IGF2-H19或突变型ICR IGF2-H19。
在一些实施方案中,所述组分是列于表S1中的蛋白质。在一些实施方案中,所述组分是列于表S3中的介体组分。在一些实施方案中,所述组分是具有列于表S2中的基序(例如,具有含基序的IDR)的蛋白质。在一些实施方案中,所述组分具有与列于表S2中的IDR相互作用的IDR。在一些实施方案中,所述组分具有IDR(例如,具有列于表S2中的基序的IDR)的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%。在一些实施方案中,所述组分具有多个IDR(例如,2、3、4、5个或更多个IDR区)。在一些实施方案中,所述组分具有至少一个IDR,其分离成多个离散区段。在一些实施方案中,所述组分是转录凝聚物的骨架的一部分。在一些实施方案中,所述组分是所述凝聚物的客户蛋白。在一些实施方案中,所述转录凝聚物通过使所述凝聚物接触与所述转录凝聚物所缔合的组分的一个或多个固有无序域或区(IDR)相互作用的剂来调节。在一些实施方案中,所述组分是介体、介体组分、MED1、MED15、GCN4、核受体配体、信号传导因子或BRD4。在一些实施方案中,所述组分是异染色质凝聚物或与mRNA起始或延伸复合物缔合的凝聚物的骨架的一部分。在一些实施方案中,所述组分是异染色质凝聚物或与mRNA起始或延伸复合物缔合的凝聚物的客户蛋白。在一些实施方案中,所述异染色质凝聚物或与mRNA起始或延伸复合物缔合的凝聚物通过使所述凝聚物接触与所述凝聚物所缔合的组分的一个或多个固有无序域或区(IDR)相互作用的剂来调节。在一些实施方案中,所述组分是介体、介体组分、MED1、MED15、GCN4、核受体配体、基因沉默因子、剪切因子或BRD4。
在一些实施方案中,所述IDR具有显示于表S2中的基序。在一些实施方案中,所述具有IDR的组分列于表S1中。在一些实施方案中,所述IDR是核受体AD的IDR。在一些实施方案中,所述组分是本文所述的任何组分。适用于本文所公开的方法的IDR不受限制。IDR可通过本领域中已知的生物信息方法鉴定。参见例如Best RB(2017年2月).“Computationaland theoretical advances in studies of intrinsically disordered proteins”.Current Opinion in Structural Biology.42:147–154;还参见http:address//d2p2.pro/about/predictors。在一些实施方案中,所述具有IDR的组分是BRD4、介体或MED1。在一些实施方案中,所述IDR具有至少5、7、10、15、20、25、30、35、40、45、50或100个氨基酸的长度。在一些实施方案中,所述IDR具有独立离散区。在一些实施方案中,所述IDR是至少约5、10、15、20、30、40、50、60、75、100、150个或更多个无序氨基酸(例如,相邻无序氨基酸)。在一些实施方案中,如果由D2P2(Oates等人,2013)使用的算法的至少75%预测残基是无序的,那么氨基酸被视为无序氨基酸。
在一些实施方案中,所述组分是介体、介体组分、MED1、MED15、p300、BRD4、TFIID、TCF7L2、TCF7、TCF7L1、LEF1、β-连环蛋白、SMAD2、SMAD3、SMAD4、STAT1、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6、NF-κB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1、激素或其变体、突变体形式或片段(例如,功能片段)。
如本文所用,蛋白质或核酸的“功能片段”展现全长蛋白质或核酸的至少一种生物活性。在一些实施方案中,所述生物活性的水平可以是全长蛋白质或核酸的生物活性的水平的至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%或至少约95%。应理解,如本文所用的“片段”包括功能片段。在一些实施方案中,所述功能片段的长度是全长蛋白质或核酸的长度的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%或至少约95%或其间任何范围。在一些实施方案中,所述功能片段包含至少一个功能域或至少两个功能域。在一些实施方案中,所述功能片段包含配体结合域和DNA结合域。在一些实施方案中,所述功能片段包含活化域和DNA结合域。在一些实施方案中,所述功能片段包含IDR。在一些实施方案中,所述生物活性可以是结合活性(例如,配体结合活性、激素结合活性、DNA结合活性、转录辅因子结合活性、基因沉默因子结合活性、mRNA结合活性)。
在一些实施方案中,功能片段可并入至异型凝聚物和/或同型凝聚物中。应理解,并入意指在相关生理学条件(例如,与细胞中的条件相同或近似的条件)或相关实验条件(例如,用于体外凝聚物形成的合适条件)下。在一些实施方案中,功能片段是下文在实施例部分中描述的凝聚物组分的片段。
在一些实施方案中,信号传导因子的功能片段可结合转录因子。在一些实施方案中,信号传导因子的功能片段具有并入至凝聚物(例如,异型凝聚物、转录凝聚物)中的能力。
在一些实施方案中,低磷酸化RNA聚合酶II C端域的功能片段是具有RNA合成生物活性和/或具有并入至凝聚物(例如,异型凝聚物、同型凝聚物、包含介体的凝聚物)中的能力的片段。在一些实施方案中,剪切因子的功能片段是具有mRNA剪切活性和/或具有并入至凝聚物(例如,异型凝聚物、同型凝聚物或包含磷酸化RNA聚合酶的凝聚物)中的能力的片段。
在一些实施方案中,甲基-DNA结合蛋白的功能片段可结合甲基化DNA和/或具有并入至凝聚物(例如,异型凝聚物、同型凝聚物或包含抑制因子的凝聚物)中的能力。在一些实施方案中,抑制因子的功能片段具有基因沉默活性和/或具有并入至凝聚物(例如,异型凝聚物、同型凝聚物或包含甲基-DNA结合蛋白的凝聚物)中的能力。
在一些实施方案中,雌激素受体的功能片段具有(a)当结合于雌激素时活化转录(例如,野生型ER片段),(b)组成性地活化转录(例如,突变型ER片段),(c)结合于雌激素,(d)结合于介体,(e)形成异型凝聚物和/或(f)形成同型凝聚物的能力。在一些实施方案中,所述雌激素受体片段具有生物活性(a)-(e)中的至少一者、两者、三者、四者、五者或全部五者。在一些实施方案中,ER配体结合域的功能片段具有雌激素结合活性。
如本文所用,并且在一些实施方案中,蛋白质的变体包含氨基酸序列与本发明蛋白(例如,野生型蛋白、经定义突变型蛋白)的氨基酸序列至少70%、80%、90%、95%、96%、97%、98%、99%、99.5%或超过99.5%同一的多肽,或由所述多肽组成。如本文所用,并且在一些实施方案中,核酸序列的变体包含具有与本发明核酸的核酸序列至少70%、80%、90%、95%、96%、97%、98%、99%、99.5%或超过99.5%同一的序列的核酸序列,或由所述核酸序列组成。
“剂”在本文中用于指任何物质、化合物(例如,分子)、超分子复合物、材料或其组合或混合物。在一些方面,剂可由化学式、化学结构或序列表示。剂的实例包括例如小分子、多肽、核酸(例如,RNAi剂、反义寡核苷酸、适体)、脂质、多糖、肽模拟物等。一般来说,剂可使用本领域中已知的任何合适方法获得。一般技术人员将基于例如剂的性质选择适当方法。剂可以是至少部分纯化的。在一些实施方案中,剂可作为组合物的一部分提供,在多个实施方案中,除所述剂以外,所述组合物还可含有例如抗衡离子、水性或非水性稀释剂或载体、缓冲液、防腐剂或其他成分。在一些实施方案中,剂可作为盐、酯、水合物或溶剂化物提供。在一些实施方案中,剂是细胞可渗透的,例如在由细胞摄取并且在细胞内(例如,在哺乳动物细胞内)起作用的典型剂的范围内。某些化合物可以特定几何异构体或立体异构体形式存在。除非另外指示,否则所述化合物在多个实施方案中由本发明涵盖,包括顺式和反式异构体、E-和Z-异构体、R-和S-对映异构体、非对映异构体、(D)-异构体、(L)-异构体、(-)-和(+)-异构体、其外消旋混合物和其其他混合物。某些化合物可以多种或质子化状态存在,可具有多种配置,可作为溶剂化物(例如,具有水(即,水合物)或常见溶剂)存在和/或可具有不同结晶形式(例如,多晶型物)或不同互变异构体形式。展现所述替代的质子化状态、配置、溶剂化物和形式的实施方案在适用情况下由本公开涵盖。
第一剂的“类似物”是指在结构上和/或在功能上类似于所述第一剂的第二剂。第一剂的“结构类似物”是在结构上类似于所述第一剂的类似物。除非另外规定,否则如本文所用的术语“类似物”是指结构类似物。剂的结构类似物可具有大体上与所述剂相似的物理、化学、生物和/或药理学特性,或可在至少一种物理、化学、生物或药理学特性方面不同。在一些实施方案中,至少一种所述特性以使得所述类似物更适用于所关注目的(例如,用于调节凝聚物)的方式不同。在一些实施方案中,剂的结构类似物与所述剂的不同之处在于所述剂的至少一个原子、官能团或子结构由所述类似物中的不同原子、官能团或子结构置换。在一些实施方案中,剂的结构类似物与所述剂的不同之处在于存在于所述剂中的至少一个氢或取代基由所述类似物中的不同部分(例如,不同取代基)置换。
在一些实施方案中,所述剂是核酸。术语“核酸”是指如脱氧核糖核酸(DNA)和核糖核酸(RNA)的多核苷酸。术语“核酸”和“多核苷酸”在本文中可互换使用并且应理解为包括双链多核苷酸、单链(如有义或反义)多核苷酸和部分双链多核苷酸。核酸通常包含典型地发现于天然存在的DNA或RNA中的标准核苷酸(其可包括如甲基化核碱基的修饰),通过磷酸二酯键接合。在一些实施方案中,核酸可包含一个或多个非标准核苷酸,所述非标准核苷酸在多个实施方案中可以是天然存在或非天然存在的(即,人工;未在自然界中发现)和/或可含有经过修饰的糖或经过修饰的骨架键联。在多个实施方案中可并入核酸修饰(例如,碱基、糖和/或骨架修饰)、非标准核苷酸或核苷等(如本领域中已知适用于RNA干扰(RNAi)、适体、CRISPR技术、多肽产生、重编程或用于研究或治疗目的的基于反义的分子的上下文的那些)。所述修饰可例如增加稳定性(例如,通过降低对核酸酶裂解的敏感性)、减少体内清除、增加细胞摄取或赋予其他特性,所述特性会改进翻译、效力、功效、特异性或以其他方式使得所述核酸更适用于期望用途。核酸修饰的多种非限制性实例描述于例如Deleavey GF等人,Chemical modification of siRNA.Curr.Protoc.Nucleic Acid Chem.2009;39:16.3.1-16.3.22;Crooke,ST(编)Antisense drug technology:principles,strategies,and applications,Boca Raton:CRC Press,2008;Kurreck,J.(编)Therapeuticoligonucleotides,RSC biomolecular sciences.Cambridge:Royal Society ofChemistry,2008;美国专利号4,469,863;5,536,821;5,541,306;5,637,683;5,637,684;5,700,922;5,717,083;5,719,262;5,739,308;5,773,601;5,886,165;5,929,226;5,977,296;6,140,482;6,455,308和/或PCT申请公布WO 00/56746和WO 01/14398中。不同修饰可用于双链核酸的两条链中。核酸可均一地或仅在其一部分上进行修饰和/或可含有多种不同修饰。在核酸或核酸区的长度关于核苷酸的数目(nt)给出的情况下,应理解除非另外指示,否则所述数目是指单链核酸或双链核酸的各链中的核苷酸数目。“寡核苷酸”是相对较短核酸,典型地在约5与约100nt长之间。
“核酸构建体”是指人工产生并且与出现于自然界中的核酸不同一的核酸,即,其在序列方面不同于天然存在的核酸分子和/或包含区别其与自然界中发现的核酸的修饰。核酸构建体可包含与自然界中发现的核酸或其部分同一,但在自然界中未作为单一核酸的一部分被发现的两种或更多种核酸。在一些实施方案中,调节转录凝聚物的剂是由核酸构建体编码。在一些实施方案中,所述核酸构建体被引入至细胞中并且在其中表达以便调节所述细胞中的转录凝聚物。在一些实施方案中,调节异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物的剂是由核酸构建体编码。在一些实施方案中,所述核酸构建体被引入至细胞中并且在其中表达以便调节所述细胞中的异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物。
在一些实施方案中,所述剂是小分子。术语“小分子”是指质量小于约2千道尔顿(kDa)的有机分子。在一些实施方案中,所述小分子小于约1.5kDa,或小于约1kDa。在一些实施方案中,所述小分子小于约800道尔顿(Da)、600Da、500Da、400Da、300Da、200Da或100Da。通常,小分子具有至少50Da的质量。在一些实施方案中,小分子是非聚合物。在一些实施方案中,小分子并非氨基酸。在一些实施方案中,小分子并非核苷酸。在一些实施方案中,小分子并非糖。在一些实施方案中,小分子含有多个碳-碳键并且可包含一个或多个杂原子和/或关于与蛋白质的结构相互作用(例如,氢键结)至关重要的一个或多个官能团,例如胺、羰基、羟基或羧基,并且在一些实施方案中包含至少两个官能团。小分子通常包含一个或多个环碳或杂环结构和/或芳香族或聚芳香族结构,其任选地经一个或多个以上官能团取代。
在一些实施方案中,所述剂是蛋白质或多肽。术语“多肽”是指通过肽键连接的氨基酸的聚合物。蛋白质是包含一种或多种多肽的分子。肽是相对较短多肽,其长度典型地在约2与100个氨基酸(aa)之间,例如在4与60aa之间;在8与40aa之间;在10与30aa之间。术语“蛋白质”、“多肽”和“肽”可互换使用。一般来说,在多个实施方案中,多肽可仅含有标准氨基酸,或可包含一种或多种非标准氨基酸(其可以是天然存在或非天然存在的氨基酸)和/或氨基酸类似物。“标准氨基酸”是通常用于由哺乳动物合成蛋白质并且通过遗传密码编码的20种L-氨基酸中的任一者。“非标准氨基酸”是并未通常用于由哺乳动物合成蛋白质的氨基酸。非标准氨基酸包括天然存在的氨基酸(20种标准氨基酸除外)和非天然存在的氨基酸。氨基酸(例如,多肽中的一种或多种氨基酸)可例如通过如烷基、烷酰基、碳水化合物基团、磷酸酯基、脂质、多糖、卤素、用于结合的连接体、保护基、小分子(如荧光团)等部分的添加(例如,共价键联)进行修饰。
在一些实施方案中,所述剂是肽模拟物。术语“模拟物”、“肽模拟物”和“拟肽物”在本文中可互换使用,并且一般是指模拟所选择的原生肽或蛋白质功能域(例如,结合基序或活性位点)的三级结合结构或活性的肽、部分肽或非肽分子。这些肽模拟物包括经过重组或化学修饰的肽,以及如小分子药物模拟物的非肽剂。在一些实施方案中,所述肽模拟物是信号传导因子模拟物。所述信号传导因子不受限制并且可以是本领域中已知和/或本文所述的任一者。在一些实施方案中,所述肽模拟物是核受体配体模拟物。
在一些实施方案中,所述剂是与凝聚物(例如,转录凝聚物、基因沉默凝聚物、与mRNA起始或延伸复合物物理缔合的凝聚物)缔合的蛋白质、多肽或核酸。在一些实施方案中,所述剂是与凝聚物缔合的蛋白质、多肽或核酸的变体或突变体。在一些实施方案中,所述剂是核受体(例如,核激素受体)的拮抗剂或促效剂。在一些实施方案中,与野生型核凝聚物相比,所述剂优先地结合于具有突变的核受体(例如,具有突变的核激素受体、具有突变的配体依赖性核受体)。在一些实施方案中,与包含野生型核受体的凝聚物相比,所述剂优先地破坏包含具有突变的核受体(例如,具有突变的核激素受体、具有突变的配体依赖性核受体)的转录凝聚物。
在一些实施方案中,所述剂是信号传导因子的拮抗剂或促效剂。所述信号传导因子不受限制并且可以是本文所述或本领域中已知的任何信号传导因子。在一些实施方案中,所述信号传导因子包含IDR。在一些实施方案中,所述剂包含磷酸化或低磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。在一些实施方案中,所述剂优先地结合磷酸化或低磷酸化Pol II CTD。在一些实施方案中,所述剂结合剪切因子、延伸复合物组分或起始复合物组分。在一些实施方案中,所述剂优先地结合甲基化DNA。在一些实施方案中,所述剂结合甲基-DNA结合蛋白。
在一些实施方案中,所述剂是由合成RNA(例如,经过修饰的mRNA)编码。所述合成RNA可编码本文所述的任何合适的剂。包括经过修饰的RNA在内的合成RNA是教导于WO2017075406中,其以引用的方式并入本文中。例如,所述合成RNA可编码调节凝聚物组成、维持、溶解、形成或调控的剂。在一些实施方案中,所述合成RNA编码结合于转录凝聚物组分、异染色质凝聚物组分或与mRNA起始或延伸复合物物理缔合的凝聚物的组分的IDR(例如,列于表S2中的IDR)、抗体(单链,例如奈米抗体)或工程改造的亲和蛋白(例如,亲和体)。在一些实施方案中,所述剂是合成RNA。
在一些实施方案中,所述剂是结合于非核酸分子的合成RNA(例如,经过修饰的mRNA),或由其编码。在一些实施方案中,所述合成RNA结合于(或以其他方式物理缔合)促进细胞摄取、核进入和/或核保留的部分(例如,肽转运部分或核酸)。在一些实施方案中,所述合成RNA结合于有效增强低聚物转运至细胞中的肽转运体部分,例如细胞穿透肽转运部分。例如,在一些实施方案中,所述肽转运体部分是富精氨酸肽。在其他实施方案中,所述转运部分附接至低聚物的5'或3'端。当所述肽结合于任一末端时,相对末端接着可用于进一步结合于如本文所述的经过修饰的末端基团。肽转运部分一般有效增强核酸的细胞穿透。在一些实施方案中,甘氨酸(G)或脯氨酸(P)氨基酸亚单元包括于所述核酸与所述肽转运部分的剩余部分之间(例如,在载体肽的羧基或氨基末端处)以降低结合物的毒性,同时相对于在所述肽转运部分与核酸之间具有不同键联的结合物维持或改进功效。
在一些实施方案中,所述剂是相(例如,凝聚物形成的破坏剂)破坏剂。在一些实施方案中,所述相破坏剂是ATP耗竭剂(例如,叠氮化钠(NaN3)和二硝基苯酚(DNP))或1,6-己二醇。
在一些实施方案中,如本文所述的剂靶向用于例如通过泛素-蛋白酶体系统(UPS)进行细胞内降解的转录凝聚物组分。在一些实施方案中,所述剂可用于降低转录凝聚物组分的水平并且由此抑制凝聚物形成、维持和/或活性。在一些实施方案中,靶向用于细胞内降解的转录凝聚物组分的剂包含结合于转录凝聚物组分的第一域,和靶向与其缔合用于例如由蛋白酶体降解的实体的第二域。在一些实施方案中,如本文所述的剂靶向用于例如通过泛素-蛋白酶体系统(UPS)进行细胞内降解的凝聚物(异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物)组分。在一些实施方案中,所述剂可用于降低凝聚物组分的水平并且由此抑制凝聚物形成、维持和/或活性。在一些实施方案中,靶向用于细胞内降解的凝聚物(异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物)组分的剂包含结合于凝聚物组分的第一域,和靶向与其缔合用于例如由蛋白酶体降解的实体的第二域。所述剂可用于降低与其结合的凝聚物组分的水平。在一些实施方案中,凝聚物组分基于蛋白水解靶向嵌合体(PROTAC)概念被靶向用于降解(参见例如Protacs:chimeric moleculesthat target proteins to the Skp1-Cullin-Fbox complex for ubiquitination anddegradation Sakamoto,Kathleen M.等人Proceedings of the National Academy ofSciences(2001),98(15),8554-8559;Carmony,KC和Kim,K,PROTAC-Induced ProteolyticTargeting,Methods Mol Biol.2012;832:第44章)。在这一方法中,杂双官能剂被设计成含有结合于所关注的蛋白质(在这种情况下是凝聚物组分(例如,转录凝聚物组分))的第一域、结合于E3泛素连接酶复合物的第二域和典型地将这些域系栓在一起的连接体。在一些实施方案中,所述第一域、所述第二域或两者包含肽。在一些实施方案中,所述第一域、所述第二域或两者包含小分子。例如,结合于所述泛素连接酶复合物的分子可以是作为小脑蛋白的配体、Cullin4A泛素连接酶复合物的组分的小分子。结合于小脑蛋白的小分子可以是邻苯二甲酰亚胺,例如沙利度胺、来那度胺或泊马度胺(参见例如Winter,GE等人Science348(6241),1376-1381;专利公布号20160235731和20180009779)。在一些实施方案中,可使用结合于von Hippel–Lindau E3泛素连接酶的分子,如描述于Buckley DL等人Targetingthe von Hippel-Lindau E3ubiquitin ligase using small molecules to disrupt theVHL/HIF-1αinteraction.J Am Chem Soc.2012;134(10):4465–4468中的小分子(例如,羟基脯氨酸类似物)或描述于Galdeano,C.等人Structure-guided design andoptimization of small molecules targeting the protein-protein interactionbetween the von Hippel–Lindau(VHL)E3ubiquitin ligase and the hypoxiainducible factor(HIF)alpha subunit with in vitro nanomolaraffinities.J.Med.Chem.57,8657–8663(2014)中的小分子。在一些实施方案中,所述PROTAC可靶向用于降解的含溴域蛋白,如BRD1、BRD2、BRD3和/或BRD4。在一些实施方案中,所述PROTAC可靶向用于降解的激酶,如CDK7或CDK9。参见例如Robb,CM等人,Chem Commun(Camb).2017年7月4日;53(54):7577-7580。
在一些实施方案中,所述剂是结合于可连接至结合于泛素连接酶复合物的小分子的组分(例如,如本文所述的组分)的小分子,所得复合物用于靶向用于降解的蛋白质。在一些实施方案中,所述小分子结合于具有列于表S1中的基序的IDR。在一些实施方案中,一种方法包括鉴定结合于列于表S1中的组分(或IDR)的小分子和使所述小分子连接至结合于泛素连接酶复合物的组分的小分子。
在一些实施方案中,所述剂与所述转录凝聚物(例如,转录凝聚物组分)之间的接触会使所述凝聚物稳定化或溶解,由此调节所述一种或多种基因的转录、剪切或沉默。在一些实施方案中,所述剂与所述凝聚物(例如,异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物)之间的接触会使所述凝聚物稳定化或溶解,由此调节所述一种或多种基因的转录、剪切或沉默。在一些实施方案中,所述剂会增加或减少所述凝聚物的半衰期达至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或更高。在一些实施方案中,相对于未接触凝聚物的半衰期,所述剂会增加或减少所述凝聚物的半衰期达至少约1.1倍、至少1.2倍、1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或至少100倍、至少1,000倍、至少10,000倍或10,000倍以上。
在一些实施方案中,所述剂可结合DNA、RNA或蛋白质并且预防组分整合至转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物中。在其他实施方案中,所述剂整合至现有转录凝聚物中。在其他实施方案中,所述剂整合至现有异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物中。在其他实施方案中,所述剂迫使另一组分整合至现有转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物中。在其他实施方案中,所述剂预防组分进入转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物。
在一些实施方案中,所述剂结合于、屏蔽和/或中和IDR(例如,转录因子的活化域;信号传导因子、核受体、甲基-DNA结合蛋白、RNA聚合酶或抑制因子的IDR)中的酸性残基。在一些实施方案中,此举可抑制TF与共活化子(例如介体,例如介体组分)的相互作用。在一些实施方案中,此举可调节信号因子依赖性转录、基因沉默或mRNA起始和/或延伸(例如剪切)。在一些实施方案中,剂结合于或修饰转录因子的活化域中的非酸性残基。在一些实施方案中,此举可增强转录因子与共活化子(例如介体,例如介体组分)的相互作用。在一些实施方案中,所述剂可增强转录因子(例如,核受体、配体独立突变型核受体)与基因沉默因子或信号传导因子的相互作用。在一些实施方案中,与野生型转录因子相比,所述剂可优先地与突变型转录因子(例如,配体独立突变型核受体)相互作用。
在一些实施方案中,所述剂是具有IDR(例如,具有列于表S2中的基序的IDR、列于表S3中的转录因子的IDR)的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%的多肽或蛋白质。在一些实施方案中,所述剂具有多个IDR(例如,2、3、4、5个或更多个IDR区)。在一些实施方案中,所述组分具有至少一个IDR,其分离成多个离散区段(例如,2、3、4、5个或更多个区段)。在一些实施方案中,所述区段由连接体序列或结构化氨基酸分离。
在一些实施方案中,所述剂是经过修饰的转录凝聚物组分(例如,转录因子、转录共活化子、核受体配体)。在一些实施方案中,所述剂是经过修饰的异染色质凝聚物组分(例如,甲基-DNA结合蛋白、基因沉默因子)。在一些实施方案中,所述剂是与mRNA起始或延伸复合物组分物理缔合的经过修饰的凝聚物(例如,剪切因子、RNA聚合酶II)。在一些实施方案中,所述组分具有经过修饰的IDR区。在一些实施方案中,所述IDR位于或源于转录因子的活化域中。在一些实施方案中,与野生型序列相比,所述经过修饰的IDR具有增加或降低数目的丝氨酸。在一些实施方案中,如与野生型序列相比,所述IDR具有降低或增加数目的芳香族酸。在一些实施方案中,如与野生型序列相比,所述IDR具有降低或增加数目的酸性残基。在一些实施方案中,如与野生型序列相比,所述IDR具有降低或增加的正或负净电荷。
在一些实施方案中,如与野生型序列相比,所述IDR具有降低或增加数目的脯氨酸残基。在一些实施方案中,如与野生型序列相比,所述IDR具有降低或增加数目的丝氨酸和/或苏氨酸残基。在一些实施方案中,如与野生型序列相比,所述IDR具有降低或增加数目的谷酰胺残基。在一些实施方案中,所述IDR的一个或多个残基((例如,丝氨酸、苏氨酸、脯氨酸、酸性残基、谷氨酸、芳香族残基)可相对于野生型序列增加或减少达1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、45、50、75、100个或100个以上。在一些实施方案中,所述IDR的一个或多个残基((例如,丝氨酸、苏氨酸、脯氨酸、酸性残基、谷氨酸、芳香族残基)可相对于野生型序列增加或减少达约1.2、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10倍或10倍以上。在一些实施方案中,所述IDR的一个或多个残基((例如,丝氨酸、苏氨酸、脯氨酸、酸性残基、谷氨酸、芳香族残基)可相对于野生型序列增加或减少达至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或更高。在一些实施方案中,所述IDR的所有酸性残基均可由非酸性残基(例如,未带电残基、碱性残基)置换。在一些实施方案中,所述IDR的所有脯氨酸残基均可由非脯氨酸残基(例如,亲水性残基、极性残基)置换。在一些实施方案中,所述IDR的所有丝氨酸和/或苏氨酸残基均可由非丝氨酸和/或苏氨酸残基(例如,疏水性残基、酸性残基)置换。在一些实施方案中,所述经过修饰的组分关于凝聚物(例如,转录凝聚物)的其他组分具有降低或增加的价态。在一些实施方案中,所述经过修饰的转录凝聚物组分抑制或预防凝聚物形成。在一些实施方案中,所述经过修饰的异染色质凝聚物组分或与mRNA起始或延伸复合物物理缔合的凝聚物的经过修饰的组分抑制或预防凝聚物形成或凝聚物活性。
转录因子活性
已知主转录因子(TF)通过建立细胞类型特异性增强子(例如,超级增强子)来调控关键细胞身份基因。此外,核受体是与包括癌症在内的多种疾病和疾患相关的TF。TF通过募集共活化子来活化其靶基因的转录。TF与共活化子之间的结合已经被描述为“模糊的”,因为其相互作用界面无法通过单一构象描述。这些动态相互作用还代表构成相分离凝聚物的IDR-IDR相互作用。具有不同类型的低复杂度活化域的TF被认为与同一小集合的多亚单元共活化子复合物相互作用,所述多亚单元共活化子复合物包括介体、p300和通用转录因子II D(TFIID)。我们建议使得TF与共活化子相互作用并且由此活化转录的作用机制是通过使共活化子凝聚物成核。因此,改变TF活化域将破坏与共活化子复合物的相互作用并且由此改变转录输出。
因此,在一些实施方案中,转录凝聚物通过调节与转录凝聚物缔合的转录因子(TF)与所述转录凝聚物的组分的结合来调节。在一些实施方案中,调节TF活化域对于一种或多种凝聚物组分的亲和力。在一些实施方案中,调节组分对于TF(例如,TF活化域)的亲和力。在一些实施方案中,转录凝聚物的形成通过调节与转录凝聚物缔合的转录因子(TF)与所述转录凝聚物的组分的结合来调节。在一些实施方案中,TF与转录凝聚物所缔合的组分的结合通过调节TF或所述组分的水平来调节。在其他实施方案中,异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物通过调节与所述凝聚物缔合的转录因子(TF)与所述凝聚物的组分的结合来调节。在一些实施方案中,调节TF活化域对于一种或多种凝聚物组分(例如,异染色质凝聚物组分或与mRNA起始或延伸复合物物理缔合的凝聚物的组分)的亲和力。在一些实施方案中,调节组分对于TF(例如,TF活化域)的亲和力。在一些实施方案中,异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物的形成通过调节与所述凝聚物缔合的转录因子(TF)与所述凝聚物的组分的结合来调节。在一些实施方案中,TF与异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物所缔合的组分的结合通过调节TF或所述组分的水平来调节。
所述组分不受限制并且可以是本文所述的任何组分。在一些实施方案中,所述组分是共活化子、辅因子或核受体配体。在一些实施方案中,所述组分是介体、介体组分、MED1、MED15、GCN4、p300、BRD4、激素(例如,雌激素)或TFIID。在一些实施方案中,所述组分是转录因子。在一些实施方案中,所述转录因子具有活化域中的IDR。在一些实施方案中,所述转录因子是OCT4、p53、MYC或GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子或核受体(例如,核激素受体、雌激素受体、视黄酸受体-α)。在一些实施方案中,所述核受体当结合于同源配体时活化转录。在一些实施方案中,所述核受体是突变型核受体,其在同源配体不存在下活化转录。所述突变型核受体可以是本文所述的任何突变型核受体。在一些实施方案中,所述转录因子是与超级增强子缔合的转录因子。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的活化域。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的IDR。在一些实施方案中,所述转录因子列于表S3中。在一些实施方案中,所述转录因子是与介体组分(例如,列于表S3中的介体组分)相互作用的转录因子。
在一些实施方案中,所述转录因子与所述转录凝聚物的组分(例如,非转录因子组分)的结合通过使所述转录因子或转录凝聚物与本文所述的剂接触来调节。在一些实施方案中,所述转录因子与异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物的组分的结合通过使所述转录因子或异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物与本文所述的剂接触来调节。在一些实施方案中,所述剂是肽、核酸或小分子。在一些方面,具有负电荷的肽可结合于具有正电荷的IDR。在一些方面,具有正电荷的肽可结合于具有负电荷的IDR。
在一些实施方案中,所述剂可以是本文所述的任何小分子。小分子可被设计成预防转录因子活化域(例如,转录因子活化域中的IDR)与同源共活化子上的固有无序区的缔合。此举可尤其与具有涉及IDR的致癌融合蛋白(MLL-重排、EWS-FLI、ETS融合物、BRD4-NUT、NUP98融合物、致癌转录因子融合物等)的癌症相关。扰乱所述相互作用可用于增强、削弱或以其他方式改变与特定转录因子或特定基因座相关的转录输出。小分子还可被设计成与野生型转录因子相比优先地结合于突变型转录因子(例如,突变型核受体)。
改变客户蛋白与骨架的相互作用
分子凝聚物已经描述为具有多种类型的组分,所述组分可分成“骨架”和“客户蛋白”(Banani,S.F.,Rice,A.M.,Peeples,W.B.,Lin,Y.,Jain,S.,Parker,R.和Rosen,M.K.(2016).Compositional Control of Phase-Separated Cellular Bodies.Cell 166,651-663.)。骨架组分进行相分离并且形成其中高度浓缩所述组分的凝聚物。当相分离时,这些骨架组分可与客户蛋白组分相互作用,所述客户蛋白组分本身未进行相分离,但经由客户蛋白骨架相互作用达到高局部浓度(Banani等人,2016)。我们建议转录凝聚物由骨架和客户蛋白组分组成并且靶向这些客户蛋白组分的相互作用域(即,固有无序域或区)的肽模拟物和其他生物分子的引入将会从转录凝聚物排除这些客户蛋白。这些客户蛋白可以是转录辅因子,以致从转录凝聚物排除会改变转录。这些客户蛋白还可以是信号传导转录因子,以致从转录凝聚物排除会特定地使过活化信号传导途径在转录方面无活性。在一些方面,所述骨架是可在细胞中或体外组装形成凝聚物的组分,接着所述组分可被视为骨架组分。
在一些实施方案中,所述转录凝聚物通过调节与所述转录凝聚物缔合的组分(例如,客户蛋白组分)的量或水平来调节。所述组分(例如,客户蛋白组分)不受限制并且可以是本文所述的任何凝聚物组分。在一些实施方案中,所述组分(例如,客户蛋白组分)是一种或多种转录辅因子和/或信号传导转录因子和/或核受体配体(例如,激素)。在一些实施方案中,所述组分(例如,客户蛋白组分)是介体、MED1、MED15、GCN4、p300、BRD4、激素或TFIID。
在一些实施方案中,与所述转录凝聚物缔合的组分(例如,客户蛋白组分)的量或水平通过与降低或消除所述组分(例如,客户蛋白组分)与所述转录凝聚物之间的相互作用的剂接触来调节。所述剂不受限制并且可以是本文所述的任何剂。在一些实施方案中,所述剂是肽模拟物或类似生物分子。
在一些实施方案中,所述剂靶向所述组分(例如,客户蛋白组分)的相互作用域。在一些实施方案中,所述相互作用域是固有无序域或区(IDR)。IDR不受限制。在一些实施方案中,所述IDR是具有列于表S2中的基序的IDR。
信号传导
此处所述的实施例显示信号传导的细胞类型依赖性特异性可至少部分地通过经由超级增强子处的相分离使信号传导因子寻址于转录凝聚物来实现。以这种方式,多种信号传导因子分子可能浓缩于所述凝聚物中并且占据基因组上的适当位点。
因此,在一些实施方案中,凝聚物(例如,转录凝聚物)可经过调节以增加或减少对于信号传导因子的亲和力(例如,使用剂)。在一些实施方案中,所述凝聚物(例如,转录凝聚物)可与增加或减少对于信号传导因子的亲和力的剂接触。例如,所述剂可与信号传导因子或所述凝聚物(例如,转录凝聚物)的另一组分缔合。或者,所述剂可降低或阻断所述剂与所述转录因子的组分的缔合。在一些实施方案中,所述信号传导因子对于所述凝聚物(例如,转录凝聚物)的亲和力可经过调节(例如,使用剂)。在一些实施方案中,所述剂可通过所述信号传导因子(例如,通过调节与所述信号传导因子缔合的转录凝聚物的形成、组成、维持、溶解、活性和/或调控)来调节转录活化。在一些实施方案中,所述剂对于凝聚物/信号传导因子亲和力或活性的调节是细胞类型或增强子(例如,超级增强子)特异性的。在一些实施方案中,所述剂调节所述信号传导因子与辅因子(例如,介体或介体组分)之间的亲和力。
在一些实施方案中,所述凝聚物(例如,转录凝聚物)与增强子(例如,超级增强子)缔合。所述增强子可与本文所述或本领域中已知的一种或多种基因缔合。在一些实施方案中,所述增强子与牵涉于细胞身份中的一种或多种基因缔合。在一些实施方案中,所述增强子与本文所述的疾病或疾患(例如,癌症)所相关的基因缔合。所述凝聚物可与本文所述或本领域中已知的任何TF缔合。在一些实施方案中,所述TF包含一个或多个IDR。在一些实施方案中,所述凝聚物与主TF缔合。在一些实施方案中,与所述凝聚物缔合的TF是MyoD、Oct4、Nanog、Klf4或Myc。
所述凝聚物(例如,转录凝聚物)可与任何基因或基因的组(例如,控制转录)缔合。在一些实施方案中,所述一种或多种基因牵涉于细胞身份中。在一些实施方案中,所述基因与本文所述的疾病或疾患(例如,癌症)相关。所述凝聚物(例如,转录凝聚物)可包含辅因子。所述辅因子不受限制。在一些实施方案中,所述辅因子和信号传导因子优先地在凝聚物中缔合。在一些实施方案中,所述辅因子是介体、介体组分、MED1、MED15、p300、BRD4、TFIID。
所述凝聚物(例如,转录凝聚物)可与信号反应元件(例如,基因启动子区内能够结合特定信号传导因子并且调控转录的短DNA序列)缔合。在一些实施方案中,所述信号反应元件与超级增强子缔合。在一些实施方案中,所述信号反应元件存在于与超级增强子缔合的基因组的区和未与超级增强子缔合的基因组的区两者中。
所述信号传导因子不受限制并且可以是本文所述或本领域中已知的任何信号传导因子。在一些实施方案中,所述信号传导因子包含一个或多个IDR。在一些实施方案中,所述信号传导因子是选自由NF-kB、FOXO1、FOXO2、FOXO4、IKKα、CREB、Mdm2、YAP、BAD、p65、p50、GLI1、GLI2、GLI3、YAP、TAZ、TEAD1、TEAD2、TEAD3、TEAD4、STAT1、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6、AP-1、C-FOS、CREB、MYC、JUN、CREB、ELK1、SRF、NOTCH1、NOTCH2、NOTCH3、NOTCH4、RBPJ、MAML1、SMAD2、SMAD3、SMAD4、IRF3、ERK1、ERK2、MYC、TCF7L2、TCF7、TCF7L1、LEF1或β-连环蛋白组成的组。在一些实施方案中,所述信号传导因子优先地结合于与所述凝聚物缔合的一种或多种信号反应元件或介体。在一些实施方案中,所述凝聚物包含主转录因子。
信号传导因子和辅因子可特异性地与转录凝聚物相互作用,并且一些信号传导途径在疾病中发生改变。所述信号传导途径不受限制。在一些实施方案中,所述信号传导途径是Akt/PKB信号传导途径、AMPK信号传导途径、cAMP依赖性途径、EGF受体信号传导途径、Hedgehog信号传导途径、Hippo信号传导途径、缺氧诱导因子(HIF)信号传导途径、胰岛素信号传导途径、IGF信号传导途径、JAK-STAT信号传导途径、MAPK/ERK信号传导途径、mTOR信号传导途径、NF-kB途径、Notch信号传导途径、PI3K/AKT信号传导途径、PDGF受体途径、T细胞受体信号传导途径、TGFβ信号传导途径、TLR信号传导途径、VEGF受体信号传导途径或Wnt信号传导途径。在一些实施方案中,所述信号传导途径是核受体相关信号传导途径。所述核受体不受限制并且可以是本文所鉴定的任何核受体。当信号传导途径促进疾病发病机理时,改变凝聚物形成、组成、维持、溶解、形态和/或调控可提供治疗益处。
在一些实施方案中,调节所述转录凝聚物会调节一种或多种信号传导途径。在一些实施方案中,所述信号传导途径促进疾病发病机理。在一些实施方案中,所述疾病是增生性疾病、炎症疾病、心血管疾病、神经疾病或传染病。在一些实施方案中,所述疾病是癌症(例如,乳腺癌)。
癌症的类型不受限制。“癌症”一般用于指特征在于一个或多个肿瘤(例如,一个或多个恶性或潜在恶性肿瘤)的疾病。如本文所用,术语“肿瘤”涵盖包含异常增生的细胞的异常生长。如本领域中已知,肿瘤的特征典型地在于不受适当调控的过度细胞增生(例如,其未正常地响应于生理影响和通常将限制增生的信号),并且可展现以下特性中的一者或多者:发育异常(例如缺乏正常细胞分化,从而导致增加数目或比例的不成熟细胞);退行发育(例如,较大分化损失、较多结构组织损失、细胞多形性、异常(如大、深染细胞核、高细胞核:细胞质比率、非典型有丝分裂等));相邻组织的浸润(例如,突破基底膜);和/或转移。恶性肿瘤具有持续生长的倾向和扩散能力,例如,以局部地侵袭和/或区域性地转移和/或至远程位置,而良性肿瘤通常保持定位于起源位点处并且就生长来说通常为自限性的。术语“肿瘤”包括恶性实体肿瘤,例如癌瘤(由上皮细胞产生的癌症)、肉瘤(由间质起源的细胞产生的癌症)和其中可能无法检测实体肿瘤质量的恶性生长(例如,某些血液学恶性肿瘤)。癌症包括但不限于:乳腺癌;胆管癌;膀胱癌;脑癌(例如,胶质母细胞瘤、髓母细胞瘤);子宫颈癌;绒膜癌;结肠癌;子宫内膜癌;食道癌;胃癌;血液学赘瘤,包括急性淋巴细胞白血病和急性骨髓性白血病;T细胞急性淋巴母细胞性白血病/淋巴瘤;毛细胞白血病;慢性淋巴细胞白血病、慢性骨髓性白血病、多发性骨髓瘤;成人T细胞白血病/淋巴瘤;上皮内赘瘤,包括鲍文氏病和佩吉特氏病;肝癌;肺癌;淋巴瘤,包括霍奇金氏病和淋巴细胞性淋巴瘤;神经母细胞瘤;黑素瘤、口腔癌(包括鳞状细胞癌);卵巢癌,包括由上皮细胞、基质细胞、生殖细胞和间质细胞产生的卵巢癌;神经母细胞瘤、胰腺癌;前列腺癌;直肠癌;肉瘤,包括血管肉瘤、胃肠基质肿瘤、平滑肌肉瘤、横纹肌肉瘤、脂肪肉瘤、纤维肉瘤和骨肉瘤;肾癌,包括肾细胞癌和威尔姆氏肿瘤;皮肤癌,包括基底细胞癌和鳞状细胞癌;睾丸癌,包括胚组织瘤,如精原细胞瘤、非精原细胞瘤(畸胎瘤、绒膜癌)、基质肿瘤和生殖细胞肿瘤;甲状腺癌,包括甲状腺腺癌和髓样癌。应理解,可在某些器官中产生多种不同肿瘤类型,其关于例如临床和/或病理学特征和/或分子标记物可不同。在多个不同器官中产生的肿瘤论述于例如WHOClassification of Tumours series,第4版或第3版(Pathology and Genetics ofTumours series),the International Agency for Research on Cancer(IARC),WHOPress,Geneva,Switzerland中,其全部卷均以引用的方式并入本文中。在一些实施方案中,所述癌症是肺癌、乳腺癌、子宫颈癌、结肠癌、胃癌、肾癌、白血病、肝癌、淋巴瘤(例如非霍奇金淋巴瘤,例如弥漫性大B细胞淋巴瘤、伯奇氏淋巴瘤)卵巢癌、胰腺癌、前列腺癌、直肠癌、肉瘤、皮肤癌、睾丸癌或子宫癌。癌症的类型不受限制。在一些实施方案中,所述癌症展现异常基因表达。在一些实施方案中,所述癌症展现异常基因产物活性。在一些实施方案中,所述癌症表达在正常水平下但具有改变其活性的突变的基因产物。在具有异常增加的活性的致癌基因的情况下,本发明方法可用于降低所述致癌基因的表达。在具有异常降低的活性(例如,归因于突变)的肿瘤抑制因子基因的情况下,本发明方法可用于通过调节调控环境来增加所述肿瘤抑制因子基因的表达。
核孔缔合
转录凝聚物可与核孔蛋白相互作用,从而允许优先接近引入的信号和优先输出新近转录的mRNA。所述凝聚物与所述核孔之间的相互作用的稳定化或破坏可改变所述凝聚物的转录输出。其还可促进来自与所述凝聚物缔合的基因的mRNA输出和翻译。
在一些实施方案中,调节所述转录凝聚物会调节所述转录凝聚物与一种或多种核孔蛋白之间的相互作用。在一些实施方案中,所述转录凝聚物与所述一种或多种核孔蛋白之间的相互作用的调节会调节核信号传导、mRNA输出和/或mRNA翻译。在一些实施方案中,核信号传导、mRNA输出和/或mRNA转移与疾病相关。
炎症
对细菌或病毒感染的炎症反应依赖于关键细胞因子和趋化因子的活化。已知这些炎症反应基因的转录的降低会降低细菌或病毒感染的有害效应。关键炎症基因的稳固表达可能依赖于凝聚物形成,所述凝聚物形成可能尤其依赖于可由肽、核酸或小分子靶向的特定蛋白质、RNA或DNA基序。
在一些实施方案中,调节所述转录凝聚物(或在一些实施方案中,异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物)会调节炎症反应。在一些实施方案中,所述炎症反应是对病毒或细菌的炎症反应。在一些实施方案中,所述炎症反应是不适当、被错误调控或过度活性炎症反应。在某些实施方案中,本公开方法用于在具有炎症状态的受试者中减少炎症,减少一种或多种炎症细胞因子的表达,和/或减少过度活性炎症反应。在一些实施方案中,炎症反应通过调节凝聚物并且由此调节牵涉于炎症或降低炎症反应中的一种或多种基因的转录、mRNA起始和/或延伸或基因沉默来调节。在一些实施方案中,牵涉于炎症或降低炎症反应中的信号传导途径的活性经由本文所公开的方法(例如,通过用凝聚物调节信号传导因子的亲和力)经过调节。
用DNA调节凝聚物
通过DNA甲基化/脱甲基化或如乙酰化/脱乙酰化的其他DNA修饰来改变DNA序列或修饰可影响凝聚物形成、组成、维持、溶解、形态和/或调控。另外,组分(DNA、RNA或蛋白质)可通过使用与dCas9(或其他催化无活性位点特异性核酸酶)的融合物并且使用特异性导向RNA而以位点特异性方式系栓至基因组DNA。可使用相似方法使特定组分定位于现有凝聚物,所述现有凝聚物可改变其组成、维持、溶解或调控。
在一些实施方案中,所述凝聚物(例如,转录凝聚物)通过改变与所述凝聚物缔合的核苷酸序列(例如,基因组DNA序列)来调节。例如,与转录凝聚物缔合的增强子(例如,超级增强子)可发生改变。还可改变转录因子结合位点。在一些实施方案中,激素反应元件或信号反应元件可发生改变。此外,编码与凝聚物缔合的组分(例如,编码转录因子、辅因子、共活化子、抑制因子、甲基-DNA缔合的结合蛋白)的基因可发生改变。所述改变可能在编码或非编码区中。在一些实施方案中,所述改变包含添加或缺失核苷酸。在一些实施方案中,添加核苷酸以触发或增强凝聚物形成或调节凝聚物稳定性。在一些实施方案中,使核苷酸缺失以预防凝聚物形成或调节凝聚物稳定性。在一些实施方案中,核苷酸的添加或缺失会影响凝聚物形成、组成、维持、溶解、形态和/或调控。
在一些实施方案中,与凝聚物缔合的DNA定位于异染色质(例如,兼性异染色质)中。在一些实施方案中,与凝聚物缔合的DNA被甲基化。在一些实施方案中,基因组DNA被甲基化或脱甲基化以调节凝聚物形成。在一些实施方案中,所述DNA被甲基化或脱甲基化以调节凝聚物形成或稳定性并且由此调节基因沉默。在一些实施方案中,使用位点特异性催化无活性核酸内切酶来使异染色质甲基化或脱甲基化以调节凝聚物形成或稳定性并且由此调节基因沉默。
在一些实施方案中,所述改变包含表观遗传修饰。在一些实施方案中,所述表观遗传修饰包含DNA甲基化。在一些实施方案中,所述核苷酸序列的改变包含DNA、RNA或蛋白质系栓于所述核苷酸序列。在一些实施方案中,所述DNA、RNA或蛋白质是如本文所述的转录凝聚物组分或其片段(例如,含IDR片段)。在一些实施方案中,所述DNA、RNA或蛋白质是如本文所述的异染色质凝聚物组分或其片段(例如,含IDR片段)。在一些实施方案中,所述DNA、RNA或蛋白质是如本文所述的剂。在一些实施方案中,所述DNA、RNA或蛋白质促进或增强凝聚物形成。在一些实施方案中,所述DNA、RNA或蛋白质抑制或预防凝聚物形成。在一些实施方案中,辅因子(例如,介体)或其片段(例如,含IDR片段)系栓至核苷酸序列。在一些实施方案中,甲基-DNA结合蛋白或其片段(例如,含IDR片段)系栓至核苷酸序列。在一些实施方案中,细胞周期素依赖性激酶或其片段系栓至核苷酸序列。在一些实施方案中,剪切因子或其片段(例如,含IDR片段)系栓至核苷酸序列。
在一些实施方案中,使用催化无活性位点特异性核酸酶和能够将DNA、RNA或蛋白质附接至核苷酸序列的效应子域。在一些实施方案中,使用催化无活性位点特异性核酸酶dCas(例如,dCas9或Cpf1)。
本领域中已知的多种CRISPR缔合(Cas)基因或蛋白质可经过修饰以产生催化无活性位点特异性核酸酶,Cas蛋白的选择将取决于所述方法的特定条件(例如,ncbi.nlm.nih.gov/gene/?term=cas9)。Cas蛋白的特定实例包括Cas1、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9和Cas10。在一特定方面,用于所述方法中的Cas核酸或蛋白是Cas9。在一些实施方案中,Cas蛋白(例如,Cas9蛋白)可来自多种原核物种中的任一者。在一些实施方案中,可选择特定Cas蛋白(例如,特定Cas9蛋白)以识别特定前间隔序列邻近基序(PAM)序列。在某些实施方案中,Cas蛋白(例如,Cas9蛋白)可获自细菌或古细菌或使用已知方法合成。在某些实施方案中,Cas蛋白可来自革兰氏阳性细菌或革兰氏阴性细菌。在某些实施方案中,Cas蛋白可来自链球菌(Streptococcus)(例如,酿脓链球菌(S.pyogenes)、嗜热链球菌(S.thermophilus))、隐球菌(Crptococcus)、棒状杆菌(Corynebacterium)、嗜血杆菌(Haemophilus)、真细菌(Eubacterium)、巴斯德氏菌(Pasteurella)、普雷沃菌(Prevotella)、韦氏球菌(VeiUonella)或海杆菌(Marinobacter)。在一些实施方案中,编码两种或更多种不同Cas蛋白的核酸或两种或更多种Cas蛋白可被引入至细胞、受精卵、胚胎或动物中,例如以虑及包含相同、相似或不同PAM基序的位点的识别和修饰。
在一些实施方案中,所述Cas蛋白是Cpf1蛋白或其功能部分。在一些实施方案中,所述Cas蛋白是来自任何细菌物种的Cpf1或其功能部分。在某些实施方案中,Cpf1蛋白是新凶手弗朗西丝菌U112蛋白或其功能部分、氨基酸球菌属BV3L6蛋白或其功能部分或毛螺菌科细菌ND2006蛋白或其功能部分。Cpf1蛋白是V型CRISPR系统的成员。Cpf1蛋白是包含约1300个氨基酸的多肽。Cpf1含有RuvC样核酸内切酶域。
在一些实施方案中,可通过使一个或多个Cas9核酸酶域不活化来产生Cas9切口酶。在一些实施方案中,在Cas9的RuvC I域中的残基10处的氨基酸取代会使所述核酸酶转化为DNA切口酶。例如,在氨基酸残基10处的天冬氨酸可取代丙氨酸(Cong等人,Science,339:819-823)。产生催化无活性Cas9蛋白的其他氨基酸突变包括在残基10和/或残基840处突变。在残基10和残基840处的突变可产生催化无活性Cas9蛋白,本文中有时称作dCas9。例如,D10A和H840A Cas9突变体是催化无活性的。
如本文所用,“效应子域”是调节基因组序列(例如,基因)的表达和/或活化的分子(例如,蛋白质)。效应子域可具有甲基化活性或脱甲基化活性(例如,DNA甲基化或DNA脱甲基化活性)。在一些方面,所述效应子域靶向基因的一或两个等位基因。所述效应子域可作为核酸序列和/或作为蛋白质引入。在一些方面,所述效应子域可以是组成性或诱导性效应子域。在一些方面,Cas(例如,dCas)核酸序列或其变体和效应子域核酸序列作为嵌合序列被引入至具有凝聚物的细胞中。在一些方面,所述效应子域融合至与Cas蛋白缔合(例如,结合)的分子(例如,所述效应子分子融合至结合于Cas蛋白的抗体或其抗原结合片段)。在一些方面,Cas(例如,dCas)蛋白或其变体和效应子域被融合或系栓,从而产生嵌合蛋白,并且作为所述嵌合蛋白被引入至细胞中。在一些方面,所述Cas(例如,dCas)蛋白和效应子域以蛋白质-蛋白质相互作用结合。在一些方面,所述Cas(例如,dCas)蛋白和效应子域经过共价连接。在一些方面,所述效应子域与所述Cas(例如,dCas)蛋白非共价缔合。在一些方面,Cas(例如,dCas)核酸序列和效应子域核酸序列作为独立序列和/或蛋白质引入。在一些方面,所述Cas(例如,dCas)蛋白和效应子域未被融合或系栓。
在一些实施方案中,所述催化无活性位点特异性核酸酶可通过一个或多个RNA序列(sgRNA)被导向至特异性DNA位点以调节一个或多个基因组序列的活性和/或表达(例如,对转录或染色质组织发挥某些影响,或将特定种类的分子带入特异性DNA基因座中,或充当局部组蛋白或DNA状态的传感器)。在特定方面,用效应子域的全部或一部分系栓的dCas9的融合物会产生嵌合蛋白,所述嵌合蛋白可通过一个或多个RNA序列被导向至特异性DNA位点以调节或修饰一个或多个基因组序列的甲基化或脱甲基化。如本文所用,“效应子域的生物活性部分”是维持效应子域(例如,“最小”或“核心”域)的功能(例如,完全地、部分地、以最小程度)的部分。所述Cas9(例如,dCas9)与一个或多个效应子域的全部或一部分的融合会产生嵌合蛋白。
效应子域的实例包括染色质组织因子域、重塑因子域、组蛋白修饰因子域、DNA修饰域、RNA结合域、蛋白质相互作用输入器件域(Grunberg和Serrano,Nucleic AcidsResearch,3'8(8):'2663-267'5(2010))和蛋白质相互作用输出器件域(Grunberg和Serrano,Nucleic Acids Research,3'8(8):'2663-267'5(2010))。在一些方面,所述效应子域是DNA修饰剂。DNA修饰因子的特定实例包括来自5mC的5hmc转化,如Tetl(TetlCD);通过Tetl、ACID A、MBD4、Apobecl、Apobec2、Apobec3、Tdg、Gadd45a、Gadd45b、ROS1实现的DNA脱甲基化;通过Dnmtl、Dnmt3a、Dnmt3b、CpG甲基转移酶M.SssI和/或M.EcoHK31I实现的DNA甲基化。在特定方面,效应子域是Tet1。在其他特定方面,效应子域是Dmnt3a。在一些实施方案中,dCas9融合至Tet1。在其他实施方案中,dCas9融合至Dnmt3a。效应子域的其他实例描述于PCT申请号PCT/US2014/034387和美国申请号14/785031中,所述申请以引用的方式整体并入本文中。使用催化无活性位点特异性核酸酶、用于修饰核苷酸序列(例如,基因组序列)的效应子域和sgRNA的方法教导于2017年12月12日提交的PCT/US2017/065918中,该案以引用的方式并入本文中。
用RNA调节凝聚物
还应注意,外源RNA的添加、RNA的稳定化或某些RNA的移除可调节凝聚物。因此,在一些实施方案中,所述转录凝聚物通过使所述凝聚物与外源添加的RNA接触来调节。在一些实施方案中,异染色质凝聚物通过使所述凝聚物与外源添加的RNA接触来调节。在一些实施方案中,与mRNA起始或延伸复合物缔合的凝聚物通过使所述凝聚物与外源添加的RNA接触来调节。
在一些实施方案中,所述外源RNA是天然存在的RNA序列、经过修饰的RNA序列(例如,包含一个或多个经过修饰的碱基的RNA序列)、合成RNA序列或其组合。如本文所用,“经过修饰的RNA”是包含对RNA序列的一种或多种修饰(例如,对骨架和或糖的修饰)的RNA(例如,包含一个或多个非标准和/或非天然存在的碱基的RNA)。修饰RNA的碱基的方法是本领域中众所周知的。所述经过修饰的碱基的实例包括含于核苷5-甲基胞嘧啶核苷(5mC)、假尿嘧啶核苷(Ψ)、5-甲基尿嘧啶核苷、2'0-甲基尿嘧啶核苷、2-硫尿嘧啶核苷、N-6甲基腺苷、次黄嘌呤、二氢尿嘧啶核苷(D)、肌苷(I)和7-甲基鸟苷(m7G)中的那些。应注意,在多个实施方案中,RNA序列中的任何数目的碱基均可被取代。还应注意,可使用不同修饰的组合。
在一些方面,所述外源RNA序列是吗啉基。吗啉基典型地是约25个碱基长度的合成分子并且通过标准核酸碱基配对结合于RNA的互补序列。吗啉基具有标准核酸碱基,但那些碱基结合于吗啉环而非脱氧核糖环并且经由二氨基磷酸酯基而非磷酸酯基进行连接。吗啉基不会使其靶RNA分子降解,不同于多种反义结构类型(例如,硫代磷酸酯、siRNA)。反而,吗啉基通过位阻起作用并且结合于RNA内的靶序列并且阻断可能以其他方式与所述RNA相互作用的分子。在一些实施方案中,所述合成RNA是如WO 2017075406中所述。
在一些实施方案中,RNA序列的长度可从约8个碱基对(bp)变化至约200bp、约500bp或约1000bp。在一些实施方案中,RNA序列的长度可以是约9至约190bp;约10至约150bp;约15至约120bp;约20至约100bp;约30至约90bp;约40至约80bp;约50至约70bp。
在一些实施方案中,所述外源RNA使所述凝聚物的形成或稳定性稳定化或增强。在一些实施方案中,所述外源RNA会加速所述凝聚物的溶解或预防/抑制凝聚物形成。
在一些实施方案中,使用干扰RNA(RNAi)来执行某些(即,特定)RNA的移除。如本文所用,术语“RNA干扰”(“RNAi”)(本领域中也称作“基因沉默”和/或“靶沉默”,例如“靶mRNA沉默”)是指RNA的选择性细胞内降解。RNAi天然地发生于细胞中以移除外来RNA(例如,病毒RNA)。天然RNAi经由从游离dsRNA裂解的片段继续进行,所述片段将所述可降解机制指向其他相似RNA序列。在一些方面,特定RNA的移除是经由所述特定RNA的转录抑制。
在一些实施方案中,RNA通过根据本领域中已知的方法保护(加帽)所述RNA的一或两个末端而稳定化。在一些实施方案中,RNA通过使所述RNA与不会干扰与所述凝聚物的组分的结合的分子(即,反义核酸或小分子)缔合而稳定化。
通过靶向凝聚物的组分调节RNA加工
一些疾病与RNA物质的异常加工相关。在一些实施方案中,转录凝聚物可与通过RNA加工装置形成的凝聚物融合。这些凝聚物的稳定化或破坏可以治疗学有益的方式改变RNA加工。在一些实施方案中,本文所述的方法可用于调节凝聚物以使转录凝聚物和通过RNA加工装置形成的凝聚物的融合增强或稳定化。在一些实施方案中,本文所述的方法可用于调节凝聚物以对转录凝聚物和通过RNA加工装置形成的凝聚物的融合进行抑制或去稳定化。在一些实施方案中,与mRNA起始或延伸复合物物理缔合的凝聚物可通过本文所公开的方法加以调节,由此调节RNA加工。在一些实施方案中,与mRNA起始或延伸复合物物理缔合的凝聚物以治疗学有益的方式加以调节。在一些实施方案中,调节与mRNA延伸缔合的凝聚物,由此以治疗学有益的方式调节mRNA剪切(例如,异常剪切变体的降低、有益剪切变体的增加)。
通过调节mRNA输出调节翻译
转录凝聚物可与核孔蛋白相互作用,从而允许优先输出新近转录的mRNA。所述凝聚物与所述核孔之间的相互作用的稳定化或破坏可因此改变来自与所述凝聚物缔合的基因的mRNA翻译。当疾病引起病理学水平的特定蛋白质时,所述改变可以是治疗学适用的。在一些实施方案中,本文所述的方法可用于调节凝聚物以增强新近转录的mRNA的优先输出。在一些实施方案中,本文所述的方法可用于调节凝聚物以增强新近转录的mRNA的优先输出。在一些实施方案中,调节mRNA是用于治疗疾病的治疗术。在一些实施方案中,调节mRNA会使病理学水平的蛋白质恢复至非病理学水平。
使用多价分子来靶向凝聚物
凝聚物(例如,转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物缔合的凝聚物)可通过具有IDR的蛋白质之间的多种微弱相互作用形成。已知所述无序区可能并未具有任何规定二级或三级结构,结合于这些区的小分子或肽模拟物可用微弱亲和力如此。为了浓缩所述分子至凝聚物(例如,转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物缔合的凝聚物)中以扰乱微弱IDR-IDR相互作用,可使用由“锚”和“破坏剂”构成的二价分子。“破坏剂”是微弱地结合所述凝聚物的相互作用组分以破坏或改变所述相互作用的性质的分子。锚组分是如下分子,其对于在所述凝聚物中或附近的蛋白质的更加结构化区具有强亲和力,因此用于将所述破坏剂分子浓缩于所述凝聚物(例如,转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物缔合的凝聚物)中或附近。
在一些实施方案中,所述转录凝聚物通过使所述凝聚物与结合于凝聚物组分的固有无序域的剂接触来调节。在一些实施方案中,异染色质凝聚物通过使所述凝聚物与结合于凝聚物组分的固有无序域的剂接触来调节。在一些实施方案中,与mRNA起始或延伸复合物缔合的凝聚物通过使所述凝聚物与结合于凝聚物组分的固有无序域的剂接触来调节。所述组分不受限制并且可以是本文所述的任何组分。在一些实施方案中,所述组分是介体、MED1、MED15、GCN4、p300、BRD4、核受体配体或TFIID。在一些实施方案中,所述组分是列于表S3中的介体组分。在一些实施方案中,所述组分是转录因子。在一些实施方案中,所述转录因子具有活化域中的IDR。在一些实施方案中,所述转录因子是OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的活化域。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的IDR。在一些实施方案中,所述转录因子列于表S3中。在一些实施方案中,所述转录因子是与介体组分(例如,列于表S3中的介体组分)相互作用的转录因子。
所述剂也不受限制并且可以是本文所述的任何合适剂。在一些实施方案中,所述剂是多价的(例如,二价、三价、四价等)。在一些实施方案中,所述剂结合于组分的固有无序域并且还结合于同一组分的非固有无序域。在一些实施方案中,所述剂结合于组分的固有无序域并且还结合于与所述转录凝聚物缔合的第二组分。在一些实施方案中,所述剂是多价的并且结合于活化域(例如,活化域的IDR)并且还结合于非活化域(例如,DNA结合域)或转录因子的非固有无序区。在一些实施方案中,所述剂特异性结合于突变型转录因子(例如,与疾病或疾患相关的突变型转录因子)非活化域或转录因子的非固有无序区。在一些实施方案中,所述剂不结合于野生型转录因子非活化域或野生型转录因子的非固有无序区。在一些实施方案中,所述多价剂结合于核受体。在一些实施方案中,所述多价剂优先地结合于核受体的突变体形式(例如,与疾病或疾患相关的突变体形式)。在一些实施方案中,所述多价剂结合于信号传导因子、辅因子、甲基-DNA结合蛋白、剪切因子或RNA聚合酶。
在一些实施方案中,所述剂会改变或破坏所述转录凝聚物的组分之间的相互作用。在一些实施方案中,所述剂会使所述转录凝聚物增强或稳定化。在一些实施方案中,所述剂会对所述转录凝聚物进行抑制或去稳定化。
将组分系栓至DNA以启动新凝聚物的形成或现有凝聚物的改变
转录凝聚物和异染色质凝聚物可形成于DNA上。因此,为了形成新凝聚物,组分(DNA、RNA或蛋白质)可根据本文所公开的方法通过使用催化无活性位点特异性核酸酶和效应子域而以位点特异性方式系栓至基因组DNA。在一些实施方案中,所述组分使用如本文所述的dCas(例如,dCas9)系栓至DNA(例如,基因组DNA)。
在一些实施方案中,可通过将一种或多种转录凝聚物组分系栓至基因组DNA而引起、增强或稳定化所述转录凝聚物的形成。在一些实施方案中,可通过将一种或多种异染色质凝聚物组分系栓至基因组DNA而引起、增强或稳定化所述异染色质凝聚物的形成。所述组分不受限制并且可包含本文所述的任何组分。在一些实施方案中,所述组分包含DNA、RNA和/或蛋白质。在一些实施方案中,所述组分包含介体、MED1、MED15、GCN4、p300、BRD4、β-连环蛋白、STAT3、SMAD3、NF-kB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1、核受体配体或TFIID。在一些实施方案中,所述组分是列于表S3中的介体组分。在一些实施方案中,所述组分具有本文所公开的IDR。在一些实施方案中,所述组分是转录因子。在一些实施方案中,所述转录因子具有活化域中的IDR。在一些实施方案中,所述转录因子是OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的活化域。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的IDR。在一些实施方案中,所述转录因子列于表S3中。在一些实施方案中,所述转录因子是与介体组分(例如,列于表S3中的介体组分)相互作用的转录因子。
使用相分离原则来隔绝疾病相关蛋白质
包括癌症在内的多种疾病可依赖于牵涉于转录中的特异性蛋白质。例如,Myc转录因子可在所有癌症的大多数中过表达并且其扰乱会导致癌细胞死亡和分化。Myc已显示优先地并入至合成MED1凝聚物中。因此,由外源肽、核酸或小化学分子诱导的凝聚物形成可能用于隔绝Myc远离在活性基因的启动子处的其正常位置。相似策略可能用于具有并入至凝聚物中的能力的任何疾病相关蛋白质。如果突变型形式可特异性地并入至合成凝聚物中,而野生型形式单独留下,那么经历突变或融合事件的疾病相关蛋白质可能尤其易经受这一方法。
在一些实施方案中,本文所述的方法可用于使凝聚物形成或稳定化以便隔绝如本文所述的蛋白质、DNA、RNA或其他凝聚物组分。例如,凝聚物可通过将组分系栓至DNA并且使凝聚物形成成核而被诱导形成。凝聚物还可通过添加合适剂(例如,外源添加的蛋白质、DNA或RNA)或合适组分至如本文所述的细胞中而被诱导形成。在一些实施方案中,凝聚物中的组分的隔绝会通过限制接近所述组分来调节第二凝聚物。在一些实施方案中,所述隔绝的组分是Myc。在一些实施方案中,所述隔绝的组分是野生型蛋白质的突变形式。在一些实施方案中,所述野生型蛋白质未被隔绝。在一些实施方案中,所述隔绝的组分是在疾病状态中过表达的组分。在一些实施方案中,所述组分的隔绝会治疗疾病状态。所述隔绝组分不受限制并且可以是本文所述的凝聚物的任何组分(例如,介体、MED1、MED15、GCN4、p300、BRD4、核受体配体和TFIID)。在一些实施方案中,所述隔绝组分是转录因子或其部分(例如,活化域)。在一些实施方案中,所述转录因子具有活化域中的IDR。在一些实施方案中,所述转录因子是OCT4、p53、MYC GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的活化域。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的IDR。在一些实施方案中,所述转录因子列于表S3中。在一些实施方案中,所述转录因子是与介体组分(例如,列于表S3中的介体组分)相互作用的转录因子。
非编码RNA是至少一些转录凝聚物的重要组分
多种凝聚物具有RNA组分(Banani,S.F.,Lee,H.O.,Hyman,A.A.和Rosen,M.K.(2017).Biomolecular condensates:organizers of cellularbiochemistry.Nat.Rev.Mol.Cell Biol.18,285-298.)。基因调控元件会产生异常高水平的非编码RNA(Li,W.,Notani,D.和Rosenfeld,M.G.(2016).Enhancers as non-coding RNAtranscription units:recent insights and future perspectives.Nat.Rev.Genet.17,207-223.)。然而,尚未理解这些RNA的生物功能。另外,多种转录因子和辅因子可与RNA相互作用(Li等人,2016)。我们建议一些转录凝聚物的形成和维持依赖于非编码RNA。直接地靶向转录凝聚物内的这些非编码RNA组分的反义寡核苷酸、RNase(使RNA降解的酶)或化合物可引起健康和疾病细胞中的转录凝聚物的溶解。
在一些实施方案中,转录凝聚物通过调节与所述转录凝聚物缔合的ncRNA的水平或活性来调节。调节ncRNA的水平或活性可通过任何合适方法执行。在一些实施方案中,调节ncRNA的水平或活性可通过本文所述的方法(例如,使用RNAi)执行。在一些实施方案中,ncRNA的水平或活性通过使ncRNA与结合ncRNA的反义寡核苷酸、RNase或小分子接触来调节。
筛选方法
本公开的一些方面针对筛选如本文所定义的剂的方法,所述剂能够修饰凝聚物(例如,转录凝聚物、异染色质凝聚物、与mRNA起始或延伸复合物缔合的凝聚物)。
筛选凝聚物修饰性治疗剂的体内测定
本公开的一些方面针对鉴定调节凝聚物(例如,转录凝聚物)的形成、稳定性或形态的剂的方法,所述方法包括提供具有凝聚物的细胞、使所述细胞与测试剂接触和测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性或形态。在一些实施方案中,所述凝聚物具有可检测标签并且所述可检测标签用于测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性或形态。在一些实施方案中,所述细胞经过遗传工程改造以表达所述可检测标签。如本文所用,术语“可检测标签”或“可检测标记”包括但不限于可检测标记,如荧光团、放射性同位素、比色基质或酶;异源表位,其特异性抗体可购得,例如FLAG-标签;异源氨基酸序列,其是用于可购得的结合蛋白的配体,例如Strep-标签、生物素;典型地联合荧光标签用于其他多肽上的荧光淬灭剂;和互补生物发光或荧光多肽片段。作为可检测标记或互补生物发光或荧光多肽片段的标签可直接地进行测量(例如,通过测量荧光或放射性,或用适当底物或酶孵育以产生如与未缔合多肽相比关于缔合多肽的分光光度法可检测的颜色改变)。作为异源表位或配体的标签典型地用结合于例如抗体或结合蛋白的第二组分检测,其中所述第二组分与可检测标记缔合。
在一些方面,所述方法包括具有凝聚物组分的细胞、使所述细胞与测试剂接触和测定与所述测试剂的接触是否调节包含所述组分的凝聚物的形成或活性(例如,形成异型凝聚物、形成同型凝聚物)。在一些实施方案中,所述一种或多种凝聚物组分包含可检测标记。在一些实施方案中,所述凝聚物组分将形成凝聚物并且所述测试剂将关于调节凝聚物形成(例如,增加或减少凝聚物形成或凝聚物形成的速率)进行筛选。在一些实施方案中,所述凝聚物组分将不会形成凝聚物并且所述测试剂将经受筛选以查明其是否引起凝聚物的形成。在一些实施方案中,所述凝聚物组分包含MED1(或其片段)和ER或其片段,例如突变型ER(例如,如本文所述),例如能够在他莫昔芬存在下并入至包含MED1的凝聚物中的突变型ER。
在一些实施方案中,“测定”包含如与对照物或参考物相比测量物理特性。例如,测定凝聚物的稳定性是否经过调节可包含如与未经受测试条件或剂的对照凝聚物相比测量凝聚物存在的时期。测定凝聚物的形状是否经过调节可包含如与未经受测试条件或剂的对照凝聚物相比比较凝聚物的形状。在一些实施方案中,如果凝聚物的一种或多种特性发生变化达统计学显著量(例如,至少10%、至少20%、至少30%、至少50%、至少75%或75%以上),那么其可“被测定”是经过调节。
在一些实施方案中,所述可检测标签是荧光标签(例如,tdTomato)。在一些实施方案中,所述可检测标签附接至如本文所述的凝聚物组分。在一些实施方案中,所述组分是选自OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、核受体配体、融合致癌转录因子、TFIID、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1和包含固有无序区(IDR)的其片段。
在一些实施方案中,使用选择性地结合于所述凝聚物的抗体来测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性或形态。在一些实施方案中,所述抗体结合于如本文所述的凝聚物组分。在一些实施方案中,所述组分是选自介体、MED1、MED15、GCN4、p300、BRD4、核受体配体和TFIID,或显示于表S3中或描述于本文中的介体组分或转录因子。在一些实施方案中,所述组分是如本文所述的核受体或其片段。在一些实施方案中,所述组分是选自OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、核受体配体、融合致癌转录因子、TFIID、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1和包含固有无序区(IDR)的其片段。
可使用由所述测试剂检测所述凝聚物的调节的任何合适方法,包括本领域中已知并且教导于本文中的方法。在一些实施方案中,使用不受限制的显微术来执行测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性或形态的步骤。在一些实施方案中,所述显微术是反褶积显微术、结构化照明显微术或干扰显微术。在一些实施方案中,使用DNA-FISH、RNA-FISH或其组合来执行测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性或形态的步骤。
具有凝聚物的细胞的类型不受限制并且可以是本文所公开的任何细胞类型。在一些实施方案中,所述细胞受疾病影响(例如,癌细胞)。在一些实施方案中,具有凝聚物的细胞是原代细胞、细胞系成员、从罹患疾病的受试者分离的细胞或源于从罹患疾病的受试者分离的细胞的细胞(例如,从罹患疾病的受试者分离的诱导性多能细胞的祖细胞)。
在一些实施方案中,所述细胞对雌激素介导的基因活化有反应。在一些实施方案中,所述细胞对核受体配体介导的基因活化有反应。在一些实施方案中,所述细胞包含突变型核受体。在一些实施方案中,所述细胞是表达核受体(例如,突变型核受体)的转基因细胞。在一些实施方案中,所述细胞是癌细胞(例如,乳腺癌细胞)。在一些实施方案中,所述细胞在雌激素存在下与测试剂接触并且评估雌激素介导的基因活化。在一些实施方案中,所述细胞包含具有标记的雌激素受体并且评估在所述测试剂存在下雌激素受体的凝聚物并入。
在一些实施方案中,所述细胞在他莫昔芬存在下对雌激素介导的基因活化有反应。在一些实施方案中,所述细胞是癌细胞(例如,乳腺癌细胞)。在一些实施方案中,所述细胞在雌激素和他莫昔芬存在下与测试剂接触并且评估雌激素介导的基因活化。在一些实施方案中,所述细胞包含具有标记的雌激素受体并且评估在所述测试剂存在下雌激素受体的凝聚物并入。
在一些实施方案中,所述测试剂是他莫昔芬类似物。在一些实施方案中,所述测试剂并非他莫昔芬类似物。
在一些实施方案中,所述凝聚物包含信号传导因子。在一些实施方案中,所述体外凝聚物包含信号传导因子或包含基因转录的活化所必需的IDR的其片段。在一些实施方案中,所述信号传导因子与致癌信号传导途径缔合。
在一些实施方案中,所述凝聚物包含甲基-DNA结合蛋白或包含C端IDR的其片段,或抑制因子或包含IDR的其片段。在一些实施方案中,所述凝聚物与甲基化DNA或异染色质缔合。在一些实施方案中,所述凝聚物包含异常水平或活性的甲基-DNA结合蛋白(例如,如与参考水平相比增加或减少的水平)。在一些实施方案中,评估通过所述剂实现的与所述凝聚物缔合的基因的沉默。在一些实施方案中,所述凝聚物包括剪切因子或包含IDR的其片段,或RNA聚合酶或包含IDR的其片段。
在一些实施方案中,所述凝聚物与转录起始复合物或延伸复合物缔合。在一些实施方案中,所述凝聚物与细胞周期素依赖性激酶接触。在一些实施方案中,所述RNA聚合酶是RNA聚合酶II(Pol II)。在一些实施方案中,评估通过与所述剂接触而引起的与所述凝聚物相关的RNA转录起始活性的变化在一些实施方案中,评估通过与所述剂接触而引起的与所述凝聚物相关的RNA延伸或剪切活性的变化。
筛选凝聚物修饰剂(例如治疗剂)的体外测定
凝聚物可形成由RNA、DNA或蛋白质构成的体外液体小液滴。转录凝聚物组分还可形成包含一种或多种蛋白质(例如,TF)和一种或多种共活化子或辅因子的体外液体小液滴。所述小液滴还可包含RNA和/或DNA。所述液体小液滴是体外凝聚物并且可对应于和/或充当体内存在的凝聚物(例如,转录凝聚物、异染色质凝聚物、与mRNA起始或延伸复合物缔合的凝聚物、包含剪切因子的凝聚物)的模型。这些液体小液滴具有可测量的物理特性(即,大小、浓度、渗透性和粘度)。这些物理特性可与凝聚物活化体内报告基因的能力相关。小分子、肽、RNA或DNA oligo的库对液体小液滴的任何物理特性的影响均可加以测量。另外,可使用基于细胞的报告基因测定调节小液滴特性的分子对于基因表达的影响。当这一凝聚物中不存在个别组分时,其可使得变成非功能性的(即,不能进行生产性转录)。另外,将新颖组分并入至现有凝聚物中可修饰、减弱或扩增其输出。因而,可需要向预先存在的凝聚物中添加或移除组分。因此,在一些实施方案中,可执行筛选以分离结合DNA、RNA或蛋白质并且驱动组分进入转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物中的小分子。在其他实施方案中,可执行筛选以分离结合DNA、RNA或蛋白质并且预防组分整合至凝聚物中的小分子。在其他实施方案中,可执行筛选以分离被设计、表达或引入而整合至现有凝聚物中的小分子、蛋白质、RNA、蛋白质或DNA。在其他实施方案中,可执行筛选以分离被设计、表达或引入而迫使另一组分整合至现有凝聚物中的小分子、蛋白质、RNA、蛋白质或DNA。在其他实施方案中,可执行筛选以分离被设计、表达或引入而预防组分进入转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物中的小分子、蛋白质、RNA或DNA。在其他实施方案中,可执行筛选以分离被设计、表达或引入而预防或减少一种或多种组分形成凝聚物的可能性的小分子、蛋白质、RNA或DNA。
本发明的一些方面针对鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供体外凝聚物并且评估所述体外凝聚物的一种或多种物理特性,使所述体外凝聚物与测试剂接触,和评估所述测试剂是否引起所述体外凝聚物的所述一种或多种物理特性的变化。在一些实施方案中,所述一种或多种物理特性与所述体外凝聚物引起细胞中基因的表达的能力相关。在一些实施方案中,所述一种或多种物理特性包含所述体外凝聚物的大小、浓度、渗透性、形态或粘度。本领域中已知的任何合适方法均可用于测量所述一种或多种物理特性。
本发明的一些方面针对鉴定调节凝聚物形成的剂的方法。在一些实施方案中,所述方法包括提供包含一种或多种凝聚物组分或其片段(例如,本文所述的任何凝聚物组分、具有IDR的任何凝聚物组分、介体或其亚单元(例如,MED1)、转录因子)的组合物,使所述组合物与测试剂接触,和测定所述测试剂是否调节包含所述凝聚物组分的凝聚物的形成或调节通过所述凝聚物组分形成的凝聚物的一种或多种特性(例如,稳定性、功能、活性、形态的增加或减少)。在一些实施方案中,所述一种或多种凝聚物组分包含可检测标记。我们可提供所述组分,将其组合于容器中,并且观察就凝聚物形成来说发生什么和/或测量所得凝聚物的所述特性(例如,稳定性、功能、活性、形态的增加或减少)。在一些实施方案中,所提供的组合物将形成凝聚物并且所述测试剂将关于调节形成(例如,增加或减少凝聚物形成或凝聚物形成的速率)进行筛选。在一些实施方案中,所提供的组合物将不会形成凝聚物并且所述测试剂将经过筛选以查明其是否引起凝聚物的形成。在一些实施方案中,所述凝聚物组分包含一种或多种辅因子(例如,MED1或其功能片段)和核受体(例如,野生型核受体、突变型核受体、与疾病或疾患相关的突变型核受体)或其功能片段。在一些实施方案中,所述凝聚物组分包含MED1(或其片段)和ER或其片段,例如突变型ER(例如,如本文所述),例如能够在他莫昔芬存在下并入至包含MED1的凝聚物中的突变型ER。
在一些实施方案中,所述体外凝聚物对核受体配体介导的基因活化有反应。在一些实施方案中,所述体外凝聚物具有组成性突变型核受体介导的基因活化。在一些实施方案中,所述体外凝聚物对雌激素介导的基因活化有反应。在一些实施方案中,所述体外凝聚物在雌激素存在下与测试剂接触并且评估雌激素介导的基因活化。在一些实施方案中,如果雌激素介导的基因活化在所述测试剂存在下减少或消除,那么所述测试剂被鉴定为用于治疗ER+癌症的候选抗癌剂。在一些实施方案中,所述体外凝聚物包含具有标记的雌激素受体并且评估在所述测试剂存在下雌激素受体的凝聚物并入。在一些实施方案中,如果ER并入在所述测试剂存在下减少或消除,那么所述测试剂被鉴定为用于治疗ER+癌症的候选抗癌剂。
在一些实施方案中,所述体外凝聚物在他莫昔芬存在下对雌激素介导的基因活化有反应(例如,所述体外凝聚物从他莫昔芬抗性乳腺癌细胞分离,所述凝聚物包含具有组成性活性的突变型ER(例如,如本文所述)。在一些实施方案中,所述体外凝聚物在雌激素和他莫昔芬存在下与测试剂接触并且评估雌激素介导的基因活化。在一些实施方案中,如果雌激素介导的基因活化在所述测试剂存在下减少或消除,那么所述测试剂被鉴定为用于治疗他莫昔芬抗性癌症的候选抗癌剂。在一些实施方案中,所述体外凝聚物包含具有标记的雌激素受体并且评估在所述测试剂存在下雌激素受体的凝聚物并入。在一些实施方案中,如果ER并入在所述测试剂存在下减少或消除,那么所述测试剂被鉴定为用于治疗他莫昔芬抗性癌症的候选抗癌剂。
在一些实施方案中,所述测试剂是他莫昔芬类似物。在一些实施方案中,所述测试剂并非他莫昔芬类似物。
所述测试剂不受限制并且包括本文所公开的任何剂。在一些实施方案中,所述测试剂是小分子、肽、RNA或DNA。
在一些实施方案中,所述体外凝聚物包含如本文所述的一种或多种组分。在一些实施方案中,所述体外凝聚物包含DNA、RNA和/或蛋白质中的一者、两者或全部三者作为组分。在一些实施方案中,所述体外凝聚物包含DNA、RNA和蛋白质作为组分。在一些实施方案中,所述体外凝聚物包含介体、MED1、MED15、GCN4、p300、BRD4、核受体配体或TFIID。在一些实施方案中,所述体外凝聚物包含OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、核受体配体、融合致癌转录因子、TFIID、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1和包含固有无序区(IDR)的其片段。在一些实施方案中,所述凝聚物包含单一组分(即,同型)。在一些实施方案中,所述体外凝聚物是异型并且包含2、3、4、5种或更多种客户蛋白或骨架组分。在一些实施方案中,所述体外凝聚物包含MED15和GCN4。在一些实施方案中,所述体外凝聚物包含如本文所述的核受体或其片段。在一些实施方案中,所述体外凝聚物包含MED1和ER。在一些实施方案中,所述ER是突变型ER(例如,本文所述的突变型ER、具有组成性活性的突变型ER、具有赋予他莫昔芬抗性的突变的突变型ER)。在一些实施方案中,所述凝聚物包含剪切因子和RNA聚合酶。在一些实施方案中,所述凝聚物包含甲基-DNA结合蛋白(例如,MeCP2)。在一些实施方案中,所述凝聚物包含信号传导因子。
在一些实施方案中,所述体外凝聚物包含多种如本文所述的可检测标签。在一些实施方案中,所述可检测标签包含在不同组分上的荧光标签(例如,用一种荧光标签标记的MED15和用不同荧光标签标记的GCN4或核受体或其片段)。在一些实施方案中,所述凝聚物的一种或多种组分具有淬灭剂。
所述体外凝聚物还可包含固有无序区或域或具有固有无序区或域的蛋白质。所述IDR可以是本文所述的任一者或通过本领域中已知的方法(例如,在本文所提及的文章和网站中)获得。在一些实施方案中,所述IDR是具有陈述于表S2中的基序的IDR。在一些实施方案中,所述组分陈述于表S1中。在一些实施方案中,所述固有无序区或域是MED1、MED15、GCN4或BRD4固有无序区或域。在一些实施方案中,所述IDR包含来自OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、核受体配体、融合致癌转录因子、TFIID、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1或SRSF1IDR的IDR或其部分。在一些实施方案中,所述体外凝聚物包含IDR的一部分。例如,所述凝聚物可包含蛋白质(例如,与体内转录凝聚物缔合的蛋白质)的IDR的至少20%、30%、40%、50%、60%、70%、80%、90%或90%以上。在一些实施方案中,所述体外凝聚物可包含IDR的至少约20、30、40、50、60、75、100、150、200、250或300个氨基酸部分。
在一些实施方案中,所述体外凝聚物包含信号传导因子或其片段。在一些实施方案中,所述体外凝聚物包含信号传导因子或包含基因转录的活化所必需的IDR的其片段。在一些实施方案中,所述信号传导因子与致癌信号传导途径缔合。
在一些实施方案中,所述凝聚物包含甲基-DNA结合蛋白或包含C端IDR的其片段,或抑制因子或包含IDR的其片段。在一些实施方案中,所述凝聚物与甲基化DNA或异染色质缔合。在一些实施方案中,所述凝聚物包含异常水平或活性的甲基-DNA结合蛋白。在一些实施方案中,评估通过所述剂实现的与所述凝聚物缔合的基因的沉默。在一些实施方案中,所述凝聚物包含剪切因子或包含IDR的其片段,或RNA聚合酶或包含IDR的其片段。
在一些实施方案中,所述凝聚物与转录起始复合物或延伸复合物缔合。在一些实施方案中,所述凝聚物与细胞周期素依赖性激酶接触。在一些实施方案中,所述RNA聚合酶是RNA聚合酶II(Pol II)。在一些实施方案中,评估通过与所述剂接触而引起的与所述凝聚物相关的RNA转录起始活性的变化在一些实施方案中,评估通过与所述剂接触而引起的与所述凝聚物相关的RNA延伸或剪切活性的变化。
在一些实施方案中,所述体外凝聚物通过微弱蛋白质-蛋白质相互作用形成。在一些实施方案中,所述微弱蛋白质-蛋白质相互作用包含IDR或IDR的部分之间的相互作用。
在一些实施方案中,所述体外凝聚物包含(固有无序域)-(诱导性低聚域)融合蛋白。所述诱导性低聚域也不受限制。在一些实施方案中,所述诱导性低聚域响应于电磁辐射(例如,可见光)或剂(例如,小分子)进行低聚。诱导性低聚域的实例包括FK506以及FK506结合蛋白和亲环蛋白的环孢霉素结合域,和FRAP的雷帕霉素结合域。在一些实施方案中,所述诱导性低聚域是Cry蛋白(例如,Cry2)。在一些实施方案中,所述融合蛋白是固有无序域-Cry2融合蛋白。“CRY”在这一文献中用于指隐-花色素(隐花色素)蛋白,其典型地是拟南芥的CRY2(GenBank编号:NM_100320)。使用Cry2进行光诱导低聚的方法教导于Che等人,“TheDual Characteristics of Light-Induced Cryptochrome 2,Homo-oligomerization andHeterodimerization,for Optogenetic Manipulation in Mammalian Cells,”ACS SynthBiol.2015年10月16日;4(10):1124–1135和Duan等人,“Understanding CRY2interactions for optical control of intracellular signaling,”NatureCommunications,第8卷:547(2017)中,所述文献以引用的方式并入本文中。在一些实施方案中,所述诱导性低聚域是由小分子、蛋白质或核酸诱导的。在一些实施方案中,所述诱导性低聚域是由可见光(例如,蓝光)诱导的。
所述IDR不受限制并且可以是本文所述或所提及的任一者。在一些实施方案中,所述IDR具有陈述于表S2中的基序。在一些实施方案中,所述固有无序区或域是MED1、MED15、GCN4或BRD4固有无序域。在一些实施方案中,所述IDR是列于表S3中的转录因子的IDR。在一些实施方案中,所述IDR是核受体活化域的IDR。在一些实施方案中,所述IDR是核受体活化域的IDR,其中所述核受体具有与疾病相关的突变。
在一些实施方案中,所述体外凝聚物模拟细胞中发现的转录凝聚物。
在一些实施方案中,体外转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物是分离的。任何合适分离方式均涵盖于本文中。在一些实施方案中,所述体外凝聚物以化学方式或以免疫学方式沉淀。在一些实施方案中,所述体外凝聚物通过离心(例如,在约5,000xg、10,000xg、15,000xg下持续约5-15分钟;在约10.000xg下持续约10min)分离。
在一些实施方案中,所述体外凝聚物是从细胞分离的转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物。本领域中可使用任何合适方法来分离所述凝聚物。例如,所述凝聚物可通过在合适缓冲液条件下用均质器(即,杜恩斯均质器)溶解细胞的核,随后离心和/或过滤以分离所述凝聚物而加以分离。
本发明的一些方面针对一种鉴定调节凝聚物的凝聚物形成、稳定性、功能或形态的剂的方法,所述方法包括提供具有报告基因的转录凝聚物依赖性表达的细胞,使所述细胞与测试剂接触,和评估所述报告基因的表达。在一些实施方案中,所述细胞在与测试剂接触之前不表达报告基因并且在与增强凝聚物形成、稳定性、功能或形态的剂接触之后表达所述报告基因。在一些实施方案中,所述细胞在与测试剂接触之前表达报告基因并且在与抑制、降级或预防凝聚物形成、稳定性、功能或形态的剂接触之后停止或降低所述报告基因的表达。
在一些实施方案中,一种鉴定调节凝聚物形成、稳定性、功能或形态的剂的方法包括提供在转录因子控制下表达报告基因的细胞或体外转录测定(或提供体外测定和细胞两者),使所述细胞或测定与测试剂接触,和评估所述报告基因的表达。在一些实施方案中,所述TF包含异源DNA结合域(DBD)和活化域。在一些实施方案中,所述TF可包含哺乳动物TF、本文所述的TF或突变型哺乳动物TF或本文所述的TF的突变型TF的活化域。在一些实施方案中,所述TF是核受体(例如,突变型核受体、具有独立于同源配体结合的组成性活性的突变型核受体、在他莫昔芬存在下引起雌激素介导的基因活化的突变型雌激素受体、在雌激素不存在下引起基因活化的突变型雌激素受体)。在一些实施方案中,所述突变型TF活化域可与疾病或疾患(例如,本文所述的疾病或疾患)相关。所述DBD不受限制并且可以是任何合适DBD。在一些实施方案中,所述DBD是GAL4DBD。所述体外测定不受限制并且可以是本领域中所公开的任一者。在一些实施方案中,所述体外测定是公开于Sabari等人Science.2018年7月27日;361(6400)中的体外转录测定。
在鉴定本文所公开的剂的方法的一些实施方案中,所述凝聚物包含核受体(例如,野生型核受体、突变型核受体、与疾病或疾患相关的突变型核受体、核激素受体、具有独立于同源配体结合的组成性活性的突变型核激素受体)或包含活化域IDR的其片段。可使用本文所述的任何核受体或片段。在一些实施方案中,所述核受体当结合于同源配体时活化转录。在一些实施方案中,所述核受体独立于配体结合活化转录(例如,具有使其变得配体独立的突变的核受体、在他莫昔芬存在下引起雌激素介导的基因活化的突变型雌激素受体、在雌激素不存在下引起基因活化的突变型雌激素受体)。在一些实施方案中,所述核受体是核激素受体。在一些实施方案中,所述核受体具有突变。在一些实施方案中,所述突变与疾病或疾患相关。在一些实施方案中,所述疾病或疾患是癌症(例如,乳腺癌)。在鉴定本文所公开的剂的方法的一些实施方案中,剂针对包含野生型核受体的凝聚物和具有与疾病相关的突变的核受体两者进行筛选。在一些实施方案中,与野生型核凝聚物相比,所鉴定的剂优先地结合于具有突变的核受体(例如,具有突变的核激素受体、具有突变的配体依赖性核受体、在他莫昔芬存在下引起雌激素介导的基因活化的突变型雌激素受体、在雌激素不存在下引起基因活化的突变型雌激素受体)。在一些实施方案中,与包含野生型核受体的凝聚物相比,所鉴定的剂优先地破坏包含具有突变的核受体(例如,具有突变的核激素受体、具有突变的配体依赖性核受体、在他莫昔芬存在下引起雌激素介导的基因活化的突变型雌激素受体、在雌激素不存在下引起基因活化的突变型雌激素受体)的转录凝聚物。
在一些实施方案中,通过本文所公开的调节凝聚物形成、稳定性、功能或形态的方法鉴定的剂另外或以其他方式进行测试以评估其对凝聚物的一种或多种功能特性的影响,例如调节与所述凝聚物缔合的一种或多种基因的转录的能力。在一些实施方案中,通过本文所公开的调节凝聚物形成、稳定性、功能或形态的方法鉴定的剂还针对其调节疾病的一种或多种特征的能力进行测试。所述疾病不受限制并且可以是本文所公开的任何疾病。例如,如果所述剂通过致癌突变型TF抑制凝聚物形成,那么可能测试所述剂抑制包含那种TF的癌细胞(例如,关于持续活力和/或增生依赖于那种TF的癌细胞)的增生的能力。
在一些实施方案中,通过本文所公开的方法被鉴定为调节凝聚物的一种或多种结构特性(例如,形成、稳定性或形态)或凝聚物的功能特性(例如,转录的调节)的剂可施用至受试者,例如充当疾病模型的非人类动物,或需要治疗所述疾病的受试者。在一些实施方案中,需要用被鉴定为调节凝聚物的一种或多种结构特性的剂治疗的受试者可通过本文所公开的方法进行鉴定。
在一些实施方案中,可产生通过本文所公开的方法被鉴定为调节凝聚物的一种或多种结构特性(例如,形成、稳定性、功能或形态)或凝聚物的功能特性(例如,转录的调节)的剂的类似物。产生类似物的方法是本领域中已知的并且包括本文所述的方法。在一些实施方案中,所产生的类似物可针对所关注的特性进行测试,如增加的稳定性(例如,在水性介质中、在人类血液中、在GI道中,等)、增加的生物可用性、在施用至受试者时增加的半衰期、增加的细胞摄取、增加的调节包括凝聚物的结构特性(例如,形成、稳定性、功能或形态)或凝聚物的功能特性(例如,转录的调节)在内的凝聚物特性的活性、增加的对含有野生型或突变型组分(例如,突变型TF、突变型NR)的凝聚物的特异性、增加的对本文所公开的细胞类型的特异性。
在一些实施方案中,执行高通量筛选(HTS)。高通量筛选可使用无细胞或基于细胞的测定(例如,含有如本文所述的细胞的凝聚物、体外凝聚物、体外分离的凝聚物)。高通量筛选通常涉及以高效率测试大量化合物,例如平行地。例如,数万种或数十万种化合物可常规地在短时期(例如,数小时至数日)内进行筛选。所述筛选通常在含有至少96个孔的多孔板或其中在基质中存在多个物理分离的空腔或凹陷的其他容器中执行。高通量筛选通常涉及使用自动化,例如用于液体处置、成像、数据采集和加工等。可应用于本发明的HTS的实施方案中的某些一般原则和技术描述于Macarrón R和Hertzberg RP.Design andimplementation of high-throughput screening assays.Methods Mol Biol.,565:1-32,2009和/或An WF和Tolliday NJ.,Introduction:cell-based assays for high-throughput screening.Methods Mol Biol.486:1-12,2009和/或其中任一者中的参考文献中。适用方法还公开于High Throughput Screening:Methods and Protocols(Methodsin Molecular Biology),William P.Janzen(2002)和High-Throughput Screening inDrug Discovery(Methods and Principles in Medicinal Chemistry)(2006),Jorg
Figure BDA0002792767850001251
中。
术语“命中”一般是指在筛选或测定中实现所关注的效应的剂,例如对于细胞生存、细胞增生、基因表达、蛋白质活性或正在所述筛选或测定中测量的所关注的其他参数具有至少预定水平的调节效应的剂。在筛选中被鉴定为命中的测试剂可选择用于进一步测试、开发或修饰。在一些实施方案中,使用相同测定或不同测定再测试测试剂。例如,候选抗癌剂可针对多种不同癌细胞系或在体内肿瘤模型中进行测试以测定其对于癌细胞生成或增生、肿瘤生长等的影响。必要时,可合成或以其他方式获得附加量的所述测试剂。可使用物理测试或计算方法来测定或预测在筛选中鉴定的化合物的一种或多种物理化学、药物动力学和/或药效学特性。例如,可以实验方法测定或预测溶解度、吸收、分布、代谢和排泄(ADME)参数。所述信息可用于例如选择用于进一步测试、开发或修饰的命中。例如,可选择具有“药物样”分子所特有的特征的小分子和/或可避免或修饰具有一种或多种不利特征的小分子以降低或消除所述不利特征。
在一些实施方案中,检查命中化合物的结构以鉴定药效团,所述药效团可用于设计另外的化合物。如与原始命中相比,另外的化合物可例如具有一种或多种改变(例如,改进)的物理化学、药物动力学(例如,吸收、分布、代谢和/或排泄)和/或药效学特性,或可具有大约相同特性,但具有不同结构。改进的特性一般是使得化合物可更容易使用或更适用于一种或多种期望用途的特性。改进可经由所述命中结构的经验修饰(例如,合成具有相关结构的化合物并且在无细胞或基于细胞的测定中或在非人类动物中测试所述化合物)和/或使用计算方法来实现。所述修饰可使用确定的医药化学原则以可预测地改变一种或多种特性。在一些实施方案中,命中化合物的分子靶经过鉴定或是已知的。在一些实施方案中,作用于相同分子靶的另外的化合物可凭经验加以鉴定(例如,经由筛选化合物库)或经过设计。
来自测试剂或执行筛选的数据或结果可进行存储或以电子方式传递。所述信息可存储于有形介质上,所述有形介质可以是计算机可读介质、纸等。在一些实施方案中,一种鉴定或测试剂的方法包括存储和/或以电子方式传递信息,所述信息指示测试剂具有一种或多种所关注的特性,或指示测试剂在特定筛选中是“命中”,或指示使用测试剂实现的特定结果。可产生来自筛选的命中的列表并且加以存储或传递。命中可基于活性、结构相似性或其他特征进行排序或分成两个或更多个组。
一旦候选剂得到鉴定,可基于所述候选剂产生另外的剂,例如类似物。另外的剂可例如具有增加的癌细胞摄取、增加的效力、增加的稳定性、较大溶解度或任何改进的特性。在一些实施方案中,产生所述剂的经标记形式。所述经标记的剂可用于例如直接地测量剂与细胞中的分子靶的结合。在一些实施方案中,如本文所述进行鉴定的剂的分子靶可得到鉴定。剂可用作亲和剂以分离分子靶。可执行鉴定分子靶的测定,例如使用如质谱分析的方法。一旦分子靶得到鉴定,可执行一种或多种另外的筛选以鉴定特异性地作用于那个靶的剂。
在多个实施方案中,多种剂中的任一者均可用作测试剂。例如,测试剂可以是小分子、多肽、肽、氨基酸、核酸、寡核苷酸、脂质、碳水化合物或杂合分子。在一些实施方案中,用作测试剂的核酸包含siRNA、shRNA、反义寡核苷酸、适体或无规寡核苷酸。在一些实施方案中,测试剂是细胞可渗透的或以某一形式或用适当载体(carrier)或载体(vector)提供以允许其进入细胞。测试剂可以是如本文所述的任何剂。
剂可获自天然来源或以合成方式产生。剂可以是至少部分纯的或可存在于萃取物或其他类型的混合物中。萃取物或其部分可由例如植物、动物、微生物、海洋生物、发酵液(例如,土壤、细菌或真菌发酵液)等产生。在一些实施方案中,测试化合物收集(“库”)。化合物库可包含天然产品和/或使用非直接或直接合成有机化学产生的化合物。在一些实施方案中,库是小分子库、肽库、拟肽库、cDNA库、寡核苷酸库或展示库(例如,噬菌体展示库)。在一些实施方案中,库包含前述类型中的两者或更多者的剂。在一些实施方案中,寡核苷酸库中的寡核苷酸包含siRNA、shRNA、反义寡核苷酸、适体或无规寡核苷酸。
库可包含例如100种与500,000种之间的化合物,或更多化合物。在一些实施方案中,库包含至少10,000种、至少50,000种、至少100,000种或至少250,000种化合物。在一些实施方案中,化合物库的化合物排列于多孔板中。其可溶解于溶剂(例如,DMSO)中或以干燥形式提供,例如呈粉末或固体形式。可测试合成、半合成和/或天然存在的化合物的收集。化合物库可包含结构上相关、结构上不同或结构上不相关的化合物。化合物可以是人工(具有人工发明的结构并且未在自然界中发现)或天然存在的。在一些实施方案中,化合物已在药物发现程序和/或其类似物中被鉴定为“命中”或“先导”。在一些实施方案中,库可聚焦(例如,主要由具有相同核心结构、源于相同前体或共同具有至少一种生物化学活性的化合物构成)。化合物库可获自如Tocris BioScience、Nanosyn、BioFocus的多种商业供货商,并且可获自政府实体,如U.S.National Institutes of Health(NIH)。在一些实施方案中,测试剂并非在本领域中已知或使用的细胞培养基(例如用于培养脊椎动物,例如哺乳动物细胞)中发现的剂,例如出于培养细胞的目的提供的剂。在一些实施方案中,如果所述剂是在本领域中已知或使用的细胞培养基中发现的剂,那么所述剂可以不同于(例如,高于)当在本文所述的方法或组合物中用作测试剂时的浓度使用。
涉及核受体的筛选测定
本发明的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的测试剂的方法,所述方法包括提供细胞、使所述细胞与测试剂接触和测定与所述测试剂的接触是否会调节凝聚物的形成、稳定性或形态,其中所述凝聚物包含核受体(NR)或其片段作为凝聚物组分。所述核受体不受限制并且可以是本文所述的任何核受体。在一些实施方案中,所述核受体是突变型核受体(例如,与疾病相关的突变型核受体、具有独立于同源配体结合的组成性活性(例如,转录活性)的突变型核受体)。在一些实施方案中,所述核受体是核激素受体、雌激素受体或视黄酸受体-α。在一些实施方案中,所述凝聚物还包含辅因子(例如,介体、MED1)作为凝聚物组分。所述凝聚物的组分可以是本文所述的任何合适凝聚物组分。在一些实施方案中,所述细胞包含所述凝聚物。在一些实施方案中,所述剂引起所述细胞中所述凝聚物的形成。
在鉴定测试剂的方法的一些实施方案中,调节凝聚物的形成、稳定性或形态的剂(例如,如果其减少所述凝聚物的形成或稳定性)被鉴定为候选治疗剂(例如,特征在于突变型核受体的疾病、癌症或特征在于包含所述核受体的信号传导途径的疾病的治疗剂)。在一些实施方案中,所鉴定的剂可以是用于本文所述的任何对应疾病或疾患的疗法的候选物。在鉴定本文所述的测试剂的方法的一些实施方案中,减少包含突变型核受体的凝聚物的形成或稳定性的剂被鉴定为用于治疗特征在于突变型NR的疾病或疾患的候选剂。在鉴定本文所述的测试剂的方法的一些实施方案中,减少包含核受体(例如,突变型核受体)或其片段的凝聚物的形成或稳定性的剂被鉴定为所述核受体的活性的候选调节剂。
在鉴定测试剂的方法的一些实施方案中,所述凝聚物的调节会降低或消除靶基因(例如,MYC致癌基因或描述于本文中或牵涉于癌症生长或活力中的其他基因)的转录。在一些实施方案中,所述靶基因(例如,MYC致癌基因)的转录降低达至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或更高。
在一些实施方案中,所述凝聚物包含可检测标记。所述标记不受限制并且可以是本文所述的任何标记。在一些实施方案中,所述凝聚物的组分包含可检测标记。在一些实施方案中,所述核受体或其片段包含可检测标记。
本发明的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供体外凝聚物、使所述凝聚物与测试剂接触和测定与所述测试剂的接触是否会调节凝聚物的形成、稳定性或形态,其中所述凝聚物包含核受体(NR)或其片段作为凝聚物组分。所述核受体不受限制并且可以是本文所述的任何核受体。在一些实施方案中,所述核受体是突变型核受体(例如,与疾病相关的突变型核受体、具有独立于同源配体结合的组成性活性(例如,转录活性)的突变型核受体)。在一些实施方案中,所述核受体是核激素受体、雌激素受体或视黄酸受体-α。在一些实施方案中,所述凝聚物还包含辅因子(例如,介体、MED1)作为凝聚物组分。所述凝聚物的组分可以是本文所述的任何合适凝聚物组分。在一些实施方案中,所述凝聚物是从细胞分离。与所述凝聚物分离的细胞可以是任何合适细胞。在一些实施方案中,所述剂引起所述体外凝聚物的形成。
在鉴定测试剂的方法的一些实施方案中,调节体外凝聚物的形成、稳定性或形态的剂(例如,如果其减少所述凝聚物的形成或稳定性)被鉴定为候选治疗剂(例如,特征在于突变型核受体的疾病、癌症或特征在于包含所述核受体的信号传导途径的疾病的治疗剂)。在一些实施方案中,所鉴定的剂可以是用于本文所述的任何对应疾病或疾患的疗法的候选物。在鉴定本文所述的测试剂的方法的一些实施方案中,减少包含突变型核受体的体外凝聚物的形成或稳定性的剂被鉴定为用于治疗特征在于突变型NR的疾病或疾患的候选剂。在鉴定本文所述的测试剂的方法的一些实施方案中,减少包含核受体(例如,突变型核受体)或其片段的体外凝聚物的形成或稳定性的剂被鉴定为所述核受体的活性的候选调节剂。
在一些实施方案中,所述体外凝聚物包含可检测标记。所述标记不受限制并且可以是本文所述的任何标记。在一些实施方案中,所述凝聚物的组分包含可检测标记。在一些实施方案中,所述核受体或其片段包含可检测标记。
疾病和疾病依赖性
癌细胞可变得高度依赖于某些基因的转录,如在转录上瘾中,并且这种转录可依赖于特定凝聚物。例如,转录凝聚物可能形成于肿瘤依赖性致癌基因上并且这一凝聚物可能尤其依赖于可由本文所述的剂(例如,肽、核酸或小分子)靶向的特定蛋白质、RNA或DNA基序。本公开的一些实施方案针对使用本文所述的方法来筛选抑制、消除或降级癌细胞中的转录凝聚物的抗癌剂。本公开的一些实施方案针对使用本文所述的方法来筛选调节癌细胞中的异染色质凝聚物的抗癌剂。在一些实施方案中,使用本文所述的方法来鉴定减少包含核受体(例如,突变型核受体、突变型激素受体)的转录凝聚物的形成或稳定性的剂。
例如,在一些实施方案中,使用本文所述的方法来鉴定减少包含MED1和ER的转录凝聚物的形成或稳定性的剂。在一些实施方案中,使用本文所述的方法来鉴定减少包含MED1和抵抗他莫昔芬的突变型ER的转录凝聚物的形成或稳定性的剂。在一些实施方案中,使用本文所述的方法来鉴定减少包含MED1和ER的转录凝聚物的形成或稳定性的剂(例如具有如本文所述的SERM活性的剂,例如有效抵抗ER+乳腺癌的候选剂)。在一些实施方案中,使用本文所述的方法来鉴定减少包含增加水平的MED1(例如,与来自并非他莫昔芬抗性的ER+乳腺癌细胞的凝聚物中相比,多至少4倍MED1)的转录凝聚物的形成或稳定性的剂。在一些实施方案中,使用本文所述的方法来鉴定减少包含突变型ER(例如,如本文所述)和MED1的转录凝聚物的形成或稳定性的剂。在一些实施方案中,所鉴定的剂是用于预防发展或克服SERM(他莫昔芬)抗性癌症(例如,乳腺癌)的候选剂。
具有引起疾病的突变或表观遗传学改变的细胞会经历依赖于特定凝聚物的改变的转录。例如,疾病可由一种或多种疾病基因处的凝聚物形成、组成、维持、溶解或调控引起并且依赖于此。本公开的一些实施方案针对使用本文所述的方法来调节与疾病相关的凝聚物。本公开的一些实施方案针对筛选可通过本文所述的方法调节与疾病相关的凝聚物的剂。
在一些实施方案中,本文所述的疾病或疾患与核受体相关。在一些实施方案中,本文所述的疾病或疾患与核受体的突变或核受体的异常表达(例如,如与参考水平相比,增加或减少的水平)相关。
凝聚物和凝聚物组分组合物
本公开的一些方面针对包含DNA、RNA和蛋白质中的一者、两者或全部三者的分离的合成凝聚物。所述合成凝聚物可包含本文所述的组分中的任一者。在一些实施方案中,所述合成凝聚物可包含如本文所述的IDR诱导性低聚域。在一些实施方案中,所述合成凝聚物可包含介体、MED1、MED15、p300、BRD4、核受体配体或TFIID。在一些方面,所述合成转录凝聚物可包含转录因子(例如,OCT4、p53、MYC、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、融合致癌转录因子或GCN4)。在一些实施方案中,所述合成凝聚物可包含OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1或TFIID或其片段或固有无序域。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的活化域。在一些实施方案中,所述转录因子具有列于表S3中的转录因子的IDR。在一些实施方案中,所述转录因子列于表S3中。在一些实施方案中,所述转录因子是与介体组分(例如,列于表S3中的介体组分)相互作用的转录因子。本公开的一些方面针对包含一种或多种合成转录凝聚物的液体小液滴。本公开的一些方面针对一种包含如本文所述的筛选测定所需的组分的组合物。
本公开的一些方面针对一种融合蛋白,其包含如本文所述的转录凝聚物组分和如本文所述的赋予诱导性低聚的域。在一些实施方案中,所述赋予诱导性低聚的域是Cry2。在一些实施方案中,所述融合蛋白还包含如本文所述的可检测标签。在一些方面,所述可检测标签是荧光标签。在一些实施方案中,赋予诱导性低聚的域可用小分子、蛋白质或核酸诱导。
本公开的一些方面提供产生合成转录凝聚物、异染色质凝聚物和与mRNA起始或延伸复合物物理缔合的凝聚物的方法。在一些实施方案中,所述方法包括在适用于形成转录凝聚物、异染色质凝聚物和与mRNA起始或延伸复合物物理缔合的凝聚物的条件下体外组合两种或更多种凝聚物组分。所述条件可包括适当组分浓度、盐浓度、pH等。在一些实施方案中,所述条件包括约25mM、40mM、50mM、125mM、200mM、350mM或425mM;或在约10-250mM、25-150mM或40-100mM范围内的盐浓度(例如,NaCl)。在一些实施方案中,所述条件包括约7-8、7.2-7.8、7.3-7.7、7.4-7.6或约7.5的pH。在一些实施方案中,所述转录凝聚物组分包含MED1、BRD4、BRD4的固有无序域(BRD4-IDR)和/或MED1的固有无序域(MED1-IDR)。在一些实施方案中,所述转录凝聚物组分包含BRD4-IDR和MED1-IDR。在一些实施方案中,所述转录凝聚物组分包含转录因子(例如,OCT4、p53、MYC、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、融合致癌转录因子或GCN4)的活化域的IDR。在一些实施方案中,所述IDR是列于表S3中的转录因子的IDR。在一些实施方案中,所述转录凝聚物组分包含核受体(例如,ER)活化域。在一些实施方案中,所述IDR是OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1或TFIID的IDR。
mRNA起始或延伸复合物组分缔合的凝聚物
如下文所示,Pol II CTD磷酸化会改变其凝聚物分配行为并且因此举可驱动PolII从牵涉于转录起始中的凝聚物交换至牵涉于RNA剪切中的那些凝聚物。这一模型与来自先前研究的如下迹象一致:Pol II的大团簇可与细胞中的介体凝聚物融合,磷酸化会溶解CTD介导的Pol II团簇,CDK9/细胞周期素T可经由相分离机制与CTD相互作用,Pol II在转录延伸期间不再与介体缔合,并且含有剪切因子的核光斑可在具有高转录活性的基因座处观察到。
本公开的一些方面针对一种调节mRNA起始的方法,所述方法包括调节与mRNA起始物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。在一些实施方案中,调节mRNA起始也会调节mRNA延伸、剪切或加帽。在一些实施方案中,调节与mRNA起始物理缔合的凝聚物的形成、组成、维持、溶解和/或调控会调节mRNA转录速率。在一些实施方案中,调节与mRNA起始物理缔合的凝聚物的形成、组成、维持、溶解和/或调控会调节基因产物的水平。
在一些实施方案中,与mRNA起始物理缔合的凝聚物的形成、组成、维持、溶解和/或调控是用剂调节。所述剂不受限制并且可以是本文所述的任何剂。在一些实施方案中,所述剂包含磷酸化或低磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。在一些实施方案中,所述剂优先地结合磷酸化或低磷酸化Pol II CTD。在一些实施方案中,所述剂会磷酸化或脱磷酸化Pol CTD。在一些实施方案中,所述剂会调节细胞周期素依赖性激酶(CDK)的磷酸化活性。在一些实施方案中,所述剂会增强或抑制与剪切因子缔合的磷酸化RNA聚合酶。所述剪切因子可以是本文所述的任何剪切因子并且不受限制。
本公开的一些方面针对一种调节mRNA延伸的方法,所述方法包括调节与mRNA延伸物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。在一些实施方案中,调节mRNA延伸也会调节mRNA起始。在一些实施方案中,调节与mRNA延伸物理缔合的凝聚物的形成、组成、维持、溶解和/或调控会调节mRNA的共转录加工。在一些实施方案中,调节与mRNA延伸物理缔合的凝聚物的形成、组成、维持、溶解和/或调控会调节mRNA剪切变体的数目或相对比例。在一些实施方案中,与mRNA延伸物理缔合的凝聚物的形成、组成、维持、溶解和/或调控是用剂调节。所述剂不受限制并且可以是本文所公开的任何剂。在一些实施方案中,所述剂包含磷酸化或低磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。在一些实施方案中,所述剂优先地结合磷酸化或低磷酸化Pol II CTD。在一些实施方案中,所述剂优先地结合磷酸化或低磷酸化Pol II CTD。在一些实施方案中,所述剂会磷酸化或脱磷酸化Pol CTD。在一些实施方案中,所述剂会调节细胞周期素依赖性激酶(CDK)的磷酸化活性。在一些实施方案中,所述剂会增强或抑制与剪切因子缔合的磷酸化RNA聚合酶。所述剪切因子可以是本文所述的任何剪切因子并且不受限制。
本公开的一些方面涉及一种调节凝聚物的形成、组成、维持、溶解和/或调控的方法,所述方法包括调节凝聚物组分的磷酸化或脱磷酸化。在一些实施方案中,所述组分是RNA聚合酶II或RNA聚合酶II C端区。在一些实施方案中,使用剂来调节凝聚物组分的磷酸化或脱磷酸化。所述剂不受限制并且可以是本文所公开的任何剂。在一些实施方案中,所述剂会调节细胞周期素依赖性激酶(CDK)的磷酸化活性。
本公开的一些方面涉及一种治疗与异常mRNA加工相关的疾病或疾患或降低所述疾病或疾患的可能性的方法,所述方法包括调节与mRNA延伸物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。所述调节凝聚物的方法不受限制并且可以是本文所述用于调节凝聚物的任何方法。在一些实施方案中,所述凝聚物用本文所述的剂调节。在一些实施方案中,与异常mRNA加工相关的疾病或疾患的特征在于异常剪切变体。在一些实施方案中,与异常mRNA加工相关的疾病或疾患的特征在于异常mRNA起始。
本公开的一些方面涉及一种鉴定调节与mRNA起始或延伸复合物物理缔合的凝聚物的形成、稳定性或形态的剂的方法。所述鉴定剂的方法可以是鉴定剂或筛选本文所述的剂的任何方法。
在一些实施方案中,所述方法包括提供具有凝聚物的细胞、使所述细胞与测试剂接触和测定与所述测试剂的接触是否会调节所述凝聚物的形成、稳定性或形态,其中所述凝聚物包含低磷酸化RNA聚合酶II C端域(Pol II CTD)、磷酸化RNA聚合酶II C端域(PolII CTD)、剪切因子或其功能片段。本公开的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供体外凝聚物并且评估所述体外凝聚物的一种或多种物理特性、使所述体外凝聚物与测试剂接触和评估与所述测试剂的接触是否会引起所述体外凝聚物的所述一种或多种物理特性的变化,其中所述凝聚物包含低磷酸化RNA聚合酶II C端域(Pol II CTD)、磷酸化RNA聚合酶II C端域(Pol II CTD)、剪切因子或其功能片段。
本公开的一些方面涉及一种鉴定细胞蛋白质中的氨基酸残基的方法,所述细胞蛋白质的磷酸化状态会调控凝聚物形成、稳定性、定位、分配、活性或其他特性。所鉴定的残基可能是修饰靶以在受试者中或体外调节凝聚物形成、稳定性、定位、分配、活性或其他特性。在一些实施方案中,所述方法需要以物理方式或以计算方式鉴定凝聚物组分(例如,丝氨酸、苏氨酸或酪氨酸)中的一个或多个磷酸化位点或潜在磷酸化位点,使一个或多个所述残基突变(例如,将残基变化为丙氨酸),和测定所述突变是否改变包含所述突变型凝聚物组分的凝聚物的特性(例如,形成、稳定性、定位、分配、活性)(例如,如与不含所述突变的凝聚物组分相比)。如果所述突变会改变凝聚物特性,那么磷酸化位点被鉴定为修饰靶以调节凝聚物的形成、稳定性、定位、分配或活性。在本发明的一些实施方案中,负责所鉴定的残基的磷酸化的激酶得到鉴定(例如,使用其中所述凝聚物是底物的体外激酶测定,使用具有降低的个别激酶表达的细胞(例如,执行全蛋白激酶组siRNA筛选),使用已知抑制特定激酶的已知激酶抑制剂)或者或另外,在一些实施方案中,筛选已知激酶抑制剂的库以鉴定影响所鉴定的残基的磷酸化状态的一种或多种激酶。在本发明的一些实施方案中,负责所鉴定的残基的脱磷酸化的磷酸酯酶得到鉴定(例如,使用其中所述凝聚物是底物的体外磷酸酯酶测定,使用具有降低的个别磷酸酯酶表达的细胞(例如,执行已知磷酸酯酶的siRNA筛选),使用已知抑制特定磷酸酯酶的已知磷酸酯酶抑制剂)或者或另外,在一些实施方案中,筛选已知磷酸酯酶抑制剂的库以鉴定影响所鉴定的残基的磷酸化状态的一种或多种磷酸酯酶。在多个实施方案中,这些测定可能体外、在无细胞系统中或在细胞中执行。
本公开的一些方面涉及一种分离的合成凝聚物,其包含低磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。本公开的一些方面涉及一种分离的合成凝聚物,其包含磷酸化RNA聚合酶II C端域(Pol II CTD)或其功能片段。本公开的一些方面涉及一种分离的合成凝聚物,其包含剪切因子或其功能片段。
异染色质凝聚物
异染色质在染色体维持和基因沉默中发挥重要作用。下文显示出MeCP2(普遍地表达于细胞中并且是正常发育所必需的甲基-DNA结合蛋白)是动态液体异染色质凝聚物的关键组分。含MeCP2的凝聚物可区域化促进基因沉默的抑制异染色质因子。MeCP2形成凝聚物、并入至细胞中的异染色质中和区域化基因沉默因子的能力依赖于其C端固有无序区(IDR)。
本公开的一些方面涉及一种调节一种或多种基因的转录的方法,所述方法包括调节与异染色质缔合的凝聚物(即,异染色质凝聚物)的形成、组成、维持、溶解和/或调控。所述调节异染色质凝聚物的方法不受限制并且可以是用于调节本文所述的凝聚物的任何方法。在一些实施方案中,调节所述异染色质凝聚物会使所述一种或多种基因的转录的抑制(即,基因沉默)增加或稳定化。在一些实施方案中,调节所述异染色质凝聚物会减少所述一种或多种基因的转录的抑制(即,基因沉默)。在一些实施方案中,调节多种与异染色质缔合的凝聚物。在一些实施方案中,异染色质凝聚物的形成、组成、维持、溶解和/或调控是用剂调节。所述剂不受限制并且可以是本文所述的任何剂。在一些实施方案中,所述剂包含肽、核酸或小分子,或由肽、核酸或小分子组成。在一些实施方案中,所述剂结合甲基化DNA、甲基-DNA结合蛋白或基因沉默因子。
本公开的一些方面涉及一种调节基因沉默的方法,所述方法包括调节异染色质凝聚物的形成、组成、维持、溶解和/或调控。在一些实施方案中,基因沉默稳定化或增加。在一些实施方案中,基因沉默是减少的。在一些实施方案中,基因沉默是用剂调节。所述剂不受限制并且可以是本文所述的任何剂。
本公开的一些方面涉及一种治疗与异常基因沉默(例如,如与参考或对照水平相比增加或减少的水平)相关的疾病或疾患或降低所述疾病或疾患的可能性的方法,所述方法包括调节异染色质凝聚物的形成、组成、维持、溶解和/或调控。在一些实施方案中,与异常基因沉默相关的疾病或疾患是与甲基-DNA结合蛋白的异常表达或活性相关。在一些实施方案中,与异常基因沉默相关的疾病或疾患是ATR-X综合征、Juberg-Marsidi综合征、Sutherland-Haan综合征、Smith-Finemers综合征、乳腺癌、MECP2重复综合征、雷特综合征、自闭症、唐氏综合征、ADHD/ADD、阿尔兹海默氏、亨廷顿氏、帕金森氏、癫痫、双极情绪病症、抑郁症、胎儿酒精综合征、Werner综合征、结肠癌、淋巴瘤、胰腺癌、ICF综合征、膀胱癌、乳腺癌、结肠癌、肝细胞癌、肺癌、巴雷特氏食道、膀胱癌、乳腺癌、结肠直肠癌、黑素瘤、骨髓瘤/淋巴瘤、肝细胞癌、前列腺癌、威尔姆氏肿瘤、乳腺癌、神经管胚细胞瘤、乳头状甲状腺癌、面部肩胛肱骨肌营养不良、弗里德希氏共济失调、脆性X综合征、Angelman综合征、Prader-Willi综合征、早年衰老综合征、Werner综合征、Beckwith-Weidemann综合征、Silver-Russel综合征、脊髓小脑性共济失调或可卡因物质滥用。在一些实施方案中,与异常基因沉默相关的疾病或疾患是雷特综合征或MeCP2过表达综合征。
本公开的一些方面涉及一种鉴定调节异染色质凝聚物的凝聚物形成、稳定性或形态的剂的方法。所述鉴定剂的方法可以是鉴定剂或筛选本文所述的剂的任何方法。在一些实施方案中,所述方法包括提供具有凝聚物的细胞、使所述细胞与测试剂接触和测定与所述测试剂的接触是否会调节所述异染色质凝聚物的形成、稳定性或形态,其中所述凝聚物包含甲基-DNA结合蛋白(例如,MeCP2)或其片段(例如,MeCP2的C端固有无序区)或抑制因子或其功能片段。在一些实施方案中,所述凝聚物与甲基化DNA缔合。在一些实施方案中,所述方法包括提供体外凝聚物并且评估所述体外凝聚物的一种或多种物理特性、使所述体外凝聚物与测试剂接触和评估与所述测试剂的接触是否会引起所述体外凝聚物的所述一种或多种物理特性的变化,其中所述凝聚物包含甲基-DNA结合蛋白(例如,MeCP2)或其片段(例如,MeCP2的C端固有无序区)或抑制因子或其功能片段。
本公开的一些方面涉及一种分离的合成凝聚物,其包含甲基-DNA结合蛋白(例如,MeCP2)或其片段(例如,MeCP2的C端固有无序区)或抑制因子或其功能片段。
诊断方法
本公开的一些方面涉及诊断方法和鉴定作为用凝聚物靶向治疗剂治疗的候选者的受试者的方法。在一些实施方案中,鉴定作为用凝聚物靶向治疗剂治疗的候选者的受试者的方法包括获得从所述受试者分离的样品,测定所述样品中一种或多种凝聚物的水平(或选自稳定性、溶解或维持的特性),和如果检测到所述凝聚物的异常水平(例如,如与参考水平相比,增加或减少的水平)或选自稳定性、溶解或维持的异常特性,那么将所述受试者鉴定为用凝聚物靶向治疗剂治疗的候选者。所述方法还可包括向所述受试者施用凝聚物靶向治疗剂,其中所述剂至少部分地标准化所述凝聚物的异常水平(或选自稳定性、溶解或维持的特性)。“凝聚物靶向治疗剂”在本文中是定义为例如通过与凝聚物组分物理缔合、修饰凝聚物组分或抑制或活化凝聚物组分的修饰剂/去修饰剂而以治疗学有益的方式调节凝聚物的形成、稳定性、组成、维持、溶解或调控的剂。在一些实施方案中,所述受试者罹患癌症。在一些实施方案中,所述凝聚物包含致癌基因或驱动致癌基因的转录。在一些实施方案中,所述凝聚物是转录凝聚物。在一些实施方案中,所述凝聚物是异染色质缔合凝聚物。
在一些方面,一种方法包括提供获自受试者(例如哺乳动物受试者,例如人类受试者)的样品,和检测所述样品中的转录凝聚物。在一些实施方案中,所述样品包含至少一种细胞,例如至少一种癌细胞。在一些实施方案中,所述方法包括如与对照细胞或样品(例如,来自健康受试者的健康细胞或样品)相比,检测细胞或样品中转录凝聚物的异常水平(例如,如与参考水平相比,增加或减少的水平)、异常组成或异常定位。在一些实施方案中,转录凝聚物的异常水平、组成或定位的检测可用于诊断疾病。
在一些方面,一种方法包括提供获自受试者(例如哺乳动物受试者,例如人类受试者)的样品,和如与对照细胞或样品(例如,来自健康受试者的健康细胞或样品)相比,检测所述样品中转录凝聚物的组分的突变或异常水平或活性。在一些实施方案中,所述样品包含至少一种细胞,例如至少一种癌细胞。在一些实施方案中,转录凝聚物的组分的突变或水平或活性改变会影响转录凝聚物的形成、稳定性、定位、活性或形态。在一些实施方案中,所述样品中转录凝聚物的组分的突变或异常水平或活性的检测可用于诊断疾病。
转基因非人类动物
本公开的一些方面涉及转基因非人类动物(例如,非人类哺乳动物、非人类灵长类动物、啮齿动物(例如,小鼠、大鼠、兔、仓鼠)、犬、猫、牛或其他哺乳动物),其细胞包含编码包含融合至可检测标记的凝聚物组分的多肽的转基因。在一些实施方案中,所述方法可包括向所述动物施用测试剂,获得包含从所述动物分离的一个或多个细胞的样品,和测定所述测试剂对于包含所述多肽的凝聚物的形成、稳定性或活性的影响。在一些实施方案中,所述样品是组织样品。
本公开的一些方面涉及作为用于疾病或疾患的动物模型的转基因动物。所述疾病或疾患不受限制并且可以是本文所公开的任何疾病或疾患。在一些实施方案中,使用所述转基因动物来测试用于所述疾病的候选剂。在一些实施方案中,所述转基因动物是用于执行本文所公开的方法(例如,筛选或鉴定剂的方法)的原代细胞的来源。
乳腺癌
乳腺癌是最常见癌症之一并且是癌症死亡率的主要原因。大约70%人类乳腺癌是激素依赖性的和雌激素受体阳性(ER+)(例如就生长来说,依赖于雌激素)。如他莫昔芬、雷洛昔芬(raloxifene)或托瑞米芬(toremifene)的选择性雌激素受体调节剂(SERM)通常用于治疗ER+乳腺癌。应了解,SERM可充当乳房组织中的ER抑制剂(拮抗剂),但视所述剂而定,可充当某些其他组织(例如,骨)中的ER活化剂(例如,部分促效剂)。还应了解,他莫昔芬自身为前药,其具有相当低的对ER的亲和力,但代谢为活性代谢物,如4-羟基他莫昔芬(阿非昔芬(afimoxifene))和N-脱甲基-4-羟基他莫昔芬(安多昔芬)。如本文所用,术语“他莫昔芬”在本文中应解释为意指他莫昔芬或其活性代谢物。例如,他莫昔芬通常是施用至患者的形式。然而,如4-羟基他莫昔芬(阿非昔芬)和/或N-脱甲基-4-羟基他莫昔芬(安多昔芬)的活性代谢物可更加适用于体外用途。
他莫昔芬是最常用于具有ER阳性乳腺癌的患者的化学治疗剂。据信他莫昔芬与雌激素竞争结合于ER并且他莫昔芬结合的ER具有降低或消除的转录因子活性。然而,服用他莫昔芬的多名患者最终发展他莫昔芬抗性乳腺癌。在雌激素刺激时,ER建立超级增强子(Bojcsuk等人,Nucleic Acids Res 2017)。此外,如下文所示,MED1在ER+乳腺癌中过表达并且是ER功能和ER+肿瘤生成所需的。又如下文所示,雌激素刺激ER并入至MED1凝聚物中。这一并入依赖于MED1中LXXL基序的存在。
本文中的结果显示,MED1-IDR和ER体外并且在细胞中形成依赖于雌激素的凝聚物。凝聚物形成由他莫昔芬减弱。然而,一些他莫昔芬抗性ER+乳腺癌包含独立于雌激素具活性的突变型ER(例如,Y537S和D538G突变体)。其他他莫昔芬抗性ER+乳腺癌包含独立于雌激素具活性的ER融合蛋白(例如,ER-YAP1、ER-PCDH11X)。这些ER独立于雌激素的存在形成具有MED1的凝聚物。本文中所示的其他结果证明了过表达MED1(例如,与非他莫昔芬抗性ER+乳腺癌细胞相比,多出超过四倍)的ER+乳腺癌细胞独立于雌激素与ER的结合将ER并入至含MED1的凝聚物中。
本公开的一些方面涉及一种调节细胞中一种或多种基因的转录的方法,所述方法包括调节与所述一种或多种基因缔合的凝聚物的组成、维持、溶解和/或调控,其中所述凝聚物包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。在一些实施方案中,所述雌激素受体是突变型雌激素受体。在一些实施方案中,所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性(例如,Y537S和D538G突变体)。在一些实施方案中,所述突变型雌激素受体是融合蛋白。在一些实施方案中,所述融合蛋白具有不依赖于雌激素结合的组成性活性(例如,ER-YAP1、ER-PCDH11X)。在一些实施方案中,所述雌激素受体片段包含配体结合域或其功能片段。在一些实施方案中,所述ER片段包含2个配体结合域或其功能片段。在一些实施方案中,所述ER片段包含DNA结合域。在一些实施方案中,所述MED1片段包含IDR、LXXLL基序或两者。在一些实施方案中,所述ER或MED1是人类ER或MED1。在本文所述的方法和组合物的一些实施方案中,所述ER或MED1是非人类哺乳动物(例如,大鼠、小鼠、兔)ER或MED1。
在一些实施方案中,所述凝聚物与雌激素或其功能片段接触(例如,所述雌激素或其片段与所述凝聚物物理缔合或在包含所述凝聚物的溶液中)。在一些实施方案中,所述凝聚物与选择性雌激素选择性调节剂(SERM)接触(例如,所述SERM与所述凝聚物物理缔合或在包含所述凝聚物的溶液中)。在一些实施方案中,所述SERM是他莫昔芬或其活性代谢物(4-羟基他莫昔芬和/或N-脱甲基-4-羟基他莫昔芬)。在一些实施方案中,所述凝聚物的调节会降低或消除MYC致癌基因的转录。在一些实施方案中,所述MYC致癌基因的转录降低达至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或更高。
所述细胞可以是任何合适细胞。在一些实施方案中,所述细胞是乳腺癌细胞(例如,从患者分离的乳腺癌细胞、来自细胞系的乳腺癌细胞(例如,600MPE、AU565、BT-20、BT-474、BT483、BT-549、Evsa-T、Hs578T、MCF-7、MDA-MB-231、SkBr3、T-47D))。在一些实施方案中,所述细胞是表达MED1和雌激素受体(例如,人类MED1和/或雌激素受体)的转基因细胞。在一些实施方案中,所述细胞是表达MED1或其功能片段和雌激素受体(例如,突变型雌激素受体)或其功能片段(例如,人类MED1和/或雌激素受体)的转基因细胞。在一些实施方案中,所述细胞过表达MED1。如本文所用,“过表达MED1”意指所述细胞以相对于对照细胞或参考水平为至少约1.1倍、至少1.2倍、1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或至少100倍、至少1,000倍、至少10,000倍或10,000倍以上的水平表达MED1。在一些实施方案中,所述细胞是他莫昔芬抗性ER+乳腺癌细胞并且所述对照细胞是非他莫昔芬抗性ER+乳腺癌细胞。在一些实施方案中,所述细胞(例如,他莫昔芬抗性ER+乳腺癌细胞)以如与对照细胞(例如,非他莫昔芬抗性ER+乳腺癌细胞)相比约4倍或更多倍(例如,约4倍至4.5倍)的水平过表达MED1。
在一些实施方案中,所述转录凝聚物通过使所述转录凝聚物与剂接触来调节。在一些实施方案中,所述剂会降低或消除ER与MED1之间的物理相互作用。在一些实施方案中,所述剂会降低ER与MED1之间的物理相互作用达至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或更高。在一些实施方案中,所述剂会降低或消除ER与雌激素之间的相互作用。在一些实施方案中,所述剂会降低ER与雌激素之间的物理相互作用达至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或更高。在一些实施方案中,所述凝聚物包含突变型ER或其片段并且所述剂会降低所述一种或多种基因的转录。
本公开的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供细胞、使所述细胞与测试剂接触和测定与所述测试剂的接触是否会调节凝聚物的形成、稳定性或形态,其中所述凝聚物包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。在一些实施方案中,所述细胞包含所述凝聚物。在一些实施方案中,所述剂引起所述凝聚物的形成。
在鉴定本文所述的测试剂的方法的一些实施方案中,调节凝聚物的形成、稳定性或形态的剂(例如,如果其减少所述凝聚物的形成或稳定性)被鉴定为候选治疗剂(例如,抗癌剂)。在一些实施方案中,所述剂被鉴定为抗ER+癌剂(例如,ER+乳腺癌剂、抗他莫昔芬抗性乳腺癌剂)。在鉴定本文所述的测试剂的方法的一些实施方案中,减少包含突变型ER(或其片段)和MED1(或其片段)的凝聚物的形成或稳定性的剂被鉴定为用于治疗ER+癌症(例如,他莫昔芬抗性ER+癌症)的候选剂。在鉴定本文所述的测试剂的方法的一些实施方案中,减少包含ER(或其片段)的凝聚物的形成或稳定性的剂被鉴定为ER活性(例如,ER介导的转录)的候选调节剂。
在一些实施方案中,所述雌激素受体是突变型雌激素受体。在一些实施方案中,所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性(例如,Y537S和D538G突变体)。在一些实施方案中,所述突变型雌激素受体是融合蛋白。在一些实施方案中,所述融合蛋白具有不依赖于雌激素结合的组成性活性(例如,ER-YAP1、ER-PCDH11X)。在一些实施方案中,所述雌激素受体片段包含配体结合域或其功能片段。在一些实施方案中,所述ER片段包含2个配体结合域或其功能片段。在一些实施方案中,所述ER片段包含DNA结合域。在一些实施方案中,所述MED1片段包含IDR、LXXLL基序或两者。在一些实施方案中,所述ER或MED1是人类ER或MED1。在一些实施方案中,所述ER或MED1是非人类哺乳动物(例如,大鼠、小鼠、兔)ER或MED1。
在一些实施方案中,所述凝聚物与雌激素或其功能片段接触。在一些实施方案中,所述凝聚物与选择性雌激素选择性调节剂(SERM)接触。所述SERM不受限制并且可以是本文所述或本领域中已知的任一者。在一些实施方案中,所述SERM是他莫昔芬或其活性代谢物(例如,如本文所述)。在本文所述的方法的一些实施方案中,所述凝聚物的调节会降低或消除靶基因(例如,MYC致癌基因或描述于本文中或牵涉于癌症生长或活力中的其他基因)的转录。在一些实施方案中,所述靶基因(例如,MYC致癌基因)的转录降低达至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或更高。
在一些实施方案中,所述细胞是乳腺癌细胞(例如,如本文所述)。在一些实施方案中,所述细胞过表达MED1(例如,如本文所述)。在一些实施方案中,所述细胞(例如,他莫昔芬抗性ER+乳腺癌细胞)以如与对照细胞(例如,非他莫昔芬抗性ER+乳腺癌细胞)相比约4倍或更多倍(例如,约4倍至4.5倍)的水平过表达MED1。在一些实施方案中,所述细胞是ER+乳腺癌细胞。在一些实施方案中,所述ER+乳腺癌细胞抵抗他莫昔芬治疗。在一些实施方案中,所述凝聚物包含可检测标记。所述标记不受限制并且可以是本文所述的任何标记。在一些实施方案中,所述凝聚物的组分包含可检测标记。在一些实施方案中,所述ER或其片段和/或所述MED1或其片段包含可检测标记。在一些实施方案中,所述一种或多种基因包含报告基因。所述报告基因不受限制并且可以是本文所述的任何报告基因。
本发明的一些方面涉及一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括提供体外凝聚物、使所述凝聚物与测试剂接触和测定与所述测试剂的接触是否会调节所述凝聚物的形成、稳定性或形态,其中所述凝聚物包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。在一些实施方案中,所述雌激素受体是突变型雌激素受体(例如,本文所述的任何突变型雌激素受体)。在一些实施方案中,所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性(例如,Y537S和D538G突变体)。在一些实施方案中,所述突变型雌激素受体是融合蛋白。在一些实施方案中,所述融合蛋白具有不依赖于雌激素结合的组成性活性(例如,ER-YAP1、ER-PCDH11X)。在一些实施方案中,所述雌激素受体片段包含配体结合域或其功能片段。在一些实施方案中,所述MED1片段包含IDR、LXXLL基序或两者。
在一些实施方案中,所述凝聚物与雌激素或其功能片段接触(例如,所述雌激素或其片段与所述凝聚物物理缔合或在包含所述凝聚物的溶液中)。在一些实施方案中,所述凝聚物与选择性雌激素选择性调节剂(SERM)接触(例如,所述SERM与所述凝聚物物理缔合或在包含所述凝聚物的溶液中)。在一些实施方案中,所述SERM是他莫昔芬或其活性代谢物(4-羟基他莫昔芬和/或N-脱甲基-4-羟基他莫昔芬)。
在一些实施方案中,所述凝聚物是从细胞分离。与所述凝聚物分离的细胞可以是任何合适细胞。在一些实施方案中,所述细胞是乳腺癌细胞(例如,从患者分离的乳腺癌细胞、来自细胞系的乳腺癌细胞(例如,600MPE、AU565、BT-20、BT-474、BT483、BT-549、Evsa-T、Hs578T、MCF-7、MDA-MB-231、SkBr3、T-47D))。在一些实施方案中,所述细胞是表达MED1和雌激素受体(例如,人类MED1和/或雌激素受体)的转基因细胞。在一些实施方案中,所述细胞是表达MED1或其功能片段和雌激素受体(例如,突变型雌激素受体)或其功能片段(例如,人类MED1和/或雌激素受体)的转基因细胞。
在一些实施方案中,所述凝聚物包含可检测标记。所述可检测标记不受限制并且可以是本文所述或本领域中已知的任何标记。在一些实施方案中,所述凝聚物的组分包含可检测标记。在一些实施方案中,所述ER或其片段和/或所述MED1或其片段包含可检测标记。
本公开的一些方面涉及一种分离的合成转录凝聚物,其包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。在一些实施方案中,所述雌激素受体是突变型雌激素受体。在一些实施方案中,所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性。在一些实施方案中,所述雌激素受体片段包含配体结合域或其功能片段。在一些实施方案中,所述MED1片段包含IDR、LXXLL基序或两者。在一些实施方案中,所述凝聚物包含雌激素或其功能片段。在一些实施方案中,所述凝聚物包含选择性雌激素选择性调节剂(SERM)。
组合物
本发明的一些方面针对包含通过本文所公开的方法鉴定的剂的组合物。在一些实施方案中,所述组合物是药物组合物。
所述剂可在药学上可接受的溶液中施用,所述溶液可常规地含有药学上可接受的浓度的盐、缓冲剂、防腐剂、可相容载体、佐剂和任选地其他治疗成分。
所述剂可配制成呈固体、半固体、液体或气体形式的制剂,如片剂、胶囊、散剂、颗粒、软膏、溶液、栓剂、吸入剂和注射液,和用于口服、肠胃外或手术施用的通常方式。本发明还涵盖配制用于局部施用的药物组合物,如通过植入剂。
适用于口服施用的组合物可以个别单位呈递,如胶囊、片剂、糖锭,各单位含有预定量的活性剂。其他组合物包括在水性液体或非水性液体中的悬浮液,如糖浆、酏剂或乳液。
在一些实施方案中,剂可直接地施用至组织。直接组织施用可通过直接注射实现。所述剂可一次性施用,或替代地,其可通过多次施用进行施用。如果施用多次,那么所述肽可经由不同途径施用。例如,第一次(或最初数次)施用可直接地针对受影响组织,而稍后施用可以是系统性的。
关于口服施用,组合物可容易地通过组合所述剂与本领域中众所周知的药学上可接受的载体来配制。所述载体使得所述剂能够被配制为片剂、丸剂、糖衣丸、胶囊、液体、凝胶、糖浆、浆液、悬浮液等,用于由待治疗的受试者口服摄取。用于口服用途的药物制剂可以固体赋形剂,任选地研磨所得混合物,并且必要时在添加合适助剂之后加工颗粒的混合物以获得片剂或糖衣丸核心来获得。合适赋形剂特别是填充剂,如糖,包括乳糖、蔗糖、甘露醇或山梨醇;纤维素制剂,如玉米淀粉、小麦淀粉、米淀粉、马铃薯淀粉、明胶、黄蓍胶、甲基纤维素、羟基丙基甲基-纤维素、羧基甲基纤维素钠和/或聚乙烯吡咯烷酮(PVP)。必要时可添加崩解剂,如交联聚乙烯吡咯烷酮、琼脂或褐藻酸或其盐,如褐藻酸钠。任选地,所述口服制剂还可在用于中和内部酸条件的生理盐水或缓冲液中进行配制,或可在任何载体均不存在的情况下施用。
糖衣丸核心具备合适包衣。为此目的,可使用浓缩糖溶液,其可任选地含有阿拉伯胶、滑石、聚乙烯吡咯烷酮、卡伯波凝胶、聚乙二醇和/或二氧化钛、漆溶液和合适的有机溶剂或溶剂混合物。染料或颜料可添加至片剂或糖衣丸包衣中用于鉴定或以便表征活性化合物剂量的不同组合。
可口服使用的药物制剂包括由明胶制成的推入配合胶囊,以及由明胶和如甘油或山梨醇的增塑剂制成的软、密封胶囊。所述推入配合胶囊可含有与如乳糖的填充剂、如淀粉的粘合剂和/或如滑石或硬脂酸镁的润滑剂和任选地稳定剂混合的活性成分。在软胶囊中,活性化合物可溶解或悬浮于如脂肪油、液体石蜡或液体聚乙二醇的合适液体中。另外,可添加稳定剂。还可使用配制用于口服施用的微球。所述微球已在本领域中充分定义。用于口服施用的所有制剂均应呈适用于所述施用的剂量。关于颊部施用,所述组合物可采用以常规方式配制的片剂或糖锭的形式。
当需要系统性递送所述化合物时,其可配制用于通过注射进行肠胃外施用,例如通过推注或连续输注。用于注射的制剂可以单位剂型,例如在安瓿中或在具有添加的防腐剂的多剂量容器中呈递。所述组合物可采用如油性或水性媒介物中的悬浮液、溶液或乳液的形式,并且可含有如悬浮剂、稳定剂和/或分散剂的配制剂。
用于肠胃外施用的制剂包括无菌水性或非水性溶液、悬浮液和乳液。非水性溶剂的实例是丙二醇、聚乙二醇、植物油(如橄榄油)和可注射有机酯(如油酸乙酯)。水性载体包括水、醇/水性溶液、乳液或悬浮液,包括生理盐水和缓冲介质。肠胃外媒介物包括氯化钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸林格氏或固定油。静脉内媒介物包括流体和营养补充剂、电解质补充剂(如基于林格氏右旋糖的那些)等。还可存在防腐剂和其他添加剂,如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。如静脉内施用的其他施用形式将引起较低剂量。在受试者中的反应在所应用的原始剂量下不充分的情况下,可使用较高剂量(或通过不同、更加局限性递送途径有效地实现较高剂量)至患者耐受性允许的程度。在一些实施方案中预期每天多个剂量以实现化合物的适当系统性水平。
本文所公开的发明的某些方面的特定实施例陈述于下文实施例中。
本领域技术人员容易理解,本发明充分适于进行所述目标并且获得所提及的目的和优势,以及其中固有的那些。本文中的描述和实施例的细节代表某些实施方案,是示例性的,并且不意图作为对本发明范围的限制。本领域技术人员将想到其中修饰和其他用途。这些修饰涵盖于本发明的精神内。本领域技术人员应显而易知,可对本文所公开的发明进行不同取代和修改而不偏离本发明的范围和精神。
除非清楚地相反指示,否则如本文中在说明书和权利要求书中所用的冠词“一(a)”和“一(an)”应理解为包括多个提及物。除非相反指示或在其他方面从本文显而易见,否则在一组的一个或多个成员之间包括“或”的权利要求或描述在所述组成员中的一者、超过一者或全部存在于、用于给定产物或过程中或以其他方式与给定产物或过程相关时被视为满足条件的。本发明包括如下实施方案,其中确切地,所述组中的一个成员存在于、用于给定产物或过程中或以其他方式与给定产物或过程相关。本发明还包括如下实施方案,其中所述组成员中的超过一者或全部存在于、用于给定产物或过程中或以其他方式与给定产物或过程相关。此外,应理解本发明提供所有变化、组合和排列,其中除非另外指示或除非一般技术者将显而易知将出现抵触或矛盾,否则所列出的权利要求中的一者或多者的一种或多种限制、要素、条款、说明项等被引入至依赖于同一基础权利要求的另一权利要求(或相关的任何其他权利要求)中。预期本文所述的所有实施方案在适当时适用于本发明的所有不同方面。还预期所述实施方案或方面的任一者均可在适当时自由地与一个或多个其他所述实施方案或方面组合。在要素以列表形式,例如以马库什组或相似形式提供时,应理解还公开了所述要素的各子组,并且任何要素均可从所述组中移除。应理解一般来说,在本发明或本发明的多个方面被提及包含特定要素、特征等时,本发明的某些实施方案或本发明的方面由所述要素、特征等组成,或基本上由所述要素、特征等组成。为简单起见,那些实施方案在本文中并非在每一种情况下均以如此多的言语特定地陈述。还应理解,本发明的任何实施方案或方面均可明确地从权利要求书中排除,无论所述特定排除是否在本说明书中加以陈述。例如,可排除任何一种或多种核酸、多肽、细胞、生物物种或类型、病症、受试者或其组合。
在权利要求书或描述涉及所述组合物时,除非另外指示或除非一般技术者将显而易知将出现抵触或矛盾,否则应理解根据本文所公开的方法中的任一者制造或使用所述组合物的方法,和出于本文所公开的目的中的任一者使用所述组合物的方法是本发明的方面。在权利要求书或描述涉及一种方法时,例如,除非另外指示或除非一般技术者将显而易知将出现抵触或矛盾,否则应理解制造适用于执行所述方法的组合物的方法,和根据所述方法产生的产物是本发明的方面。
在本文中给出范围时,本发明包括其中包括终点的实施方案、其中排除两个终点的实施方案和其中包括一个终点并且排除另一终点的实施方案。应假设,除非另外指示,否则两个终点均包括在内。此外,还应理解除非另外指示或在其他方面从本文和一般技术者的理解显而易知,否则以范围表述的值可在本发明的不同实施方案中假设所陈述的范围内的任何特定值或子范围,除非本文另外清楚地指示,否则达到所述范围的下限的单位的十分之一。还应理解,在本文中陈述一系列数值时,本发明包括如下实施方案,其相似地涉及任何介于中间的值或由所述系列中的任何两个值界定的范围,并且最低值可被视为最小值并且最大值可被视为最高值。如本文所用的数值包括以百分率表述的值。关于其中数值之前加上“约”或“大约”的本发明的任何实施方案,本发明包括其中陈述所述精确值的实施方案。关于其中数值之前不加“约”或“大约”的本发明的任何实施方案,本发明包括其中所述值之前加上“约”或“大约”的实施方案。除非另外规定或在其他方面从本文显而易知(除了所述数字将不允许超过可能的值的100%的情况),否则“大约”或“约”一般包括如下数字,其属于在任一方向中(大于或小于所述数字)1%的范围或在一些实施方案中属于数字的5%的范围或在一些实施方案中属于数字的10%的范围。应理解,除非清楚地相反指示,否则在本文所主张的包括超过一种动作的任何方法中,所述方法的动作的顺序不必限于其中所述方法的动作被陈述的顺序,但本发明包括其中如此限制所述顺序的实施方案。还应理解,除非相反指示或从本文显而易知,否则本文所述的任何产物或组合物均可被视为“分离的”。
***
实施例
实施例1
转录控制的现有模型的关键特征在于,潜在调控相互作用以通过在自然界中基于概率的生物化学规则指示的逐步方式发生。当要求解释涉及超级增强子或增强子在两种不同基因处引起同步转录爆发的能力的近期观察结果时,这些模型具有限制。相分离的多分子组装体提供基本调控机制以区域化细胞内的生物化学反应。我们建议相分离模型更容易地解释转录控制的已知特征,包括超级增强子的形成、超级增强子对扰乱的敏感性、其转录爆发模式和增强子在多种基因处产生同时效应的能力。这一模型提供概念构架以进一步研究哺乳动物中的基因控制原则。
引言
转录调控的近期研究已揭露了数种令人费解的观察结果,所述观察结果迄今缺乏定量描述,但其进一步理解将可能提供对发展和疾病期间的基因控制的新颖并且有价值的见解。例如,尽管数千种增强子元件控制任何给定的人类细胞类型中的数千种基因的活性,增强子的数百个团簇(称作超级增强子(SE))会控制在细胞类型特异性过程中具有尤其显著作用的基因(ENCODE Project Consortium等人,2012;Hnisz等人,2013;Loven等人,2013;Parker等人,2013;Roadmap Epigenomics等人,2015;Whyte等人,2013)。癌细胞获得超级增强子以驱动显著致癌基因的表达,因此SE在发展和疾病两者中发挥关键作用(Chapuy等人,2013;Loven等人,2013)。超级增强子由异常高密度的相互作用因子占据,能够驱动高于典型增强子的水平的转录,并且罕见地易经受通常与大多数增强子缔合的组分的扰乱(Chapuy等人,2013;Hnisz等人,2013;Loven等人,2013;Whyte等人,2013)。
近期研究中已经出现的另一令人费解的观察结果在于,单一增强子能够同时活化多种近端基因(Fukaya等人,2016)。增强子以物理方式接触其活化的基因的启动子,并且使用染色质接触定位技术(例如,在β-球蛋白基因座处)的早期研究发现在任何给定时间处,增强子仅活化所述基因座内的数种球蛋白基因之一(Palstra等人,2003;Tolhuis等人,2002)。然而,使用在高时间分辨率下的定量成像的最近工作揭露了增强子典型地活化呈爆发形式的基因,并且两种基因启动子当通过相同增强子活化时可展现同步爆发(Fukaya等人,2016)。
转录控制的先前模型已经提供了对基因调控原则的重要见解。大多数先前转录控制模型的关键特征在于,潜在调控相互作用以通过在自然界中基于概率的生物化学规则指示的逐步方式发生(Chen和Larson,2016;Elowitz等人,2002;Levine等人,2014;Orphanides和Reinberg,2002;Raser和O'Shea,2004;Spitz和Furlong,2012;Suter等人,2011;Zoller等人,2015)。所述动力学模型预测了在单一基因水平下的基因活化是随机、嘈杂过程,并且还提供了对多步骤调控过程如何可抑制固有噪声并且导致爆发的见解。这些模型不会清楚地显示SE的形成、功能和特性的潜在机制或解释难题,如两种基因启动子当通过相同增强子活化时如何展现同步爆发。
我们在本文中建议并且研究可解释上述难题的模型。这一模型是基于涉及多分子组装体的相分离的原则。
转录控制中的协作性
自从超过30年前发现了增强子,研究已经试图以定量方式描述增强子的功能特性,并且这些努力主要地依赖于增强子组分之间的协作相互作用的概念。经典地,增强子已经被定义为当在靶基因启动子上游或下游多种距离处以任一取向插入时可增加所述启动子的转录的元件(Banerji等人,1981;Benoist和Chambon,1981;Gruss等人,1981)。增强子典型地由数百个DNA碱基对组成并且由多种转录因子(TF)分子以协作方式结合(Bulger和Groudine,2011;Levine等人,2014;Malik和Roeder,2010;Ong和Corces,2011;Spitz和Furlong,2012)。经典地,协作结合描述了一种TF分子与DNA的结合会影响另一TF分子的结合的现象(图3A)(Carey,1998;Kim和Maniatis,1997;Thanos和Maniatis,1995;Tjian和Maniatis,1994)。已经提出转录因子在增强子处的协作结合是归因于TF对DNA弯曲的影响(Falvo等人,1995)、TF之间的相互作用(Johnson等人,1979)以及通过TF进行的大辅因子复合物的组合募集(Merika等人,1998)。
超级增强子展现高度协作特性
增强子的数百个团簇(称作超级增强子(SE))会控制在细胞类型特异性过程中具有尤其显著作用的基因(Hnisz等人,2013;Whyte等人,2013)。SE的三种关键特征指示了协作特性对于其形成和功能尤其重要:1)SE由异常高密度的相互作用因子占据;2)SE可通过单一成核事件形成;和3)SE罕见地易经受通常与大多数增强子缔合的一些组分(即,超级增强子组分)的扰乱。
SE由异常高密度的增强子缔合因子占据,包括转录因子、辅因子、染色质调控因子、RNA聚合酶II和非编码RNA(Hnisz等人,2013)。通过SE内的转录因子结合位点处的不同转录产生(Hah等人,2015;Sigova等人,2013)的非编码RNA(增强子RNA或eRNA)可促进增强子活性和附近基因的顺式表达(Dimitrova等人,2014;Engreitz等人,2016;Lai等人,2013;Pefanis等人,2015)。所述蛋白质因子和eRNA在SE处的密度已经据估计是同一集合的组分在基因组中的典型增强子处的密度的大约10倍(图3B)(Hnisz等人,2013;Loven等人,2013;Whyte等人,2013)。染色质接触定位方法指示了SE内的增强子团簇与另一团簇并且与其活化的基因的启动子区紧密物理接触(图3C)(Dowen等人,2014;Hnisz等人,2016;Ji等人,2016;Kieffer-Kwon等人,2013)。
SE可作为将单一转录因子结合位点引入至DNA中具有结合另外的因子的潜力的区中之后果形成。在T细胞白血病中,小(2-12bp)单-等位基因插入通过产生用于主转录因子MYB的结合位点而使完整SE的形成成核,从而将另外的转录调控因子募集至邻近结合位点并且组装散布于具有SE所特有的特征的8kb域上的多种基因(Mansour等人,2014)。炎症刺激还导致内皮细胞中SE的快速形成;此处,SE的形成再次明显地通过响应于炎症刺激的转录因子的单一结合事件成核(Brown等人,2014)。
跨数万个碱基对的完整超级增强子在其辅因子受到扰乱时可作为一单位崩塌,并且SE内的组分增强子的基因缺失可损害其他组分的功能。例如,共活化子BRD4在SE、典型增强子和启动子处结合乙酰化染色质,但SE对阻断BRD4结合于乙酰化染色质的药物敏感得多(Chapuy等人,2013;Loven等人,2013)。还已经在多项研究中观察到SE对细胞周期素依赖性激酶CDK7的抑制作用的相似超敏性(Chipumuro等人,2014;Kwiatkowski等人,2014;Wang等人,2015)。这种激酶对于通过RNA聚合酶II(RNAPII)实现转录的起始至关重要并且磷酸化其重复C端域(CTD)(Larochelle等人,2012)。此外,SE内的组分增强子的基因缺失可损害所述超级增强子内的其他组分的活性(Hnisz等人,2015;Jiang等人,2016;Proudhon等人,2016;Shin等人,2016),并且可导致完整超级增强子的崩塌(Mansour等人,2014),不过对于一些发展受到调控的超级增强子来说,组分增强子的这种互相依赖不太明显(Hay等人,2016)。
总之,数条证据指示SE的形成和功能涉及协作过程,所述过程使多种组分增强子和其结合的因子紧密空间邻近。高密度蛋白质和核酸(和这些分子中的协作相互作用)已牵涉于真核细胞中无膜细胞器(称作细胞体)的形成中(Banjade等人,2015;Bergeron-Sandoval等人,2016;Brangwynne等人,2009)。下文中,我们首先描述细胞体的形成的特征,并且接着发展超级增强子形成和功能的模型,所述模型利用相关概念。
通过相分离形成无膜细胞器
真核细胞含有无膜细胞器(称作细胞体),其在区域化细胞内的基本生物化学反应中发挥基本作用。这些细胞体通过经由多价分子之间的协助相互作用介导的相分离形成(Banjade等人,2015;Bergeron-Sandoval等人,2016;Brangwynne等人,2009)。细胞核中的所述细胞器的实例包括核仁,其为rRNA生物合成的位点;卡哈尔体(Cajal body),其充当用于小核RNP的组装位点;和核光斑,其为用于mRNA剪切因子的存储隔室(Mao等人,2011;Zhu和Brangwynne,2015)。这些细胞器展现液体小液滴的特性;例如,其可经历裂变和融合,并且因此其形成已经描述为通过液体-液体相分离来介导。纯化的RNA和RNA-结合蛋白的混合物形成这些类型的体外相分离的细胞体(Berry等人,2015;Feric等人,2016;Kato等人,2012;Kwon等人,2013;Li等人,2012;Wheeler等人,2016)。与这些观察结果一致,过去的理论工作指示凝胶的形成通常伴随相分离(Semenov和Rubinstein,1998)。因此,多项研究显示高密度蛋白质和核酸(和这些分子中的协作相互作用)牵涉于相分离的细胞体的形成中。
如上文所述,超级增强子可本质上被视为高密度转录因子、转录辅因子、染色质调控因子、非编码RNA和RNA聚合酶II(RNAPII)的协作组装体。此外,已经主张一些具有低复杂度域的转录因子产生体外凝胶样结构(Han等人,2012;Kato等人,2012;Kwon等人,2013)。我们因此假设相分离和相分离的多分子组装体的形成可能发生于SE形成期间并且很少具有典型增强子(图4A)。
我们建议一种简单模型,其强调在相互作用组分的数目和价态的情况下的协作性,和这些转录调控因子与核酸之间的相互作用的亲和力,以研究相分离用于SE组装和功能的作用。这种模型的计算机模拟显示相分离可解释SE的关键特征,包括其形成、功能和弱点的方面。所述模拟也与在通过弱和强增强子驱动的转录爆发模型之间观察到的差异和通过共享单一增强子控制的基因的同时爆发一致。我们通过注意所述相分离模型的数种牵连和预测得出结论,所述牵连和预测可能导向脊椎动物中这种转录控制概念的进一步探索。
增强子组装和功能的相分离模型
在增强子和SE处结合的多种分子可在多个位点处经历可逆化学修饰(例如,乙酰化、磷酸化),如转录因子、转录共活化子(例如,BRD4)、RNAPII和RNA。在所述修饰时,这些多价分子能够与多种其他组分相互作用,因此形成“交联”(图4A)。此处,交联可定义为牵涉于动态结合和解离相互作用中的任何可逆特征(包括可逆化学修饰)或任何其他特征。在考虑相分离是否可成为转录控制的某些所观察特征的基础时,需要一种简单模型来描述相分离对于相互作用分子的价态和亲和力(生物学家所测量的参数)的变化的依赖性。下文中,我们描述所述模型,并且解释这一模型的参数如何表示典型增强子和超级增强子的特征。
在所述模型中,增强子的蛋白质和核酸组分被表示为链样分子,其中每一者均含有可潜在地参加与其他链的相互作用的残基的集合(图4B)。这些残基被表示为可经历可逆化学修饰的位点,并且所述残基的修饰与其在所述链之间形成非共价交联相互作用的能力相关(图4B)。包括转录因子、辅因子和RNA聚合酶II的C端域(CTD)的七肽重复序列在内的众多增强子组分经受磷酸化,并且已知基于其磷酸化状态结合其他蛋白质(Phatnani和Greenleaf,2006)。所述模型涵盖所述磷酸化或脱磷酸化,其可导致结合相互作用,以及在通过乙酰化、甲基化或其他类型的化学修饰调节的增强子和转录调控因子处发现的组蛋白和其他蛋白质的相互作用。为简便起见,我们将所有类型的化学修饰和去修饰统称作分别通过“修饰剂”和“去修饰剂”介导的“修饰”和“去修饰”。
在其最简单形式中,所述模型具有三种参数:1)“N”=所述系统中的巨分子(也称作“链”)的数目;这一参数设置相互作用组分的浓度—N值越大,所述浓度越大—SE被视为具有较大N值,而典型增强子被建模为具有较少组分。2)“f”=价态,其对应于各分子中可潜在地进行修饰并且参加与其他链的交联的残基的数目。注意,在所述简化模型中,需要残基的修饰以允许所述残基与另一链产生交联。在概念上,如果交联形成需要残基的去修饰状态,那么所述模型以相似方式工作,除了允许或抑制交联形成的酶活性被逆转。3)Keq=(k缔合/k解离)平衡常数,通过描述交联反应或相互作用的缔合速率和解离速率定义(图4B)。
根据数种假设,如大的链长并且不允许分子内交联或相同两条链之间的多个键,这一模型的平衡特性可以分析方法获得(Cohen和Benedek,1982;Semenov和Rubinstein,1998)。在相互作用链的临界浓度C*以上,发生相分离,从而产生多分子组装体。在这些条件下,C*随
Figure BDA0002792767850001581
变化。因此,用于组装体形成的临界浓度敏感地依赖于价态并且不太依赖于结合常数。
我们进行所述模型的计算机模拟(放宽上文所述的平衡理论中的一些假设)以研究其动态而非平衡特性。在所述模型的动态计算机模拟中,随着所述残基进行修饰和去修饰,所述价态在0与“f”之间变化;修饰和去修饰反应速率在所述研究中未发生改变。所述系统中的修饰剂:去修饰剂比率(例如,激酶:磷酸酯酶比率)决定了各组分上进行修饰并且可交联的位点的数目,并且在所述研究中发生改变。
所述模型用固定体积中的N条链模拟,所述固定体积表示其中所述增强子或SE的多种组分得到浓缩的区。我们考虑N的多种值。在所述模拟期间,所述链可经历具有如下动力学常数的修饰和去修饰,K修饰=0.05,K去修饰=0.05。修饰剂和去修饰剂水平(N修饰,N去修饰)发生改变。交联形成和解离用如下动力学常数模拟,k缔合=0.5并且
Figure BDA0002792767850001582
仅允许不同链上的经过修饰的残基交联,即不允许链内交联反应,但多个键可形成于两条链之间。所述模拟以如下限制进行,其中允许每条链上的每个位点与其他链上的所有其他位点交联(Cohen和Benedek,1982;Semenov和Rubinstein,1998)—即,存在相互作用位点的平均浓度(通过N和经过修饰的位点的数目测定);所述模拟体积内的局部浓度的变化未加以考虑。
所述模拟使用Gillespie算法(Gillespie,1977)进行,所述算法产生所考虑的动态过程的时间分辨率的随机轨迹(即,修饰和交联反应)。任何单一轨迹均描述相互作用链的状态的时间演化,包括其如何分布于变化大小的团簇中。所有轨迹均用去修饰、未交联链初始化—即,各链在“独立团簇”中。运行模拟直至达到稳态,其中所述系统的特性(例如,平均团簇大小)是非时变的。关于所有计算执行多条轨迹(50个重复样品)以在必要时获得统计学平均特性。
所述模拟中转录活性(TA)的代理者是定义为交联链的最大团簇的大小,由链的总数定标[TA=(团簇最大的大小)/N]。当所述系统中的所有链形成单一交联团簇时(TA≈1),产生相分离的组装体。这一组装体被视为涵盖在增强子/SE处以及在启动子处的因子结合,所述结合导致对于增强的基因转录至关重要的组分的浓缩。我们记录通过增强子和SE产生的转录活性,随时间变化。
具有价态变化的转录调控
对随价态变化的转录活性建模揭露了SE的形成涉及比典型增强子的形成更显著的协作性(图4C)。在这些模拟中,SE被建模为由N=50种分子组成的系统,并且典型增强子SE被建模为由N=10种分子组成的系统,与在这些元件处组分的密度的大约一个数量级差异一致(Hnisz等人,2013)。我们接着关于不同价态对转录活性(TA)作图,而所有其他参数保持恒定。SE在标准化价态值2处达到最大转录活性的约90%(即,参考值f=3的两倍),而关于典型增强子,在标准化价态值5处获得最大转录活性的90%。在标准化价态值2处,典型增强子达到最大转录活性的约40%(图4C)。这些结果表明在一致条件下,由较大数目的组分组成的SE在低于由较少数目的组分组成的典型增强子的价态水平下形成较大的连接团簇(即,经历相分离)。此外,我们关于SE在标准化价态值约1.5处观察到转录活性的急剧增加,而关于典型增强子,价态增加导致转录活性的更适度、平滑增加(图4C),与先前考虑一致(图3A)(Loven等人,2013)。
在相互作用组分(即,超级增强子组分)的价态归因于增强的协作性变化时,SE的转录活性的较急剧变化可通过希尔系数定量。SE的行为的特征在于希尔系数的较大值,指示较大协作性和对价态变化的超敏性(图4C)。实际上,如图4C中的插图显示,希尔系数随牵涉于增强子中的组分的数目增加,在大量N值中,约为N0.4。另外,如所预期,典型增强子与SE的转录活性之间的差异与用于对其建模的“N”值的差异相关;关于足够大的N差异,再现图4C中报告的行为(图8)。
超级增强子形成和弱点
所述相分离模型的这些预测与先前公开的实验数据定性地一致。例如,通过TNFα刺激内皮细胞会导致炎症基因处SE的形成(Brown等人,2014)。在这一原稿中,通过转录辅因子BRD4的基因组占有率监测SE形成,所述转录辅因子是SE和典型增强子的关键组分。这些细胞中的炎症刺激导致如与其他基因处的典型增强子相比,BRD4更显著募集于炎症基因的SE处(Brown等人,2014)。所述相分离模型建议,这是因为TNFα刺激会导致使相互作用组分的价态变化的修饰,并且关于SE,与典型增强子相比,在价态的较低值上方急剧地发生相分离,因此导致如BRD4的相互作用组分的增强的募集(图4C)。
我们接着研究所述相分离模型是否解释SE通过常见转录辅因子的抑制剂产生扰乱的罕见弱点。BRD4和CDK7是典型增强子和SE两者的组分,但SE和其缔合基因对BRD4和CDK7的化学抑制作用的敏感性比典型增强子多得多(图5A)(Chipumuro等人,2014;Christensen等人,2014;Kwiatkowski等人,2014;Loven等人,2013)。我们对BRD4和CDK7抑制剂通过使所述系统中的去修饰剂/修饰剂活性的比率变化来降低价态的效应建模,所述变化会转变相互作用分子内的经过修饰的位点的平衡。这是因为CDK7是充当修饰剂的激酶,并且BRD4具有大价态,因为其可与多种组分相互作用,并且因此抑制BRD4会不成比例地降低相互作用分子的平均价态。如图5B所示,SE(N=50)在低于典型增强子(N=10)的去修饰剂/修饰剂比率下急剧地损失很多其活性。这些结果与以下观念一致,即SE活性对价态的变化极其敏感,因为相分离是当关键变量超出阈值时突然发生的协作现象。
转录爆发
真核细胞中的基因表达一般是偶尔发生的,由转录爆发组成,并且我们研究所述相分离模型是否可预测转录爆发。使用活细胞中的转录爆发的定量成像的近期研究建议,通过增强子驱动的基因表达的水平与转录爆发的频率相关(Fukaya等人,2016)。发现强增强子驱动高于弱增强子的频率的爆发,并且在某一强度水平上方,所述爆发不再分解并且导致相对恒定的高转录活性(图6A)。所述相分离模型显示SE以通过强增强子展现的低变化(在相对恒定高转录活性周围)爆发模式再现高频率,而典型增强子以较低频率展现更加可变的爆发(图6B)。一旦发生持续相分离(TA饱和),那么波动被淬灭,就SE来说,其导致TA的较大变化。爆发模式的这一差异可通过将所述结果转化为功率谱来定量。我们预期强增强子尽管具有少于SE的组分(N),由于较高价态交联而仍将比典型增强子更容易地形成稳定相分离的多分子组装体。因此,所述模型的预测在于如同SE,与弱或典型增强子相比,强增强子应展示不同转录爆发模式。
所述相分离模型也与如下令人感兴趣的观察结果一致,即两种启动子当通过相同增强子活化时可展现同步爆发(Fukaya等人,2016);在这种情况下,相分离的组装体会并入所述增强子和两种启动子(图6C)。
形成体内相分离的组装体的候选转录调控因子
在所述简化模型中,相分离通过变化介导,其程度使得相互作用组分(即,超级增强子组分)上的残基经过修饰(或价态),从而引起分子间相互作用。然而,实际上,增强子由可能说明所述相互作用的多种不同因子构成,所述因子大多数经受可逆化学修饰(图7)。这些组分包括转录因子、转录共活化子(如介体和BRD4)、染色质调控因子(例如,读取、书写或抹除组蛋白修饰)、细胞周期素依赖性激酶(例如,CDK7、CDK8、CDK9、CDK12)、非编码RNA和RNA-结合蛋白甲基RNA聚合酶II(Lai和Shiekhattar,2014;Lee和Young,2013;Levine等人,2014;Malik和Roeder,2010)。这些分子中的多种为多价的,即含有多个模块域或相互作用基序,并且因此能够与多种其他增强子组分相互作用。例如,RNA聚合酶II的大的亚单元在人类细胞中在其C端域(CTD)处含有七肽序列的52个重复序列,并且数种转录因子含有低复杂度域的重复序列或倾向于聚合的同一氨基酸延伸段的重复序列(Gemayel等人,2015;Kwon等人,2013)。增强子和多种启动子的DNA部分含有用于多种转录因子的结合位点,所述转录因子中的一些可同时结合于DNA和RNA两者(Sigova等人,2015)。在增强子处的组蛋白关于可由染色质读取器识别的修饰富集,并且因此邻近核小体可被视为能够与多种染色质读取器相互作用的平台。RNA本身可进行化学修饰并且与多种RNA-结合分子和剪切因子物理相互作用。牵涉于这些相互作用中的多种残基可产生“交联”(图7)。
所述相分离模型的可能牵连和预测
所述简单相分离模型提供用于进一步研究发展和疾病中的基因控制原则的概念构架。下文中,我们论述在所述模型的转录控制和一些可测试的预测中可能与相分离的多分子复合物的组装体相关的现象的一些实施例。
转录调控因子的相分离的多分子组装体的肉眼观察
所述模型的关键测试是转录调控因子的多分子组装体的相分离是否可在体内直接地观察到,其中证明了那些复合物的相分离与基因活性相关。近期数项工作提供了对这些问题的原始见解。例如,使用高分辨率显微术的近期研究指示了信号刺激会导致活哺乳动物细胞中RNA聚合酶II的大团簇的形成(Cisse等人,2013)和在基因的子集处的转录的一致活化(Cho等人,2016)。这以及其他单一分子技术(Chen和Larson,2016;Shin等人,2017)可因此使得能够进行肉眼观察,和测试相分离的多分子复合物是否形成于通过SE调控的基因附近和我们此处所描述的所述简单模型是否预测转录控制的特征。例如,我们假设由52个七肽重复序列组成的RNAPII C端域是这一组装体内的价态的关键促成因素,并且在表达具有截短的CTD的RNAPII的细胞中,所述团簇将展现显著较低半衰期。
信号依赖性基因控制
细胞经由向基因中继信息的信号转导途径感测其环境并且响应其环境,但响应于特定信号传导途径的基因可对同一信号展现不同活化量级。我们已经进行了计算,其中假设一旦发生相分离,所述组装体会募集作为去修饰剂的组分。在这些条件下,与典型增强子相比,关于SE的转变和相分离分辨率(即,转录活性)更加独特。有趣的是,所述模拟建议存在最大价态和SE组分的最大数目,如果超出,那么其不会在现实时标中允许分解(图9)。这是因为所述分子如此重度交联,使得其保持亚稳状态持续长时期。所述模型的预测在于细胞信号传导的病理学超活化可能经由在表达程序中锁定细胞而成为疾病状态的基础,所述程序—至少短暂地—变得对将在正常生理学条件下抵抗所述疾病状态的信号无反应。我们推测所述状态可通过增加相互作用组分的数目和价态人工地加以诱导。
转录控制的保真度
暴露于相同环境信号(称作转录噪声)的细胞的同基因群体内基因的转录水平的变异性可对细胞表型具有深刻影响(Raj和van Oudenaarden,2008)。所述相分离模型指示,由于牵涉于SE形成中的高协作性,当价态(通过修饰剂/去修饰剂比率调节,所述比率实际上与经由活化级联转导的发展信号相似)超出清晰定义的阈值时,发生转录(图4C)。关于典型增强子中的较少数目的组分,具有环境信号的转录的变化更持续,潜在地在较宽信号强度范围中导致“更嘈杂”或更易错转录。在相分离点附近,在两个相(在所述情况下,低TA和稳固TA)之间存在波动。所述模型显示与就典型增强子来说发生这种情况时的宽范围相比,就SE来说,这些波动(或噪声)被限制于窄环境信号范围(图10)。就SE来说,这些波动的标准化量级也较小。这些结果表明,SE为何已经发展的一种原因在于使得能够相对无误和稳固转录维持细胞身份所必需的基因。然而,可借鉴经由协作性,而非通过发展用于控制各基因的特异性分子所介导的化学特异性实现的这种转录保真度形式,以驱动疾病状态中的异常基因表达(例如,癌细胞中的SE)。
对转录抑制作用的抗性
如BRD4的超级增强子组分的小分子抑制剂目前在临床中作为抗癌治疗剂进行测试,其中普遍存在的挑战在于抵抗靶向治疗剂的肿瘤细胞的出现(Stathis等人,2016)。有趣的是,近期研究揭露在多种肿瘤细胞中发展对抑制BRD4的药物JQ1的抗性,而无任何基因变化(Fong等人,2015;Rathert等人,2015;Shu等人,2016)。虽然JQ1抑制BRD4与乙酰化组蛋白的相互作用,但BRD4归因于其在JQ1抗性细胞中的超磷酸化仍被募集至超级增强子(Shu等人,2016)。这与所述模型的如下预测一致,即BRD4是SE的高效价组分,并且其与乙酰化组蛋白的相互作用的抑制(即,其价态的减少)可通过经由靶向BRD4本身的激酶途径的活化来增加其价态而得到补偿。在所述模型中,超级增强子的特征在于高希尔系数,即高协作性(图4C),其表明多种适当选择的SE组分的抑制作用可能对肿瘤细胞中SE驱动的致癌基因具有协同效应。如果这种预测是真实的,那么对BRD4抑制剂的抗性可经由使用转录调控因子的另外的抑制剂的组合治疗来预防。
结束语
转录控制的这种相分离模型的基本特征在于其在相互作用组分的价态和数目变化的情况下考虑所述组分之间的协作性。这种单一概念构架一致地描述转录控制的多种最近观察到的特征,如因子的团簇、动态变化、SE对转录抑制剂的超敏性和同一增强子对多种基因的同时活化。细胞信号传导途径可能在短时期内通过价态的改变调节转录。细胞生长和生存的选择将扩展或收缩在较长时间内相互作用的数目或所述增强子的大小。所述模型也作出多种预测(上文所述的一些),所述预测可能在多种细胞背景中进行研究。另外,令人感兴趣的是,这一模型将增强子和尤其超级增强子类型基因调控设置于如细胞核中的核仁、卡哈尔体和剪切光斑以及细胞质中的应激颗粒和P小体的无膜细胞器的大家族中,作为相分离的多分子组装体的结果。
参考文献
Banerji,J.,Rusconi,S.,and Schaffner,W.(1981).Expression of a beta-globin gene is enhanced by remote SV40 DNA sequences.Cell 27,299-308.
Banjade,S.,Wu,Q.,Mittal,A.,Peeples,W.B.,Pappu,R.V.,and Rosen,M.K.(2015).Conserved interdomain linker promotes phase separation of themultivalent adaptor protein Nck.Proceedings of the National Academy ofSciences of the United States of America 112,E6426-6435.
Benoist,C.,and Chambon,P.(1981).In vivo sequence requirements of theSV40 early promotor region.Nature 290,304-310.
Bergeron-Sandoval,L.P.,Safaee,N.,and Michnick,S.W.(2016).Mechanismsand Consequences of Macromolecular Phase Separation.Cell 165,1067-1079.
Berry,J.,Weber,S.C.,Vaidya,N.,Haataja,M.,and Brangwynne,C.P.(2015).RNA transcription modulates phase transition-driven nuclear bodyassembly.Proceedings of the National Academy of Sciences of the United Statesof America 112,E5237-5245.
Brangwynne,C.P.,Eckmann,C.R.,Courson,D.S.,Rybarska,A.,Hoege,C.,Gharakhani,J.,Julicher,F.,and Hyman,A.A.(2009).Germline P granules are liquiddroplets that localize by controlled dissolution/condensation.Science 324,1729-1732.
Brown,J.D.,Lin,C.Y.,Duan,Q.,Griffin,G.,Federation,A.J.,Paranal,R.M.,Bair,S.,Newton,G.,Lichtman,A.H.,Kung,A.L.,et al.(2014).NF-kappaB DirectsDynamic Super Enhancer Formation in Inflammation and Atherogenesis.Molecularcell.
Bulger,M.,and Groudine,M.(2011).Functional and mechanistic diversityof distal transcription enhancers.Cell 144,327-339.
Carey,M.(1998).The enhanceosome and transcriptional synergy.Cell 92,5-8.
Chapuy,B.,McKeown,M.R.,Lin,C.Y.,Monti,S.,Roemer,M.G.,Qi,J.,Rahl,P.B.,Sun,H.H.,Yeda,K.T.,Doench,J.G.,et al.(2013).Discovery and characterization ofsuper-enhancer-associated dependencies in diffuse large B celllymphoma.Cancer cell 24,777-790.
Chen,H.,and Larson,D.R.(2016).What have single-molecule studiestaught us about gene expression?Genes&development 30,1796-1810.
Chipumuro,E.,Marco,E.,Christensen,C.L.,Kwiatkowski,N.,Zhang.T.,Hatheway,C.M.,Abraham,B.J.,Sharma,B.,Yeung,C.,Altabef,A.,et al.(2014).CDK7Inhibition Suppresses Super-Enhancer-Linked Oncogenic Transcription ii MYCN-Driven Cancer.Cell 159,1126-1139.
Cho,W.K.,Jayanth,N.,English,B.P.,Inoue,T.,Andrews,J.O.,Conway,W.,Grimm,J.B.,Spille,J.H.,Lavis,L.D.,Lionnet,T.,et al.(2016).RNA Polymerase IIcluster dynamics predict mRNA output in living cells.eLife 5.
Christensen,C.L.,Kwiatkowski,N.,Abraham,B.J.,Carretero,J.,Al-Shahrour,F.,Zhang,T.,Chipumuro,E.,Herter-Sprie,G.S.,Akbay,E.A.,Altabef,A.,etal.(2014).Targeting Transcriptional Addictions in Small Cell Lung Cancer witha Covalent CDK7 Inhibitor.Cancer cell 26,909-922.
Cisse,II,Izeddin,I.,Causse,S.Z.,Boudarene,L.,Senecal,A.,Muresan,L.,Dugast-Darzacq,C.,Hajj,B.,Dahan,M.,and Darzacq,X.(2013).Real-time dynamics ofRNA polymerase II clustering in live human cells.Science 341,664-667.
Cohen,R.J.,and Benedek,G.B.(1982).Equilibrium and kinetic theory ofPolymerization and the sol-gel transition.The Journal of Physical Chemistry86,3696-3714.
Dimitrova,N.,Zamudio,J.R.,Jong,R.M.,Soukup,D.,Resnick,R.,Sarma,K.,Ward,A.J.,Raj,A.,Lee,J.T.,Sharp,P.A.,et al.(2014).LincRNA-p21 activates p21in cis to promote Polycomb target gene expression and to enforce the G1/Scheckpoint.Molecular cell54,777-790.
Dowen,J.M.,Fan,Z.P.,Hnisz,D.,Ren,G.,Abraham,B.J.,Zhang,L.N.,Weintraub,A.S.,Schuijers,J.,Lee,T.I.,Zhao,K.,et al.(2014).Control of cellidentity genes occurs in insulated neighborhoods in Mammalianchromosomes.Cell 159,374-387.
Elowitz,M.B.,Levine,A.J.,Siggia,E.D.,and Swain,P.S.(2002).Stochasticgene expression in a single cell.Science 297,1183-1186.
ENCODE Project Consortium,Bernstein,B.E.,Birney,E.,Dunham,I.,Green,E.D.,Gunter,C.,and Snyder,M.(2012).An integrated encyclopedia of DNA elementsin the human genome.Nature 489,57-74.
Engreitz,J.M.,Haines,J.E.,Perez,E.M.,Munson,G.,Chen,J.,Kane,M.,McDonel,P.E.,Guttman,M.,and Lander,E.S.(2016).Local regulation of geneexpression by lncRNA promoters,transcription and splicing.Nature 539,452-455.
Falvo,J.V.,Thanos,D.,and Maniatis,T.(1995).Reversal of intrinsic DNAbends in the IFN beta gene enhancer by transcription factors and thearchitectural protein HMG I(Y).Cell 83,1101-1111.
Feric,M.,Vaidya,N.,Harmon,T.S.,Mitrea,D.M.,Zhu,L.,Richardson,T.M.,Kriwacki,R.W.,Pappu,R.V.,and Brangwynne,C.P.(2016).Coexisting Liquid PhasesUnderlie Nucleolar Subcompartments.Cell 165,1686-1697.
Fong,C.Y.,Gilan,O.,Lam,E.Y.,Rubin,A.F.,Ftouni,S.,Tyler,D.,Stanley,K.,Sinha,D.,Yeh,P.,Morison,J.,et al.(2015).BET inhibitor resistance emerges fromleukaemia stem cells.Nature 525,538-542.
Fukaya,T.,Lim,B.,and Levine,M.(2016).Enhancer Control ofTranscriptional Bursting.Cell 166,358-368.
Gemayel,R.,Chavali,S.,Pougach,K.,Legendre,M.,Zhu,B.,Boeynaems,S.,vander Zande,E.,Gevaert,K.,Rousseau,F.,Schymkowitz,J.,et al.(2015).VariableGlutamine-Rich Repeats Modulate Transcription Factor Activity.Molecular cell59,615-627.
Gillespie,D.T.(1977).Fxact stochastic simulation of coupled chemicalreactions.The Journal of Physical Chemistry 81,2340-2361.
Gruss,P.,Dhar,R.,and Khoury,G.(1981).Simian virus 40 tandem repeatedsequences as an element of the early promoter.Proceedings of the NationalAcademy of Sciences of the United States of America 78,943-947.
Hah,N.,Benner,C.,Chong,L.W.,Yu,R.T.,Downes,M.,and Evans,R.M.(2015).Inflammation-sensitive super enhancers form domains of coordinatelyregulated enhancer RNAs.Proceedings of the National Academy of Sciences ofthe United States of America 112,E297-302.
Han,T.W.,Kato,M.,Xie,S.,Wu,L.C.,Mirzaei,H.,Pei,J.,Chen,M.,Xie,Y.,Allen,J.,Xiao,G.,et al.(2012).Cell-free formation of RNA granules:bound RNAsidentify features and components of cellular assemblies.Cell 149,768-779.
Hay,D.,Hughes,J.R.,Babbs,C.,Davies,J.O.,Graham,B.J.,Hanssen,L.L.,Kassouf,M.T.,Oudelaar,A.M.,Sharpe,J.A.,Suciu,M.C.,et al.(2016).Geneticdissection of the alpha-globin super-enhancer in vivo.Nature genetics 48,895-903.
Hnisz,D.,Abraham,B.J.,Lee,T.I.,Lau,A.,Saint-Andre,V.,Sigova,A.A.,Hoke,H.A.,and Young,R.A.(2013).Super-enhancers in the control of cellidentity and disease.Cell 155,934-947.
Hnisz,D.,Schuijers,J.,Lin,C.Y.,Weintraub,A.S.,Abraham,B.J.,Lee,T.I.,Bradner,J.E.,and Young,R.A.(2015).Convergence of Developmental andOncogenicSignaling Pathways at Transcriptional Super-Enhancers.Molecularcell.
Hnisz,D.,Weintraub,A.S.,Day,D.S.,Valton,A.L.,Bak,R.O.,Li,C.H.,Goldmann,J.,Lajoie,B.R.,Fan,Z.P.,Sigova,A.A.,et al.(2016).Activation ofproto-oncogenes hy disruption of chromosome neighborhoods.Science 351,1454-1458.
Ji,X.,Dadon,D.B.,Powell,B.E.,Fan,Z.P.,Borges-Rivera,D.,Shachar,S.,Weintraub,A.S.,Hnisz,D.,Pegoraro,G.,Lee,T.I.,et al.(2016).3D ChromosomeRegulatory Landscape of Human Pluripotent Cells.Cell stem cell 18,262-275.
Jiang,T.,Raviram,R.,Snetkova,V.,Rocha,P.P.,Proudhon,C.,Badri,S.,Bonneau,R.,Skok,J.A.,and Kluger,Y.(2016).Identification of multi-loci hubsfrom 4C-seq demonstrates the functional importance of simultaneousinteractions.Nucleic acids research.
Johnson,A.D.,Meyer,B.J.,and Ptashne,M.(1979).Interactions betweenDNA-bound repressors govern regulation by the lambda phagerepressor.Proceedings of the National Academy of Sciences of the UnitedStates of America 76,5061-5065.
Kato,M.,Han,T.W.,Xie,S.,Shi,K.,Du,X.,Wu,L.C.,Mirzaei,H.,Goldsmith,E.J.,Longgood,J.,Pei,J.,et al.(2012).Cell-free formation of RNA granules:lowcomplexity sequence domains form dynamic fibors within hydrogels.Cell 149,753-767.
Kieffer-Kwon,K.R.,Tang,Z.,Mathe,E.,Qian,J.,Sung,M.H.,Li,G.,Resch,W.,Baek,S.,Pruett,N.,Grontvad,L.,et al.(2013).Interactome maps of mouse generegulatory domains reveal basic principles of transcriptional regulation.Cell155,1507-1520.
Kim,T.K.,and Maniatis,T.(1997).The mechanism of transcriptionalsynergy of an in vitro assembled interferon-beta enhanceosome.Molecular cell1,119-129.
Kwiatkowski,N.,Zhang,T.,Rahl,P.B.,Abraham,B.J.,Reddy,J.,Ficarro,S.B.,Dastur,A.,Amzallag,A.,Ramaswamy,S.,Tesar,B.,et al.(2014).Targetingtranscription regulation in cancer with a covalent CDK7 inhibitor.Nature 511,616-620.
Kwon,I.,Kato,M.,Xiang,S.,Wu,L.,Theodoropoulos,P.,Mirzaei,H.,Han,T.,Xie,S.,Corden,J.L.,and McKnight,S.L.(2013).Phosphorylation-regulated bindingof RNA polymerase II to fibrous polymers of low-complexity domains.Cell 155,1049-1060.
Lai,F.,Orom,U.A.,Cesaroni,M.,Beringer,M.,Taatjes,D.J.,Blobel,G.A.,andShiekhattar,R.(2013).Activating RNAs associate with Mediator to enhancechromatin architecture and transcription.Nature 494,497-501.
Lai,F.,and Shiekhattar,R.(2014).Enhancer RNAs:the new molecales oftranscription.Curr Opin Genet Dev 25,38-42.
Larochelle,S.,Amat,R.,Glover-Cutter,K.,Sanso,M.,Zhang,C.,Allen.J.J.,Shokat,K.M.,Bentley,D.L.,and Fisher,R.P.(2012).Cyclin-dependent kinasecontrol of the initiation-to-elongation switch of RNA polymerase II.Naturestructural&molecularbiology 19,1108-1115.
Lee,T.I.,and Young,R.A.(2013).Transcriptional regulation and itsmisregulation in disease.Cell 152,1237-1251,
Levine,M.,Cattoglin,C.,and Tjian,R.(2014).Looping back to leapforward:transcription enters a new era.Cell 157,13-25.
Li,P.,Banjade,S.,Cheng,H.C.,Kim,S.,Chen,B.,Guo,L.,Llaguno,M.,Hollingsworth,J.V.,King,D.S.,Banani,S.F.,et al.(2012).Phase transitions inthe assembly of multivalent signalling proteins.Nature 483,336-340.
Loven,J.,Hoke,H.A.,Lin,C.Y.,Lau,A.,Orlando,D.A.,Vakoc,C.R.,Bradner,J.E.,Lee,T.I.,and Young,R.A.(2013).Selective inhibition of tumor oncogenes bydisruption of super-enhancers.Cell 153,320-334.
Malik,S.,and Roeder,R.G,(2010).The metazoan Mediator co-activatorcomplex as an integrative hub for transcriptional regulation.Nature reviewsGenetics 11,761-772.
Mansour,M.R.,Abraham,B.J.,Anders,L.,Berezovskaya,A.,Gutierrez,A.,Durbin,A.D.,Etchin,J.,Lawton,L.,Sallan,S.E.,Silverman,L.B.,et al.(2014).Anoncogenic super-enhancer formed through somatic mutation of a noncodingintergenic element.Science.
Mao,Y.S.,Zhang,B.,and Spector,D.L.(2011).Biogenesis and function ofnuclear bodies.Trends in genetics:TIG 27,295-306.
Merika,M.,Williams,A.J.,Chen,G.,Collins,T.,and Thanos,D.(1998).Recruitment of CBP/p300 by the IFN beta enhanceosome is required forsynergistic activation of transcription.Molecular cell 1,277-287.
Ong,C.T.,and Corces,V.G.(2011).Enhancer function:new insights intothe regulation of tissue-specific gene expression.Nature reviews Genetics 12,283-293.
Orphanides,G.,and Reinberg,D.(2002).A unified theory of geneexpression.Cell 108,439-451.
Palstra,R.J.,Tolhuis,B.,Splinter,E.,Nijmeijer,R.,Grosveld,F.,and deLaat,W.(2003).The beta-globin nuclear compartment in development anderythroid differentiation.Nature genetics 35,190-194.
Parker,S.C.,Stitzel,M.L.,Taylor,D.L.,Orozco,J.M.,Erdos,M.R.,Akiyama,J.A.,van Bueren,K.L.,Chines,P.S.,Narisu,N.,Program,N.C.S.,et al.(2013).Chromatin stretch enhancer states drive cell-specific gene regulation andharbor human disease risk variants.Proceedings of the National Academy ofSciences of the United States of America 110,17921-17926.
Pefanis,E.,Wang,J.,Rothschild,G.,Lim,J.,Kazadi,D.,Sun,J.,Federation,A.,Chao,J.,Elliott,O.,Liu,Z.P.,et al.(2015).RNA exosome-regulated long non-coding RNA transcription controls super-enhancer activity.Cell 161,774-789.
Phatnani,H.P.,and Greenleaf,A.L.(2006).Phosphorylation and functionsof the RNA polymerase II CTD.Genes&development 20,2922-2936.
Proudhon,C.,Snetkova,V.,Raviram,R.,Lobry,C.,Badri,S.,Jiang,T.,Hao,B.,Trimarchi,T.,Kluger,Y.,Aifantis,I.,et al.(2016).Active and Inactive EnhancersCooperate to Exert Localized and Long-Range Control of Gehe Regulation.Cellreports 15,2159-2169.
Raj,A.,and van Oudenaarden,A.(2008).Nature,nurture,or chance:stochastic gene expression and its consequences.Cell 135,216-226.
Raser,J.M.,and O′Shea,E.K.(2004).Control of stochasticity ineukaryotic gene expression.Science 304,1811-1814.
Rathert,P.,Roth,M.,Neumann,T.,Muerdter,F.,Roe,J.S.,Muhar,M.,Deswal,S.,Cerny-Reiterer,S.,Peter,B.,Jude,J.,et al.(2015).Transcriptional plasticitypromotes primary and acquired resistance to BET inhibition.Nature 525,543-547.
Roadmap Epigenomics,C.,Kundaje,A.,Meuleman,W.,Ernst,J.,Bilenky,M.,Yen,A.,Heravi-Moussavi,A.,Kheradpour,P.,Zhang,Z.,Wang,J.,et al.(2015).Integrative analysis of 111 reference human epigenomes.Nature 518,317-330.
Semenov,A.N.,and Rubinstein,M.(1998).Thermoreversible gelation insolutions of associative polymers.Macromolecules 31,1373-1385.
Shin,H.Y.,Willi,M.,Yoo,K.H.,Zeng,X.,Wang,C.,Metser,G.,andHennighausen,L.(2016).Hierarchy within the mammary STAT5-driven Wap super-enhancer.Nature genetics 48,904-911.
Shin,Y.,Berry,J.,Pannucci,N.,Haataja,M.P.,Toettcher,J.E.,andBrangwynne,C.P.(2017).Spatiotemporal Control of Intracellular PhaseTransitions Using Light-Activated optoDroplets.Cell 168,159-171 e114.
Shu,S.,Lin,C.Y.,He,H.H.,Witwicki,R.M.,Tabassum,D.P.,Roberts,J.M.,Janiszewska,M.,Huh,S.J.,Liang,Y.,Ryan,J.,et al.(2016).Response and resistanceto BET bromodomain inhibitors in triple-negative breast cancer.Nature 529,413-417.
Sigova,A.A.,Abraham,B.J.,Ji,X.,Molinie,B.,Hannett,N.M.,Guo,Y.E.,Jangi,M.,Giallourakis,C.C.,Sharp,P.A.,and Young,R.A.(2015).Transcriptionfactor trapping by RNA in gene regulatory elements.Science 350,978-981.
Sigova,A.A.,Mullen,A.C.,Molinie,B.,Gupta,S.,Orlando,D.A.,Guenther,M.G.,Almada,A.E.,Lin,C.,Sharp,P.A.,Giallourakis,C.C.,et al.(2013).Divergenttranscription of long noncoding RNA/mRNA gene pairs in embryonic stemcells.Proceedings of the Natioual Academy of Scieuces of the United States ofAmerica 110,2876-2881.
Spitz,F.,and Furlong,E.E.(2012).Transcription factors:from enhancerbinding to developmental control.Nature reviews Genetics 13,613-626.
Stathis,A.,Zucca,E.,Bekradda,M.,Gomez-Roca,C.,Delord,J.P.,de La MotteRouge,T.,Uro-Coste,E.,de Braud,F.,Pelosi,G.,and French,C.A.(2016).ClinicalResponse of Carcinomas Harboring the BRD4-NUT Oncoprotein to the TargetedBromodomain Inhibitor OTX015/MK-8628.Cancer discovery 6,492-500.
Suter,D.M.,Molina,N.,Gatfield,D.,Schneider,K.,Schibler,U.,and Naef,F.(2011).Mammalian genes are transcribed with widely different burstingkinetics.Science 332,472-474.
Thanos,D.,and Maniatis,T.(1995).Virus induction of human IFN betagene expression requires the assembly of an enhanceosome.Cell 83,1091-1100.
Tjian,R.,and Maniatis,T.(1994).Transcriptional activation:a complexpuzzle with few easy pieces.Cell 77,5-8.
Tolhuis,B.,Palstra,R.J.,Splinter,E.,Grosveld,F.,and de Laat,W.(2002).Looping and interaction between hypersensitive sites in the active beta-globin locus.Molecular cell 10,1453-1465.
Wang,Y.,Zhang,T.,Kwiatkowski,N.,Abraham,B.J.,Lee,T.I.,Xie,S.,Yuzugullu,H.,Von,T.,Li,H.,Lin,Z.,et al.(2015).CDK7-dependent transcriptionaladdiction in triple-negative breast cancer.Cell 163,174-186.
Wheeler,J.R.,Matheny,T.,Jain,S.,Abrisch,R.,and Parker,R.(2016).Distinct stages in stress granule assembly and disassembly.eLife 5.
Whyte,W.A.,Orlando,D.A.,Hnisz,D.,Abraham,B.J.,Lin,C.Y.,Kagey,M.H.,Rahl,P.B.,Lee,T.I.,and Young,R.A.(2013).Master transcription factors andmediator establish super-enhancers at key cell identity genes.Cell 153,307-319.
Zhu,L.,and Brangwynne,C.P.(2015).Nuclear bodies:the emergingbiophysics of nucleoplasmic phases.Current opinion in cell biology 34,23-30.
Zoller,B.,Nicolas,D.,Molina,N.,and Naef,F.(2015).Structure of silenttranscription intervals and noise characteristics of mammaliangenes.Molecular systems biology 11,823.
实施例2
此处,我们提供实验证据,即超级增强子形成液体样的相分离的凝聚物。这建立了新型构架来说明关于这些调控元件所描述的不同特性并且将通过LLPS调控的生物化学过程扩展至包括基因控制。
BRD4和MED1是核凝聚物的组分
包含SE的增强子团簇由主转录因子和异常高密度的辅因子(如BRD4和介体)占据,其存在可用于定义SE(1、2、13)。我们推断,如果SE形成核凝聚物,那么这些富SE辅因子可能作为细胞的细胞核中的个别细胞体进行肉眼观察。实际上,使用针对BRD4和MED1(介体亚单元)的抗体的免疫荧光(IF)的结构化照明显微术(SIM)揭露了在鼠科动物胚胎干细胞(mESC)的细胞核中的离散焦点(图11A)。BRD4和MED1焦点显示显著重叠(图11B),与ChIP-seq数据(图16A和15B)一致,表明两种蛋白质典型地共占据这些凝聚物。BRD4和MED1焦点显示与HP1a(图11C)或细胞核的其他DAPI密集区(图11A)的不良重叠,指示BRD4和MED1凝聚物倾向于出现在细胞核的异染色质区外部。我们还通过反褶积显微术或SIM肉眼观察先前描述的核凝聚物,包括核仁(FIB1)(14)、组蛋白小体(NPAT)(15)、组成性异染色质(HP1a)(16、17)(图11D)。虽然存在核凝聚物的大小和数目的多样性,但关于BRD4和MED1的那些是在先前描述的凝聚物的大小范围内(图11E)。这些结果指示BRD4和MED1未在细胞核内扩散,但占据离散区,我们将其称作BRD4和MED1凝聚物。
BRD4和MED1凝聚物出现于经活跃转录的SE中
通过ChIP-seq对增强子处的BRD4和MED1结合进行的整体分析表明,在mESC(1)中存在具有相对较高水平的这些辅因子的数百种SE和多种另外的增强子。为了测定BRD4和MED1凝聚物是否与活性SE(SE驱动的RNA合成的位点)一致,我们使用BRD4或MED1的IF来鉴定凝聚物并且通过使用SE驱动的新生转录物的RNA-FISH(探测内含子RNA)来鉴定活性SE(图12和图17)。检查四种不同活性SE,并且在各情况下,活性SE驱动的转录物的位点与BRD4或MED1凝聚物重叠或紧密邻近(图12B和图17B)。FISH和IF信号重叠或紧密邻近的频率远高于偶然预期(图17C-17D,参见材料和方法)。这些结果指示活跃转录的SE驱动基因与含有BRD4或MED1的凝聚物缔合。
BRD4和MED1凝聚物在光漂白动力学之后展现液体样荧光恢复
我们试图检查BRD4和MED1凝聚物是否展现液体样凝聚物所特有的特征。液体样凝聚物的特点是内部动态重组和快速交换动力学(10-12),其可通过测量光漂白之后的荧光恢复(FRAP)速率来查询。为了研究BRD4和MED1小体在活细胞中的动力学,我们在mESC中异位表达BRD4-GFP或MED1-GFP并且执行FRAP实验。在光漂白之后,BRD4-GFP和MED1-GFP凝聚物在数秒时标中恢复荧光(图13和18A),其中表观扩散系数分别是0.54±0.15μm2/s和0.36±0.13μm2/s。这些值与液体样凝聚物的先前所述组分(18、19)相似(图18A)。有趣的是,荧光恢复发生在相同边界内,证明荧光信号表示与稀相快速地交换组分的动态致密相(图13B和13E)。在聚甲醛固定的情况下,BRD4-GFP或MED1-GFP凝聚物仍存在,但其在光漂白之后不展现恢复,证明交联会维持总体凝聚物结构,但会破坏与所述稀相的交换(图18B)。ATP已通过驱动能量依赖性过程和/或经由其固有的助水溶物活性(20、21)而牵涉于促进凝聚物流动性中。通过葡萄糖剥夺和寡霉素处理实现的细胞ATP耗尽(图18C)消除BRD4-GFP和MED1-GFP小体两者在光漂白之后的荧光恢复(图13C和13F)。这些结果指示含有BRD4和MED1的小体在细胞中具有液体样特性,与先前描述的相分离的凝聚物一致。
BRD4和MED1的固有无序区在体外相分离
具有固有无序区(IDR)的蛋白质已牵涉于促进凝聚物形成中(10、12)。BRD4和MED1含有大IDR(图14A)。牵涉于凝聚物形成中的数种蛋白质的纯化的IDR形成体外相分离的小液滴(18、22、23)。因此,我们研究BRD4或MED1的IDR是否形成体外相分离的小液滴。纯化的重组GFP-IDR融合蛋白(BRD4-IDR和MED1-IDR)(图14B)添加至小液滴形成缓冲液中(参见材料和方法),使所述溶液变得不透明,而仅具有GFP的相等溶液保持澄清(图14C)。不透明MED1-IDR和BRD4-IDR溶液的荧光显微术揭露GFP阳性、微米大小的球形小液滴在溶液中自由地移动并且落在玻璃盖玻片的表面上并且湿润所述表面,其中所述小液滴保持固定。如通过纵横比分析所测定,所述MED1-IDR和BRD4-IDR小液滴是高度球形(图19A),这是关于液体样小液滴所预期的特性(10-12)。
相分离的小液滴典型地根据所述系统(24)中的组分浓度对大小定标。我们使用介于0.6μM至20μM范围内的变化浓度的BRD4-IDR、MED1-IDR和GFP来执行小液滴形成测定。BRD4-IDR和MED1-IDR形成具有浓度依赖性大小分布的小液滴,而GFP在所测试的所有条件下均保持扩散(图14D和19B)。所述小液滴在较低浓度下变得较小,但我们在所测试的最低浓度(0.6μM)下观察到BRD4-IDR和MED1-IDR小液滴(图19C)。
由纯化的IDR组成的小液滴可对增加的盐浓度(25)敏感。BRD4-IDR和MED1-IDR两者的大小分布在增加的NaCl浓度(50mM至350mM)下朝向较小的小液滴移动,与通过微弱盐敏感性蛋白质-蛋白质相互作用的网络驱动的小液滴形成一致(图14E和19D)。
为了测试所述小液滴是不可逆聚集体或可逆相分离的凝聚物,使BRD4-IDR和MED1-IDR形成小液滴并且接着在等摩尔浓度盐中或在高盐溶液中将蛋白质浓度稀释一半(图14F)。预先形成的BRD4-IDR和MED1-IDR两者的小液滴的大小和数目在稀释的情况下并且在升高的盐浓度下降低(图14F)。这些结果显示出,BRD4-IDR和MED1-IDR小液滴视系统条件而形成大小的分布并且一旦形成,可以大小分布的快速调节响应于所述系统中的变化。这些特征是通过微弱蛋白质-蛋白质相互作用的网络形成的相分离的凝聚物所特有的。
MED1IDR参与细胞中的液体-液体相分离
为了研究MED1的IDR是否在促进细胞中的相分离中发挥作用,我们使用先前开发的测定,所述测定允许体内小液滴形成的直接观察(26)。简单说来,光可活化、自缔合Cry2蛋白是经mCherry标记并且融合至所关注的IDR,其允许细胞内所选择的IDR的局部浓度的蓝光诱导性增加(图15A)(26)。在这一测定中,已知促进相分离的IDR会增加cry2的光反应性团簇特性(27,28),从而在蓝光刺激时引起液体样球形小液滴(optoDroplet)的快速形成(图15A)(26)。一部分MED1IDR与Cry2-mCherry的融合会在蓝光刺激时促进微米大小球形optoDroplet的快速形成(图15B和15C)。在蓝光刺激期间,邻近optoDroplet融合在一起(图5D)。此外,融合物对球形形状展现颈缩和松弛的特有液体样融合特性(图5E)。
我们接着测试MED1-IDR optoDroplet是否展现液体样FRAP恢复速率(图15F-H)。OptoDroplet形成是由蓝光诱导,随后进行光漂白并且在蓝光不存在下恢复。荧光在数秒内恢复并且保持optoDroplet的边界(图15F和15H)。在Cry2相互作用的蓝光活化不存在下的快速FRAP动力学表明,通过蓝光建立的MED1-IDR optoDroplet是动态组装体,其在原始信号不存在下与稀相交换。这些数据显示MED1的IDR可在活细胞的细胞核内的临界局部浓度下参与液体-液体相分离。
论述
超级增强子(SE)调控在健康和患病细胞状态下具有显著作用的基因,因此存在以下改进理解,即这些元件可能提供对牵涉于这些细胞状态的转录控制中的调控机制的新见解(1、2、29)。已经主张SE和其组分形成相分离的凝聚物(3),但关于这种假设存在极少实验证据。此处,我们证明了SE的两种关键组分BRD4和MED1在SE驱动的转录的位点处形成核凝聚物。在这些SE凝聚物内,BRD4和MED1展现与先前关于驱动体内相分离的其他蛋白质(18、19)所报告的那些相似的表观扩散系数。BRD4和MED1的IDR足以在体外相分离并且一部分MED1-IDR促进活细胞中的液体-液体相分离。这些结果指示SE形成相分离的凝聚物,所述凝聚物在关键基因处区域化并且浓缩转录装置并且鉴定有可能在相分离中发挥作用的SE组分。这一模型与牵涉于关键细胞身份基因的控制和细胞核的功能组织中的机制有关。
SE通过使主转录因子(TF)结合于增强子团簇(1、2)来建立,并且这些主TF足以建立对定义细胞身份的基因表达程序的控制(30-36)。这些TF典型地由结构可通过结晶学方法测定的DNA结合域和由结构无法通过所述方法定义的IDR组成的转录活化域组成(37-39)。这些TF的活化域募集高密度的辅因子(如介体和BRD4)至SE(2),并且转录装置的这些和其他组分的浓度看来足以形成液体凝聚物。相对于人类基因组中编码的大多数蛋白质,所述TF、辅因子和转录装置在IDR(40)中富集,所述IDR可能介导微弱多价相互作用,由此促进体内凝聚。我们建议高价态因子在SE处的凝聚会在分离的致密相内产生反应坩埚,其中转录机构的高局部浓度确保稳固基因表达。
染色体的核组织有可能受SE凝聚物影响。DNA相互作用技术指示SE内的个别增强子具有异常高的彼此相互作用频率(3、41-43),与如下观念一致,即凝聚物使这些元件在致密相中紧密邻近。数项近期研究表明SE可彼此相互作用并且还可以这种方式促进染色体组织(44、45)。粘合素(染色体结构维持(SMC)蛋白复合物)已牵涉于限制SE-SE相互作用中,因为其损失会引起细胞核内的SE的广泛融合(45)。这些SE-SE相互作用可归因于液相凝聚物经历融合的倾向(10-12)。
SE形成在关键基因处区域化转录装置的相分离的凝聚物的模型引起多种问题。凝聚如何促进转录输出的调控?可以是相分离的凝聚物的RNA聚合酶II团簇的超分辨率研究表明在凝聚物生存期与转录输出之间的正相关(46)。什么组分会驱动转录凝聚物的形成和溶解?所述研究指示BRD4和MED1有可能参与,但DNA结合TF、辅因子、RNA POL II和调控RNA的作用需要进一步研究。肿瘤细胞在不存在于其起源细胞中的驱动者致癌基因处具有异常大的SE,并且这些细胞中的一些对靶向SE富集组分的药物异常敏感(29、47)。
材料和方法
细胞培养
V6.5鼠科动物胚胎干细胞(mESC)是来自Jaenisch实验室的礼物。细胞在0.2%凝胶化(Sigma,G1890)组织培养板上在2i培养基、DMEM-F12(Life Technologies,11320082)、0.5X B27补充剂(Life Technologies,17504044)、0.5X N2补充剂(Life Technologies,17502048)、另外的0.5mM L-谷酰胺(Gibco,25030-081)、0.1mM b-巯基乙醇(Sigma,M7522)、1%青霉素链霉素(Life Technologies,15140163)、0.5X非必需氨基酸(Gibco,11140-050)、1000U/ml LIF(Chemico,ESG1107)、1μM PD0325901(Stemgent,04-0006-10)、3μM CHIR99021(Stemgent,04-0004-10)中生长。细胞在潮湿孵育器中在37℃和5%CO2下生长。关于共聚焦、反褶积和超分辨率成像,细胞在37C下用5μg/ml聚-L-鸟氨酸(Sigma-Aldrich,P4957)涂布持续30min并且37C下用5μg/ml层粘连蛋白(Corning,354232)涂布持续2h-16h的玻璃盖玻片(Carolina Biological Supply,633029)、玻璃底皿(ThomasScientific,1217N79)或8室盖玻片(Life Technologies,155409PK或VWR,100489-104)上生长。关于传代,细胞在PBS(Life Technologies,AM9625)、1000U/ml LIF中进行洗涤。使用TrypLE表达酶(Life Technologies,12604021)使细胞从板脱离。TrypLE用FBS/LIF-培养基、DMEM K/O(Gibco,10829-018)、1X非必需氨基酸、1%青霉素链霉素、2mM L-谷酰胺、0.1mM b-巯基乙醇和15%胎牛血清FBS(Sigma Aldrich,F4135)淬灭。细胞在RT下在1000rpm下短暂离心持续3min,再悬浮于2i培养基中并且5×106个细胞接种于152cm2中。
HEK293T细胞(ATCC,CRL-3216)用于产生用于optoDroplet实验的病毒。HEK293T细胞在潮湿孵育器中在37℃和5%CO2下在补充有10%FBS(Sigma Aldrich,F4135)、2mM L-谷酰胺(Gibco,25030)和100U/mL青霉素-链霉素(Gibco,15140)的DMEM(GIBCO,11995-073)中培养。
NIH 3T3细胞(ATCC,CRL-3216)用于optoDroplet实验。NIH 3T3细胞在潮湿孵育器中在37℃和5%CO2下在补充有10%FBS(Sigma Aldrich,F4135)、2mM L-谷酰胺(Gibco,25030)和100U/mL青霉素-链霉素(Gibco,15140)的DMEM(GIBCO,11995-073)中培养。
构建体产生
MED1-GFP表达构建体通过利用30bp丝氨酸-甘氨酸连接体将全长人类MED1 cDNA融合至mEGFP而产生,所述连接体在使用NEB Hi-Fi克隆试剂盒(NEB E5520S)的慢病毒表达载体中与PGK启动子并置。
细胞处理和细胞系产生
转染:细胞根据制造商的说明书在以下修改下用Lipofectamine 3000(LifeTechnologies,L3000008)转染。1ml FBS/LIF-培养基中的1×106个细胞接种于6-多孔皿的一个明胶涂布的孔中并且在接种期间,Lipofectamine-DNA混合物立即添加于所述细胞顶部上。12h之后,FBS/LIF-培养基用2i培养基置换。细胞在转染后24-48h成像。
ATP耗尽:细胞在补充有0.5X B27补充剂和0.5X N2补充剂的无葡萄糖DMEM(Gibco,11966025)中培养持续2小时,随后用5mM 2-脱氧-葡萄糖(Sigma,D6134)和126nM寡霉素(Sigma,75351)孵育持续2小时。细胞ATP水平使用生物发光测定(Invitrogen,A22066)根据制造商的说明书来测量。
免疫荧光
免疫荧光是如先前所述在一些修改下执行(49)。简单说来,在涂布玻璃上生长的细胞在RT下在PBS中的4%聚甲醛PFA(VWR,BT140770)中固定持续10min。在PBS中进行三次洗涤持续5min之后,细胞存储于4C下或针对免疫荧光进行加工。细胞在RT下用PBS中的0.5%triton X100(Sigma Aldrich,X100)渗透持续5min。在PBS中进行三次洗涤持续5min之后,细胞在RT下用4%无IgG牛血清白蛋白BSA(VWR,102643-516)阻断持续至少15min并且在RT下在4%无IgG BSA中用第一抗体(参见抗体表)孵育O/N。在PBS中进行三次洗涤之后,第一抗体在暗处通过第二抗体(参见抗体表)识别。细胞用PBS洗涤三次,在RT下在暗处使用20μm/ml HOESCH(Life Technologies,H3569)对细胞核染色持续5min。载玻片用Vactashield(VWR,101098-042)封固于载玻片上。盖玻片用透明指甲油(ElectronMicroscopy Science Nm,72180)密封并且存储于4℃下。在具有100x物镜的RPI转盘式共聚焦显微镜上使用MetaMorph采集软件和Hammamatsu ORCA-ER CCD摄影机(W.M.KeckMicroscopy Facility,MIT),或在具有60x物镜的Applied Precision DeltaVision-OMXSuper-Resolution Microscope显微镜(Microscopy Core Facility,Koch Institute forIntegrative Cancer Research)上如图例所陈述采集图像。结构化照明显微术用于直径小于200nm的核体,在其他情况下如图例所陈述使用反褶积或共聚焦显微术。图像使用FijiIs Just ImageJ(FIJI)(50)或Imaris v9.0.0Bitplane Inc(W.M.Keck MicroscopyFacility,MIT)、在//bitplane.com处可获得的软件或Softworx处理软件(MicroscopyCore Facility,Koch Institute for Integrative Cancer Research)进行后处理。
与免疫荧光组合的RNA-FISH
免疫荧光是如先前所述在以下修改下执行。免疫荧光在无RNase环境中执行,移液管和工作台用RNaseZap(Life Technologies,AM9780)处理。使用无RNase PBS并且抗体始终在无RNase PBS中进行稀释。在免疫荧光完成之后。细胞在RT下用PBS中的4%PFA后固定持续10min。细胞在无RNase PBS中洗涤两次。细胞在RT下用无RNase水(LifeTechnologies,AM9932)中的20%Stellaris RNA FISH洗涤缓冲液A(BiosearchTechnologies,Inc.,SMF-WA1-60)、10%去离子化甲酰胺(EMD Millipore,S4117)洗涤一次持续5min。细胞用90%Stellaris RNA FISH杂交缓冲液(Biosearch Technologies,SMF-HB1-10)、10%去离子化甲酰胺、12.5μM被设计成杂交SE缔合基因的转录物的内含子的Stellaris RNA FISH探针杂交。杂交在37C下执行O/N。细胞接着在37℃下用洗涤缓冲液A洗涤持续30min并且细胞核在RT下用洗涤缓冲液A中的20μm/ml HOESCH染色持续5min。在RT下用Stellaris RNA FISH洗涤缓冲液B(Biosearch Technologies,SMF-WB1-20)进行一次5-min洗涤之后。盖玻片如关于免疫荧光所述进行封固。在RPI转盘式共聚焦显微镜上拍摄图像。
光漂白之后的荧光恢复(FRAP)
表达经荧光标记的蛋白质的细胞在Andor Revolution Spinning DiskConfocal,FRAPPA系统和Metamorph采集软件(W.M.Keck Microscopy Facility,MIT)上每1s以100x物镜成像持续20s。一或两张图像是预漂白的并且接着大约0.5μm2用可定量的激光模块(QLM)的488nm激光漂白。对所关注的选择区执行FRAP,每20μs具有5次脉冲。
成像分析
关于结构化照明和反褶积处理,使用Softworx处理软件(Microscopy CoreFacility,Koch Institute for Integrative Cancer Research)。
关于展示于图11E中的数据,使用FIJI Particle Analysis(51)或FIJI ObjectCounter 3D插件(51)对核凝聚物进行计数。最小三维像素大小是4并且强度截止值基于亮度和对比度分析来决定。
关于IF/RNA-FISH分析,BRD4和MED1凝聚物的大小和坐标和RNA-FISH焦点用FIJIObject Counter 3D插件(51)测量。根据图像采集参数,关于图像的像素宽度和长度在FIJI内被设置于0.0572009微米,并且三维像素深度被设置于0.5微米。关于小体,需要最少4个三维像素。各新生RNA转录物小体(FISH)与最接近蛋白质小体(IF)之间的3D距离如下进行测量。在分离用FIJI Object Counter 3D插件召集的焦点之后,计算同一图像集合中的各FISH焦点与所有其他IF焦点的质心之间的3D距离。保持单一最接近IF焦点并且用于展示距所述最接近焦点的距离的分布。关于随机对照物,还保持各FISH焦点的5微米内的随机IF焦点。
关于FRAP分析,荧光恢复作为针对未漂白区域或整个细胞核的强度标准化的经过光漂白的区域的荧光强度进行测量。荧光强度用FIJI FRAP剖析器插件(代码由JeffHardin书写,从Tony Collins'Macbiophotonics插件修改,所述插件可获自此处://worms.zoology.wisc.edu/research/4d/4d.html测量。
ChIP-Seq分析
使用bowtie以参数–k 1 –m 1 –best和设置为读出长度的–l比对ChIP-Seq数据与小鼠参考基因组的mm9形式(52)。使用MACS以参数–w–S–space=50–nomodel–shiftsize=200创建用于以仓展示读取覆盖率的Wiggle文件,并且每仓读数计数针对用于产生所述wiggle文件的数百万个定位的读数标准化(53)。每百万个读数标准化的wiggle文件展示于UCSC基因组浏览器中(54)。使用具有–p 1e-9–keep-dup=1和关于BRD4、MED1和RNA PolII的输入对照物的MACS鉴定富集的峰。小鼠胚胎干细胞中的超级增强子位置从先前公布下载(55)。
使用崩塌的区联合(称作BRD4或MED1的峰)创建因子共定位热图,所述崩塌的区联合使用bedtools合并产生(56)。使用bamToGFF(https://github.com/BradnerLab/ pipeline)以参数–m 50 –r –f 1 –e 200关于各崩塌的区以50个相等大小的仓计算读取密度。热图通过在所有列中的给定行中的BRD4/MED1/PolII信号的读取信号定制。使用samtools rmdup来移除假定的PCR复制物,并且将这些非复制物读数的密度用于热图构建(57)。
数据集是:
HP1a:GSM1375159 RNAPII:GSM1566094 MED1:GSM560348 BRD4:GSM1659409
输入对照物:GSM1082343
蛋白质纯化
关于细菌中的重组蛋白表达,将针对BRD4-IDR的6xHIS-mEGFP-连接体-IDR(BRD4674-1351)或MED1-IDR(MED1948-1574)或6x-HIS-mEGFP-连接体克隆至T7pET表达载体(addgene:29663)中。连接体序列是GAPGSAGSAAGGSG(SEQ ID NO:14)。质粒转化至LOBSTR细胞(Cheeseman Lab的礼物)中。新鲜细菌集落接种至含有卡那霉素和氯霉素的LB培养基中并且在37℃下生长过夜。这些细菌以1:15稀释于具有新鲜添加的卡那霉素和氯霉素的500ml预温LB中并且在37℃下生长持续1.5小时。在用1mM IPTG诱导蛋白质表达之后,细胞再生长持续5小时,收集,并且冷冻存储于-80℃下直至准备使用。
来自500ml细胞的集结粒再悬浮于含有10mM咪唑、cOmplete蛋白酶抑制剂(Roche,11873580001)的15ml缓冲液A(50mM Tris pH 7.5、500mM NaCl)中并且进行声波处理(15秒打开、60s切断的十个周期)。溶解产物通过在4℃下在12,000g下离心持续30分钟被清除并且添加至用10X体积的缓冲液A预平衡的1ml Ni-NTA琼脂糖(Invitrogen,R901-15)中。含有这一琼脂糖溶解产物浆液的管在4C下旋转持续1.5小时。所述浆液倾倒至柱中,并且填充的琼脂糖用15体积的含有10mM咪唑的缓冲液A洗涤。蛋白质相继用含有50mM咪唑的2X2ml缓冲液A、具有100mM咪唑的2X2ml缓冲液A、具有250mM咪唑的4X2ml缓冲液A洗脱。
组合如通过库马斯染色凝胶所判断含有蛋白质的洗脱份并且针对缓冲液D(50mMTris-HCl pH 7.5、500mM NaCl、10%甘油、1mM DTT)进行透析。
体外小液滴测定
重组GFP融合蛋白使用Amicon Ultra离心过滤器(30K MWCO,Millipore)进行浓缩并且脱盐至适当蛋白质浓度和125mM NaCl。重组蛋白添加至小液滴形成缓冲液(50mMTrish-HCl pH 7.5、10%甘油、10%PEG-8000(Sigma 89510)、1mM DTT)中具有变化浓度的所指示的最终盐的溶液中。所述蛋白质溶液立即装载至包含通过双面胶带的两个平行条附接的载玻片和盖玻片的自制室中。载玻片接着在使用100x物镜的Andor RevolutionSpinning Disk Confocal上成像。除非另外指示,否则所呈递的图像具有沉降于玻璃盖玻片上的小液滴。
OptoDroplet测定
OptoDroplet测定根据Shin,Y等人Cell 2017(58)加以修改。关于IDR的克隆,使用Phusion Flash(ThermoFisher F548S)扩增编码固有无序域的DNA区段。区段使用Hi-FiNEBuilder(NEB E2621S)克隆至含有mCherry-Cry2融合蛋白的产生II慢病毒骨架(获自Brangwynne实验室)中。克隆的opto-droplet质粒用psPAX(Addgene 12260)和使用PEI转染剂的pMD2.G(Addgene 12259)病毒封装质粒(polysciences 23966-1)共转染。病毒在HEK293T细胞中产生,并且直接地加以使用或使用Takara Lenti-X浓缩器(631232)进行浓缩。关于转导,3T3细胞在转导之前1天进行接种,以每个35mm组织培养孔400,000个细胞接种。病毒介质添加至细胞中持续24小时,此时细胞在正常培养基中扩增用于成像或繁殖。关于成像,35mm MatTek玻璃底皿(MatTek P35G-1.5-20-C)在37℃下用0.1mg/ml纤维连接蛋白(EMD-Millipore FC010)涂布持续20分钟并且用PBS洗涤两次,接着进行接种。细胞在成像之前一天以每个35mm皿400,000个细胞进行接种。在Zeiss LSM 710点扫描显微镜上执行成像。除非另外指示,否则小液滴形成用每2秒488nm光脉冲诱导,持续成像的持续时间,其中每2秒还拍摄图像。成像持续时间如所指示。mCherry荧光用561nm光刺激。关于FRAP实验,小液滴形成用488nm光诱导持续40秒,此时焦点用561nm光漂白并且在488nm刺激不存在下每2秒使恢复成像。
抗体
Figure BDA0002792767850001851
构建体
公司和目录号 参考文献
BRD4-GFP Addgene质粒#65378 (59)
HP1a-GFP Cheesman实验室
mCherry-Cry2WT Brangwynne实验室
MED1-GFP 本公开
pET-BRD4-IDR 本公开
pET-MED1-IDR 本公开
pET-GFP 本公开
OptoIDR-MED1-frag1 本公开
参考文献:
1.W.A.Whyte et al.,Master Transcription Factors and MediatorEstablish Super-Enhancers at Key Cell Identity Genes,Cell.153,307-319(2013).
2.D.Hnisz et al.,Super-enhancers in the control of cell identity anddisease.Cell.155,934-947(2013).
3.D.Hnisz,K.Shrinivas,R.A.Young,A.K.Chakraborty,P.A.Sharp,A PhaseSeparation Model for Transcriptional Control.Cell.169,13-23(2017).
4.K.Adelman,J.T.Lis,Promoter-proximal pausing of RNA polymerase II:emerging roles in metazoans.Nature Reviews Genetics.13,720-731(2012).
5.M.Bulger,M.Groudine,Functional and Mechanistic Diversity of DistalTranscription Enhancers.Cell.144,327-339(2011).
6.E.Calo,J.Wysocka,Modification of Enhancer Chromatin:What,How,andWhy?Molecular Cell.49,825-837(2013).
7.F.Spitz,E.E.M.Furlong,Transcription factors:from enhancer bindingto developmental control.Nature Reviews Genetics.13,613-626(2012).
8.W.Xie,B.Ren,Enhancing Pluripotency and LineageSpecification.Science.341,245-247(2013).
9.M.Levine,C.Cattoglio,R.Tjian,Looping Back to Leap Forward:Transcription Enters a New Era.Cell.157,13-25(2014).
10.S.F.Banani,H.O.Lee,A.A.Hyman,M.K.Rosen,Biomolecular condensates:organizers of cellular biochemistry.Nat Rev Mol Cell Biol.18,285-298(2017).
11.A.A.Hyman,C.A.Weber,F.Jülicher,Liquid-Liquid Phase Separation inBiology.Annu.Rev.Cell Dev.Biol.30,39-58(2014).
12.Y.Shin,C.P.Brangwynne,Liquid phase condensation in cell physiologyand disease.Science.357,eaaf4382(2017).
13.B.Chapuy et al.,Discovery and Characterization of Super-Enhancer-Associated Dependencies in Diffuse Large B Cell Lymphoma.Cancer Cell.24,777-790(2013).
14.T.Pederson,The nucleolus.Cold Spring Harbor Perspectives inBiology.3,a000638-a000638(2011).
15.Z.Nizami,S.Deryusheva,J.G.Gall,The Cajal body and histone locusbody.Cold Spring Harbor Perspectives in Biology.2,a000653(2010).
16.A.G.Larson et al.,Liquid droplet formation by HP1αsuggests a rolefor phase separation in heterochromatin.Nature.547,236-240(2017).
17.A.R.Strom et al.,Phase separation drives heterochromatin domainformation.Nature.547,241-245(2017).
18.T.J.Nott et al.,Phase transition of a disordered nuage proteingenerates environmentally responsive membraneless organelles.MolecularCell.57,936-947(2015).
19.C.W.Pak et al.,Sequence Determinants of Intracellular PhaseSeparation by Complex Coacervation of a Disordered Protein.Molecular Cell.63,72-85(2016).
20.C.P.Brangwynne,T.J.Mitchison,A.A.Hyman,Active liquid-like behaviorof nucleoli determines their size and shape in Xenopus laevisoocytes.Proceedings of the National Academy of Sciences.108,4334-4339(2011).
21.A.Patel et al.,ATP as a biological hydrotrope.Science.356,753-756(2017).
22.Y.Lin,D.S.W.Protter,M.K.Rosen,R.Parker,Formation and Maturation ofPhase-Separated Liquid Droplets by RNA-Binding Proteins.Molecular Cell.60,208-219(2015).
23.K.A.Burke,A.M.Janke,C.L.Rhine,N.L.Fawzi,Residue-by-Residue View ofIn Vitro FUS Granules that Bind the C-Terminal Domain of RNA PolymeraseII.Molecular Cell.60,231-241(2015).
24.C.P.Brangwynne,Phase transitions and size scaling of membrane-lessorganelles.J Cell Biol.203,875-881(2013).
25.C.P.Brangwynne,P.Tompa,R.V.Pappu,Polymer physics of intracellularphase transitions.Nat Phys.11,899-904(2015).
26.Y.Shin et al.,Spatiotemporal Control of Intracellular PhaseTransitions Using Light-Activated optoDroplets.Cell.168,159-171.e14(2017).
27.I.Ozkan-Dagliyan et al.,Formation of Arabidopsis Cryptochrome 2Photobodies in Mammalian Nuclei APPLICATION AS AN OPTOGENETIC DNA DAMAGECHECKPOINT SWITCH.J.Biol.Chem.288,23244-23251(2013).
28.X.Yu et al.,Formation of Nuclear Bodies of Arabidopsis CRY2 inResponse to Blue Light Is Associated with Its Blue Light-DependentDegradation.The Plant Cell.21,118-130(2009).
29.J.Lovén et al.,Selective Inhibition of Tumor Oncogenes byDisruption of Super-Enhancers.Cell.153,320-334(2013).
30.Y.Buganim,D.A.Faddah,R.Jaenisch,Mechanisms and models of somaticcell reprogramming.Nature Reviews Genetics.14,427-439(2013).
31.T.Graf,T.Enver,Forcing cells to change lineages.Nature.462.587-594(2009).
32.T.I.Lee,R.A.Young,Transcriptional Regulation and Its Misregulationin Disease.Cell.152,1237-1251(2013).
33.S.A.Morris,G.Q.Daley,A blueprint for engineering cell fate:currenttechnologies to reprogram cell identity.Cell Research.23,33-48(2013).
34.I.Sancho-Martinez,S.H.Baek,J.C.I.Belmonte,Lineage conversionmethodologies meet the reprogramming toolbox.Nat Cell Biol.14,ncb2567-899(2012).
35.T.Vierbuchen,M.Wernig,Molecular Roadblocks for CellularReprogramming.Molecular Cell.47,827-838(2012).
36.S.Yamanaka,Induced Pluripotent Stem Cells:Past,Present,andFuture.Stem Cell.10.678-684(2012).
37.M.Ptashne,How eukaryotic transcriptional activatorswork.Nature.335,683-689(1988).
38.P.J.Mitchell,R.Tjian,Transcriptional regulation in mammalian cellsby sequence-specific DNA binding proteins.Science.245,371-378(1989).
39.J.Liu et al.,Intrinsic Disorder in TranscriptionFactors.Biochemistry.45,6873-6888(2006).
40.H.Xie et al.,Functional Anthology of IntrinsicDisorder.1.Biological Processes and Functions of Proteins with LongDisordered Regions.J.Proteome Res.6,1882-1898(2007).
41.J.M.Dowen et al.,Control of Cell Identity Genes Occurs inInsulated Neighborhoods in Mammalian Chromosomes.Cell.159,374-387(2014).
42.X.Ji et al.,3D Chromosome Regulatory Landscape of HumanPluripotent Cells.Cell Stem Cell.18,262-275(2016).
43.K.-R.Kieffer-Kwon et al.,Interactome Maps of Mouse Gene RegulatoryDomains Reveal Basic Principles of Transcriptional Regulation.Cell.155,1507-1520(2013).
44.R.A.Beagrie et al.,Complex multi-enhancer contacts captured bygenome architecture mapping.Nature.295,1306(2017).
45.S.S.P.Rao et al.,Cohesin Loss Eliminates All LoopDomains.Cell.171,305-320.e24(2017).
46.W.-K.Cho et al.,RNA Polymerase II cluster dynamics predict mRNAoutput in living cells.Elife.5,1123(2016).
47.N.Kwiatkowski etal.,Targeting transcription regulation in cancerwith a covalent CDK7 inhibitor.Nature.511,616-620(2014).
48.M.Dundr,T.Misteli,Biogenesis of Nuclear Bodies.Cold Spring HarborPerspectives in Biology.2,a000711-a000711(2010).
49.S.Albini et al.,Brahma is required for cell cycle arrest and latemuscle gene expression during skeletal myogenesis.EMBO Rep 16,1037-1050(2015).
50.J.Schindelin et al.,Fiji:an open-source platform for biological-image analysis.Nat Methods 9,676-682(2012).
51.S.Bolte,F.P.Cordelieres,A guided tour into subcellularcolocalization analysis in light microscopy.J Microsc 224,213-232(2006).
52.B.Langmead,C.Trapnell,M.Pop,S.L.Salzberg,Ultrafast and memory-efficient alignment of short DNA sequences to the human genome.Genome Biol10,R25(2009).
53.Y.Zhang et al.,Model-based analysis of ChIP-Seq(MACS).Genome Biol9,R137(2008).
54.W.J.Kent et al.,The human genome browser at UCSC.Genome Res 12,996-1006(2002).
55.W.A.Whyte et al.,Master transcription factors and mediatorestablish super-enhancers at key cell identity genes.Cell 153,307-319(2013).
56.A.R.Quinlan,I.M.Hall,BEDTools:a flexible suite of utilities forcomparing genomic features.Bioinformatics 26,841-842(2010).
57.H.Li et al.,The Sequence Alignment/Map format andSAMtools.Bioinformatics 25,2078-2079(2009).
58.Y.Shin et al.,Spatiotemporal Control of Intracellular PhaseTransitions Using Light-Activated optoDroplets.Cell 168,159-171 e114(2017).
59.F.Gong et al.,Screen identifies bromodomain protein ZMYND8 inchromatin recognition of transcription-associated DNA damage that promoteshomologous recombination.Genes Dev 29,197-211(2015).
实施例3
基因表达是通过由DNA结合域(DBD)和活化域(AD)组成的转录因子(TF)控制。所述DBD已经得到充分表征,但很少知晓使AD实现基因活化的机制。此处,我们报告不同AD与介体共活化子形成相分离的凝聚物。关于OCT4和GCN4 TF,我们显示体外与介体形成相分离的小液滴的能力和体内活化基因的能力依赖于相同氨基酸残基。关于雌激素受体(ER),即配体依赖性活化子,我们显示雌激素会增强与介体的相分离,再次使相分离与基因活化相关。这些结果表明,不同TF可经由其AD的相分离能力与介体相互作用并且具有介体的凝聚物的形成牵涉于基因活化中。
近期研究已经显示酵母TF GCN4的AD在多个位点处并且以多种取向和构象结合于介体亚单元MED15(Brzovic等人,2011;Jedidi等人,2010;Tuttle等人,2018;Warfield等人,2014)。这种类型的蛋白质-蛋白质相互作用的产物已被称作“模糊复合物”,其中相互作用界面无法通过单一构象描述(Tompa和Fuxreiter,2008)。这些动态相互作用还代表促进相分离的生物分子凝聚物的形成的IDR-IDR相互作用(Alberti,2017;Banani等人,2017;Hyman等人,2014;Shin和Brangwynne,2017;Wheeler和Hyman,2018)。
此处,我们报告不同TF AD与介体共活化子相分离。我们显示胚胎干细胞(ESC)多能TF OCT4、雌激素受体(ER)和酵母TF GCN4形成具有介体的相分离的凝聚物并且需要相同氨基酸或配体用于活化和相分离两者。我们显示IDR介导的与共活化子的相分离是TF AD活化基因的机制。
结果
在ESC超级增强子处的介体凝聚物依赖于OCT4
OCT4是ESC的多能状态所必需的主TF并且是在ESC SE处的规定TF(Whyte等人,2013)。在ESC SE处形成凝聚物(Sabari等人,2018)的介体共活化子被认为经由MED1亚单元与OCT4相互作用(表S3)(Apostolou等人,2013)。如果OCT4促进介体凝聚物的形成,那么OCT4色斑应存在于其中已经观察到MED1色斑的SE处。实际上,免疫荧光(IF)显微术和并行新生RNA FISH揭露在关键多能基因Esrrb、Nanog、Trim28和Mir290的SE处的个别OCT4色斑(图20)。平均图像分析确认OCT4 IF在RNA FISH焦点的中心处富集。使用随机选择的核位置未见这种富集(图27)。这些结果确认OCT4出现于其中介体形成凝聚物(Sabari等人,2018)并且其中ChIP-seq显示OCT4和MED1的共占据的相同SE处的色斑中(图20)。
我们使用降解策略来研究存在于SE处的介体凝聚物是否依赖于OCT4(Nabet等人,2018)。携带编码融合至OCT4的FKBP蛋白的DNA的内源基因敲入的ESC株中的OCT4降解通过添加dTag持续24小时来诱导(Weintraub等人,2017)(图21A和28A)。OCT4降解的诱导会降低OCT4蛋白水平,但不会影响MED1水平(图28B)。ChIP-seq分析显示如与典型增强子(TE)相比,增强子处的OCT4和MED1占有率降低,其中最显著效应出现于SE处。(图21B)。RNA-seq揭露SE驱动的基因的表达相伴地减少(图21B)。例如,OCT4和MED1占有率在Nanog SE处降低达大约90%(图21C),与Nanog mRNA水平的60%降低相关(图21D)。免疫荧光(IF)显微术和并行DNA FISH显示OCT4降解会引起Nanog处的MED1凝聚物的降低(图21E和28C)。这些结果指示ESC SE处介体凝聚物的存在依赖于OCT4。
ESC分化会在某些ESC SE处引起OCT4结合的损失,其导致这些OCT4依赖性SE的损失,并且因此应在这些位点处引起介体凝聚物的损失。为了测试这种观念,我们通过LIF戒断使ESC分化。在分化的细胞群体中,我们观察到MiR290SE处降低的OCT4和MED1占有率(图21F、21G和28D)和降低的MiR290miRNA水平(图21H),不过MED1蛋白继续表达(图28E)。相应地,在分化的细胞群体中,Mir290处的MED1凝聚物降低(图21I和28F)。这些结果与使用OCT4降解决定子实验所获得的那些一致并且支持如下观念,即这些ESC SE处的介体凝聚物依赖于增强子元件的OCT4占有率。
OCT4并入至MED1液体小液滴中
OCT4具有负责基因活化的两个固有无序AD,其侧接结构化DBD(图22A)(Brehm等人,1997)。由于IDR能够形成微弱相互作用的动态网络,并且牵涉于凝聚物形成中的蛋白质的纯化的IDR可形成相分离的小液滴(Burke等人,2015;Lin等人,2015;Nott等人,2015),我们接着研究OCT4是否能够在具有和不具有介体的MED1亚单元的IDR的情况下形成体外小液滴。
重组OCT4-GFP融合蛋白是纯化的并且添加至含有拥挤剂(10%PEG-8000)的小液滴形成缓冲液中以刺激细胞核的致密拥挤化环境。小液滴混合物的荧光显微术揭露单独OCT4不会在所测试浓度的范围内形成小液滴(图22B)。相比之下,如先前所述(Sabari等人,2018),纯化的重组MED1-IDR-GFP融合蛋白展现浓度依赖性液体-液体相分离(图22B)。
我们接着使所述两种蛋白质混合并且发现MED1-IDR小液滴并入并且浓缩纯化的OCT4-GFP以形成异型小液滴(图22C)。相比之下,纯化的GFP未浓缩至MED1-IDR小液滴中(图22C、29A)。OCT4-MED1-IDR小液滴是近微米大小化的(图29B),展现光漂白之后的快速恢复(图22D)、球形形状(图29C),并且是盐敏感性的(图22E和29D)。因此,其展现与相分离的液体凝聚物相关的特征(Banani等人2017;Shin等人2017)。此外,我们发现OCT4-MED1-IDR小液滴可能在任何拥挤剂不存在下形成(图29E和29F)。
OCT4-MED1-IDR小液滴形成和基因活化所需的残基
我们接着研究特异性OCT4氨基酸残基是否是OCT4-MED1-IDR相分离的小液滴的形成所需的,因为氨基酸相互作用的多种类别已牵涉于形成凝聚物中。例如,丝氨酸残基是MED1相分离所需的(Sabari等人,2018)。我们询问OCT4 AD中的氨基酸富集是否可能指向相互作用的机制。氨基酸频率和电荷偏移的分析显示OCT4 IDR在脯氨酸和甘氨酸中富集,并且具有总体酸性电荷(图23A)。已知AD在酸性氨基酸和脯氨酸中富集,并且历史上以这一基础进行分类(Frietze和Farnham,2011),但这些富集可能引起基因活化的机制尚未可知。我们假设AD中的脯氨酸或酸性氨基酸可能促进与相分离的MED1-IDR小液滴的相互作用。为了测试这种假设,我们设计经荧光标记的脯氨酸和谷氨酸十肽并且研究这些肽是否可在MED1-IDR小液滴中浓缩。当添加至单独小液滴形成缓冲液中时,这些肽保持于溶液中(图30A)。然而,当与MED1-IDR-GFP混合时,脯氨酸肽未并入至MED1-IDR小液滴中,而谷氨酸肽浓缩于其中(图23B和30B)。这些结果显示出,具有酸性残基的肽顺从并入于MED1相分离的小液滴内。
基于这些结果,我们推断AD中缺乏酸性氨基酸的OCT4蛋白可能在其与MED1-IDR相分离的能力方面存在缺陷。对酸性残基的所述依赖性将与如下观察结果一致,即OCT4-MED1-IDR小液滴是高度盐敏感性的。为了测试这一观念,我们产生突变型OCT4,其中AD中的所有酸性残基均由丙氨酸置换(因此使N端AD中的17个AA和C端AD中的6个发生变化)(图23C)。当这种GFP融合的OCT4突变体与纯化的MED1-IDR混合时,进入小液滴中会高度减弱(图23C和30C)。为了测试这一效应是否对酸性残基具特异性,我们产生OCT4突变体,其中AD内的所有芳香族氨基酸均变化为丙氨酸。我们发现这种突变体仍并入至MED1-IDR小液滴中(30C和30D)。这些结果指示OCT4与MED1-IDR相分离的能力依赖于OCT4 IDR中的酸性残基。
为了确保这些结果未对MED1-IDR具特异性,我们研究纯化的介体复合物是否将形成体外小液滴并且并入OCT4。人类介体复合物如先前所述(Meyer等人,2008)进行纯化并且接着浓缩用于小液滴形成测定(图30E)。因为纯化的内源介体不含荧光标签,我们通过微分干涉相差(DIC)显微术监测小液滴形成并且发现其在约200-400nM下形成单独小液滴(图23D)。与关于MED1-IDR小液滴的结果一致,OCT4并入于人类介体复合物小液滴中,但OCT4酸性突变型的并入减弱。这些结果指示MED1-IDR和完全介体复合物各自展现相分离行为并且表明其均以依赖于由酸性氨基酸提供的静电相互作用的方式并入OCT4。
为了测试OCT4 AD酸性突变是否会影响所述因子在体内活化转录的能力,我们使用GAL4反式活化测定(图23E)。在这一系统中,AD或其突变型配对物融合至GAL4DBD并且表达于携带荧光素酶报告基因质粒的细胞中。我们发现融合至GAL4-DBD的野生型OCT4-AD能够活化转录,而酸性突变体丧失这种功能(图23E)。这些结果指示OCT4AD的酸性残基是在体外并入至MED1相分离的小液滴中和体内基因活化两者所必需的。
多种TF与介体亚单元小液滴相分离
具有不同类型的AD的TF已经显示与介体亚单元相互作用,并且MED1在主要由TF靶向的亚单元当中(表S3)。哺乳动物TF的分析确认了TF和其推定AD在IDR中富集,如先前分析已经显示(Liu等人,2006;Staby等人,2017b)(图24A)。我们推断,多种不同TF可能与MED1-IDR相互作用以产生液体小液滴并且因此并入至MED1凝聚物中。为了评估不同MED1相互作用转录因子是否可与MED1进行相分离,我们制备纯化的重组、经mEGFP标记、全长MYC、p53、NANOG、SOX2、RARa、GATA2和ER(表S5)。当添加至小液滴形成缓冲液中时,大多数TF形成单独小液滴(图24B)。当添加至具有MED1-IDR的小液滴形成缓冲液中时,这些TF中的全部7者均浓缩至MED1-IDR小液滴中(图24C、31A)。我们选择p53小液滴用于FRAP分析;其展现快速和动态内部重组(图31B),从而支持以下观念,即其为液体凝聚物。这些结果指示出,先前显示与介体的MED1亚单元相互作用的TF可通过与MED1形成相分离的凝聚物而如此。
雌激素刺激雌激素受体与MED1的相分离
雌激素受体(ER)是配体依赖性TF的充分研究的实例。ER由N端配体独立AD、中央DBD和C端配体依赖性AD(也称作配体结合域(LBD))组成(图25A)。雌激素通过结合ER的LBD而促进ER与MED1的相互作用,所述LBD使MED1-IDR内的LXXLL基序的结合袋暴露(图25A和25B)(Manavathi等人,2014)。我们注意到ER可与迄今用于这些研究中的MED1-IDR重组蛋白形成异型小液滴(图24C),所述重组蛋白缺乏LXXLL基序。这使我们研究ER-MED1小液滴形成是否可响应于雌激素并且这是否涉及MED1LXXLL基序。
我们使用含有LXXLL基序的MED1-IDR重组蛋白(MED1-IDRXL-mCherry)执行小液滴形成测定并且发现与MED1-IDR和完全介体相似,其具有形成单独小液滴的能力(图25C)。我们接着测试ER与MED1-IDRXL-mCherry和MED1-IDR-mCherry小液滴进行相分离的能力。一些重组ER并入并且浓缩至MED1-IDRXL-mCherry小液滴中,但雌激素的添加显著地增强异型小液滴形成(图25D和25E)。相比之下,当所述实验用缺乏LXXLL基序的MED1-IDR-mCherry进行时,雌激素的添加对小液滴形成具有很少影响(图32)。这些结果显示出,刺激ER介导的体内转录的雌激素还刺激ER在体外并入至MED1-IDR小液滴中。因此,OCT4和ER两者需要相同氨基酸/配体用于相分离和活化两者。此外,由于LBD是在雌激素结合时经历构象转变以与MED1相互作用的结构化域,看来结构化相互作用可促进转录凝聚物形成。
GCN4和MED15相分离依赖于活化所需的残基
酵母TF GCN4和其与介体的MED15亚单元的相互作用是在最佳研究的TF-共活化子系统中(Brzovic等人,2011;Herbig等人,2010;Jedidi等人,2010)。GCN4 AD已经进行遗传学解剖,促进活化的氨基酸已经得到鉴定(Drysdale等人,1995;Staller等人,2018),并且近期研究已经显示GCN4 AD以多种取向和构象与MED15相互作用以形成“模糊复合物”(Tuttle等人,2018)。形成模糊复合物的微弱相互作用具有IDR-IDR相互作用的特征,所述IDR-IDR相互作用被认为产生相分离的凝聚物。
为了测试GCN4和MED15是否可形成相分离的小液滴,我们纯化重组酵母GCN4-GFP和含有残基6-651的酵母MED15-mCherry的N端部分(下文称作MED15),其负责与GCN4的相互作用。当独立地添加至小液滴形成缓冲液中时,GCN4仅在极高浓度(40uM)下形成微米大小的小液滴,并且MED15在这一高浓度下仅形成小型小液滴(图26A)。然而,当混合在一起时,GCN4和MED15重组蛋白在较低浓度下形成双重阳性、微米大小、球形小液滴(图26B、33A)。这些GCN4-MED15小液滴展现快速FRAP动力学(图33B),与液体样行为一致。我们产生这两种蛋白质的相图,并且发现其在低浓度下一起形成小液滴(图33C和33D)。这表明两者之间的相互作用是低浓度下的相分离所需的。
GCN4与MED15相互作用并且活化基因表达的能力已经归因于GCN4 AD中的特异性疏水性补丁和芳香族残基(Drysdale等人,1995;Staller等人,2018;Tuttle等人,2018)。我们产生GCN4突变体,其中含于这些疏水性补丁中的11种芳香族残基变化为丙氨酸(图26C)。当添加至小液滴形成缓冲液中时,所述突变型蛋白质形成单独小液滴的能力减弱(图33E)。接着,我们测试使用MED15的小液滴形成是否受到影响;实际上,所述突变型蛋白质具有受损害的与MED15形成小液滴的能力(图26C和33F)。当GCN4和GCN4的芳香族突变体添加至具有完全介体复合物的小液滴形成缓冲液中时,获得相似结果;当GCN4并入至介体小液滴中时,GCN4突变体并入至介体小液滴中被减弱(图26D和33G)。这些结果证明了GCN4和MED15的AD之间的多价、微弱相互作用会促进相分离至液体样小液滴中。
酵母TF的AD可用于哺乳动物细胞中并且可通过与人类介体相互作用而如此(Oliviero等人,1992)。为了研究GCN4 AD的芳香族突变体在体内募集介体的能力是否受损,将GCN4 AD和GCN4突变体AD系栓至U2OS细胞中的Lac阵列(图26E)(Janicki等人,2004)。虽然系栓的GCN4 AD会引起稳固介体募集,GCN4芳香族突变体却不会(图26E)。我们使用先前所述的GAL4反式活化测定来确认GCN4 AD能够进行体内转录活化,而GCN4芳香族突变体已经失去那种特性(图26F)。这些结果提供对于如下观念的进一步支持,即与介体进行相分离所必需的TF AD氨基酸是基因活化所需的。
论述
此处所述的结果支持如下模型,由此TF与介体相互作用并且通过其AD与这种共活化子形成相分离的凝聚物的能力活化基因。关于哺乳动物ESC多能TF OCT4和酵母TF GCN4两者,我们发现与介体凝聚物进行相分离所需的AD氨基酸也是体内基因活化所需的。关于雌激素受体,我们发现雌激素刺激相分离的ER-MED1小液滴的形成。AD和共活化子一般由已经分类为IDR的低复杂度氨基酸序列组成,并且IDR-IDR相互作用已牵涉于促进相分离的凝聚物的形成中。我们建议IDR介导的与介体的相分离是TF AD实现基因活化的一般机制,并且提供其在体内出现于SE处的证据。我们建议与介体进行相分离的能力(其将使用液体-液体相分离凝聚物所特有的高价态和低亲和力特征)连同一些TF与介体形成高亲和力相互作用的能力起作用(图26G)(Taatjes,2017)。
TF AD通过与共活化子形成相分离的凝聚物而起作用的模型解释了难以与蛋白质-蛋白质相互作用的经典锁钥模型一致的数项观察结果。哺乳动物基因组编码数百种TF,所述TF具有必须与极少数目的共活化子相互作用的不同AD(Allen和Taatjes,2015;Arany等人,1995;Avantaggiati等人,1996;Dai和Markham,2001;Eckner等人,1996;Gelman等人,1999;Green,2005;Liu等人,2009;Merika等人,1998;Oliner等人,1996;Yin和Wang,2014;Yuan等人,1996),并且在TF中,共享极少序列同源性的AD在功能上可互换(Godowski等人,1988;Hope和Struhl,1986;Jin等人,2016;Lech等人,1988;Ransone等人,1990;Sadowski等人,1988;Struhl,1988;Tora等人,1989)。AD的最常见特征(具有低复杂度IDR)也是共活化子中显著的特征。通过相分离的凝聚物形成实现共活化子相互作用和基因活化的模型因此更容易地解释有几百种哺乳动物TF与这些共活化子相互作用。
先前研究已经提供促使我们研究TF AD通过形成相分离的凝聚物而起作用的可能性的重要见解。TF AD已经通过其氨基酸概况分类为酸性、富脯氨酸、富丝氨酸/苏氨酸、富谷酰胺,或通过其假设形状分类为酸斑、阴性长链或肽套索(Sigler,1988)。这些特征中的一些已经关于能够形成相分离的凝聚物的IDR加以描述(Babu,2016;Darling等人,2018;Das等人,2015;Dunker等人,2015;Habchi等人,2014;van der Lee等人,2014;Oldfield和Dunker,2014;Uversky,2017;Wright和Dyson,2015)。GCN4 AD以多种取向和构象与MED15相互作用以形成“模糊复合物”(Tuttle等人,2018)的证据与相分离的凝聚物所特有的动态低亲和力相互作用的观念一致。同样,FET(FUS/EWS/TAF15)RNA-结合蛋白的低复杂度域(Andersson等人,2008)可形成相分离的水凝胶并且以CTD磷酸化依赖性方式与RNA聚合酶II C端域(CTD)相互作用(Kwon等人,2013);这可解释使RNA聚合酶II被募集以活化呈非磷酸化状态的基因并且被释放用于CTD磷酸化之后的延伸的机制。
我们在此处关于TF AD功能描述的模型可解释一类迄今知之甚少的融合致癌蛋白的功能。多种恶性肿瘤携带涉及TF的部分的融合蛋白易位(Bradner等人,2017;Kim等人,2017;Latysheva等人,2016)。这些异常基因产物通常将DNA或染色质结合域融合至多种搭配物,所述搭配物中的一些是IDR。例如,MLL在AML中可融合至80种不同搭配物基因(Winters和Bernt,2017),尤文氏肉瘤中的EWS-FLI重排会通过将无序域募集至致癌基因而引起恶性转化(Boulay等人,2017;Chong等人,2017),并且无序相分离蛋白FUS在某些肉瘤中被发现融合至DBD(Crozat等人,1993;Patel等人,2015)。相分离会提供所述基因产物导致异常基因表达程序的机制;通过将无序蛋白募集至染色质,不同共活化子可形成相分离的凝聚物以驱动致癌基因表达。理解构成这些异常转录凝聚物的相互作用、其结构和行为可开拓新治疗方法。
参考文献
Alberti,S.(2017).The wisdom of crowds:regulating cell functionthrough condensed states of living matter.J.Cell Sci.130,2789-2796.
Allen,B.L.,and Taatjes,D.J.(2015).The Mediator complex:a centralintegrator of transcription.Nat.Rev.Mol.Cell Biol.16,155-166.
Andersson,M.K.,
Figure BDA0002792767850002001
A.,Arvidsson,Y.,Olofsson,A.,Semb,H.,Stenman,G.,Nilsson,O.,and
Figure BDA0002792767850002003
P.(2008).The multifunctional FUS,EWS and TAF15 proto-oncoproteins show cell type-specific expression patterns and involvement incell spreading and stress response.BMC Cell Biol.9,37.
Apostolou,E.,Ferrari,F.,Walsh,R.M.,Bar-Nur,O.,Stadtfeld,M.,Cheloufi,S.,Stuart,H.T.,Polo,J.M.,Ohsumi,T.K.,Borowsky,M.L.,et al.(2013).Genome-widechromatin interactioins of the Nanog locus in pluripotency,differentiation,and reprogramming.Cell Stem Cell 12,699-712.
Arany,Z.,Newsome,D.,Oldread,E.,Livingston,D.M.,and Eckner,R.(1995).Afamily of transcriptional adaptor proteins targeted by the E1Aoncoprotein.Nature 374,81-84.
Avantaggiati,M.L.,Carbone,M.,Graessmann,A.,Nakatani,Y.,Howard,B.,andLevine,A.S.(1996).The SV40 large T antigen and adenovirus E1a oncoproteinsinteract with distinct isoforms of the transcriptional co-activator,p300.EMBOJ.15,2236-2248.
Babu,M.M.(2016).The contribution of intrinsically disordered regionsto protein function,cellular complexity,and humandisease.Biochem.Soc.Trans.44,1185-1200.
Banani,S.F.,Lee,H.O.,Hyman,A.A.,and Rosen,M.K.(2017).Biomolecularcondensates:organizers of cellular biochemistry.Nat.Rev.Mol.Cell Biol.18,285-298.
Boulay,G.,Sandoval,G.J.,Riggi,N.,Iyer,S.,Buisson,R.,Naigles,B.,Awad,M.E.,Rengarajan,S.,Volorio,A.,McBride,M.J.,et al.(2017).Cancer-SpecificRetargeting of BAF Complexes by a Prion-like Domain.Cell 171,163-178.e19.
Bradner,J.E.,Hnisz,D.,and Young,R.A.(2017).Transcriptional Addictionin Cancer.
Brehm,A.,Ohbo,K.,and
Figure BDA0002792767850002002
H.(1997).The carboxy-terminaltransactivation domain of Oct-4acquires cell specificity through the POUdomain.Mol.Cell.Biol.17,154-162.
Brent,R.,and Ptashne,M.(1985).A eukaryotic transcriptional activatorbearing the DNA specificity of a prokaryotic repressor.Cell 43,729-736.
Brzovic,P.S.,Heikaus,C.C.,Kisselev,L.,Vernon,R.,Herbig,E.,Pacheco,D.,Warfield,L.,Littlefield,P.,Baker,D.,Klevit,R.E.,et al.(2011).The acidictranscription activator Gcn4 binds the mediator subunit Gal11/Med15 using asimple protein interface forming a fuzzy complex.Mol.Cell 44,942-953.
Burke,K.A.,Janke,A.M.,Rhine,C.L.,and Fawzi,N.L.(2015).Residuc-by-Residue View of In Vitro FUS Granules that Bind the C-Terminal Domain of RNAPolymerase II.Mol.Cell 60,231-241.
Chong,S.,Dugast-darzacq,C.,Liu,Z.,Dong,P.,and Dailey,G.M.(2017).Dynamic and Selective Low-Complexity Domain Interactions Revealed by Live-Cell Single-Molecule Imaging.Bioarxiv.
Crozat,A.,
Figure BDA0002792767850002011
P.,Mandahl,N.,and Ron,D.(1993).Fusion of CHOP to anovel RNA-binding protein in human myxoid liposarcoma.Nature 363,640-644.
Dai,Y.S.,and Markham,B.E.(2001).p300 Functions as a coactivator oftranscription factor GATA-4.J.Biol.Chem.276,37178-37185.
Darling,A.L.,Liu,Y.,Oldfield,C.J.,and Uversky,V.N.(2018).Intrinsically Disordered Proteome of Human Membrane-LessOrganelles.Proteomics18,1700193.
Das,R.K.,Ruff,K.M.,and Pappu,R.V(2015).Relating sequence encodedinformation to form and function of intrinsically disordered proteins.Curr.Opin.Struct.Biol.32,102-112.
Drysdale,C.M.,
Figure BDA0002792767850002012
E.,Jackson,B.M.,Reusser,U.,Braus,G.H.,andHinnebusch,A.G.(1995).The transcriptional activator GCN4 contains multipleactivation domains that are critically dependent on hydrophobic aminoacids.Mol.Cell.Biol.15,1220-1233.
Dunker,A.K.,Bondos,S.E.,Huang,F.,and Oldfield,C.J.(2015).Intrinsically disordered proteins and multicellular organisms.Semin.CellDev.Biol.37,44-55.
Eckner,R.,Yao,T.P.,Oldread,E.,and Livingston,D.M.(1996).Interactionand functional collaboration of p300/CBP and bHLH proteins in muscle and B-cell differentiation.Genes Dev.10,2478-2490.
Frietze,S.,and Farnham,P.J.(2011).Transcription factor effectordomains.Subcell.Biochem.52,261-277.
Fulton,D.L.,Sundararajan,S.,Badis,G.,Hughes,T.R.,Wasserman,W.W.,Roach,J.C.,and Sladek,R.(2009).TFCat:the curated catalog of mouse and humantranscription factors.Genome Biol.10,R29.
Gelman,L.,Zhou,G.,Fajas,L.,Raspé,E.,Fruchart,J.C.,and Auwerx,J.(1999).p300 interacts with the N-and C-terminal part of PPARgamma2 in aligand-independent and-dependent manner,respectively.J.Biol.Chem.274,7681-7688.
Godowski,P.J.,Picard,D.,and Yamamoto,K.R.(1988).Signal transductionand transcriptional regulation by glucocorticoid receptor-LexA fusionproteins.Science 241,812-816.
Green,M.R.(2005).Eukaryotic Transcription Activation:Right onTarget.Mol.Cell 18,399-402.
Habchi,J.,Tompa,P.,Longhi,S.,and Uversky,V.N.(2014).IntroducingProtein Intrinsic Disorder.Chem.Rev.114,6561-6588.
Herbig,E.,Warfield,L.,Fish,L.,Fishburn,J.,Knutson,B.A.,Moorefield,B.,Pacheco,D.,and Hahn,S.(2010).Mechanism of Mediator Recruitment by Tandem Gcn4Activation Domains and Three Gal11 Activator-BindingDomains.Mol.Cell.Biol.30,2376-2390.
Hnisz,D.,Shrinivas,K.,Young,R.A.,Chakraborty,A.K.,and Sharp,P.A.(2017).Perspective A Phase Separation Model for TranscriptionalControl.Cell169,13-23.
Holehouse,A.S.,Das,R.K.,Ahad,J.N.,Richardson,M.O.G.,and Pappu,R.V(2017).CIDER:Resources to Analyze Sequence-Ensemble Relationships ofIntrinsically Disordered Proteins.Biophys.J.112,16-21.
Hope,I.A.,and Struhl,K.(1986).Functional dissection of a eukaryotictranscriptional activator protein,GCN4 of yeast.Cell 46,885-894.
Hume,M.A.,Barrera,L.A.,Gisselbrecht,S.S.,and Bulyk,M.L.(2015).UniPROBE,update 2015:new tools and content for the online database ofprotein-binding microarray data on protein-DNA interactions.Nucleic AcidsRes.43,D117-D122.
Hyman,A.A.,Weber,C.A.,and Jülicher,F.(2014).Liquid-Liquid PhaseSeparation in Biology.Annu.Rev.Cell Dev.Biol.30,39-58.
Janicki,S.M.,Tsukamoto,T.,Salghetti,S.E.,Tanscy,W.P.,Sachidanandam,R.,Prasanth,K.V,Ried,T.,Shav-Tal,Y.,Bertrand,E.,Singer,R.H.,et al.(2004).Fromsilencing to gene expression:real-time analysis in single cells.Cell 116,683-698.
Jedidi,I.,Zhang,F.,Qiu,H.,Stahl,S.J.,Palmer,I.,Kaufman,J.D.,Nadaud,P.S.,Mukherjee,S.,Wingfield,P.T.,Jaroniec,C.P.,et al.(2010).Activator Gcn4employs multiple segments of Med15/Gal11,including the KIX domain,to recruitmediator to target genes in vivo.J.Biol.Chem.285,2438-2455.
Jin,W.,Wang,L.,Zhu,F.,Tan,W.,Lin,W.,Chen,D.,Sun,Q.,and Xia,Z.(2016).Critical POU domain residues confer Oct4 uniqueness in somatic cellreprogramming.Sci.Rep.6,20818.
Jolma,A.,Yan,J.,Whitington,T.,Toivonen,J.,Nitta,K.R.,Rastas,P.,Morgunova,E.,Enge,M.,Taipale,M.,Wei,G.,et al.(2013).DNA-Binding Specificitiesof Human Transcription Factors.Cell 152,327-339.
Juven-Gershon,T.,and Kadonaga,J.T.(2010).Regulation of geneexpression via the core promoter and the basal transcriptionalmachinery.Dev.Biol.339,225-229.
Keegan,L.,Gill,G.,and Ptashne,M.(1986).Separation of DNA binding fromthe transcription-activating function of a eukaryotic regulatoryprotein.Science 231,699-704.
Khan,A.,Fornes,O.,Stigliani,A.,Gheorghe,M.,Castro-Mondragon,J.A.,vander Lee,R.,Bessy,A.,Chèneby,J.,Kulkarni,S.R.,Tan,G.,et al.(2018).JASPAR 2018:update of the open-access database of transcription factor binding profilesand its web framework.Nucleic Acids Res.46,D260-D266.
Kim,P.,Ballester,L.Y.,and Zhao,Z.(2017).Domain retention intranscription factor fusion genes and its biological and clinicalimplications:a pan-cancer study.Oncotarget 8,110103-110117.
Latysheva,N.S.,Oates,M.E.,Maddox,L.,Buljan,M.,Weatheritt,R.J.,MadanBabu,M.,Flock,T.,and Gough,J.(2016).Molecular Principles of Gene FusionMediated Rewiring of Protein Interaction Networks in Cancer.Mol.Cell 63,579-592.
Lech,K.,Anderson,K.,and Brent,R.(1988).DNA-bound Fos proteinsactivate transcription in yeast.Cell 52,179-184.
van der Lee,R.,Buljan,M.,Lang,B.,Weatheritt,R.J.,Daughdrill,G.W.,Dunker,A.K.,Fuxreiter,M.,Gough,J.,Gsponer,J.,Jones,D.T.,et al.(2014).Classification of intrinsically disordered regions andproteins.Chem.Rev.114,6589-6631.
Lin.Y.,Protter,D.S.W.,Rosen,M.K.,and Parker,R.(2015).Formation andMaturation of Phase-Separated Liquid Droplets by RNA-BindingProteins.Mol.Cell 60,208-219.
Liu,J.,Perumal,N.B.,Oldfield,C.J.,Su,E.W.,Uversky,V.N.,and Dunker,A.K.(2006).Intrinsic Disorder in Transcription Factors
Figure BDA0002792767850002041
Biochemistry 45,6873-6888.
Liu,W.-L.,Coleman,R.A.,Ma,E.,Grob,P.,Yang,J.L.,Zhang,Y.,Dailey,G.,Nogales,E.,and Tjian,R.(2009).Structures of three distinct activator-TFIIDcomplexes.Genes Dev.23,1510-1521.
Malik,S.,and Roeder,R.G.(2010).The metazoan Mediator co-activatorcomplex as an integrative hub for transcriptionalregulation.Nat.Rev.Genet.11,761-772.
Manavathi,B.,Samanthapudi,V.S.K.,and Gajulapalli,V.N.R.(2014).Estrogen receptor coregulators and pioneer factors:the orehestrators ofmammary gland cell fate and development.Front.Cell Dev.Biol.2,34.
Merika,M.,Williams,A.J.,Chen,G.,Collins,T.,and Thanos,D.(1998).Recruitment of CBP/p300 by the IFN beta enhanceosome is required forsynergistic activation of transcription,Mol,Cell 1,277-287.
Meyer,K.D.,Donner,A.J.,Knuesel,M.T.,York,A.G.,Espinosa,J.M.,andTaatjes,and D.J.(2008).Cooperative activity of cdk8 and GCN5L within Mediatordirects tandem phosphoacetylation of histone H3.EMBO J.27,1447-1457.
Mitchell,P.J.,and Tjian,R.(1989).Transcriptional regulation inmammalian cells by sequence-specific DNA binding prateins.Science 245,371-378.
Nabet,B.,Roberts,J.M.,Buckley,D.L.,Paulk,J.,Dastjerdi,S.,Yang,A.,Leggett,A.L.,Erb,M.A.,Lawlor,M.A.,Souza,A.,et al.(2018).The dTAG system forimmediate and target-specific protein degradation.Nat.Chem.Biol.14,431-441.
Nott,T.J.,Petsalaki,E.,Farber,P.,Jervis,D.,Fussner,E.,Plochowietz,A.,Craggs,T.D.,Bazett-Jones,D.P.,Pawson,T.,Forman-Kay,J.D.,et al.(2015).PhaseTransition of a Disordered Nuage Protein Generates Environmentally ResponsiveMembraneless Organelles.Mol.Cell 57,936-947.
Oates,M.E.,Romero,P.,Ishida,T.,Ghalwash,M.,Mizianty,M.J.,Xue,B.,Dosztányi,Z.,Uversky,V.N.,Obradovic,Z.,Kurgan,L.,et al.(2013).D2P2:database ofdisordered protein predictions.Nucleic Acids Res.41,D508-16.
Oldfield,C.J.,and Dunker,A.K.(2014).Intrinsically Disordered Proteinsand Intrinsically Disordered Protein Regions.Annu.Rev.Biochem.83,553-584.
Oliner,J.D.,Andresen,J.M.,Hansen,S,K.,Zhou,S.,and Tjian,R.(1996).SREBP transcriptional activity is mediated through an interaction with theCREB-binding protein.Genes Dev.10,2903-2911.
Oliviero,S.,Robinson,G.S.,Struhl,K.,and Spiegelman,B.M.Yeast GCN4 asa probe for oncogenesis by AP-1.transcription factors:transcnpuonalactivation through AP-1 sites is not sufficient for cellular transformation.
Panne,D.,Maniatis,T.,and Harrison,S.C.(2007).An Atomic Model of theInterferon-βEnhanceosome.Cell 129,1111-1123.
Patel,A.,Lee,H.O.,Jawerth,L.,Maharana,S.,Jahnel,M.,Hein,M.Y.,Stoynov,S.,Mahamid,J.,Saha,S.,Franzmann,T.M.,et al.(2015).A Liquid-to-Solid PhaseTransition of the ALS Protein FUS Accelerated by Disease Mutation.Cell 162,1066-1077.
Plaschka,C.,Nozawa,K.,and Cramer,P.(2016).Mediator Architecture andRNA Polymerase II Interaction.J.Mol.Biol.428,2569-2574.
Ransone,L.J.,Wamsley,P.,Morley,K.L,and Verma,I.M.(1990).Domainswapping reveals the modular nature of Fos,Jun,and CREBproteins.Mol.Cell.Biol.10,4565-4573.
Reiter,F.,Wienerroither,S.,and Stark,A.(2017).Combinatorial functionof transcription factors and cofactors.Curr.Opin.Genet.Dev.43,73-81.
Roberts,S.G.(2000).Mechanisms of action of transcription activationand repression domains.Cell.Mol.Life Sci.57,1149-1160.
Sabari,B.,Dall’Agnese,A.,Boija,A.,Klein,I.A.,Coffey,E.L.,Shrinivas,K.,Abraham,B.J.,Hannett,N.M.,Zamudio,A.V.,Manteiga,J.,et al.(2018).Coactivator condensation at super-enhancers links phase separation and genecontrol.Science(80-.).
Sadowski,I.,Ma,J.,Trieezenberg,S.,and Ptashne,M.(1988).GAL4-VP16 isan unusually potent transcriptional activator.Nature 335,563-564.
Saint-andré,V.,Federation,A.J.,Lin,C.Y.,Abraham,B.J.,Reddy,J.,Lee,T.I.,Bradner,J.E.,and Young,R.A.Models of human core transcriptionalregulatory circuitries.385-396.
Shin,Y.,and Brangwynne,C.P.(2017).Liquid phase condensation in cellphysiology and disease.Science(80-.).357,eaaf4382.
Sigler,P.B.(1988).Acid blobs and negative noodles.Nature 333,210-212.
Soutourina,J.(2017),Transcription regulation by the Mediatorcomplex.Nat.Rev.Mol.Cell Biol.19,262-274.
Staby,L.,O’Shea,C.,
Figure BDA0002792767850002061
M.,Theisen,F.,Kragelund,B.B.,and Skriver,K.(2017a).Eukaryotic transcription factors:paradigms of protein intrinsicdisorder.Biochem.J.474,2509-2532.
Staby,L.,O’Shea,C.,
Figure BDA0002792767850002062
M.,Theisen,F.,Kragelund,B.B.,and Skriver,K.(2017b).Eukaryotic transcription factors:paradigms of protein intrinsicdisorder.Biochem.J.474,2509-2532.
Staller,M.V.,Holehouse,A.S.,Swain-Lenz,D.,Das,R.K.,Pappu,R.V.,andCohen,B.A.(2018).A High-Throughput Mutational Scan of an IntrinsicallyDisordered Acidic Transcriptional Activation Domain.Cell Syst.6,444-455.e6.
Struhl,K.(1988).The JUN oncoprotein,a vertebrate transcriptionfactor,activates transcription in yeast.Nature 332,649-650.
Taatjes,D.J.(2010).The human Mediator complex:a versatile,genome-wideregulator of transcription.Trends Biochem.Sci.35,315-322.
Taatjes,D.J.(2017).Transcription Factor-Mediator Interfaces:Multipleand Multi-Valent.J.Mol.Biol.429,2996-2998.
Tompa,P.,and Fuxreiter,M.(2008).Fuzzy complexes:polymorphism andstructural disorder in protein-protein interactions.Trends Biochem.Sci.33,2-8.
Tora,L.,White,J.,Brou,C.,Tasset,D.,Webster,N.,Scheer,E.,and Chambon,P.(1989).The human estrogen receptor has two independent nonacidictranscriptional activation functions.Cell 59,477-487.
Triezenberg,S.J.(1995).Structure and funetion of transcriptionalactivation domains.Curr.Opin.Genet.Dev.5,190-196.
Tuttle,L.M.,Pacheco,D.,Warfield,L.,Luo,J.,Ranish,J.,Hahn,S.,andKlevit,R.E.(2018).Gcn4-Mediator Specificity Is Mediated by a Large andDynamic Fuzzy Protein-Protein Complex.Cell Rep.22,3251-3264.
Uversky,V.N.(2017).Intrinsically disordered proteins in overcrowdedmilieu:Membrane-less organelles,phase separation,and intrinsic disorder.Curr.Opin.Struct.Biol.44,18-30.
Vaquerizas,J.M.,Kummerfeld,S.K.,Teichmann,S.A.,and Luscombe,N.M.(2009).A census of human transcription factors:function,expression andevolution.Nat.Rev.Genet.10,252-263.
Warfield,L.,Tuttle,L.M.,Pacheco,D.,Klevit,R.E.,and Hahn,S.(2014).Asequence-specific transcription activator motif and powerful syntheticvariants that bind Mediator using a fuzzy protein interface.Proc.Natl.Acad.Sci.111,E3506-E3513.
Weintraub,A.S.,Li,C.H.,Zamudio,A.V.,Sigova,A.A.,Hannett,N.M.,Day,D.S.,Abraham,B.J.,Cohen,M.A.,Nabet,B.,Buckley,D.L.,et al.(2017).YY1 Is aStructural Regulator of Enhancer-Promoter Loops.Cell 171,1573-1588.e28.
Wheeler,R.J.,and Hyman,A.A.(2018).Controlling compartmentalization bynon-membrane-bound organelles.Philos.Trans.R.Soc.Lond.B.Biol.Sci.373.
Whyte,W.A.,Orlando,D.A.,Hnisz,D.,Abraham,B.J.,Lin,C.Y.,Kagey,M.H.,Rahl,P.B.,Lee,T.I.,and Young,R.A.(2013).Master transcription factors andmediator establish super-enhancers at key cell identity genes.Cell 153,307-319.
Winters,A.C.,and Bernt,K.M.(2017).MLL-Rearranged Leukemias-An Updateon Science and Clinical Approaches.Front.Pediatr.5,4.
Wright,P.E.,and Dyson,H.J.(2015).Intrinsically disordered proteins incellular signalling and regulation.Nat.Rev.Mol.Cell Biol.16,18-29.
Yin,J.,and Wang,G.(2014).The Mediator complex:a master coordinator oftranscription and cell lineage development.Development 141,977-987.
Yuan,W.,Condorelli,G.,Caruso,M.,Felsani,A.,and Giordano,A.(1996).Human p300 protein is a coactivator for the transcription factorMyoD.J.Biol.Chem.271,9009-9013.
表S3.所报告的转录因子-介体亚单元相互作用的表。
Figure BDA0002792767850002081
根据Borggrefe及Xae,201157进行修改。
表中所引用的参考文献
1.Apostolou,E.et al.Genome-wide chromatin interactions of the Nanoglocus in pluripotency,differentiation,and reprogramming.Cell Stem Cell12,699-712(2013).
2.Gordon,D.F.et al.MED220/thyroid receptor-associated protein 220functions as a transcriptional coactivator with Pit-1 and GATA-2 on thethyrotropin-beta promoter in thyrotropes,Mol.Endocrinol.20,1073-89(2006).
3.Liu,X.,Vorontchikhina,M.,Wang,Y.-L.,Faiola.F.&Martinez,E.STAGArecruits Mediator to the MYC oncoprotein to stimulate transcription and cellprolifertion.Mol.Cell.Biol.28,108-21(2008).
4.Meyer,K.D.,Lin,S.,Bernecky,C.,Gao,Y.&Taatjes,D.J.p53 activatestranscription by directing structural shifts inMediator.Nat.Struct.Mol.Biol.17,753-760(2010).
5.Drané,P.,Barel,M.,Balbo,M.&Frade,R.Identification of RB18A,a 205kDanew p53 regulatory protein which shares antigenic and functional propertieswith p53.Oncogene 15,3013-3024(1997).
6.Frade,R.,Balbo,M.&Barel,M.RB18A,whose gene is localized onchromosome 17q12-q21.1,regulates in vivo p53 transactivating activity.CancerRes.60,6585-9(2000).
7.Ge,K.et al.Transcription coactivator TRAP220 is required for PPARγ2-stimulated adipogenesis.Nture 417,563-567(2002).
8.Yuan,C.X.,Ito,M.,Fondell,J.D.,Fu,Z.Y.&Roeder,R.G.The TRAP220component of a thyroid hormone receptor-associated protein(TRAP)coactivatorcomplex interacts directly with nuclear receptors in aligand-dependent fashion.Proc.Natl.Acad.Sci.U.S.A.95,7939-44(1998).
9.Zhu,X.G.,McPhie,P.,Lin,K.H.&Cheng,S.Y.The differential hormone-dependent transcriptional activation of thyroid hormone receptor isoforms ismediated by interplay of their domains.J.Biol.Chem.272,9048-54(1997).
10.Kang,Y.K.,Guermah,M.,Yuan,C.-X.&Roeder,R.G.The TRAP/Mediatorcoactivator complex interacts directly with estrogen receptors and throughthe TRAP220 subunit and directly enhances estrogen receptor function invitro.Proc.Natl.Acad.Sci.99,2642-2647(2002).
11.Jiang,P.et al.Key roles for MED1 LxxLL motifs in pubertal mammarygland development and luminal-cell differentiation.Proc.Natl.Acad.Sci.U.S.A.107,6765-70(2010).
12.Burakov,D.,Wong,C.W.,Rachez,C.,Cheskis,B.J.&Freedman,L.P.Functional interactions between the estrogen receptor and DRIP205,asubunit of the heteromeric DRIP coactivator complex.J.Biol.Chem.275,20928-34(2000).
13,Li,H.et al.The Med1 Subunit of Transcriptional Mediator Plays aCentral Role in Regulating CCAAT/Enhancer-binding Protein-β-driyenTranscription in Response to Interferon-γ.J.Biol.Chem.283,13077-13086(2008).
14.Rachez,C.et al.Ligand-dependent transcription activation bynuclear receptors requires the DRIP complex.Nature 398,824-8(1999).
15.Stumpf,M.et al.The mediator complex functions as a coactivator forGATA-1 in erythropoiesis via subunit Med 1/TRAP220.Proc.Natl.Acad.Sci.103,18504-18509(2006).
16.Crawford,S.E.et al.Defects of the Heart,Eye,and Megakaryocytes inPeroxisome Proliferator Activator Receptor-binding Protein(PBP)Null FmbryosImplicate GATA Family of Transcription Factors.J.Biol.Chem.277,3585-3592(2002).
17.Malik,S.,Wallberg,A.E.,Kang,Y.K.&Roeder,R.G.TRAP/SMCC/mediator-dependent transcriptional activation from DNA and chromatin templates byorphan nuclear receptor hepatocyte nuclear factor 4.Mol.Cell.Biol.22,5626-37(2002).
18.Wang,S.,Ge,K.,Roeder,R.G.&Hankinson,O.Role of mediator intranscriptional activation by the aryl hydrocarbon receptor.J.Biol.Chem.279,13593-600(2004).
19.Wang,Q.,Sharma,D.,Ren,Y.&Fondell,J.D.A Coregulatory Role for theTRAP-Mediator Complex in Androgen Receptor-mediated GeneExpression.J.Biol.Chem.277,42852-42858(2002).
20.
Figure BDA0002792767850002101
A.M.et al.Composite co-activator ARC mediates chromatin-directed transcriptional activation.Nature 398,828-32(1999).
21.Hittelman,A.B.,Burakov,D.,
Figure BDA0002792767850002102
-Lluhí,J.A.,Freedman,L.P.&Garabedian,M.J.Differential regulation of glucocorticoid receptortranscriptional activation via AF-1-associated proteins.EMBO J.18,5380-5388(1999).
22.Atkins,G.B.et al.Coactivators for the Orphan Nuclear Receptor RORα.Mol.Endocrinol.13,1550-1557(1999).
23.Chen,W.&Roeder,R.G.The Mediator subunit MED1/TRAP220 is requiredfor optimal glucocorticoid receptor-mediated transcription activation.NucleicAcids Res.35,6161-9(2007).
24.Pineda Torra,I.,Freedman,L.P.&Garabedian,M.J.Identification ofDRIP205 as a Coactivator for the Farnesoid X Receptor.J.Biol.Chem.279,36184-36191(2004).
25.Zhou,T.&Chiang,C.-M.Sp1 and AP2 regulate but do not constituteTATA-less human TAF(II)55 core promoter activity.Nucleic Acids Res.30,4145-57(2002).
26.Ito,M.et al.Identity between TRAP and SMCC complexes indicatesnovel pathways for the function of nuclear receptors and diverse mammalianactivators.Mol.Cell 3,361-70(1999).
27.Zhou,H.,Kim,S.,Ishii,S.&Boyer,T.G.Mediator Modulates Gli3-Dependent Sonic Hedgehog Signaling.Mol.Cell.Biol.26,8667-8682(2006).
28.Tutter,A.V et al.Role for Med12 in regulation of Nanog and Nanogtarget genes.J.Biol.Chem.284,3709-18(2009).
29.Hein,M.Y.et al.A human interactome in three quantitativedimensions organized by stoichiometries and abundances.Cell 163,712-23(2015).
30.Gwack,Y.et al.Principal role of TRAP/mediator and SWI/SNFcomplexes in Kaposi’s sarcoma-associated herpesvirus RTA-mediated lyticreactivation.Mol.Cell.Biol.23,2055-67(2003).
31.Kim,S.,Xu,X.,Hecht,A.&Boyer,T.G.Mediator is a transducer of Wnt/beta-catenin signaling.J.Biol.Chem.281,14066-75(2006).
32.Xu,X.,Zhou,H.&Boyer,T.G.Mediator is atransducer of amyloid-precursor-protein-dependent nuclear signalling.EMBO Rep.12,216-222(2011).
33.
Figure BDA0002792767850002111
L.,Madsen,M.S.,Boergesen,M.,Roeder,R.G.&Mandrup,S.MED14tethers mediator to the N-terminal domain of peroxisome proliferator-activated receptor gamma and is required for full transcriptional activityand adipogenesis.Mol.Cell.Biol.30,2155-69(2010).
34.Huttlin,E.L.et al.The BioPlex Network:A Systematic Exploration ofthe Human Interactome.Cell 162,425-440(2015).
35.Yang,F.et al.An ARC/Mediator subunit required for SREBP control ofcholesterol and lipid homeostasis.Nature 442,700-704(2006).
36.Kim,T.W.et al.MED16 and MED23 of Mediator are coactivators oflipopolysaccharide-and heat-shock-induced transcriptional activators.Proc.Natl.Acad.Sci.U.S.A.101,12153-8(2004).
37.Taatjes,D.J.,
Figure BDA0002792767850002121
A.M.,Andel,F.,Nogales,E.&Tjian,R.Structure,function,and activator-induced conformations of the CRSP coatctivator.Science295,1058-62(2002).
38.van Essen,D.,Engist,B.,Natoli,G.&Saccani,S.Two Modes ofTranscriptional Activation at Native Promoters by NF-κB p65.PLoS Biol.7,e1000073(2009).
39.Park,J.M.et al.Signal-induced transcriptional activation by Difrequires the dTRAP80 mediator module.Mol.Cell.Biol.23,1358-67(2003).
40.Park,J.M.,Werner,J.,Kim,J.M.,Lis,J.T.&Kim,Y.J.Mediator,notholoenzyme,is directly recruited to the heat shock promoter by HSF upon heatshock.Mol.Cell8,9-19(2001).
41.Ding,N.et al.MED19 and MED26 are synergistic functional targets ofthe RE1 silencing transcription factor in epigenetic silencing of neuronalgene expression.J.Biol.Chem.284,2648-56(2009).
42.Gu,W.et al.A novel human SRB/MED-containing cofactor complex,SMCC,involved in transcription regulation.Mol.Cell3,97-108(1999).
43.Nevado,J.,Tenbaum,S.P.&Aranda,A.hSrb7,an essential human Mediatorcomponent,acts as a coactivator for the thyroid hormone receptor.Mol.Cell.Endocrinol.222,41-51(2004).
44.Asada,S.et al.External control of Her2 expression and cancer cellgrowth by targeting a Ras-linked coactivator.Proc.Natl.Acad.Sci.U.S.A.99,12747-52(2002).
45.Lambert,J.-P.,Tucholska,M.,Go,C.,Knight,J.D.R.&Gingras,A.-C.Proximity biotinylation and affinity purification are complementaryapproaches for the interactome mapping of chromatin-associated proteincomplexes.J.Proteomics 118,81-94(2015).
46.Galbraith,M.D.et al.HIF1A employs CDK8-mediator to stimulateRNAPII elongation in response to hypoxia.Cell 153,1327-39(2013).
47.Mo,X.,Kowenz-Leutz,E.,Xu,H.&Leutz,A.Rasinduces mediator complexexchange on C/EBP beta.Mol.Cell 13,241-50(2004).
48.Cantin,G,T.,Stevens,J.L.&Berk,A.J.Activation domain-mediatorinteractions promote transcription preinitiation complex assembly on promoterDNA.Proc.Natl.Acad.Sci.U.S.A.100,12003-8(2003).
49.Stevens,J.L.et al.Transcription Control by E1A and MAP KinasePathway via Sur2 Mediator Subunit.Science(80-.).296,755-758(2002).
50.Mittler,G.et al.A novel docking site on Mediator is critical foractivation by VP16 in mammalian cells.EMBO J.22,6494-504(2003).
51.Yang,F.,DeBeaumont,R.,Zhou,S.&
Figure BDA0002792767850002131
A.M.The activator-recruitedcofactor/Mediator coactivator subunit ARC92 is a functionally importanttarget of the VP16 transcriptional activator.Proc.Natl.Acad.Sci.U.S.A.101,2339-44(2004).
52.Lee,H.-K.,Park,U.-H.,Kim,E.-J.&Um,S.-J.MED25 is distinct fromTRAP220/MED1 in cooperating with CBP for retinoid receptor activation.EMBOJ.26,3545-3557(2007).
53.Rana,R.,Surapureddi,S.,Kam,W.,Ferguson,S.&Goldstein,J.A.Med25 isrequired for RNApolymerase II recruitment to specific promoters,thusregulating xenobiotic and lipid metabolism in human liver.Mol.Cell.Biol.31,466-81(2011).
54.Nakamura,Y.et al.Wwp2 is essential for palatogenesis mediafed bythe interaction between Sox9 and mediator subunit 25.Nt.Commun.2,251(2011).
55.Garrett-Engele,C.M.et al.intersex,a gene required for femalesexual development in Drosophila,is expressed in both sexes and functionstogether with doublesex to regulate terminal differentiation.Development 129,4661-75(2002).
56.Eberhardy,S.R.&Farnham,P.J.Myc Recruits P-TEFb to Mediate theFinal Step in the Transcriptional Activation of the cadPromoter.J.Biol.Chem.277,40156-40162(2002).
57.Borggrefe,T.&Yue,X.Interactions between subunits of the Mediatorcomplex with gene-specific transcription factors.Semin.Cell Dev.Biol.22,759-768(2011).
星星方法
实验模型和主题细节
细胞
V6.5鼠科动物胚胎干细胞是来自Whitehead Institute的R.Jaenisch的礼物。V6.5是源于C57BL/6(F)x129/sv(M)杂交的雄细胞。HEK293T细胞购自ATCC(ATCC CRL-3216)。细胞关于支原体呈阴性。
细胞培养条件
V6.5鼠科动物胚胎干(mES)细胞在2i+LIF条件下生长。mES细胞始终在0.2%凝胶化(Sigma,G1890)组织培养板上生长。用于2i+LIF培养基条件的培养基如下:967.5mLDMEM/F12(GIBCO 11320)、5mL N2补充剂(GIBCO 17502048)、10mL B27补充剂(GIBCO17504044)、0.5mM L-谷酰胺(GIBCO 25030)、0.5X非必需氨基酸(GIBCO 11140)、100U/mL青霉素-链霉素(GIBCO 15140)、0.1mM b-巯基乙醇(Sigma)、1uM PD0325901(Stemgent 04-0006)、3uM CHIR99021(Stemgent 04-0004)和1000U/mL重组LIF(ESGRO ESG1107)。关于分化,mESC在如下血清培养基中培养:补充有15%胎牛血清(Hyclone,表征的SH3007103)、100mM非必需氨基酸(Invitrogen,11140-050)、2mM L-谷酰胺(Invitrogen,25030-081)、100U/mL青霉素、100mg/mL链霉素(Invitrogen,15140-122)和0.1mM b-巯基乙醇(SigmaAldrich)的DMEM(Invitrogen,11965-092)。HEK293T细胞购自ATCC(ATCC CRL-3216)并且在具有10%胎牛血清(Hyclone,表征的SH3007103)、100U/mL青霉素-链霉素(GIBCO 15140)、2mM L-谷酰胺(Invitrogen,25030-081)的DMEM(高葡萄糖、丙酮酸盐)(GIBCO 11995-073)中培养。细胞关于支原体呈阴性。
方法细节
免疫荧光联合RNA FISH
盖玻片在37℃下用5ug/mL聚-L-鸟氨酸(Sigma-Aldrich,P4957)涂布持续30分钟并且用5μg/mL层粘连蛋白(Corning,354232)涂布持续2小时。细胞接种于预先涂布的盖玻片上并且生长持续24小时,随后使用PBS中的4%聚甲醛PFA(VWR,BT140770)固定持续10分钟。在PBS中洗涤细胞三次之后,将所述盖玻片放入潮湿室中或在4℃下存储于PBS中。使用PBS中的0.5%triton X100(Sigma Aldrich,X100)执行细胞的渗透持续10分钟,随后进行三次PBS洗涤。细胞用4%无IgG牛血清白蛋白BSA(VWR,102643-516)阻断持续30分钟并且以1:500于PBS中的浓度添加所指示的第一抗体(参见表S4)持续4-16小时。细胞用PBS洗涤三次,随后用第二抗体以1:5000于PBS中的浓度孵育持续1小时。在用PBS洗涤两次之后,细胞使用PBS中的4%聚甲醛PFA(VWR,BT140770)固定持续10分钟。在两次PBS洗涤之后,无RNase水(Life Technologies,AM9932)中的洗涤缓冲液A(20%Stellaris RNA FISH洗涤缓冲液A(Biosearch Technologies,Inc.,SMF-WA1-60)、10%去离子化甲酰胺(EMD Millipore,S4117)添加至细胞中并且孵育持续5分钟。杂交缓冲液(90%Stellaris RNA FISH杂交缓冲液(Biosearch Technologies,SMF-HB1-10)和10%去离子化甲酰胺)中的12.5μM RNA探针(表S6,Stellaris)添加至细胞中并且在37C下孵育过夜。在37℃下用洗涤缓冲液A洗涤持续30分钟之后,细胞核在20μm/mL Hoechst33258(Life Technologies,H3569)中染色持续5分钟,随后在洗涤缓冲液B(Biosearch Technologies,SMF-WB1-20)中洗涤5分钟。细胞在水中洗涤一次,随后用Vectashield(VWR,101098-042)将盖玻片封固于载玻片上并且最终用指甲油(Electron Microscopy Science Nm,72180)密封所述盖玻片。在具有100x物镜的RPI转盘式共聚焦显微镜上使用MetaMorph采集软件和Hammamatsu ORCA-ER CCD摄影机(W.M.Keck Microscopy Facility,MIT)采集图像。图像使用Fiji Is Just ImageJ(FIJI)进行后处理。
免疫荧光联合DNA FISH
如先前上文执行免疫荧光。在用第二抗体孵育细胞之后,细胞在RT下在PBS中洗涤三次持续5min,用PBS中的4%PFA固定持续10min并且在PBS中洗涤三次。细胞在RT下在70%乙醇、85%乙醇和接着100%乙醇中孵育持续1分钟。通过混合7μL FISH杂交缓冲液(Agilent G9400A)、1μl FISH探针(参见下文关于区所述)和2μL水制得探针杂交混合物。5μL混合物添加于载玻片上并且将盖玻片放置于顶部(朝向所述杂交混合物的细胞侧)。使用橡胶胶水密封盖玻片。一旦橡胶胶水凝固,基因组DNA和探针在78℃下变性持续5分钟并且载玻片在暗处在16℃下孵育O/N。从载玻片移除盖玻片并且在73℃下在预温洗涤缓冲液1(Agilent,G9401A)中孵育持续2分钟并且在RT下在洗涤缓冲液2(Agilent,G9402A)中孵育持续1分钟。在RT下空气干燥载玻片并且用PBS中的Hoechst对细胞核染色持续5分钟。盖玻片在PBS中洗涤三次,使用Vectashield封固于载玻片上并且用指甲油密封。在具有100x物镜的RPI转盘式共聚焦显微镜上使用MetaMorph采集软件和Hammamatsu ORCA-ER CCD摄影机(W.M.Keck Microscopy Facility,MIT)采集图像。
DNA FISH探针由Agilent定制设计并且产生以靶向Nanog和MiR290超级增强子。
Nanog
设计输入区–mm9
chr6 122605249–122705248
设计区–mm9
chr6:122605985-122705394
Mir290
设计区–mm10
chr7:3141151–3241381
组织培养
V6.5鼠科动物胚胎干细胞(mESC)是来自Jaenisch实验室的礼物。细胞在0.2%凝胶化(Sigma,G1890)组织培养板上在2i培养基、DMEM-F12(Life Technologies,11320082)、0.5X B27补充剂(Life Technologies,17504044)、0.5X N2补充剂(Life Technologies,17502048)、另外的0.5mM L-谷酰胺(Gibco,25030-081)、0.1mM b-巯基乙醇(Sigma,M7522)、1%青霉素链霉素(Life Technologies,15140163)、0.5X非必需氨基酸(Gibco,11140-050)、1000U/ml LIF(Chemico,ESG1107)、1μM PD0325901(Stemgent,04-0006-10)、3μM CHIR99021(Stemgent,04-0004-10)中生长。细胞在潮湿孵育器中在37℃和5%CO2下生长。关于共聚焦成像,细胞在玻璃盖玻片(Carolina Biological Supply,633029)上生长,所述玻璃盖玻片在37℃下用5μg/mL聚-L-鸟氨酸(Sigma Aldrich,P4957)涂布持续30分钟并且在37℃下用5μg/ml层粘连蛋白(Corning,354232)涂布持续2h-16h。关于传代,细胞在PBS(Life Technologies,AM9625)、1000U/mL LIF中进行洗涤。使用TrypLE表达酶(LifeTechnologies,12604021)使细胞从板脱离。TrypLE用FBS/LIF-培养基(DMEM K/O(Gibco,10829-018)、1X非必需氨基酸、1%青霉素链霉素、2mM L-谷酰胺、0.1mM b-巯基乙醇和15%胎牛血清、FBS(Sigma Aldrich,F4135))淬灭。细胞在RT下在1000rpm下短暂离心持续3min,再悬浮于2i培养基中并且5×106个细胞接种于15cm皿中。关于mESC的分化,6000个细胞接种于6孔组织培养皿的每个孔中,或1000个细胞接种于具有用层粘连蛋白涂布的玻璃盖玻片的24孔板的每个孔中。24小时之后,2i培养基用不具有LIF的FBS培养基(上文)置换。每天更换培养基持续5天,接着收集细胞。
Western印迹
细胞在具有蛋白酶抑制剂(Roche,11697498001)的Cell Lytic M(Sigma-AldrichC2978)中溶解。溶解产物在3%–8%Tris-乙酸盐凝胶或10%Bis-Tris凝胶或3-8%Bis-Tris凝胶上在80V下跑胶持续约2h,随后在120V下跑胶直至染料前部到达所述凝胶的末端。蛋白质接着在4℃下在300mA下在冰冷转移缓冲液(25mM Tris、192mM甘氨酸、10%甲醇)中湿式转移至0.45μm PVDF膜(Millipore,IPVH00010)持续2小时。在转移之后,所述膜在室温、振荡下用TBS中的5%脱脂乳阻断持续1小时。膜接着用稀释于TBST中的5%脱脂乳中的1:1,000所指示抗体(表S4)孵育并且在4℃、振荡下孵育过夜。次日早晨,所述膜用TBST洗涤三次,每次洗涤在室温振荡下持续5分钟。膜在RT下用1:5,000第二抗体孵育持续1h并且在TBST中洗涤三次持续5分钟。膜用ECL底物(Thermo Scientific,34080)显影并且使用CCD摄影机成像或使用膜或用高灵敏度ECL暴露。
染色质免疫沉淀(ChIP)qPCR和测序
mES在2i培养基中生长至80%汇合。使用PBS中的1%甲醛使细胞交联持续15分钟,随后在冰上用最终浓度为125mM的甘氨酸淬灭。细胞用冷PBS洗涤并且通过在冷PBS中刮擦细胞进行收集。所收集的细胞在4℃下在1000g下集结成粒持续3分钟,在液氮中速冻并且存储于-80℃下所有缓冲液均含有新鲜制备的cOmplete蛋白酶抑制剂(Roche,11873580001)。冷冻的交联细胞在冰上解冻并且接着再悬浮于溶解缓冲液I(50mM HEPES-KOH pH 7.5、140mM NaCl、1mM EDTA、10%甘油、0.5%NP-40、0.25%Triton X-100、1 3蛋白酶抑制剂)中并且在4℃下旋转持续10分钟,接着在4℃下在1350rcf下短暂离心持续5分钟。集结粒再悬浮于溶解缓冲液II(10mM Tris-HCl pH 8.0、200mM NaCl、1mM EDTA、0.5mM EGTA、1 3蛋白酶抑制剂)中并且在4℃下旋转持续10分钟并且在4℃下在1350rcf.下短暂离心持续5分钟。集结粒再悬浮于声波缓冲液(20mM Tris-HCl pH 8.0、150mM NaCl、2mM EDTA pH 8.0、0.1%SDS和1%Triton X-100、1 3蛋白酶抑制剂)中并且接着在Misonix 3000声波发生器中进行声波处理,持续在冰上各30s的10个周期(18-21W),其中各周期之间在冰上60s。经过声波处理的溶解产物通过在4℃下在16,000rcf.下离心持续10分钟而被清除一次。输入材料被保留并且剩余部分在4℃下用与抗体(表S4)结合的磁性珠粒孵育过夜以富集由所指示的因子结合的DNA片段。珠粒用以下缓冲液中的每一者洗涤两次:洗涤缓冲液A(50mMHEPES-KOH pH 7.5、140mM NaCl、1mM EDTA pH 8.0、0.1%脱氧胆酸钠、1%Triton X-100、0.1%SDS)、洗涤缓冲液B(50mM HEPES-KOH pH 7.9、500mM NaCl、1mM EDTA pH 8.0、0.1%脱氧胆酸钠、1%Triton X-100、0.1%SDS)、洗涤缓冲液C(20mM Tris-HCl pH 8.0、250mMLiCl、1mM EDTA pH 8.0、0.5%脱氧胆酸钠、0.5%IGEPAL C-630、0.1%SDS)、洗涤缓冲液D(具有0.2%Triton X-100的TE)和TE缓冲液。通过在65℃下孵育持续1小时从所述珠粒洗脱出DNA,其中在洗脱缓冲液(50mM Tris-HCl pH 8.0、10mM EDTA、1%SDS)中进行间歇涡旋。交联在65℃下逆转过夜。为了纯化洗脱的DNA,添加200μL TE并且接着通过添加2.5μL33mg/mL RNase A(Sigma,R4642)并且在37℃下孵育持续2小时而使RNA降解。通过添加10μL20mg/mL蛋白酶K(Invitrogen,25530049)并且在55℃下孵育持续2小时而使蛋白质降解。执行苯酚:氯仿:异戊醇萃取,随后进行乙醇沉淀。所述DNA接着再悬浮于50μL TE中并且用于qPCR或测序。关于ChIP-qPCR实验,使用Power SYBR Green混合物(Life Technologies#4367659)在QuantStudio 5或QuantStudio 6系统(Life Technologies)上执行qPCR。
RNA-Seq
在所指示的细胞系中用所指示的处理执行RNA-Seq,并且用于测定表达的基因。通过AllPrep试剂盒(Qiagen 80204)分离RNA并且使用TruSeq Stranded mRNA Library Prep试剂盒(Illumina,RS-122-2101)根据制造商的方案制备链polyA选择的库并且在Hi-seq2500仪器上对单一末端进行测序。
蛋白质纯化
编码所关注的基因或其IDR的cDNA克隆至T7pET表达载体的修饰形式中。对所述基础载体进行工程改造以包括5’6xHIS、随后mEGFP或mCherry和14个氨基酸的连接体序列“GAPGSAGSAAGGSG.”(SEQ ID NO:14)。使用
Figure BDA0002792767850002191
HiFi DNA Assembly Master Mix(NEB E2621S)与连接体氨基酸同框插入这些序列(通过PCR产生)。表达单独mEGFP或mCherry的载体含有所述连接体序列、随后终止密码子。突变体序列作为基因块(IDT)合成并且插入至如上文所述的相同基础载体中。所有表达构建体均进行测序以确保序列同一性。关于蛋白质表达,质粒如下转化至LOBSTR细胞(Chessman Lab的礼物)中并且如下生长。新鲜细菌集落接种至含有卡那霉素和氯霉素的LB培养基中并且在37℃下生长过夜。含有MED1-IDR构建体的细胞以1:30稀释于具有新鲜添加的卡那霉素和氯霉素的500ml室温LB中并且在16℃下生长1.5小时。添加IPTG至1mM并且生长继续18小时。收集细胞并且冷冻存储于-80℃下。含有所有其他构建体的细胞以相似方式进行处理,除了其在IPTG诱导之后在37℃下生长持续5小时。
500ml cMyc和Nanog细胞的集结粒再悬浮于含有cOmplete蛋白酶抑制剂(Roche,11873580001)的15ml变性缓冲液(50mM Tris 7.5、300mM NaCl、10mM咪唑、8M脲)中并且进行声波处理(15秒打开、60s切断的十个周期)。溶解产物通过在12,000g下离心持续30分钟被清除并且添加至已经用10X体积的相同缓冲液预平衡的1ml Ni-NTA琼脂糖(Invitrogen,R901-15)中。含有这一琼脂糖溶解产物浆液的管旋转持续1.5小时。所述浆液倾倒至柱中,用15体积的溶解缓冲液洗涤并且用含有250mM咪唑的变性缓冲液洗脱4次。各洗脱份在12%凝胶上跑胶并且精确大小的蛋白质首先针对缓冲液(50mM Tris pH 7.5、125Mm NaCl、1MmDTT和4M脲)、随后针对含有2M脲的相同缓冲液并且最后针对具有10%甘油而无脲的缓冲液的2种变化进行透析。透析之后的任何沉淀物均通过在3.000rpm下离心持续10分钟而被移除。所有其他蛋白质以相似方式进行纯化。500ml细胞集结粒再悬浮于含有10mM咪唑和cOmplete蛋白酶抑制剂的15ml缓冲液A(50mM Tris pH 7.5、500mM NaCl)中,进行声波处理,溶解产物通过在4℃下在12,000g下离心持续30分钟而被清除,添加至1ml预平衡的Ni-NTA琼脂糖中,并且在4℃下旋转持续1.5小时。所述浆液倾倒至柱中,用15体积的含有10mM咪唑的缓冲液A洗涤并且蛋白质用含有50mM咪唑的缓冲液A洗脱2次,用含有100mM咪唑的缓冲液A洗脱2次,并且用含有250mM咪唑的缓冲液A洗脱3次。或者,所述树脂浆液在3,000rpm下离心持续10分钟,用15体积的缓冲液洗涤并且蛋白质通过用以上缓冲液中的每一者(50mM、100mM和250mM咪唑)孵育持续10分钟或更多10分钟旋转、随后离心并且凝胶分析而进行洗脱。含有精确大小的蛋白质的洗脱份在4℃下针对含有50mM Tris 7.5、125mM NaCl、10%甘油和1mM DTT的缓冲液的两次变化进行透析。
体外小液滴测定
重组GFP或mCherry融合蛋白使用Amicon Ultra离心过滤器(30K MWCO,Millipore)进行浓缩并且脱盐至适当蛋白质浓度和125mM NaCl。重组蛋白添加至小液滴形成缓冲液(50mM Tris-HCl pH 7.5、10%甘油、1mM DTT)中具有变化浓度的所指示的最终盐和作为拥挤剂的10%PEG-8000的溶液中。所述蛋白质溶液立即装载至包含通过双面胶带的两个平行条附接的载玻片和盖玻片的自制室中。载玻片接着用具有150x物镜的Andor共聚焦显微镜成像。除非有所指示,否则所呈递的图像具有沉降于玻璃盖玻片上的小液滴。关于使用经荧光标记的多肽的实验,所指示的十肽通过Koch Institute/MIT Biopolymers&Proteomics Core Facility用TMR荧光标签合成。所关注的蛋白质添加至具有125mM NaCl和10%Peg-8000和所指示的多肽的缓冲液D中并且如上文所述成像。关于体外小液滴的FRAP,在50us停留时间处的5次激光脉冲应用于小液滴,并且恢复每1s在Andor显微镜上成像持续所指示的时期。关于雌激素刺激实验,新鲜B-雌二醇(E8875Sigma)在100%EtOH中复原至10mM,接着在125mM NaCl小液滴形成缓冲液中稀释至100uM。一微升的这种浓缩储备液用于10uL小液滴形成反应中以实现10uM的最终浓度。
基因组编辑和蛋白质降解
使用CRISPR/Cas9系统来遗传学工程改造ESC株。靶特异性寡核苷酸克隆至携带Cas9的密码子优化形式和GFP(来自R.Jaenisch的礼物)的质粒中。所靶向的DNA的序列(前间隔序列邻近基序加下划线)列于同一表中。关于经内源标记的株的产生,1百万个经Med1-mEGFP标记mES细胞用2.5mg含有下文导向序列的Cas9质粒(pX330-GFP-Oct4)和1.25mg非线性化修复质粒1(pUC19-Oct4-FKBP-BFP)和1.25mg非线性化修复质粒2(pUC19-Oct4-FKBP-mcherry)(表S5)转染。细胞在48小时之后关于GFP的存在进行分选。细胞扩增持续五天并且接着再关于双重阳性mCherry和BFP细胞进行分选。四万个mCherry+/BFP+分选细胞以连续稀释接种于六孔板中。所述细胞在2i培养基中生长持续大约一周并且接着使用立体镜将个别集落挑选至96孔板中。细胞通过PCR进行扩增并且进行基因分型,通过western印迹和IF确认降解。具有纯合基因敲入标签的克隆进一步扩增并且用于实验。表达经FKBP标记Oct4的克隆性纯合基因敲入株用于降解实验。细胞在2i中生长并且接着用100nM浓度的dTAG-47处理持续24小时,接着收集。
Oct4导向序列
tgcattcaaactgaggcacc*NGG(PAM)(SEQ ID NO:15)
GAL4转录测定
转录因子构建体在含有驱动GAL4DNA结合域表达的SV40启动子的哺乳动物表达载体中进行组装。Oct4和Gcn4的野生型和突变型活化域通过Gibson克隆(NEB 2621S)融合至所述DNA结合域的C端,通过连接体GAPGSAGSAAGGSG(SEQ ID NO:16)接合。这些转录因子构建体使用Lipofectamine 3000(Thermofisher L3000015)转染至HEK293T细胞(ATCC CRL-3216)或V6.5小鼠胚胎干细胞中,所述细胞在白色平底96孔测定板(Costar 3917)中生长。所述转录因子构建体用含有荧火虫荧光素酶基因上游的五个GAL4上游活化位点的PGL3-Basic(Promega)载体的修饰形式共转染。pRL-SV40(Promega)是含有由SV40启动子驱动的海肾荧光素酶基因的质粒,其也进行共转染。在转染之后24小时,使用Dual-glo荧光素酶测定系统(Promega E2920)来测量由各荧光素酶蛋白产生的发光。所呈递的数据已经关于海肾荧光素酶表达进行对照。
Lac结合测定
构建体通过含有驱动CFP-LacI融合蛋白表达的SV40启动子的pSV2哺乳动物表达载体中的NEB HIFI克隆进行组装。Gcn4的活化域和突变型活化域通过c端融合至这种重组蛋白,通过连接体序列GAPGSAGSAAGGSG(SEQ ID NO:17)接合。含有约51,000个Lac-抑制因子结合位点的稳定整合阵列的U2OS-268细胞(Spector实验室的礼物)使用lipofectamine3000(Thermofisher L3000015)进行转染。在转染之后24小时,细胞接种于用纤维连接蛋白涂布的玻璃盖玻片上。在玻璃盖玻片上24小时之后,细胞用如上文所述的MED1抗体(表S4)固定用于免疫荧光并且通过转盘式共聚焦显微术成像。
CDK8-介体的纯化
CDK8-介体样品如所述(Meyer等人,2008)在修改下进行纯化。在亲和力纯化之前,P0.5M/QFT洗脱份通过硫酸铵沉淀(35%)浓缩至12mg/mL。集结粒再悬浮于含有20mM KCl、20mM HEPES、0.1mM EDTA、2mM MgCl2、20%甘油的pH 7.9缓冲液中并且接着在亲和力纯化步骤之前针对含有0.15M KCl、20mM HEPES、0.1mM EDTA、20%甘油和0.02%NP-40的pH 7.9缓冲液进行透析。如所述(Meyer等人,2008)进行亲和力纯化,将洗脱的材料装载至含有2mL0.15M KCl HEMG(20mM HEPES、0.1mM EDTA、2mM MgCl2、10%甘油)的2.2mL离心管中并且在4℃下在50K RPM下离心持续4h。此举用于移除过量游离GST-SREBP并且用于浓缩最终洗脱份中的CDK8-介体。在小液滴测定之前,使用具有Ultracel-30膜(Millipore MRCF0R030)的Microcon-30kDa离心过滤单元浓缩纯化的CDK8-介体以实现约300nM介体复合物。浓缩的CDK8-介体在10μM所指示的经GFP标记蛋白存在或不存在下添加至小液滴测定中直至约200nM的最终浓度。小液滴反应含有10%PEG-8000和140mM盐。
定量和统计学分析
实验设计
所有实验均重复进行。关于所进行的重复实验的特定数目,参见图例或下文特定部分。所述研究的任何方面均未盲性进行。样品大小未预定并且未排除离群值。
平均图像和径向分布分析
关于RNA FISH联合免疫荧光的分析,书写定制的内部MATLABTM原稿以处理并且分析在FISH(RNA/DNA)和IF通道中收集的3D图像数据。FISH焦点在个别z-堆栈中通过强度阈值手动地鉴定,沿大小l=2.9μm的盒定中心,并且在z-堆栈当中以3-D缝合在一起。所召集的FISH焦点针对FISH焦点的手动策划列表进行交叉引用以移除假阳性,所述假阳性归因于核外信号或反射脉冲而产生。关于所鉴定的每一个RNA FISH焦点,来自IF通道中的相应位置的信号在定中心于每一个相应z-切片处的RNA FISH焦点处的l×l正方形中加以收集。接着组合定中心于各FISH和IF对的FISH焦点处的IF信号并且计算平均强度投影,从而提供定中心于FISH焦点处的l×l正方形内的IF信号强度的平均数据。关于定中心于其本身坐标上的FISH信号强度进行相同过程,从而提供定中心于FISH焦点处的l×l正方形内的FISH信号强度的平均数据。作为对照,关于定中心于随机选择的核位置处的IF信号进行这一相同过程。随机选择的核位置通过首先鉴定核体积并且接着选择那一体积内的位置而针对各图像集合加以鉴定。核体积通过z-堆栈图像从DAPI染色测定,所述z-堆栈图像接着通过定制的CellProfiler管线(作为辅助文件包括在内)进行处理。简单说来,这一管线对图像强度再定标,针对处理速度压缩所述图像至原始大小的20%,增强所检测的光斑,过滤中值信号,对主体设置阈值,移除孔,过滤中值信号,使所述图像扩大返回原始大小,对细胞核设置水线,并且将所得对象转化为黑白图像。这一黑白图像用作定制的R脚本的输入,所述定制的R脚本使用readTIFF和im(来自spatstat)来选择每个图像集合40个随机核三维像素。这些平均强度投影接着用于产生信号强度或径向分布图的2D轮廊图。轮廊图使用MATLABTM中的内置功能产生。强度径向功能((r))是由平均数据计算。关于轮廓图,所呈递的强度-颜色范围在颜色的线性范围内(n!=15)进行定制。关于FISH通道,使用黑色至品红色。关于IF通道,我们使用chroma.js(在线颜色生成器)在15个仓内产生颜色,其中关键转变颜色是选择为黑色、蓝紫色、中蓝色、绿黄色。进行此举以确保读者的眼睛可能更容易地检测信号对比度。所产生的颜色图用于所有IF图中的15个均匀间隔的强度仓。使用相同彩色比例尺对定中心于FISH处或随机选择的核位置处的平均IF作图,所述彩色比例尺经过设置以包括各图的最小和最大信号。关于DNA FISH分析,FISH焦点在个别z-堆栈中通过FIJI中的强度阈值手动地鉴定并且标记为参考区域。所述参考区域接着转移至所述图像的MED1 IF通道并且测定FISH焦点内的平均IF信号。对包含每个图像超过10个细胞的5个图像中的平均信号求平均值以计算与DNA FISH焦点相关的平均MED1 IF强度。
染色质免疫沉淀PCR和测序(ChIP)分析
图中展示的值针对输入标准化。展示平均WT范数值和标准偏差。所用的引物列于下文中。所关注的区(ROI)处的ChIP值针对输入值(倍数输入)标准化并且关于mir290增强子针对另外的负区(负范数)标准化所展示的值在分化实验中针对ES状态标准化并且在OCT4降解实验中针对DMSO对照物标准化(对照标准化)。qPCR反应以技术三重复执行。
Figure BDA0002792767850002251
ChIP qPCR引物
Mir290
GGACTCCATCCCTAGTATTTGC SEQ ID
mir290_Neg_F NO:16
GCTAATCACAAATTTGCTCTGC SEQ ID
mir290_Neg_R NO:17
CCACCTAAACAAAGAACAGCAG SEQ ID
mir290_OCT4_F NO:18
TGTACCCTGCCACTCAGTTTAC SEQ ID
mir290_OCT4_R NO:19
AAGCAGGGTGGTAGAGTAAGGA SEQ ID
mir290_MED1_F NO:20
ATTCCCGATGTGGAGTAGAAGT SEQ ID
mir290_MED1_R NO:21
使用bowtie以参数–k 1–m 1–best和设置为读出长度的–l比对ChIP-Seq数据与小鼠参考基因组的mm9形式。使用MACS以参数–w–S–space=50–nomodel–shiftsize=200创建用于以仓展示读取覆盖率的Wiggle文件,并且每仓读数计数针对用于产生所述wiggle文件的数百万个定位的读数标准化。每百万个读数标准化的wiggle文件展示于UCSC基因组浏览器中。图1中所示的ChIP-Seq迹线根据Whyte等人,2013来源于GSM1082340(OCT4)和GSM560348(MED1)。在2i条件下生长的细胞中的超级增强子和典型增强子和其缔合基因是从Sabari等人,2018下载。占有率倍数变化的分布使用bamToGFF(github.com/BradnerLab/pipeline)来计算以定量在2i条件下生长的细胞中的超级增强子和典型增强子覆盖率。各典型和超级增强子重叠的读数使用bamToGFF以参数-e 200 -f 1 -t TRUE来测定并且随后针对数百万个定位的读数(RPM)标准化。来自各条件的RPM标准化的输入读数计数接着从来自相应条件的RPM标准化的ChIP-Seq读数计数中减去。来自其中这一减去会导致负数的区的值被设置为0。计算DMSO处理(正常OCT4量)与dTAG处理(耗尽的OCT4)之间的Log2倍数变化;一个假计数添加至各条件中。
超级增强子鉴定
超级增强子如Whyte等人所述进行鉴定。使用具有–p 1e-9 –keep-dup=1和输入对照物的MACS鉴定MED1富集的峰。来自未处理条件的MED1比对读数和MED1的相应峰用作具有参数-s 12500 -t 2000 -g mm9和输入对照物的ROSE(bitbucket.org/young_computation/)的输入。通过添加D7Ertd143e并且移除Mir290、Mir291a、Mir291b、Mir292、Mir293、Mir294和Mir295以预防作为相同转录物的一部分的这些附近微小RNA经过多重计数来创建定制的基因列表,缝合的增强子(超级增强子和典型增强子)被分配至单一表达的RefSeq转录物,所述转录物的启动子最接近缝合的增强子的中心。表达的转录物是如上文所定义。
RNA-Seq分析
关于分析,使用具有默认参数的hisat2使原始读数与小鼠参考基因组的mm9修订形式进行比对。用18年6月6日从Refseq下载的具有参数-I gene_id –stranded=reverse-f bam -m intersection-strict和含有转录物位置的GTF的htseq-count执行基因名称-水平读数计数定量。使用DEseq2使用标准工作流和各条件的两个重复样品测定标准化计数、标准化倍数变化和差异性表达p值。
OCT4的富集和电荷分析
通过对沿蛋白质的氨基酸序列的各残基的氨基酸身份作图使用R来产生氨基酸组成图。通过使用localCIDER程序包(Holehouse等人,2017)计算沿5个氨基酸的滑动窗中的OCT4氨基酸序列的平均氨基酸电荷来测定关于OCT4的每个残基净电荷。
无序富集分析
人类转录因子蛋白序列的列表用于针对TF的所有分析,如(Saint-andré等人)中所定义。使用参考人类蛋白质组(Uniprot UP000005640)来提取所述列表(降至约1200种蛋白质),主要地移除非规范亚型。转录共活化子和Pol II缔合蛋白在人类中使用GO富集IDSGO:0003713和GO:0045944加以鉴定。使用上文所定义的参考人类蛋白质组来产生所有人类蛋白质的列表,并且从Uniprot审查列表鉴定过氧化物酶体和高尔基蛋白。关于各蛋白质,使用D2P2来测定针对各氨基酸的无序倾向。如果由D2P2(Oates等人,2013)使用的算法的至少75%预测残基是无序的,那么蛋白质中的氨基酸被视为无序的。另外,关于转录因子,所有经过批注的PFAM域均经过鉴定(总计5741个,180个独特域)。交叉引用关于已知DNA结合活性的PFAM批注,45个独特高置信度DNA结合域的子集经过鉴定,占所有鉴定的域的约85%。绝大多数TF(>95%)具有至少一个经过鉴定的DNA结合域。关于每一种TF中的所有DNA结合区以及所述序列的剩余部分计算无序分数,所述剩余部分包括大多数经过鉴定的反式活化域。
体外小液滴的成像分析
为了分析体外相分离成像实验,书写定制的MATLABTM脚本以鉴定小液滴并且表征其大小和形状。关于任何特定实验条件,使用基于直方图的峰的强度阈值和大小阈值(2个像素的半径)使所述图像区段化。对“骨架”通道(在MED1+TF的情况下是MED1,关于GCN4+MED15是GCN4)执行小液滴鉴定,并且测定面积和纵横比。为了计算所述体外小液滴测定的富集,小液滴是定义为FIJI中由所述骨架通道关注的区,并且测定那个小液滴内的客户蛋白的最大信号。所选骨架是MED1、介体复合物或GCN4。这一信号除以所述图像中的背景客户蛋白信号以产生Cin/out。通过使所述实验条件的Cin/out除以对照荧光蛋白(GFP或mCherry)的Cin/out来计算富集分数。
数据和软件可用性
数据集
Figure BDA0002792767850002281
总体登录:
GSE120476
关键资源表
Figure BDA0002792767850002291
Figure BDA0002792767850002301
Figure BDA0002792767850002311
Figure BDA0002792767850002321
表S4.抗体表
Figure BDA0002792767850002331
表S5.构建体。除非另外指示,否则蛋白质的所有序列均是人类的
Figure BDA0002792767850002332
Figure BDA0002792767850002341
表S6 RNA FISH探针的序列
Figure BDA0002792767850002342
Figure BDA0002792767850002351
Figure BDA0002792767850002361
Figure BDA0002792767850002371
实施例4
哺乳动物异染色质是由两种主要的表观遗传学途径控制,所述表观遗传学途径的特征在于不同染色质修饰,即组蛋白H3赖氨酸9三甲基化(H3K9me3)和DNA甲基化。这些修饰由具有抑制活性的读取器蛋白特异性识别并且结合。尤其,HP1α是H3K9me3修饰的读取器,而MeCP2是DNA甲基化的读取器。HP1α和MeCP2是牵涉于全局基因控制中的一般染色质调控因子。两种蛋白质是正常发育所必需的,广泛地表达于多种组织中,并且经由众多相互作用搭配物介导其效应。
异染色质已经传统地被视作细胞核中的静态并且难以接近的结构。对于转录沉默的普遍观点在于异染色质中的染色质压实从下伏DNA中排除了如RNA聚合酶的蛋白质并且由此抑制转录。然而,一些观察结果已经表明异染色质是允许某些蛋白质的快速交换的更具动态组装体。例如,募集如H3K9甲基转移酶和组蛋白脱乙酰基酶的染色质修饰剂至染色质的异染色质蛋白质HP1α在不同异染色质域之间以及在染色质结合与核原生质形式之间快速地交换。
液体-液体相分离(LLPS)是物理现象,其特征在于与具有不同浓度的不同液相反混合的分子。致密液相的形成是由微弱、多价分子间相互作用驱动,所述相互作用如通过蛋白质的低复杂度和固有无序域产生的那些。LLPS已经作为细胞组织的机制出现,驱动无膜细胞器(称作凝聚物)的形成,所述无膜细胞器区域化并且浓缩生物分子至无膜体中。
我们想知晓MeCP2是否促进相分离的异染色质隔室。此外,严重神经综合征是由MeCP2的功能损失和过表达两者引起,并且凝聚物模型具有解释为何降低和升高的水平均可能引起相关综合征的潜力。此处,我们显示MeCP2通过相分离形成动态液体凝聚物并且这种特性促进异染色质功能。MeCP2在异染色质处形成具有动态液体样特性的核凝聚物。所述蛋白质可在体外形成可并入抑制因子的相分离的液体小液滴。MeCP2的C端固有无序域是体外凝聚物形成、体内异染色质缔合和异染色质基因抑制所必需的。这些结果表明,MeCP2用于区域化并且浓缩异染色质中的抑制因子。
结果
MeCP2和HP1α存在于液体样异染色质凝聚物中
我们试图通过研究MeCP2在异染色质中的动态行为来测定MeCP2是否可能促进哺乳动物异染色质的动态液体凝聚物特性。为了研究活细胞中内源水平下的MeCP2,我们使用CRISPR/Cas9系统来工程改造鼠科动物胚胎干细胞(mESC)以用单体增强型绿色荧光蛋白(GFP)标记MeCP2。为了比较相同细胞类型中的MeCP2和HP1α动力学,我们另外工程改造mESC以用mCherry标记HP1α。MeCP2-GFP和HP1α-mCherry细胞的活细胞荧光显微术揭露了与DNA致密异染色质焦点重叠的个别核体(图43A和图43B)。同一细胞核中的MeCP2-GFP和HP1α-mCherry信号的比较显示出,其同时出现于mESC中的同一异染色质凝聚物中(图43C)。活细胞图像的分析显示出,每个细胞核存在14.9±2.7种MeCP2凝聚物,每种凝聚物具有1.04±1.47μm3体积(平均值±标准偏差)。这些结果指示出,当以正常水平表达于mESC中时,MeCP2和HP1α是异染色质凝聚物的共享组分。
我们接着试图测定MeCP2凝聚物是否展示通过相分离形成的液体凝聚物的特有特征。通过液体-液体相分离形成的凝聚物的关键特征是分子的动态内部重排和内部-外部交换(Hyman等人2014;Banani等人2017;Shin和Brangwynne 2017),其可使用光漂白(FRAP)实验之后的荧光恢复来测量。为了研究活细胞中MeCP2凝聚物的动力学,我们对经内源标记MeCP2-GFP mESC执行FRAP实验。MeCP2-GFP凝聚物在光漂白之后在以秒为单位的时标中恢复荧光(图43D和图43E)。HP1α-mCherry mESC的FRAP显示相似的恢复动力学(图43F和图43G)。定量分析显示MeCP2-GFP的恢复半衰期是约10s,具有约80%的可移动部分(图43H和图43I)。因此,MeCP2和HP1α均显示异染色质凝聚物中的动态液体样特性。
MeCP2在体外形成相分离的液体小液滴
MeCP2含有两个保守固有无序区(IDR),所述保守固有无序区侧接其结构化甲基结合域(MBD)(图44A和图50A)(Ghosh等人2010;Wakefield等人1999;Nan等人1993;Adams等人2007)。牵涉于凝聚物形成中的蛋白质通常含有IDR并且当纯化时可在体外形成相分离的液体小液滴(Burke等人2015;Nott等人2015;Lin等人2015;Kato等人2012;Sabari等人2018)。为了测定MeCP2是否能够形成相分离的小液滴,在小液滴形成测定中纯化并且研究重组MeCP2-GFP融合蛋白。添加蛋白质至含有拥挤剂以模拟细胞核中的高浓度因子的缓冲液中会诱导富集MeCP2-GFP的球形小液滴的形成,所述球形小液滴使用荧光显微术加以检测(图44B)。相分离的小液滴典型地用所述系统中的组分浓度对大小定标(Brangwynne 2013)。发现MeCP2-GFP在介于160nM至10μM范围内的浓度下形成小液滴并且所述小液滴随增加的蛋白质浓度增加大小(图44B-D和图50B)。液体小液滴能够融合,并且用MeCP2-GFP观察到小液滴融合(图44E)。MeCP2-GFP小液滴的FRAP显示恢复,其指示MeCP2-GFP小液滴内的分子的动态重排(图44F)。还发现HP1α-mCherry形成相分离的小液滴(图50C),从而确认先前报告(Strom等人2017;Larson等人2017)。这些结果证明了MeCP2可经历相分离以形成液体小液滴,这使我们推断MeCP2和HP1α均为异染色质中具有经历体外相分离的能力的组分。
相分离可由蛋白质IDR内的氨基酸残基之间的多价微弱分子间相互作用驱动;带电残基和芳香族残基均已经显示促进相分离。MeCP2的两个大IDR的氨基酸含量的检查揭露了带电残基的显著丰度,但仅存在一些芳香族残基(图44A和图50A)。如果静电相互作用促进MeCP2相分离,那么MeCP2形成小液滴的能力应通过在小液滴形成测定中增加盐浓度而减弱,增加盐浓度将破坏离子相互作用。实际上,MeCP2小液滴通过增加盐浓度而减弱(图44G-图44I),表明静电相互作用促进MeCP2形成相分离的小液滴的能力。通过检查在多种盐和蛋白质浓度下的MeCP2-GFP小液滴形成能力,产生MeCP2-GFP小液滴形成的相图(图44J和图50D)。
凝聚物形成、异染色质缔合和基因抑制依赖于MeCP2C端IDR
为了测定MeCP2形成相分离的小液滴的能力是否依赖于其IDR中的一或两者,我们纯化缺乏N端IDR(ΔIDR-1)或C端IDR(ΔIDR-2)的重组MeCP2-GFP缺失突变体(图45A)并且检查其在体外形成小液滴的能力。小液滴测定揭露了缺乏N端IDR(ΔIDR-1)的突变体保持能够形成小液滴,但缺乏C端IDR(ΔIDR-2)的突变体已经丧失这种能力(图45B)。这些结果指示MeCP2在体外形成相分离的小液滴的能力依赖于其C端IDR。
我们接着通过使用经过工程改造以表达来自内源Mecp2基因座的这些蛋白质的mESC来研究缺乏N端IDR(ΔIDR-1)或C端IDR(ΔIDR-2)的MeCP2-GFP突变体与细胞中的异染色质缔合的能力。活细胞荧光显微术揭露了ΔIDR-1MeCP2定位于异染色质处并且在异染色质处展示与全长MeCP2相似的富集(图45C和图45D)。相比之下,ΔIDR-2MeCP2在异染色质处展示降低的定位和富集(图45C和图45D)。这些结果指示体外凝聚物形成和体内异染色质缔合均依赖于MeCP2的C端IDR。
如果MeCP2通过异染色质凝聚物中的定位和浓度用于促进基因抑制,那么我们将预期IDR-2损失将影响重复元件沉默。实际上,当与全长MeCP2细胞相比时,在ΔIDR-2MeCP2细胞中存在主要卫星重复序列表达的显著增加(图45E)。合起来,这些结果表明凝聚物形成、异染色质定位和基因沉默相互依赖于MeCP2的C端IDR。
MeCP2凝聚物可区域化异染色质因子
凝聚物被视为用于区域化并且浓缩凝聚液相内的因子。我们使用具有核萃取物的小液滴形成测定来研究MeCP2是否可将已知与异染色质缔合的多种因子区域化至小液滴中(图46A)。使用核萃取物,因为其含有细胞核的所有组分并且凝聚物形成可在不添加人工拥挤剂的情况下发生。在高盐条件下由表达MeCP2-mCherry或MeCP2-ΔIDR-2-mCherry的HEK293细胞制备核萃取物,并且通过降低所述核萃取物的盐浓度来诱导小液滴形成。我们发现小液滴形成于来自表达MeCP2-mCherry而非MeCP2-ΔIDR-2-mCherry的细胞的核萃取物中(图46B)。凝聚物浓缩蛋白质组分并且因此比周围相更致密,使得核萃取物经受离心以短暂离心致密材料并且这种材料通过western印迹进行分析。所述结果揭露了已知与异染色质缔合的抑制因子(包括HP1α、TBL1R(转导蛋白β样蛋白)、HDAC3(组蛋白脱乙酰基酶3)和SMRT(视黄酸和甲状腺受体的沉默介体))在MeCP2-mCherry萃取物而非MeCP2-ΔIDR-2-mCherry萃取物中富集(图46C和图46D)。相比之下,如RNA聚合酶II(RPB1)的常染色质组分未富集(图46C和图46D)。这些结果指示MeCP2可在可区域化并且浓缩与异染色质缔合的抑制因子的核萃取物中形成小液滴。
MeCP2 IDR-2可分配至异染色质凝聚物中
已经主张凝聚物形成蛋白的IDR将蛋白质寻址于特定凝聚物,但关于所述寻址功能存在极少直接证据(Banani等人2017)。我们为此研究MeCP2 IDR-2是否足以将mCherry蛋白寻址于细胞中的异染色质(图47A)。融合至mCherry(mCherry-MeCP2-IDR-2)和对照mCherry的MeCP2 IDR-2异位表达于mESC中并且通过显微术检查其定位。mCherry-MeCP2-IDR-2优先地定位于DNA-致密异染色质和核仁(通过相分离形成的另一核体)(图47B-图47D)。相比之下,单独mCherry未在异染色质或核仁中富集(图47B-图47C)。这些结果表明,MeCP2-IDR-2在细胞中展示一定程度的特定分配行为,与如下观念一致,即优先分配可能促进因子适当寻址于特定凝聚物。
MeCP2浓缩于小鼠脑的神经元的异染色质中
MeCP2已经过广泛研究,因为功能突变的MECP2损失会引起雷特综合征并且基因复制会引起MECP2复制综合征;这些综合征均涉及特征在于严重智力障碍的神经病症。MeCP2表达于所有动物组织中,但其以尤其高水平表达于神经元中(Skene等人2010)。出于这些原因,我们试图测定MeCP2是否还浓缩于鼠科动物脑的神经元中的液体样凝聚物中。雷特综合征的小鼠模型忠实地再现在人类综合征中观察到的表型。高级别嵌合小鼠由整合至报告基因ES细胞的内源基因座中的MECP2-GFP和MED1-GFP构建体产生。在2月龄时,在通过福尔马林灌注固定之后,鼠科动物脑被切成10μm切片。荧光显微术揭露了MeCP2在表达Map2的神经元和表达PU.1的小胶质细胞中的DNA致密异染色质焦点处形成个别核体(图48A-图48C)。使用新鲜制备的活脑组织切片的FRAP实验显示MeCP2-GFP在这些异染色质凝聚物中是高度动态的(图48D和图48E)。如所预期,MED1-GFP色斑较小并且较多,并且未与异染色质缔合(图48F)。这些结果指示MeCP2浓缩于活鼠科动物神经元的异染色质中并且表明这些组织中的异染色质表现为动态凝聚物。
论述
我们在此处显示MeCP2是ES细胞和脑组织中的神经元两者中的动态异染色质凝聚物的组分。MeCP2的C端IDR是其凝聚物形成特性和其在体外区域化抑制因子的能力和体内异染色质缔合和基因沉默所必需的。独立于所述蛋白质的剩余部分表达的这一MeCP2 IDR足以将所述域寻址并且并入至细胞中的异染色质凝聚物中。所述结果因此显示MeCP2是多种细胞类型中的动态异染色质凝聚物的组分并且表明MeCP2与异染色质的相互作用可由其甲基DNA结合和其凝聚物缔合特性两者介导。
MeCP2和HP1α均为异染色质凝聚物的组分的观察结果与如下先前证据一致,即所述两种蛋白质是正常发育所必需的,广泛地表达于多种组织中,并且牵涉于基因抑制中(Allshire和Madhani 2018;Ip等人2018;Ausió等人2014;Lyst和Bird 2015;Guy等人2011)。先前研究已经报告了串扰发生于DNA甲基化、H3K9甲基化与结合蛋白MeCP2和Hp1α之间。例如,在近着丝粒区域卫星重复序列的异染色质化中并且在胚胎植入之后的POU5F1基因沉默中,组蛋白甲基转移酶G9a使组蛋白H3K9(其使得实现HP1α结合)三甲基化,并且结合DNMT3(其使DNA甲基化),从而引起MeCP2结合。MeCP2和HP1α均可募集牵涉于基因沉默中的搭配物,如组蛋白脱乙酰基酶。所述结果与先前关于HP1α所述的那些合起来表明MeCP2和HP1α均区域化并且浓缩这些抑制因子以维持异染色质隔室的沉默状态。
异染色质蛋白质的相分离可用于浓缩并且区域化抑制因子的观察结果提供了简化模型来解释归因于这些蛋白质的不同相互作用。异染色质与数百种蛋白质因子缔合。已经观察到MeCP2和HP1α均与众多不同的相互作用搭配物相互作用。关于这些相互作用搭配物如何与异染色质小体以物理方式相互作用并且稳定缔合,难以与蛋白质-蛋白质相互作用的经典锁钥模型一致。MeCP2和HP1α形成浓缩并且区域化相互作用的动态网络内的抑制因子的相分离的异染色质凝聚物的能力较好地解释了这些观察结果。值得注意的是,异染色质凝聚物特异性地浓缩抑制组分而非活性转录装置的能力表明了使活性因子和抑制因子经由这些凝聚物的相分离特性特定地区域化至不同凝聚物中的机制。
这一模型将解释引起雷特综合征的MeCP2突变为何可发生于DNA结合域中或C端IDR中,其中大多数突变引起IDR的损失或截短(图48A)。
破坏编码异染色质蛋白质的基因的突变发生于多种疾病中。有趣的是推测这些突变是否可经由异染色质相分离的破坏引起疾病表型。值得注意的是,MECP2中的错义和无义突变会引起雷特综合征,所述综合征是会影响10,000名年轻女孩中的1名的神经发育病症(Amir等人1999)。这些突变通常影响MeCP2的IDR并且可扰乱MeCP2在异染色质处经历相分离或区域化异染色质凝聚物内的关键因子的能力。另外,MECP2基因剂量的致病增加会引起MECP2复制综合征,所述综合征是年轻男性中的相关神经发育病症(Van Esch等人2005)。相分离系统可对组分因子的浓缩中的小变化敏感,表明基因剂量的异常增加或减少可能对凝聚物行为具有实质影响。理解疾病突变与异染色质相分离的牵连可对于理解分子病理学和鉴定治疗这些疾病的新治疗机会至关重要。
方法
细胞培养条件
细胞培养
V6.5鼠科动物胚胎干细胞(ESC)在用0.2%明胶(Sigma G1890)涂布的组织培养物处理板上的2i/LIF培养基中培养。ESC在潮湿孵育器中在5%CO2下在37℃下生长。细胞每2-3天使用TrypLE Express(Gibco12604)通过解离传代。所述解离反应使用血清/LIF培养基淬灭。细胞定期地使用MycoAlert支原体检测试剂盒(Lonza LT07-218)针对支原体进行测试并且发现呈阴性。
HEK293T细胞获自ATCC,并且在具有高葡萄糖、10%胎牛血清(Hyclone,表征的SH3007103)2mM L-谷酰胺和100U/mL青霉素-链霉素(GIBCO 15140)的DMEM(GIBCO)中培养。
培养基组成
2i/LIF培养基的组成如下:补充有0.5X N2补充剂(Gibco 17502)、0.5X B27补充剂(Gibco 17504)、2mM L-谷酰胺(Gibco 25030)、1X MEM非必需氨基酸(Gibco 11140)、100U/mL青霉素-链霉素(Gibco 15140)、0.1mM 2-巯基乙醇(Sigma M7522)、3μM CHIR99021(Stemgent 04-0004)、1μM PD0325901(Stemgent 04-0006)和1000U/mL白血病抑制剂因子(LIF)(ESGRO ESG1107)的DMEM/F12(Gibco 11320)。
血清/LIF培养基的组成如下:补充有15%胎牛血清(Sigma F4135)、2mM L-谷酰胺(Gibco 25030)、1X MEM非必需氨基酸、100U/mL青霉素-链霉素(Gibco 15140)、0.1mM 2-巯基乙醇(Sigma M7522)和1000U/mL白血病抑制剂因子(LIF)(ESGRO ESG1107)的基因敲除DMEM(Gibco 10829)。
基因组编辑
使用CRISPR/Cas9系统来产生遗传学修饰的ESC株。靶特异性序列克隆至含有sgRNA骨架、Cas9的密码子优化形式和mCherry或BFP(来自R.Jaenisch的礼物)的质粒中。关于经MeCP2-mEGFP和HP1a-mCherry内源标记株的产生,使用NEBuilder HiFi DNA MasterMix(NEB E2621S)将同源定向修复模板克隆至pUC19中。所述同源修复模板由任一侧侧接使用PCR从基因组DNA扩增的800bp同源臂的mEGFP或mCherry cDNA序列组成。
为了产生细胞系,使用Lipofectamine 3000(Invitrogen L3000)用833ng Cas9质粒和1666ng非线性化同源修复模板转染750,000个细胞。细胞在转染之后48小时关于在Cas9质粒上编码的mCherry或BFP荧光蛋白的存在进行分选以富集转染的细胞。使这一群体扩增持续1周,接着关于GFP或mCherry的存在第二次进行分选。40,000个GFP阳性细胞以连续稀释接种于6孔板中并且使其扩增持续一周,接着将个别集落手动地挑选至96孔板中。24个集落使用PCR基因分型关于成功靶向进行筛选以确认插入。
活细胞成像
活细胞成像条件
细胞在35mm玻璃板(Mattek Corporation P35G-1.5-20-C)上生长并且在2i/LIF培养基中使用具有Airyscan检测器(Zeiss,Thornwood,NY)的LSM880共聚焦显微镜成像。细胞在补充有37℃潮湿空气的37℃加热台上成像。另外,所述显微镜封闭于加热至37℃的孵育室中。ZEN black edition 2.3版(Zeiss,Thornwood NY)用于采集。用具有Plan-Apochromat 63x/1.4油物镜的超分辨率(SR)模式的Airyscan检测器采集图像。原始Airyscan图像使用ZEN 2.3(Zeiss,Thornwood NY)进行处理。
光漂白之后的荧光恢复(FRAP)
用488nm和561nm激光在LSM880Airyscan显微镜上执行FRAP。在100%激光功率下执行漂白并且每两秒收集图像。各图像使用LSM880Airyscan平均容量并且是两张图像的平均结果。组合的图像接着使用ZEN2.3进行处理。
光漂白之后的恢复通过首先减去背景值,并且接着定量漂白凝聚物内损失的荧光强度来计算,所述荧光强度针对独立、相邻细胞中的凝聚物内的信号标准化以说明光漂白。使用MATLAB脚本FRAPPA Profiler来计算图像中的强度值,不过使用定制分析来执行标准化。
MeCP2凝聚物体积的计算
使用ZEN 2.3软件来拍摄Z-堆栈图像。细胞用SiR-DNA染料(Spirochrome SC007)处理以对DNA染色用于简化聚焦程序。使用远红(SiR-DNA)信号来测定细胞核的上和下-z边界。接着,在488或561通道与643通道两者中以0.19微米逐步增加通过核原生质拍摄图像。图像是使用ZEN 2.3软件处理的单一Airyscan图像的结果。
为了定量MeCP2凝聚物的体积,使用SiR-DNA信号来界定给定细胞的核边界。使用这一边界来屏蔽488或561图像中的非核信号。一旦非核信号被屏蔽,使488和561图像经历7.0个像素的中值滤波,并且对象使用FIJI 3D Object计数器进行计数和定量,阈值为154。
分配系数的计算
使用Fiji来计算活细胞成像中的分配系数。使用每个细胞单一焦平面,对凝聚物内的平均信号强度进行定量并且与核边界内的8-12个非异染色质区的平均信号强度进行比较。异染色质区和核边界的限制被局限于Hoechst通道中。在所选择的平面中具有>3个异染色质焦点的细胞具有计算的分配系数。这一个别系数表示所述实验中的单一n。
蛋白质纯化
蛋白质表达载体克隆
人类cDNA克隆至T7pET表达载体的修饰形式中。对所述基础载体进行工程改造以包括编码N端6xHis的序列、随后mEGFP或mCherry和14个氨基酸的连接体序列“GAPGSAGSAAGGSG.”(SEQ ID NO:14)使用NEBuilder HiFi DNA Assembly Master Mix(NEBE2621S)在所述连接体序列之后同框插入通过PCR产生的cDNA序列。表达单独mEGFP的载体含有所述连接体序列、随后终止密码子。突变型cDNA序列通过PCR产生并且插入至如上文所述的相同基础载体中。所有表达构建体均进行测序以确认序列同一性。
蛋白质纯化
关于蛋白质表达,质粒如下转化至LOBSTR细胞中并且生长。新鲜细菌集落接种至含有卡那霉素和氯霉素的LB培养基中并且在37℃下生长过夜。细胞以1:30稀释于具有新鲜添加的卡那霉素和氯霉素的500mL预温LB中并且在37℃下生长1.5小时。为了诱导表达,IPTG以1mM最终浓度添加至细菌培养物中并且继续生长4小时。诱导的细菌接着通过离心集结成粒并且细菌集结粒存储于-80℃下直至准备使用。
500mL细胞集结粒再悬浮于15ml溶解缓冲液(50mM Tris-HCl pH 7.5、500mM NaCl和1X cOmplete蛋白酶抑制剂)中,随后进行声波处理(15秒打开、60秒切断的十个周期)。溶解产物通过在4℃下在12,000xg下离心持续30分钟被清除,添加至1mL预平衡的Ni-NTA琼脂糖中,并且在4℃下旋转持续1.5小时。所述浆液在3,000rpm下离心持续10分钟,用10体积的溶解缓冲液洗涤并且蛋白质通过用含有50mM咪唑、100mM咪唑或3X250mM咪唑的溶解缓冲液孵育持续10分钟或10分钟以上旋转、随后离心并且凝胶分析而进行洗脱。含有精确大小的蛋白质的洗脱份在4℃下针对含有50mM Tris-HCl pH 7.5、125mM NaCl、10%甘油和1mMDTT的缓冲液的两次变化进行透析。纯化的蛋白质的蛋白质浓度使用Pierce BCA蛋白质测定试剂盒(Thermo Scientific 23225)进行测定。
体外小液滴测定
体外小液滴测定
蛋白质存储于10%甘油、50mM Tris-HCl pH 7.5、500mM NaCl、1mM DTT中。使用Amicon Ultra离心过滤器(30K或50K MWCO,Millipore)将蛋白质浓缩至所需浓度。用于特定小液滴测定的反应条件在原稿中关于个别反应进行展示。小液滴测定在8管PCR条中执行。重组蛋白相分离在由10%PEG-8000、10%甘油、50mM Tris-HCl pH 7.5、1mM DTT和介于0mM至500mM范围内的变化盐构成的小液滴形成缓冲液中被诱导。接着,添加所需量的蛋白质以诱导相变,并且通过移液混合所述溶液。所述反应接着装载至由封固于双面胶带的两个平行条上的玻璃盖玻片产生的定制载玻片室上,所述双面胶带封固于玻璃显微术载玻片或玻璃底384孔板上。所述反应接着在具有100x物镜的Andor共聚焦显微镜上成像。除非另外指示,否则所呈递的图像具有沉降于玻璃盖玻片或384孔板的玻璃底上的小液滴。
数据分析
为了分析体外相分离成像实验,书写定制的MATLAB脚本以鉴定小液滴并且表征其大小、纵横比、凝聚分数和分配因子。关于任何特定实验条件,使用基于直方图的峰的强度阈值和大小阈值(2个像素半径)使所述图像区段化,此时所关注的区被定义并且信号强度可能在小液滴内部和外部进行定量。
核萃取物中的小液滴测定
核萃取物的制备
核萃取物是由HEK293T细胞制备。细胞通过强力移液从培养板移出,此时其在1,000Xg下集结成粒。集结粒再悬浮于添加有新鲜蛋白酶抑制剂的TMSD50缓冲液(20mMHEPES、5mM MgCl2 250mM蔗糖、1mM DTT、50mM NaCl)中。细胞在TMSD50缓冲液中在4摄氏度下搅拌持续30分钟以萃取细胞核。所述溶液接着在3,500Xg下短暂离心持续10分钟。细胞核在Mnase缓冲液(20mM HEPES、100mM NaCl、5mM MgCl2、5mM CaCl2、蛋白酶抑制剂)中进行洗涤并且再次在3,500Xg下短暂离心。细胞核接着再悬浮于一个集结粒体积的Mnase缓冲液中并且在37摄氏度下用1U Mnase处理持续15分钟。用一个集结粒体积的停止缓冲液(20mMHEPES、500mM NaCl、5mM MgCl2、20%甘油、15mM EGTA、蛋白酶抑制剂)停止反应。消化的细胞核接着在尖端声波发生器中在幅度20下进行20次声波处理并且在2,700Xg下短暂离心两次以移除碎片。
核萃取物小液滴形成
具有核萃取物的小液滴形成测定通过将储备核萃取物1:2稀释至缓冲液B(10%甘油、20mM HEPES)中以降低总盐至150mM NaCl来执行。在8孔PCR条中执行测定,其中反应在装载于玻璃底384孔板上之前孵育持续15分钟。使小液滴沉降于所述板的玻璃底上持续15分钟,接着在Andor共聚焦显微镜上以150X成像。
核萃取物集结成粒
如上文在1.5mL Eppendorf管中形成小液滴并且孵育持续10分钟。此时,反应在2,700Xg下离心持续10分钟。移除所有上清液。所述管接着用1mL小液滴形成缓冲液(20mMHEPES、15%甘油、150mM NaCl、6.6mM MgCl2、5mM EGTA、1.7mM CaCl2)轻柔地洗涤。在移除洗涤溶液之后,25%βME、25%XT缓冲液(Bio-rad)、50%水添加至管中以制备用于western印迹的集结粒部分。用于小液滴形成的10%材料也与βME、XT缓冲液和水组合用于western印迹。
Western印迹分析
上文所述的蛋白质溶液在10%Bis-Tris凝胶(Bio-Rad)上在80V下跑胶持续15分钟,随后在150V下跑胶持续约1.5h。蛋白质接着在260mA下在4摄氏度转移缓冲液(25mMTris、192mM甘氨酸、10%甲醇)中转移至0.45μm PVDF膜(Millipore,IPVH00010)持续2小时。膜接着在室温下在TBST中的5%脱脂乳中阻断持续1h。膜接着在4摄氏度下在TBST中的5%乳中用针对所指示的蛋白质的抗体孵育过夜,同时振荡。膜接着用TBST洗涤3次,每次持续10分钟,在室温下用第二抗体孵育持续1h,用TBST再洗涤3次并且在Bio-Rad chemidoc上使用ECL或fempto-ECL底物(Thermo Scientific)成像。
qPCR分析
使用RNeasy试剂盒(Qiagen)收集RNA。接着使用Superscript3(Invitrogen)执行逆转录酶反应。使用以下TaqMan探针执行qPCR:
mL1-Orf2a_1f-cctccattgttggtgggatt(SEQ ID NO:221);mL1-Orf2a_2r-ggaaccgccagactgatttc(SEQ ID NO:222);mGapdh_1f-ccatgtagttgaggtcaatgaagg(SEQ IDNO:223);mGapdh_2r-tggtgaaggtcggtgtgaa(SEQ ID NO:224)。
免疫荧光
鼠科动物ESC接种于用聚-L-鸟氨酸和层粘连蛋白涂布的玻璃盖玻片上。24小时之后,细胞用PBS中的4%聚甲醛固定。细胞接着用PBS洗涤3次,用PBS中的0.5%Triton-X100渗透。细胞接着用PBS洗涤3次。细胞在PBS中的4%无IgG BSA中阻断持续1h,并且接着在室温下在潮湿室中用4%无IgG BSA中的所指示抗体染色过夜。细胞接着用PBS洗涤3次。第二抗体添加至4%无IgG BSA中的细胞中并且在室温下孵育持续1h。细胞接着在PBS中洗涤2次。细胞用milliQ水中的Hoecsht染料染色持续5分钟,并且接着封固于Vectashield封固介质中。在RPI转盘式共聚焦上在100x放大率下执行成像。
IDR表达载体的转染
使用Lipofectamine 3000(Life Technologies)转染细胞。750,000个鼠科动物ESC进行计数并且接种于凝胶化6孔皿上。在接种之后即刻,根据Lipofectamine 3000试剂盒说明书制备的DNA混合物添加至细胞中。24小时后,细胞是胰蛋白酶化并且分裂至用聚-L-鸟氨酸和层粘连蛋白涂布的35mm玻璃底皿(Matek)上用于成像。
参考文献
Adams,V.H.et al.,2007.Intrinsic disorder and autonomous domainfunction in the multifunctional nuclear protein,MeCP2.Journal of BiologicalChemistry,282(20),pp.15057-15064.
Allshire,R.C.&Madhani,H.D.,2018.Ten principles of heterochromatinformation and function.Nature Reviews Molecular Cell Biology,19(4),pp.229-244.
Amir,R.E.et al.,1999.Rett syndrome is caused by mutations in X-linkedMECP2,encoding methyl-CpG-binding protein 2.Nature Genetics,23(october),pp.185-188.
Ausió,J.,de Paz,A.M.artíne.&Esteller,M.,2014.MeCP2:the long trip froma chromatin protein to neurological disorders.Trends in molecular medicine,20(9),pp.487-498.
Banani,S.F.et al.,2017.Biomolecular condensates:organizers ofcellular biochemistry.Nature Reviews Molecular Cell Biology,18(5),pp.285-298.
Bannister,A.J.et al.,2001.Selective recognition of methylated lysine9 on histone H3 by the HP1 chromo domain.Nature,410,pp.120-124.
Brangwynne,C.P.et al.,2009.Germline P granules are liquid dropletsthat localize by controlled dissolution/condensation.Science,5(June),pp.1729-1732.
Brangwynne,C.P.,2013.Phase transitions and size scaling of membrane-less organelles.Journal of Cell Biology,203(6),pp.875-881.
Burke,K.A.et al.,2015.Residue-by-Residue View of In Vitro FUSGranules that Bind the C-Terminal Domain of RNA Polymerase II,Molecular Cell,60(2),pp.231-241.
Cheutin,T.et al.,2003.Maintenance of stable heterochromatin domainsby dynamic HP1 binding.Science,299(5607),pp.721-725.
Chiolo,I.et al.,2011.Double-strand breaks in heterochromatin moveoutside of a dynamic HP1a domain to complete recombinational repair.Cell,144(5),pp.732-744.
Van Esch,H.et al.,2005.Duplication of the MECP2 Region Is a FrequentCause of Severe Mental Retardation and Progressive Neurological Symptoms inMales.The American Journal of Human Genetics,77(3),pp.442-453.
Festenstein,R.et al.,2003.Modulation of Heterochromatin Protein 1Dynamics in Primary Mammalian Cells.Science,299(5607),pp.719-721.
Ghosh,R.P.et al.,2010.Unique physical properties and interactions ofthe domains of methylated DNA binding protein 2.Biochemistry,49(20),pp.4395-4410.
Grewal,S.I.S.&Jia,S.,2007.Heterochromatin revisited.Nature ReviewsGenetics,8(1),pp.35-46.
Guy,J.et al.,2011.The Role of MeCP2 in the Brain.Annual Review ofCell and Developmental Biology,27(1),pp.631-652.
Hendrich,B.&Bird,A.,1998.Identification and Characterization of aFamily of Mammalian Methyl-CpG Binding Proteins.Molecular and CellularBiology,18(11),pp.6538-6547.
Hyman,A.A.,Weber,C.A.&Jülicher,F.,2014.Liquid-Liquid Phase Separationin Biology.Annual Review of Cell and Developmental Biology,30(1),pp.39-58.
Imbeault,M.,Helleboid,P.Y.&Trono,D.,2017.KRAB zinc-finger proteinscontribute to the evolution of gene regulatory networks,Nature,543(7646),pp.550-554.
Ip,J.P.K.,Mellios,N.&Sur,M.,2018.Rett syndrome:insights into genetic,molecular and circuit mechanisms.Nature Reviews Neuroscience.
Kato,M.et al.,2012.Cell-free formation of RNA granules:Low complexitysequence domains form dynamic fibers within hydrogels.Cell,149(4),pp.753-767.
Lachner,M.et al.,2001.Methylation of histone H3 lysine 9 creates abinding site for HP1 proteins.Nature,410(6824),pp.116-120.
Larson,A.G.et al.,2017.Liquid droplet formation by HP1αsuggests arole for phase separation in heterochromatin.Nature,547(7662),pp.236-240.
Lewis,J.D.et al.,1992.Purification.sequence,and cellular localizationof a novel chromosomal protein that binds to Methylated DNA.Cell,69(6),pp.905-914.
Lin,Y.et al.,2015.Formation and Maturation of Phase-Separated LiquidDroplets by RNA-Binding Proteins.Molecular Cell,60(2),pp.208-219.
Lyst,M.J.&Bird,A.,2015.Rett syndrome:A complex disorder with simpleroots.Nature Reviews Genetics,16(5),pp.261-274.
Meehan,R.R.,Lewis,J.D.&Bird,A.P.,1992.Characterization of Mecp2,aVertebrate Dna-Binding Protein With Affinity for Methylated Dna.Nucleic AcidsResearch,20(19),p.5085-5092 ST-CHARACTERIZATIONOF MECP2,A VERTE.
Nakano,M.et al.,2008.Inactivation of a Human Kinetochore by SpecificTargeting of Chromatin Modifiers.Developmental Cell,14(4),pp.507-522.
Nan,X.,Meehan,R.R.&Bird,A.,1993.Dissection of the methyl-CpG bindingdomain from the chromosomal protein MeCP2.Nucleic Acids Research,21(21),pp.4886-4892.
Nott,T.J.et al.,2015.Phase Transition of a Disordered Nuage ProteinGenerates Environmentally Responsive Membraneless Organelles.Molecular Cell,57(5),pp.936-947.
Sabari,B.R.et al.,2018.Coactivator condensation at super-enhancerslinks phase separation and gene control.Science,361(6400).
Shin,Y.&Brangwynne,C.P.,2017.Liquid phase condensation in cellphysiology and disease.Science,357(6357).
Skene,P.J.et al.,2010.Neuronal MeCP2 Is Expressed at Near Histone-Octamer Levels and Globally Alters the Chromatin State.Molecular Cell,37(4),pp.457-468.
Soufi,A.,Donahue,G.&Zaret,K.S.,2012.Facilitators and impediments ofthe pluripotency reprogramming factors’initial engagement with thegenome.Cell,151(5),pp.994-1004.
Strom,A.R.et al.,2017.Phase separation drives heterochromatin domainformation.Nature,547(7662),pp.241-245.
Tate,P.,Skarnes,W.&Bird,A.,1996.The methyl-CpG binding protein MeCP2is essential for embryonic development in the mouse.Nat Genet,12,pp.205-208.
Wakefield,R.I.D.et al.,1999.The solution structure of the domain fromMeCP2 that binds to methylated DNA.Journal of Molecular Biology,291(5),pp.1055-1065.
Wang,J.,Jia,S.T.&Jia,S.,2016.New Insights into the Regulation ofHeterochromatin.Trends in Genetics,32(5),pp.284-294.
实施例5
定义各细胞的身份的基因表达程序由以下控制:主转录因子(TF),其建立细胞类型特异性增强子;和信号传导因子,其携带细胞外刺激物至所述增强子。信号传导因子在不同细胞类型中表达并且具有极少DNA结合序列特异性,但通过知之甚少的机制被募集至细胞类型特异性增强子。近期研究已揭露主TF在增强子处与共活化子形成相分离的凝聚物。此处,我们提供如下证据,即用于WNT、TGF-β和JAK/STAT途径的信号传导因子使用其固有无序区(IDR)进入并且浓缩于超级增强子驱动的基因处的介体凝聚物中。我们主张对信号传导的反应的细胞类型特异性部分地由信号传导因子的IDR介导,所述IDR使这些因子分配至在细胞身份中具有突出作用的基因处通过主TF和介体建立的凝聚物中。
已经描述数种机制来说明信号传导因子优先地结合给定细胞类型的活性增强子和超级增强子的能力。信号传导因子以弱亲和力结合于以高频率存在于哺乳动物基因组中的相对较小序列基序(Farley等人,2015),并且优选结合于活性增强子中的序列可部分地反映接近与活性增强子缔合的“开放染色质”(Mullen等人,2011)。信号传导因子还可归因于通过这些增强子处其他TF的结合介导的DNA中的结构变化而青睐于结合所述位点(Hallikas等人,2006;Zhu等人,2018),或经由与主TF的直接蛋白质-蛋白质相互作用协作性地结合(Kelly等人,2011)。
近期研究已经揭露主TF和介体共活化子在超级增强子处形成相分离的凝聚物,所述凝聚物在关键细胞身份基因处区域化并且浓缩转录装置(Boija等人,2018;Cho等人,2018;Sabari等人,2018)。信号传导因子已经显示对细胞类型特异性超级增强子具有特殊偏好(Hnisz等人,2015),从而使我们推测信号传导因子可能具有使其分配至超级增强子处的转录凝聚物中(关于细胞类型特异性增强子缔合,先前未表征的机制)的特性。此处,我们报告信号传导因子响应于超级增强子驱动的基因处的信号传导刺激物以细胞类型特异性方式与共活化子相分离。我们主张相分离通过使信号传导因子寻址于主TF驱动的转录凝聚物而帮助实现信号传导的背景依赖性特异性。
结果
信号传导因子信号依赖性并入至超级增强子处的凝聚物中
近期研究已经显示TF和介体在超级增强子处形成相分离的凝聚物(Boija等人,2018;Cho等人,2018;Sabari等人,2018)并且WNT、JAK/STAT和TGF-β途径的末端信号传导因子(分别为β-连环蛋白、STAT3和SMAD3)已经显示优先地占据超级增强子(Hnisz等人,2015)。为了测试这些信号传导因子是否并入至超级增强子缔合基因处的凝聚物中,我们执行关于Nanog的RNA FISH,与关于三种信号传导因子中任一者的免疫荧光组合(图52A)。对于多能性至关重要的基因Nanog在小鼠胚胎干细胞(mESC)中与由这三种信号传导因子和介体占据的超级增强子缔合,如通过ChIP-测序所示(图52B)。我们发现在个别细胞中的Nanog基因座处关于所有三种因子可能观察到凝聚焦点(图52A),表明所有三种因子均并入至超级增强子缔合的凝聚物中。在其中已经证明转录凝聚物出现于mESC中的另外的超级增强子基因座处获得相似结果(Boija等人,2018;Sabari等人,2018)(图58A、B)。为了确认信号传导因子与这一基因座的缔合是细胞类型特异性的,我们使用免疫荧光与DNA FISH的组合来研究β-连环蛋白是否凝聚C2C12成肌细胞中与Nanog重叠的焦点;在C2C12细胞中的这一基因座处未检测到β-连环蛋白信号(图58C)。这些结果与如下观念一致,即信号传导因子并入至细胞类型特异性超级增强子凝聚物中。为了确认β-连环蛋白、STAT3和SMAD3信号传导因子在途径刺激时并入至核凝聚物中,我们在用于各信号传导途径的刺激物存在或不存在下在mESC中执行关于那些因子的免疫荧光。我们发现当所有三种信号传导因子各自的信号传导途径活化时,其均通过免疫荧光被检测为凝聚核焦点(图52C)。这些结果指示β-连环蛋白、SMAD3和STAT3在途径活化时并入至核凝聚物中。
由超级增强子处的转录因子和介体形成的凝聚物展现液体样行为(Boija等人,2018;Cho等人,2018;Sabari等人,2018)。液体-液体相分离的凝聚物的特点是动态内部重组和快速交换动力学(Banani等人,2017;Hyman等人,2014;Shin和Brangwynne,2017),其可通过测量光漂白之后的荧光恢复(FRAP)速率来查询。为了测试信号传导因子是否展现这种类型的行为,我们在组成性WNT活化的HCT116细胞中的β-连环蛋白基因的内源基因座处引入mEGFP-标签,确认表达于这些细胞中的经mEGFP标记β-连环蛋白的水平类似于正常表达于这些细胞中的那些(图58D),并且通过FRAP检查这些凝聚物的行为。β-连环蛋白核色斑在数秒时标中恢复(图52D),具有0.004±0.003μm2/s的近似表观扩散系数。这些值类似于液体样凝聚物的先前所述组分的那些(Nott等人,2015;Pak等人,2016,Sabari等人,2018),指示含有β-连环蛋白的凝聚物展现液体样特性。
纯化的信号传导因子可在体外形成凝聚物
β-连环蛋白、STAT3和SMAD3的氨基酸序列的分析揭露了其含有固有无序区(IDR)(图53A、图59)。因为IDR能够形成微弱相互作用的动态网络并且已牵涉于凝聚物形成中(Burke等人,2015;Lin等人,2015;Nott等人,2015),我们研究这些信号传导蛋白是否可能在体外形成相分离的小液滴。实际上,纯化的重组mEGFP-β-连环蛋白、mEGFP-STAT3和mEGFP-SMAD3形成浓度依赖性小液滴(图53B)。所述小液滴是球形、微米大小并且在溶液中自由地移动。这些蛋白质的小液滴形成行为在微摩尔浓度下展现致密相与稀相之间的分配比转换,与经历相分离的蛋白质的行为一致(图53B)。这些小液滴的进一步表征揭露了其可通过稀释逆转并且对增加的盐浓度敏感(图53C),这些是液体-液体相分离的小液滴所特有的行为。
纯化的信号传导因子在体外并入至介体凝聚物中
在超级增强子处形成的转录凝聚物含有高浓度的介体共活化子,并且转录因子通过对于其活化域的相分离至关重要的相同残基与介体相互作用(Sabari等人,2018;Boija等人,2018)。已知β-连环蛋白、SMAD3和STAT3的小液滴形成特性和其体内定位,我们推断这些信号传导蛋白可能也与介体凝聚物相互作用,并且浓缩至介体凝聚物中。为了测试这一观念,我们使用介体复合物的替代物MED1-IDR(Boija等人,2018)在PEG-8000中形成小液滴,添加稀信号传导因子至所述溶液中,并且监测MED1-IDR小液滴中信号传导因子的并入(图54A)。我们发现β-连环蛋白、SMAD3和STAT3并入并且浓缩于MED1-IDR小液滴中(图54B、C)。
在哺乳动物细胞中在纳摩尔浓度下发现β-连环蛋白、SMAD3和STAT3(Beck等人,2017),但所述重组信号传导蛋白在体外形成小液滴时所处的浓度是在微摩尔浓度范围内(图53B)。这使我们研究信号传导因子在介体存在下在纳摩尔浓度下是否可形成小液滴,其中其本身无法形成可检测的小液滴。在这些测定中,信号传导因子也有效地分配至MED1-IDR小液滴中(图54D)。这些结果与信号传导因子分配至介体凝聚物中会促进信号传导因子定位于超级增强子处的转录凝聚物中的可能性一致。
β-连环蛋白的相分离和靶基因的活化依赖于芳香族氨基酸
如果信号传导因子在超级增强子处的富集通过其IDR的相分离特性和并入至介体凝聚物中而发生,那么将预期IDR中影响其在体外形成相分离的小液滴的能力的突变会影响其在体内靶向并且活化基因的能力。为了测试这一假设,我们将进一步研究集中于β-连环蛋白并且试图鉴定所述蛋白质中负责其相分离特性的部分。β-连环蛋白由具有由N端IDR和C端IDR围绕的犰狳重复序列的中央、结构化域组成(图55A)。小液滴测定显示仅含有犰狳重复序列或N端或C端IDR的重组蛋白不能在所测试的任何浓度下进行相分离(图55B),表明单独这些组分不会促进完整蛋白的相分离特性并且两种IDR均是这一行为所需的。
我们接着致力于两种IDR内可能促进凝聚的氨基酸残基,并且注意芳香族残基的丰度(图59)。我们产生β-连环蛋白的突变形式,其中两种IDR中的芳香族残基用丙氨酸取代(图55C)。这些类型的突变扰乱π-阳离子相互作用,所述相互作用在多种蛋白质的相分离能力中发挥重要作用(Frey等人,2018;Wang等人,2018)。当在小液滴形成测定中测试时,β-连环蛋白的突变形式无法形成小液滴(除非在极高浓度下),其中观察到极小的小液滴(图55C)。当在使用MED1-IDR的异型小液滴形成测定中测试时,突变型β-连环蛋白无法并入并且浓缩于MED1-IDR小液滴中(图55D、E)。这些结果表明,β-连环蛋白的IDR中的芳香族残基促进其相分离行为。
为了测试IDR中的芳香族残基是否会促进β-连环蛋白的体内功能,编码β-连环蛋白的经TdTomato标记野生型和突变形式的构建体在多西环素诱导性启动子的控制下整合至mESC的基因组中(图56A)并且在由多西环素活化之后执行β-连环蛋白的ChIP-qPCR。如所预期,发现野生型β-连环蛋白占据WNT反应性基因Myc、Sp5和Klf4,而在这些增强子处发现较低水平的芳香族突变体(图56B)。这一差异性占有率由这些基因的较低表达水平反映(图56B)。这些结果表明,β-连环蛋白IDR中的芳香族残基是体内凝聚物形成和β-连环蛋白在增强子处的适当缔合和功能两者所必需的。
我们在使用β-连环蛋白的野生型和突变形式的荧光素酶测定中独立地测试β-连环蛋白芳香族突变体反式活化WNT反应性报告基因的能力(图56C)。野生型β-连环蛋白的表达会刺激荧光素酶活性的8倍增加,而芳香族突变体的表达对荧光素酶报告基因具有极少影响(图56C)。这些结果还支持如下观念,即体外与介体形成凝聚物所必需的β-连环蛋白氨基酸对于体内基因活化也是至关重要的。
本文所用的β-连环蛋白的序列:
β-连环蛋白N端IDR序列:
Gctactcaagctgatttgatggagttggacatggccatggaaccagacagaaaagcggctgttagtcactggcagcaacagtcttacctggactctggaatccattctggtgccactaccacagctccttctctgagtggtaaaggcaatcctgaggaagaggatgtggatacctcccaagtcctgtatgagtgggaacagggattttctcagtccttcactcaagaacaagtagctgatattgatggacagtatgcaatgactcgagctcagagggtacgagctgctatgttccctgagacattagatgagggcatgcagatcccatctacacagtttgatgctgctcatcccactaatgtccagcgtttggctgaaccatcacagatgctg(SEQ ID NO:249)
>β-连环蛋白_C端IDR:
Ccacaagattacaagaaacggctttcagttgagctgaccagctctctcttcagaacagagccaatggcttggaatgagactgctgatcttggacttgatattggtgcccagggagaaccccttggatatcgccaggatgatcctagctatcgttcttttcactctggtggatatggccaggatgccttgggtatggaccccatgatggaacatgagatgggtggccaccaccctggtgctgactatccagttgatgggctgccagatctggggcatgcccaggacctcatggatgggctgcctccaggtgacagcaatcagctggcctggtttgatactgacctg(SEQID NO:250)
>β-连环蛋白N端IDR,其中芳香族残基转化为丙氨酸:
Gctactcaagctgatttgatggagttggacatggccatggaaccagacagaaaagcggctgttagtcacgcgcagcaacagtctgccctggactctggaatccattctggtgccactaccacagctccttctctgagtggtaaaggcaatcctgaggaagaggatgtggatacctcccaagtcctggctgaggcggaacagggagcttctcagtccgccactcaagaacaagtagctgatattgatggacaggctgcaatgactcgagctcagagggtacgagctgctatggcccctgagacattagatgagggcatgcagatcccatctacacaggctgatgctgctcatcccactaatgtccagcgtttggctgaaccatcacagatgctg(SEQ ID NO:251)
>β-连环蛋白_C端IDR,其中芳香族残基转化为丙氨酸:
Ccacaagatgccaagaaacggctttcagttgagctgaccagctctctcgccagaacagagccaatggctgcgaatgagactgctgatcttggacttgatattggtgcccagggagaaccccttggagctcgccaggatgatcctagcgctcgttctgctcactctggtggagctggccaggatgccttgggtatggaccccatgatggaacatgagatgggtggccaccaccctggtgctgacgctccagttgatgggctgccagatctggggcatgcccaggacctcatggatgggctgcctccaggtgacagcaatcagctggccgcggctgatactgacctg(SEQ ID NO:252)
β-连环蛋白-凝聚物相互作用可独立于TCF因子发生
β-连环蛋白不具有DNA结合活性并且关于β-连环蛋白募集至基因的常规模型涉及其犰狳重复序列与TCF/LEF家族DNA结合转录因子之间的结构化相互作用。如果β-连环蛋白通过允许β-连环蛋白在体内凝聚的动态相互作用募集至介体凝聚物,那么这应在TCF/LEF因子不存在下发生。我们开发一系列测定来测试这一观念。
我们首先通过使用凝聚物测定来研究β-连环蛋白是否可能在体内并入至MED1凝聚物中,所述凝聚物测定最初开发用于研究核光斑(Janicki等人,2004)(图57A)。MED1-IDR被系栓至U2OS细胞中的LacI结合位点阵列,所述细胞具有组成性活化的WNT信号传导途径(Chen等人,2015)并且因此在细胞核中具有可检测水平的β-连环蛋白。细胞用LacI-MED1-IDR或对照LacI短暂地转染。发现LacI-MED1-IDR而非单独LacI将内源β-连环蛋白募集至所述lac阵列(图57A)。这一效应有可能未通过与TCF/LEF的相互作用和与DNA的直接相互作用介导,因为所述lac阵列不含TCF基序并且在LacI-MED1-IDR焦点处未通过IF检测到TCF4(图57B)。异染色质结合蛋白HP1α用作对照物并且未被募集至所述阵列(图61A)。当经TdTomato标记野生型和芳香族突变型β-连环蛋白异位表达时,积聚于MED1-IDR处的所述经TdTomato标记野生型β-连环蛋白占据lac阵列,而所述经TdTomato标记芳香族突变体的积聚显著降低(图57C)。这些结果表明,β-连环蛋白在TCF4不存在下在体内并入至MED1-IDR凝聚物中并且其并入方式依赖于β-连环蛋白在体内并入并且浓缩于MED1凝聚物中所需的相同氨基酸。
为了进一步测试β-连环蛋白中使其与介体相分离的区是否足以在与TCF/LEF因子的相互作用不存在下使β-连环蛋白寻址于特定基因组基因座,我们工程改造β-连环蛋白-嵌合体蛋白,其中包括TCF相互作用域在内的犰狳重复序列由mEGFP置换。所述β-连环蛋白-嵌合体在多西环素诱导性启动子的控制下整合至HEK293T细胞中。关于GFP的ChIP-qPCR显示β-连环蛋白-嵌合体在WNT驱动基因SOX9、SMAD7、KLF9和GATA3处的富集,指示β-连环蛋白的IDR足以使mEGFP寻址于特定基因组基因座(图57D)。这一效应未归因于这些因子的表达的差异,因为所述嵌合体以与β-连环蛋白的野生型形式可相当的水平表达(图61B)。β-连环蛋白的C端IDR含有其反式活化域,因此我们试图研究β-连环蛋白-嵌合体是否还可能活化转录以及定位于精确基因组位置。当所述β-连环蛋白-嵌合体在荧光素酶报告基因测定中过表达时,其能够活化WNT-报告基因,不过其活化低于β-连环蛋白的野生型形式(图57E)。这些数据与如下观念一致,即β-连环蛋白可通过其与这种凝聚物相互作用的能力并且独立于其与TCF/LEF因子的经典相互作用被募集至介体凝聚物。
论述
不同细胞类型使用共享、发育重要信号传导途径的小集合来传递细胞外信息以相应地调节基因表达程序(Perrimon等人,2012)。在任一细胞类型中,WNT、TGF-β和JAK/STAT途径的效应子组分连接至大量潜在信号反应元件的仅一个小子集,青睐于结合通过那一细胞类型的主转录因子形成的活性增强子中的那些,因此产生细胞类型特异性反应(David和Massagué,2018;Hnisz等人,2015;Mullen等人,2011;Trompouki等人,2011)。已经为了说明这一偏好而描述的机制包括优先接近“开放染色质”(Mullen等人,2011)、接近通过其他TF的结合和与主TF的协作蛋白质-蛋白质相互作用引起的改变的DNA结构(Hallikas等人,2006;Kelly等人,2011)。信号传导因子对细胞类型特异性超级增强子具有特殊偏好的观察结果(Hnisz等人,2015)联合TF和介体在超级增强子处形成相分离的凝聚物的发现(Boija等人,2018;Cho等人,2018;Sabari等人,2018)使我们研究信号传导因子是否具有促进分配至超级增强子处的转录凝聚物中的特性。此处所述的证据主张信号传导的细胞类型依赖性特异性可至少部分地通过经由超级增强子处的相分离使信号传导因子寻址于转录凝聚物来实现。以这种方式,多种信号传导因子分子可能浓缩于所述凝聚物中并且占据基因组上的适当位点。
我们发现信号传导因子β-连环蛋白、STAT3和SMAD3出现于ESC中的信号反应性超级增强子处的凝聚色斑中,其中已经报告转录凝聚物含有数百个介体和RNA聚合酶II分子(Boija等人,2018;Cho等人,2018;Sabari等人,2018)。这些信号传导因子可在体外并入并且浓缩于介体亚单元凝聚物中,表明其进入介体凝聚物的能力可能促进其在体内与超级增强子处发现的介体凝聚物的优先缔合。实际上,将介体亚单元系栓至基因组位点的阵列会形成凝聚物,所述凝聚物可将这些信号传导因子中的至少一者β-连环蛋白募集至所述凝聚物并且在与其经典搭配物(DNA结合因子TCF4)的结构化相互作用不存在下也是如此。重要的是,降低体外β-连环蛋白-介体凝聚物并入的残基突变会降低β-连环蛋白在体内进入介体亚单元凝聚物并且活化转录的能力。
我们关于β-连环蛋白进入超级增强子凝聚物中所述的模型可帮助解释信号传导文献中的另外的难题。例如,已经报告β-连环蛋白与大量不同的蛋白质相互作用(Schuijers等人,2014)并且这种相互作用混乱已经导致如下提议,即除了TCF/LEF家族的规范募集者以外,大量DNA结合转录因子也具有募集β-连环蛋白的能力(Nateri等人,2005;Kouzmenko等人,2004;Essers等人,2005;Kaidi等人,2007;Botrugno等人,2004;Kelly等人,2011;Sinner等人,2004)。然而,这些报告的相互作用中的大多数未受到功能数据支持并且仅结合于TCF已经受到共结晶支持(Poy等人,2001;Sampietro等人,2006)。所述模型可能解释β-连环蛋白如何可能与转录凝聚物中的大量TF功能性地相互作用,而无法在其中可能未组装所述凝聚物的人工系统中活化转录。
此处所述的凝聚物模型可促进对如癌症的疾病中的病理性信号传导的进一步理解。失调的转录和信号传导实际上是癌症的两种特点(Bradner等人,2017)。癌细胞会发展基因组改变,所述基因组改变会在驱动者致癌基因处产生超级增强子(Chapuy等人,2013;Hnisz等人,2013;Lin等人,2016;Mansour等人,2014;Zhang等人,2016),并且这些致癌基因尤其可响应于致癌信号传导(Hnisz等人,2015)。促进致癌信号传导的信号传导因子一般地可通过还促进相分离的特性与超级增强子凝聚物相互作用。以这种方式,依赖于特定信号传导途径的肿瘤细胞可能通过使用替代信号传导途径而获得对疗法的抗性,所述替代信号传导途径的信号传导因子可能并入至转录凝聚物中。靶向致癌信号传导途径和超级增强子组分两者的疗法可能将在具有信号传导和转录依赖性的肿瘤细胞中证明尤其有效。
星星方法
关键资源表
Figure BDA0002792767850002641
Figure BDA0002792767850002651
Figure BDA0002792767850002661
Figure BDA0002792767850002671
Figure BDA0002792767850002681
实验模型和主题细节
细胞系
V6.5鼠科动物胚胎干细胞是来自Jaenisch实验室的礼物。HEK293T和HCT116细胞获自ATCC。U2OS细胞获自Spector实验室。细胞常规地针对支原体进行测试。
细胞培养条件
V6.5鼠科动物胚胎干细胞在0.2%凝胶化(Sigma,G1890)组织培养板上在2i+LIF条件下生长。用于2i+LIF培养基条件的培养基如下:967.5mL DMEM/F12(GIBCO 11320)、5mLN2补充剂(GIBCO17502048)、10mL B27补充剂(GIBCO 17504044)、0.5mM L-谷酰胺(GIBCO25030)、0.5X非必需氨基酸(GIBCO 11140)、100U/mL青霉素-链霉素(GIBCO 15140)、0.1mMβ-巯基乙醇(Sigma)、1uM PD0325901(Stemgent 04-0006)、3uM CHIR99021(Stemgent 04-0004)和1000U/mL重组LIF(ESGRO ESG1107)。HEK293T、U2OS和HCT116细胞在具有10%胎牛血清(Hyclone,表征的SH3007103)、100U/mL青霉素-链霉素(GIBCO 15140)、2mM L-谷酰胺(Invitrogen,25030-081)的DMEM(高葡萄糖、丙酮酸盐)(GIBCO 11995-073)中培养。
细胞系刺激
关于WNT:细胞在2i+LIF培养基中在CHIR不存在下(mES)或在10%FBS DMEM培养基中的CHIR存在下(HEK293)用CHIR99021或IWP2(Sigma Aldrich I0536)处理持续24h。
关于SMAD3:细胞在2i+LIF培养基中用活化素A(R&D systems338-AC-010)或SB431542(Tocis Bioscience 16-141)处理持续24小时。关于STAT3:细胞用2i+LIF或2i-LIF培养基处理持续24小时。
细胞系产生
V6.5鼠科动物胚胎干细胞、HCT116结肠直肠癌细胞或HEK293T胚胎肾细胞使用CRISPR-Cas9系统进行遗传学修饰。靶向β连环蛋白的N端的导向序列克隆至具有mCherry可选择标记物和以下序列的px330载体中:CTGCGTGGACAATGGCTACT(SEQ ID NO:248)。与侧接mEGFP-标签的内源基因座具有800bp同源性的修复模板克隆至pUC19载体中。细胞用2.5μg两种构建体转染并且转染后两天关于mCherry进行分选并且转染后一周再次关于mEGFP进行分选。连续稀释细胞并且挑选集落以获得克隆细胞系。
FRAP
用488nm激光在LSM880Airyscan显微镜上执行FRAP。使用100%激光功率经r漂白≈1um执行漂白并且每两秒收集图像。使用FIJI测量荧光强度。减去背景强度并且相对于漂白前时间点报告值。
书写定制的MATLABTM脚本以处理强度数据,从而说明背景光漂白和针对漂白前强度的标准化。关于各细胞系和条件,经由9个重复样品对漂白后FRAP恢复数据求平均值。FRAP恢复曲线进行拟合:
Figure BDA0002792767850002691
免疫荧光
细胞在RT下固定于4%聚甲醛中持续10min,如Sabari等人2018中所述。细胞接着洗涤三次并且在RT下用PBS中的0.5TritonX 100渗透持续5min。在PBS中洗涤三次之后,细胞在RT下在4%牛血清白蛋白中阻断持续15min并且在室温下用4%BSA中的第一抗体孵育过夜。在PBS中洗涤三次之后,细胞在暗处用4%BSA中的第二抗体孵育持续1小时。细胞用PBS洗涤三次,随后在暗处在RT下用Hoechst孵育持续5min。载玻片用Vectashield H-1000封固并且盖玻片用透明指甲油密封并且存储于4C下。使用具有100x物镜的RPI转盘式共聚焦显微镜使用Metamorph软件和CCD摄影机采集图像。
共免疫荧光联合DNA FISH
在用第二抗体孵育之后,如早先所述执行免疫荧光,其中所述方案具有修改。在第二抗体之后,细胞在RT下在PBS中洗涤3次并且接着用PBS中的4%PFA固定持续20min并且用PBS洗涤三次。细胞在RT下在70%乙醇、85%乙醇和接着100%乙醇中孵育持续1min。用7μlFISH杂交缓冲液(Agilent G9400A)、1μl FISH探针和2μl水制得探针杂交混合物。5μl混合物添加于载玻片上并且将盖玻片放置于顶部。使用橡胶胶水密封盖玻片。一旦橡胶胶水凝固,基因组DNA和探针在78C下变性持续5分钟并且载玻片在暗处在16C下孵育过夜。盖玻片从载玻片移出并且在预温洗涤缓冲液1中在73C下孵育持续3min并且在洗涤缓冲液2中在RT下孵育持续1min。在RT下空气干燥载玻片并且用PBS中的Hoechst对细胞核染色持续5min。盖玻片在PBS中洗涤三次,使用Vectashield H-1000封固于载玻片上并且用指甲油密封。使用具有100x物镜的RPI转盘式共聚焦显微镜使用MetaMorph采集软件和Hammamatsu ORCA-ER CCD摄影机采集图像。DNA FISH探针由Agilent定制设计并且产生以靶向Nanog基因座。
共免疫荧光联合RNA FISH
如先前所述(Sabari等人,2018)在小修改下执行免疫荧光。免疫荧光在无RNase环境中执行,移液管和工作台用RNaseZap(Life Technologies,AM9780)处理。使用无RNasePBS并且抗体始终在无RNase PBS中进行稀释。在免疫荧光完成之后,细胞在RT下用PBS中的4%PFA后固定持续10min。细胞在无RNase PBS中洗涤两次。细胞在RT下用无RNase水(LifeTechnologies,AM9932)中的20%Stellaris RNA FISH洗涤缓冲液A(BiosearchTechnologies,Inc.,SMF-WA1-60)、10%去离子化甲酰胺(EMD Millipore,S4117)洗涤一次持续5min。细胞用90%Stellaris RNA FISH杂交缓冲液(Biosearch Technologies,SMF-HB1-10)、10%去离子化甲酰胺、12.5μM被设计成杂交SE缔合基因的转录物的内含子的Stellaris RNA FISH探针杂交。在37℃下执行杂交过夜。细胞接着在37℃下用洗涤缓冲液A洗涤持续30min并且细胞核在RT下用洗涤缓冲液A中的20μm/ml HOESCHT染色持续5min。在室温下用Stellaris RNA FISH洗涤缓冲液B(Biosearch Technologies,SMF-WB1-20)进行一次5-min洗涤之后。盖玻片如关于免疫荧光所述进行封固。在具有100x物镜的RPI转盘式共聚焦显微镜上使用MetaMorph采集软件和Hammamatsu ORCA-ER CCD摄影机采集图像。所用的第一抗体是抗MED1Abcam ab64965 1:500稀释、抗b连环蛋白Abcam ab22656 1:500稀释、抗pSTAT3Santa Cruz 1:20稀释、抗SMAD2/3Santa Cruz 1:20稀释)。所用的第二抗体是抗兔IgG、抗山羊IgG和抗小鼠IgG。
平均图像分析
关于RNA FISH联合免疫荧光的分析,书写定制的MATLABTM脚本以处理并且分析在RNA FISH和IF通道中收集的3D图像数据。FISH焦点在个别z-堆栈中通过强度和大小阈值鉴定,沿大小l=2.9μm的盒定中心,并且在z-堆栈当中以3-D缝合在一起。关于所鉴定的每一个FISH焦点,来自IF通道中的相应位置的信号在定中心于每一个相应z-切片处的RNA FISH焦点处的l x l正方形中加以收集。接着组合定中心于各FISH和IF对的FISH焦点处的IF信号并且计算平均强度投影,从而提供定中心于FISH焦点处的l x l正方形内的IF信号强度的平均数据。关于定中心于其本身坐标上的FISH信号强度进行相同过程,从而提供定中心于FISH焦点处的l x l正方形内的FISH信号强度的平均数据。作为对照,关于定中心于随机选择的核位置处的IF信号进行这一相同过程。关于各重复样品,从核包膜的内部产生40个随机核点,通过大的大小(200个像素)和强度(DNA致密)阈值的组合从DAPI通道鉴定。这些平均强度投影接着用于产生信号强度的2D轮廊图。轮廊图使用MATLABTM中的内置功能产生。关于轮廓图,所呈递的强度-颜色范围在颜色的线性范围内(n!=15)进行定制。关于FISH通道,使用黑色至品红色。关于IF通道,我们使用chroma.js(在线颜色生成器)在15个仓内产生颜色,其中关键转变颜色是选择为黑色、蓝紫色、中蓝色、绿黄色。进行此举以确保读者的眼睛可能更容易地检测信号对比度。所产生的颜色图用于所有IF图中的15个均匀间隔的强度仓。使用相同彩色比例尺对定中心于FISH处或随机选择的核位置处的平均IF作图,所述彩色比例尺经过设置以包括各图的最小和最大信号。
蛋白质纯化
编码所关注的基因或其IDR的cDNA克隆至T7pET表达载体的修饰形式中。所述基础载体经过工程改造以包括5’6xHIS、随后mEGFP或mCherry和14个氨基酸的连接体序列“GAPGSAGSAAGGSG.”(SEQ ID NO:14)使用
Figure BDA0002792767850002721
HiFi DNA Assembly Master Mix(NEB E2621S)与连接体氨基酸同框插入这些序列(通过PCR产生)。表达单独mEGFP或mCherry的载体含有所述连接体序列、随后终止密码子。突变体序列作为基因块(IDT)合成并且插入至如上文所述的相同基础载体中。所有表达构建体均进行测序以确保序列同一性。
关于蛋白质表达,质粒如下转化至LOBSTR细胞(Chessman Lab的礼物)中并且生长。新鲜细菌集落接种至含有卡那霉素和氯霉素的LB培养基中并且在37℃下生长过夜。含有MED1-IDR构建体的细胞以1:30稀释于具有新鲜添加的卡那霉素和氯霉素的500ml室温LB中并且在16℃下生长1.5小时。添加IPTG至1mM并且生长继续18小时。收集细胞并且冷冻存储于-80℃下。含有所有其他构建体的细胞以相似方式进行处理,除了其在IPTG诱导之后在37℃下生长持续5小时。
500mlβ连环蛋白突变细胞的集结粒再悬浮于含有cOmplete蛋白酶抑制剂(Roche,11873580001)的15ml变性缓冲液(50mM Tris 7.5、300mM NaCl、10mM咪唑、8M脲)中并且进行声波处理(15秒打开、60s切断的十个周期)。溶解产物通过在12,000g下离心持续30分钟被清除并且添加至1ml预平衡的Ni-NTA琼脂糖(Invitrogen,R901-15)中。含有这一琼脂糖溶解产物浆液的管在室温下旋转持续1.5小时。所述浆液在Thermo Legend XTR吊桶式转子中在3,000rpm下离心持续10分钟。集结粒用5ml溶解缓冲液洗涤2次,随后如上文在3,000rpm下离心10分钟。蛋白质用具有250mM咪唑的2ml溶解缓冲液洗脱3次。关于各周期,添加洗脱缓冲液并且旋转至少10分钟并且如上文进行离心。洗脱物在用库马斯染色的12%丙烯酰胺凝胶上进行分析。汇集含有期望大小的蛋白质的洗脱份,用250mM咪唑缓冲液1:1稀释并且首先针对含有50mM Tris pH 7.5、125Mm NaCl、1mM DTT和4M脲的缓冲液、随后针对含有2M脲的相同缓冲液并且最后针对具有10%甘油而无脲的缓冲液的2种变化进行透析。透析之后的任何沉淀物均通过在3.000rpm下离心持续10分钟而被移除。以相似方式纯化MED1-IDR和WTβ连环蛋白,除了溶解缓冲液不含脲,所述孵育在4C下进行并且透析至50mMTris pH7.5、125mM NaCl、10%甘油和1mM DTT的2种变化中。
体外小液滴形成测定
重组GFP或mCherry融合蛋白使用Amicon Ultra离心过滤器(30K MWCO,Millipore)进行浓缩并且脱盐至适当蛋白质浓度和125mM NaCl。重组蛋白添加至小液滴形成缓冲液(50mM Tris-HCl pH 7.5、10%甘油、1mM DTT)中具有变化浓度的所指示的最终盐和作为拥挤剂的10%PEG-8000的溶液中。所述蛋白质溶液立即装载至包含通过双面胶带的两个平行条附接的载玻片和盖玻片的自制室中。载玻片接着用具有150x物镜的Andor共聚焦显微镜成像。除非有所指示,否则所呈递的图像具有沉降于玻璃盖玻片上的小液滴。
盖玻片用PEG-硅烷涂布以便中和电荷。简单说来,盖玻片用2%Helmanex III洗涤持续2小时,用H2O洗涤三次并且用乙醇洗涤一次,接着在具有1%乙酸的乙醇中的0.5%PEG-硅烷中孵育过夜。其接着用乙烷洗涤一次并且在水浴声波发生器中在乙醇中进行声波处理持续15分钟,用H2O洗涤三次,接着用乙醇冲洗并且在空气中干燥。
异型小液滴分析
为了分析体外小液滴实验,书写使用scikit-image程序包的定制Python脚本以鉴定小液滴并且表征其大小、形状和强度。小液滴根据多种准则从所捕捉的通道的平均图像区段化:(1)在图像的平均值以上三个标准偏差的强度阈值,(2)大小阈值(9个像素的最小小液滴大小),(3)和最小圆度
Figure BDA0002792767850002741
(1是完美圆)。在区段化之后,计算各小液滴的平均强度,同时排除相界面附近的像素(Banani等人,2016)。对典型地5-10个独立视场中鉴定的数百个小液滴进行定量。关于各通道,计算所述小液滴内(C-in)和整体中(C-out)的平均强度。分配比是计算为(C-in)/(C-out)。盒形图显示所有小液滴的分布。图2b中关于分配比对蛋白质浓度的所测量数据集通过逻辑方程进行拟合(Wang等人,2018):
Figure BDA0002792767850002742
其中f是分配比并且x是相应蛋白质浓度。
RT-qPCR
使用Rneasy Plus Mini Kit(QIAGEN,74136)根据制造商的说明书分离RNA。使用具有oligo-dT引物(Promega,C1101)的SuperScript II逆转录酶(Invitrogen,18080093)根据制造商的说明书产生cDNA。在Applied Biosystems 7000、QuantStudio5和QuantStudio6仪器上使用用于SE基因的TaqMan探针执行定量实时PCR。
ChIP
细胞以4-5百万个细胞/板的密度进行接种并且24-48小时后加以收集。使用PBS中的1%甲醛来使细胞交联持续15分钟,随后在冰上用最终浓度是125mM的甘氨酸淬灭。细胞用冷PBS洗涤并且通过在冷PBS中刮擦细胞加以收集。所收集的细胞在4℃下在1500g下集结成粒持续5分钟,再悬浮于LB1(50mM Hepes-KOH pH 7.9、140mM NaCl、1mM EDTA 0.5mL0.5M、10%甘油、0.5%NP40、1%TritonX-100、1x蛋白酶抑制剂)中并且在4℃下孵育持续20分钟旋转。细胞在1350g下集结成粒持续5分钟,再悬浮于LB2(10mM Tris pH8.0、200mMNaCl、1mM EDTA、0.5mM EGTA、1x蛋白酶抑制剂)中并且在4℃下孵育持续5分钟旋转。集结粒以30-50百万个细胞/ml的浓度再悬浮于LB3(10mM Tris pH 8.0、100mM NaCl、1mM EDTA、0.5mM EGTA、0.1%脱氧胆酸钠、0.5%月桂酰肌氨酸钠、1%TritonX-100、1x蛋白酶抑制剂)中。细胞使用Covaris S220使用制造商的说明书进行声波处理持续12分钟,随后在4℃下在20 000g下短暂离心持续30分钟。用0.5%BSA预阻断的Dynabead用GFP抗体(Abcam,ab290)、Med1抗体(Abcam,ab64965)或dsRed(Takara,632496)抗体孵育持续6小时。染色质添加至抗体-珠粒复合物中并且在4℃下孵育,旋转过夜。珠粒在4℃下用各洗涤缓冲液1(50mM HepespH 7.5、500mM NaCl、1mM EDTA、1mM EGTA、1%Triton、0.1%NaDoc、0.1%SDS)和洗涤缓冲液2(20mM Tris pH 8、1mM EDTA、250mM LiCl、0.5%NP40、0.5%NaDoc)洗涤三次,随后在室温下用TE洗涤一次。染色质通过添加洗脱缓冲液(50mM Tris pH 8.0、10mM EDTA、1%十二烷基硫酸钠、20ug/ml RNaseA)至珠粒中进行洗脱并且在60℃下孵育,振荡持续30分钟。在58℃下执行交联的逆转持续4小时。添加蛋白酶K并且在37℃下孵育持续1-2小时用于蛋白质移除。使用Qiagen PCR纯化试剂盒来纯化DNA并且再悬浮于10mM Tris-HCL中。用SwiftBiosciences
Figure BDA0002792767850002761
2S Plus DNA库试剂盒根据试剂盒说明书制备ChIP库,其中在来自Sage Science的PippinHT系统上进行另外的大小选择步骤。在库制备之后,ChIP库在具有200-600个碱基的大小收集窗的PippinHT上的2%凝胶上跑胶。最终库通过qPCR用来自Roche的KAPA库定量试剂盒定量并且在Illumina HiSeq 2500上以用于40个碱基的单端测序模式测序。
ChIP-seq分析
使用bowtie以参数–k 1–m 1–best和设置为读出长度的–1比对ChIP-Seq数据与小鼠参考基因组的mm9形式。使用MACS以参数–w–S space=50–nomodel–shiftsize=200创建用于以仓展示读取覆盖率的Wiggle文件,并且每仓读数计数针对用于产生所述wiggle文件的数百万个定位的读数标准化(Zhang等人,2008)。每百万个读数标准化的wiggle文件展示于UCSC基因组浏览器中(Kent等人,2002)。
参考文献
Banani,S.F.,Lee,H.O.,Hyman,A.A.,and Rosen,M.K.(2017).Biomolecularcondensates:Organizers of cellular biochemistry.Nat.Rev.Mol.Cell Biol.18,285-298.
Beck,M.,Schmidt,A.,Malmstroem,J.,Claassen,M.,Ori,A.,Szymborska,A.,Herzog,F.,Rinner,O.,Ellenberg,J.,and Aebersold,R.(2011).The quantitativeproteome of a human cell line,Mol.Syst.Biol.7,1-8.
Boija,A.,Klein,I.A.,Sabari,B.R.,Dall’Agnese,A.,Coffey,E.L.,Zamudio,A.V.,Li,C.H.,Shrinivas,K.,Manteiga,J.C.,Hannett,N.M.,et al.(2018).Transcription Factors Activate Genes through the Phase-Separation Capacityof Their Activation Domains.Cell 1-14.
Botrugno,O.A.,Fayard,E.,Annicotte,J.-S.,Haby,C.,Brennan,T.,Wendling,O.,Tanaka,T.,Kodama,T.,Thomas,W.,Auwerx,J.,et al.(2004).Synergy between LRH-1and beta-catenin induces G1 cyclin-mediated cell proliferation.Mol.Cell 15,499-509.
Bradner,J.E.,Hnisz,D.,and Young,R.A.(2017).Transcriptional Addictionin Cancer.Cell 168,629-643.
Burke,K.A.,Janke,A.M.,Rhine,C.L.,and Fawzi,N.L.(2015).Residue-by-Residue View of In Vitro FUS Granules that Bind the C-Terminal Domain of RNAPolymerase II.Mol.Cell 60,231-241.
Chapuy,B.,McKeown,M.R.,Lin,C.Y.,Monti,S.,Roemer,M.G.M.,Qi,J.,Rahl,P.B.,Sun,H.H.,Yeda,K.T.,Doench,J.G.,et al.(2013).Discovery andcharacterization of super-enhancer-associated dependencies in diffuse large Bcell lymphoma.Cancer Cell 24,777-790.
Chen,C.,Zhao,M.,Tian,A.,Zhang,X.,Yao,Z.,and Ma,X.(2015).Aberrantactivation of Wnt/B-catenin signaling drives proliferation of bone sarcomacells.Oncotarget 6,17570-17583.
Cho,W.K.,Spille,J.H.,Hecht,M.,Lee,C.,Li,C.,Grube,V.,and Cisse,I.I.(2018).Mediator and RNA polymerase II clusters associate in transcription-dependent condensates.Science(80-.).361,412-415.
Darnell,J.,Kerr,I.,and Stark,G.(1994).Jak-STAT pathways andtranscriptional activation in response.Science(80-.).264,1415-1421.
David,C.J.,and Massagué,J.(2018).Contextual determinants of TGFβaction in development,immunity and cancer.Nat.Rev.Mol.Cell Biol.19,419-435.
Essers,M.A.G.,de Vries-Smits,L.M.M.,Barker,N.,Polderman,P.E.,Burgering,B.M.T.,and Korswagen,H.C.(2005).Functional interaction betweenbeta-catenin and FOXO in oxidative stress signaling.Science 308,1181-1184.
Farley,E.K.,Olson,K.M.,Zhang,W.,Brandt,A.J.,Rokhsar,D.S.,and Levine,M.S.(2015).Suboptimization of developmental enhancers.Science 350,325-328.
Frey,S.,Rees,R.,Schünemann,J.,Ng,S.C.,Fünfgeld,K.,Huyton,T.,and
Figure BDA0002792767850002781
D.(2018).Surface Properties Determining Passage Rates of Proteinsthrough Nuclcar Pores.Cell 174,202-217.e9.
Hallikas,O.,Palin,K.,Sinjushina,N.,Rautiainen,R.,Partanen,J.,Ukkonen,E.,and Taipale,J.(2006).Genome-wide prediction of mammalian enhancers basedon analysis of transcription-factor binding affinity.Cell 124,47-59.
Hnisz,D.,Abraham,B.J.,Lee,T.I.,Lau,A.,Saint-André,V.,Sigova,A.A.,Hoke,H.A.,and Young,R.A.(2013).Super-enhancers in the control of cellidentity and disease.Cell 155,934-947.
Hnisz,D.,Schuijers,J.,Lin,C.Y.,Weintraub,A.S.,Abraham,B.J.,Lee,T.I.,Bradner,J.E.,and Young,R.A.(2015).Convergence of Developmental and OncogenicSignaling Pathways at Transcriptional Super-Enhancers.Mol.Cell 58,362-370.
Hyman,A.A.,Weber,C.A.,and Jülicher,F.(2014).Liquid-Liquid PhaseSeparation in Biology.Annu.Rev.Cell Dev.Biol.30,39-58.
Janicki,S.M.,Tsukamoto,T.,Salghetti,S.E.,Tansey,W.P.,Sachidanandam,R.,Prasanth,K.V.,Ried,T.,Shav-Tal,Y.,Bertrand,E.,Singer,R.H.,et al.(2004).From silencing to gene expressinn:Real-time analysis in single cells.Cell116,683-698.
Kaidi,A.,Williams,A.C.,and Paraskeva,C.(2007).Interaction betweenβ-eatenin and HIF-1 promotes cellular adaptation to hypoxia.Nat.Cell Biol.9,210-217.
Kelly,K.F.,Ng,D.Y.,Jayakumaran,G.,Wood,G.A.,Koide,H.,and Doble,B.W.(2011).β-Catenin Enhances Oct-4 Activity and Reinforces Pluripotency througha TCF-Independent Mechanism.Cell Stem Cell 8,214-227.
Kent WJ,Sugnet CW,Furey TS,Roskin KM,Pringle TH,Zahler AM,Haussler D.(2002).The human genome browser at UCSC.Genome Res.12(6),996-1006.
Kouzmenko,A.P.,Takeyama,K.I.,Ito,S.,Furutani,T.,Sawatsubashi,S.,Maki,A.,Suzuki,E.,Kawasaki,Y.,Akiyama,T.,Tabata,T.,et al.(2004).Wnt/β-catenin andestrogen signaling converge in vivo.J.Biol.Chem.279,40255-40258.
Langmead,B.,Trapnell,C.,Pop,M.,and Salzberg,S.L.(2009).Ultrafast andmemory-efficient alignment of short DNA sequences to the human genome.GenomeBiol.10.
Lee,T.I.,and Young,R.A.(2013).Transcriptional regulation and itsmisregulation in disease.Cell 152,1237-1251.
Lin,C.Y.,Erkek,S.,Tong,Y.,Yin,L.,Federation,A.J.,Zapatka,M.,Haldipur,P.,Kawauchi,D.,Risch,T.,Warnatz,H.-J.,et al.(2016).Active medulloblas-tomaenhancers reveal subgroup-specific cellular origins.Nature 530,57-62.
Lin,Y.,Protter,D.S.W.,Rosen,M.K.,and Parker,R.(2015).Formation andMaturation of Phase-Separated Liquid Droplets by RNA-BindingProteins.Mol.Cell 60,208-219.
Mansour,M.R.,Abraham.B.J.,Anders,L.,Berezovskaya,A.,Gutierrez,A.,Durbin,A.D.,Etchin,J.,Lee,L.,Sallan,S.E.,Silverman,L.B.,et al.(2014).Anoncogenic super-enhancer formed through somatic mutation of a noncodlingintergenic element.Science(80-.).346,1373-1377.
Molenaar,M.,Van De Wetering,M.,Oosterwegel,M.,Peterson-Maduro,J.,Godsave,S.,Korinek,V.,Roose,J.,Destrée,O.,and Clevers,H.(1996).XTcf-3transcription factor mediatesβ-catenin-induced axis formation in xenopusembryos.Cell 86,391-399.
Mullen,A.C.,Orlando,D.A.,Newman,J.J.,Lovén,J.,Kumar,R.M.,Bilodeau,S.,Reddy,J.,Guenther,M.G.,Dekoter,R.P.,and Young,R.A.(2011).Master transcriptionfactors determine cell-type-specific responses to TGF-βsignaling.Cell 147,565-576.
Mullen,A.C.,and Wrana,J.L.(2017).TGF-βfamily signaling in embryonicand somatic stem-cell renewal and differentiation.Cold SpringHarb.Perspect.Biol.9
Nateri,A.S.,Spencer-Dene,B.,and Behrens,A.(2005).Interaction ofphosphorylated c-Jun with TCF4 regulates intestinal cancer development.Nature437,281-285.
Nott,T.J.,Petsalaki,E.,Farber,P.,Jervis,D.,Fussner,E.,Plochowietz,A.,Craggs,T.D.,Bazett-Jones,D.P.,Pawson,T.,Forman-Kay,J.D.,et al.(2015).PhaseTransition of a Disordered Nuage Protein Generates Environmentally ResponsiveMembraneless Organelles.Mol.Cell 57,936-947.
Nusse,R.,and Clevers,H.(2017).Wnt/β-Catenin Signaling,Disease,andEmerging Therapeutic Modalities.Cell 169,985-999.
Nüsslein-volhard,C.,and Wieschaus,E.(1980).Mutations affectingsegment number and polarity in drosophila.Nature 287,795-801.
Pak,C.W.,Kosno,M.,Holehouse,A.S.,Padrick,S.B.,Mittal,A.,Ali,R.,Yunus,A.A.,Liu,D.R.,Pappu,R.V.,and Rosen,M.K.(2016).Sequence Determinants ofIntracellular Phase Separation by Complex Coacervation of a DisorderedProtein.Mol.Cell 63,72-85.
Perrimon,N.,Pitsouli,C.,and Shilo,B.(2012).Signaling MechanismsControlling Cell Fate and Embryonic Patterning.Cold SpringHarb.Perspect.Biol.4,1-18.
Poy,F.,Lepourcelet,M.,Shivdasani,R.A.,and Eck,M.J.(2001).Structure ofa human Tcf4-β-catenin complex.Nat.Struct.Biol.8,1053-1057.
Rawlings,J.S.(2004).The JAK/STAT signaling pathway.J.Cell Sci.117,1281-1283.
Sabari,B.R.,Dall’Agnese,A.,Boija,A.,Klein,I.A.,Coffey,E.L.,Shrinivas,K.,Abraham,B.J.,Hannett,N.M.,Zamudio,A.V,Manteiga,J.C.,et al.(2018).Coactivator condensation at super-enhancers links phase separation and genecontrol.Science 361,eaar3958.
Sampietro,J.,Dahlberg,C.L.,Cho,U.S.,Hinds,T.R.,Kimelman,D.,and Xu,W.(2006).Crystal Structure of aβ-Catenin/BCL9/Tcf4Complex.Mol.Cell 24,293-300.
Schindelin,J.,Arganda-Carreras,I.,Frise,E.,Kaynig,V.,Longair,M.,Pietzsch,T.,Preibisch,S.,Rueden,C.,Saalfeld,S.,Schmid,B.,et al.(2012).Fiji:Anopen-source platform for biological-image analysis.Nat.Methods 9,676-682.
Schuijers,J.,Mokry,M.,Hatzis,P.,Cuppen,E.,and Clevers,H.(2014).Wnt-induced transcriptional activation is exclusively mediated by TCF/LEF.EMBOJ.33,146-156.
Shin,Y.,and Brangwynne,C.P.(2017).Liquid phase condensation in cellphysiology and disease.Science 357,2415-2423.
Small,S.,Blair,A.,and Levine,M.(1992).Regulation of even-skippedstripe 2 in the Drosophila embryo.EMBO J.11,4047-4057.
Sinner,D.,Rankin,S.,Lee,M.,and Zorn,A.M.(2004).Sox17 and beta-catenincooperate to regulate the transcription of endodermal genes.Development 131,3069-3080.
Takahashi,K.,and Yamanaka,S.(2016).A decade of transcription factor-mediated reprogramming to pIuripotency.Nat.Rev.Mol.Cell Biol.17,183-193.
Takahashi,K.,Yamanaka,S.,Zhang,Y.,Li,Y.,Feng,C.,Li,X.,Lin,L.,Guo,L.,Wang,H.,Liu,C.,et al.(2006).Induction of Pluripotent Stem Cells from MouseEmbryonic and Adult Fibroblast Cultures by Defined Factors.Cell 126,663-676.
Theunissen,T.W.,and Jaenisch,R.(2014).Molecular control of inducedpluripotency.Cell Stem Cell 14,720-734.
Trompouki,E.,Bowman,T.V.,Lawton,L.N.,Fan,Z.P.,Wu,D.C.,Dibiase,A.,Martin,C.S.,Cech,J.N.,Sessa,A.K.,Leblanc,J.L.,et al,(2011).Lineage regulatorsdirect BMP and Wnt pathways tocell-specific programs during differentiationand regeneration.Cell 147,577-589.
Wang,J.,Choi,J.M.,Holehouse,A.S.,Lee,H.O.,Zhang,X.,Jahnel,M.,Maharana,S.,Lemaitre,R.,Pozniakovssky,A.,Drechsel,D.,et al.(2018).A MolecularGrammar Governing the Driving Forcess for Phase Separation of Prion-like RNABinding Proteins.Cell 1-12.
Weintraub,H.,Tapscott,S.J.,Davis,R.L.,Thayer,M.J.,Adam,M.A.,Lassar,A.B.,and Miller,A.D.(1989).Activation of muscle-specific genes in pigment,nerve,fat,liver,and fibroblast cell lines by forced expression ofMyoD.Proc.Natl.Acad.Sci.86,5434-5438.
van de Wetering,M.,Cavallo,R.,Dooijes,D.,van Beesst,M.,van Es,J.,Loureiro,J.,Ypma,A.,Hursh,D.,Jones,T.,Bejsovec,A.,et al.(1997).ArmadilloCoactivates TranscriPtion Driven by the Product of the Drosophila SegmentPolarity Gene dTCF.Cell 88,789-799.
Whyte,W.A.,Orlando,D.A.,Hnisz,D.,Abraham,B.J.,Lin,C,Y.,Kagey,M.H.,Rahl,P.B.,Lee,T.I.,and Young,R.A.(2013).Masster transcription factors andmediator establish super-enhancers at key cell identity genes.Cell 153,307-319.
Yan,R.,Small,S.,Desplan,C.,Dearolf,C.R.,and Darnell,J.E.(1996).Identification of a Stat gene that functions in Drossophila development.Cell84,421-430.
Yingling,J.M.,Datto,M.B.,Wong,C.,Frederick,J.P.,Liberati,N.T.,andWand,X.-F.(1997).Tumor suppressssor,Smad-4,is a TGF-beta inducible,DNAbinding protein.Mol Cell Biol 17,7019-7028.
Zhang,X.,Choi,P.S.,Francis,J.M.,Imielinski.M.,Watanabe,H.,Cherniack,A.D.,and Meyersson,M.(2016).Identification of focally amplified lineage-sspecific super-enhancers in human epithelial cacers.Nat.Genet.48,176-182.
Zhang,Y.,Liu,T.,Meyer,C.A.,Eeckhoute,J.,Johnson,D.S.,Sv.D.,Bernsstein,E.C.,Nusbaum,B.,Myers,R.M.,Brown,M.,Li,W.,Liu,X.S.(2008).Model-based analysis of ChIP-Seq(MACS).Genome Biol.9,R137.
Zhu,F.,Farnung,L.,Kaasinen,E.,Sahu,B.,Yin,Y.,Wei,B.,Dodonova,S.O.,Nitta,K.R.,Morgunova,E.,Taipale,M.,et al.(2018).The interaction lanscapebetween transcription factors and the nucleossome.Nature 562,76-81.
实施例6
转录起始机构和剪切机构均可形成含有大量组分分子的相分离的凝聚物;数百种Pol II和介体复合物浓缩于超级增强子处的凝聚物中8,9并且大量剪切因子浓缩于核光斑中,所述核光斑中的一些出现于高度活性转录位点处10-17。此处,我们研究CTD的磷酸化是否调控与转录起始和剪切相关的相分离的凝聚物中的CTD并入。我们发现低磷酸化Pol IICTD并入至介体凝聚物中并且通过调控CDK实现的磷酸化会引起其逐出。我们还发现磷酸化CTD优先地并入至由剪切因子形成的凝聚物中。这些结果表明,Pol II CTD磷酸化会驱动从牵涉于转录起始中的凝聚物交换至牵涉于RNA加工中的那些并且暗示磷酸化是调控凝聚物偏好的机制。
研究已经显示低磷酸化Pol II CTD可与介体相互作用5-7并且Pol II和介体出现于超级增强子处的凝聚物中8,9。为了研究Pol II CTD是否并入至介体凝聚物中,我们纯化人类介体复合物并且在体外小液滴测定中测量凝聚物形成。介体小液滴并入并且浓缩融合至GFP的人类全长CTD(GFP-CTD),而非对照GFP(图62B)。拥挤剂用于这些测定中以模拟细胞中的拥挤蛋白质环境,并且确保观察结果未对所用的剂具特异性,我们在两种化学上不同的拥挤剂存在下执行相同实验并且获得一致结果(图62B)。这些结果与如下观念一致,即Pol II CTD促进其并入至介体凝聚物中。
我们还通过将实验集中于MED1(介体复合物的最大亚单元)来研究CTD与介体的相互作用18。我们选择MED1用于进一步研究,因为MED1已经证明是适用于先前研究中的介体凝聚物的替代物9。另外,MED1具有异常大的固有无序区(IDR),所述固有无序区促进凝聚物形成9并且MED1已经显示优先地与人类细胞中的Pol II缔合19。小液滴测定揭露了MED1-IDR凝聚物并入并且浓缩GFP-CTD(图62C),如关于介体复合物所观察(图62B)。当CTD七肽重复序列的数目降低时,CTD进入MED1-IDR凝聚物中的能力受损(图62D),如关于涉及高价态组分的相互作用所期望,所述高价态组分是形成凝聚物的生物分子的特征20,21。Pol II CTD/MED1-IDR凝聚物展现液体样融合行为(图62E)并且通过光漂白之后的荧光恢复(FRAP;图62F)显示分子的动态内部重排和内部-外部交换的证据,与液体-液体相分离的凝聚物一致。
Pol II从起始至延伸的转变伴随有CDK7和CDK9对CTD七肽重复序列的磷酸化22-25。CTD的磷酸化已经显示影响其与由FET(FUS/EWS/TAF15)蛋白质的低复杂度域形成的水凝胶的相互作用26,表明磷酸化可影响CTD的凝聚物相互作用特性。
我们研究CDK7或CDK9对CTD的磷酸化是否将影响其并入至MED1-IDR凝聚物中。CTD磷酸化测定显示CDK7和CDK9制剂可能磷酸化体外重组CTD的丝氨酸2和5,其中CDK7显示对丝氨酸5磷酸化的偏好(图66A、B),与公开的结果一致22-25。我们发现由CDK7实现的CTD磷酸化会引起MED1-IDR小液滴中的CTD并入的显著降低(图63A、B;图66C),并且这一效应独立于所用的拥挤剂(图63A、B)。同样,由CDK9实现的磷酸化会引起MED1-IDR小液滴中的CTD并入的显著降低,并且这独立于反应中所用的拥挤剂(图63A、B)。这些结果与如下模型一致,即Pol II CTD磷酸化会引起从介体凝聚物逐出。
已经报告磷酸化Pol II CTD与剪切机构的多种组分相互作用27-30,并且富丝氨酸/精氨酸(SR)蛋白质SRSF2是这些剪切因子中富集最多的(图66A)7。SRSF2促进剪切体募集至剪切位点31并且可发现与核光斑中的mRNA前体剪切机构缔合10。使用SRSF2作为用于剪切机构的替代物,我们研究是否可能在小鼠胚胎干细胞(mESC)中的活性超级增强子缔合基因处发现剪切缔合凝聚物(图64)。使用对SRSF2具特异性的抗体的免疫荧光显微术(图67B)和并行新生RNA FISH揭露在Nanog和Trim28基因处的个别SRSF2色斑,所述基因是编码关键ESC多能转录因子的超级增强子缔合基因(图64A)。Nanog和Trim28FISH焦点的多张图像的分析(参见方法)显示,SRSF2在两种基因处均在新生RNA FISH焦点处富集(图64A)。我们验证剪切所需的两种另外的SR蛋白SRRM1和SRSF132,33也在Nanog和Trim28基因处在新生RNA FISH焦点处富集(图64B)。这些结果指示SRSF2和与剪切机构缔合的其他蛋白质是位于这些活性转录基因处的凝聚物的组分。
我们接着研究磷酸化Pol II是否与染色质上的SRSF2缔合。使用针对MED1、SRSF2、非磷酸化Pol II CTD和在丝氨酸2处磷酸化的Pol II CTD(S2P)的抗体执行ChIP-seq以获得这些组分在多个基因座全基因组处的相对占有率的线索(图4a、b)。如所预期,MED1占据超级增强子和启动子连同含有非磷酸化CTD的Pol II图65A,B)。含有丝氨酸2磷酸化CTD的Pol II最主要地在转录基因的3’末端处被观察到并且展现与SRSF2的强烈重叠(图65A、B)。这些结果表明,由SRSF2占据的基因组部分倾向于由具有磷酸化CTD的Pol II共占据。
为了直接地测试CTD的磷酸化是否会影响其并入至剪切因子凝聚物中,我们试图使用重组SRSF2对体外这些凝聚物建模。纯化融合至mCherry的全长人类SRSF2并且发现形成相分离的小液滴(图65C、D)。虽然非磷酸化CTD未有效地并入至SRSF2小液滴中,CDK7或CDK9磷酸化的CTD并入并且浓缩于SRSF2小液滴中(图65C、D、E、F和图67C)。SRSF2小液滴对磷酸化Pol II CTD的并入的这种选择性独立于实验中所用的拥挤剂(图65C、D、E、F)。这些结果显示Pol II CTD的磷酸化会导致其与SRSF2凝聚物相互作用的能力的转换。
所述结果指示,Pol II CTD磷酸化会改变其凝聚物分配行为并且因此可驱动PolII从牵涉于转录起始中的凝聚物交换至牵涉于RNA剪切中的那些。这一模型与来自先前研究的如下迹象一致:Pol II的大团簇可与细胞中的介体凝聚物融合8,磷酸化会溶解CTD介导的Pol II团簇34,CDK9/细胞周期素T可通过相分离机制与CTD相互作用35,Pol II在转录延伸期间不再与介体缔合18,并且含有剪切因子的核光斑可在具有高转录活性的基因座处被观察到10-17。先前研究已经显示CTD可以磷酸形式特异性方式5-7与转录起始装置和RNA加工机构的组分相互作用,但未研究这些组分出现于凝聚物中的可能性,或已经显示Pol IICTD的磷酸化会改变其在这些凝聚物之间的分配行为。所述结果揭露介体和剪切因子凝聚物出现于相同超级增强子驱动基因处并且表明Pol II从与牵涉于起始中的组分相互作用转换至与牵涉于剪切中的那些组分相互作用可通过CTD磷酸化调控的凝聚物分配转换来介导。这些结果还表明,磷酸化可以是其中蛋白质功能涉及从一种凝聚物逐出和迁移至另一凝聚物的过程中调控蛋白质的凝聚物分配的机制。
方法
细胞培养
V6.5鼠科动物胚胎干细胞(mESC)是来自Jaenisch实验室的礼物。细胞在0.2%凝胶化(Sigma,G1890)组织培养板上在2i培养基、DMEM-F12(Life Technologies,11320082)、0.5X B27补充剂(Life Technologies,17504044)、0.5X N2补充剂(Life Technologies,17502048)、另外的0.5mM L-谷酰胺(Gibco,25030-081)、0.1mMβ-巯基乙醇(Sigma,M7522)、1%青霉素链霉素(Life Technologies,15140163)、1X非必需氨基酸(Gibco,11140-050)、1000U/ml LIF(Chemico,ESG1107)、1μM PD0325901(Stemgent,04-0006-10)、3μMCHIR99021(Stemgent,04-0004-10)中生长。细胞在潮湿孵育器中在37℃和5%CO2下生长。关于共聚焦成像,细胞在玻璃盖玻片(Carolina Biological Supply,633029)上生长,所述玻璃盖玻片在37℃下用5μg/mL聚-L-鸟氨酸(Sigma Aldrich,P4957)涂布持续至少30min并且在37℃下用5μg/ml层粘连蛋白(Corning,354232)涂布持续2h-16h。关于传代,细胞在PBS(Life Technologies,AM9625)、1000U/mL LIF中进行洗涤。使用TrypLE表达酶(LifeTechnologies,12604021)使细胞从板脱离。TrypLE用FBS/LIF-培养基(DMEM K/O(Gibco,10829-018)、1X非必需氨基酸、1%青霉素链霉素、2mM L-谷酰胺、0.1mMβ-巯基乙醇和15%胎牛血清FBS(Sigma Aldrich,F4135)淬灭。
Western印迹
纯化的磷酸化CTD混入1X XT缓冲液(Bio-Rad)中并且在10%CriterionTM XT Bis-Tris Precast Gels(Bio-Rad)上在100V下跑胶,直至染料前部到达所述凝胶的末端。蛋白质接着在4℃下在250mA下在冰冷转移缓冲液(25mM Tris、192mM甘氨酸、10%甲醇)中湿式转移至0.45μm PVDF膜(Millipore,IPVH00010)持续2小时。在转移之后,所述膜在室温下在振荡下用TBS中的5%脱脂乳阻断持续1小时。所述膜接着在4℃下在振荡下用TBST中的5%脱脂乳中的抗GFP(Abcam#ab290)、抗Pol II phospho-Ser5(Millipore#04-1572)或抗PolII phospho-Ser2(Millipore#04-1571)抗体的1:2,000稀释液孵育过夜。所述膜在室温下在振荡下用TBST洗涤三次持续10min。所述膜在RT下用1:10,000第二抗体(GE health)孵育持续1h并且在TBST中洗涤三次持续5min。膜用Femto ECL底物(Thermo Scientific,34095)显影并且使用CCD摄影机成像。
免疫荧光联合RNA FISH
盖玻片在37℃下用5ug/mL聚-L-鸟氨酸(Sigma-Aldrich,P4957)涂布持续30分钟并且用5μg/mL层粘连蛋白(Corning,354232)涂布持续2小时。细胞接种于预先涂布的盖玻片上并且生长持续24小时,随后使用PBS中的4%聚甲醛PFA(VWR,BT140770)固定持续10分钟。在PBS中洗涤细胞三次之后,将所述盖玻片放入潮湿室中或在4℃下存储于PBS中。使用PBS中的0.5%triton X100(Sigma Aldrich,X100)执行细胞的渗透持续10分钟,随后进行三次PBS洗涤。细胞用4%无IgG牛血清白蛋白BSA(VWR,102643-516)阻断持续30分钟。细胞接着用PBS中浓度为1:500的所指示的第一抗体孵育持续4-16小时。细胞用PBS洗涤三次,随后用第二抗体以1:5000于PBS中的浓度孵育持续1小时。在用PBS洗涤两次之后,细胞使用PBS中的4%聚甲醛PFA(VWR,BT140770)固定持续10分钟。在两次PBS洗涤之后,无RNase水(Life Technologies,AM9932)中的洗涤缓冲液A(20%Stellaris RNA FISH洗涤缓冲液A(Biosearch Technologies,Inc.,SMF-WA1-60)、10%去离子化甲酰胺(EMD Millipore,S4117))添加至细胞中并且孵育持续5分钟。杂交缓冲液(90%Stellaris RNA FISH杂交缓冲液(Biosearch Technologies,SMF HB1-10)和10%去离子化甲酰胺)中的12.5μM RNA探针添加至细胞中并且在37℃下孵育过夜。在37℃下用洗涤缓冲液A洗涤持续30分钟之后,细胞核在20μm/mL Hoechst 33258(Life Technologies,H3569)中染色持续5分钟,随后在洗涤缓冲液B(Biosearch Technologies,SMFWB1-20)中洗涤5分钟。细胞在水中洗涤一次,随后用Vectashield(VWR,101098-042)将盖玻片封固于载玻片上并且最终用指甲油(Electron Microscopy Science Nm,72180)密封所述盖玻片。在具有100x物镜的RPI转盘式共聚焦显微镜上使用MetaMorph采集软件和Hammamatsu ORCA-ER CCD摄影机(W.M.KeckMicroscopy Facility,MIT)采集图像。图像使用Fiji Is Just ImageJ(FIJI)进行后处理。RNA FISH探针由Agilent定制设计并且产生以靶向Nanog和Trim28内含子区,从而肉眼观察新生RNA。
蛋白质纯化
人类cDNA克隆至T7pET表达载体的修饰形式中。对所述基础载体进行工程改造以包括5’6xHIS、随后mEGFP或mCherry和14个氨基酸的连接体序列“GAPGSAGSAAGGSG.”(SEQID NO:14)。使用
Figure BDA0002792767850002881
HiFi DNA Assembly Master Mix(NEB E2621S)与连接体氨基酸同框插入这些序列(通过PCR产生)。表达单独mEGFP的载体含有所述连接体序列、随后终止密码子。突变体序列通过PCR产生并且插入至如上文所述的相同基础载体中。所有表达构建体均进行测序以确保序列同一性。
关于蛋白质表达,质粒如下转化至LOBSTR细胞(Chessman Lab的礼物)中并且生长。新鲜细菌集落接种至含有卡那霉素和氯霉素的LB培养基中并且在37度下生长过夜。细胞以1:30稀释于具有新鲜添加的卡那霉素和氯霉素的500ml室温LB中并且在16度下生长1.5小时。添加IPTG至1mM并且生长继续20小时。收集细胞并且冷冻存储于-80度下。含有单独GFP和GFP-SRSF2的细胞以相似方式进行处理,除了其在IPTG诱导之后在37度下生长持续5小时。
500ml mCherry-SRSF2表达细胞的集结粒再悬浮于具有cOmplete蛋白酶抑制剂(Roche,11873580001)的15ml变性缓冲液(50mM Tris 7.5、300mM NaCl、10mM咪唑、8M脲)中并且进行声波处理(15秒打开、60s切断的十个周期)。溶解产物通过在12,000g下离心持续30分钟被清除并且添加至已经用10体积的相同缓冲液预平衡的1ml Ni-NTA琼脂糖(Invitrogen,R901-15)中。含有这一琼脂糖溶解产物浆液的管在室温下旋转持续1.5小时。所述浆液倾倒至柱中,用15体积的溶解缓冲液洗涤并且用含有250mM咪唑的2ml变性缓冲液洗脱4次。各洗脱份在12%凝胶上跑胶并且精确大小的蛋白质首先针对缓冲液(50mM TrispH 7.5、125mM NaCl、1mM DTT和4M脲)、随后针对含有2M脲的相同缓冲液并且最后针对具有10%甘油而无脲的缓冲液的2种变化进行透析。透析之后的任何沉淀物均通过在3,000rpm下离心持续10分钟而被移除。
所有其他蛋白质以相似方式进行纯化。约500ml细胞集结粒再悬浮于含有10mM咪唑和cOmplete蛋白酶抑制剂的15ml缓冲液A(50mM Tris pH 7.5、500mM NaCl)中,通过声波处理溶解,通过在4度下在12,000xg下离心持续30分钟被清除,添加至1ml预平衡的Ni-NTA琼脂糖中,并且在4度下旋转持续1.5小时。所述浆液倾倒至柱中,用15体积的含有10mM咪唑的溶解缓冲液洗涤并且蛋白质用含有50mM咪唑的缓冲液洗脱2次,用含有100mM咪唑的缓冲液洗脱2次,并且用含有250mM咪唑的缓冲液洗脱3次。或者,所述树脂浆液在3,000rpm下离心持续10分钟,用10体积的10mM咪唑缓冲液洗涤并且蛋白质通过用以上缓冲液中的每一者孵育持续10分钟或10分钟以上旋转、随后离心并且凝胶分析而进行洗脱。含有精确大小的蛋白质的洗脱份在4度下针对含有50mM Tris 7.5、125mM NaCl、10%甘油和1mM DTT的缓冲液的两次变化进行透析。
介体的纯化
如先前所述36在修改下纯化介体样品。在亲和力纯化之前,P0.5M/QFT洗脱份通过硫酸铵沉淀(35%)浓缩至12mg/mL。集结粒再悬浮于含有20mM KCl、20mM HEPES、0.1mMEDTA、2mM MgCl2、20%甘油的pH 7.9缓冲液中并且接着在亲和力纯化步骤之前针对含有0.15M KCl、20mM HEPES、0.1mM EDTA、20%甘油和0.02%NP-40的pH 7.9缓冲液进行透析。如所述36进行亲和力纯化,将洗脱的材料装载至含有2mL 0.15M KCl HEMG(20mM HEPES、0.1mM EDTA、2mM MgCl2、10%甘油)的2.2mL离心管中并且在4℃下在50K RPM下离心持续4h。此举用于移除过量游离GST-SREBP并且用于浓缩最终洗脱份中的介体。在小液滴测定之前,使用具有Ultracel-30膜(Millipore MRCF0R030)的Microcon-30kDa离心过滤单元进一步浓缩纯化的介体以实现约300nM介体复合物。浓缩的介体在10μM所指示的经GFP标记蛋白存在或不存在下添加至小液滴测定中直至约200nM的最终浓度。小液滴反应含有10%PEG-8000或16%Ficoll-400和140mM盐。
染色质免疫沉淀测序(ChIP-seq)
mES在2i培养基中生长至80%汇合。使用PBS中的1%甲醛来使细胞交联持续15分钟,随后在冰上用最终浓度为125mM的甘氨酸淬灭。细胞用冷PBS洗涤并且通过在冷PBS中刮擦细胞加以收集。所收集的细胞在4℃下在1000g下集结成粒持续3分钟,在液氮中速冻并且存储于-80℃下。所有缓冲液均含有新鲜制备的cOmplete蛋白酶抑制剂(Roche,11873580001)。关于使用磷酸特异性抗体的ChIP,所有缓冲液均含有新鲜制备的PhosSTOP磷酸酯酶抑制剂混合液(Roche,4906837001)。冷冻的交联细胞在冰上解冻并且接着再悬浮于LB1(50mM Hepes-KOH pH 7.9、140mM NaCl、1mM EDTA 0.5mL 0.5M、10%甘油、0.5%NP-40、1%TritonX-100、1x蛋白酶抑制剂)中并且在4℃下孵育持续20分钟旋转。细胞在1350g下集结成粒持续5分钟,再悬浮于LB2(10mM Tris pH 8.0、200mM NaCl、1mM EDTA、0.5mMEGTA、1x蛋白酶抑制剂)中并且在4℃下孵育持续5分钟旋转。集结粒以30-50百万个细胞/ml的浓度再悬浮于LB3(10mM Tris pH 8.0、100mM NaCl、1mM EDTA、0.5mM EGTA、0.1%脱氧胆酸钠、0.5%月桂酰肌氨酸钠、1%TritonX-100、1x蛋白酶抑制剂)中。细胞使用CovarisS220进行声波处理持续12分钟(工作周期:5%,强度:4,每次爆发的周期数:200)。经过声波处理的材料通过在4℃下在20000xg下短暂离心持续30分钟而澄清。上清液是用于ChIP的可溶性染色质。用0.5%BSA预阻断的Dynabead用所指示的抗体孵育持续2小时。染色质添加至抗体-珠粒复合物中并且在4℃下孵育,旋转过夜。珠粒在4℃下用洗涤缓冲液1(50mM HepespH 7.5、500mM NaCl、1mM EDTA、1mM EGTA、1%Triton、0.1%NaDoc、0.1%SDS)和洗涤缓冲液2(20mM Tris pH 8、1mM EDTA、250mM LiCl、0.5%NP-40、0.5%NaDoc)各自洗涤三次,随后在室温下用TE洗涤一次。染色质通过添加洗脱缓冲液(50mM Tris pH8.0、10mM EDTA、1%十二烷基硫酸钠)至珠粒中进行洗脱并且在60℃下孵育,振荡持续30分钟。在58℃下执行交联的逆转过夜。添加RNaseA并且在50℃下孵育持续1小时用于RNA移除。添加蛋白酶K并且在60℃下孵育持续1小时用于蛋白质移除。使用Qiagen PCR纯化试剂盒根据制造商的说明书纯化DNA,并且在50μL 10mM Tris-HCl pH 8.5中洗脱,其用于定量和ChIP库制备。用SwiftBiosciences
Figure BDA0002792767850002911
2S Plus DNA库试剂盒根据试剂盒说明书制备ChIP库,其中在来自Sage Science的PippinHT系统上进行另外的大小选择步骤。在库制备之后,ChIP库在具有200-600个碱基的大小收集窗的PippinHT上的2%凝胶上跑胶。最终库通过qPCR用来自Roche的KAPA库定量试剂盒定量并且在Illumina HiSeq 2500上以用于40个碱基的单端测序模式测序。
使用bowtie以参数–k 1 –m 1 –best和设置为读出长度的–1比对ChIP-Seq数据与小鼠参考基因组的mm9形式。使用MACS以参数–w–S–space=50–nomodel–shiftsize=200创建用于以仓展示读取覆盖率的Wiggle文件,并且每仓读数计数针对用于产生所述wiggle文件的数百万个定位的读数标准化。每百万个读数标准化的wiggle文件展示于UCSC基因组浏览器中。使用ngs.plot37(v2.61)使用默认参数产生Metagene图。由公开的RNA-seq数据集(GSE112807)9计算所表达基因的顶部20%。在这一研究中使用针对SRSF2(Abcam ab11826)和Pol IISer2 phospho CTD(Millipore 04-1571)的抗体产生SRSF2和Ser2-P Pol IIChIP-seq,而MED1和总Pol II ChIP-seq是先前公开的(GSE112808)9。
平均图像分析
关于RNA FISH联合免疫荧光的分析,书写定制的内部MATLABTM脚本以处理并且测定在RNA FISH和IF通道中收集的3D图像数据。FISH焦点在个别z-堆栈中通过强度和大小阈值鉴定,沿大小l=2.9μm的盒定中心,并且在z-堆栈当中以3-D缝合在一起。关于所鉴定的每一个FISH焦点,来自IF通道中的相应位置的信号在定中心于每一个相应z-切片处的RNAFISH焦点处的l x l正方形中加以收集。接着组合定中心于各FISH和IF对的FISH焦点处的IF信号并且计算平均强度投影,从而提供定中心于FISH焦点处的l x l正方形内的IF信号强度的平均数据。关于定中心于其本身坐标上的FISH信号强度进行相同过程,从而提供定中心于FISH焦点处的l x l正方形内的FISH信号强度的平均数据。对设置于图例中的各图像提供每次平均强度投影的重复样品数目。作为对照,关于定中心于随机选择的核位置处的IF信号进行这一相同过程。关于各重复样品,从核包膜的内部产生40个随机核点,通过大的大小(200个像素)和强度(DNA致密)阈值的组合从DAPI通道鉴定。
这些平均强度投影接着用于产生信号强度的2D轮廊图。轮廊图使用MATLABTM中的内置功能产生。关于轮廓图,所呈递的强度-颜色范围在颜色的线性范围内(n!=15)进行定制。关于FISH通道,使用黑色至品红色。关于IF通道,我们使用chroma.js(在线颜色生成器)在15个仓内产生颜色,其中关键转变颜色是选择为黑色、蓝紫色、中蓝色、绿黄色。进行此举以确保读者的眼睛可能更容易地检测信号对比度。所产生的颜色图用于所有IF图中的15个均匀间隔的强度仓。使用相同彩色比例尺对定中心于FISH处或随机选择的核位置处的平均IF作图,所述彩色比例尺经过设置以包括各图的最小和最大信号。
体外小液滴测定
重组GFP或mCherry融合蛋白使用Amicon Ultra离心过滤器(30K MWCO,Millipore)浓缩并且脱盐至适当蛋白质浓度和125mM NaCl。重组蛋白添加至小液滴形成缓冲液(50mM Tris-HCl pH 7.5、10%甘油、1mM DTT)中具有变化浓度的100-125mM最终盐和作为拥挤剂的16%Ficoll-400或10%PEG-8000的溶液中,如图例中所述。所述蛋白质溶液立即装载至包含通过双面胶带的两个平行条附接的载玻片和盖玻片的自制室中。载玻片接着用具有150x物镜的Andor共聚焦显微镜成像。除非有所指示,否则所呈递的图像具有沉降于玻璃盖玻片上的小液滴。关于体外小液滴的FRAP,在20us停留时间处的2次激光脉冲(20%功率)应用于小液滴,并且恢复每1s在Andor显微镜上成像持续所指示的时期。关于CDK7或CDK9介导的CTD磷酸化,市售活性CDK7/MAT1/CCNH(CAK复合物;Millipore 14-476)或CDK9/细胞周期素T1(Millipore 14-685)在室温下用于磷酸化激酶反应缓冲液(20mMMOPs-NaOH pH 7.0、1mM EDTA、0.001%NP-40、2.5%甘油、0.05%β-巯基乙醇、10mM MgAc、10uM ATP)中的GFP-CTD52持续2-3小时。CTD:酶比率是约1uM CTD:约4.8ng/ul CDK7或CDK9。
体外小液滴的成像分析
为了分析体外相分离成像实验,书写定制的MATLABTM脚本以鉴定小液滴并且表征其大小和形状。关于任何特定实验条件,使用基于直方图的峰的强度阈值和大小阈值(每个z-切片9个像素)使所述图像区段化。对“骨架”通道(在MED1-IDR+CTD的情况下是MED1-IDR,关于SRSF2+CTD是SRSF2)执行小液滴鉴定,并且测定面积和纵横比。对典型地5-10个独立视场中鉴定的数百个小液滴进行定量。关于GFP通道(即,GFP-CTD),计算所述小液滴内(C-in)和整体中(C-out)的平均强度。关于GFP-CTD的分配系数/富集比是计算为(C-in)/(C-out)。富集分数通过使所述实验条件的Cin/out除以对照GFP荧光蛋白的Cin/out来计算。
数据可用性
这一研究中产生的数据集已经以登录号GSE120656寄存于Gene ExpressionOmnibus中。
参考文献
1 Adelman,K.&Lis,J.T.Promoter-proximal pausing of RNA polymerase II:emerging roles in metazoans.Nat Rev Genet 13,720-731,doi:10.1038/nrg3293(2012).
2 Harlen,K.M.&Churchman,L.S.The code and beyond:transcriptionregulation by the RNA polymerase II carboxy-terminal domain.Nat Rev Mol CellBiol 18,263-273,doi:10.1038/nrm.2017.10(2017).
3 Levine,M.,Cattoglio,C.&Tjian,R.Looping back to leap forward:transcription enters a new era.Cell 157,13-25,doi:10.1016/j.cell.2014.02.009(2014).
4 Sainsbury,S.,Bernecky,C.&Cramer,P.Struetural basis of transcriptioninitiation by RNA polymerase II.Nat Rev Mol Cell Biol 16,129-143,doi:10.1038/nrm3952(2015).
5 Eick,D.&Geyer,M.The RNA polymerase II carboxy-terminal domain (CTD)code.Chem Rev 113,8456-8490,doi:10.1021/cr400071f(2013).
6 Jeronimo,C.,Bataille,A.R.&Robert,F.The writers,readers,andfunctions of the RNA polymerase II C-terminal domain code.Chem Rev 113,8491-8522,doi:10.1021/cr4001397(2013).
7 Ebmeier,C.C.et al.Human TFIIH Kinase CDK7 Regulates Transcription-Associated Chromatin Modifications.Cell Rep 20,1173-1186,di:10.1016/j.celrep.2017.07.021(2017).
8 Cho,W.K.et al.Mediator and RNA polymerase II clusters associate intranscription-dependent condensates.Science 361,412-415,doi:10.1126/science.aar4199(2018).
9 Sabari,B.R.et al.Coactivator condensation at super-enhancers linksphase separation and gene control.Science 361,doi:10.1126/science.aar3958(2018).
10 Spector,D.L.&Lamond,A.I.Nuclear speckles.Cold Spring Harb PerspectBiol 3,doi:10.1101/cshperspect.a000646(2011).
11 Chen,Y.et al.Mapping 3D genome organization relative to nuclearcompartments using TSA-Seq as a cytological ruler.J Cell Biol,doi:10.1083/jcb.201807108(2018).
12 Quinodoz,S.A.et al.Higher-Order Inter-chromosomal Hubs Shape 3DGenome Organization in the Nucleus.Cell 174,744-757 e724,doi:10.1016/j.cell.2018.05.024(2018).
13 Shopland,L.S.,Johnson,C.V.,Byron,M.,McNeil,J.&Lawrence,J.B.Clustering of multiple specific genes and gene-rich R-bands around SC-35domains:evidence for local euchromatic neighborhoods.J Cell Biol 162,981-990,doi:10.1083/jcb.200303131(2003).
14 Xing,Y.,Johnson,C.V.,Moen,P.T.,Jr.,McNeil,J.A.&Lawrence,J.Nonrandom gene organization:structural arrangements of specific pre-mRNAtranscription and splicing with SC-35 domains.J Cell Biol 131,1635-1647(1995).
15 Moen,P.T.,Jr.et al.Repositioning of muscle-specific genes relativeto the periphery of SC-35 domains during skeletal myogenesis,Mol Biol Cell15,197-206,doi:10.1091/mbc.e03-06-0388(2004).
16 Hu,Y.,Kireev,I.,Plutz,M.,Ashourian,N.&Belmont,A.S.Large-scalechromatin structure of inducible genes:transcription on a condensed,lineartemplate.J Cell Biol 185,87-100,doi:10.1083/jcb.200809196(2009).
17 Khanna,N.,Hu,Y.&Belmont,A.S.HSP70 transgene direeted motion tonuclear speckles facilitates heat shock activation.Curr Biol 24,1138-1144,dui:10.1016/j.cub.2014.03.053(2014).
18 Allen,B.L.&Taatjes,D.J.The Mediator complex:a central integratorof transcription.Nat Rev Mol Cell Biol 16,155-166,doi:10.1038/nrm3951(2015).
19 Zhang,X.et al.MED1/TRAP220 exists predominantly in a TRAP/Mediatorsubpopulation enriched in RNA polymerase II and is required for ER-mediatedtranscription.Mol Cell 19,89-100,doi:10.1016/j.molcel.2005.05.015(2005).
20 Banani,S.F.,Lee,H.O.,Hyman,A.A.&Rosen,M.K.Biomolecularcondensates:organizers of cellular biochemistry.Nat Rev Mol Cell Biol 18,285-298,doi:10.1038/nrm.2017.7(2017).
21 Hnisz,D.,Shrinivas,K.,Young,R.A.,Chakraborty,A.K.&Sharp,P.A.APhase Separation Model for Transcriptional Control.Cell 169,13-23,doi:10.1016/j.cell.2017.02.007(2017).
22 Akhtar,M.S.et al.TFIIH kinase places bivalent marks on thecarboxy-terminal domain of RNA polymerase II.Mol Cell 34,387-393,doi:10.1016/j.molcel.2009.04.016(2009).
23 Glover-Cutter,K.et al.TFIIH-associated Cdk7 kinase functions inphosphorylation of C-terminal domain Ser7 residues,promoter-proximal pausing,and termination by RNA polymerase II.Mol Cell Biol 29,5455-5464,doi:10.1128/MCB.00637-09(2009).
24 Czudnochowski,N.,Bosken,C.A.&Geyer,M.Serine-7 but not serine-5phosphorylation primes RNA polymerase II CTD for P-TEFb recognition.NatCommun 3,842,doi:10.1038/ncomms1846(2012).
25 Jones,J.C.et al.C-terminal repeat domain kinase I phosphorylatesSer2 and Ser5 of RNA polymerase II C-terminal domain repeats.J Biol Chem 279,24957-24964,doi:10.1074/jbc.M402218200(2004).
26 Kwon,I.et al.Phosphorylation-regulated binding of RNA polymeraseII to fibrous polymers of low-complexity domains.Cell 155,1049-1060,doi:10.1016/i.cell.2013.10.033(2013).
27 Bentley,D.L.Coupling mRNA processing with transcription in timeand space.Nat Rev Genet 15,163-175,doi:10.1038/nrg3662(2014).
28 Braunschweig,U.,Gueroussov,S.,Plocik,A.M.,Graveley,B.R.&Blencowe,B.J.Dynamic integration of splicing within gene regulatory pathways.Cell 152,1252-1269,doi:10.1016/j.cell.2013.02.034(2013).
29 Herzel,L.,Ottoz,D.S.M.,Alpert,T.&Neugebauer,K.M.Splicing andtranscription touch base:co-transcriptional spliceosome assembly andfunetion.Nat Rev Mol Cell Biol 18,637-650,doi:10.1038/nrm.2017.63(2017).
30 Hsin,J.P.&Manley,J.L.The RNA polymerase II CTD coordinatestranscription and RNA processing.Genes Dev 26,2119-2137,doi:10.1101/gad.200303.112(2012).
31 Long,J.C.&Caceres,J.F.The SR protein family of splicing factors:master regulators of gene expression.Biochem J 417,15-27,doi:10.1042/BJ20081501(2009).
32 Blencowe,B.J.,Issner,R.,Nickerson,J.A.&Sharp,P.A.A coactivator ofpre-mRNA splicing.Genes Dev 12,996-1009(1998).
33 Kramer,A.&Keller,W.Purification of a protein required for thesplicing of pre-mRNA and its separation from the lariat debranchingenzyme.EMBO J 4,3571-3581(1985).
34 Boehning,M.et al.RNA polymerase II clustering through carboxy-terminal domain phase separation.Nat Struct Mol Biol,doi:10.1038/s41594-018-0112-y(2018).
35 Lu,H.et al.Phase-separation mechanism for C-terminalhyperphosphorylation of RNA polymerase II.Nature 558,318-323,doi:10.1038/s41586-018-0174-3(2018).
36 Meyer,K.D.et al.Cooperative activity of cdk8 and GCN5L withinMediator directs tandem phosphoacetylation of histone H3.EMBO J 27,1447-1457,doi:10.1038/emboj.200878(2008).
37 Shen,L.,Shao,N.,Liu,X.&Nestler,E.ngs.plot:Quick mining andvisualization of next-generation sequencing data by integrating genomicdatabases.BMC Genomics 15,284,doi:10.1186/1471-2164-15-284(2014).
实施例7
相分离是使得生物分子分离成稀相和浓缩相的物理化学过程,由此形成“无膜细胞器”(1-5)。近期研究已经显示TF和介体共活化子可形成相分离的凝聚物以区域化并且浓缩在正常细胞身份中具有突出作用的基因处的转录装置(6-10)。转录失调是恶性疾病的充分描述的特征,但我们对凝聚物在癌症中发挥的作用具有有限理解(11-16)。因此,我们试图发现如果转录凝聚物受到癌症疗法扰乱,并且如果转录凝聚物在药物抗性状态中发生改变,那么其是否驱动致癌转录程序。
乳腺癌是最常见的恶性疾病并且大多数病例是由ER(致癌TF)驱动(17)。ER与转录装置相互作用以驱动雌激素反应性基因(包括MYC致癌基因)的表达(18-20)。为了测定转录凝聚物是否出现于人类肿瘤组织中的MYC处,我们对ER+浸润性导管癌活组织检查执行针对介体的MED1亚单元和ER的免疫荧光(IF),以及RNA FISH(图68A、图72A)。我们发现ER和MED1是出现于人类肿瘤组织中的活性MYC基因座处的核色斑的组分,与我们对于转录凝聚物的预期一致(图68A、图72B)。我们将研究扩展至以实验方法更易处理的ER+乳腺癌细胞系MCF7并且确认MED1和ER色斑在雌激素存在下形成于活性MYC转录位点处(图68B)。经过工程改造以产生经mEGFP标记MED1的MCF7细胞中的MED1证明光漂白之后的快速荧光恢复(FRAP)(图68C、图72C),与对于液体样凝聚物所预期的特性一致。这些结果表明,ER和介体在乳腺癌细胞中的MYC致癌基因处形成转录凝聚物。
MYC致癌基因的表达失调并且驱动多种癌症的肿瘤发生(21)。介体是数种TF的共活化子,因此我们可能预期介体凝聚物存在于多种癌细胞类型中的MYC处(22)。实际上,在前列腺癌、多发性骨髓瘤、伯奇氏淋巴瘤和结肠癌细胞系中的转录活性MYC基因座处发现MED1色斑(图68D)。合起来,这些结果表明MYC在其中这种基因是致癌驱动者的肿瘤组织和癌细胞中由介体凝聚物占据。
在ER+乳腺癌细胞中,结合于ER的雌激素导致ER靶基因的增强的活化(23)。为了评估雌激素是否增强ER靶基因处的介体凝聚物形成,我们在MCF7细胞中的MYC基因座处执行关于MED1的IF以及DNA FISH。MED1信号在雌激素刺激时在MYC处增强(图69A)并且这伴随有MYC RNA表达的增加(图69B)。他莫昔芬是抗雌激素治疗剂,其结合于ER配体结合域(LBD),导致减少ER的活化潜力和对MED1的亲和力的构象转变(24)。他莫昔芬治疗会降低MYC处的MED1信号(图69A),与降低的MYC RNA表达一致(图69B)。这些结果与如下模型一致,其中雌激素刺激致癌基因处的共活化子凝聚物形成和转录,并且他莫昔芬抑制凝聚物形成和转录两者的雌激素依赖性刺激物(图69A)。
为了进一步研究雌激素和他莫昔芬的效应是否归因于共活化子凝聚物的ER LBD依赖性形成和溶解,我们使用工程改造的系统,其中当ER LBD系栓至细胞中的Lac阵列时,可监测相分离的凝聚物的形成(图69C)(25、26)。我们发现当细胞暴露于雌激素时,系栓的ER LBD产生含MED1凝聚物,并且这一凝聚物形成是由他莫昔芬预防(图69C)。含有经内源标记MED1-mEGFP的这些细胞的活细胞成像(图73A、图73B)揭露了他莫昔芬使ER LBD-MED1凝聚物溶解,从而确认关于这一组装体所预期的动态性质(图69D)。这些结果指示ER LBD的雌激素依赖性、他莫昔芬敏感性反式活化功能与细胞中雌激素依赖性、他莫昔芬敏感性含MED1凝聚物的形成相关。
为了进一步研究雌激素和他莫昔芬对ER-MED1凝聚物的影响,我们使用体外小液滴形成测定,所述测定使用纯化的重组ER-GFP和截短的MED1-mCherry融合蛋白。如先前所报告,MED1-mCherry形成相分离的小液滴,其中ER并入是由雌激素增强(图69E、图73C)(6)。雌激素刺激的ER并入至MED1凝聚物中是由他莫昔芬抵消(图69E、图73C)。这些结果与如下模型一致,其中雌激素反应性致癌基因的活化通过增强的介体凝聚发生,并且在乳腺癌中具有治疗益处的药物可抵消这些凝聚物的形成(图69F)。
虽然如他莫昔芬的抗雌激素是用于乳腺癌的高度有效治疗,但抗性仍为主要挑战(17)。抗性可通过多种机制发生,其中一些机制导致ER与共活化子之间的激素独立相互作用,具有后续基因活化和肿瘤生长(27)。我们推断,如果ER与共活化子凝聚的能力是肿瘤生长和生存所必需的,那么抗雌激素抗性可能通过改变所述转录因子和所述辅因子跨稀相与浓缩相之间的边界转变的能力来实现。如图70A中所说明,跨TF-介体凝聚物的相分离边界的转变可能通过改变构成所述凝聚物的组分之间的亲和力而发生(28)。
在抗雌激素抗性乳腺癌患者中发现ER的不同基因改变,包括LBD中使适用于共活化子相互作用的结构构象(Y537S和D538G)(29)和易位至包括共活化子YAP1和细胞表面蛋白PCDH11X在内的不同基因稳定化的突变(图70B、图74A)(30)。为了检查这些ER突变体的凝聚物形成特性,我们产生重组ER Y537S、ER D538G、ER-YAP1和ER-PCDH11X GFP融合蛋白。与使用野生型ER(其并入至MED1小液滴中是由雌激素增强并且由他莫昔芬抵消)的结果形成对比,所有四种突变型ER蛋白均与MED1形成雌激素独立、他莫昔芬不敏感凝聚物(图70C-D、图74B)。这些突变型ER蛋白的改变的相分离能力与其雌激素独立反式活化潜力相关(图70E-G)(29、30)。为了检查其在细胞中的凝聚物形成特性,将ER LBD点突变体系栓至细胞中的Lac阵列(图69C);正常ER仅在雌激素存在下在基因组基因座处产生MED1凝聚物,而ER突变型在雌激素存在和不存在下均形成MED1凝聚物(图74C)。总之,这些数据证明了在抗雌激素抗性患者中发现的获得性基因改变允许ER和MED1的雌激素独立凝聚,具有后续基因活化和肿瘤生长。
跨TF-介体凝聚物的相分离边界的转变可能还通过改变如MED1的凝聚物组分的浓缩而发生(图71A)(8、28)。如与雌激素结合的ER相比,他莫昔芬结合的ER对共活化子具有降低的亲和力(31)。然而,MED1过表达看来补偿这一降低的亲和力;即使使用他莫昔芬治疗,具有MED1过表达肿瘤的患者也有可能经历复发(32)。与这一致,针对他莫昔芬抗性选择的MCF7细胞过表达MED1超过4倍(图71B)。这使我们假设在高MED1浓度存在下,即使对共活化子具有较低亲和力,他莫昔芬结合的ER也可形成ER-MED1凝聚物,活化基因,并且实现癌细胞生存。为了测试升高的MED1浓度可促进使用他莫昔芬结合的ER的凝聚物形成,我们在不同MED1浓度下执行体外小液滴实验。在低MED1浓度下,雌激素结合的ER促进MED1凝聚物的形成,而他莫昔芬结合的ER并非如此(图71C、图75A)。然而,在较高MED1浓度下,雌激素结合和他莫昔芬结合的ER均允许MED1凝聚(图71C、图75A)。为了测试这是否还发生于细胞中,我们改变具有系栓至Lac阵列的ER LBD的细胞中的MED1水平。ER LBD在他莫昔芬存在下在正常MED1水平下不产生MED1凝聚物(图71D);相比之下,当MED1过表达时,他莫昔芬结合的ERLBD产生MED1凝聚物(图71D)。为了检查MED1过表达的功能结果,与他莫昔芬结合的ER一起使用GAL4反式活化测定,所述测定在升高的MED1水平下显示活化(图71E和图75B)。为了确认MED1过表达可促进乳腺癌细胞中的药物抗性,我们产生过表达MED1的MCF7细胞,其展示降低的对他莫昔芬的敏感性(图71F)。这些数据表明,MED1的过表达可通过增强凝聚物形成来介导抗雌激素抗性,由此暗示蛋白质表达和浓度依赖性相分离的调节是癌症中的药物抗性机制(图71G)。
所述结果表明转录凝聚物区域化并且浓缩转录装置以驱动癌症中的致癌基因表达,这些致癌凝聚物可受到临床有效药物扰乱,并且不同药物抗性机制的演化可集中于转录凝聚物行为的调节。这些观念与如下先前证据一致,即肿瘤细胞在驱动者致癌基因处获得超级增强子(SE)(33),致癌SE可仅用TF-DNA相互作用的小变化获得(34),并且一些致癌基因SE罕有地倾向于受到某些药物破坏(11)。凝聚物的特有特征可说明这些观察结果,包括形成和溶解的急剧转变、高组分浓度和特异性化学品的差异性分配潜力。我们对于凝聚物行为和由小分子化学品实现的其调节的理解的进一步推进可因此在癌症的设置中证明是有益的。
材料和方法
细胞培养
MCF7细胞(Weinberg实验室的礼物)、HCT116细胞(ATCC CCL-247)、含有约50,000个Lac-抑制因子结合位点的稳定整合阵列的U2OS-268细胞(下文中称作“U2OS-Lac细胞”)(Spector实验室的礼物)和HEK293T细胞(ATCC CRL-3216)在完全DMEM培养基(DMEM(LifeTechnologies 11995073)、10%胎牛血清FBS(Sigma Aldrich,F4135)、1%L-谷酰胺(GIBCO,25030-081)、1%青霉素链霉素(Life Technologies,15140163))中生长。关于雌激素剥夺,细胞在无雌激素DMEM((无酚红DMEM(Life Technologies,31053028)、木炭汽提的胎牛血清FBS(Sigma-Aldrich F6765)、1%L-谷酰胺(GIBCO,25030-081)、1%青霉素链霉素(Life Technologies,15140163))中生长持续所指示的时间量。
LN-CAP(ATCC CRL-1740)、MM1S(ATCC CRL-2974)和Ramos(ATCC CRL-1596)细胞在完全RPMI培养基(RPMI-1640(Life Technologies,61870127)、1%青霉素链霉素(LifeTechnologies,15140163)、10%胎牛血清FBS(Sigma Aldrich,F4135))中生长。
TamR7(ECACC 16022509)细胞在TAMR7培养基(无酚红DMEM/F12(LifeTechnologies 21041025、1%L-谷酰胺(GIBCO,25030-081)1%青霉素链霉素(LifeTechnologies,15140163)、1%胎牛血清FBS(Sigma Aldrich,F4135)、6ng/mL胰岛素(SantaCruz Biotechnology,sc-360248))中生长。
关于传代,细胞在PBS(Life Technologies,AM9625)中进行洗涤。使用TrypLE表达酶(Life Technologies,12604021)使细胞从板脱离。TrypLE用完全DMEM淬灭。
组织样品
由BioIVT提供新鲜冷冻的未处理雌激素受体阳性、孕酮受体阳性、HER2/neu阴性、浸润性导管癌的10uM切片。由获得样品的公司执行H&E染色。
细胞系产生
使用CRISPR/Cas9在U2OS-Lac细胞中产生经内源mEGFP标记的MED1。编码靶向蛋白质的N端附近的基因组序列的2种导向RNA的寡核苷酸克隆至表达Cas9和mCherry的px330载体(来自R.Jaenisch的礼物)中。靶向的MED1序列是5’CCTTCAGGATGAAAGCTCAG 3’(SEQ IDNO:253)和5’CCCCTGAGCTTTCATCCTGA 3’(SEQ ID NO:254)。修复模板克隆至含有mEGFP、10个氨基酸的GS连接体和侧接所述插入物的800bp同源臂的pUC19载体(NEB)中。500k个细胞使用Lipofectamine 3000用1.25μg px330载体和1.25μg修复模板转染。细胞在针对mCherry转染之后2天进行分选。第一次分选之后1周,细胞针对mEGFP以96孔板的每孔单一细胞进行分选。细胞通过PCR进行扩增并且基因分型,并且具有纯合基因敲入标签的克隆用于实验。
为了产生MCF7 mEGFP-MED1细胞,克隆含有具有通过10个氨基酸的GS连接体连接的N端mEGFP融合物的全长MED1的慢病毒构建体,含有嘌呤霉素选择标记物。慢病毒粒子在HEK293T细胞中产生。250,000个MCF7细胞接种于6孔板的一个孔中并且添加病毒上清液。48小时后,以1ug/mL添加嘌呤霉素持续5天用于选择。
蛋白质产生
编码所关注的基因或其IDR的cDNA克隆至T7 pET表达载体的修饰形式中。关于ER和其变体,所述全长蛋白用于所有情形中。关于MED1,产生延长的IDR,其含有已知与ER相互作用的LXXLL域,包含氨基酸600-1582。对所述基础载体进行工程改造以包括5’6xHIS、随后mEGFP或mCherry和14个氨基酸的连接体序列“GAPGSAGSAAGGSG.”(SEQ ID NO:14)使用
Figure BDA0002792767850003031
HiFi DNA Assembly Master Mix(NEB E2621S)与连接体氨基酸同框插入这些序列(通过PCR产生)。表达单独mEGFP或mCherry的载体含有所述连接体序列、随后终止密码子。突变体序列作为基因块(IDT)合成并且插入至如上文所述的相同基础载体中。所有表达构建体均进行测序以确保序列同一性。
蛋白表达质粒转化至LOBSTR细胞(Chessman实验室的礼物)中。新鲜细菌集落接种至含有卡那霉素和氯霉素的LB培养基中并且在37℃下生长过夜。含有MED1-IDR构建体的细胞以1:30稀释于具有新鲜添加的卡那霉素和氯霉素的500ml室温LB中并且在16℃下生长1.5小时。添加IPTG至1mM并且生长继续20小时。收集细胞并且冷冻存储于-80℃下。含有所有其他构建体的细胞以相似方式进行处理,除了其在IPTG诱导之后在37C下生长持续5小时。
500ml细胞集结粒再悬浮于15ml缓冲液A(50mM Tris pH 7.5、500mM NaCl、10mM咪唑、cOmplete蛋白酶抑制剂(Roche 11872580001))中并且进行声波处理持续10个周期(15秒打开、60秒切断)。溶解产物通过在4℃下在12,000g下离心持续30分钟被清除,添加至1ml预平衡的Ni-NTA琼脂糖(Invitrogen R901-15)中并且在4℃下旋转持续1.5小时。所述浆液在Thermo Legend XTR吊桶式转子中在3,000rpm下离心持续10分钟。树脂集结粒用5ml缓冲液A洗涤2次,随后如上文离心。蛋白质用2ml缓冲液A加上250mM咪唑洗脱3次。关于各周期,添加洗脱缓冲液并且在4C下旋转至少10分钟并且如上文进行离心。洗脱物在用库马斯染色的12%丙烯酰胺凝胶上进行分析。汇集含有精确大小的蛋白质的洗脱份,用250mM咪唑缓冲液1:1稀释并且在4C下针对含有50mM Tris 7.5、125mM NaCl、10%甘油和1mM DTT的缓冲液的两次变化进行透析。蛋白质浓度通过Thermo BCA蛋白质测定试剂盒-还原剂可相容来测量。
免疫荧光
以10μm厚度切片的人类肿瘤组织或在用聚-L-鸟氨酸涂布的玻璃上生长的细胞用PBS洗涤一次并且固定于4%聚甲醛PFA(VWR,BT140770)中持续10分钟。在PBS中进行三次洗涤持续5min之后,细胞存储于4℃下或转移至潮湿室中并且针对免疫荧光进行加工。使用PBS中的0.5%triton X100(Sigma Aldrich,X100)执行细胞的渗透持续10分钟,随后进行三次PBS洗涤。细胞用4%无IgG牛血清白蛋白BSA(VWR,102643-516)阻断持续30分钟并且以1:500于4%无IgG牛血清白蛋白中的浓度添加所指示的第一抗体(ER ab32063,MED1ab64965)持续4-16小时。如果随后进行RNA FISH或DNA FISH,那么第一抗体稀释于PBS中。细胞用PBS洗涤三次,随后用第二抗体(山羊抗兔IgG Alexa Fluor 488,LifeTechnologies A11008)以1:500于PBS中的浓度孵育持续1小时。
在用PBS洗涤两次之后,细胞核在20μm/mL Hoechst 33258(Life Technologies,H3569)中染色持续5分钟。细胞接着在水中洗涤一次,随后用Vectashield(VWR,101098-042)将盖玻片封固于载玻片上并且最终用指甲油(Electron Microscopy Science Nm,72180)密封所述盖玻片。在具有100x物镜的RPI转盘式共聚焦显微镜上使用MetaMorph采集软件和Hammamatsu ORCA-ER CCD摄影机(W.M.Keck Microscopy Facility,MIT)采集图像。图像使用Fiji Is Just ImageJ(The worldwide web at//fiji.sc/)进行后处理。
免疫荧光联合RNA FISH
如上文所述执行免疫荧光。在用第二抗体孵育细胞之后,细胞在RT下在PBS中洗涤三次持续5min并且用PBS中的4%PFA固定持续10min。在两次PBS洗涤之后,无RNase水(LifeTechnologies,AM9932)中的洗涤缓冲液A(20%Stellaris RNA FISH洗涤缓冲液A(Biosearch Technologies,Inc.,SMF-WA1-60)、10%去离子化甲酰胺(EMD Millipore,S4117)添加至细胞中并且孵育持续5分钟。杂交缓冲液(90%Stellaris RNA FISH杂交缓冲液(Biosearch Technologies,SMF-HB1-10)和10%去离子化甲酰胺)中的12.5μM RNA探针(定制Stellaris MYC探针Ref#SS4687950104)添加至细胞中并且在37℃下孵育过夜。在37℃下用洗涤缓冲液A洗涤持续30分钟之后,细胞核在PBS中的20μm/mL Hoechst 33258(LifeTechnologies,H3569)中染色持续5分钟,随后在洗涤缓冲液B(Biosearch Technologies,SMF-WB1-20)中洗涤5分钟。细胞接着在水中洗涤一次,随后将盖玻片封固于载玻片上,密封,成像,并且如上文所述进行后处理。
免疫荧光联合DNA FISH
MCF7细胞在24孔板中用聚-L-鸟氨酸涂布的盖玻片上以50,000个细胞/孔的原始接种密度在无雌激素DMEM中生长持续3天。细胞接着用媒介物10uM雌二醇或10uM雌二醇和5uM 4-羟基他莫昔芬处理持续45分钟。盖玻片上的细胞接着固定于4%聚甲醛中。如上文所述执行免疫荧光。在用第二抗体孵育细胞之后,细胞在RT下在PBS中洗涤三次持续5min,用PBS中的4%PFA固定持续10min并且在PBS中洗涤三次。细胞在RT下在70%乙醇、85%乙醇和接着100%乙醇中孵育持续1分钟。通过混合7μL FISH杂交缓冲液(Agilent G9400A)、1μlFISH探针(SureFISH 8q24.21 MYC 294kb G101211R-8)和2μL水制得探针杂交混合物。5μL混合物添加于载玻片上并且将盖玻片放置于顶部(朝向所述杂交混合物的细胞侧)。使用橡胶胶水密封盖玻片。一旦橡胶胶水凝固,基因组DNA和探针在78℃下变性持续5分钟并且载玻片在暗处在16℃下孵育O/N。从载玻片移除盖玻片并且在73℃下在预温洗涤缓冲液1(Agilent,G9401A)中孵育持续2分钟并且在RT下在洗涤缓冲液2(Agilent,G9402A)中孵育持续1分钟。空气干燥载玻片并且细胞核在RT下在PBS中的20μm/mL Hoechst 33258(LifeTechnologies,H3569)中染色持续5分钟。盖玻片在PBS中洗涤三次,随后将盖玻片封固于载玻片上,密封,成像,并且如上文所述进行后处理。
RT-qPCR
MCF7细胞被剥夺雌激素持续3天,接着用10nM雌激素或10nM雌激素和5uM 4-羟基他莫昔芬刺激持续24小时。RNA通过AllPrep试剂盒(Qiagen 80204)分离,随后使用高容量cDNA逆转录试剂盒(Applies Biosystems 4368814)进行cDNA合成。使用QuantStudio 6系统(Life Technologies)上的Power SYBR Green混合物(Life Technologies#4367659)以生物和技术三重复执行qPCR。以下oligos用于qPCR中;Myc fwd AACCTCACAACCTTGGCTGA(SEQ ID NO:255)、MYC rev TTCTTTTATGCCCAAAGTCCAA(SEQ ID NO:256)、GAPDH fwdTGCACCACCAACTGCTTAGC(SEQ ID NO:257)、GAPDH rev GGCATGGACTGTGGTCATGAG(SEQ IDNO:258)。计算倍数变化并且MYC表达值针对GAPDH表达标准化。
LAC结合测定
构建体通过含有驱动CFP-LacI融合蛋白表达的SV40启动子的pSV2哺乳动物表达载体中的NEB HIFI克隆进行组装。ESR1的活化域和突变型活化域通过c端融合至这种重组蛋白,通过连接体序列GAPGSAGSAAGGSG(SEQ ID NO:14)接合。关于一些实验,使用具有mCherry来替代CFP的变异质粒。U2OS-Lac细胞被剥夺雌激素持续24小时。细胞接着接种于用纤维连接蛋白涂布的玻璃盖玻片上并且使用lipofectamine 3000(ThermofisherL3000015)进行转染。关于高MED1条件,共转染具有哺乳动物表达载体的构建体,所述哺乳动物表达载体含有驱动融合至GFP的MED1的表达的PGK启动子。在转染之后24小时,细胞用DMSO、在DMSO中复原的10nM B-雌二醇(Sigma-Aldrich E8875)或在DMSO中复原的1uM 4-羟基他莫昔芬(Sigma-Aldrich H7904)处理持续45分钟。在处理之后,固定细胞并且用如上文所述的MED1抗体执行免疫荧光。
Lac阵列图像分析
关于Lac阵列数据的分析,书写定制的Python脚本以处理并且分析在Lac和经标记蛋白质通道中收集的图像数据。核染色用高斯滤波器(δ=2.0)抹掉并且通过K-平均值群集成2个团簇(细胞核和背景)。细胞核接着用python scikit-image程序包使用measure.label功能标记。为了区段化Lac光斑,Lac图像通道用高斯滤波器(δ=2.0)抹掉,并且将强度阈值(平均值+1.5*std)应用于所述图像。区段化的区(还通过measure.label测定)接着基于最小面积(150个像素)、最大面积(2000个像素)、圆度(c=4π*面积/周长^2;0.8)和如通过上文所述的屏蔽定义的细胞核中的存在进行过滤。范数富集比通过测定区段化的Lac光斑中经标记蛋白质的平均强度并且使其除以存在于同一完整细胞核中的经标记蛋白质的平均强度来计算。
活细胞成像
关于U2OS-Lac细胞的活细胞处理,具有经内源标记GFP-MED1的那些经历雌激素饥饿持续24小时,接着接种于用聚-L-鸟氨酸涂布(Sigma-Aldrich A-004)的皿上并且用具有mCherry-LacI-ESR1融合物的质粒转染。24小时后,细胞用10nM B-雌二醇处理持续45分钟。细胞在处理前和在用无雌激素DMEM中的DMSO或10uM 4-羟基他莫昔芬的1:1000稀释液处理之后30分钟成像。在FIJI中执行定量;从所述阵列中的平均信号强度减去仪器背景,接着除以从平均核信号减去的仪器背景以产生标准化信号强度。在用他莫昔芬或媒介物处理的样本中,30分钟时的标准化信号强度除以时间0时的那一信号强度以产生相对强度。
关于活细胞FRAP实验,经内源标记U2OS-Lac细胞或MED1-mEGFP MCF7细胞接种于用聚-L-鸟氨酸涂布的玻璃底组织培养板上。U2OS-Lac细胞经受如上文所述的B-雌二醇处理。在50us停留时间处的20次激光脉冲应用于所述阵列,并且恢复每1s在Andor显微镜上成像持续所指示的时期。在FIJI中执行定量。
关于MCF7 MED1-mEGFP FRAP,从漂白色斑中的平均信号强度减去仪器背景,接着除以从对照色斑减去的仪器背景。关于U2OS-Lac MED1-mEGFP FRAP,从lac阵列处的MED1信号的漂白部分中的平均信号强度减去仪器背景,接着除以从细胞核中的对照区域减去的仪器背景。这些值每秒作图,并且计算具有95%置信区间的最佳拟合线。
体外小液滴测定和定量
重组GFP或mCherry融合蛋白使用Amicon Ultra离心过滤器(30K MWCO,Millipore)浓缩并且脱盐至适当蛋白质浓度和125mM NaCl。重组蛋白添加至小液滴形成缓冲液(50mM Tris-HCl pH 7.5、10%甘油、1mM DTT)中具有变化浓度的所指示的最终盐和作为拥挤剂的10%PEG-8000的溶液中。所述蛋白质溶液立即装载至包含通过双面胶带的两个平行条附接的载玻片和盖玻片的自制室中。载玻片接着用具有150x物镜的Andor共聚焦显微镜成像。除非有所指示,否则所呈递的图像具有沉降于玻璃盖玻片上的小液滴。B-雌二醇(E8875 Sigma)或4-羟基他莫昔芬(Sigma-Aldrich H7904)在100%EtOH中复原至10mM,接着在125mM NaCl小液滴形成缓冲液中稀释至1mM。一微升的这一浓缩储备液用于10uL小液滴形成反应中以实现100uM的最终浓度。为了计算所述体外小液滴测定的富集,小液滴是定义为FIJI中由MED1骨架通道关注的区,并且测定那一小液滴内的ER客户蛋白的最大信号。或者,测量MED1的最大信号。在所有情形中,最大信号均除以所述图像中的背景客户蛋白信号以产生Cin/out。
Gal4转录测定
转录因子构建体在含有驱动GAL4 DNA结合域表达的SV40启动子的哺乳动物表达载体中进行组装。ESR1的野生型和突变型活化域通过Gibson克隆(NEB 2621S)融合至所述DNA结合域的C端,通过连接体GAPGSAGSAAGGSG(SEQ ID NO:14)接合。HEK293T细胞(ATCCCRL-3216)被剥夺雌激素持续24小时,接着接种于白色平底96孔测定板(Costar 3917)中。24小时后使用Lipofectamine 3000(Thermofisher L3000015)转染所述转录因子构建体。这些构建体用含有荧火虫荧光素酶基因上游的五个GAL4上游活化位点的PGL3-Basic(Promega)载体的修饰形式共转染。pRL-SV40(Promega)是含有通过SV40启动子驱动的海肾荧光素酶基因的质粒,其也进行共转染。关于高MED1条件,共转染具有哺乳动物表达载体的构建体,所述哺乳动物表达载体含有驱动融合至GFP的MED1的表达的PGK启动子。在转染时,细胞用所指示的DMSO、10nM B-雌二醇或1uM他莫昔芬的1:1000稀释液处理。关于MED1过表达实验,细胞用10nM他莫昔芬处理。在转染之后24小时,使用Dual-glo荧光素酶测定系统(Promega E2920)来测量由各荧光素酶蛋白产生的发光。所呈递的数据已经关于海肾荧光素酶表达进行对照并且针对ER-LBD雌激素剥夺条件标准化。
高通量测序数据集和肉眼观察
雌激素刺激的MCF细胞(GEO登录号GSE60270)和MCF7 CTCF ChIA-PET(GEO登录号GSE92881)的MED1和ESR1 ChIP-Seq获自公共来源并且在UCSC浏览器(https://genome.ucsc.edu/cgi-bin/hgGateway)上进行肉眼观察。
Cbioportal数据采集
关于患者突变的频率,针对存在于任何乳腺癌测序数据集中的ESR1突变查询cbioportal(http://www.cbioportal.org/)。
Western印迹
细胞在具有蛋白酶抑制剂(Roche,11697498001)的Cell Lytic M(Sigma-AldrichC2978)中溶解。溶解产物在3%–8%Tris-乙酸盐凝胶或10%Bis-Tris凝胶或3-8%Bis-Tris凝胶上在80V下跑胶持续约2h,随后在120V下跑胶直至染料前部到达所述凝胶的末端。蛋白质接着在4℃下在300mA下在冰冷转移缓冲液(25mM Tris、192mM甘氨酸、10%甲醇)中湿式转移至0.45μm PVDF膜(Millipore,IPVH00010)持续2小时。在转移之后,所述膜在室温、振荡下用TBS中的5%脱脂乳阻断持续1小时。膜接着用稀释于TBST中的5%脱脂乳中的1:1,000所指示抗体(ER ab32063,MED1 ab64965)孵育并且在4℃、振荡下孵育过夜。次日早晨,所述膜用TBST洗涤三次,每次洗涤在室温振荡下持续5分钟。膜在RT下用1:5,000第二抗体孵育持续1h并且在TBST中洗涤三次持续5分钟。膜用ECL底物(Thermo Scientific,34080)显影并且使用CCD摄影机成像或使用膜或用高灵敏度ECL暴露。使用BioRad图像实验室执行western印迹的定量。
MCF7生存测定
MCF7细胞用PiggyBac转座酶和含有MED1-mApple的PiggyBac整合载体转染并且在2ug/ml多西环素存在下生长。5天之后,细胞关于表达高水平的mApple的那些进行分选。亲本MCF7或表达MED1-mApple的MCF7细胞接着在完全DMEM中以50,000个细胞/孔接种于24孔板中。1天后,所述培养基更换为含有媒介物(DMSO)或25uM 4-羟基他莫昔芬的那种培养基。48小时后,孔通过Cell Titer-Glo进行测定以在Tecan板式读取器中定量白底96孔板中的ATP的量。百分比生存是计算为经过处理的孔中的荧光素酶信号除以媒介物处理的孔中的信号,数据呈递为经过处理中的百分比生存除以媒介物中的百分比生存以产生相对生存。
FISH-IF平均图像分析
关于RNA/DNA FISH联合免疫荧光的分析,书写定制的Python脚本以处理并且测定在FISH和IF通道中收集的3D图像数据。核染色用高斯滤波器(δ=2.0)抹掉,最大程度投影于z平面中,并且通过K-平均值群集成2个团簇(细胞核和背景)。FISH焦点用ImageJ手动地召集或使用scipy ndimage程序包自动地召集。关于自动检测,将强度阈值(平均值+3*标准偏差)应用于FISH通道。接着使用ndimage find_objects功能在3D中召集相邻FISH焦点。这些FISH焦点通过多种准则进行过滤,所述准则包括大小(最小100个像素)、最大z-投影的圆度(圆度=4π*面积/周长^2;0.7)和存在于细胞核中(通过上文所述的核屏蔽测定)。关于手动召集,FISH焦点在FISH通道的最大z-投影中进行鉴定,并且x和y坐标用作参考垫以导向上文所述的自动检测。FISH焦点接着定中心于3D-盒(长度大小l=3.0μm)中。接着组合定中心于各FISH和IF对的FISH焦点处的IF信号并且计算平均强度投影,从而提供定中心于FISH焦点处的l x l正方形内的IF信号强度的平均数据。作为对照,关于定中心于相等数目的随机选择的核位置处的IF信号进行这一相同过程。这些平均强度投影接着用于产生信号强度的2D轮廊图。轮廊图使用matplotlib python程序包产生。关于轮廓图,所呈递的强度-颜色范围在颜色的线性范围内(n!=15)进行定制。关于FISH通道,使用黑色至品红色。关于IF通道,我们使用chroma.js(在线颜色生成器)在15个仓内产生颜色,其中关键转变颜色是选择为黑色、蓝紫色、中蓝色、绿黄色。进行此举以确保读者的眼睛可能更容易地检测信号对比度。所产生的颜色图用于所有IF图中的15个均匀间隔的强度仓。使用相同彩色比例尺对定中心于FISH处或随机选择的核位置处的平均IF作图,所述彩色比例尺经过设置以包括各图的最小和最大信号。
参考文献
1.S.Alberti,The wisdom of crowds:regulating cell function throughcondensed states of living matter.J Cell Sci 130,2789-2796(2017).
2.S.F.Banani,H.O.Lee,A.A.Hyman,M.K.Rosen,Biomolecular condensates:organizers of cellular biochemistry.Nat Rev Mol CellBiol 18,285-298(2017).
3.A.A.Hyman,C.A.Weber,F.Julicher,Liquid-liquid phase separation inbiology.Annu Rev Cell Dev Biol 30,39-58(2014).
4.Y.Shin,C.P.Brangwynne,Liquid phase condensation in cell physiologyand disease.Science 357,(2017).
5.R.J.Wheeler,A.A.Hyman,Controlling compartmentalization by non-membrane-bound organelles.Philos Trans R Soc Lond B Biol Sci 373,(2018).
6.A.Boija et al.,Transcription Factors Activate Genes through thePhase-Separation Capacity of Their Activation Domains.Cell 175,1842-1855e1816(2018).
7.D.Hnisz,K.Shrinivas,R.A.Young,A.K.Chakraborty,P.A.Sharp,A PhaseSeparation Model for Transcriptional Control.Cell 169,13-23(2017).
8.B.R.Sabari et al.,Coactivator condensation at super-enhancers linksphase separation and gene control.Science 361,(2018).
9.W.K.Cho et al.,Mediator and RNA polymerase II clusters associate intranscription-dependeht condensates.Science 361,412-415(2018).
10.L.M.Tuttle et al.,Gcn4-Mediator Specificity Is Mediated by a Largeand Dynamic Fuzzy Protein-Protein Complex.Cell Rep 22,3251-3264(2018).
11.J.E.Bradner,D.Hnisz,R.A.Young,Transcriptional Addiction inCancer.Cell 168,629-643(2017).
12.J.J.Bouchard et al.,Cancer Mutations of the Tumor Suppressor SPOPDisrupt the Formation of Active,Phase-Separated Compartments.Mol Cell 72,19-36 e18 (2018).
13.G.Boulay et al.,Cancer-Specific Retargeting of BAF Complexes by aPrion-like Domain.Cell 171,163-178 e119(2017).
14.J.S.Roe et al.,Enhancer Reprogramming Promotes Pancreatic CancerMetastasis.Cell 170,875-888 e820(2017).
15.S.Rahman et al.,Activation of the LMO2 oncogene through asomatically acquired neomorphic promoter in T-cell acute lymphoblasticleukemia.Blood 129,3221-3226(2017).
16.Y.Wang et al.,CDK7-dependent transcriptional addiction in triple-negative breast cancer.Cell 163,174-186(2015).
17.A.G.Waks,E.P.Winer,Breast Cancer Treatment:A Review.JAMA 321,288-300(2019).
18.Y.K.Kang,M.Guermah,C.X.Yuan,R.G.Roeder,The TRAP/Mediatorcoactivator complex interacts directly with estrogen receptors alpha and betathrough the TRAP220 subunit and directly enhances estrogen receptor functionin vitro.Proc Natl Acad Sci USA 99,2642-2647(2002).
19.D.Dubik,T.C.Dembinski,R.P.Shiu,Stimulation of c-myc oncogeneexpression associated with estrogen-induced proliferation of human breastcancer cells.Cancer Res 47,6517-6521(1987).
20.Y.Shang,X.Hu,J.DiRenzo,M.A.Lazar,M.Brown,Cofactor dynamics andsufficiency in estrogen receptor-regulated transcription.Cell 103,843-852(2000).
21.C.E.Nesbit,J.M.Tersak,E.V.Prochownik,MYC oncogenes and humanneoplastic disease.Oncogene 18,3004-3016(1999).
22.T.Borggrefe,X.Yue,Interactions between subunits of the Mediatorcomplex with gene-specific transcription factors.Semin Cell Dev Biol 22,759-768(2011).
23.J.S.Carroll et al.,Genome-wide analysis of estrogen receptorbinding sites.Nat Genet 38,1289-1297(2006).
24.A.K.Shiau et al.,The structural basis of estrogen receptor/coactivator recognition and the antagonism of this interaction bytamoxifen.Cell 95,927-937(1998).
25.S.M.Janicki et al.,From silencing to gene expression:real-timeanalysis in single cells.Cell 116,683-698(2004).
26.S.Chong et al.,Imaging dynamic and selective low-complexity domaininteractions that control gene transcription.Science 361,(2018).
27.C.K.Osborne,R.Schiff,Mechanisms of endocrine resistance in breastcancer.Annu Rev Med 62,233-247(2011).
28.S.F.Banani et al.,Compositional Control of Phase-SeparatedCellular Bodies.Cell 166,651-663(2016).
29.S.W.Fanning et al.,Estrogen receptor alpha somatic mutations Y537Sand D538G confer breast cancer endocrine resistance by stabilizing theactivating function-2 binding conformation.Elife 5,(2016).
30.J.T.Lei et al.,Functional Annotation of ESR1 Gene Fusions inEstrogen Receptor-Positive Breast Cancer.Cell Rep 24,1434-1444 e1437(2018).
31.M.S.Ozers et al.,Analysis of ligand-dependent recruitment ofcoactivator peptides to estrogen receptor using fluorescence polarization.MolEndocrinol 19,25-34(2005).
32.A.Nagalingam et al.,Medl plays a critical role in the developmentof tamoxifen resistance.Carcinogenesis 33,918-930(2012).
33.D.Hnisz et al.,Super-enhancers in the control of cell identity anddisease.Cell 155,934-947(2013).
34.M.R.Mansour et al.,Oncogene regulation.An oncogenic super-enhancerformed through somatic mutation of a noncoding intergenic element.Science346,1373-1377(2014).

Claims (352)

1.一种调节一种或多种基因的转录的方法,所述方法包括调节与所述一种或多种基因缔合的凝聚物的形成、组成、维持、溶解、活性和/或调控,其中所述凝聚物是转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物。
2.如权利要求1所述的方法,其中所述凝聚物通过增加或减少与所述凝聚物缔合的组分的价态来调节。
3.如权利要求1-2所述的方法,其中所述凝聚物通过使所述凝聚物接触与所述凝聚物的组分的一个或多个固有无序域相互作用的剂来调节。
4.如权利要求2-3所述的方法,其中所述组分是信号传导因子、甲基-DNA结合蛋白、基因沉默因子、RNA聚合酶、剪切因子、BRD4、介体、介体组分、MED1、MED15、转录因子或核受体配体。
5.如权利要求4所述的方法,其中所述信号传导因子是选自由TCF7L2、TCF7、TCF7L1、LEF1、β-连环蛋白、SMAD2、SMAD3、SMAD4、STAT1、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6和NF-κB组成的组。
6.如权利要求4或5所述的方法,其中所述信号传导因子包含一个或多个固有无序域。
7.如权利要求4-6所述的方法,其中所述信号传导因子优先地结合于与所述转录凝聚物缔合的一种或多种信号反应元件或介体。
8.如权利要求4-7所述的方法,其中所述转录凝聚物包含主转录因子。
9.如权利要求4所述的方法,其中所述甲基-DNA结合蛋白优先地结合于甲基化DNA。
10.如权利要求4或9所述的方法,其中所述甲基-DNA结合蛋白是MECP2、MBD1、MBD2、MBD3或MBD4。
11.如权利要求4、9或10所述的方法,其中所述甲基-DNA结合蛋白与基因沉默相关。
12.如权利要求4所述的方法,其中所述基因沉默因子与异染色质缔合。
13.如权利要求4或12所述的方法,其中所述基因沉默因子是HP1α、TBL1R(转导蛋白β样蛋白)、HDAC3(组蛋白脱乙酰基酶3)或SMRT(视黄酸和甲状腺受体的沉默介体)。
14.如权利要求4所述的方法,其中所述RNA聚合酶与mRNA起始或延伸复合物物理缔合。
15.如权利要求4或14所述的方法,其中所述RNA聚合酶是RNA聚合酶II或RNA聚合酶IIC端区。
16.如权利要求15所述的方法,其中所述RNA聚合酶IIC端区包含固有无序区(IDR)。
17.如权利要求16所述的方法,其中所述IDR包含磷酸化位点。
18.如权利要求4所述的方法,其中所述剪切因子是SRSF2、SRRM1或SRSF1。
19.如权利要求4所述的方法,其中所述转录因子是OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、基因沉默因子或融合致癌转录因子。
20.如权利要求19所述的方法,其中所述核受体是核激素受体(NHR)。
21.如权利要求19-20所述的方法,其中所述核受体当结合于同源配体时活化转录。
22.如权利要求21所述的方法,其中所述同源配体是激素。
23.如权利要求19-21所述的方法,其中所述核受体是在不结合于同源配体的情况下活化转录的突变型核受体。
24.如权利要求19-23所述的方法,其中所述核受体是雌激素受体(ER)、具有组成性活性的突变型ER或视黄酸受体-α(RARa)。
25.如权利要求19所述的方法,其中所述SOX家族转录因子是SOX2。
26.如权利要求19所述的方法,其中GATA家族转录因子是GATA2。
27.如权利要求19所述的方法,其中所述基因沉默因子与异染色质缔合。
28.如权利要求3-27所述的方法,其中所述剂包含肽、核酸或小分子。
29.如权利要求28所述的方法,其中所述肽针对酸性氨基酸进行富集。
30.如权利要求3-29所述的方法,其中所述剂是信号传导因子模拟物。
31.如权利要求3-29所述的方法,其中所述剂是信号传导因子拮抗剂。
32.如权利要求3-29所述的方法,其中所述剂包含磷酸化或低磷酸化RNA聚合酶IIC端域(PolIICTD)或其功能片段。
33.如权利要求32所述的方法,其中所述剂优先地结合低磷酸化PolIICTD。
34.如权利要求3-29所述的方法,其中所述剂结合甲基化DNA。
35.如权利要求3-29所述的方法,其中所述剂结合甲基-DNA结合蛋白。
36.如权利要求3-35所述的方法,其中与所述剂接触会使所述凝聚物稳定化或溶解,由此调节所述一种或多种基因的转录。
37.如权利要求1-36所述的方法,其中所述凝聚物通过调节与所述凝聚物缔合的转录因子与所述凝聚物的组分的结合来调节。
38.如权利要求37所述的方法,其中调节所述转录因子的活化域与所述凝聚物的组分的所述结合。
39.如权利要求37-38所述的方法,其中所述凝聚物的所述组分是共活化子、辅因子、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶或核受体配体。
40.如权利要求39所述的方法,其中所述共活化子、辅因子、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶或核受体配体是介体、介体组分、MED1、MED15、p300、BRD4、TFIID、β-连环蛋白、STAT3、SMAD3、NF-kB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1或激素。
41.如权利要求38-40所述的方法,其中所述转录因子是OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子。
42.如权利要求38-41所述的方法,其中所述转录因子与所述凝聚物的组分的所述结合通过使所述转录因子或凝聚物与肽、核酸或小分子接触来调节。
43.如权利要求42所述的方法,其中所述肽针对酸性氨基酸进行富集。
44.如权利要求1所述的方法,其中所述转录凝聚物通过调节配体与所述凝聚物所缔合的核受体的结合来调节。
45.如权利要求44所述的方法,其中所述配体是激素。
46.如权利要求44-45所述的方法,其中所述配体的所述结合用剂调节。
47.如权利要求1所述的方法,其中所述转录凝聚物通过调节与所述凝聚物缔合的核受体与所述凝聚物的组分的结合来调节。
48.如权利要求47所述的方法,其中所述凝聚物的所述组分是共活化子、辅因子或核受体配体。
49.如权利要求48所述的方法,其中所述共活化子、辅因子或核受体配体是介体组分或激素。
50.如权利要求47-49所述的方法,其中所述核受体是在不结合于同源配体的情况下活化转录的突变型核受体。
51.如权利要求47-50所述的方法,其中所述核受体与所述组分的所述结合用剂调节。
52.如权利要求1-2所述的方法,其中所述凝聚物通过调节信号传导因子与所述转录凝聚物的组分的结合来调节。
53.如权利要求52所述的方法,其中所述组分是介体、介体组分或转录因子。
54.如权利要求52-53所述的方法,其中所述转录凝聚物与超级增强子缔合。
55.如权利要求52-54所述的方法,其中调节所述转录凝聚物会调节一种或多种致癌基因的表达。
56.如权利要求52-55所述的方法,其中所述信号传导因子与致癌信号传导途径缔合。
57.如权利要求52-56所述的方法,其中所述凝聚物包含异常水平的信号传导因子。
58.如权利要求1-2所述的方法,其中所述异染色质凝聚物通过调节甲基-DNA结合蛋白与所述凝聚物的组分或与甲基化DNA的结合来调节。
59.如权利要求1-2所述的方法,其中所述异染色质凝聚物通过调节基因沉默因子与所述凝聚物的组分的结合来调节。
60.如权利要求1-2所述的方法,其中与mRNA起始或延伸复合物缔合的所述凝聚物通过调节RNA聚合酶与所述转录因子的组分的结合来调节。
61.如权利要求1-2所述的方法,其中与mRNA起始或延伸复合物缔合的所述凝聚物通过调节剪切因子与所述转录因子的组分的结合来调节。
62.如权利要求1-2所述的方法,其中所述凝聚物通过调节所述凝聚物中的组分的量来调节。
63.如权利要求62所述的方法,其中所述组分是一种或多种转录辅因子、核受体配体、信号传导因子、甲基-DNA结合蛋白、基因沉默因子、RNA聚合酶、剪切因子和/或信号传导转录因子。
64.如权利要求63所述的方法,其中所述组分是介体、介体组分、MED1、MED15、p300、BRD4、TFIID、β-连环蛋白、STAT3、SMAD3、NF-kB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1或激素。
65.如权利要求62-64所述的方法,其中所述凝聚物组分是选自OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体和融合致癌转录因子的转录因子。
66.如权利要求62-65所述的方法,其中与所述凝聚物缔合的所述组分的量通过与降低或消除所述组分与所述凝聚物之间的相互作用的剂接触来调节。
67.如权利要求66所述的方法,其中所述剂靶向所述组分的相互作用域。
68.如权利要求67所述的方法,其中所述相互作用域是一个或多个固有无序域。
69.如权利要求66所述的方法,其中所述剂靶向转录因子活化域。
70.如权利要求69所述的方法,其中所述剂靶向所述活化域的固有无序域。
71.如权利要求1-2所述的方法,其中调节所述转录凝聚物会调节一种或多种信号传导途径。
72.如权利要求71所述的方法,其中所述信号传导途径促进疾病发病机理。
73.如权利要求71-72所述的方法,其中所述信号传导途径促进癌症。
74.如权利要求71-73所述的方法,其中所述信号传导途径涉及激素信号传导。
75.如权利要求71-74所述的方法,其中所述信号传导途径包含作为所述转录凝聚物的组分的信号传导因子。
76.如权利要求75所述的方法,其中所述信号传导因子是选自由TCF7L2、TCF7、TCF7L1、LEF1、β-连环蛋白、SMAD2、SMAD3、SMAD4、STAT1、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6和NF-κB组成的组。
77.如权利要求1-2所述的方法,其中调节所述转录凝聚物会调节所述凝聚物与一种或多种核孔蛋白之间的相互作用。
78.如权利要求77所述的方法,其中所述转录凝聚物与所述一种或多种核孔蛋白之间的相互作用的调节会调节核信号传导、mRNA输出和/或mRNA翻译。
79.如权利要求1-2所述的方法,其中调节所述异染色质凝聚物会调节所述凝聚物与甲基-DNA结合蛋白之间的相互作用。
80.如权利要求1-2或79所述的方法,其中调节所述异染色质凝聚物会调节所述凝聚物与基因沉默因子之间的相互作用。
81.如权利要求79-80所述的方法,其中调节所述异染色质凝聚物会调节位于异染色质中的一种或多种基因的抑制或活化。
82.如权利要求1-2所述的方法,其中调节与mRNA起始或延伸复合物缔合的所述凝聚物会调节所述凝聚物与剪切因子之间的相互作用。
83.如权利要求1-2或82所述的方法,其中调节与mRNA起始或延伸复合物缔合的所述凝聚物会调节所述凝聚物与RNA聚合酶之间的相互作用。
84.如权利要求82-83所述的方法,其中调节与mRNA起始或延伸复合物缔合的所述凝聚物会调节mRNA起始或延伸。
85.如权利要求82-84所述的方法,其中调节与mRNA起始或延伸复合物缔合的所述凝聚物会调节mRNA剪切。
86.如权利要求1-2所述的方法,其中调节所述凝聚物会调节炎症反应。
87.如权利要求86所述的方法,其中所述炎症反应是对病毒或细菌的炎症反应。
88.如权利要求1-2所述的方法,其中调节所述转录凝聚物或异染色质凝聚物会降低或消除癌细胞的生长或活力。
89.如权利要求1-2所述的方法,其中所述凝聚物通过改变与所述凝聚物缔合的核苷酸序列来调节。
90.如权利要求89所述的方法,其中所述改变包含添加或缺失核苷酸。
91.如权利要求90所述的方法,其中所述添加或缺失的核苷酸编码酸性核苷酸或芳香族氨基酸。
92.如权利要求89所述的方法,其中所述改变包含表观遗传修饰。
93.如权利要求92所述的方法,其中所述表观遗传修饰包含DNA甲基化。
94.如权利要求89所述的方法,其中所述核苷酸序列的所述改变包含DNA、RNA或蛋白质系栓于所述核苷酸序列。
95.如权利要求94所述的方法,其中使用dCas位点特异性核酸内切酶将所述DNA、RNA或蛋白质系栓于所述核苷酸序列。
96.如权利要求1-2所述的方法,其中所述凝聚物通过将DNA、RNA或蛋白质系栓于所述凝聚物来调节。
97.如权利要求1-2所述的方法,其中所述凝聚物通过使所述凝聚物与外源RNA接触来调节。
98.如权利要求1-2所述的方法,其中所述凝聚物通过使与所述凝聚物缔合的DNA甲基化或脱甲基化来调节。
99.如权利要求1-2所述的方法,其中与mRNA起始或延伸复合物缔合的所述凝聚物通过使组分磷酸化或脱磷酸化来调节。
100.如权利要求99所述的方法,其中所述组分是RNA聚合酶。
101.如权利要求1-2所述的方法,其中所述凝聚物通过使与所述凝聚物缔合的一种或多种RNA稳定化来调节。
102.如权利要求1-2所述的方法,其中所述凝聚物通过调节与所述凝聚物缔合的RNA的水平来调节。
103.如权利要求1-102所述的方法,其中所述细胞中的RNA加工发生改变。
104.如权利要求103所述的方法,其中RNA加工通过抑制或增强所述凝聚物与一种或多种RNA加工装置凝聚物的融合而发生改变。
105.如权利要求1-2所述的方法,其中所述凝聚物通过使所述凝聚物与结合于所述凝聚物的组分的固有无序域的剂接触来调节。
106.如权利要求105所述的方法,其中所述组分是介体、介体组分、MED1、MED15、p300、BRD4、TFIID、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT RNA聚合酶II、SRSF2、SRRM1、SRSF1或核受体配体。
107.如权利要求105所述的方法,其中所述组分是转录因子。
108.如权利要求107所述的方法,其中所述转录因子是OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子。
109.如权利要求105-108所述的方法,其中所述剂是多价的。
110.如权利要求109所述的方法,其中所述剂是二价的。
111.如权利要求109-110所述的方法,其中所述剂还结合于所述组分的非固有无序域或结合于所述凝聚物的第二组分。
112.如权利要求104-111所述的方法,其中所述剂改变或破坏所述转录凝聚物的组分之间的相互作用。
113.如权利要求1-2所述的方法,其中所述凝聚物的形成通过将一种或多种凝聚物组分系栓于基因组DNA来引起、增强或稳定化。
114.如权利要求113所述的方法,其中所述组分包含DNA、RNA、肽和/或蛋白质。
115.如权利要求113-114所述的方法,其中所述组分包含介体、介体组分、MED1、MED14、p300、BRD4、TFIID、信号传导因子、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT RNA聚合酶II、SRSF2、SRRM1、SRSF1或核受体配体。
116.如权利要求113-114所述的方法,其中所述组分是转录因子。
117.如权利要求116所述的方法,其中所述转录因子是OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子。
118.如权利要求113-117所述的方法,其中所述一种或多种组分使用dCas位点特异性核酸内切酶进行系栓。
119.如权利要求1-2所述的方法,其中所述凝聚物通过将所述凝聚物的一种或多种组分隔绝于第二凝聚物中来调节。
120.如权利要求119所述的方法,其中所述第二凝聚物的形成通过使所述细胞与外源肽、核酸、肽和/或蛋白质接触而被诱导。
121.如权利要求119-120所述的方法,其中所述隔绝的组分是转录因子、共活化子、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶或核受体配体。
122.如权利要求121所述的方法,其中所述隔绝的组分是介体、MED1、MED14、p300、BRD4、TFIID、OCT4、p53、MYC、GCN4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体或融合致癌转录因子。
123.如权利要求119-122所述的方法,其中所述隔绝的组分是野生型蛋白质的突变形式。
124.如权利要求123所述的方法,其中所述野生型蛋白质未被隔绝。
125.如权利要求119-124所述的方法,其中所述隔绝的组分是磷酸化组分。
126.如权利要求119-124所述的方法,其中所述隔绝的组分是脱磷酸化组分。
127.如权利要求119-126所述的方法,其中所述隔绝的组分是在疾病状态中过表达的组分。
128.如权利要求119-127所述的方法,其中所述隔绝的组分是核受体。
129.如权利要求128所述的方法,其中所述核受体是核受体的突变形式。
130.如权利要求119所述的方法,其中所述隔绝的组分是信号传导因子。
131.如权利要求119所述的方法,其中所述隔绝的组分是甲基-DNA结合蛋白。
132.如权利要求119所述的方法,其中所述隔绝的组分是剪切因子。
133.如权利要求119所述的方法,其中所述隔绝的组分是基因沉默因子。
134.如权利要求1-2所述的方法,其中所述凝聚物通过调节与所述凝聚物缔合的ncRNA的水平或活性来调节。
135.如权利要求134所述的方法,其中所述ncRNA的所述水平或活性通过使所述ncRNA与结合所述ncRNA的反义寡核苷酸、RNase或化合物接触来调节。
136.如权利要求1-135所述的方法,其中所述方法治疗由凝聚物形成、组成、维持、溶解或调控引起或依赖于凝聚物形成、组成、维持、溶解或调控的疾病或降低所述疾病的可能性。
137.如权利要求1-136所述的方法,其中所述方法治疗癌症或降低癌症的可能性。
138.如权利要求1-137所述的方法,其中所述方法治疗与异常蛋白质表达相关的疾病。
139.如权利要求138所述的方法,其中所述疾病引起病理学水平的蛋白质。
140.如权利要求1-139所述的方法,其中所述方法治疗与表达核受体的基因中的突变相关的疾病。
141.如权利要求1-140所述的方法,其中所述方法治疗与甲基-DNA结合蛋白的异常表达或活性相关的疾病。
142.如权利要求1-141所述的方法,其中所述方法治疗与异常mRNA起始或延伸相关的疾病。
143.如权利要求1-141所述的方法,其中所述方法治疗与异常mRNA剪切相关的疾病。
144.一种调节mRNA起始的方法,所述方法包括调节与mRNA起始复合物物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。
145.如权利要求144所述的方法,其中调节mRNA起始还调节mRNA延伸、剪切或加帽。
146.如权利要求144或145所述的方法,其中调节与mRNA起始复合物物理缔合的所述凝聚物的形成、组成、维持、溶解和/或调控会调节mRNA转录速率。
147.如权利要求144-146所述的方法,其中调节与mRNA起始复合物物理缔合的所述凝聚物的形成、组成、维持、溶解和/或调控会调节基因产物的水平。
148.如权利要求144-147所述的方法,其中与mRNA起始复合物物理缔合的所述凝聚物的形成、组成、维持、溶解和/或调控是用剂调节。
149.如权利要求148所述的方法,其中所述剂包含低磷酸化RNA聚合酶IIC端域(PolIICTD)或其功能片段。
150.如权利要求148所述的方法,其中所述剂优先地结合低磷酸化PolIICTD。
151.一种调节mRNA延伸的方法,所述方法包括调节与mRNA延伸复合物物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。
152.如权利要求151所述的方法,其中调节mRNA延伸还调节mRNA起始。
153.如权利要求151或152所述的方法,其中调节与mRNA延伸复合物物理缔合的所述凝聚物的形成、组成、维持、溶解和/或调控会调节mRNA的共转录加工。
154.如权利要求151-153所述的方法,其中调节与mRNA延伸复合物物理缔合的所述凝聚物的形成、组成、维持、溶解和/或调控会调节mRNA剪切变体的数目或相对比例。
155.如权利要求151-154所述的方法,其中与mRNA延伸复合物物理缔合的所述凝聚物的形成、组成、维持、溶解和/或调控是用剂调节。
156.如权利要求155所述的方法,其中所述剂包含磷酸化RNA聚合酶IIC端域(PolIICTD)或其功能片段。
157.如权利要求155所述的方法,其中所述剂优先地结合磷酸化PolIICTD。
158.一种调节凝聚物的形成、组成、维持、溶解和/或调控的方法,所述方法包括调节凝聚物组分的磷酸化或脱磷酸化。
159.如权利要求158所述的方法,其中所述组分是RNA聚合酶II或RNA聚合酶IIC端区。
160.一种治疗与异常mRNA加工相关的疾病或疾患或降低所述疾病或疾患的可能性的方法,所述方法包括调节与mRNA延伸复合物物理缔合的凝聚物的形成、组成、维持、溶解和/或调控。
161.一种鉴定调节凝聚物形成、稳定性或形态的剂的方法,所述方法包括
a.提供具有与mRNA起始或延伸复合物物理缔合的凝聚物的细胞,
b.使所述细胞与测试剂接触,和
c.测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性或形态
其中所述凝聚物包含低磷酸化RNA聚合酶IIC端域(PolIICTD)、磷酸化RNA聚合酶IIC端域(Pol IICTD)、剪切因子或其功能片段。
162.一种鉴定调节凝聚物形成、稳定性或形态的剂的方法,所述方法包括
a.提供体外凝聚物并且评估所述体外凝聚物的一种或多种物理特性,
b.使所述体外凝聚物与测试剂接触,和
c.评估所述测试剂是否引起所述体外凝聚物的所述一种或多种物理特性的变化
其中所述凝聚物包含低磷酸化RNA聚合酶IIC端域(PolIICTD)、磷酸化RNA聚合酶IIC端域(Pol IICTD)、剪切因子或其功能片段。
163.一种分离的合成凝聚物,其包含低磷酸化RNA聚合酶IIC端域(PolIICTD)或其功能片段。
164.一种分离的合成凝聚物,其包含磷酸化RNA聚合酶IIC端域(PolIICTD)或其功能片段。
165.一种分离的合成凝聚物,其包含剪切因子或其功能片段。
166.一种调节一种或多种基因的转录的方法,所述方法包括调节异染色质凝聚物的形成、组成、维持、溶解和/或调控。
167.如权利要求166所述的方法,其中调节所述异染色质凝聚物会使所述一种或多种基因的转录的抑制增加或稳定化。
168.如权利要求166所述的方法,其中调节所述异染色质凝聚物会减少所述一种或多种基因的转录的抑制。
169.如权利要求166-168所述的方法,其中调节多种异染色质凝聚物。
170.如权利要求166-169所述的方法,其中所述异染色质凝聚物的形成、组成、维持、溶解和/或调控是用剂调节。
171.如权利要求170所述的方法,其中所述剂包含肽、核酸或小分子。
172.如权利要求170-171所述的方法,其中所述剂结合甲基化DNA、甲基-DNA结合蛋白或基因沉默因子。
173.一种调节基因沉默的方法,所述方法包括调节异染色质凝聚物的形成、组成、维持、溶解和/或调控。
174.如权利要求173所述的方法,其中基因沉默是稳定化或增加的。
175.如权利要求173所述的方法,其中基因沉默是减少的。
176.如权利要求173-175所述的方法,其中基因沉默是用剂调节。
177.一种治疗与异常基因沉默相关的疾病或疾患或降低所述疾病或疾患的可能性的方法,所述方法包括调节异染色质凝聚物的形成、组成、维持、溶解和/或调控。
178.如权利要求177所述的方法,其中与异常基因沉默相关的所述疾病或疾患是与甲基-DNA结合蛋白的异常表达或活性相关。
179.如权利要求177-178所述的方法,其中与异常基因沉默相关的所述疾病或疾患是雷特综合征或MeCP2过表达综合征。
180.一种鉴定调节凝聚物形成、稳定性或形态的剂的方法,所述方法包括
a.提供具有凝聚物的细胞,
b.使所述细胞与测试剂接触,和
c.测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性或形态
其中所述凝聚物包含MeCP2或包含MeCP2的C端固有无序区的其片段,或抑制因子。
181.如权利要求180所述的方法,其中所述凝聚物是异染色质凝聚物。
182.如权利要求180-181所述的方法,其中所述凝聚物与甲基化DNA缔合。
183.一种鉴定调节凝聚物形成、稳定性或形态的剂的方法,所述方法包括
a.提供体外凝聚物并且评估所述体外凝聚物的一种或多种物理特性,
b.使所述体外凝聚物与测试剂接触,和
c.评估所述测试剂是否引起所述体外凝聚物的所述一种或多种物理特性的变化
其中所述凝聚物包含MeCP2或包含MeCP2的C端固有无序区的其片段,或抑制因子或其功能片段。
184.一种分离的合成凝聚物,其包含MeCP2或包含MeCP2的C端固有无序区的其片段。
185.一种分离的合成凝聚物,其包含抑制因子或其功能片段。
186.一种鉴定调节凝聚物形成、稳定性、活性或形态的剂的方法,所述方法包括
a.提供具有凝聚物的细胞,
b.使所述细胞与测试剂接触,和
c.测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性、活性或形态,其中所述凝聚物是转录凝聚物、异染色质凝聚物或与mRNA起始或延伸复合物物理缔合的凝聚物。
187.如权利要求186所述的方法,其中所述凝聚物具有可检测标签并且所述可检测标签用于测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性、活性或形态。
188.如权利要求187所述的方法,其中所述细胞经过遗传工程改造以表达所述可检测标签。
189.如权利要求187-188所述的方法,其中所述可检测标签是荧光标签。
190.如权利要求187-189所述的方法,其中所述可检测标签附接至选自由OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、核受体配体、融合致癌转录因子、TFIID、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1和包含固有无序区(IDR)的其片段组成的组的凝聚物组分。
191.如权利要求190所述的方法,其中使用选择性地结合于所述凝聚物或其组分的抗体来测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性、活性或形态。
192.如权利要求191所述的方法,其中所述抗体选择性地结合于选自由OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、核受体配体、融合致癌转录因子、TFIID、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1和包含固有无序区(IDR)的其片段组成的组的凝聚物组分。
193.如权利要求186-192所述的方法,其中使用显微术来执行测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性、活性或形态的步骤。
194.如权利要求193所述的方法,其中所述显微术是反褶积显微术或结构化照明显微术。
195.如权利要求186-194所述的方法,其中使用DNA-FISH、RNA-FISH或其组合来执行测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性、活性或形态的步骤。
196.如权利要求186-195所述的方法,其中所述凝聚物的组分是核受体或包含IDR的其片段。
197.如权利要求196所述的方法,其中所述核受体当结合于同源配体时活化转录。
198.如权利要求196所述的方法,其中所述核受体是在不结合于同源配体的情况下活化转录的突变型核受体。
199.如权利要求196-198所述的方法,其中所述核受体是核激素受体。
200.如权利要求196-199所述的方法,其中所述核受体具有突变。
201.如权利要求199-200所述的方法,其中所述核受体是雌激素受体或突变型雌激素受体。
202.如权利要求201所述的方法,其中所述突变型雌激素受体不依赖于雌激素来活化转录。
203.如权利要求201-202所述的方法,其中由所述突变型雌激素受体实现的转录活化不受他莫昔芬(tamoxifen)或其活性代谢物抑制。
204.如权利要求201-203所述的方法,其中使所述细胞与雌激素接触。
205.如权利要求201-204所述的方法,其中使所述细胞与他莫昔芬或其活性代谢物接触。
206.如权利要求204-205所述的方法,其进一步包括所述剂在雌激素和/或他莫昔芬或其活性代谢物存在下是否抑制突变型雌激素受体的转录活性。
207.如权利要求200所述的方法,其中所述突变与疾病或疾患相关或代表所述疾病或疾患的特征。
208.如权利要求207所述的方法,其中所述疾病或疾患是癌症。
209.如权利要求186-208所述的方法,其中所述转录凝聚物的所述组分是信号传导因子或包含IDR的其片段。
210.如权利要求209所述的方法,其中所述转录凝聚物与一种或多种信号反应元件物理缔合。
211.如权利要求209-210所述的方法,其中所述信号传导因子与疾病相关的信号传导途径缔合。
212.如权利要求211所述的方法,其中所述疾病是癌症。
213.如权利要求186-212所述的方法,其中所述凝聚物调节致癌基因的转录。
214.如权利要求186-213所述的方法,其中所述凝聚物与超级增强子缔合。
215.如权利要求186-195所述的方法,其中与mRNA起始或延伸复合物物理缔合的所述凝聚物的所述组分是甲基-DNA结合蛋白或包含C端IDR的其片段,或抑制因子或包含IDR的其片段。
216.如权利要求215所述的方法,其中所述异染色质凝聚物与甲基化DNA或异染色质缔合。
217.如权利要求215-216所述的方法,其中所述异染色质凝聚物包含异常水平或活性的甲基-DNA结合蛋白。
218.如权利要求215-217所述的方法,其中所述细胞是神经细胞。
219.如权利要求218所述的方法,其中所述细胞来源于具有雷特综合征或MeCP2过表达综合征的受试者。
220.如权利要求215-219所述的方法,其中评估所述剂对与mRNA起始或延伸复合物物理缔合的所述凝聚物所缔合的基因的表达的抑制。
221.如权利要求186-220所述的方法,其中与mRNA起始或延伸复合物物理缔合的所述凝聚物的所述组分是剪切因子或包含IDR的其片段,或RNA聚合酶或包含IDR的其片段。
222.如权利要求221所述的方法,其中所述细胞还包含细胞周期素依赖性激酶。
223.如权利要求221-222所述的方法,其中所述RNA聚合酶是RNA聚合酶II(Pol II)。
224.如权利要求221-223所述的方法,其中评估通过与所述剂接触而引起的与所述凝聚物相关的RNA转录起始活性的变化。
225.如权利要求221-224所述的方法,其中评估通过与所述剂接触而引起的与所述凝聚物相关的RNA延伸或剪切活性的变化。
226.一种鉴定调节凝聚物形成、稳定性、活性或形态的剂的方法,所述方法包括
a.提供体外凝聚物并且评估所述体外凝聚物的一种或多种物理特性,
b.使所述体外凝聚物与测试剂接触,和
c.评估所述测试剂是否引起所述体外凝聚物的所述一种或多种物理特性的变化。
227.如权利要求226所述的方法,其中所述一种或多种物理特性与所述体外凝聚物引起或抑制细胞中的基因表达的能力有关。
228.如权利要求226-227所述的方法,其中所述一种或多种物理特性包含大小、浓度、渗透性、形态或粘度。
229.如权利要求226-228所述的方法,其中所述测试剂包含小分子、肽、RNA或DNA。
230.如权利要求226-229所述的方法,其中所述体外凝聚物包含DNA、RNA和蛋白质。
231.如权利要求226-230所述的方法,其中所述体外凝聚物包含选自由OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、核受体配体、融合致癌转录因子、TFIID、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1和包含固有无序区(IDR)的其片段组成的组的凝聚物组分。
232.如权利要求226-231所述的方法,其中所述体外凝聚物包含固有无序区或域。
233.如权利要求232所述的方法,其中所述固有无序区或域包含MED1或BRD4固有无序区或域。
234.如权利要求232所述的方法,其中所述固有无序区或域包含一个或多个转录因子固有无序区或域。
235.如权利要求234所述的方法,其中所述固有无序区或域包含活化因子固有无序区或域。
236.如权利要求233-235所述的方法,其中所述核受体当结合于同源配体时活化转录。
237.如权利要求231-235所述的方法,其中所述核受体是在不结合于同源配体的情况下活化转录的突变型转录因子。
238.如权利要求231-237所述的方法,其中所述核受体是核激素受体。
239.如权利要求231-238所述的方法,其中所述核受体具有突变。
240.如权利要求238-239所述的方法,其中所述核受体是雌激素受体或突变型雌激素受体。
241.如权利要求240所述的方法,其中所述突变型雌激素受体不依赖于雌激素来活化转录。
242.如权利要求240-241所述的方法,其中由所述突变型雌激素受体实现的转录活化不受他莫昔芬或其活性代谢物抑制。
243.如权利要求240-242所述的方法,其中使所述细胞与雌激素接触。
244.如权利要求240-243所述的方法,其中使所述细胞与他莫昔芬或其活性代谢物接触。
245.如权利要求243-244所述的方法,其进一步包括所述剂在雌激素和/或他莫昔芬或其活性代谢物存在下是否抑制突变型雌激素受体的转录活性。
246.如权利要求239-245所述的方法,其中所述突变与疾病或疾患相关。
247.如权利要求246所述的方法,其中所述疾病或疾患是癌症。
248.如权利要求226-247所述的方法,其中所述体外凝聚物通过微弱蛋白质-蛋白质相互作用形成。
249.如权利要求226-248所述的方法,其中所述体外凝聚物包含在所述核受体配体不存在的情况下活化基因的转录的突变型核受体,或包含IDR的其片段。
250.如权利要求226-250所述的方法,其中所述体外凝聚物包含在所述核受体配体不存在的情况下抑制基因的转录的突变型核受体,或包含IDR的其片段。
251.如权利要求226-250所述的方法,其中所述体外凝聚物包含基因转录的活化所必需的信号传导因子或包含IDR的其片段。
252.如权利要求226-251所述的方法,其中所述信号传导因子与致癌信号传导途径缔合。
253.如权利要求226-235所述的方法,其中所述凝聚物包含甲基-DNA结合蛋白或包含C端IDR的其片段,或抑制因子或包含IDR的其片段。
254.如权利要求253所述的方法,其中所述凝聚物与甲基化DNA或异染色质缔合。
255.如权利要求253-254所述的方法,其中所述凝聚物包含异常水平或活性的甲基-DNA结合蛋白。
256.如权利要求253-255所述的方法,其中评估所述剂对所述凝聚物所缔合的基因的表达的抑制。
257.如权利要求226-235所述的方法,其中所述凝聚物包含剪切因子或包含IDR的其片段,或RNA聚合酶或包含IDR的其片段。
258.如权利要求257所述的方法,其中使所述凝聚物与转录起始复合物或延伸复合物缔合。
259.如权利要求257-258所述的方法,其中使所述凝聚物与细胞周期素依赖性激酶接触。
260.如权利要求257-259所述的方法,其中所述RNA聚合酶是RNA聚合酶II(Pol II)。
261.如权利要求257-260所述的方法,其中评估通过与所述剂接触而引起的与所述凝聚物相关的RNA转录起始活性的变化。
262.如权利要求257-261所述的方法,其中评估通过与所述剂接触而引起的与所述凝聚物相关的RNA延伸或剪切活性的变化。
263.如权利要求226-262所述的方法,其中所述体外凝聚物包含(固有无序域)-(诱导性低聚域)融合蛋白。
264.如权利要求263所述的方法,其中所述融合蛋白是固有无序域-Cry2融合蛋白。
265.如权利要求263-264所述的方法,其中所述诱导性低聚域是由小分子、蛋白质或核酸诱导。
266.如权利要求263-265所述的方法,其中所述固有无序域是OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1或TFIID固有无序域。
267.如权利要求263-266所述的方法,其中所述体外凝聚物响应蓝光刺激而形成。
268.如权利要求263-267所述的方法,其中所述体外凝聚物模拟细胞中发现的凝聚物。
269.如权利要求268所述的方法,其中所述细胞是癌细胞或神经细胞。
270.一种鉴定调节凝聚物形成、稳定性、功能或形态的剂的方法,所述方法包括
a.提供具有报告基因的凝聚物依赖性表达的细胞或体外转录测定,
b.使所述细胞或体外转录测定与测试剂接触,和
c.评估所述报告基因的表达。
271.如权利要求270所述的方法,其中步骤(a)中的所述细胞或体外转录测定不表达所述报告基因。
272.如权利要求270所述的方法,其中步骤(a)中的所述细胞或体外转录测定表达所述报告基因。
273.如权利要求270-272所述的方法,其中所述报告基因的表达依赖于具有异源DNA结合域和活化域的转录因子。
274.如权利要求270-273所述的方法,其中所述报告基因的表达依赖于具有突变型转录因子活化域的转录因子。
275.如权利要求274所述的方法,其中所述突变型转录因子活化域与疾病或疾患相关。
276.如权利要求270-275所述的方法,其中所述凝聚物包含核受体或包含IDR的其片段。
277.如权利要求276所述的方法,其中所述核受体当结合于同源配体时活化转录。
278.如权利要求276所述的方法,其中所述核受体是在不结合于同源配体的情况下活化转录的突变型核受体。
279.如权利要求276-278所述的方法,其中所述核受体是核激素受体。
280.如权利要求270-275所述的方法,其中所述凝聚物包含信号传导因子或包含IDR的其片段。
281.如权利要求280所述的方法,其中所述信号传导因子与致癌信号传导途径缔合。
282.如权利要求270-275所述的方法,其中所述凝聚物包含甲基-DNA结合蛋白或包含C端IDR的其片段,或抑制因子或包含IDR的其片段。
283.如权利要求282所述的方法,其中所述凝聚物与甲基化DNA或异染色质缔合。
284.如权利要求281-282所述的方法,其中所述凝聚物包含异常水平或活性的甲基-DNA结合蛋白。
285.如权利要求281-283所述的方法,其中评估所述剂对所述凝聚物所缔合的基因的表达的抑制。
286.如权利要求270-275所述的方法,其中所述凝聚物包含剪切因子或包含IDR的其片段,或RNA聚合酶或包含IDR的其片段。
287.如权利要求286所述的方法,其中使所述凝聚物与转录起始复合物或延伸复合物缔合。
288.如权利要求286-287所述的方法,其中使所述凝聚物与细胞周期素依赖性激酶接触。
289.如权利要求286-288所述的方法,其中所述RNA聚合酶是RNA聚合酶II(Pol II)。
290.如权利要求286-289所述的方法,其中评估通过与所述剂接触而引起的与所述凝聚物相关的RNA转录起始活性的变化。
291.如权利要求286-290所述的方法,其中评估通过与所述剂接触而引起的与所述凝聚物相关的RNA延伸或剪切活性的变化。
292.一种分离的合成凝聚物,其包含DNA、RNA和蛋白质中的一者、两者或三者。
293.如权利要求292所述的分离的合成凝聚物,其中所述凝聚物包含OCT4、p53、MYC、GCN4、介体、介体组分、MED1、MED15、p300、BRD4、NANOG、MyoD、KLF4、SOX家族转录因子、GATA家族转录因子、核受体、核受体配体、融合致癌转录因子、TFIID、信号传导因子、甲基-DNA结合蛋白、剪切因子、基因沉默因子、RNA聚合酶、β-连环蛋白、STAT3、SMAD3、NF-KB、MECP2、MBD1、MBD2、MBD3、MBD4、HP1α、TBL1R、HDAC3、SMRT、RNA聚合酶II、SRSF2、SRRM1、SRSF1或包含固有无序区(IDR)的其片段。
294.一种液体小液滴,其包含如权利要求292或293所述的分离的合成凝聚物。
295.一种融合蛋白,其包含凝聚物组分和赋予诱导性低聚的域。
296.如权利要求295所述的融合蛋白,其中所述融合蛋白还包含可检测标签。
297.如权利要求296所述的融合蛋白,其中所述可检测标签是荧光标签。
298.一种调节细胞中的一种或多种基因的转录的方法,所述方法包括调节与所述一种或多种基因缔合的凝聚物的组成、维持、溶解和/或调控,其中所述凝聚物包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。
299.如权利要求298所述的方法,其中所述雌激素受体是突变型雌激素受体。
300.如权利要求299所述的方法,其中所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性。
301.如权利要求298-300所述的方法,其中所述雌激素受体片段包含配体结合域或其功能片段。
302.如权利要求298-301所述的方法,其中所述MED1片段包含IDR、LXXLL基序或两者。
303.如权利要求298-302所述的方法,其中使所述凝聚物与雌激素或其功能片段接触。
304.如权利要求298-303所述的方法,其中使所述凝聚物与选择性雌激素选择性调节剂(SERM)接触。
305.如权利要求304所述的方法,其中所述SERM是他莫昔芬或其活性代谢物。
306.如权利要求298-305所述的方法,其中所述凝聚物的调节会降低或消除MYC致癌基因的转录。
307.如权利要求298-306所述的方法,其中所述细胞是乳腺癌细胞。
308.如权利要求298-307所述的方法,其中所述细胞过表达MED1。
309.如权利要求298-308所述的方法,其中所述转录凝聚物通过使所述转录凝聚物与剂接触来调节。
310.如权利要求309所述的方法,其中所述剂降低或消除所述ER与MED1之间的相互作用。
311.如权利要求309-310所述的方法,其中所述剂降低或消除ER与雌激素之间的相互作用。
312.如权利要求309-311所述的方法,其中所述凝聚物包含突变型ER或其片段并且所述剂降低所述一种或多种基因的转录。
313.一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括
a.提供细胞,
b.使所述细胞与测试剂接触,和
c.测定与所述测试剂的接触是否调节凝聚物的形成、稳定性或形态,
其中所述凝聚物包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。
314.如权利要求313所述的方法,其中所述雌激素受体是突变型雌激素受体。
315.如权利要求314所述的方法,其中所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性。
316.如权利要求313-315所述的方法,其中所述雌激素受体片段包含配体结合域或其功能片段。
317.如权利要求313-316所述的方法,其中所述MED1片段包含IDR、LXXLL基序或两者。
318.如权利要求313-317所述的方法,其中使所述凝聚物与雌激素或其功能片段接触。
319.如权利要求313-318所述的方法,其中使所述凝聚物与选择性雌激素选择性调节剂(SERM)接触。
320.如权利要求319所述的方法,其中所述SERM是他莫昔芬或其活性代谢物。
321.如权利要求313-320所述的方法,其中所述凝聚物的调节会降低或消除MYC致癌基因的转录。
322.如权利要求313-321所述的方法,其中所述细胞是乳腺癌细胞。
323.如权利要求313-322所述的方法,其中所述细胞过表达MED1。
324.如权利要求313-323所述的方法,其中所述细胞是ER+乳腺癌细胞。
325.如权利要求313-324所述的方法,其中所述ER+乳腺癌细胞抵抗他莫昔芬治疗。
326.如权利要求313-325所述的方法,其中所述凝聚物包含可检测标记。
327.如权利要求326所述的方法,其中所述凝聚物的组分包含所述可检测标记。
328.如权利要求327所述的方法,其中所述ER或其片段和/或所述MED1或其片段包含所述可检测标记。
329.如权利要求313-328所述的方法,其中所述一种或多种基因包含报告基因。
330.一种鉴定调节凝聚物的形成、稳定性或形态的剂的方法,所述方法包括
a.提供体外凝聚物,
b.使所述凝聚物与测试剂接触,和
c.测定与所述测试剂的接触是否调节所述凝聚物的形成、稳定性或形态,
其中所述凝聚物包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。
331.如权利要求330所述的方法,其中所述雌激素受体是突变型雌激素受体。
332.如权利要求331所述的方法,其中所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性。
333.如权利要求330-332所述的方法,其中所述雌激素受体片段包含配体结合域或其功能片段。
334.如权利要求330-333所述的方法,其中所述MED1片段包含IDR、LXXLL基序或两者。
335.如权利要求330-334所述的方法,其中使所述凝聚物与雌激素或其功能片段接触。
336.如权利要求330-334所述的方法,其中使所述凝聚物与选择性雌激素选择性调节剂(SERM)接触。
337.如权利要求336所述的方法,其中所述SERM是4-羟基他莫昔芬和/或N-脱甲基-4-羟基他莫昔芬。
338.如权利要求330-337所述的方法,其中所述凝聚物是从细胞分离。
339.如权利要求338所述的方法,其中所述细胞是乳腺癌细胞。
340.如权利要求330-339所述的方法,其中所述细胞过表达MED1。
341.如权利要求330-340所述的方法,其中所述细胞是ER+乳腺癌细胞。
342.如权利要求341所述的方法,其中所述ER+乳腺癌细胞抵抗他莫昔芬治疗。
343.如权利要求330-342所述的方法,其中所述凝聚物包含可检测标记。
344.如权利要求343所述的方法,其中所述凝聚物的组分包含所述可检测标记。
345.如权利要求344所述的方法,其中所述ER或其片段和/或所述MED1或其片段包含所述可检测标记。
346.一种分离的合成转录凝聚物,其包含雌激素受体(ER)或其片段和MED1或其片段作为凝聚物组分。
347.如权利要求346所述的分离的合成转录凝聚物,其中所述雌激素受体是突变型雌激素受体。
348.如权利要求347所述的分离的合成转录凝聚物,其中所述突变型雌激素受体具有不依赖于雌激素结合的组成性活性。
349.如权利要求346-348所述的分离的合成转录凝聚物,其中所述雌激素受体片段包含配体结合域或其功能片段。
350.如权利要求346-349所述的分离的合成转录凝聚物,其中所述MED1片段包含IDR、LXXLL基序或两者。
351.如权利要求346-350所述的分离的合成转录凝聚物,其中所述凝聚物包含雌激素或其功能片段。
352.如权利要求346-351所述的分离的合成转录凝聚物,其中所述凝聚物包含选择性雌激素选择性调节剂(SERM)。
CN201980034629.9A 2018-03-23 2019-03-22 通过调节凝聚物来调节基因转录的方法和测定 Pending CN113164622A (zh)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201862647613P 2018-03-23 2018-03-23
US62/647,613 2018-03-23
US201862648377P 2018-03-26 2018-03-26
US62/648,377 2018-03-26
US201862722825P 2018-08-24 2018-08-24
US62/722,825 2018-08-24
US201862752332P 2018-10-29 2018-10-29
US62/752,332 2018-10-29
US201962819662P 2019-03-17 2019-03-17
US62/819,662 2019-03-17
US201962820237P 2019-03-18 2019-03-18
US62/820,237 2019-03-18
PCT/US2019/023694 WO2019183552A2 (en) 2018-03-23 2019-03-22 Methods and assays for modulating gene transcription by modulating condensates

Publications (1)

Publication Number Publication Date
CN113164622A true CN113164622A (zh) 2021-07-23

Family

ID=67987575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980034629.9A Pending CN113164622A (zh) 2018-03-23 2019-03-22 通过调节凝聚物来调节基因转录的方法和测定

Country Status (11)

Country Link
US (1) US20220120736A1 (zh)
EP (1) EP3768329A4 (zh)
JP (2) JP2021535737A (zh)
KR (1) KR20210070233A (zh)
CN (1) CN113164622A (zh)
AU (1) AU2019239084A1 (zh)
CA (1) CA3094974A1 (zh)
IL (1) IL277533A (zh)
SG (1) SG11202009359WA (zh)
TW (1) TW202003051A (zh)
WO (1) WO2019183552A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254499A (zh) * 2021-05-21 2021-08-13 国家卫星气象中心(国家空间天气监测预警中心) 基于长序列历史资料再定标的气候数据集生产方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3921650A1 (en) 2019-02-08 2021-12-15 Dewpoint Therapeutics, Inc. Methods of characterizing condensate-associated characteristics of compounds and uses thereof
CA3140651A1 (en) * 2019-05-15 2020-11-19 Whitehead Institute For Biomedical Research Methods of characterizing and utilizing agent-condensate interactions
WO2021055644A1 (en) 2019-09-18 2021-03-25 Dewpoint Therapeutics, Inc. Methods of screening for condensate-associated specificity and uses thereof
WO2021150937A1 (en) * 2020-01-23 2021-07-29 The Rockefeller University Phase separation sensors and uses thereof
CN111269976A (zh) * 2020-02-03 2020-06-12 清华大学 检测MeCP2突变的物质在检测MeCP2突变是否为致病突变以及筛选药物中的应用
CN111487399B (zh) * 2020-03-26 2021-09-17 湖南师范大学 一种蛋白分子标记在鱼类生殖细胞发育研究中的应用
CN111471713A (zh) * 2020-04-23 2020-07-31 北京大学 基于可控相分离液滴控制细胞内mRNA定位和翻译过程的方法
US20230236190A1 (en) * 2020-06-18 2023-07-27 Whitehead Institute For Biomedical Research Viral condensates and methods of use thereof
WO2022115539A2 (en) * 2020-11-25 2022-06-02 Whitehead Institute For Biomedical Research Modulating transcriptional condensates
WO2022171163A1 (en) * 2021-02-10 2022-08-18 Etern Biopharma (Shanghai) Co., Ltd. Methods of modulating androgen receptor condensates
WO2022187202A1 (en) * 2021-03-02 2022-09-09 Dewpoint Therapeutics, Inc. New condensate paradigms
AU2022229784A1 (en) * 2021-03-02 2023-09-14 Dewpoint Therapeutics, Inc. Methods of identifying a condensate phenotype and uses thereof
WO2022212872A1 (en) * 2021-04-02 2022-10-06 Case Western Reserve University Methods and compositions for accelerating oligodendrocyte maturation
WO2023014989A1 (en) * 2021-08-05 2023-02-09 Whitehead Institute For Biomedical Research Methods and agents for decreasing insulin resistance
WO2024001989A1 (en) * 2022-06-27 2024-01-04 Etern Biopharma (Shanghai) Co., Ltd. Compositions and methods for modulating molecules

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002038734A2 (en) * 2000-11-13 2002-05-16 Cistem Molecular Corporation Methods for determining the biological effects of compounds on gene expression
WO2006063356A1 (en) * 2004-12-10 2006-06-15 Isis Phamaceuticals, Inc. Regulation of epigenetic control of gene expression
WO2016054106A1 (en) * 2014-09-29 2016-04-07 The Regents Of The University Of California SCAFFOLD RNAs
CA3028446A1 (en) * 2016-07-01 2018-01-04 Arrakis Therapeutics, Inc. Compounds and methods for modulating rna function

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254499A (zh) * 2021-05-21 2021-08-13 国家卫星气象中心(国家空间天气监测预警中心) 基于长序列历史资料再定标的气候数据集生产方法
CN113254499B (zh) * 2021-05-21 2023-09-29 国家卫星气象中心(国家空间天气监测预警中心) 基于长序列历史资料再定标的气候数据集生产方法

Also Published As

Publication number Publication date
EP3768329A2 (en) 2021-01-27
KR20210070233A (ko) 2021-06-14
WO2019183552A3 (en) 2019-10-31
IL277533A (en) 2020-11-30
EP3768329A4 (en) 2022-01-05
US20220120736A1 (en) 2022-04-21
TW202003051A (zh) 2020-01-16
WO2019183552A2 (en) 2019-09-26
CA3094974A1 (en) 2019-09-26
JP2021535737A (ja) 2021-12-23
SG11202009359WA (en) 2020-10-29
JP2024029228A (ja) 2024-03-05
AU2019239084A1 (en) 2020-11-05

Similar Documents

Publication Publication Date Title
US20220120736A1 (en) Methods and assays for modulating gene transcription by modulating condensates
Chujo et al. Unusual semi‐extractability as a hallmark of nuclear body‐associated architectural noncoding RNA s
Choi et al. Massively parallel reporter assays of melanoma risk variants identify MX2 as a gene promoting melanoma
Yi et al. A PRC2-independent function for EZH2 in regulating rRNA 2′-O methylation and IRES-dependent translation
Millan-Arino et al. Mapping of six somatic linker histone H1 variants in human breast cancer cells uncovers specific features of H1. 2
Bouveret et al. NKX2-5 mutations causative for congenital heart disease retain functionality and are directed to hundreds of targets
Mo et al. Human RecQL4 helicase plays multifaceted roles in the genomic stability of normal and cancer cells
Galvan et al. The striatal kinase DCLK3 produces neuroprotection against mutant huntingtin
Cha et al. Inner nuclear protein Matrin-3 coordinates cell differentiation by stabilizing chromatin architecture
JP2022532661A (ja) 薬剤-凝縮物相互作用を特徴付け及び利用する方法
Maldotti et al. The acetyltransferase p300 is recruited in trans to multiple enhancer sites by lncSmad7
Yoshikawa et al. ROCK inhibition enhances microRNA function by promoting deadenylation of targeted mRNAs via increasing PAIP2 expression
Hu et al. High-content image-based CRISPR screening reveals regulators of 3D genome architectures.
Cui et al. Cooperation between IRTKS and deubiquitinase OTUD4 enhances the SETDB1-mediated H3K9 trimethylation that promotes tumor metastasis via suppressing E-cadherin expression
Roth et al. Systematic analysis of alternative exon-dependent interactome remodeling reveals multitasking functions of gene regulatory factors
Biancon et al. Multi-omics profiling of U2AF1 mutants dissects pathogenic mechanisms affecting RNA granules in myeloid malignancies
Campbell et al. The myopathic transcription factor DUX4 induces the production of truncated RNA-binding proteins in human muscle cells
Kong et al. The cohesin loader NIPBL interacts with pre-ribosomal RNA and treacle to regulate ribosomal RNA synthesis
Wu RNA and Cancer
Ozenberger Mouse Modeling and Epigenomic Profiling of Clear Cell Sarcoma
Chan et al. Transcriptional elongation machinery controls vulnerability of breast cancer cells to PRC2 inhibitors
Skowronek Dissecting the differences between NSD1 and NSD2 function in Head and Neck Squamous Cell Carcinoma
Agupitan Exploring the effects of symmetric arginine methylation readers on E2F1-dependent transcriptional output in vitro
Carcamo Dissecting SWI/SNF Subcomplex Chromatin Dynamics in ARID2 Deficient Melanoma
Williamson Defining transcription factor-chromatin remodeler interactions and their impact on DNA accessibility and gene expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination