CN114867854A - 肽 - Google Patents

Download PDF

Info

Publication number
CN114867854A
CN114867854A CN202080088650.XA CN202080088650A CN114867854A CN 114867854 A CN114867854 A CN 114867854A CN 202080088650 A CN202080088650 A CN 202080088650A CN 114867854 A CN114867854 A CN 114867854A
Authority
CN
China
Prior art keywords
intein
leu
construct
glu
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080088650.XA
Other languages
English (en)
Inventor
阿里·塔瓦索利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Southampton
Original Assignee
University of Southampton
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Southampton filed Critical University of Southampton
Publication of CN114867854A publication Critical patent/CN114867854A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/64Cyclic peptides containing only normal peptide links
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了一种在哺乳动物细胞内产生环肽的无毒方法,包括以下步骤:a)将载体引入所述哺乳动物细胞中,其中所述载体包含构建体,所述构建体编码C端内含肽结构域、待环化的多肽序列、N端内含肽结构域以及降解标签,其中所述降解标签附接于至少一个内含肽结构域,以及b)表达所述构建体,以产生包含活性内含肽和所述多肽序列的中间体,其中所述活性内含肽一形成就经历剪接并使所述多肽环化,并且其中所述降解标签使所述活性内含肽降解。本发明还提供了一种根据所述方法产生的环肽文库,以及将上述方法的无毒环肽产生构建体并入基因构建体、载体或哺乳动物细胞中。

Description

技术领域
本发明涉及通过改良肽和蛋白质的分裂内含肽(split-intein)环状连接(SICLOPPS)方法来无毒性地产生环肽,以提高在哺乳动物细胞内的效率。
背景技术
在药物发现的早期阶段使用环肽在药物研发中已变得越来越普遍。这些长度范围为仅两个联结氨基酸到包含数百个此类残基的肽的多肽特别适用于鉴定蛋白质-蛋白质相互作用抑制剂,并进一步用作药物样小分子设计的关键起点。
肽具有作为以其他方式“无成药性的”靶标的配体的特殊效用。此类无成药性的靶标可以是细胞内分子、特定的蛋白质-蛋白质相互作用,并且通常不适用于小分子和生物制剂。肽的进一步环化或闭环延长了此类分子在体内的寿命,并随后显著改善了它们的药代动力学。虽然在自然界中发现的可用环肽的范围略微有限,但是像这样在实验室中产生合成多肽为发现候选药物开辟了一条有潜力的途径。
因此,大规模合成环肽文库的生成已成为现代药物发现的基石,具有重大的经济和商业意义。通过对可与每种肽结合的DNA或mRNA标签进行测序,此类基因编码文库允许对与靶蛋白结合的命中物进行高通量筛选和快速去卷积。
一种越来越多地使用的细胞内环肽文库生成方法被称为肽和蛋白质的分裂内含肽环状连接(SICLOPPS)。这种易于获取的方法可以以显著的速度和简单性生成超过1亿个成员的文库,其中其细胞内性质允许在体内进行综合功能测定。
该方法利用内含肽剪接来使各感兴趣的肽,或“外显肽”环化。内含肽是独特的自动加工蛋白结构域,它可以通过两个肽键的切割而从较大的前体多肽经历自我切除事件,同时将侧接外显肽序列的N端和C端利用新的肽键连接。更具体地,“分裂内含肽”具有源自两种基因的其多肽序列,并且可以导致外显肽侧接两个单独的N-内含肽和C-内含肽结构域。在翻译后,这两个结构域以非共价方式重新组装成典型的活性内含肽以进行蛋白质剪接。
SICLOPPS构建体编码C端内含肽结构域,接着是待环化的外显肽多肽序列,以及N端内含肽结构域。在转录和翻译后,侧翼区域缔合得到活性内含肽,所述内含肽由于剪接而自我切除并使C端与N端内含肽结构域之间的其余多肽序列环化。可以将不同长度和氨基酸组成的肽并入SICLOPPS方法中,前提是靶肽的第一个氨基酸是亲核性半胱氨酸、丝氨酸或苏氨酸。
该技术提供了一种用于生成环肽文库的简单方法,其仅需要SICLOPPS质粒、简并寡核苷酸,以及少量简单直接的分子生物学步骤。简并寡核苷酸将被设计成确定环肽的环大小、随机化氨基酸的数量以及待并入的任一组氨基酸。包含感兴趣的独特外显肽序列的每个寡核苷酸通过PCR消化和连接技术整合到SICLOPPS质粒中,以创建文库。然后可以将质粒文库转化到包含例如表型测定的细胞中,然后进行筛选。通过从表现出期望表型的细胞中分离SICLOPPS质粒,然后进行DNA测序来揭示活性环肽的身份(Tavassoli 2017,CurrOpin Chem Biol 38:30-35)。
SICLOPPS的出现带来了在多种生物体中将环肽文库与测定相配合的好处:所述生物体的范围为大肠杆菌、酵母和哺乳动物细胞。可以针对多种靶标进行细胞内功能测定,因此不仅可以评估文库中每个成员的亲和力,而且还可以评估其针对给定靶标的功能。SICLOPPS文库是DNA编码的,这使得可以对文库的构成进行大量控制,并允许轻松产生多种文库并针对此类靶标进行筛选。SICLOPPS文库中易于实施的变化的实例包括:不同环大小的环肽、具有不同氨基酸组成的文库,或在文库每个成员中的设定位置处包括给定的氨基酸或基序。因此,用户通过编码所述文库的简并寡核苷酸而对其环肽文库的构成具有绝对控制。
SICLOPPS最初使用来自集胞藻属物种(Synechocystis sp.)PCC6803的DnaE分裂内含肽,称为“Ssp”内含肽。Ssp内含肽具有相对慢的剪接速率并且对剪接衔接点附近的氨基酸变化具有显著敏感性,这意味着很大一部分环肽文库实际上可能并不是环肽,而是作为部分剪接的内含肽存在。然而,通过更快的剪接和从点形念珠藻(Nostoc punctiforme)工程改造得到的更混杂的“Npu”内含肽的改编克服了该技术的此类局限。
然而,尽管使用替代内含肽类型取得了明显进展,但内含肽本身的使用仍然存在细胞中的技术效率水平低下的问题。Townend和Tavassoli(2016)研究了SICLOPPS生成的环肽文库在大肠杆菌中对细胞活力的影响(Townend&Tavassoli 2016,ACS Chem Biol 11(6):1624-1630)。数据表明,尽管它们的剪接速度快并且对外显肽序列的变异具有耐受性,但发现约42%的Npu SICLOPPS文库对其大肠杆菌宿主具有细胞毒性,从而显著降低了它们的效用。由于该研究使用了三种不同的大肠杆菌菌株(DH5α、BW27786和BL21),因此认为此类所观察到的效果不太可能是菌株特异性的。该测定进一步使用不太有利的Ssp内含肽进行,结果表明大约14%的文库成员也影响宿主活力。虽然一部分由文库编码的环肽可能对大肠杆菌具有固有毒性,例如通过干扰关键蛋白或途径,但两组内含肽在实验中编码相同的文库。因此,使用Npu内含肽观察到的更高水平的毒性只能归因于Npu内含肽本身。
在2016年的一项研究中,科学家将SsrA标签(AANDENYALAA;SEQ ID NO:11)工程改造到感兴趣的蛋白质的C端,以便靶向经剪接的内含肽以进行细胞内降解(Townend和Tavassoli 2016,ACS Chem Biol 11(6):1624-1630)。SsrA序列的添加被显示为将带标签蛋白引导至大肠杆菌天然的ClpXP机器进行降解,从而将带标签蛋白的半衰期减少至大约5分钟。
虽然已经对降低Npu SICLOPPS内含肽在大肠杆菌中的细胞毒性进行了研究,但不存在适用于细胞功能与原核细胞不同的哺乳动物细胞的这种所描述的替代方法。随着对在哺乳动物细胞中进行环肽的功能测定以用于药物发现的需求不断增加,对SICLOPPS进行改良以提高效率将有助于阐明针对哺乳动物特异性靶标的化合物。
因此,需要以更有效的方式在哺乳动物细胞中产生环肽的改良的SICLOPPS方法。
Kinsella等人2002JBC 277:37512-37518描述了使用Ssp SICLOPPS内含肽在哺乳动物细胞中产生具有最多至160,000个成员的环肽文库,而没有提及或研究与内含肽相关的毒性。
发明内容
Kinsella等人没有研究内含肽在哺乳动物细胞中的毒性。发明人惊讶地发现哺乳动物细胞也易受由活性内含肽造成的毒性的影响。在此之前,没有认识到哺乳动物细胞中内含肽相关毒性的问题。发明人设计了一种适用于哺乳动物细胞的降解标签系统,其消除了内含肽相关毒性,从而允许分裂内含肽系统广泛地用于哺乳动物细胞以产生环肽。
本发明基于一个令人惊讶的发现,即可以改变基于哺乳动物细胞的SICLOPPS方法以包括内含肽附接的降解标签,以便使任何所得内含肽诱导的细胞毒性最小化。降解标签与N端或C端内含肽结构域的附接将允许典型的活性内含肽在剪接和感兴趣的外显肽环化后被引导通过哺乳动物细胞的降解途径进行降解。因此,该方法防止在哺乳动物细胞内产生环肽期间形成细胞毒性内含肽的有害积聚。因此,此类带降解标签的内含肽可以用于改良的SICLOPPS方法,以在哺乳动物细胞内更高效地产生环肽文库。重要的是,内含肽能够在降解之前剪接。
因此,在本发明的第一方面,提供了一种用于在哺乳动物细胞中无毒性地产生环肽的方法,包括:a)将载体引入哺乳动物细胞中,其中载体包含构建体,所述构建体编码C端内含肽结构域、待环化的多肽序列、N端内含肽结构域和降解标签,其中降解标签附接于至少一个内含肽结构域;以及b)表达构建体,以产生包含活性内含肽和多肽序列的中间体,其中活性内含肽一形成就经历剪接并使多肽环化,并且其中降解标签使活性内含肽降解。
本发明还提供了一种哺乳动物细胞,其通过本发明的第一方面的方法产生。例如,本发明提供了一种表达环肽的细胞,其中哺乳动物细胞通过包括以下的方法产生:
a)将载体引入哺乳动物细胞中,其中载体包含构建体,所述构建体编码分裂内含肽的C端内含肽结构域和N端内含肽结构域;待环化的多肽序列;以及降解标签,其中降解标签附接于至少一个内含肽结构域;
b)表达构建体,以产生包含活性内含肽和多肽序列的中间体,由此活性内含肽经历剪接并使多肽环化,并且其中降解标签使活性内含肽降解。
本发明还提供了一种根据本发明的第一方面产生的哺乳动物细胞的文库,即所述文库包括多个哺乳动物细胞,所述细胞各自包含编码不同环肽的不同核酸,其中核酸是如本文所述的本发明的核酸。在一些实施方案中,通过根据本发明的第一方面的方法产生的哺乳动物细胞的文库在环肽水平上包括至少128,000个成员,任选地例如在环肽水平上包括至少150,000个或至少200,000个成员。如本领域技术人员将理解的,可以产生包含数百万种不同基因构建体的文库,但如果基因编码的蛋白质或肽(在此情况下为环肽)对细胞有毒,那么那些细胞将丧失,从而在蛋白质水平上减少文库中的成员数量。例如,如果在基因水平上产生200万个成员的文库,但活性内含肽是有毒的,则将获得仅例如100万个表达环肽的成员。由于本发明解决了与内含肽相关的毒性,因此可以产生大得多的环肽文库,或大得多的根据本发明的第一方面的方法产生的哺乳动物细胞的文库。
在一些实施方案中,通过根据本发明的第一方面的方法产生的哺乳动物细胞的文库在蛋白质水平上包括至少128,000个成员,例如至少130,000、150,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、100万、150万、200万、250万、300万、320万、350万或至少400万个成员。
所谓的在蛋白质水平上,我们包括所表达的环化肽水平的水平的含义。
应清楚的是,虽然如本领域所报道的使用分裂内含肽在哺乳动物细胞中产生环肽将得到包含可能有毒的活性内含肽的哺乳动物细胞,但本发明的细胞由于降解标签的使用而不包含活性内含肽,或基本上不包含活性内含肽,例如不包含或基本上不包含有毒的活性内含肽。
本发明还提供了一种由本发明的哺乳动物细胞制备的细胞裂解物。
在本发明的第二方面,提供了一种通过根据本发明的第一方面的方法产生的环肽文库。
在本发明的第三方面,提供了一种基因构建体,其包含编码C端内含肽结构域、待环化的多肽序列、N端内含肽结构域和适用于哺乳动物细胞的降解标签的多核苷酸盒,其中降解标签附接于至少一个内含肽结构域,并且其中一旦表达,就形成活性内含肽。
在本发明的第四方面,提供了一种载体,其包含根据本发明的第三方面的基因构建体。
在本发明的第五方面,提供了一种哺乳动物细胞,其包含根据本发明的第四方面的载体或根据本发明的第三方面的基因构建体。本发明还提供了一种哺乳动物细胞的文库,其包括根据本发明的第四方面的载体或根据本发明的第三方面的基因构建体。在一些实施方案中,哺乳动物细胞的文库包括至少200,000个成员,例如至少300,000、400,000、500,000、600,000、700,000、800,000、900,000、100万、150万、200万、250万、300万、320万、350万或至少400万个成员。
在本发明的第六方面,提供了一种根据本发明的第一方面的方法产生环状文库的方法。
附图说明
本发明参照以下附图进行说明,其中:
图1示出SICLOPPS机制的启动,其中位于感兴趣的外显肽的肽序列侧翼的N端和C端内含肽结构域非共价缔合,形成典型的活性内含肽(由Townend和Tavassoli 2016,ACSChem Biol 11(6):1624-1630改编)。
图2示出活性内含肽形成后的SICLOPPS机制。在涉及硫酯中间体和套索中间体的三步过程中,活性内含肽剪接以使靶肽外显肽环化。
图3示出可以如何由SICLOPPS质粒文库生成环肽文库。将含有适当复制起点、选择性标志物和启动子以及感兴趣的SICLOPPS构建体的质粒转染到哺乳动物细胞中。在转录和翻译之后,所表达的内含肽,在此情况下为DnaE内含肽,使每个感兴趣的肽环化以产生此类分子的细胞内文库。
图4示出用于eGFP/YFP肽的SICLOPPS构建体,其被设计成在N-内含肽中添加降解标签。附接的降解标签是缺氧诱导因子-1α(HIF-1α)亚基的氧依赖性降解(ODD)结构域。该构建体的进一步添加包括亲和标签、mCherry的荧光标签以及用于抗体识别的FLAG标签。
图5示出根据图4的SICLOPPS质粒的荧光显微镜图像,所述质粒已被转染到HeLa细胞中,随后将所述细胞置于氧的存在下,进行或不进行100μM去铁胺(DFX)处理。内含肽应仅在存在氧且不存在DFX的情况下降解。结果示出,与显示mCherry荧光的DFX实验相比,与mCherry荧光相关的内含肽在常氧中降解。用GFP标记的外显肽在这两种条件下均保持存在。
图6示出进一步在降解标签中含有P564G突变的根据图4的SICLOPPS质粒的荧光显微镜图像,所述质粒已被转染到HeLa细胞中,随后将所述细胞置于氧的存在下,进行或不进行100μM去铁胺(DFX)处理。在此突变构建体中,无论条件如何,内含肽都应永不降解,正如结果中所观察到的那样。
图7示出野生型(WT)和如上所述的P564G突变体SICLOPPS质粒的蛋白质印迹分析,所述质粒已被转染到HeLa细胞中并在常氧、缺氧或DFX处理的条件下孵育。缺氧和DFX条件显示,野生型质粒没有内含肽降解,而内含肽在正常氧条件下降解。
图8示出在常氧或缺氧条件下,如上所述用WT和P564G突变体SICLOPPS质粒转染的HeLa细胞经48小时的细胞计数。趋势显示,在缺氧条件下,内含肽没有被降解,随着时间的推移,WT和P564G SICLOPPS质粒均因细胞毒性而发生细胞数量的减少。然而,在正常条件下,相对于由于细胞毒性而数量减少的含脯氨酸突变内含肽的细胞,WT转染细胞的细胞数量由于内含肽的降解而随时间保持不变。
图9示出用编码GFP-Npu-ODDD-mCherry的质粒转染的Trex293细胞。剪接(WT)或非剪接(C1A)。门代表Q1:mCherry+GFP-,Q2:mCherry+GFP+,Q3:mCherry-GFP+,Q4:mCherry-GFP-。A)不具有DFX的GFP-WT。Q1:2.53%,Q2:47.5%,Q3:32.1%,Q4:17.8%。B)具有DFX的GFP-WT,Q1:3.24%,Q2:69.3%,Q3:10.8%,Q4:16.6%。C)具有DFX的GFP-C1A,Q1:40.4%,Q2:37.5%,Q3:0.65%,Q4:21.4%。D)具有DFX的GFP-C1A,Q1:25.0%,Q2:54.3%,Q3:0.18%,Q4:20.5%。E)来自A(深灰色;-DFX)和B(浅灰色;+DFX)的mCherry+细胞的叠加:添加DFX防止mCherry(即内含肽)降解。mCherry-A中值的值,A:265个单位,B:618个单位。
图10整合了编码剪接(WT)的GFP-Npu-ODDD-mCherry的质粒的Trex293细胞,门控代表Q1:mCherry+GFP-、Q2:mCherry+GFP+,Q3:mCherry-GFP+,Q4:mCherry-GFP-。A)不具有DFX的GFP-WT。Q1:0.035%,Q2:0.84%,Q3:67.4%,Q4:31.7%。B)具有DFX的GFP-WT,Q1:0.17%,Q2:35.1%,Q3:29.4%,Q4:35.4%。
图11在孵育24h后评估不具有DFX(-dfx)的细胞和具有DFX(+dfx)的细胞的活力。值一式三份(+/-SD)。将每个细胞系的活力针对它们的-dfx对照归一化。
图12实施例5和6中使用的GFP-Npu-mCherry-ODDD的质粒图谱。
序列表的描述
SEQ ID NO:1是从集胞藻属物种菌株PCC6803中分离的Ssp DnaE分裂内含肽的C端内含肽结构域的氨基酸序列。
SEQ ID NO:2是从集胞藻属物种菌株PCC6803中分离的Ssp DnaE分裂内含肽的相应N端内含肽结构域的氨基酸序列。
SEQ ID NO:3是从念珠藻属物种(Nostoc sp.)菌株PCC73102中分离的Npu DnaE分裂内含肽的C端内含肽结构域的氨基酸序列。
SEQ ID NO:4是从念珠藻属物种菌株PCC73102中分离的Npu DnaE分裂内含肽的相应N端内含肽结构域的氨基酸序列。
SEQ ID NO:5是经工程改造以增强稳定性和活性的人工Cfa DnaE分裂内含肽的C端内含肽结构域的氨基酸序列。
SEQ ID NO:6是经工程改造以增强稳定性和活性的人工Cfa DnaE分裂内含肽的相应N端内含肽结构域的氨基酸序列。
SEQ ID NO:7是经工程改造以具有非常快的剪接活性的“超快(ultrafast)”gp41-1 DnaE分裂内含肽的C端内含肽结构域的氨基酸序列。
SEQ ID NO:8是经工程改造以具有非常快的剪接活性的“超快”gp41-1 DnaE分裂内含肽的相应N端内含肽结构域的氨基酸序列。
SEQ ID NO:9是智人(Homo sapiens)缺氧诱导因子-1α(HIF-1α)亚基的氨基酸序列,其包含可用作降解标签的氧依赖性降解(ODD)结构域。
SEQ ID NO:10是智人缺氧诱导因子-1α(HIF-1α)亚基的氧依赖性降解(ODD)结构域的氨基酸序列,其可用作降解标签。
具体实施方式
本发明是基于以下惊人发现:向基于SICLOPPS的方法中添加降解标签允许在哺乳动物细胞内产生环肽,而不产生细胞毒性内含肽副产物的积聚。因此,可以在哺乳动物细胞中产生环肽,而不存在通常与这种方法相关的低效率水平。
如本文所用,术语“环肽”是指已“环化”的多肽或蛋白质,在所述多肽或蛋白质中,其构成原子形成环。例如,当线性肽的游离氨基(N)端与其游离羧基(C)端共价键合,即以头对尾的形式,使得没有游离的C端或N端保留在肽中时,所述线性肽被环化。如本文所提及,术语“肽”和“多肽”可以互换使用。
本发明提供了一种通过并入降解标签的使用的改变的SICLOPPS方法在哺乳动物细胞内产生环肽的方法。
术语“哺乳动物细胞”是指具有结构上限定的细胞内组织的真核细胞,与细菌和古细菌相反。哺乳动物细胞常用于细胞培养,例如使用中国仓鼠卵巢(CHO)细胞,这是用于大批量生产治疗性蛋白的最常见的哺乳动物细胞系(Wurm 2004,Nat Biotech 22(11):1393-1398)。
SICLOPPS或“肽和蛋白质的分裂内含肽环状连接”利用内含肽剪接来生成环肽。
如本文所用,词语“内含肽”是指嵌入前体蛋白中的天然存在的或人工构建的多肽序列,其可以在蛋白质的翻译后加工过程中催化剪接反应。内含肽可以在名为“剪接”的过程中从前体蛋白中切除自身并将其余部分用肽键连结起来。“分裂内含肽”是一种内含肽,其具有由两种单独基因编码的两个或更多个彼此不融合的单独组分。在一些情况下,分裂内含肽组分将位于其中被称为“外显肽”的多肽序列的侧翼。当位于外显肽的侧翼时,分裂内含肽组分相对于外显肽的N端和C端被称为N端和C端内含肽结构域。
在本发明的所有方面的一些实施方案中,内含肽是对哺乳动物细胞有毒的内含肽。所谓的有毒,我们包括内含肽对哺乳动物细胞的生长速率产生负面影响,或导致细胞凋亡或坏死的含义。
哺乳动物细胞可以是希望在其中表达环肽的任何哺乳动物细胞。
目前已认识到超过350种内含肽,每种内含肽或所述内含肽可以具有不同的催化剪接反应的速率。内含肽的命名是基于在其中发现所述内含肽的生物体的学名。例如,Ssp内含肽首次是从集胞藻属物种中分离出来的,而剪接更快的Npu内含肽首次是从点形念珠藻中分离出来的。包含一些已知内含肽的列表的数据库可以在http://www.biocenter.helsinki.fi/bi/iwai/InBase/tools.neb.com/inbase/list.html找到。
本发明中使用的内含肽可以是剪接将快于通过附接的降解标签实现的其降解时间的任何内含肽。技术人员可以选择适当的内含肽以与相应的降解标签一起使用。
在一个实施方案中,内含肽可以是Cfa内含肽。在一个优选实施方案中,内含肽可以是分裂的Cfa内含肽,其包含C端和N端内含肽结构域的相应的SEQ ID NO:5和SEQ ID NO:6的氨基酸序列。
在另一个优选实施方案中,内含肽可以是Ssp内含肽。在另一个优选实施方案中,内含肽可以是分裂的Ssp内含肽,其包含C端和N端内含肽结构域的相应的SEQ ID NO:1和SEQ ID NO:2的氨基酸序列。
在另一个优选实施方案中,内含肽可以是gp41-1内含肽。在另一个优选实施方案中,内含肽可以是分裂的gp41-1内含肽,其包含C端和N端内含肽结构域的相应的SEQ IDNO:7和SEQ ID NO:8的氨基酸序列。
在另一个优选实施方案中,内含肽可以是Npu内含肽。在最优选的实施方案中,内含肽可以是分裂的Npu内含肽,其包含C端和N端内含肽结构域的相应的SEQ ID NO:3和SEQID NO:4的氨基酸序列。
SICLOPPS的过程是本领域已知的,如Tavassoli 2017,Curr Opin Chem Biol 38:30-35所提及。SICLOPPS方法利用了包含C端内含肽结构域,接着是待环化的外显肽多肽序列,以及N端内含肽结构域的构建体。所述构建体这样排列,使得在mRNA序列的翻译之后,位于居间外显肽侧翼的N端和C端内含肽结构域能够非共价缔合,形成功能性的活性内含肽(图1),所述内含肽随后催化剪接反应,产生环状多肽。
如图2所示,具有其典型的活性内含肽的折叠的SICLOPPS构建体或“融合蛋白”将在N端内含肽结构域和外显肽衔接点处催化N到S酰基转移,以产生硫酯中间体。硫酯中间体将在相反的C端内含肽结构域和外显肽衔接点处与侧链亲核试剂发生酯交换,以形成套索中间体。最后,天冬酰胺侧链环化和随后的X-N酰基转移将环肽从内含肽中释放出来(Scott等人,1999,PNAS 96(24):13638-13643)。这种方法因此导致产生环肽和包含现在不需要的内含肽多肽的副产物。
因此,在本发明的一些实施方案中,存在一种改变的SICLOPPS方法,其使用包含Npu分裂内含肽的多肽构建体,所述构建体可包含以下序列:
HHHHHHMIKIATRKYLGKQNVYDIGVERYHNFALKNGFIASN
X~~~~~CLSYDTEILTVEYGILPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR
GEQEVFEYCLEDGCLIRATKDHKFMTVDGQMMPIDEIFERELDLMRVDNLPN
(SEQ ID NO:12;其中“~”表示为另外的X)。
其中X~~~~~是待产生的外显肽和环肽;X是C、S或T,并且“~”表示环肽序列的氨基酸。对于剪接的功能,必要的是第一个位置可被不变的半胱氨酸、丝氨酸或苏氨酸残基占据。对于本领域技术人员将显而易见的是,可在上述序列中的“X”之后插入任何序列。该序列的长度可为一个或多个氨基酸。
在一个优选实施方案中,该序列的长度可为三个或更多个氨基酸。在最优选的实施方案中,该序列的长度可为至少六个氨基酸。
上述序列包含以下成分:
1.
HHHHHH(SEQ ID NO:13)
用以帮助纯化的任选的六组氨酸(6xHis)标签,或任何其他这样的亲和标签可包括在构建体内。因此,在一个实施方案中,基础SICLOPPS构建体将进一步包括亲和标签。在一个优选实施方案中,构建体将包括6xHis标签。在另一个优选实施方案中,构建体将包括2xStrep标签。
2.
MIKIATRKYLGKQNVYDIGVERYHNFALKNGFIASN(SEQ ID NO:14)
包含C端内含肽结构域。
3.
X~~~~~
包含待环化的多肽外显肽序列。
4.
CLSYDTEILTVEYGILPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEV
FEYCLEDGCLIRATKDHKFMTVDGQMMPIDEIFERELDLMRVDNLPN(SEQ ID NO:15)
包含N端内含肽结构域。
在一些实施方案中,可以进一步修饰SICLOPPS构建体以包括用于抗体识别的标签。在一个优选实施方案中,用于抗体识别的标签可以是FLAG标签。
本发明提供了一种改变的SICLOPPS方法,其中如上文所例示的SICLOPPS构建体通过添加降解标签进行修饰,所述标签适用于哺乳动物细胞,附接于N端或C端内含肽结构域中的任一个。
术语“降解标签”旨在涵盖标记蛋白质以供细胞的降解机器降解的肽序列。在哺乳动物细胞中,选择性蛋白降解的主要途径是泛素-蛋白酶体途径。泛素依赖性蛋白降解在许多生物学过程中具有天然作用,包括信号转导、细胞周期进程和转录调控(Groulx&Lee2002,Mol Cell Biol 22(15):5319-5336)。泛素是一种小的调控蛋白,其可以在被称为泛素化的过程中添加到底物蛋白中。泛素的缀合是ATP依赖性过程,涉及三种酶:E1和E2蛋白为缀合准备泛素;E3泛素连接酶识别特定的蛋白质底物以催化转移激活的泛素分子。一旦用单个泛素分子给蛋白质加上标签,就向其他E3泛素连接酶发出信号以附接更多的泛素分子,从而形成与底物蛋白附接的聚泛素链。
带有标签以用于泛素化的蛋白质随后靶向细胞蛋白酶体复合物,其中泛素链被蛋白酶体识别,并且结合的蛋白质被降解成长七至八个氨基酸的肽。因此,降解标签可以通过将带标签蛋白与E3泛素连接酶接合,从而导致聚泛素链的添加并且随后被蛋白酶体降解而发挥作用。
在本发明的一个实施方案中,提供了一种改变的SICLOPPS方法,其使用如上所述的构建体,所述构建体可包含与N端或C端内含肽结构域中的任一个附接的降解标签。
在一个优选实施方案中,附接的降解标签可至少部分地通过泛素化实现降解。
在另一个优选实施方案中,附接的降解标签可以是缺氧诱导因子-1α(HIF-1α)亚基。在另一个优选实施方案中,附接的降解标签可包括接合泛素连接酶复合物的HIF-1α的氧依赖性降解结构域。在最优选的实施方案中,附接的降解标签可包含根据SEQ ID NO:10的氨基酸序列。
在另一个实施方案中,附接的降解标签可以是接合E3泛素连接酶以进行蛋白质降解的标签或蛋白水解靶向嵌合体。
缺氧诱导因子(HIF)是异二聚体转录因子,其包含组成型表达的HIF-1β亚基和受氧调控的HIF-1α亚基。HIF-1α包含氧依赖性降解(ODD)结构域,所述结构域包含在常氧中被羟基化以靶向HIF-1α亚基,以通过接合泛素连接酶复合物来进行蛋白酶体降解的关键脯氨酸残基P564。泛素连接酶复合物包含负责识别HIF-1α的ODD结构域的羟基化的P564残基的von Hippel-Lindau肿瘤抑制蛋白(von Hippel-Lindau tumour suppressor protein,VHL)。
因此,将来自HIF-1α的ODD结构域的包含P564的序列作为降解标签添加到SICLOPPS构建体多肽中诱导附接蛋白的降解。在本发明中,在SICLOPPS构建体表达时,活性内含肽在其自我切除和剪接以及感兴趣的外显肽的环化后,从其N端或C端结构域附接至ODD结构域的包含P564的多肽。羟基化的P564残基连同附接的细胞毒性活性内含肽一起被来自泛素连接酶复合物的VHL识别,被泛素化并被蛋白酶体降解。
因此,在一些实施方案中,用于在改变的SICLOPPS方法中使用的如上所述的多肽构建体还可包含HIF-1α的全长ODD结构域的氨基酸548-603,其包含用于羟基化的关键P564,附接至N端内含肽结构域,所述构建体由以下序列组成:
HHHHHHMIKIATRKYLGKQNVYDIGVERYHNFALKNGFIASN
X~~~~~CLSYDTEILTVEYGILPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGCLIRATKDHKFMTVDGQMMPIDEIFERELDLMRVDNLPNNPFSTQDTDLDLEMLAPYIPMDDDFQLRSFDQLSPLESSSAS PESASPQSTVTVFQ(SEQ ID NO:16)
其中:
NPFSTQDTDLDLEMLAPYIPMDDDFQLRSFDQLSPLESSSASPESASPQSTVTVFQ(SEQ ID NO:17)
包含HIF-1α的全长ODD结构域的氨基酸548-603。
蛋白水解靶向嵌合体(PROTAC)可以类似地用作降解标签。PROTAC是包含两个共价连接的蛋白质结合结构域的小分子。一个结构域能够接合E3泛素连接酶,而另一个结构域则与意图降解的靶蛋白结合。因此,将PROTAC作为N端或C端的降解标签并入导致,在SICLOPPS构建体表达时,E3泛素连接酶募集至经切除的活性内含肽,从而导致其泛素化和蛋白酶体降解。
据设想,活性内含肽的降解将使得能够在哺乳动物细胞内产生环肽,而不增加被显示为与活性内含肽相关的细胞毒性。
如本文所用,术语“细胞毒性”是指化合物对细胞的毒性性质,这可能导致此类细胞发生坏死,其中它们由于由细胞膜完整性丧失造成的细胞裂解或由于细胞凋亡而迅速死亡,其中细胞经历程序化细胞死亡。例如,如熟练读者将理解的,细胞毒性作用将对出于产生环肽的目的利用哺乳动物细胞的效率水平产生影响。
降解标签可诱导其所附接的蛋白质或多肽的降解,无论附接是在序列中直接附接还是通过接头附接。此类接头或间隔子是在2个与31个氨基酸之间变化的短氨基酸序列,被实现用于分隔单个蛋白质的多个结构域。
在本发明的一个实施方案中,提供了一种使用如上所述的构建体的改变的SICLOPPS方法,其中降解标签通过直接连接或通过接头附接于N端或C端内含肽结构域。在一个优选实施方案中,降解标签通过直接连接附接。
据设想,相对于所用内含肽的类型,将把相容的降解标签并入SICLOPPS构建体中。对于熟练读者将显而易见的是,活性内含肽在通过所包括的降解标签降解之前需要剪接,或者换句话说,降解标签需要比内含肽剪接更慢地诱导降解。
出于实验可视化的目的,在肽编码构建体中任选地包括荧光标签是本领域的常见做法。据设想,此类荧光标签可附接到SICLOPPS构建体内的降解标签上;因此,可以使用荧光显微镜法或本领域已知的其他此类技术来使所得的所表达的带标签蛋白的任何降解可视化。存在广泛多种适用于显微镜法的荧光标签或荧光团。荧光团的综合列表可在https://www.biosyn.com获得。
在本发明的一些实施方案中,提供了一种改变的SICLOPPS方法,其使用如上所述并添加有任何荧光标签的构建体。在另一个实施方案中,荧光标签附接于并入SICLOPPS构建体内的降解标签。在一个优选实施方案中,荧光标签是DsRed荧光团。
在本发明的方法中设想,将把经修饰的SICLOPPS构建体引入哺乳动物细胞中的任何合适的表达载体内,所述表达载体可以促进多核苷酸的表达。
如本文所用,短语“表达载体”是指促进核酸分子在合适的体外或体内系统中的转录和/或翻译的媒介物。当向含有表达载体的宿主系统中添加外源物质导致载体被表达,例如导致载体内的核酸分子被转录成mRNA时,表达载体是“诱导型的”。
此类合适的载体包括质粒(图4)、噬菌体和病毒载体。这些载体中的大量载体是本领域已知的,并且许多载体是可商购获得的或可从科学界获得。本领域技术人员可以基于例如所选择的系统的类型诸如哺乳动物细胞和所选择的表达条件来选择用于特定应用的合适载体。
所述方法中使用的表达载体可以包括编码靶标多肽构建体的核苷酸的链段和作为调节或控制载体内的核苷酸序列的表达的调控结构域操作的核苷酸的链段。例如,调控结构域可以是启动子或增强子。
在一些实施方案中,所述方法中使用的表达载体被产生为在编码分裂内含肽部分的核酸序列之间和之内具有限制性位点,以使得能够克隆广泛多种环化靶标或剪接中间体。在一些实施方案中,本发明的表达载体可以是诱导型表达载体,诸如阿拉伯糖诱导型载体。此类表达载体可以使用如熟练读者将已知的标准分子生物学技术生成。可以通过本领域内的几种良好实践的技术将质粒转染到哺乳动物细胞中用于瞬时表达,诸如基于化学或基于电穿孔的转染。
据设想,本发明中使用的表达载体将包含用于哺乳动物细胞的合适的复制起点(ORI)。由于没有“天然”哺乳动物ORI,基于病毒的ORI常用于旨在用于哺乳动物细胞的表达载体,诸如病毒EB病毒(Epstein-Barr virus,EBC)或SV40 ORI。
因此,在一个实施方案中,提供了一种改变的SICLOPPS方法,其利用包含如上文所概述的适用于在哺乳动物细胞内表达的经修饰的SICLOPPS构建体的质粒。在一个优选实施方案中,质粒包含适用于在哺乳动物细胞内表达的SV40复制起点。
在第二方面,本发明提供了一种通过根据本发明的第一方面的改变的SICLOPPS方法产生的环肽文库。
术语“环肽文库”是指多个区室化的(compartmentalised)环肽,通常包含超过1亿个肽成员。
如本发明的第一方面所述,文库的每个成员可在哺乳动物细胞内由独特质粒表达。据设想,文库将包含大量来自每个所表达的质粒的随机化环肽,其生成方式使得感兴趣的多肽或外显肽是随机化的。随机化多肽基本上是简并寡核苷酸,其中“简并”是指其序列包含许多可能的核苷酸碱基。所得的文库在理论上将包含大量可能的环肽结构,所述结构随后可用于药物分析和其他研究目的。细胞内环肽文库的生成允许针对多种靶标进行功能测定。
如上所述的基于SICLOPPS的文库是DNA编码的,这使得可以对文库的构成进行大量控制,并允许轻松产生多种文库并针对给定靶标进行筛选(图3)。SICLOPPS文库中易于实施的此类变化包括:不同环大小的环肽;具有不同氨基酸组成的文库,使用有限的密码子组;或者,在文库的每个成员的设定位置处包括给定的氨基酸或基序。因此,SICLOPPS用户通过编码所述文库的简并寡核苷酸而对其环肽文库的构成具有绝对控制。
插入载体中的随机化多核苷酸的长度将取决于可由技术人员确定的各种因素。首要考虑的是所表达的最终多肽的大小,以及随后的环肽的环大小。在一个优选实施方案中,多肽的长度为6个氨基酸。因此,合适的随机化多核苷酸的长度将为18个核酸。对于环肽的形成,必须考虑多肽的长度是否足以允许环化反应进行,即长度是否允许形成闭合的肽环。在一些实施方案中,通过任何长度的接头使肽环化。因此,可通过仅编码两个氨基酸来获得环状多肽,在这种情况下,随机化多核苷酸的长度将为至少6个核酸。另一个考虑因素是载体和相应的复制系统所耐受的最大插入物大小。在一些实施方案中,随机化序列可更长,例如,长度为至少9、30、60、90、180、300、600、900、1,800、3,000或更多个核酸。在优选实施方案中,随机化核苷酸序列的长度为6、9、12、15、18、21、24、27或30个核苷酸。尽管随机化序列旨在编码多肽,但其长度可以不必须是3的倍数。例如,其长度可为7、8、10、11、13、14、16、17、19、20、22、23、25、26、28或29个核苷酸。随机化多核苷酸序列在本文中也可称为可变序列。在实施方案中,“随机”或“可变”序列的一个或多个位置实际上可以是固定的。例如,在这样的SICLOPPS方法中,第一个位置可被不变的半胱氨酸、丝氨酸或苏氨酸残基占据,接着是如本发明的第一方面所述的可变或随机氨基酸序列。
在本发明的第三方面,提供了一种基因构建体,其包含编码C端内含肽结构域、待环化的多肽序列、N端内含肽结构域和适用于哺乳动物细胞的降解标签的多核苷酸盒,其中降解标签附接于至少一个内含肽结构域,并且其中一旦表达,就形成活性内含肽。
在一些实施方案中,基因构建体还可包含根据本发明的第一方面的任何修饰或规范(specification)。
在本发明的第四方面,提供了一种载体,其包含根据本发明的第三方面的基因构建体。
在本发明的第五方面,提供了一种哺乳动物细胞,其包含根据本发明的第四方面的载体。
在本发明的第六方面,提供了一种根据本发明的第一方面的方法产生环状文库的方法。
为了可以更清楚地理解本发明,现在将参照附图以举例的方式描述其实施方案。
实施例1
SICLOPPS构建体被设计成在N端内含肽结构域处添加了降解结构域,从而导致经剪接的内含肽产物耗尽,以防止在哺乳动物细胞中的毒性。Cfa内含肽用于快速剪接和高度混杂,在残基122-124处包含ERD到GEP突变,以增加在+2残基处的氨基酸耐受性。构建体被设计成具有以下序列:
C端内含肽结构域(+N端6xHis标签):
MGHHHHHHGSGVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(SEQ ID NO:18)
N端内含肽结构域:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(SEQ ID NO:19)
外显肽,其中在本实施例中使用eGFP(+N端2xStrep标签)。并入野生型Cfa剪接衔接点(CFN&AEY)以提高效率:
CFNWSHPQFEKGGGSGGGSGGSAWSHPQFEKGGSGGEFMVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLKERVTAAGITLGMDELYKAEY(SEQ ID NO:20)
将包含用于羟基化的关键残基P564的来自HIF-1α的氧依赖性降解(ODD)结构域并入N端内含肽结构域的C端:
NPFSTQDTDLDLEMLAPYIPMDDDFQLRSFDQLSPLESSSASPESASPQSTVTVFQ
(SEQ ID NO:21)
进一步将荧光蛋白mCherry融合至ODD结构域的C端,接着是用于抗体识别的FLAG 标签
MVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKTGDYKDDDDK(SEQ ID NO:22)
生成eGFP外显肽质粒的两种形式(图4)。
1.野生型或WT–将剪接和降解。
2.P564G–ODD结构域中的脯氨酸564的突变防止降解。
实施例2
将来自实施例1的两种质粒独立转染到HeLa细胞中,随后将所述细胞置于氧的存在下,不进行或进行100μM DFX处理,以防止内含肽的降解。在野生型质粒中,由于HIF脯氨酰羟化酶结构域(PHD)的抑制,内含肽应仅在氧的存在下降解并且在不存在氧的情况下或在存在DFX的情况下是稳定的。相比之下,在P564G突变体中,内含肽应永不降解,无论是在氧的存在下还是在进行DFX处理的情况下。脯氨酸已突变为甘氨酸,从而防止脯氨酸被PHD羟基化和随后的蛋白质降解。
使用Zeiss荧光显微镜对HeLa细胞成像,以确定外显肽(GFP)和内含肽(带mCherry标签)是否取决于条件而存在。
如图5所示,发现与显示mCherry荧光的DFX实验相比,与mCherry荧光相关的WT内含肽在常氧中降解。P564G突变体(图6)在常氧和DFX中均显示GFP和mCherry荧光,表明未发生内含肽的降解。
实施例3
将来自实施例1和2的野生型和P564G质粒转染到HeLa细胞中,然后在常氧、缺氧或经DFX处理的条件下孵育24小时。然后使用RIPA缓冲液和刮刀裂解细胞。通过蛋白质印迹分析总蛋白质裂解物,其结果在图7中示出。Strep标签用于捕获GFP,而FLAG标签则用于mCherry。分别使用与Alexa 488和Alexa 568偶联的二抗识别抗FLAG和抗Strep标签抗体。
对于野生型质粒,缺氧和DFX条件显示出更多mCherry,表明不存在内含肽的降解。总体而言,结果表明,在所有条件下,WT中的GFP(与外显肽相关)多于P564G突变体。用作对照的肌动蛋白在各孔之间总体上是相当的。
实施例4
从胰蛋白酶消化的细胞中进行细胞计数,所述细胞已经用来自前述实施例的两种质粒独立转染,其中HeLa细胞在常氧和缺氧条件下生长。将胰蛋白酶消化的细胞重悬于完全培养基中。然后使用MOXI细胞计数器分析细胞悬液,以对活细胞和死细胞计数。时间点取为0h、6h、12h、24h、36h和48h,一式三份或一式两份。
如图8所示,趋势显示野生型转染细胞中的活细胞数量保持不变,而常氧中的P564G中的活细胞数量减少。对于两种质粒,在缺氧条件下孵育的细胞可能从48h开始表现出细胞数量的减少,即毒性,其中未发生内含肽的降解。
实施例5
将剪接(WT)和非剪接(C1A)的GFP-Npu-mCherry-ODDD构建体瞬时转染到Trex细胞
程序:将1.2x106个Trex293细胞涂板到6cm培养皿中。第二天,用1ug质粒转染细胞,并且一个孔保持未转染,以用作设置荧光门的阴性对照。第二天,更换培养基,在每个培养皿中添加1ug/mL强力霉素,并且在经处理细胞的培养皿中,添加DFX至终浓度为100μM。第二天通过FACS分析细胞。
结果:我们研究了融合至mCherry和氧依赖性降解结构域(ODDD)的内含肽在氧的存在下是否降解以及添加DFX是否可以防止这种氧依赖性降解。当通过FACS分析细胞时,GFP剪接形式(图9小图A)显示出Q3群体(GFP+mCherry-)中的细胞,表明GFP外显肽被剪接并且单独的内含肽降解。添加DFX后(图9小图B),在Q3中观察到的细胞少得多,而在Q2(GFP+mCherry+)中观察到更多细胞,表明内含肽的降解减少。这在非剪接突变体中得到证实,图9(小图C和D)。来自小图A和B的mCherry+细胞的叠加(在图9小图E中示出)证实,在存在DFX的情况下,mCherry荧光的强度更高,表明通过ODDD途径的内含肽降解较少。
实施例6
将剪接(WT)的GFP-Npu-mCherry-ODDD构建体稳定整合到Trex细胞中
程序:将稳定整合了GFP-WT-Npu-mCherry-ODDD的Trex293细胞涂板在6孔板中。然后用强力霉素处理细胞以诱导内含肽的表达。一种条件用DFX(100μM)处理并且另一种条件保持未处理。第二天,通过FACS分析细胞
结果:我们研究了融合至mCherry和氧依赖性降解结构域(ODDD)的内含肽在氧的存在下是否降解以及添加DFX是否可以防止这种氧依赖性降解。当通过FACS分析细胞时,在不存在DFX的情况下(图10小图A),在Q1和Q2(分别为mCherry+GFP-和mCherry+GFP+)中几乎没有观察到细胞,而在Q3中观察到了大部分细胞(mCherry-GFP+;67.4%)。这表明发生了剪接,从而将GFP和mCherry分开,并且带有mCherry-ODDD标签的内含肽在氧的存在下降解,并且经剪接的GFP保持完整。添加DFX后(图10小图B),在Q2中发现了许多细胞(35.1%),表明内含肽的降解减少,因为存在更多mCherry。
实施例7
整合了剪接(WT)和非剪接(C1A)的编码CFA内含肽-肽外显肽-ODDD-mCherry的构 建体的Trex293细胞的活力测定
程序:将整合了CFA内含肽-肽外显肽-ODDD-mCherry(剪接和非剪接)的Trex细胞以每孔1000个细胞的密度涂板于96孔板中。第二天,更换培养基并替换为含有强力霉素(1μg/mL)且具有或不具有DFX(100μM终浓度)的新鲜培养基。第二天,使用Cell Titer Glo测定测量细胞活力。
肽外显肽WT 肽外显肽C1A
-dfx 100 100
+dfx 57.22013278 57.73246861
结果:该活力测定证实,在用dfx处理后,显示为导致内含肽的降解减少,细胞活力显著降低(图11)。这表明细胞中内含肽的存在对细胞活力具有负面影响。-dfx对照导致内含肽降解并随后活力增加。C1A非剪接对照证实这不是外显肽毒性的结果,因为不存在经剪接的外显肽。
在整个说明书中使用并构成描述的一部分的序列:
SEQ ID NO:1(Ssp DnaE C端内含肽结构域的氨基酸序列)
MVKVIGRRSLGVQRIFDIGLPQDHNFLLANGAIAANC
SEQ ID NO:2(Ssp DnaE N端内含肽结构域的氨基酸序列)
AEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHRFLTTDYQLLAIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK
SEQ ID NO:3(Npu DnaE C端内含肽结构域的氨基酸序列)
MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
SEQ ID NO:4(Npu DnaE N端内含肽结构域的氨基酸序列)
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN
SEQ ID NO:5(Cfa DnaE C端内含肽结构域的氨基酸序列)
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN
SEQ ID NO:6(Cfa DnaE N端内含肽结构域的氨基酸序列)
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
SEQ ID NO:7(gp41-1 C端内含肽结构域的氨基酸序列)
MMLKKILKIEELDERELIDIEVSGNHLFYANDILTHNS
SEQ ID NO:8(gp41-1 N端内含肽结构域的氨基酸序列)
CLDLKTQVQTPQGMKEISNIQVGDLVLSNTGYNEVLNVFPKSKKKSYKITLEDGKEIICSEEHLFPTQTGEMNISGGLKEGMCLYVKE
SEQ ID NO:9(智人缺氧诱导因子-1α[HIF-1α]亚基的氨基酸序列)
MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVMRLTISYLRVRKLLDAGDLDIEDDMKAQMNCFYLKALDGFVMVLTDDGDMIYISDNVNKYMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNGLVKKGKEQNTQRSFFLRMKCTLTSRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQCGYKKPPMTCLVLICEPIPHPSNIEIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHLTKTHHDMFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQHDLIFSLQQTECVLKPVESSDMKMTQLFTKVESEDTSSLFDKLKKEPDALTLLAPAAGDTIISLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSSADPALNQEVALKLEPNPESLELSFTMPQIQDQTPSPSDGSTRQSSPEPNSPSEYCFYVDSDMVNEFKLELVEKLFAEDTEAKNPFSTQDTDLDLEMLAPYIPMDDDFQLRSFDQLSPLESSSASPESASPQSTVTVFQQTQIQEPTANATTTTATTDELKTVTKDRMEDIKILIASPSPTHIHKETTSATSSPYRDTQSRTASPNRAGKGVIEQTEKSHPRSPNVLSVALSQRTTVPEEELNPKILALQNAQRKRKMEHDGSLFQAVGIGTLLQQPDDHAATTSLSWKRVKGCKSSEQNGMEQKTIILIPSDLACRLLGQSMDESGLPQLTSYDCEVNAPIQGSRNLLQGEELLRALDQVN
SEQ ID NO:10(智人缺氧诱导因子-1α(HIF-1α)亚基的氧依赖性降解(ODD)结构域的氨基酸序列)
NPFSTQDTDLDLEMLAPYIPMDDDFQLRSFDQLSPLESSSASPESASPQSTVTVFQ
序列表
<110> 南安普顿大学(The University of Southampton)
<120> 哺乳动物内含肽
<130> CURBD/P75368PC
<160> 22
<170> BiSSAP 1.3.6
<210> 1
<211> 37
<212> PRT
<213> 集胞藻属(Synechocystis) PCC6803
<400> 1
Met Val Lys Val Ile Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe
1 5 10 15
Asp Ile Gly Leu Pro Gln Asp His Asn Phe Leu Leu Ala Asn Gly Ala
20 25 30
Ile Ala Ala Asn Cys
35
<210> 2
<211> 126
<212> PRT
<213> 集胞藻属(Synechocystis) PCC6803
<400> 2
Ala Glu Tyr Cys Leu Ser Phe Gly Thr Glu Ile Leu Thr Val Glu Tyr
1 5 10 15
Gly Pro Leu Pro Ile Gly Lys Ile Val Ser Glu Glu Ile Asn Cys Ser
20 25 30
Val Tyr Ser Val Asp Pro Glu Gly Arg Val Tyr Thr Gln Ala Ile Ala
35 40 45
Gln Trp His Asp Arg Gly Glu Gln Glu Val Leu Glu Tyr Glu Leu Glu
50 55 60
Asp Gly Ser Val Ile Arg Ala Thr Ser Asp His Arg Phe Leu Thr Thr
65 70 75 80
Asp Tyr Gln Leu Leu Ala Ile Glu Glu Ile Phe Ala Arg Gln Leu Asp
85 90 95
Leu Leu Thr Leu Glu Asn Ile Lys Gln Thr Glu Glu Ala Leu Asp Asn
100 105 110
His Arg Leu Pro Phe Pro Leu Leu Asp Ala Gly Thr Ile Lys
115 120 125
<210> 3
<211> 36
<212> PRT
<213> 念珠藻属物种(Nostoc sp.) PCC73102
<400> 3
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
Ile Ala Ser Asn
35
<210> 4
<211> 102
<212> PRT
<213> 念珠藻属物种(Nostoc sp.) PCC73102
<400> 4
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn
100
<210> 5
<211> 35
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cfa DnaE C端内含肽结构域的氨基酸序列
<400> 5
Val Lys Ile Ile Ser Arg Lys Ser Leu Gly Thr Gln Asn Val Tyr Asp
1 5 10 15
Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Lys Asn Gly Leu Val
20 25 30
Ala Ser Asn
35
<210> 6
<211> 100
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cfa DnaE N端内含肽结构域的氨基酸序列
<400> 6
Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Phe Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Glu Arg Ile Glu Cys Thr Val Tyr Thr
20 25 30
Val Asp Lys Asn Gly Phe Val Tyr Thr Gln Pro Ile Ala Gln Trp His
35 40 45
Asn Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Thr Asp Gly Gln Met
65 70 75 80
Leu Pro Ile Asp Glu Ile Phe Glu Arg Gly Leu Asp Leu Lys Gln Val
85 90 95
Asp Gly Leu Pro
100
<210> 7
<211> 38
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> gp41-1 C端内含肽结构域的氨基酸序列
<400> 7
Met Met Leu Lys Lys Ile Leu Lys Ile Glu Glu Leu Asp Glu Arg Glu
1 5 10 15
Leu Ile Asp Ile Glu Val Ser Gly Asn His Leu Phe Tyr Ala Asn Asp
20 25 30
Ile Leu Thr His Asn Ser
35
<210> 8
<211> 88
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> gp41-1 N端内含肽结构域
<400> 8
Cys Leu Asp Leu Lys Thr Gln Val Gln Thr Pro Gln Gly Met Lys Glu
1 5 10 15
Ile Ser Asn Ile Gln Val Gly Asp Leu Val Leu Ser Asn Thr Gly Tyr
20 25 30
Asn Glu Val Leu Asn Val Phe Pro Lys Ser Lys Lys Lys Ser Tyr Lys
35 40 45
Ile Thr Leu Glu Asp Gly Lys Glu Ile Ile Cys Ser Glu Glu His Leu
50 55 60
Phe Pro Thr Gln Thr Gly Glu Met Asn Ile Ser Gly Gly Leu Lys Glu
65 70 75 80
Gly Met Cys Leu Tyr Val Lys Glu
85
<210> 9
<211> 826
<212> PRT
<213> 智人(Homo sapiens)
<400> 9
Met Glu Gly Ala Gly Gly Ala Asn Asp Lys Lys Lys Ile Ser Ser Glu
1 5 10 15
Arg Arg Lys Glu Lys Ser Arg Asp Ala Ala Arg Ser Arg Arg Ser Lys
20 25 30
Glu Ser Glu Val Phe Tyr Glu Leu Ala His Gln Leu Pro Leu Pro His
35 40 45
Asn Val Ser Ser His Leu Asp Lys Ala Ser Val Met Arg Leu Thr Ile
50 55 60
Ser Tyr Leu Arg Val Arg Lys Leu Leu Asp Ala Gly Asp Leu Asp Ile
65 70 75 80
Glu Asp Asp Met Lys Ala Gln Met Asn Cys Phe Tyr Leu Lys Ala Leu
85 90 95
Asp Gly Phe Val Met Val Leu Thr Asp Asp Gly Asp Met Ile Tyr Ile
100 105 110
Ser Asp Asn Val Asn Lys Tyr Met Gly Leu Thr Gln Phe Glu Leu Thr
115 120 125
Gly His Ser Val Phe Asp Phe Thr His Pro Cys Asp His Glu Glu Met
130 135 140
Arg Glu Met Leu Thr His Arg Asn Gly Leu Val Lys Lys Gly Lys Glu
145 150 155 160
Gln Asn Thr Gln Arg Ser Phe Phe Leu Arg Met Lys Cys Thr Leu Thr
165 170 175
Ser Arg Gly Arg Thr Met Asn Ile Lys Ser Ala Thr Trp Lys Val Leu
180 185 190
His Cys Thr Gly His Ile His Val Tyr Asp Thr Asn Ser Asn Gln Pro
195 200 205
Gln Cys Gly Tyr Lys Lys Pro Pro Met Thr Cys Leu Val Leu Ile Cys
210 215 220
Glu Pro Ile Pro His Pro Ser Asn Ile Glu Ile Pro Leu Asp Ser Lys
225 230 235 240
Thr Phe Leu Ser Arg His Ser Leu Asp Met Lys Phe Ser Tyr Cys Asp
245 250 255
Glu Arg Ile Thr Glu Leu Met Gly Tyr Glu Pro Glu Glu Leu Leu Gly
260 265 270
Arg Ser Ile Tyr Glu Tyr Tyr His Ala Leu Asp Ser Asp His Leu Thr
275 280 285
Lys Thr His His Asp Met Phe Thr Lys Gly Gln Val Thr Thr Gly Gln
290 295 300
Tyr Arg Met Leu Ala Lys Arg Gly Gly Tyr Val Trp Val Glu Thr Gln
305 310 315 320
Ala Thr Val Ile Tyr Asn Thr Lys Asn Ser Gln Pro Gln Cys Ile Val
325 330 335
Cys Val Asn Tyr Val Val Ser Gly Ile Ile Gln His Asp Leu Ile Phe
340 345 350
Ser Leu Gln Gln Thr Glu Cys Val Leu Lys Pro Val Glu Ser Ser Asp
355 360 365
Met Lys Met Thr Gln Leu Phe Thr Lys Val Glu Ser Glu Asp Thr Ser
370 375 380
Ser Leu Phe Asp Lys Leu Lys Lys Glu Pro Asp Ala Leu Thr Leu Leu
385 390 395 400
Ala Pro Ala Ala Gly Asp Thr Ile Ile Ser Leu Asp Phe Gly Ser Asn
405 410 415
Asp Thr Glu Thr Asp Asp Gln Gln Leu Glu Glu Val Pro Leu Tyr Asn
420 425 430
Asp Val Met Leu Pro Ser Pro Asn Glu Lys Leu Gln Asn Ile Asn Leu
435 440 445
Ala Met Ser Pro Leu Pro Thr Ala Glu Thr Pro Lys Pro Leu Arg Ser
450 455 460
Ser Ala Asp Pro Ala Leu Asn Gln Glu Val Ala Leu Lys Leu Glu Pro
465 470 475 480
Asn Pro Glu Ser Leu Glu Leu Ser Phe Thr Met Pro Gln Ile Gln Asp
485 490 495
Gln Thr Pro Ser Pro Ser Asp Gly Ser Thr Arg Gln Ser Ser Pro Glu
500 505 510
Pro Asn Ser Pro Ser Glu Tyr Cys Phe Tyr Val Asp Ser Asp Met Val
515 520 525
Asn Glu Phe Lys Leu Glu Leu Val Glu Lys Leu Phe Ala Glu Asp Thr
530 535 540
Glu Ala Lys Asn Pro Phe Ser Thr Gln Asp Thr Asp Leu Asp Leu Glu
545 550 555 560
Met Leu Ala Pro Tyr Ile Pro Met Asp Asp Asp Phe Gln Leu Arg Ser
565 570 575
Phe Asp Gln Leu Ser Pro Leu Glu Ser Ser Ser Ala Ser Pro Glu Ser
580 585 590
Ala Ser Pro Gln Ser Thr Val Thr Val Phe Gln Gln Thr Gln Ile Gln
595 600 605
Glu Pro Thr Ala Asn Ala Thr Thr Thr Thr Ala Thr Thr Asp Glu Leu
610 615 620
Lys Thr Val Thr Lys Asp Arg Met Glu Asp Ile Lys Ile Leu Ile Ala
625 630 635 640
Ser Pro Ser Pro Thr His Ile His Lys Glu Thr Thr Ser Ala Thr Ser
645 650 655
Ser Pro Tyr Arg Asp Thr Gln Ser Arg Thr Ala Ser Pro Asn Arg Ala
660 665 670
Gly Lys Gly Val Ile Glu Gln Thr Glu Lys Ser His Pro Arg Ser Pro
675 680 685
Asn Val Leu Ser Val Ala Leu Ser Gln Arg Thr Thr Val Pro Glu Glu
690 695 700
Glu Leu Asn Pro Lys Ile Leu Ala Leu Gln Asn Ala Gln Arg Lys Arg
705 710 715 720
Lys Met Glu His Asp Gly Ser Leu Phe Gln Ala Val Gly Ile Gly Thr
725 730 735
Leu Leu Gln Gln Pro Asp Asp His Ala Ala Thr Thr Ser Leu Ser Trp
740 745 750
Lys Arg Val Lys Gly Cys Lys Ser Ser Glu Gln Asn Gly Met Glu Gln
755 760 765
Lys Thr Ile Ile Leu Ile Pro Ser Asp Leu Ala Cys Arg Leu Leu Gly
770 775 780
Gln Ser Met Asp Glu Ser Gly Leu Pro Gln Leu Thr Ser Tyr Asp Cys
785 790 795 800
Glu Val Asn Ala Pro Ile Gln Gly Ser Arg Asn Leu Leu Gln Gly Glu
805 810 815
Glu Leu Leu Arg Ala Leu Asp Gln Val Asn
820 825
<210> 10
<211> 56
<212> PRT
<213> 智人(Homo sapiens)
<400> 10
Asn Pro Phe Ser Thr Gln Asp Thr Asp Leu Asp Leu Glu Met Leu Ala
1 5 10 15
Pro Tyr Ile Pro Met Asp Asp Asp Phe Gln Leu Arg Ser Phe Asp Gln
20 25 30
Leu Ser Pro Leu Glu Ser Ser Ser Ala Ser Pro Glu Ser Ala Ser Pro
35 40 45
Gln Ser Thr Val Thr Val Phe Gln
50 55
<210> 11
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> SsrA tag
<400> 11
Ala Ala Asn Asp Glu Asn Tyr Ala Leu Ala Ala
1 5 10
<210> 12
<211> 150
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 其中XXXXXX为待产生的外显肽和环肽;
第一个X为C、S或T,并且后续X在说明书中示出为“~”,其表示环肽序列的氨基酸。
<400> 12
His His His His His His Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu
1 5 10 15
Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg Tyr His Asn Phe
20 25 30
Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Ile Leu
50 55 60
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
65 70 75 80
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
85 90 95
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Cys
100 105 110
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
115 120 125
Met Met Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
130 135 140
Val Asp Asn Leu Pro Asn
145 150
<210> 13
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 六组氨酸(6xHis)标签
<400> 13
His His His His His His
1 5
<210> 14
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 包含C端内含肽结构域的成分
<400> 14
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
Asp Ile Gly Val Glu Arg Tyr His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
Ile Ala Ser Asn
35
<210> 15
<211> 102
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 包含N端内含肽结构域的成分
<400> 15
Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Ile Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Cys
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Met Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn
100
<210> 16
<211> 206
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 其中XXXXXX为待产生的外显肽和环肽;
第一个X为C、S或T,并且后续X在说明书中示出为“~”,其表示环肽序列的氨基酸。
<400> 16
His His His His His His Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu
1 5 10 15
Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg Tyr His Asn Phe
20 25 30
Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Ile Leu
50 55 60
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
65 70 75 80
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
85 90 95
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Cys
100 105 110
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
115 120 125
Met Met Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
130 135 140
Val Asp Asn Leu Pro Asn Asn Pro Phe Ser Thr Gln Asp Thr Asp Leu
145 150 155 160
Asp Leu Glu Met Leu Ala Pro Tyr Ile Pro Met Asp Asp Asp Phe Gln
165 170 175
Leu Arg Ser Phe Asp Gln Leu Ser Pro Leu Glu Ser Ser Ser Ala Ser
180 185 190
Pro Glu Ser Ala Ser Pro Gln Ser Thr Val Thr Val Phe Gln
195 200 205
<210> 17
<211> 56
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 包含HIF-1α的全长ODD结构域的氨基酸548-603
<400> 17
Asn Pro Phe Ser Thr Gln Asp Thr Asp Leu Asp Leu Glu Met Leu Ala
1 5 10 15
Pro Tyr Ile Pro Met Asp Asp Asp Phe Gln Leu Arg Ser Phe Asp Gln
20 25 30
Leu Ser Pro Leu Glu Ser Ser Ser Ala Ser Pro Glu Ser Ala Ser Pro
35 40 45
Gln Ser Thr Val Thr Val Phe Gln
50 55
<210> 18
<211> 46
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> C端内含肽结构域(+N端6xHis标签)
<400> 18
Met Gly His His His His His His Gly Ser Gly Val Lys Ile Ile Ser
1 5 10 15
Arg Lys Ser Leu Gly Thr Gln Asn Val Tyr Asp Ile Gly Val Gly Glu
20 25 30
Pro His Asn Phe Leu Leu Lys Asn Gly Leu Val Ala Ser Asn
35 40 45
<210> 19
<211> 101
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> N端内含肽结构域
<400> 19
Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Phe Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Glu Arg Ile Glu Cys Thr Val Tyr Thr
20 25 30
Val Asp Lys Asn Gly Phe Val Tyr Thr Gln Pro Ile Ala Gln Trp His
35 40 45
Asn Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Ile Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Thr Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Gly Leu Asp Leu Lys Gln
85 90 95
Val Asp Gly Leu Pro
100
<210> 20
<211> 280
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 并入的野生型Cfa剪接衔接点(CFN & AEY)
<400> 20
Cys Phe Asn Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly
20 25 30
Gly Ser Gly Gly Glu Phe Met Val Ser Lys Gly Glu Glu Leu Phe Thr
35 40 45
Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His
50 55 60
Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys
65 70 75 80
Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp
85 90 95
Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg
100 105 110
Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro
115 120 125
Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
130 135 140
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn
145 150 155 160
Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu
165 170 175
Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met
180 185 190
Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His
195 200 205
Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn
210 215 220
Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
225 230 235 240
Ser Thr Gln Ser Lys Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
245 250 255
Met Val Leu Lys Glu Arg Val Thr Ala Ala Gly Ile Thr Leu Gly Met
260 265 270
Asp Glu Leu Tyr Lys Ala Glu Tyr
275 280
<210> 21
<211> 56
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自HIF-1α的氧依赖性降解(ODD)结构域, 包含
用于羟基化的关键残基P564,并入N端内含肽结构域的C端
<400> 21
Asn Pro Phe Ser Thr Gln Asp Thr Asp Leu Asp Leu Glu Met Leu Ala
1 5 10 15
Pro Tyr Ile Pro Met Asp Asp Asp Phe Gln Leu Arg Ser Phe Asp Gln
20 25 30
Leu Ser Pro Leu Glu Ser Ser Ser Ala Ser Pro Glu Ser Ala Ser Pro
35 40 45
Gln Ser Thr Val Thr Val Phe Gln
50 55
<210> 22
<211> 246
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 融合至ODD结构域C端的荧光蛋白mCherry,接着是FLAG标签
<400> 22
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
100 105 110
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys Thr Gly Asp Tyr
225 230 235 240
Lys Asp Asp Asp Asp Lys
245

Claims (21)

1.一种用于在哺乳动物细胞中无毒性地产生环肽的方法,包括:
a)将载体引入所述哺乳动物细胞中,其中所述载体包含构建体,所述构建体编码分裂内含肽的C端内含肽结构域和N端内含肽结构域;待环化的多肽序列;以及降解标签,其中所述降解标签附接于至少一个内含肽结构域;
b)表达所述构建体,以产生包含活性内含肽和所述多肽序列的中间体,由此所述活性内含肽经历剪接并使所述多肽环化,并且其中所述降解标签使所述活性内含肽降解。
2.一种环肽文库,其通过根据权利要求1所述的方法产生。
3.一种表达环肽的哺乳动物细胞,其中所述哺乳动物细胞通过包括以下的方法产生:
a)将载体引入所述哺乳动物细胞中,其中所述载体包含构建体,所述构建体编码分裂内含肽的C端内含肽结构域和N端内含肽结构域;待环化的多肽序列;以及降解标签,其中所述降解标签附接于至少一个内含肽结构域;
b)表达所述构建体,以产生包含活性内含肽和所述多肽序列的中间体,由此所述活性内含肽经历剪接并使所述多肽环化,并且其中所述降解标签使所述活性内含肽降解。
4.根据权利要求3所述的哺乳动物细胞,其中所述细胞不包含活性内含肽或基本上不包含活性内含肽。
5.一种基因构建体,其包含:编码分裂内含肽的C端内含肽结构域和N端内含肽结构域的多核苷酸盒;待环化的多肽序列;以及适用于哺乳动物细胞的降解标签,其中所述降解标签附接于至少一个内含肽结构域。
6.一种载体,其包含根据权利要求5所述的基因构建体。
7.一种哺乳动物细胞,其包含根据权利要求5所述的基因构建体和/或根据权利要求6所述的载体。
8.根据前述权利要求中任一项所述的方法、文库、构建体、载体或细胞,其中所述活性内含肽在其通过所述降解标签降解之前进行剪接。
9.根据前述权利要求中任一项所述的方法、文库、构建体、载体或细胞,其中所述降解标签至少部分地通过泛素化实现降解。
10.根据前述权利要求中任一项所述的方法、文库、构建体、载体或细胞,其中所述降解标签是缺氧诱导因子-1α(HIF-1α)亚基或蛋白水解靶向嵌合体(PROTAC)。
11.根据前述权利要求中任一项所述的方法、文库、构建体、载体或细胞,其中所述降解标签是包含关键残基P564的缺氧诱导因子-1α(HIF-1α)亚基的氧依赖性降解(ODD)结构域。
12.根据权利要求11所述的方法、文库、构建体、载体或细胞,其中HIF-1α的所述ODD结构域包含跨越氨基酸548-603的序列长度。
13.根据权利要求1-9中任一项所述的方法、文库、构建体、载体或细胞,其中所述降解标签是能够接合E3泛素连接酶的蛋白水解靶向嵌合体(PROTAC)小分子。
14.根据前述权利要求中任一项所述的方法、文库、构建体、载体或细胞,其中所述活性内含肽是Cfa、Npu、Ssp或gp41-1内含肽。
15.根据权利要求1-13中任一项所述的方法、文库、构建体、载体或细胞,其中所述活性内含肽是Npu内含肽。
16.根据前述权利要求中任一项所述的方法、文库、构建体、载体或细胞,其中所述降解标签与所述内含肽之间的连接是直接连接。
17.根据前述权利要求中任一项所述的方法、文库、构建体、载体或细胞,其中所述构建体进一步编码至少一个亲和标签。
18.根据权利要求16所述的方法、文库、构建体、载体或细胞,其中所编码的所述至少一个亲和标签是用于抗体识别的FLAG标签。
19.根据前述权利要求中任一项所述的方法、文库、构建体、载体或细胞,其中所述构建体进一步编码荧光标签,其中所述标签优选为DsRed。
20.一种使用根据权利要求1所述的方法产生环状文库的方法。
21.根据前述权利要求中任一项所述的方法、文库、构建体、载体或细胞,其中所述内含肽对哺乳动物细胞有毒。
CN202080088650.XA 2019-12-18 2020-12-17 Pending CN114867854A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1918693.1A GB201918693D0 (en) 2019-12-18 2019-12-18 Peptide
GB1918693.1 2019-12-18
PCT/GB2020/053263 WO2021123789A1 (en) 2019-12-18 2020-12-17 Peptide

Publications (1)

Publication Number Publication Date
CN114867854A true CN114867854A (zh) 2022-08-05

Family

ID=69186767

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080088650.XA Pending CN114867854A (zh) 2019-12-18 2020-12-17

Country Status (7)

Country Link
US (1) US20240279646A1 (zh)
EP (1) EP4077662A1 (zh)
JP (1) JP2023507409A (zh)
CN (1) CN114867854A (zh)
CA (1) CA3164788A1 (zh)
GB (1) GB201918693D0 (zh)
WO (1) WO2021123789A1 (zh)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001066565A2 (en) * 2000-03-06 2001-09-13 Rigel Pharmaceuticals, Inc. In vivo production of cyclic peptides

Also Published As

Publication number Publication date
US20240279646A1 (en) 2024-08-22
JP2023507409A (ja) 2023-02-22
GB201918693D0 (en) 2020-01-29
CA3164788A1 (en) 2021-06-24
WO2021123789A1 (en) 2021-06-24
EP4077662A1 (en) 2022-10-26

Similar Documents

Publication Publication Date Title
KR102684890B1 (ko) 진핵 게놈 변형을 위한 조작된 cas9 시스템
WO2017215619A1 (zh) 在细胞内产生点突变的融合蛋白、其制备及用途
KR20220147710A (ko) 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선
US8183037B2 (en) Methods of genetically encoding unnatural amino acids in eukaryotic cells using orthogonal tRNA/synthetase pairs
US20120077224A1 (en) unnatural amino acid incorporation in eukaryotic cells
EP2820127B1 (en) Targeted histone acetylation
KR20200017479A (ko) Crispr/cas 활성제 시스템용 합성 유도 rna
CN113711046B (zh) 用于揭示与Tau聚集相关的基因脆弱性的CRISPR/Cas脱落筛选平台
US11965184B2 (en) CRISPR/Cas fusion proteins and systems
US20220411771A1 (en) Compositions and methods for detecting nucleic acid-protein interactions
CN113260700B (zh) 基于可检测标签与靶蛋白的CRISPR/Cas控制的整合而选择细胞的方法
JP2022532216A (ja) タンパク質の選択的分解
CN114867854A (zh)
Kubo et al. Identification of proteins that interact with a plant nuclear protein using the yeast split-Trp sensor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination