CN111560391A - 一种蛋白质异质索烃的生物合成方法 - Google Patents

一种蛋白质异质索烃的生物合成方法 Download PDF

Info

Publication number
CN111560391A
CN111560391A CN202010436910.XA CN202010436910A CN111560391A CN 111560391 A CN111560391 A CN 111560391A CN 202010436910 A CN202010436910 A CN 202010436910A CN 111560391 A CN111560391 A CN 111560391A
Authority
CN
China
Prior art keywords
protein
gly
glu
p53dim
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010436910.XA
Other languages
English (en)
Other versions
CN111560391B (zh
Inventor
张文彬
刘雅杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202010436910.XA priority Critical patent/CN111560391B/zh
Publication of CN111560391A publication Critical patent/CN111560391A/zh
Priority to PCT/CN2021/094589 priority patent/WO2021233330A1/zh
Priority to US17/999,377 priority patent/US20230348546A1/en
Application granted granted Critical
Publication of CN111560391B publication Critical patent/CN111560391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4746Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used p53
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公布了一种蛋白质异质索烃的生物合成方法。通过模拟天然拓扑蛋白质合成中的多步翻译后修饰过程,基于合理的基因序列设计,结合原位组装、链断裂和定点环化,发展了基于两种正交偶联方式的生物合成体系,可以实现蛋白质异质索烃的模块化合成。该方法利用p53dim结构域等缠结基元的分子内二聚来提高蛋白质异质索烃的产量,同时不需要额外的胞外反应。当多肽‑蛋白质反应对与断裂内含肽联用时,可以实现支化蛋白质异质索烃的生物合成;当两种正交断裂内含肽联用时,可以获得完全主链环化的蛋白质异质索烃。本发明拓展了拓扑蛋白质的合成方法,可以简洁地实现蛋白质异质索烃的生物合成。

Description

一种蛋白质异质索烃的生物合成方法
技术领域
本发明涉及蛋白质异质索烃的生物合成方法,特别涉及基于多肽-蛋白质反应对和/或断裂内含肽的生物合成体系,以及基于该体系通过两种正交偶联环化方式构建多结构域蛋白质异质索烃的方法。
背景技术
在自然界中,许多天然生物大分子都存在特定的拓扑结构,并与其相应的生物学功能密切相关。目前发现的天然拓扑蛋白质包括环状、扭结、套索蛋白质和蛋白质索烃等。由于环状蛋白质的构建只需对多肽链实现偶联,是目前人工合成拓扑蛋白质的研究重点,通常表现出明显热稳定性的提高。由于蛋白质折叠机制的复杂性,通过控制多肽链之间的缠结关系对蛋白质的拓扑结构进行调控是相对困难的。索烃中最为简单的[2]索烃是由两个机械互锁的环状基元组成,因而相应的蛋白质异质索烃结构既可以结合环状蛋白质的优势,又可以通过调控两个环状基元的相对位置实现协同作用,而该结构尚未在自然界中发现。故而发展蛋白质异质索烃的制备方法是一个非常有吸引力的研究方向。
目前关于人工合成蛋白质索烃的报道相对较少,其合成策略可以大致分为三类,但实现机械互锁结构的本质均是基于蛋白质的折叠结构。第一类是利用肿瘤抑制蛋白质p53的四聚结构域p53tet或其突变型二聚结构域p53dim来指导分子链间的相互缠结,再通过高效特异的天然化学连接或者谍标签-谍捕手(SpyTag-SpyCatcher)反应对进行闭环,从而实现蛋白质同质索烃的合成。第二类则是基于套索肽的拓扑结构转换,通过酶切和组装逐步转变为高阶索烃。第三类则是通过将谍捕手拆分为BDTag和谍订书机酶(SpyStapler),并基于谍标签-谍捕手反应对的折叠结构对三个基元进行合理重组,结合断裂内含肽介导的环化反应和其自催化生成异肽键的特点,首次实现了蛋白质异质索烃的合成,但其反应无法达到完全,整个纯化过程也较为繁琐。基于组装-反应的协同策略,进一步发展蛋白质异质索烃的生物合成方法,将有助于更深入地研究拓扑结构对蛋白质性质和功能的影响,也将为其在生物医学领域中的应用奠定基础。
发明内容
本发明的目的在于提供一种蛋白质异质索烃的生物合成策略,不需要额外的胞外反应过程,即可实现多结构域蛋白质异质索烃的高效构建。
本发明通过模拟天然拓扑蛋白质合成中的多步翻译后修饰过程,基于合理的基因序列设计,结合原位组装、链断裂和定点环化,发展了基于两种正交偶联方式的合成体系,可以实现蛋白质异质索烃的模块化合成,具有支化或完全主链环化的结构特征。
本发明设计的用于制备蛋白质异质索烃的蛋白质前体序列的基本结构包括:L1-1-X-L1-2-(原位酶切位点)-L2-1-X-L2-2,其中:
(1)X代表可以形成二聚体的缠结基元,是形成异质索烃的关键元素之一。两个X可以相同,例如肿瘤抑制因子衍生的p53dim结构域、幽门螺旋杆菌HP0242蛋白等形成同质二聚体的缠结基元;两个X也可以不同,例如在上述二聚体基元基础上经过氨基酸残基的取代等衍生的异质二聚体基元,或者是自然界中存在的天然异质缠结二聚体基元。
(2)L1-1/L1-2、L2-1/L2-2代表可以在胞内发生正交偶联反应的两对环化基元,是形成异质索烃的另一关键元素。所述环化基元可以选自多肽-蛋白质反应对、断裂内含肽等,为了避免过多的副反应,两种环化方式之间应当具有一定的正交性。在特定情况下需要在L1-2与L2-1之间插入原位酶切位点,通过在胞内共表达蛋白酶对该位点进行原位酶切才能实现异质索烃的合成,例如插入TVMV酶的识别位点。
两对环化基元的选择主要包括下述三种方式:
①两种正交的多肽-蛋白质反应对,例如谍标签-谍捕手反应对和探标签-探捕手反应对。在这种情况下必须在两个反应对之间插入原位酶切位点,将一条多肽链经共表达蛋白酶酶切变为两条多肽链。
②多肽-蛋白质反应对与断裂内含肽组合,例如谍标签-谍捕手反应对与NpuDnaE断裂内含肽(包括C端部分和N端部分)。当多肽-蛋白质反应对在前面,断裂内含肽在后面,即L1-1/L1-2为多肽-蛋白质反应对,L2-1/L2-2为断裂内含肽时,由于多肽-蛋白质反应对的胞内环化反应是侧链偶联反应,同时所形成的复合物会存在于最终结构中,因此需要通过原位酶切引发L2-1/L2-2的环化反应;当断裂内含肽在前面,多肽-蛋白质反应对在后面,即L1-1/L1-2为断裂内含肽,L2-1/L2-2为多肽-蛋白质反应对时,基于断裂内含肽介导的环化为主链偶联,断裂内含肽环化后会通过自剪接的方式从前体蛋白质中释放出来的特性,原位酶切可以是非必须的。
③两种正交的断裂内含肽,例如NpuDnaE断裂内含肽的两种不同断裂方式形成的IntC1/IntN1、IntC2/IntN2,以及其他断裂内含肽,例如gp41-1,gp41-8,NrdJ-1和IMPDH-1等,两种断裂内含肽存在一定正交性即可。断裂内含肽介导环化的优势是形成主链环化,并且自身剪接离去,剩余的冗余氨基酸少。利用两种正交的断裂内含肽时可以不插入原位酶切位点。
在上述蛋白质前体序列的基本结构中插入一个或多个相同或不同的目标蛋白,即可构建包含目标蛋白的蛋白质异质索烃。目标蛋白的插入位点可以在环内,即X结构域前和/或X结构域后。由于多肽-蛋白质反应对介导的环化为侧链偶联,其环化后仍然保留N端和C端,因而目标蛋白的插入位点也可以在环外,即多肽-蛋白质反应对的N端和/或C端,从而构建支化异质索烃。
目标蛋白的基因构建参见图1,在蛋白质前体序列L1-1-X-POI1-L1-2-(TVMV)-L2-1-X-POI2-L2-2中,L1-1/L1-2与L2-1/L2-2代表两种正交环化方式的环化基元,X代表缠结基元,POI1和POI2代表目标蛋白1和目标蛋白2;TVMV位点代表TVMV酶的识别位点,可以被共表达的TVMV酶识别并进行原位酶切;在第二个缠结基元X前引入纯化标签(如组氨酸标签序列),方便对合成的异质索烃进行纯化。下面举例说明目标蛋白的可融合位置:
①当L1-1/L1-2与L2-1/L2-2为正交的多肽-蛋白质反应对时,均发生侧链偶联环化,需要原位酶切,所形成的复合物L1和L2会存在于最终的索烃结构中,因此,除了将目标蛋白POI1和POI2分别插入两个环内,形成异质索烃cat-L1(X-POI1)-L2(X-POI2)外,进一步在多肽-蛋白质反应对的N端和C端融合上目标蛋白(POI3、POI4、POI5、POI6)可以构建支化异质索烃,目标蛋白插入的位置如下:POI3-L1-1-X-POI1-L1-2-POI4-(TVMV)-POI5-L2-1-X-POI2-L2-2-POI6。
②当L1-1/L1-2与L2-1/L2-2为多肽-蛋白质反应对与断裂内含肽组合时,由于断裂内含肽形成的复合物会自剪接离去,若L1-1/L1-2为多肽-蛋白质反应对,L2-1/L2-2为断裂内含肽,将目标蛋白POI1和POI2分别插入两个环内,形成的异质索烃为cat-L1(X-POI1)-(X-POI2),进一步在L1-1/L1-2多肽-蛋白质反应对的N端和C端融合上目标蛋白(POI3、POI4)可以构建支化异质索烃,目标蛋白插入的位置如下:POI3-L1-1-X-POI1-L1-2-POI4-(TVMV)-L2-1-X-POI2-L2-2;反之,若L1-1/L1-2为断裂内含肽,L2-1/L2-2为多肽-蛋白质反应对,将形成异质索烃cat-(X-POI1)-L2(X-POI2),进一步在L2-1/L2-2多肽-蛋白质反应对的N端和C端融合上目标蛋白(POI3、POI4)可以构建支化异质索烃,目标蛋白插入的位置如下:L1-1-X-POI1-L1-2-(TVMV)-POI3-L2-1-X-POI2-L2-2-POI4。
③当L1-1/L1-2与L2-1/L2-2为正交断裂内含肽时,由于断裂内含肽形成的复合物会自剪接离去并介导主链环化,将目标蛋白POI1和POI2分别插入两个环内,形成的异质索烃为cat-(X-POI1)-(X-POI2),其所含有的两个环状蛋白质基元均实现了主链环化,且不含有缠结基元和目标蛋白以外的其他冗余组分。
本发明进行蛋白质异质索烃生物合成的策略重点考虑了以下方面:(1)利用p53dim结构域等缠结基元(X)实现机械互锁,通过将分子间二聚转为分子内二聚提高异质索烃的产率;(2)选择可以在胞内发生的环化方式,目前应用较多的是蛋白质-多肽反应对和断裂内含肽;(3)两种环化方式之间具有一定的正交性,避免过多的副反应,例如将谍标签-谍捕手反应对和断裂内含肽结合使用,或者选择两种具有一定正交性的断裂内含肽;(4)断裂内含肽通常包括尺寸较大的N端部分(IntN)和尺寸相对较小的C端部分(IntC),当IntC位于链中导致反应受阻时,可以通过共表达蛋白酶对新生多肽链进行原位酶切,从而引发该断裂内含肽介导的反式剪接反应。
本发明涉及的断裂内含肽优选为NpuDnaE断裂内含肽,其天然断裂方式是分成含有36个氨基酸的IntC1和含有102个氨基酸的IntN1。通过系统性地截短IntC部分得到的含有15个氨基酸的IntC2和相应的含有123个氨基酸的IntN2,同样具有很好的反式剪接效率。尽管IntC1与IntN2存在一定的反应性,但是IntC2无法和IntN1发生反应,体现出一定的正交性。
本发明中蛋白质异质索烃的生物合成体系均是利用p53dim结构域等缠结基元的分子内二聚导向多肽链的缠结,但是实现正交偶联的方式有所不同。基于多肽-蛋白质反应对的胞内环化反应是一个具有完整N-/C-末端的侧链偶联反应,同时其所形成的复合物会存在于最终结构中,因而可以通过进一步融合其他目标蛋白制备支化蛋白质异质索烃。与之不同的是,基于断裂内含肽的胞内环化反应,可以将肽链的两端以天然肽键相连实现主链环化,同时断裂内含肽会通过自剪接的方式从前体蛋白质中释放出来。
本发明提供的蛋白质异质索烃的生物合成方法主要包括:
1)设计蛋白质异质索烃的蛋白质前体序列,其基本结构由N端到C端包括:L1-1-X-L1-2-(原位酶切位点)-L2-1-X-L2-2,其中,X代表形成二聚体的缠结基元;L1-1/L1-2、L2-1/L2-2代表在胞内发生正交偶联反应的两对环化基元,这两对环化基元可以为两种正交的多肽-蛋白质反应对,或者多肽-蛋白质反应对和断裂内含肽组合,或者两种正交的断裂内含肽;当L1-1/L1-2为多肽-蛋白质反应对时,在L1-2与L2-1之间插入的原位酶切位点为必要元件,通过在胞内共表达蛋白酶对该位点进行原位酶切,否则所述原位酶切位点为非必要元件;在上述基本结构中插入目标蛋白序列,插入位点选自:X结构域前和/或X结构域后、多肽-蛋白质反应对的N端和/或C端;
2)构建步骤1)所述蛋白质前体序列对应的编码基因序列,并引入表达载体中;
3)将步骤2)构建的表达载体转入细胞中进行表达,必要时在细胞内共表达切割所述原位酶切位点的蛋白酶;
4)对步骤3)获得的融合蛋白进行纯化,得到相应的蛋白质异质索烃。
上述步骤1)中,所述多肽-蛋白质反应对优选为谍标签-谍捕手反应对、探标签-探捕手反应对,典型的谍标签(SpyTag)和谍捕手(SpyCatcher)的氨基酸序列分别如序列表中SEQ ID NO:1和SEQ ID NO:2所示,也可以应用具有反应性的SpyTag/SpyCatcher突变体。所述突变体是指在SpyTag/SpyCatcher的上述氨基酸序列基础上经过氨基酸残基的取代、缺失或添加而衍生的肽链,所述取代、缺失或添加的氨基酸残基不会对其生成异肽键的偶联反应产生影响。
上述步骤1)中,缠结基元X优选为肿瘤抑制因子衍生的p53dim结构域,典型的p53dim结构域的氨基酸序列如序列表中SEQ ID NO:3所示,也可以应用能够形成类似二聚结构的p53dim突变体。所述突变体是指在p53dim的上述氨基酸序列基础上经过氨基酸残基的取代、缺失或添加而衍生的肽链,所述取代、缺失或添加的氨基酸残基不会对其缠结二聚体的生成产生影响。
上述步骤1)中,所述断裂内含肽优选NpuDnaE断裂内含肽的N端部分(IntN)和C端部分(IntC)构成环化基元,其两种断裂方式所产生的IntC1、IntN1、IntC2和IntN2的氨基酸序列分别如序列表中SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6和SEQ ID NO:7所示。除此之外,其他满足条件的断裂内含肽也可以应用于本发明以实现蛋白质异质索烃的生物合成。
上述步骤1)中,所述原位酶切位点优选为烟草脉斑驳病毒(Tobacco veinmottling virus,TVMV)蛋白酶的识别序列ETVRFQG。
上述步骤1)中,为了对所合成的蛋白质异质索烃进行拓扑结构的证明,可以在第一个缠结基元X之前引入烟草蚀斑病毒(Tobacco etch virus,TEV)蛋白酶的识别序列ENLYFQG,该序列也可以用作所述的原位酶切位点。进一步的,为了便于纯化,在第二个缠结基元X之前引入了组氨酸标签序列,在步骤4)通过镍柱亲和层析进行蛋白纯化。
上述步骤3)中,对于L1-1/L1-2为多肽-蛋白质反应对的情况,必须与原位酶切位点的蛋白酶进行共表达才能实现蛋白质异质索烃的生物合成;而对于L1-1/L1-2为断裂内含肽的情况,不需要共表达所述蛋白酶。
上述步骤4)中,对于引入组氨酸标签序列的蛋白质异质索烃,通过镍柱亲和层析对所表达的蛋白质进行纯化,可以结合梯度洗脱或尺寸排阻色谱进一步提高蛋白质异质索烃的纯度。
在本发明的实施例中,如图2所示,设计了下述蛋白质前体序列:
SpyCatcher(B)-p53dim(X)-SpyTag(A)-IntC1-p53dim(X)-IntN1,简记为BXA-IntC1-X-IntN1;
IntC1-p53dim(X)-POI1-IntN1-IntC2-p53dim(X)-POI2-IntN2,简记为IntC1-X-POI1-IntN1-IntC2-X-POI2-IntN2。
将上述编码基因引入表达载体pMCSG19中,再将表达载体转入BL21(DE3)感受态细胞进行表达。对于需要共表达蛋白酶的体系BXA-IntC1-X-IntN1,BL21(DE3)感受态细胞中则还含有可以编码TVMV蛋白酶的pRK1037质粒;而IntC1-X-POI1-IntN1-IntC2-X-POI2-IntN2在单独表达或与TVMV酶共表达的情况下,均可以实现蛋白质异质索烃的生物合成,二者没有明显差异,因此将其表达载体转入常规BL21(DE3)感受态细胞进行表达即可。最后对获得的融合蛋白质进行纯化,即可得到相应的蛋白质异质索烃。
由BXA-IntC1-X-IntN1或IntC1-XPOI1-IntN1-IntC2-XPOI2-IntN2重组质粒表达得到的蛋白质前体,首先通过p53dim结构域的二聚形成分子内缠结的结构,再通过两种正交的偶联方式实现定点环化。在BXA-IntC1-X-IntN1的体系中,必须要通过与TVMV酶进行共表达来实现原位酶切,从而引发IntC1/IntN1介导的反式剪接反应,再结合谍标签-谍捕手反应对介导的侧链环化反应,最终实现蛋白质异质索烃cat-BXA-X的制备。在IntC1-X-POI1-IntN1-IntC2-X-POI2-IntN2的体系中,两对断裂内含肽可以顺序发生反式剪接反应,依次介导两种目的蛋白的环化,最终实现蛋白质异质索烃cat-XPOI1-XPOI2的制备。
在BXA-IntC1-X-IntN1的基础上,通过在SpyCatcher的N端和SpyTag的C端引入其他折叠蛋白质,例如对HER2具有高亲和力的亲和体AffiHER2,可以基于同样的共表达方式实现支化蛋白质异质索烃的生物合成。在IntC1-XPOI1-IntN1-IntC2-XPOI2-IntN2的体系中,选择小泛素修饰蛋白SUMO和超折叠蛋白质GFP作为模型蛋白质,分别实现了蛋白质异质索烃cat-XSUMO-X和cat-XSUMO-XGFP的生物合成。
下面通过一些具体的例子说明蛋白质异质索烃生物合成过程中蛋白质前体的序列:
(a)SpyCatcher(B)-p53dim(X)-SpyTag(A)-IntC1-p53dim(X)-IntN1(BXA-IntC1-X-IntN1):从N端到C端分别为反应基元SpyCatcher、缠结基元p53dim结构域、反应基元SpyTag、断裂内含肽C端部分IntC1、缠结基元p53dim结构域和断裂内含肽N端部分IntN1,其中SpyCatcher和第一个p53dim结构域之间插入了TEV蛋白酶的识别序列,SpyTag和IntC1之间插入了TVMV蛋白酶的识别序列,并在第二个p53dim结构域之前引入了组氨酸标签序列。BXA-IntC1-X-IntN1对应的基因序列如列表中SEQ ID No:8所示,其中第8-122位氨基酸残基为SpyCatcher,第132-138位氨基酸残基为TEV蛋白酶的识别序列,第186-198位氨基酸残基为SpyTag,第143-180位和第274-311位氨基酸残基为p53dim结构域,第205-211位氨基酸残基为TVMV蛋白酶的识别序列,第221-255位氨基酸残基为IntC1,第261-266位氨基酸残基为6×His标签,第319-420位氨基酸残基为IntN1。
(b)AffiHER2-SpyCatcher(B)-p53dim(X)-SpyTag(A)-AffiHER2-IntC1-p53dim(X)-IntN1(AffiHER2-BXA-AffiHER2-IntC1-X-IntN1):从N端到C端分别为目的蛋白AffiHER2、反应基元SpyCatcher、缠结基元p53dim结构域、反应基元SpyTag、目的蛋白AffiHER2、断裂内含肽C端部分IntC1、缠结基元p53dim结构域和断裂内含肽N端部分IntN1,其中SpyCatcher和第一个p53dim结构域之间插入了TEV蛋白酶的识别序列,第二个AffiHER2和IntC1之间插入了TVMV蛋白酶的识别序列,并在第二个p53dim结构域之前引入了组氨酸标签序列。AffiHER2-BXA-AffiHER2-IntC1-X-IntN1对应的基因序列如列表中SEQID No:9所示,其中第6-75位和第279-348位氨基酸残基为AffiHER2,第82-196位氨基酸残基为SpyCatcher,第206-212位氨基酸残基为TEV蛋白酶的识别序列,第260-272位氨基酸残基为SpyTag,第217-254位和第424-461位氨基酸残基为p53dim结构域,第355-361位氨基酸残基为TVMV蛋白酶的识别序列,第371-405位氨基酸残基为IntC1,第411-416位氨基酸残基为6×His标签,第469-570位氨基酸残基为IntN1。
(c)IntC1-p53dim-SUMO-IntN1-IntC2-p53dim-IntN2(IntC1-X-SUMO-IntN1-IntC2-X-IntN2):从N端到C端分别为断裂内含肽C端部分IntC1、缠结基元p53dim结构域、目的蛋白SUMO、断裂内含肽N端部分IntN1、断裂内含肽C端部分IntC2、缠结基元p53dim结构域和断裂内含肽N端部分IntN2,其中IntC1和第一个p53dim结构域之间插入了TEV蛋白酶的识别序列,IntN1和IntC2之间插入了TVMV蛋白酶的识别序列,并在第二个p53dim结构域之前引入了组氨酸标签序列。IntC1-XSUMO-IntN1-IntC2-X-IntN2对应的基因序列如列表中SEQID No:10所示,其中第8-42位氨基酸残基为IntC1,第48-54位氨基酸残基为TEV蛋白酶的识别序列,第62-99位和第358-395位氨基酸残基为p53dim结构域,第100-195位氨基酸残基为目标蛋白质SUMO,第203-304位氨基酸残基为IntN1,第311-317位氨基酸残基为TVMV蛋白酶的识别序列,第345-350位氨基酸残基为6×His,第326-339位氨基酸残基为IntC2,第403-504位氨基酸残基为IntN2。
(d)IntC1-p53dim-SUMO-IntN1-IntC2-p53dim-GFP-IntN2(IntC1-X-SUMO-IntN1-IntC2-X-GFP-IntN2):从N端到C端分别为断裂内含肽C端部分IntC1、缠结基元p53dim结构域、目的蛋白质SUMO、断裂内含肽N端部分IntN1、断裂内含肽C端部分IntC2、缠结基元p53dim结构域、目的蛋白质GFP和断裂内含肽N端部分IntN2,其中IntC1和第一个p53dim结构域之间插入了TEV蛋白酶的识别序列,IntN1和IntC2之间插入了TVMV蛋白酶的识别序列,第二个p53dim结构域之前引入了组氨酸标签序列。IntC1-XSUMO-IntN1-IntC2-XGFP-IntN2对应的基因序列如列表中SEQ ID No:11所示,其中第8-42位氨基酸残基为IntC1,第48-54位氨基酸残基为TEV蛋白酶的识别序列,第62-99位和第358-395位氨基酸残基为p53dim结构域,第100-195位氨基酸残基为目标蛋白质SUMO,第203-304位氨基酸残基为IntN1,第311-317位氨基酸残基为TVMV蛋白酶的识别序列,第345-350位氨基酸残基为6×His,第326-339位氨基酸残基为IntC2,第403-640位氨基酸残基为目标蛋白质GFP,第643-765位氨基酸残基为IntN2。
本发明利用常规表征手段,如十二烷基磺酸钠-聚丙烯酰氨凝胶电泳(SDS-PAGE)、超高效液相色谱-质谱(LC-MS)以及TEV酶解反应对所制备的蛋白质异质索烃进行基本表征以及拓扑结构证明。
本发明基于合理的基因序列设计,结合原位组装、酶切和定点环化,发展了基于正交偶联的生物合成体系,适用于胞内合成多种功能蛋白质的异质索烃,其主要优势在于:1)通过基因编码的方式可以实现异质索烃的模块化合成,利用p53dim结构域等二聚缠结基元的分子内二聚提高蛋白质异质索烃的产量,相应的缠结基元和偶联手段有多种选择;2)模拟天然拓扑蛋白质合成中的多步翻译后修饰过程,直接在胞内完成多肽链缠结和两种正交的共价环化反应,不需要额外的胞外反应,表达纯化后即可得到相应的蛋白质异质索烃。3)在含多肽-蛋白质反应对的构建中,如BXA-IntC1-X-IntN1,通过在SpyCatcher的N端和SpyTag的C端引入其他折叠蛋白质,可以实现支化蛋白质异质索烃的生物合成;而在含两种正交断裂内含肽的构建中,如IntC1-X-POI1-IntN1-IntC2-X-POI2-IntN2,则实现了完全主链环化的蛋白质异质索烃的生物合成。两种体系均可以实现对现有蛋白质异质索烃结构的拓展。
Figure BDA0002502624010000081
Figure BDA0002502624010000091
Figure BDA0002502624010000101
附图说明
图1显示了本发明利用不同的正交偶联反应合成的部分蛋白质异质索烃的结构示意图,其中L1-1/L1-2与L2-1/L2-2代表两种正交环化方式的环化基元;当环化基元为多肽-蛋白质反应对时,发生侧链偶联,所形成的复合物分别为L1和L2,会存在于合成的异质索烃中;当环化基元为断裂内含肽时,发生主链偶联,环化后自剪接离去,不存在于合成的异质索烃中。
图2显示了本发明中两种代表性的利用正交偶联反应实现蛋白质异质索烃合成的示意图,其中:(a)由原位酶切、SpyTag-SpyCatcher反应对和断裂内含肽IntC1/IntN1介导蛋白质异质索烃的生物合成;(b)由两种正交断裂内含肽IntC1/IntN1和IntC2/IntN2介导蛋白质异质索烃的生物合成。
图3显示了实施例合成的蛋白质异质索烃cat-BXA-X的尺寸排阻色谱(a),TEV酶切前后的SDS-PAGE表征结果(b)以及cat-BXA-X的质谱(c)。
图4显示了实施例合成的蛋白质异质索烃cat-(AffiHER2-BXA-AffiHER2)-X的尺寸排阻色谱(a),TEV酶切前后的SDS-PAGE表征结果(b)以及cat-(AffiHER2-BXA-AffiHER2)-X的质谱(c)。
图5显示了实施例合成的蛋白质异质索烃cat-XSUMO-X的尺寸排阻色谱(a),TEV酶切前后的SDS-PAGE表征结果(b)以及cat-XSUMO-X的质谱(c)。
图6显示了实施例合成的蛋白质异质索烃cat-XSUMO-XGFP的尺寸排阻色谱(a),TEV酶切前后的SDS-PAGE表征结果(b),cat-XSUMO-XGFP的质谱(c)。
图7显示了实施例合成的蛋白质异质索烃cat-BXA-X的TEV酶切产物l-BXA(a)和c-X(b)的质谱,cat-(AffiHER2-BXA-AffiHER2)-X的TEV酶切产物l-AffiHER2-BXA-AffiHER2(c)和c-X(d)的质谱以及cat-XSUMO-X的TEV酶切产物l-XSUMO(e)和c-X(f)的质谱。
具体实施方式
下面通过实施例进一步对本发明进行详细说明,但不以任何方式限制本发明的范围。
构建蛋白质异质索烃生物合成过程中蛋白质前体及其相应表达体系的具体步骤:
1)对于SpyTag-SpyCatcher反应对和断裂内含肽IntC1/IntN1共同介导蛋白质异质索烃合成的体系,利用重组基因工程技术构建含有6×His标签(用于蛋白质纯化)、SpyTag和SpyCatcher反应对、p53dim结构域、断裂内含肽IntC1/IntN1的基因序列,即SpyCatcher(B)-p53dim(X)-SpyTag(A)-IntC1-p53dim(X)-IntN1(BXA-IntC1-X-IntN1)。在该基因序列的基础上,进一步在SpyCatcher的N端和SpyTag的C端分别引入折叠蛋白质AffiHER2,构建AffiHER2-SpyCatcher(B)-p53dim(X)-SpyTag(A)-AffiHER2-IntC1-p53dim(X)-IntN1(AffiHER2-BXA-AffiHER2-IntC1-X-IntN1)的基因序列。将这两种基因序列分别插入表达载体pMSCG19中,转入含有pRK1037质粒的BL21(DE3)感受态细胞进行表达,其中pRK1037质粒可以编码TVMV蛋白酶。在表达过程中,通过原位组装、酶切和定点环化,实现蛋白质异质索烃cat-BXA-X和cat-(AffiHER2-BXA-AffiHER2)-X的生物合成。
2)对于正交断裂内含肽介导蛋白质异质索烃合成的体系,利用重组基因工程技术构建含有6×His标签(用于蛋白质纯化)、p53dim结构域、断裂内含肽IntC1/IntN1、断裂内含肽IntC2/IntN2和目的蛋白SUMO/GFP的基因序列,即IntC1-p53dim-SUMO-IntN1-IntC2-p53dim-IntN2(IntC1-X-SUMO-IntN1-IntC2-X-IntN2),或者IntC1-p53dim-SUMO-IntN1-IntC2-p53dim-GFP-IntN2(IntC1-X-SUMO-IntN1-IntC2-X-GFP-IntN2)。将这两种基因序列分别插入表达载体pMSCG19中,转入BL21(DE3)感受态细胞进行表达。在表达过程中,通过原位组装和正交断裂内含肽介导的环化反应,实现蛋白质异质索烃cat-XSUMO-X和cat-XSUMO-XGFP的生物合成。
利用十二烷基磺酸钠-聚丙烯酰氨凝胶电泳(SDS-PAGE)、超高效液相色谱-质谱(LC-MS)以及TEV酶解反应对所制备的蛋白质异质索烃进行基本表征以及拓扑结构证明。
实施例1:利用pMCSG19/pRK1037的共表达体系实现蛋白质异质索烃cat-BXA-X和cat-(AffiHER2-BXA-AffiHER2)-X的生物合成
将BXA-IntC1-X-IntN1和AffiHER2-BXA-AffiHER2-IntC1-X-IntN1的基因片段分别插入表达载体pMCSG19中,其序列分别如列表中SEQ ID No:8和SEQ ID No:9所示。所得构建经测序确认后,转入含有pRK1037质粒的BL21(DE3)感受态细胞中,利用含有100μg/mL氨苄青霉素钠和50μg/mL卡那霉素的双抗性平板在37℃进行过夜培养。随后挑出单克隆菌落,接种至5mL含有相同抗性的2×YT培养基中,在37℃震荡培养10-12小时制备种子菌液。将该种子菌液按1:100比例接种到250mL含有相同抗性的2×YT培养基中,在37℃震荡培养至OD600在0.5-0.7之间,加入异丙基-β-D-硫代吡喃半乳糖苷(IPTG)至终浓度为0.25mM,转至16℃表达20小时。
实施例2:蛋白质异质索烃cat-XSUMO-X和cat-XSUMO-XGFP的生物合成
将IntC1-X-SUMO-IntN1-IntC2-X-IntN2和IntC1-X-SUMO-IntN1-IntC2-X-GFP-IntN2的基因片段分别插入表达载体pMCSG19中,其序列分别如列表中SEQ ID No:10和SEQID No:11所示。所得构建经测序确认后,转入BL21(DE3)感受态细胞中,利用含有100μg/mL氨苄青霉素钠的平板在37℃进行过夜培养。随后挑出单克隆菌落,接种至5mL含有相同抗性的2×YT培养基中,在37℃震荡培养10-12小时制备种子菌液。将该种子菌液按1:100比例接种到250mL含有相同抗性的2×YT培养基中,在37℃震荡培养至OD600在0.5-0.7之间,加入异丙基-β-D-硫代吡喃半乳糖苷(IPTG)至终浓度为0.5mM,转至16℃表达20小时。
实施例3:蛋白质异质索烃的纯化
蛋白质表达结束后,用高速冷冻离心机离心收集菌体(5500g×15min),弃去上清液。将菌体用裂解缓冲液A(50mM磷酸二氢钠,300mM氯化钠,10mM咪唑,pH 8.0)重悬。重悬液在冰水浴条件下用超声波细胞破碎仪超声破碎(工作5秒,间隔5秒,强度30%),随后离心收集上清液(12000g×30min)。取上清液与Ni-NTA树脂混合均匀并在4℃孵育1h。将该混合液倒入纯化用PD-10重力空柱中,待裂解液流尽后,用5-10倍树脂体积的洗涤缓冲液B(50mM磷酸二氢钠,300mM氯化钠,20mM咪唑,pH 8.0)冲洗树脂以减少非特异性吸附。对于蛋白质异质索烃cat-BXA-X、cat-(AffiHER2-BXA-AffiHER2)-X和cat-XSUMO-X,可以直接用洗脱缓冲液C(50mM磷酸二氢钠,300mM氯化钠,250mM咪唑,pH 8.0)进行洗脱。对于蛋白质异质索烃cat-XSUMO-XGFP,为了提高其纯度,采取梯度洗脱的方式,首先用洗脱缓冲液D(50mM磷酸二氢钠,300mM氯化钠,50mM咪唑,pH 8.0)进行洗脱~10个树脂体积,收集的蛋白质洗脱液基本为异质索烃,再用洗脱缓冲液C洗脱GFP的环状或索烃副产物。
蛋白质洗脱液利用快速纯化液相色谱系统(
Figure BDA0002502624010000131
pure,GE Healthcare)和尺寸排阻色谱柱(Superdex 200 increase 10/300GL,GE Healthcare)进行进一步纯化,流动相为经过0.22μm滤膜过滤的磷酸盐缓冲液PBS(pH 7.4),流速为0.5mL/min,通过280nm的紫外吸收监测蛋白质的流出峰,收集样品进行表征。
实施例4:蛋白质异质索烃的表征
对于实施例3中纯化得到的蛋白质异质索烃,首先加入5×SDS上样缓冲液,并于98℃加热10min,然后进行SDS-PAGE表征。将SEC纯化后的蛋白质样品用超滤管置换至ddH2O中后,利用LC-MS对其分子量进行表征。通过超微量分光光度计(NanoPhotometer P330,Implen,Inc.)测定蛋白质的浓度。为了进行异质索烃的拓扑结构证明,将蛋白质溶液(10μM)与10μM TEV蛋白酶以20:1的摩尔比混合,在37℃条件下进行酶切(1、3、6小时,3小时基本可以酶切完全)。酶切结束后,取10μL加入5×SDS上样缓冲液,并于98℃条件下加热10min终止反应,利用SDS-PAGE表征酶切之后的产物组成。利用超滤管将剩余的酶切体系置换至ddH2O中后,利用LC-MS进行分子量确认。cat-BXA-X、cat-(AffiHER2-BXA-AffiHER2)-X、cat-XSUMO-X和cat-XSUMO-XGFP经镍柱亲和纯化后的SEC表征,酶切前后的SDS-PAGE表征以及LC-MS表征结果分别如图3、4、5和6所示。cat-BXA-X、cat-(AffiHER2-BXA-AffiHER2)-X和cat-XSUMO-X经TEV酶切后酶切产物的LC-MS表征如图7所示。
SEQUENCE LISTING
<110> 北京大学
<120> 一种蛋白质异质索烃的生物合成方法
<130> WX2020-03-059
<160> 11
<170> PatentIn version 3.5
<210> 1
<211> 13
<212> PRT
<213> 人工序列
<400> 1
Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10
<210> 2
<211> 115
<212> PRT
<213> 人工序列
<400> 2
Ala Met Val Asp Thr Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser
1 5 10 15
Gly Asp Met Thr Ile Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser
20 25 30
Lys Arg Asp Glu Asp Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu
35 40 45
Arg Asp Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln
50 55 60
Val Lys Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr
65 70 75 80
Ala Ala Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val
85 90 95
Asn Glu Gln Gly Gln Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp
100 105 110
Ala His Ile
115
<210> 3
<211> 38
<212> PRT
<213> 人工序列
<400> 3
Gly Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe Glu
1 5 10 15
Glu Phe Arg Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln Ala
20 25 30
Gly Lys Glu Pro Gly Gly
35
<210> 4
<211> 35
<212> PRT
<213> 人工序列
<400> 4
Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp
1 5 10 15
Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile
20 25 30
Ala Ser Asn
35
<210> 5
<211> 102
<212> PRT
<213> 人工序列
<400> 5
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn
100
<210> 6
<211> 14
<212> PRT
<213> 人工序列
<400> 6
Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn
1 5 10
<210> 7
<211> 123
<212> PRT
<213> 人工序列
<400> 7
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly
100 105 110
Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg
115 120
<210> 8
<211> 420
<212> PRT
<213> 人工序列
<400> 8
Met Lys Gly Ser Ser Ala Ser Ala Met Val Asp Thr Leu Ser Gly Leu
1 5 10 15
Ser Ser Glu Gln Gly Gln Ser Gly Asp Met Thr Ile Glu Glu Asp Ser
20 25 30
Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp Gly Lys Glu Leu
35 40 45
Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly Lys Thr Ile Ser
50 55 60
Thr Trp Ile Ser Asp Gly Gln Val Lys Asp Phe Tyr Leu Tyr Pro Gly
65 70 75 80
Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly Tyr Glu Val Ala
85 90 95
Thr Ala Ile Thr Phe Thr Val Asn Glu Gln Gly Gln Val Thr Val Asn
100 105 110
Gly Lys Ala Thr Lys Gly Asp Ala His Ile Asp Gly Pro Gln Gly Ile
115 120 125
Trp Gly Gln Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly Ser Gly Gly
130 135 140
Glu Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe Glu Glu Phe
145 150 155 160
Arg Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln Ala Gly Lys
165 170 175
Glu Pro Gly Gly Ser Gly Gly Ser Gly Ala His Ile Val Met Val Asp
180 185 190
Ala Tyr Lys Pro Thr Lys Val Asp Ser Gly Ser Gly Glu Thr Val Arg
195 200 205
Phe Gln Gly Gly Gly Ser Gly Gly Ser Ser Gly Met Ile Lys Ile Ala
210 215 220
Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu
225 230 235 240
Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn Cys
245 250 255
Phe Asn Gly Gly His His His His His His Glu Leu Ser Gly Ser Gly
260 265 270
Ser Gly Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe
275 280 285
Glu Glu Phe Arg Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln
290 295 300
Ala Gly Lys Glu Pro Gly Gly Ser Gly Gly Ser Gly Thr Ser Cys Leu
305 310 315 320
Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu Pro Ile
325 330 335
Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser Val Asp
340 345 350
Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His Asp Arg
355 360 365
Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser Leu Ile
370 375 380
Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln Met Leu
385 390 395 400
Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg Val Asp
405 410 415
Asn Leu Pro Asn
420
<210> 9
<211> 570
<212> PRT
<213> 人工序列
<400> 9
Met Lys Gly Ser Ser Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Gly
1 5 10 15
Val Asp Asn Lys Phe Asn Lys Glu Met Arg Asn Ala Tyr Trp Glu Ile
20 25 30
Ala Leu Leu Pro Asn Leu Asn Asn Gln Gln Lys Arg Ala Phe Ile Arg
35 40 45
Ser Leu Tyr Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala
50 55 60
Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys Gly Gly Gly Gly Ser Ala
65 70 75 80
Ser Ala Met Val Asp Thr Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln
85 90 95
Ser Gly Asp Met Thr Ile Glu Glu Asp Ser Ala Thr His Ile Lys Phe
100 105 110
Ser Lys Arg Asp Glu Asp Gly Lys Glu Leu Ala Gly Ala Thr Met Glu
115 120 125
Leu Arg Asp Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly
130 135 140
Gln Val Lys Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu
145 150 155 160
Thr Ala Ala Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr
165 170 175
Val Asn Glu Gln Gly Gln Val Thr Val Asn Gly Lys Ala Thr Lys Gly
180 185 190
Asp Ala His Ile Asp Gly Pro Gln Gly Ile Trp Gly Gln Glu Asn Leu
195 200 205
Tyr Phe Gln Gly Gly Ser Gly Ser Gly Gly Glu Tyr Phe Thr Leu Gln
210 215 220
Ile Arg Gly Arg Glu Arg Phe Glu Glu Phe Arg Glu Lys Asn Glu Ala
225 230 235 240
Leu Glu Leu Lys Asp Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Gly
245 250 255
Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
260 265 270
Gly Thr Gly Gly Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro
275 280 285
Gly Val Asp Asn Lys Phe Asn Lys Glu Met Arg Asn Ala Tyr Trp Glu
290 295 300
Ile Ala Leu Leu Pro Asn Leu Asn Asn Gln Gln Lys Arg Ala Phe Ile
305 310 315 320
Arg Ser Leu Tyr Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu
325 330 335
Ala Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys Gly Val Asp Ser Gly
340 345 350
Ser Gly Glu Thr Val Arg Phe Gln Gly Gly Gly Ser Gly Gly Ser Ser
355 360 365
Gly Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val
370 375 380
Tyr Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly
385 390 395 400
Phe Ile Ala Ser Asn Cys Phe Asn Gly Gly His His His His His His
405 410 415
Glu Leu Ser Gly Ser Gly Ser Gly Gly Glu Tyr Phe Thr Leu Gln Ile
420 425 430
Arg Gly Arg Glu Arg Phe Glu Glu Phe Arg Glu Lys Asn Glu Ala Leu
435 440 445
Glu Leu Lys Asp Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Gly Gly
450 455 460
Ser Gly Thr Ser Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu
465 470 475 480
Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys
485 490 495
Thr Val Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val
500 505 510
Ala Gln Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu
515 520 525
Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr
530 535 540
Val Asp Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu
545 550 555 560
Asp Leu Met Arg Val Asp Asn Leu Pro Asn
565 570
<210> 10
<211> 525
<212> PRT
<213> 人工序列
<400> 10
Met Lys Gly Ser Ser Ala Ser Ile Lys Ile Ala Thr Arg Lys Tyr Leu
1 5 10 15
Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg Asp His Asn Phe
20 25 30
Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn Cys Phe Asn Gly Gly Glu
35 40 45
Asn Leu Tyr Phe Gln Gly Arg Ser Ser Gly Ser Gly Ser Gly Gly Glu
50 55 60
Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe Glu Glu Phe Arg
65 70 75 80
Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln Ala Gly Lys Glu
85 90 95
Pro Gly Gly Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys
100 105 110
Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly
115 120 125
Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg
130 135 140
Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu
145 150 155 160
Arg Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp Gln Thr Pro Glu
165 170 175
Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln
180 185 190
Ile Gly Gly Ser Gly Gly Ser Gly Gly Thr Cys Leu Ser Tyr Glu Thr
195 200 205
Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val
210 215 220
Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser Val Asp Asn Asn Gly Asn
225 230 235 240
Ile Tyr Thr Gln Pro Val Ala Gln Trp His Asp Arg Gly Glu Gln Glu
245 250 255
Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys
260 265 270
Asp His Lys Phe Met Thr Val Asp Gly Gln Met Leu Pro Ile Asp Glu
275 280 285
Ile Phe Glu Arg Glu Leu Asp Leu Met Arg Val Asp Asn Leu Pro Asn
290 295 300
Val Asp Ser Gly Ser Gly Glu Thr Val Arg Phe Gln Gly Gly Gly Ser
305 310 315 320
Gly Gly Ser Ser Gly Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile
325 330 335
Ala Ser Asn Cys Phe Asn Gly Gly His His His His His His Glu Leu
340 345 350
Ser Gly Ser Gly Ser Gly Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly
355 360 365
Arg Glu Arg Phe Glu Glu Phe Arg Glu Lys Asn Glu Ala Leu Glu Leu
370 375 380
Lys Asp Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Gly Gly Ser Gly
385 390 395 400
Thr Ser Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly
405 410 415
Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val
420 425 430
Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln
435 440 445
Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp
450 455 460
Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp
465 470 475 480
Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu
485 490 495
Met Arg Val Asp Asn Leu Pro Asn Ile Lys Ile Ala Thr Arg Lys Tyr
500 505 510
Leu Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg
515 520 525
<210> 11
<211> 765
<212> PRT
<213> 人工序列
<400> 11
Met Lys Gly Ser Ser Ala Ser Ile Lys Ile Ala Thr Arg Lys Tyr Leu
1 5 10 15
Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg Asp His Asn Phe
20 25 30
Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn Cys Phe Asn Gly Gly Glu
35 40 45
Asn Leu Tyr Phe Gln Gly Arg Ser Ser Gly Ser Gly Ser Gly Gly Glu
50 55 60
Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe Glu Glu Phe Arg
65 70 75 80
Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln Ala Gly Lys Glu
85 90 95
Pro Gly Gly Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys
100 105 110
Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly
115 120 125
Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg
130 135 140
Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu
145 150 155 160
Arg Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp Gln Thr Pro Glu
165 170 175
Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln
180 185 190
Ile Gly Gly Ser Gly Gly Ser Gly Gly Thr Cys Leu Ser Tyr Glu Thr
195 200 205
Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val
210 215 220
Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser Val Asp Asn Asn Gly Asn
225 230 235 240
Ile Tyr Thr Gln Pro Val Ala Gln Trp His Asp Arg Gly Glu Gln Glu
245 250 255
Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys
260 265 270
Asp His Lys Phe Met Thr Val Asp Gly Gln Met Leu Pro Ile Asp Glu
275 280 285
Ile Phe Glu Arg Glu Leu Asp Leu Met Arg Val Asp Asn Leu Pro Asn
290 295 300
Val Asp Ser Gly Ser Gly Glu Thr Val Arg Phe Gln Gly Gly Gly Ser
305 310 315 320
Gly Gly Ser Ser Gly Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile
325 330 335
Ala Ser Asn Cys Phe Asn Gly Gly His His His His His His Glu Leu
340 345 350
Ser Gly Ser Gly Ser Gly Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly
355 360 365
Arg Glu Arg Phe Glu Glu Phe Arg Glu Lys Asn Glu Ala Leu Glu Leu
370 375 380
Lys Asp Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Gly Gly Ser Gly
385 390 395 400
Thr Ser Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile
405 410 415
Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg
420 425 430
Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe
435 440 445
Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr
450 455 460
Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met
465 470 475 480
Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln
485 490 495
Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala
500 505 510
Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys
515 520 525
Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu
530 535 540
Tyr Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys
545 550 555 560
Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly
565 570 575
Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp
580 585 590
Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Val
595 600 605
Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu
610 615 620
Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
625 630 635 640
Thr Ser Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly
645 650 655
Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val
660 665 670
Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln
675 680 685
Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp
690 695 700
Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp
705 710 715 720
Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu
725 730 735
Met Arg Val Asp Asn Leu Pro Asn Ile Lys Ile Ala Thr Arg Lys Tyr
740 745 750
Leu Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg
755 760 765

Claims (10)

1.一种蛋白质异质索烃的生物合成方法,包括以下步骤:
1)设计蛋白质异质索烃的蛋白质前体序列,其基本结构由N端到C端包括:L1-1-X-L1-2-(原位酶切位点)-L2-1-X-L2-2,其中,X代表形成二聚体的缠结基元,可以为同质也可以为异质,即两个X可以相同也可以不同;L1-1/L1-2、L2-1/L2-2代表在胞内发生正交偶联反应的两对环化基元,这两对环化基元可以为两种正交的多肽-蛋白质反应对,或者多肽-蛋白质反应对和断裂内含肽组合,或者两种正交的断裂内含肽;当L1-1/L1-2为多肽-蛋白质反应对时,在L1-2与L2-1之间插入的原位酶切位点为必要元件,通过在胞内共表达蛋白酶对该位点进行原位酶切,否则所述原位酶切位点为非必要元件;在上述基本结构中插入目标蛋白序列,插入位点选自:X结构域前和/或X结构域后、多肽-蛋白质反应对的N端和/或C端;
2)构建步骤1)所述蛋白质前体序列对应的编码基因序列,并引入表达载体中;
3)将步骤2)构建的表达载体转入细胞中进行表达,必要时在细胞内共表达切割所述原位酶切位点的蛋白酶;
4)对步骤3)获得的融合蛋白进行纯化,得到相应的蛋白质异质索烃。
2.如权利要求1所述的方法,其特征在于,步骤1)中所述缠结基元为p53dim结构域或能够形成二聚结构的p53dim突变体,其中p53dim结构域的氨基酸序列如序列表中SEQ IDNO:3所示。
3.如权利要求1所述的方法,其特征在于,步骤1)中所述多肽-蛋白质反应对选自谍标签-谍捕手反应对、探标签-探捕手反应对。
4.如权利要求3所述的方法,其特征在于,所述谍标签-谍捕手反应对中谍标签和谍捕手的氨基酸序列分别如序列表中SEQ ID NO:1和SEQ ID NO:2所示。
5.如权利要求1所述的方法,其特征在于,步骤1)中所述断裂内含肽为NpuDnaE断裂内含肽,由IntC1和IntN1组成环化基元,或者由IntC2和IntN2组成环化基元,IntC1、IntN1、IntC2和IntN2的氨基酸序列分别如序列表中SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6和SEQ ID NO:7所示。
6.如权利要求1所述的方法,其特征在于,步骤1)中设计的原位酶切位点是TVMV蛋白酶的识别序列ETVRFQG,或者是TEV蛋白酶的识别序列ENLYFQG;相应的在步骤3)中共表达TVMV蛋白酶或TEV蛋白酶。
7.如权利要求1所述的方法,其特征在于,步骤1)在第二个缠结基元X之前引入了组氨酸标签序列,在步骤4)通过镍柱亲和层析进行蛋白纯化。
8.如权利要求1所述的方法,其特征在于,步骤1)设计的蛋白质前体序列基本结构为SpyCatcher-p53dim-SpyTag-IntC1-p53dim-IntN1,从N端到C端依次是环化反应基元谍捕手SpyCatcher、缠结基元p53dim结构域、环化反应基元谍标签SpyTag、断裂内含肽C端部分IntC1、缠结基元p53dim结构域和断裂内含肽N端部分IntN1;在SpyTag和IntC1之间插入TVMV蛋白酶的识别序列,并在第二个p53dim结构域之前引入了组氨酸标签序列;一个或多个相同或不同的目标蛋白的融合位点选自:p53dim结构域前和/或p53dim结构域后、SpyCatcher的N端、SpyTag的C端。
9.如权利要求1所述的方法,其特征在于,步骤1)设计的蛋白质前体序列基本结构为IntC1-p53dim-IntN1-IntC2-p53dim-IntN2,从N端到C端依次是断裂内含肽C端部分IntC1、缠结基元p53dim结构域、断裂内含肽N端部分IntN1、断裂内含肽C端部分IntC2、缠结基元p53dim结构域和断裂内含肽N端部分IntN2;在第二个p53dim结构域前引入了组氨酸标签序列;一个或多个相同或不同的目标蛋白插在两个p53dim结构域的前面和/或后面。
10.如权利要求1所述的方法,其特征在于,在步骤4)对于引入组氨酸标签序列的蛋白质异质索烃,通过镍柱亲和层析对所表达的蛋白质进行纯化,并结合梯度洗脱或尺寸排阻色谱进一步提高蛋白质异质索烃的纯度。
CN202010436910.XA 2020-05-21 2020-05-21 一种蛋白质异质索烃的生物合成方法 Active CN111560391B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010436910.XA CN111560391B (zh) 2020-05-21 2020-05-21 一种蛋白质异质索烃的生物合成方法
PCT/CN2021/094589 WO2021233330A1 (zh) 2020-05-21 2021-05-19 一种蛋白质异质索烃的生物合成方法
US17/999,377 US20230348546A1 (en) 2020-05-21 2021-05-19 Method for biosynthesis of protein heterocatenane

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010436910.XA CN111560391B (zh) 2020-05-21 2020-05-21 一种蛋白质异质索烃的生物合成方法

Publications (2)

Publication Number Publication Date
CN111560391A true CN111560391A (zh) 2020-08-21
CN111560391B CN111560391B (zh) 2022-02-11

Family

ID=72072251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010436910.XA Active CN111560391B (zh) 2020-05-21 2020-05-21 一种蛋白质异质索烃的生物合成方法

Country Status (3)

Country Link
US (1) US20230348546A1 (zh)
CN (1) CN111560391B (zh)
WO (1) WO2021233330A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113403291A (zh) * 2021-06-22 2021-09-17 华侨大学 一种醛醇氧化酶二聚体及其制备方法
WO2021233330A1 (zh) * 2020-05-21 2021-11-25 北京大学 一种蛋白质异质索烃的生物合成方法
CN116621947A (zh) * 2023-07-18 2023-08-22 北京智源人工智能研究院 一种基于索烃骨架的拓扑蛋白质、制备方法及应用
CN117003852A (zh) * 2022-07-07 2023-11-07 北京大学 白细胞介素-2的拓扑改造及其作为自身免疫病药物的应用
WO2023229029A1 (ja) * 2022-05-26 2023-11-30 国立大学法人山形大学 ヘテロダイマータンパク質の製造方法、ダイマータンパク質、モノマータンパク質、および標的反応性のヘテロダイマータンパク質のスクリーニング方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114075298B (zh) * 2022-01-07 2022-04-29 广州中科蓝华生物科技有限公司 一种索烃化的var2csa重组蛋白及其制备方法和应用
KR20240072944A (ko) * 2022-11-15 2024-05-24 한양대학교 산학협력단 고리형 단백질의 제조방법 및 이의 응용

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105061581A (zh) * 2015-09-17 2015-11-18 北京大学 可基因编码的全蛋白质索烃的制备方法
CN107921090A (zh) * 2015-04-06 2018-04-17 苏伯多曼有限责任公司 含有从头结合结构域的多肽及其用途
CN110272913A (zh) * 2019-06-12 2019-09-24 北京大学 一种基于索烃化的蛋白质偶联方法
US20200048716A1 (en) * 2017-11-03 2020-02-13 Twister Biotech, Inc Using minivectors to treat ovarian cancer

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111073925B (zh) * 2018-10-19 2022-04-26 北京大学 一种基于无序蛋白偶联酶的高效多肽-多肽偶联系统和方法
CN111560391B (zh) * 2020-05-21 2022-02-11 北京大学 一种蛋白质异质索烃的生物合成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107921090A (zh) * 2015-04-06 2018-04-17 苏伯多曼有限责任公司 含有从头结合结构域的多肽及其用途
CN105061581A (zh) * 2015-09-17 2015-11-18 北京大学 可基因编码的全蛋白质索烃的制备方法
US20200048716A1 (en) * 2017-11-03 2020-02-13 Twister Biotech, Inc Using minivectors to treat ovarian cancer
CN110272913A (zh) * 2019-06-12 2019-09-24 北京大学 一种基于索烃化的蛋白质偶联方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
XIA-LING WU等: "An Intrinsically Disordered Peptide-Peptide Stapler for Highly Efficient Protein Ligation Both in Vivo and in Vitro", 《JOURNAL OF THE AMERICAN CHEMICAL SOCIETY》 *
XIAO-WEI WANG等: "Chemical Topology and Complexity of Protein Architectures", 《TRENDS IN BIOCHEMICAL SCIENCES》 *
YAJIE LIU等: "Cellular Synthesis and Crystal Structure of a Designed Protein Heterocatenane", 《ANGEWANDTE CHEMIE INTERNATIONAL EDITION》 *
YAJIE LIU等: "Lasso Proteins: Modular Design, Cellular Synthesis and Topological Transformation", 《ANGEWANDTE CHEMIE》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021233330A1 (zh) * 2020-05-21 2021-11-25 北京大学 一种蛋白质异质索烃的生物合成方法
CN113403291A (zh) * 2021-06-22 2021-09-17 华侨大学 一种醛醇氧化酶二聚体及其制备方法
WO2023229029A1 (ja) * 2022-05-26 2023-11-30 国立大学法人山形大学 ヘテロダイマータンパク質の製造方法、ダイマータンパク質、モノマータンパク質、および標的反応性のヘテロダイマータンパク質のスクリーニング方法
CN117003852A (zh) * 2022-07-07 2023-11-07 北京大学 白细胞介素-2的拓扑改造及其作为自身免疫病药物的应用
CN116621947A (zh) * 2023-07-18 2023-08-22 北京智源人工智能研究院 一种基于索烃骨架的拓扑蛋白质、制备方法及应用
CN116621947B (zh) * 2023-07-18 2023-11-07 北京智源人工智能研究院 一种基于索烃骨架的拓扑蛋白质、制备方法及应用

Also Published As

Publication number Publication date
WO2021233330A1 (zh) 2021-11-25
US20230348546A1 (en) 2023-11-02
CN111560391B (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
CN111560391B (zh) 一种蛋白质异质索烃的生物合成方法
CA2570990C (en) Expression-enhanced polypeptides
US5910573A (en) Monomeric and dimeric antibody-fragment fusion proteins
Kipriyanov et al. High level production of soluble single chain antibodies in small-scale Escherichia coli cultures
EP0938571B1 (en) Method for the oligomerisation of peptides
CN110272913B (zh) 一种基于索烃化的蛋白质偶联方法
CN107849147B (zh) 基于二泛素突变蛋白的Her2结合蛋白
EP3408292A2 (en) Split inteins with exceptional splicing activity
AU1440392A (en) Serine-rich peptide linkers
JP2006333825A (ja) 標的物質捕捉用タンパク質の製造方法及びその構成材料の選択方法
WO2001057183A3 (en) Method for producing circular or multimeric protein species in vivo or in vitro and related methods
KR102357604B1 (ko) 환상 펩티드를 단백질 구조에 제시시키는 초범용법
AU2020271959B2 (en) Novel PSMA specific binding proteins for cancer diagnosis and treatment
KR20210038580A (ko) 새로운 결합 특이성을 항체에 부여하는 초범용법
CN113045633B (zh) 蛋白质异质缠结基元的设计与复杂索烃结构的制备方法
KR102140557B1 (ko) 단백질-단백질 결합체를 형성 매개 펩타이드 및 이를 이용한 단백질-단백질 결합체 형성 방법
Pasupuleti et al. Genetic code expansion in E. coli enables production of a functional ‘ready-to-click’T cell receptor-specific scFv
CN111073925B (zh) 一种基于无序蛋白偶联酶的高效多肽-多肽偶联系统和方法
US5912322A (en) Modified pseudomonas exotoxin PE40
CN118146334A (zh) 单结构域荧光蛋白索烃及其构建和在制备融合蛋白索烃中的应用
WO2017142388A2 (es) Composición farmacéutica de proteínas híbridas recombinantes capaces de generar anticuerpos neutralzantes en contra del veneno de alacranes
JP5686360B2 (ja) タンパク質集積体及びその利用
KR20230102453A (ko) 폴리 glp1 변이체의 컨쥬게이트
Stankiewicz Protein semi-synthesis in vivo
EP3325514A1 (en) Her2 binding proteins based on di-ubiquitin muteins

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant