CN101646771A

CN101646771A - 环肽结构的稳定

Info

Publication number: CN101646771A
Application number: CN200880007136A
Authority: CN
Inventors: 罗纳德·C·格耶尔
Original assignee: University of Saskatchewan
Current assignee: University of Saskatchewan; Saskatchewan University of Technologies Inc
Priority date: 2007-01-10
Filing date: 2008-01-10
Publication date: 2010-02-10
Also published as: US20130273553A9; US20100129807A1; EP2106446A4; EP2106446A1; CA2675024A1; WO2008083493A8; WO2008083493A1

Abstract

在多个方面，本发明提供了环化蛋白的方法，包括增强环化蛋白在胞质条件下的稳定性的方法。本发明还提供了多种利用环化蛋白的方法。例如，本发明的环化蛋白可用在类似于酵母双杂交测定法的筛选测定法中。本发明所选的实施方案提供环化的单链可变片段(ScFv)分子，包括免疫球蛋白折叠形式的分子。

Description

环肽结构的稳定

背景

功能基因组分析方面的进步提供了增强我们评估蛋白治疗前景的能力的数据集。但是，单独的功能基因组数据在任何单一蛋白对疾病或过程的贡献方面生成相对低质量的信息。为了获得蛋白的治疗前景的更可靠结论，有必要为功能基因组数据补充直接实验。进行直接实验方面主要的瓶颈为缺乏用于逆向分析蛋白功能的高通量技术。在逆向分析中，研究者以假定与疾病或过程有关的基因开始，并采用直接实验来证实这种相关性。生物体中，直接实验一直是依赖于使基因失活的遗传学方法，其或者通过删除基因，或者通过制造基因中的功能缺失突变。尽管遗传学方法提供大量信息，但是它们通常难于大规模和在多种生物体中进行。

已经开发出了诸如小分子、反义RNA、核酶、RNAi、抗体的反式显性试剂(Trans dominant agent)和显性负性(dominant negative)蛋白，使得能更容易地在双倍体生物体中进行逆向分析(Geyer，CR.& Brent，R.(2000)Methods Enzymol.328：178-208)。这些试剂使基因产物失活而不改变编码它们的遗传物质。除了显性作用模式外，蛋白功能的系统逆向分析要求试剂可针对任何给定靶而容易地和快速地产生、可抑制蛋白相互作用和活性以及可阻断与蛋白的特异相互作用而保持其它相互作用不被干扰。为了证实以小分子药物抑制靶点的治疗前景，也必需以直接抑制靶点而不是阻断靶点转录或翻译中的步骤的试剂进行逆向分析。

可采用酵母双杂交测定法通过从肽适体组合文库中遗传学地选择构象上受限的(conformationally constrained)支架肽(scaffoldedpeptide)(肽适体)而快速得到具有这些特征的细胞内蛋白功能抑制剂(Geyer，CR.& Brent，R.(2000)Methods Enzymol.328：178-208)。受限肽是优选的，因为它们通常比线性肽结合更紧并且更稳定(Davidson，A.R.& Sauer，R.T.(1994)Proc.Natl.Acad.Sci.USA 91：2146-2150)。肽适体组合文库应该原则上含有结合任何靶点的成员。支架蛋白增强溶解性并允许转录激活结构域与肽适体融合，这对于酵母双杂交测定是必需的。肽适体在证实蛋白为治疗性靶点方面是有用的，但是将肽展示在支架表面限制了它们作为药物或先导药物(drug-leads)的用途，因为它们通常不是膜可通透的并且它们容易被蛋白酶降解。支架蛋白的大小也阻碍了通过合成肽化学来合成肽适体并使得解析其结构困难。

可选择地，肽可通过环化而受限，并且有很多天然和合成环肽抑制剂的实例(Horswill，A.R.& Benkovic，S.J.(2005)Cell Cycle4：552-555)。最近，已经开发了采用经工程化的蛋白内含子(intein)表达基因编码的环肽的方法(Scott，CP.et al.(1999)Proc.Natl.Acad.Sci.USA 96：13638-13643)。环肽比肽适体有优势，因为它们抗外切蛋白酶，并且它们的小尺寸使它们适合于化学合成、结构研究和膜转运。已经采用正向和逆向方法筛选了环肽组合文库，来分别分离抑制细胞过程(Kinsella，T.M.et al.(2002)J.Biol.Chem.277：37512-37518，Nilsson，L.O.et al.(2005)Protein Pept.Lett.12：795-799)和破坏蛋白相互作用(Horswill，A.R.et al.(2004)Proc.Natl.Acad.Sci.USA 101：15591-15596)的环肽。

抗体为非环状蛋白，所述非环状蛋白具有被良好表征的结构，其由具有可识别的三级结构的多个结构域构成。抗体分子中的每个结构域都具有类似的结构，即在压缩的反平行β桶中两β片层彼此紧密地叠在一起。这种保守的结构称为免疫球蛋白折叠。这种折叠通常通过每个片层的β链之间的氢键、通过内部相对片层的残基之间的疏水键以及通过片层间的二硫键稳定。可变结构域的折叠具有9个β链，设置为4链和5链的两片层。每个可变区是由通过4个框架区(FR)分开的3个互补决定区(CDR)构成。CDR为可变区的最可变部分，并执行抗原结合功能。已经显示结合抗原的功能也可通过完整抗体的片段进行。结合片段实例为(i)由VL、VH、CL和CH1结构域构成的Fab片段；(ii)由VH和CH1结构域构成的Fd片段；(iii)由抗体的单臂的VL和VH结构域构成的Fv片段；(iv)dAb片段(Ward，E.S.et al.，Nature341，544-546(1989)，其由VH结构域构成；(v)分离的CDR区；以及(vi)F(ab′)_.sub.2片段，包含通过铰链区二硫化物桥连接的两Fab片段的二价片段。尽管Fv片段的两结构域是由不同基因编码的，但是证实通过重组方法生成合成的接头使它们作为单链蛋白被产生也是可能的(称为单链Fv(scFv)；Bird，R.E.et al.，Science 242，423-426(1988)Huston，J.S.et al.，Proc.Natl.Acad.Sci，USA 85，5879-5883(1988))。

概述

本发明的一方面公开了遗传测定法，其可被用于采用酵母双杂交相互作用陷阱(Gyuris，J.et al.(1993)Cell 75：791-803)分离与靶蛋白相互作用的肽套索(peptide lariat)。套索由带有共价连接的转录激活结构域的环肽或“绞索(noose)”区构成。通过改造蛋白内含子环肽产生系统(Scott，CP.et al.(1999)Proc.Natl.Acad.Sci.USA 96：13638-13643)以将环肽反应停止在中间步骤(这产生含有通过酰胺键与内酯环化肽共价结合的转录激活结构域的套索)，本发明提供适合于酵母双杂交系统的套索。基于绞索序列的套索肽或环肽可被用于研究蛋白靶点的功能或证实蛋白靶点的治疗前景。

在一个具体的实施方案中，本发明通过产生细菌阻遏蛋白LexA的抑制剂例证了前述方法的可行性。LexA代表了推定的抗菌靶点，当被抑制时会增强细胞毒性抗生素的活性。当LexA被活化的RecA结合时，其经历自体蛋白水解而不再抑制其调节子中的基因(Lin，LL.&Little，J.W.(1988)Bacteriol.170：2163-2173)。阻断自体蛋白水解的LexA突变体(Walker，G.C.(1984)Microbiol.Rev.48：60-93)使得细菌对诸如DNA损伤试剂丝裂霉素C(MMC)的化合物诱导的压力更敏感(Lin，L.L.&Little，J.W.(1988)Bacteriol.170：2163-2173)，并且它们降低抗生素抗性(Cirz，R.T.et al.(2005)PLoS Biol.3：e 176，Miller，C.et al.(2004)Science 305：1629-1631)。阻断自体蛋白水解的LexA抑制剂将增强细菌对细胞毒性试剂的敏感性，并且由于LexA不存在于人中，其将不会对宿主DNA损伤修复系统有影响。

本发明的不同实施方案利用了包含与核酸分子可操作地连接的宿主可操作启动子的载体，该核酸分子按顺序包含活性结构域、经修饰的C-蛋白内含子结构域、插入序列、经修饰的N-蛋白内含子和转录终止序列。

在一些实施方案中，提供了包含与与核酸分子可操作地连接的宿主可操作启动子的经修饰蛋白内含子套索文库，该核酸分子按顺序包含活性结构域、经修饰的C-蛋白内含子、在其中插入了随机肽或抗体单链可变片段(ScFv)编码寡核苷酸或随机基因组片段的插入序列、经修饰的N-蛋白内含子和转录终止序列。这里，ScFv指由通过短接头结合在一起的重(H)和轻(L)链的免疫球蛋白可变(V)结构域构成的抗体片段(Tanaka，T.et al.(2003)Nucl.Acids Res.31：e23)。可构建新的ScFv，其含有来自所选轻链和重链可变结构域的特定框架区，以及含有随机互补决定区。可选择地，采用RT-PCR从纯化自外周血B淋巴细胞的总RNA扩增轻链和重链可变结构域，可产生免疫和非免疫ScFv文库。该免疫文库可从以特定抗原攻击的动物或从具有特定疾病的动物产生。基因组片段指源于基因组DNA或cDNA的随机或理性产生的DNA片段。

在可选择实施方案中，提供了鉴定与靶分子相互作用的环状肽、ScFv或基因组片段的方法。这些方法例如可在宿主生物体中进行，所述方法包括：(i)将上述经修饰的蛋白内含子文库转化进适合的宿主或宿主细胞或细胞系；(ii)以编码连接至第二活性结构域的靶分子的核酸分子转化所述宿主或宿主细胞或细胞系，所述第二活性结构域被设置为在所述宿主中表达；(iii)鉴定包含可检测产物的宿主细胞，所述产物是通过蛋白内含子文库成员和靶分子之间的相互作用使活性结构域在一起而产生的；以及(iv)从表达可检测产物的宿主细胞回收所述文库成员并对随机肽、ScFv或基因组片段编码寡核苷酸测序。已经报道了很多检测细胞内蛋白相互作用的测定法，包括双杂交系统(在Vidal M.& Legrain P.(1999)Nucl.Acid Res.27：919中所综述的)、断裂泛素系统(Stagljar et al.，(1998)Proc.Natl.Acad.Sci.USA 95：5187)、蛋白片段互补测定法(Remy I.& Michnick S.W.(1999)Proc.Natl.Acad.Sci.USA96：5394)、阻遏物重建测定法(Hirst et al.，(2001)Proc.Natl.Acad.Sci.USA 98：8726)，以及SOS募集系统(Broder et al.，(1998)Curr.Biol.8：1121)。这些测定法的任一种或未列出的采用报告基因/蛋白在细胞中检测蛋白相互作用的类似测定法可被用于分离与蛋白靶相互作用的环状肽、基因组片段或ScFv。可选择地，已经报道了很多将编码蛋白的DNA与表达的蛋白偶联的测定法，包括噬菌体展示(Smith，G.P.(1985)Science 228：1315)、细菌展示(Francisco，et al.，(1993)Proc.Natl.Acad.Sci.USA 90：10444)，以及酵母展示(Boder，E.T.Wittrup，K.D.(1997)Nat.Biotech.15：553)。已经开发了其它的涉及无细胞蛋白表达的测定法，用于将编码蛋白的RNA与表达的蛋白偶联，包括核糖体展示(Mattheakis，et al.，(1994)Proc.Nat.Acad.Sci.USA 91：9022)和mRNA展示(Roberts，R.W.& Szostak，J.W.(1997)Proc.Natl.Acad.Sci.USA94：12297)。这些测定法的任一种或未列出的将编码核酸的DNA或RNA与其表达的蛋白偶联的类似测定法可被用于分离与蛋白靶相互作用的环状肽、基因组片段或ScFv。

本发明还提供如上文所述分离的环状肽、ScFv或基因组片段。

本发明提供了可以用于产生所选靶点的环状和套索肽抑制剂的方法，其可用于多种目的。例如，环肽可用作药物来抑制致病靶点。它们也可用作亲和试剂来证实靶点的治疗前景或者用在需要亲和试剂的普通应用中。在其它实施方案中，套索肽在这样的应用中是有用的：所述应用使用环肽，但是可能还需要共价连接至环肽的标签(尾)。如本文所述，这些标签可编码酵母双杂交转录激活结构域。这些标签还可以编码其它蛋白相互作用检测系统所需的部分，所述系统包括断裂泛素系统(Stagljar et al.，(1998)Proc.Natl.Acad.Sci.USA 95：5187)、蛋白片段互补测定法(Remy I.& Michnick S.W.(1999)Proc.Natl.Acad.Sci.USA 96：5394)、阻遏物重建测定法(Hirst et al.，(2001)Proc.Natl.Acad.Sci.USA 98：8726)、SOS募集系统(Broder et al.，(1998)Curr.Biol.8：1121)、噬菌体展示(Smith，G.P.(1985)Science 228：1315)、细菌展示(Francisco，et al.，(1993)Proc.Natl.Acad.Sci.USA 90：10444)，以及酵母展示(Boder，E.T.Wittrup，K.D.(1997)Nat.Biotech.15：553)、核糖体展示(Mattheakis，et al.，(1994)Proc.Nat.Acad.Sci.USA 91：9022)和mRNA展示(Roberts，R.W.& Szostak，J.W.(1997)Proc.Natl.Acad.Sci.USA 94：12297)。

所述标签也可以编码用于标记靶的标记物(label)(荧光、放射性等)、定位序列、膜渗透序列、抗体表位标签、用于检测和定量结合靶的量的核酸序列，或小分子。当然，其它适合的用途对本领域技术人员而言也是显而易见的。

如本文中所讨论的，套索肽文库可在多种生物体中产生。可采用上文所述的蛋白相互作用测定法从遗传上选择这些文库中与特定靶相互作用的特定套索肽。酵母双杂交测定法有很多优势，包括但绝不限于以下。

环肽相对地稳定和小，这增加了它们在体内的稳定性和细胞通透性。在一些实施方案中，本发明提供了可以适合于细胞内肽输送的肽。例如，对源于HIV-1的Tat-肽系统的操作已被用于细胞内肽输送。参见例如Caron等人(2001)Intracellular delivery of a Tat-eGFP fusionprotein into muscle cells(Tat-eGFP融合蛋白细胞内输送进肌肉细胞).Mol.Therap.3(3)：310-18；Wadia和Dowdy(2003)Modulation of cellularfunction by TAT mediated transduction of full length proteins(通过TAT介导的全长蛋白转导调节细胞功能)；以及EP 656950 B1。可选择地，穿膜肽(penetratin)、穿透肽(transportan)和MAP(KLAL)肽可被用于介导细胞内输送。参见例如

等人(2001)Cargo delivery kinetics ofcell-penetrating peptides(细胞穿透肽的货物输送动力学).Biochim.Biophys.Acta.1515(2)：101-09；Thorén等人Uptake of analogs ofpenetratin，Tat(48-60)and oligoarginine in live cells(活细胞对穿膜肽类似物、Tat(48-60)和寡聚精氨酸的摄取).Biochem.Biophys.Res.Commun.307(1)：100-07；WO 2006/101283A1；以及Howl等人(2003)Intracellular delivery of bioactive peptides to RBL-2H3 cells inducesbeta-hexosaminidase secretion and phospholipase D activation(细胞内输送生物活性肽至RBL-2H3细胞诱导β-氨基己糖苷酶分泌和磷脂酶D活化).Chembiochem.4(12)：1312-16。可选择地，寡聚精氨酸融合蛋白可细胞内输送。参见例如Han等人(2001)Efficient intracellular deliveryof exogenous protein GFP with genetically fused basic oligopeptides(具有遗传融合的碱性寡肽的外源蛋白GFP的有效胞内输送).Mol.Cells.12(2)：267-71；Futaki et al.(2001)Arginine-rich peptides.An abundantsource of membrane-permeable peptides having potential as carriers forintracellular protein delivery(精氨酸丰富肽。来源充足的具有作为胞内蛋白输送载体潜力的膜可渗透肽).J.Biol.Chem.276(8)：5836-40；以及AU 2003/290511A8。可选择地，豆蔻酰化肽可细胞内输送。参见例如Nelson等人(2007)Myristoyl-based transport of peptides into livingcells(进入活细胞的基于豆蔻酰基的肽输送).Biochemistry 46(51)：14771-81；和EP 651805B1。

酵母双杂交测定法为容易、快速和可自动化的测定法。例如，酵母双杂交系统可以以阵列模式进行。这使得能产生套索肽阵列。采用自动化机器人，这些阵列可用于快速产生针对特定靶的套索肽。与不同靶相互作用的套索肽的模式可用于对靶进行表征。例如，具有类似的结合表面的靶应该与阵列中的类似套索肽相互作用。可选择地，套索肽可被用于摘出靶复合物以鉴定相互作用伴侣。在其它实施方案中，套索可被固定在表面，生成蛋白微阵列芯片来检测蛋白水平。

在其它实施方案中，其它的功能结构域可以连接至套索，包括显像和破坏结构域。

在具体实施方案中，本发明提供了编码断裂蛋白内含子多肽的重组核酸序列。按氨基到羧基顺序，该断裂蛋白内含子多肽可以包括：

包含F模块(block)和G模块的I_C结构域，F模块与序列rVYDLpV^**a--HNFh有至少80％的一致性，分别命名为位置F1至F16，G模块与序列NGhhhHNp有至少80％的一致性，分别命名为位置G1至G8；

与G模块的C末端部分连接的蛋白外显子(extein)结构域；以及

与蛋白外显子结构域的C末端部分连接的I_N结构域，该I_N结构域包含A模块和B模块，A模块与序列Ch--Dp-hhh--G有至少80％的一致性，分别命名为位置A1至A13，B模块与序列G--h-hT--H-hhh有至少80％的一致性，分别命名为位置B1至B14。在前述序列中，大写字母表示通过单字母氨基酸代码命名的氨基酸；“h”表示选自G、B、L、I、A和M的疏水残基；“a”表示选自D和E的酸性残基；“r”表示选自F、Y和W的芳香性残基；“p”表示选自S、T和C的极性残基；“-”表示任何氨基酸；“^*”表示任选的空位。

在可能以增强的稳定性，特别地肽骨架中内酯键的增强的稳定性为特征的特定实施方案中，多种氨基酸替换可以发生在前述分子式中，包括这样的替换，即其中：

(a)位置G7处编码的残基为Q、W、F、L、I、Y、M、V、R、K、H、E或D；和/或

(b)位置G6处编码的残基为L、N、D、W、F、I、M或Y；和/或

(c)位置B11处编码的残基为K、Y、F、W、H、Q或E；和/或

(d)位置G6处编码的残基为A且G7为Y；和/或

(e)位置G6处编码的残基为A且B11为K、Y、F、W、H、Q或E；和/或

(f)位置F4处编码的残基为E或Q；和/或

(g)位置F13处编码的残基为F、L或I；和/或

(h)位置F14处编码的残基为W、F、Y、L、K或R；和/或

(i)位置F15处编码的残基为W或L；和/或

(j)位置B9处的残基不为R或T且对于N-X酰基转换而言是非催化氨基酸；和/或

(k)位置B10处的残基不为R或T且对于N-X酰基转换而言是非催化氨基酸；和/或

(l)位置F2处的残基不为R或T且对于N-X酰基转换而言是非催化氨基酸；和/或

(m)位置F6处的残基不为S、T或C且对于涉及位置G8处亲核氨基酸攻击酯键或硫酯键的酯交换反应而言是非催化氨基酸。

在一些实施方案中，蛋白外显子结构域可以包含编码免疫球蛋白分子的免疫球蛋白编码区，该免疫球蛋白分子包含通过接头连接至轻链可变区的重链可变区，第一接头将重链可变区的C末端区连接至轻链可变区的N末端区，第二接头将重链可变区的N末端区连接至轻链可变区的C末端区，其中所述接头包含至少10个氨基酸(或者10至50的整数个氨基酸)的多肽链。在这些实施方案中，重链可变区可以包含一个或多个选自HFR1、HFR2、HFR3和HFR4的重链框架区；并且该重链可变区还包含一个或多个选自CDR-H1、CDR-H2、CDR-H3的互补决定区；重链框架区和互补决定区按式HFR1--CDR-H1--HFR2--CDR-H2--HFR3--CDR-H3--HFR4设置。轻链可变区可以包含一个或多个选自LFR1、LFR2、LFR3和LFR4的轻链框架区；并且该轻链可变区还包含一个或多个选自CDR-L1、CDR-L2和CDR-L3的互补决定区；轻链框架区和互补决定区按式LFR1--CDR-L1--LFR27-CDR-L2--LFR3--CDR-L3--LFR4设置。在这些结构式中：

(i)HFR1为第一重链框架区，由约30个氨基酸残基(或20至40中的任何整数值或其范围)的序列构成；

(ii)HFR2为第二重链框架区，由约14个氨基酸残基(或10至30中的任何整数值或其范围)的序列构成；

(iii)HFR3为第三重链框架区，由约29至约32个氨基酸残基(或20至50中的任何整数值或其范围)的序列构成；

(iv)HFR4为第四重链框架区，由约7至约9个氨基酸残基(或5至15中的任何整数值或其范围)的序列构成；

(v)CDR-H1为第一重链互补决定区(其可以例如为长10-100中的任何整数值或其范围的氨基酸)；

(vi)CDR-H2为第二重链互补决定区(其可以例如为长10-100中的任何整数值或其范围的氨基酸)；

(vii)CDR-H3为第三重链互补决定区(其可以例如为长10-100中的任何整数值或其范围的氨基酸)；

(viii)LFR1为第一轻链框架区，由约22至约23个氨基酸残基(或15至35中的任何整数值或其范围)的序列构成；

(ix)LFR2为第二轻链框架区，由约13至约16个氨基酸残基(或15至35中的任何整数值或其范围)的序列构成；

(x)LFR3为第三轻链框架区，由约32个氨基酸残基(或20至40中的任何整数值或其范围)的序列构成；

(xi)LFR4为第四轻链框架区，由约12至约13个氨基酸残基(或5至25中的任何整数值或其范围)的序列构成；

(xii)CDR-L1为第一轻链互补决定区(其可以例如为长10-100中的任何整数值的氨基酸)；

(xiii)CDR-L2为第二轻链互补决定区(其可以例如为长10-100中的任何整数值的氨基酸)；以及

(xiv)CDR-L3为第三轻链互补决定区(其可以例如为长10-100中的任何整数值的氨基酸)。

本发明还提供了包含前述重组核酸的宿主细胞，包括这样的细胞，即其中断裂蛋白内含子多肽在宿主细胞中在自体催化的反应中加工，以形成具有不超过一个线性末端的至少一种环化多肽(诸如免疫球蛋白分子，所述免疫球蛋白分子具有不超过一个线性末端并具有免疫球蛋白折叠的构象)。例如，该环化多肽可以具有一个线性末端，C末端或N末端，例如套索肽(其可以包含内酯或内酰胺连接点)。可选择地，该环化多肽可以为环状的，以致其不具有线性末端。

本发明的宿主细胞可以适用于分析融合蛋白间相互作用的方法。例如，本发明的细胞可以包含：

编码猎物融合蛋白的第一重组基因，该猎物融合蛋白包含转录阻遏物或激活物结构域和第一异源氨基酸序列；

编码诱饵融合蛋白的第二重组基因，该诱饵融合蛋白包含DNA结合结构域和第二异源氨基酸序列；以及

编码可检测基因产物的重组报告基因，该重组报告基因包含能够与诱饵融合蛋白的DNA结合结构域结合的操纵基因DNA序列；

其中报告基因的表达响应第一异源氨基酸序列和第二异源氨基酸序列之间的结合而被调节；以及

其中所述重组基因的至少一种包含前述重组核酸。

一方面，本发明提供了具有不超过一个线性末端的免疫球蛋白分子，包括具有如下构象的分子，即免疫球蛋白折叠，所述折叠包含通过接头与轻链可变区连接的重链可变区。在这类分子中，可以存在第一接头，将重链可变区的C末端区连接至轻链可变区的N末端区，并且可以存在第二接头，将重链可变区的N末端区连接至轻链可变区的C末端区。这些接头可以为长至少约50埃的柔性共价分子连接，例如长约15个氨基酸的多肽链或长14至25个氨基酸的多肽链(例如由甘氨酸和丝氨酸残基构成)。

附图简要说明

图1蛋白内含子催化的蛋白剪接反应。(a)自体剪接蛋白内含子反应。蛋白内含子结构域(黑)催化自体剪接反应，导致蛋白外显子结构域(白)的连接。(b)断裂蛋白内含子反应。蛋白内含子断裂为两个分开的蛋白。一个蛋白含有N蛋白外显子和N蛋白内含子，另一蛋白含有C蛋白内含子和C蛋白外显子。蛋白内含子结构域之间的相互作用导致蛋白外显子结构域的连接。(c)断裂蛋白内含子蛋白环化反应。蛋白内含子结构域相对于蛋白外显子结构域被交换。蛋白内含子结构域折叠在一起并催化蛋白外显子结构域的环化。

图2蛋白内含子介导的肽环化反应示意图。步骤1：蛋白内含子折叠-C蛋白内含子和N蛋白内含子结构域相互作用形成催化上有活性的蛋白内含子结构。步骤2：N-蛋白内含子切割-蛋白内含子催化蛋白外显子的环化和切除N蛋白内含子结构域。步骤3：C蛋白内含子的释放-C蛋白内含子结构域被切去，导致形成环肽。

图3套索蛋白内含子的形成。(a)套索蛋白内含子为蛋白内含子催化的环化反应中的中间体产物。套索肽中的C末端氨基酸通过内酯键共价连接到C蛋白内含子结构域(I_C)中的特定亲核残基。(b)套索蛋白内含子“绞索”的环化部分用于展示(i)随机肽、(ii)基因组片段和(iii)抗体单链可变片段(ScFv)。显示I_C结构域与核定位序列(NLS)、转录激活结构域(ACT)、血凝素标签(HA)融合。

图4未加工蛋白内含子的形成。(a)通过阻断蛋白内含子催化的环化反应中的步骤(i)形成未加工蛋白内含子。(b)蛋白外显子或限制在C蛋白内含子(I_C)和N蛋白内含子(I_N)结构域之间的区域被用于展示(i)随机肽、(ii)基因组片段和(iii)抗体单链可变片段(ScFv)。显示I_C结构域与核定位序列(NLS)、转录激活结构域(ACT)、血凝素标签(HA)融合。

图5双半胱氨酸蛋白内含子的形成。(a)通过阻断蛋白内含子催化的环化反应中的步骤(i)形成双半胱氨酸蛋白内含子。双半胱氨酸蛋白内含子在C蛋白内含子结构域(I_C)后和N蛋白内含子结构域(I_N)的第一氨基酸位置处各含有1个Cys。(b)蛋白外显子或限制在两Cys氨基酸之间的区域被用于展示(i)随机肽、(ii)基因组片段和(iii)抗体单链可变片段(ScFv)。显示I_C结构域与核定位序列(NLS)、转录激活结构域(ACT)、血凝素标签(HA)融合。

图6套索、未加工和双半胱氨酸蛋白内含子向环状和线性肽的转化。(a)套索蛋白内含子中内酯环化的肽或蛋白可被转化为头尾相接的环化肽或蛋白或者线性肽或蛋白。(b)未加工蛋白内含子中的受限肽或蛋白可被转化为头尾相接的环化肽或蛋白或者线性肽或蛋白。(c)双半胱氨酸蛋白内含子中的受限肽或蛋白可被转化为Cys交联的或二硫键环化的肽或蛋白或者线性肽或蛋白。I_N是N蛋白内含子结构域，I_C是C蛋白内含子结构域。显示I_C结构域与核定位序列(NLS)、转录激活结构域(ACT)和血凝素标签(HA)融合。

图7采用套索、未加工和双半胱氨酸蛋白内含子的酵母双杂交测定。(a)采用酵母双杂交测定法筛选套索蛋白内含子组合文库。套索蛋白内含子含有融合至I_C结构域的转录激活结构域(ACT)，其为酵母双杂交测定法中激活报告基因所需。(b)采用酵母双杂交测定法筛选未加工蛋白内含子组合文库。未加工蛋白内含子含有融合至I_C结构域的转录激活结构域(ACT)，其为酵母双杂交测定法中激活报告基因所需。(c)采用酵母双杂交测定法筛选双半胱氨酸蛋白内含子组合文库。双半胱氨酸蛋白内含子含有融合至I_C结构域的转录激活结构域(ACT)，其为酵母双杂交测定法中激活报告基因所需。对于以上列出的所有实例，I_C结构域还显示出与核定位序列(NLS)和血凝素标签(HA)融合。

图8蛋白内含子和蛋白外显子氨基酸编号。C蛋白内含子结构域(I_C)具有保守的模块F和G，N蛋白内含子(I_N)结构域具有保守的模块A和B。保守氨基酸根据它们的模块字母和位置数字编号。显示了I_C-蛋白外显子-I_N边界处的剪接位点的放大图。I_C蛋白内含子采用标记方案I_C-1、I_C-2、I_C-3、...从C末端向N末端编号或者根据模块字母和位置号编号。模块G编号1-8，模块F编号1-16。I_N蛋白内含子采用标记方案I_N+1、I_N+2、I_N+3、...从N末端向C末端编号或者根据模块字母和位置号编号。模块A编号1-13，模块B编号1-14。蛋白外显子采用标记方案I_C+1、I_C+2、I_C+3、...从N末端向C末端编号，或者采用标记方案I_N-1、I_N-2、I_N-3、...从C末端向N末端编号。每个模块的一致序列显示在模块下方。定义：h＝疏水残基(G、V、L、I、A、M)；a＝酸性残基(D、E)；r＝芳香残基(F、Y、W)；p＝极性残基(S、T、C)；“.”＝非保守残基；“^*”＝用于较佳比对而引入的空位；大写字母＝单字母氨基酸代码，表示高度保守的位置。

图9蛋白内含子介导的蛋白剪接的标准机制。步骤(i)：N-X酰基转换-蛋白外显子I_N连接点处的I_N+1(A1)亲核试剂经历N-X酰基转换而将酰胺键转变为酯或硫酯键。步骤(ii)：酯交换反应-I_C-蛋白外显子连接点处的I_C+1(G8)亲核试剂经历对步骤(i)中形成的酯或硫酯的亲核攻击并产生分支中间体。步骤(iii)：Asn环化-I_C+2Asn经历侧链环化，这切割了I_C结构域和蛋白外显子之间的酰胺键，产生通过酯或硫酯连接的蛋白外显子。步骤(iv)：酯至酰胺的转换-酯或硫酯键通过热动力学上有利的X至N酰基转换而转变为酰胺键。定义：X＝O或S，这取决于Ser或Cys。I_N是N蛋白内含子结构域，I_C是C蛋白内含子结构域。

图10蛋白内含子介导的蛋白剪接的非标准机制。步骤(i)：对酰胺键的直接攻击-I_C-蛋白外显子连接点处的I_C+1(G8)亲核试剂对连接N蛋白外显子和I_N结构域的酰胺键进行亲核攻击并产生分支中间体。步骤(ii)：Asn环化-I_C+2Asn经历侧链环化，这切去了I_C结构域，产生通过酯或硫酯连接的蛋白外显子产物。步骤(iii)：酯至酰胺的转换-酯或硫酯键通过热动力学上有利的X至N酰基转换而转变为酰胺键。定义：X＝O或S，这取决于Cys或Ser/Thr。I_N是N蛋白内含子结构域，I_C是C蛋白内含子结构域。

图11蛋白内含子介导的蛋白环化反应。步骤(i)：N-X酰基转换-蛋白外显子-I_N连接点处的I_N+1(A1)亲核试剂经历N-X酰基转换而将酰胺键转变为酯或硫酯。步骤(ii)：酯交换反应-I_C-蛋白外显子连接点处的I_C+1(G8)亲核试剂对步骤(i)中形成的酯或硫酯进行亲核攻击并产生分支中间体。步骤(iii)：Asn环化-I_C+2Asn经历侧链环化，这切去了I_C结构域，产生了作为内酯的蛋白外显子产物。步骤(iv)：内酯至内酰胺的转换-内酯环化的蛋白内含子通过热动力学上有利的X至N酰基转换而转变为内酰胺。定义：X＝S或O，这取决于Cys或Ser/Thr。I_N是N蛋白内含子结构域，I_C是C蛋白内含子结构域。

图12未加工蛋白内含子的产生。(a)通过抑制步骤(ii)(酯交换反应)产生未加工蛋白内含子。如果只是步骤(ii)被阻断，则未加工蛋白内含子可经历两个副反应。副反应(iii)(Asn环化)导致从未加工蛋白内含子切去I_C结构域。副反应(iv)(酯水解)导致从未加工蛋白内含子切去I_N结构域。为了产生稳定的未加工蛋白内含子，需要抑制步骤(i)(N-X酰基转换)和步骤(iii)(Asn环化)。I_C结构域显示为与核定位序列(NLS)、转录激活结构域(ACT)、血凝素标签(HA)融合。X＝S或O，这取决于Cys或Ser/Thr。

图13双半胱氨酸蛋白内含子的产生。(a)通过抑制步骤(ii)(酯交换反应)产生未加工蛋白内含子。如果只是步骤(ii)被阻断，则未加工蛋白内含子可经历两个副反应。副反应(iii)(Asn环化)导致从未加工蛋白内含子切去I_C结构域。副反应(iv)(酯水解)导致从未加工蛋白内含子切去I_N结构域。为了产生稳定的双半胱氨酸蛋白内含子，需要抑制步骤(i)(N-X酰基转换)和步骤(iii)(Asn环化)。I_C结构域显示为与核定位序列(NLS)、转录激活结构域(ACT)、血凝素标签(HA)融合。X＝S或O，这取决于Cys或Ser/Thr。

图14套索蛋白内含子的产生。为了产生套索蛋白内含子，需要阻断步骤(iii)(Asn环化)。套索蛋白内含子可进行副反应(iv)(内酯水解)。为了产生稳定的蛋白内含子套索，应该减少步骤(iv)(内酯水解)。I_C结构域显示为与核定位序列(NLS)、转录激活结构域(ACT)、血凝素标签(HA)融合。X＝S或O，这取决于Cys或Ser/Thr。

图15抗LexA套索的分离。(a)蛋白内含子介导的肽环化。(i)未加工蛋白内含子采用肽-I_N连接点处的I_N+1半胱氨酸经历N至S酰基转换。(ii)涉及I_C-肽连接点处的I_C+1丝氨酸和步骤(i)中形成的硫酯的酯交换反应，其释放I_N结构域，产生套索中间体。(iii)在产生环肽系统的蛋白内含子中，I_C+2天冬酰胺经历侧链环化，其释放I_C结构域并产生内酯环化肽，所述内酯环化肽经历热动力学上有利的O至N酰基转换而产生内酰胺环化肽。在产生套索的蛋白内含子中，位置I_C-1处的天冬酰胺突变为丙氨酸(^*)，其抑制天冬酰胺环化。(b)用于产生套索和无活性蛋白内含子的突变。套索蛋白内含子在位置I_C-1处含有天冬酰胺至丙氨酸的突变，这阻断了天冬酰胺侧链环化反应。无活性蛋白内含子含有与套索蛋白内含子相同的突变以及位置I_C+1处的丝氨酸至丙氨酸突变和位置I_N+1处的半胱氨酸至丙氨酸突变。位置I_N+1处的半胱氨酸至丙氨酸突变阻断了N至S酰基转换。位置I_C+1处的丝氨酸至丙氨酸突变阻断了酯交换反应。X表示NNK密码子编码的氨基酸。(c)套索酵母双杂交测定法。通过将天冬酰胺突变为丙氨酸抑制了天冬酰胺侧链环化反应，这终止了套索中间体的环化反应。套索含有转录激活结构域，其被用于采用酵母双杂交相互作用陷阱来选择抗LexA套索。(d)来自两抗LexA套索肽(L1和L2)的绞索区域的氨基酸序列。来自组合区域的氨基酸为粗体并且短划线用于比对L1和L2中的相同氨基酸。

图16套索组合文库的分析。来自17套索文库质粒(pIL-XX)的序列。粗体氨基酸是不变的。^*表示终止密码子。X表示NNK密码子编码的氨基酸。文库的35％含有随机7氨基酸肽，无终止密码子。

图17L2套索的分析。(a)采用抗HA抗体对EY93中蛋白内含子介导的套索生成的Western分析。pIL-L2和pIN-L2分别设计为产生套索和未加工蛋白内含子。未加工蛋白内含子在约23kDa处，套索在约9kDa处。(b)酵母双杂交分析L2套索与LexA的相互作用。pIL-01为具有CGPC肽绞索的套索表达质粒。pIL-L2为具有L2绞索的套索表达质粒。pIN-L2为带有L2绞索的突变体套索表达质粒，其仅产生未加工蛋白内含子。(i)在非选择性的His^-、Trp^-葡萄糖培养基上的酵母生长。(ii)在为选择激活LEU2、ADE2和LacZ酵母双杂交报告基因的His^-Trp^-Leu^-Ade^-Xgal半乳糖/蔗糖培养基上生长的酵母。(c)BL21-CP中产生的经His标签纯化的套索的HPLC和ESI-TOF MS分析。(i)套索和I_N片段的反相HPLC分离。(ii)套索(8651.7calc；8651.4obs)和水解套索(8669.7calc；8669.5obs)的ESI-TOF MS分析。(iii)I_N片段的ESI-TOF MS分析(13966.7calc；13967.0obs)。(d)对MS分析之前存在的套索的量的分析。(i)通过内酯键环化的套索。(ii)在Na¹⁸OH处理之前被切割的套索。(iii)Na¹⁸OH诱导内酯键切割得到的产物。(iv)胰蛋白酶消化经切割的套索来证实¹⁸O掺入的位置。显示了含有¹⁸O的每个片段的百分比，所述百分比对应于MS分析前通过内酯键环化的套索的量(图20)。

图18L2与LexA相互作用的表面等离子共振(SPR)分析。L2肽被固定到CM5传感器芯片上，LexA(11μM-110μM)流经该传感器芯片。每个点的反应曲线被用于采用BiaEvaluation(Biacore)拟和软件来确定解离常数(K_d)。采用不同的LexA浓度计算标准偏差。

图19NaOH切割套索的机制。Na¹⁸OH对套索内酯的水解可通过两个机制进行。(a)第一个机制涉及对酯键的水解，导致¹⁸O掺入位置(I_N-1)处的酪氨酸羧酸。(b)第二个机制涉及α-H消除以产生二氢丙氨酸，接着是迈克尔(Michael)加成，其将¹⁸O掺入位置(I_C+1)处丝氨酸侧链。

图20对MS分析前套索的定量。(a)分析¹⁸O在位置(I_N-1)处酪氨酸羧酸的掺入。胰蛋白酶消化经Na¹⁸OH处理的套索产生在位置(I_N-1)处含有酪氨酸的肽片段(SWDLPGEY)。¹⁶O产物具有966.420m/z的计算质量，¹⁸O产物具有968.420m/z的计算质量。(b)来自经Na¹⁶OH或Na¹⁸OH处理样品的SWDLPGEY肽片段的质谱分析与理论上的同位素分布(MS-ISOTOPE软件)叠放。在Na¹⁸OH处理的样品中，与理论分布有大偏差，表明存在一种以上的肽。(c)MATCHING软件分析所观察到的图谱中¹⁶O标记肽(966.3m/z，86％，方形)和¹⁸O标记肽(969.3m/z，14％，三角形)的百分比。分析了1+和2+带电片段，观察到类似结果。仅显示了1+电荷。(d)在观察到的SWDLPGEY肽片段图谱上叠放¹⁸O和¹⁶O肽的计算贡献的总和。(e)¹⁸O在位置(I_C+1)处丝氨酸侧链掺入的分析。胰蛋白酶消化经Na¹⁸OH处理的套索产生在位置(I_C+1)处含有丝氨酸的肽片段(IFDIGLPQDHNFLLANGAIAHASR)。该片段的质量为2590.352m/z，对应于比预测的¹⁶O掺入的产物重1Da的产物。1Da的位移可归结于天冬酰胺的脱酰胺。由于位于甘氨酸(7-10)的N末端，位置(I_C-7)处的天冬酰胺容易发生碱催化的脱酰胺。分析了2+、3+、4+和5+带电片段，得到类似的结果。仅显示了4+带电片段。(f)来自经Na¹⁶OH或Na¹⁸OH处理样品的IFDIGLPQDHNFLLANGAIAHASR肽片段的质谱分析与理论上的同位素分布(MS-ISOTOPE软件)叠放。在Na¹⁸OH处理的样品中，与理论分布有大偏差，表明存在一种以上的肽。Na¹⁸OH处理的样品应该掺入了两个¹⁸O，一个来自水解，另一个来自脱酰胺，产生2595.36Da的M+H。(g)MATCHING软件分析¹⁶O和¹⁸O标记肽的百分比：(■)具有两个¹⁶O取代的肽，对应于由¹⁶O进行的脱酰胺和水解(2591.35m/z，8.8％，方形)，(▲)具有一¹⁶O和一¹⁸O取代的肽，对应于由¹⁸O进行的脱酰胺和由¹⁶O进行的水解(2593.35m/z，59.0％，三角形)，以及(●)具有两个¹⁸O取代的肽(2595.35m/z，32.2％，圆形)，对应于由¹⁸O进行的脱酰胺和水解。D＝脱酰胺，H＝水解。(h)在观察到的IFDIGLPQDHNFLLANGAIAHASR肽片段图谱上叠放¹⁸O和¹⁶O肽的计算贡献的总和。

图21L2套索和环肽的生物学活性。(a)通过L2套索抑制MMC诱导的LexA切割。以MMC和氯霉素处理BL21-CP细胞，所述细胞或者表达pETIL-01(其表达带有CGPC绞索的套索)，或者表达pETIL-L2(其表达带有L2绞索的套索)。在MMC添加后0、1、2和3小时采用抗LexA抗体通过Western分析法分析细胞提取物。(b)SMR6039-DE3中抑制MMC诱导的sulA-GFP表达。存在和不存在IPTG时经pETIL-L2转化和MMC处理的表达GFP的SMR6039-DE3细胞的百分比。在MMC添加后的0、0.5、1.5和2.5小时采用流式细胞术分析GFP表达。误差线表示来自3个独立试验的标准偏差。(c)经pETIL-01或pETIL-L2转化的BL21-CP细胞在存在(+)和不存在(-)MMC和/或IPTG时的存活测定。(d)合成的线性和环状L2肽处理的BL21-CP细胞的存活测定。通过1小时后的菌落形成单位(cfu)数量除以0小时时间点的cfu数量计算标准化的细胞存活百分比。未诱导的对照或无肽的对照标准化至100％。误差线表示3个独立试验的标准偏差。

图22线性L2肽抑制细胞存活并增强丝裂霉素C活性。合成的线性L2肽处理的BL21-CP细胞的存活测定。相对于未处理对照报告细胞存活。误差线表示3个独立试验的标准偏差。

图23用于构建套索蛋白内含子和混合蛋白内含子的寡核苷酸。

图24套索突变对套索稳定性和加工的影响。蛋白内含子构建体中的3个位置G6、G7和B11突变为所列的氨基酸。野生型蛋白内含子进行蛋白内含子反应中的所有步骤并产生环肽。G6：His、G7：Ala和B11：Arg为产生套索的蛋白内含子构建体。(-)表示套索形成和加工未表征。％套索为未水解套索的量。％加工为在套索反应中进行前两步骤的量。

图25ScFv文库的多样化互补区域(CDR)中氨基酸位置。CDR的名称列在表上方，位置以对应于Kabat数据库的编号标记。编号下的字母指以单字母氨基酸代码表示的该位置中的氨基酸。X表示可变位置。

图26ScFv套索加工的时程分析。采用抗HA抗体对EY93中蛋白内含子介导的ScFv套索产生的Western分析。未加工蛋白内含子为约54kDa，套索为约42kDa。

图27ScFv文库相互作用的酵母双杂交比较。针对5诱饵池：Bcr-Abl SH2结构域、Bcr-Abl SH3结构域、Bcr-Abl卷曲螺旋结构域、Bcr-Abl Y177基序以及Hck Tyr激酶结构域筛选K4、cyc-K4、T4和cyc-T4文库。由于激活腺嘌呤报告基因(ADE)而生长的阳性克隆的数量以黑条显示。由于激活腺嘌呤报告基因(ADE)和LacZ报告基因而生长并变蓝的阳性克隆的数量以灰色条显示。误差线表示来自3个独立试验的标准偏差。

图28用于构建ScFv文库的寡核苷酸。

详细说明

产生连续的酰胺肽骨架的头尾相接肽环化已被成功地用于约束和稳定肽并改善其生物学活性。已经开发出了多种用于将肽从其线性前体环化的体外化学和酶学策略。最近已经开发了采用蛋白内含子的方法来体内合成头尾相接环肽(Scott，CP.et al.(1999)Proc.Natl.Acad.Sci.USA 96：13638-13643)。

蛋白内含子为自体剪接蛋白，它们存在于前体蛋白的蛋白外显子之间。蛋白内含子从前体蛋白中除去它们自身，导致蛋白外显子连接(图1a)。天然存在的和经改造的蛋白内含子以及断裂蛋白内含子将蛋白和肽连接在一起(图1b)。基于这些结果，蛋白内含子已被进一步改造，用于产生环状蛋白和肽。为此，改变蛋白内含子结构域的顺序(图1c)以使得蛋白外显子结构域能头尾相接环化。

采用改造的蛋白内含子来产生头尾相接的环化肽的方法已有描述。通过融合蛋白内含子结构域之间的随机肽已生成了组合环肽文库。这些环肽文库已被用于分离在人B细胞中阻断白介素-4信号转导的特异头尾相接环化肽(Kinsella，T.M.et al.(2002)J.Biol.Chem.277：37512-37518)。尽管这种方法已成功地用于改变细胞表型，但是难以确定环肽的细胞靶点。最近，已经开发了在细菌中采用遗传选择策略，来分离破坏特异蛋白-蛋白相互作用的头尾相接环化肽的技术(Horswill，A.R.et al.(2004)Proc.Natl.Acad.Sci.USA 101：15591-15596，Tavassoli，A.& Benkovic，SJ.(2005)Agnew Chem.Int.Ed.Engl.44：2760-2763)。但是，本领域技术人员显而易见的是，头尾相接环化肽缺乏自由N末端或C末端，这意味着报告子(reporter)或激活子不能与其连接。

本发明描述“套索”蛋白内含子或套索前体(未加工或双半胱氨酸蛋白内含子)在酵母双杂交测定法或上述和/或现有技术中已知的其它选择技术中的构建和应用。套索为没有C末端的新的肽构建体，代表了一种新类型的环肽。通过改动体内蛋白内含子介导的蛋白连接反应来产生套索蛋白内含子(图2)。使套索蛋白内含子的C末端倒回成环并通过内酯键连接到肽内部的特定丝氨酸(图3)。随机肽、ScFv或基因组片段的文库可展示在套索的环状区或绞索区(图3)。与头尾相接的环化肽不同，套索具有自由N末端，这使得能连接有用的活性结构域，例如转录激活结构域，这对于酵母双杂交测定法是必要的。未加工蛋白内含子(图4)为这样的蛋白内含子构建体，即其不能在蛋白内含子介导的环化中经历任何步骤。随机肽、ScFv或基因组片段可被展示和限制在C和N蛋白内含子结构域之间(图4)。未加工蛋白内含子具有自由N和C末端，使得能在任一端连接有用的活性结构域，例如转录激活结构域，这对于酵母双杂交测定法是必要的。双半胱氨酸蛋白内含子(图5)为这样的蛋白内含子构建体，即其不能在蛋白内含子介导的环化中经历任何步骤。随机肽、ScFv或基因组片段可被展示和限制在C和N蛋白内含子结构域之间(图5)。在双半胱氨酸蛋白内含子中，随机肽、ScFv或基因组片段在每一端与Cys侧翼连接。该双半胱氨酸蛋白内含子具有自由N和C末端，使得能在任一端连接有用的活性结构域，例如转录激活结构域，这对于酵母双杂交测定法是必要的。该套索构建体或未加工蛋白内含子和双半胱氨酸蛋白内含子可用于展示与转录激活结构域融合的组合环肽、ScFv或基因组片段文库。本文中，ScFv指由通过短接头结合在一起的重(H)和轻(L)链的免疫球蛋白可变(V)结构域构成的抗体片段(Tanaka，T.et a1.(2003)Nucl.Acids Res.31：e23)。注意，在图3、图4和图5中，可通过将V_H结构域融合至I_C结构域及随后的接头和V_L结构域而构建ScFv。可选择地，V_L结构域可融合至后面接有接头和V_H结构域的I_C结构域。用在本文时，“ScFv”指任一构建体。本文中，基因组片段指源于基因组DNA或cDNA的DNA的随机或理性产生的片段，它们在套索、未加工蛋白内含子或双半胱氨酸蛋白内含子构建体中表达。酵母双杂交测定法或其它的选择技术可用于从遗传学上选择与特异靶结合的套索肽、未加工蛋白内含子和双半胱氨酸蛋白内含子。

其它的用于检测细胞内蛋白、RNA和DNA相互作用的测定法也可用于选择结合特异靶的套索肽、未加工蛋白内含子和双半胱氨酸蛋白内含子，包括双杂交系统(在Vidal M.& Legrain P.(1999)Nucl.AcidRes.27：919中所综述的)、断裂泛素系统(Stagljar et al.，(1998)Proc.Natl.Acad.Sci.USA 95：5187)、蛋白片段互补测定法(Remy I.&MichnickS.W.(1999)Proc.Natl.Acad.Sci.USA 96：5394)、阻遏物重建测定法(Hirst et al.，(2001)Proc.Natl.Acad.Sci.USA 98：8726)，以及SOS募集系统(Broder et al.，(1998)Curr.Biol.8：1121)。这些测定法的任一种或未列出的采用报告基因/蛋白在细胞中检测蛋白、RNA或DNA相互作用的类似测定法可被用于分离与靶相互作用的环状肽、基因组片段或ScFv。可选择地，已经报道了很多将编码蛋白的DNA与表达的蛋白偶联的测定法，包括噬菌体展示(Smith，G P.(1985)Science 228：1315)、细菌展示(Francisco，et al.，(1993)Proc.Natl.Acad.Sci.USA 90：10444)，以及酵母展示(Boder，E.T.Wittrup，K.D.(1997)Nat.Biotech.15：553)。已经开发了其它的涉及无细胞蛋白表达的测定法，用于将编码蛋白的RNA与表达的蛋白偶联，包括核糖体展示(Mattheakis，et al.，(1994)Proc.Nat.Acad.Sci.USA 91：9022)和mRNA展示(Roberts，R.W.&Szostak，J.W.(1997)Proc.Natl.Acad.Sci.USA 94：12297)。这些测定法的任一种或未列出的将DNA或RNA编码核酸与其表达的蛋白偶联的类似测定法可被用于分离与靶相互作用的环状肽、基因组片段或ScFv。

结合特异靶的套索和未加工蛋白内含子可被用作模板以合成与该相同靶相互作用但不含有任何蛋白内含子序列的线性或环肽、ScFv或基因组片段(图6a、图6b)。与靶相互作用的双半胱氨酸蛋白内含子可用于设计与靶相互作用但不含有任何蛋白内含子序列的受限肽(constrained peptide)、ScFv或基因组片段。为此，将展示在C和N蛋白内含子结构域之间的肽、ScFv或基因组片段合成为侧翼连接Cys。侧翼连接的Cys被用于交联和限制肽、ScFv或基因组片段(图6c)。也可采用其它的可交联氨基酸替代两半胱氨酸残基来构建双半胱氨酸蛋白内含子。存在于氨基酸上的可交联部分的实例包括但不限于：胺-硫醇、胺-胺、胺-羧酸、羧酸-羧酸等。其它的氨基酸可在翻译后修饰，以并入不在氨基酸上天然存在的可交联部分。进一步地，可设计这样的交联分子，使得具有独特功能的其它分子可连接到所述肽、ScFv或基因组片段。这些分子可以包括荧光标记、定位序列、纯化标签、分子破坏部分等。

术语“蛋白内含子”指一组公知的“剪接蛋白”。如本文所讨论的，多种蛋白内含子可如下文所述被修饰而用在本发明中。来自不同蛋白内含子的N蛋白内含子结构域和C蛋白内含子结构域也可混合以产生功能性蛋白内含子。实例包括但不限于天然存在的断裂蛋白内含子，例如Aha DnaE-c和Aha DnaE-n、Aov DnaE-c和Aov DnaE-n、AspDnaE-c和Asp DnaE-n、Ava DnaE-c和Ava DnaE-n、Cwa DnaE-c和Cwa DnaE-n、Dra Snf2-c和Dra Snf2-n、Npu DnaE-c和Npu DnaE-n、Nsp DnaE-c和Nsp DnaE-n、Oli DnaE-c和Oli DnaE-n、Ssp DnaE-c和Ssp DnaE-n、Tel DnaE-c和Tel DnaE-n、Ter DnaE-3c和Ter DnaE-3n，以及Tvu DnaE-c和Tvu DnaE-n。

其它适合的蛋白内含子包括那些被鉴定为蛋白内含子的肽，即符合以下标准的肽(来自New England Biolabs网页)：

1)基因内的同框插入，该基因具有先前经测序缺乏该插入的同源物。

2)成熟蛋白的观测大小类似于缺乏蛋白内含子的该同源物的大小，而与前体的预测大小不同。很多小组进一步通过对跨连接的蛋白外显子中的剪接结合点的氨基酸测序或者通过质谱分析鉴定经剪接的肽而证实蛋白剪接。在缺乏剪接的实验证据时，蛋白内含子被认为是推断的并在蛋白内含子登记(Intein Registry)中注明为理论的。

3)存在由模块A、N2、B、N4、F和G构成的蛋白内含子剪接基序。尽管模块C、D、E和H为内切核酸酶结构域的部分，但它们倾向于比剪接基序更保守，并且有时更容易在候选序列中找到。但是，归巢内切核酸酶(homing endonuclease)结构域的存在不足以将蛋白归类为蛋白内含子，因为很多归巢内切核酸酶为独立存在的或者在内含子(intron)中发现。因而缺乏这些DOD基序的小蛋白内含子更难鉴定，尤其是它们在保守位置含有非一致序列时。注意最近的文章报道了既非蛋白内含子介导亦非自催化的“蛋白剪接”。请区分蛋白内含子介导的蛋白剪接和产生剪接、重排蛋白的其它蛋白编辑机制。

4)存在4个保守的剪接点残基：蛋白内含子N末端的Ser、Thr或Cys，蛋白内含子C末端的二肽His-Asn或His-Gln，下游剪接位点后的Ser、Thr或Cys。Ser、Thr、Cys和Asn为必要残基，它们在剪接途径中用作亲核试剂。缺乏这些残基或以不能进行类似化学的残基替换提示无活性的蛋白内含子或可选择的剪接途径。在Tli Pol-2蛋白内含子中，未在蛋白内含子N末端观察到Thr，但是其可有效地替换Ser(Hodges，R.A.et al.(1992)Nucl.Acid.Res.20：6153-6157)。保守的Thr(模块B)和His(模块B和G中)残基协助催化，因而可能不是必要的，因为蛋白内含子中的其它残基可以在它们不存在时提供类似的辅助功能。

一方面，本发明提供了分离识别所选靶标的套索蛋白内含子、未加工蛋白内含子以及双半胱氨酸蛋白内含子的方法，例如采用酵母双杂交相互作用陷阱(图7)。套索蛋白内含子为环化的肽、基因组片段或ScFv，其具有共价连接环化或绞索区的肽标签。通过突变产生环肽的蛋白内含子以使其在环化反应中仅经历前两个步骤，来产生套索肽。套索为蛋白内含子介导的环肽反应中的中间产物。套索产物含有经酰胺键共价连接至内酯环化肽的尾(对于酵母双杂交测定法，这为转录激活结构域)。套索肽对于该酵母双杂交测定法来说是必需的，因为这种测定法要求转录激活结构域连接至环肽来激活报告基因。如下文所讨论的，酵母双杂交测定法可用于产生针对给定靶的环状和套索肽亲和试剂。也可使用其它的激活结构域，例如阻遏结构域、断裂泛素和本领域已知的其它双杂交融合物，其如本文所讨论。

描述了两种套索蛋白内含子前体蛋白，其在环化反应中不经历任何步骤。称为未加工蛋白内含子的第一前体蛋白含有突变，所述突变使得在环化反应中不允许进行任何步骤。在未加工蛋白内含子中，通过将组合肽、基因组片段或ScFv插在C蛋白内含子结构域和N蛋白内含子结构域之间而进行限制。在未加工蛋白内含子中，活性结构域可连接至C蛋白内含子或N蛋白内含子结构域。称为双半胱氨酸蛋白内含子的第二前体蛋白含有在每一端与半胱氨酸侧翼连接的组合肽、基因组片段或ScFv。半胱氨酸蛋白内含子也含有突变，所述突变使得环化反应中的步骤不能进行。可以选择与靶分子相互作用的、插在C蛋白内含子和N蛋白内含子结构域之间的组合肽、ScFv或基因组片段。未加工蛋白内含子或双半胱氨酸蛋白内含子可被用作针对给定靶的亲和试剂。基于所述肽、ScFv或基因组片段插入序列的环肽也可被用作针对给定靶的亲和试剂。双半胱氨酸蛋白内含子中肽插入序列每一端的半胱氨酸也可用于环化肽、基因组片段或ScFv插入序列，或者是通过形成二硫键，或者是通过硫醇反应性交联剂交联半胱氨酸。

环肽实际上被用于产生高亲和性药物样效应子。天然存在的和合成设计的环肽都成功地用作药物来治疗人类疾病(Horswill，A.R.&Benkovic，SJ.(2005)Cell Cycle 4：552-555)。环肽用作药物是有优势的，因为它们相对于线性肽具有减弱的蛋白水解敏感性(Humphrey，J.M.&Chamberlin，A.R.(1997)Chem.Rev.97：2243-2266)，并且由于它们受限的构象空间(结合时熵减小(Williams et al.(2002)J.Biol.Chem.277：7790-7798))，它们展示了对其靶的增强结合(Horton，D.A.et al.(2002)J.Comput.Aided Mol.Des.16：415-430，Li，P.&Roller，P.P.(2002)Curr.Top.Med.Chem.2：325-341)。出于这些原因，需要可快速产生结合或干扰特异靶的环肽的方法。

一方面，本发明提供了经修饰的蛋白内含子文库和使用该文库筛选与特异靶相互作用或干扰特异过程的环肽、基因组片段和ScFv。如本文所讨论的，在一些实施方案中，“特异过程”可以为蛋白-蛋白相互作用。

在一个可应用于套索蛋白内含子、未加工蛋白内含子和双半胱氨酸蛋白内含子的实施方案中，提供了包含与核酸分子可操作地连接的宿主可操作启动子的载体，该核酸分子按顺序包含活性结构域、经修饰的C蛋白内含子、插入序列、经修饰的N蛋白内含子和转录终止序列。

在另一可应用于未加工蛋白内含子和双半胱氨酸蛋白内含子的实施方案中，提供了包含与核酸分子可操作地连接的宿主可操作启动子的载体，该核酸分子按顺序包含经修饰的C蛋白内含子、插入序列、经修饰的N蛋白内含子、活性结构域和转录终止序列。

在一些实施方案中，宿主可操作启动子为在宿主中有活性的合适启动子，其可操作地连接至本文所描述的蛋白内含子文库，用于驱动在宿主中的表达。这些启动子和中止序列的实例为现有技术中公知，这些元件在其中有功能的宿主也是公知的。值得注意的是，在一些实施方案中，可以使用强病毒启动子如SV40或CAMV，而不是强宿主特异启动子。如本领域技术人员所了解的，这些构建体的一个优点是，它们会在多种宿主中有功能。在其它实施方案中，可以使用组织特异性启动子或可诱导启动子。在所选的实施方案中，载体中的宿主可操作启动子为盒，所述盒可容易地采用普通分子生物学技术被替换以插入不同表达盒或该核酸序列上游的启动子盒。

如本领域技术人员所了解的，对活性结构域的选择是基于其与第二活性结构域紧密靠近时形成可检测产物的能力。如下文所讨论的，使用时，第二活性结构域融合至靶分子，这样蛋白内含子文库编码的环肽、ScFv或基因组片段与靶分子之间的相互作用使两活性结构域在一起以产生可检测的产物.适合的活性结构域的实例包括但绝不限于DNA结合结构域、转录激活结构域、阻遏结构域、荧光蛋白和定位序列、断裂-泛素、其它用于蛋白相互作用测定的结构域(上文所述)、生物素化序列或其它的抗体表位标签和蛋白纯化结构域，如His标签或GST。

在其它实施方案中，所述文库可以用来筛选对特定生物学过程或细胞表型的破坏或改变。如本领域技术人员所了解的，取决于生物学过程或细胞表型的性质，可基于检测对生物学过程(举例而言，在特定基质或培养基上生长的能力)或细胞表型的破坏来选择阳性物。

如本领域技术人员所了解的，文库成员与靶的相互作用可以防止靶与其它细胞组分相互作用或者可以防止除了靶以外的细胞组分之间的相互作用。因此，在这些和类似的实施方案中，所述文库可以用于鉴定抑制蛋白-蛋白相互作用的候选物。

如本领域技术人员所了解的，I_N和I_C指侧翼连接插入序列的N和C蛋白内含子结构域。对蛋白内含子结构域进行修饰以使得蛋白内含子形成套索、未加工蛋白内含子或双半胱氨酸蛋白内含子，其将在下文讨论。

在这些实施方案中，插入序列包括用于插入编码随机肽、ScFv或基因组片段的核酸分子的插入位点，如下文所讨论。如本领域技术人员所了解的，插入位点可以例如为本领域已知的单个限制性位点、两个邻近的限制性位点或多克隆位点。例如，插入序列可以包含Nrul限制酶识别位点，尽管对本领域技术人员来说显而易见的是，可以使用任何适合的限制酶识别位点。值得进一步注意的是，本领域技术人员可容易地将“适合”理解为包括因素，所述因素例如但绝不限于载体序列内的独特性和酶学活性。PCR也可被用于产生线性化的套索、未加工或双半胱氨酸载体，其用于插入编码随机肽、ScFv或基因组片段的核酸分子，其如下文所讨论。

在另一实施方案中，提供了经修饰的蛋白内含子套索文库，其包含与核酸分子可操作地连接的宿主可操作启动子，该核酸分子按顺序包含活性结构域、经修饰的C-蛋白内含子、在其中插入了随机肽、ScFv或基因组片段编码寡核苷酸的插入序列、经修饰的N-蛋白内含子和转录中止序列。

在这些实施方案中，将编码一个或多个氨基酸的寡核苷酸插进插入序列的插入位点。如以下所讨论的，由随机肽、ScFv或基因组片段编码寡核苷酸编码的氨基酸将形成套索、未加工蛋白内含子或双半胱氨酸蛋白内含子的环。

重要的是，注意到，在产生用于随机肽或新ScFv的寡核苷酸时，如果终止密码子被去除或或针对其进行选择，则提高了方法的效率，因为所有或基本上所有的插入序列都将形成环，但是这不是本发明的必要特征。此外，重要的是，注意到，寡核苷酸编码的氨基酸数量没有必需的上限或下限。还有，重要的是，注意到，尽管在制备所述文库期间，可能希望采用相同长度的寡核苷酸(编码例如6或7或8个氨基酸)来产生例如6氨基酸套索文库，但是在使用时，可对这些文库进行组合，如下文所讨论的。重要的是，注意到，尽管就特定长度寡核苷酸而言，当然希望所述文库含有氨基酸的所有组合(例如，对于5氨基酸套索，这将是20×20×20×20×20＝3200000个不同的5氨基酸套索)，但这绝不是本发明所必需的。最后，重要的是，注意到，随机氨基酸文库不必含有全部20种氨基酸。文库可由两种或更多种氨基酸的任意组合构成。

在一些实施方案中，经修饰的蛋白内含子文库可以被设置为用于转化进适合的宿主或者可以包含经该文库转化的宿主细胞混合物，其如下文所讨论。

使用时，经修饰的蛋白内含子套索文库被转化进适合的宿主或宿主细胞或细胞系中。所述细胞可以为之前用核酸分子转化或转染的细胞，该核酸分子编码融合至如上所述的第二活性结构域的靶分子。可选择地，可以首先导入所述文库，再导入靶，或者可以用所述文库和靶共转化宿主。

适合的宿主的实例包括但绝不限于细菌、酵母、噬菌体、黑腹果蝇(Drosophilia Melanogaster)、线虫(C.elegans)、斑马鱼、小鼠或其它模式生物以及哺乳动物细胞系、昆虫细胞系等。

如本文所讨论的，如果特异的经修饰的蛋白内含子文库成员与靶分子相互作用，则产生可检测的产物，并且可从表达可检测产物的宿主细胞中回收该特异的蛋白内含子文库成员并对其测序。在这种筛选中分离的这类肽的实例在下文提供。相应地，在本发明的一方面，提供了由上述方法鉴定的环肽。

如本领域技术人员所了解的，活性结构域可与其连接的任何分子都可以用作靶。值得注意的是，如本文所述，采用作为本方法基础的酵母双杂交系统已经鉴定了广泛种类肽的大量的蛋白-蛋白相互作用。

如本文所讨论，蛋白内含子序列经修饰以产生套索结构，其经历部分蛋白内含子反应，产生具有环状“环”和连接活性结构域的N末端尾的套索。未加工蛋白内含子和双半胱氨酸蛋白内含子不经历蛋白内含子反应的任何步骤，因此活性结构域可添加到C末端或N末端。通过对蛋白内含子序列进行特定突变，因而阻断蛋白内含子的完全加工，来产生套索、未加工蛋白内含子和双半胱氨酸蛋白内含子。

蛋白内含子构建体的编号方案

已经开发了编号方案来协助比较异源或外源蛋白内含子。该协议对蛋白内含子的氨基酸顺序编号，从N末端到C末端，于蛋白内含子的第一残基起始，蛋白内含子的最后一个残基结束。断裂蛋白内含子使这种命名协议复杂化，并因此使用以下的编号方案：(i)I_N蛋白内含子结构域从N末端到C末端编号{I_N+1，I_N+2，I_N+3...}；(ii)蛋白外显子从C末端到N末端编号{I_N-1，I_N-2，I_N-3...}或者从N末端到C末端编号{I_C+1，I_C+2，I_C+3...}；(ii)随后I_C蛋白内含子结构域从蛋白内含子的C末端到N末端编号{I_C-1，I_C-2，I_C-3...}(Perler，F.B.(2002).Nucl.Acids Res.30：383-384)。

这种编号系统使得难以在不同蛋白内含子之间比较不与剪接位点接近的保守氨基酸位点。为了方便指出这些保守氨基酸，本发明制定了基于保守蛋白内含子基序的命名方案。通过比较蛋白内含子氨基酸序列，观察到数个保守的基序(motif)。对这些基序有两个命名法：(i)模块A、B、C、D、E、H、F、G(Pietrokovski，S.(1994)Protein Sci 3：2340-50，Telenti，A.et al.(1997)J.Bacteriol.179：6378-82)和(ii)模块N1、N3、EN1、EN2、EN3、EN4、C2和C1(Pietrokovski，S.(1998)Protein Sci.7：64-71)。本发明使用A、B、C、D、E、H、F、G命名法，并且从N末端到C末端，对保守模块中的每个氨基酸位置指定一个数字。例如，I_C+1，其在模块G中为从N末端起的第8个氨基酸，标记为G8。类似地，I_N+1，其为模块A中从N末端起的第1个氨基酸，标记为A1。I_N蛋白内含子结构域含有模块A和B，I_C蛋白内含子结构域含有模块F和G。待环化区域或蛋白外显子从N末端向C末端编号{I_C+1，I_C+2，I_C+3，...，I_N-3，I_N-2，I_N-1}(关于编号方案参见图8)。

在本文中，位于剪接点5氨基酸以内的氨基酸将采用两种协议命名，即I_C+1(G8)。离剪接点5个氨基酸以上的氨基酸将采用它们保守的模块和氨基酸编号指出。

蛋白内含子介导的蛋白剪接的机制

对于蛋白内含子介导的蛋白剪接提出了两种机制。第一种是最常见的，称为“标准”机制(图9)。第二种较不常见的机制称为“非标准”机制(图10)。标准机制中的步骤1涉及位置I_N+1(A1)处的N-X酰基转换(其中X＝Cys或Ser)。酰基转换向肽的酰胺骨架引入了硫酯或酯。酯键比酰胺键更不稳定，因此为步骤2(酯交换反应)提供了良好的离去基团。酯键的形成还使酯键在步骤2(酯交换反应)中处于I_C+1(G8)Ser或Cys亲核试剂攻击的位置(Southworth，M.W.et al.(2000)EMBO J.19：5019-5026，Poland，B.W.et al.(2000)J.Biol.Chem.275：16408-16413)。在步骤2(酯交换反应)中，位置I_C+1(G8)的Cys、Ser或Thr可用作亲核试剂与步骤1(N-X酰基转换)中形成的硫酯或酯键反应。这导致I_N结构域在位置I_N+1(A1)和I_N-1的氨基酸之间从蛋白内含子的切割，并通过I_C+1(G8)和I_N-1之间的硫酯或酯键形成分支中间物。在步骤3中，Asn环化切割了连接I_C+1(G8)和I_C-1(G7)位置上氨基酸的酰胺键并释放蛋白外显子，其含有I_C+1(G8)和I_N-1之间的硫酯或酯键。Gln也出现在位置I_C-1(G7)，并经历类似的环化反应(Pietrokovski，S.(1998)Protein Sci.7：64-71)。最后一步，内酯向内酰胺的转化将蛋白外显子中I_C+1(G8)和I_N-1之间的酯键转变为酰胺键。基于InBase数据库中的344条蛋白内含子序列(Perler，F.B.(2002).Nucl.Acids Res.30：383-384)，以下氨基酸出现在上述位置：Cys(281/344)和Ser(34/344)出现在位置I_N+1(A1)；Cys(139/344)、Ser(120/344)和Thr(81/344)出现在位置I_C+1(G8)；Asn(327/344)和Gln(15/344)出现在位置I_C-1(G7)。

在非标准机制中，没有N-X酰基转换(标准机制中的步骤1)。对于采用非标准机制的蛋白内含子而言，位置I_N+1(A1)的Ser或Cys由Ala替换。InBase(Perler，F.B.(2002)Nuct.Acids Res.30：383-384)中，Ala在25/344蛋白内含子中存在于I_N+1(A1)。在I_N+1(A1)位置具有Ala的蛋白内含子利用位置I_C+1(G8)处的氨基酸，经历对I_N-1至I_N+1(A1)的肽骨架的直接亲核攻击(图10)(Southworth，M.W.et al.(2000)EMBOJ.19：5019-5026)。在采用非标准机制的蛋白内含子中不需要步骤1(N-X酰基转换)，因为对于I_C+1(G8)处的亲核试剂的直接攻击，已经排列了酰胺键，因此它们不需要步骤1(N-X酰基转换)产生的骨架延伸(Southworth，M.W.et al.(2000)EMBO J.19：5019-5026，Poland，B.W.etal.(2000)J.Biol.Chem.275：16408-16413)。

在直接参与到剪接的3个位置(I_C+1(G8)、I_C-1(G7)和I_N+1(A1))也观察到其它的氨基酸替代。这些蛋白内含子也可以使用不用于标准机制的蛋白内含子剪接机制。例如，曾鉴定Asp在I_C-1(G7)处替换Asn(1/344)(Amitai，G.et al.(2004)J.Biol.Chem.279：3121-3131)。这种蛋白内含子可以在标准机制的步骤3(Asn环化)中经历Asp环化。但是即使Asp突变为Ala，这种蛋白内含子仍能够剪接，这表明还有未确定的蛋白内含子剪接的非标准机制(Amitai，G.et al.(2004)J.Biol.Chem.279：3121-3131)。

已经鉴定了数种其它的蛋白内含子，它们也在直接涉及剪接的3氨基酸(I_C+1(G8)、I_C-1(G7)和I_N+1(A1))处具有其它的氨基酸。对于这些蛋白内含子，还没有关于它们剪接机制或它们是否能够剪接的信息。在所指出位置含有其它氨基酸的这些蛋白内含子的一些实例包括：位置I_N+1(A1)的Gln(2/344)(Cth TerA和PhiEL ORF11蛋白内含子)、Met(1/344)(PhiEL ORF40蛋白内含子)和Pro(1/344)(Mbe DnaB蛋白内含子)；位置I_C+1(G8)的Val(2/344)(Cth ATpase和Pfi Fha)、Gly(1/344)(Avin PIR1)和Tyr(1/344)(Mmag Magn8951)；以及位置I_C-1(G7)的His(1/344)(Mga SufB(Mga Pps1))。

描述蛋白内含子反应中的中间体结构

对蛋白内含子介导的剪接机制的了解使得我们能够在该机制的不同点中断剪接并分离出在很多生物学应用中有用的突变蛋白内含子。本发明中描述的突变蛋白内含子指在蛋白内含子介导的蛋白环化反应中的突变体(图11)。这些突变体称为未加工蛋白内含子、双半胱氨酸蛋白内含子和套索蛋白内含子。这3种蛋白内含子以产生它们所需的突变来描述。

为了产生未加工蛋白内含子，需要抑制步骤2(酯交换反应)。酯交换反应释放I_N结构域。如果I_N结构域被释放，则负责这种突变体支架能力的I_C-I_N结构域相互作用被破坏。为了进一步稳定未加工蛋白内含子，步骤1(N-X酰基转换)也应该被抑制。步骤1(N-X酰基转换)导致蛋白外显子-I_N连接点处、I_N-1和I_N+1(A1)之间形成硫酯或酯键。硫酯键或酯键比酰胺键更容易水解。水解导致在蛋白外显子-I_N连接点处的切割并释放I_N结构域。由于Asn环化(步骤3)，I_C-1(G7)和I_C+1(G8)之间I_C-蛋白外显子连接点处的切割也以低速率发生(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。为了针对Asn环化对I_C-蛋白外显子的切割而稳定蛋白内含子，步骤3(Asn环化)也应该被抑制。抑制蛋白内含子反应中的全部3个步骤(N-X酰基转换、酯交换反应和Asn环化)产生最稳定的未加工蛋白内含子(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。

双半胱氨酸蛋白内含子在I_C+1(G8)和I_N+1(A1)位置上具有Cys，它们用于交联与靶相互作用的肽、基因组片段或ScFv。因为这些氨基酸可在蛋白内含子反应的步骤1(N-X酰基转换)和步骤2(酯交换反应)中起亲核试剂的作用，所以需要抑制这些步骤而不突变这些Cys的策略。最低限度，步骤2(酯交换反应)需要被抑制以防止在I_C+1(G8)和蛋白外显子的最后残基I_N-1之间形成不稳定的硫酯键(其导致对I_N结构域的切割)。与未加工蛋白内含子类似，可通过抑制步骤1(N-X酰基转换)来稳定双半胱氨酸蛋白内含子，其防止了蛋白外显子-I_N酯或硫酯的水解。可通过抑制步骤3(Asn环化)来进一步稳定双半胱氨酸蛋白内含子，其防止了I_C-1(G7)和I_C+1(G8)之间的I_C-蛋白外显子切割。

通过在蛋白内含子反应中抑制步骤3(Asn环化)来产生套索蛋白内含子。套索蛋白内含子是通过内酯键环化，这比酰胺键更容易水解。可通过抑制内酯键的水解来进一步稳定套索。

抑制蛋白内含子反应中的步骤的方法概述

如下文所述，这些策略可单独使用，或者组合使用以产生未加工蛋白内含子、双半胱氨酸蛋白内含子或套索蛋白内含子。

步骤1：N-X酰基转换

N-X酰基转换涉及I_N+1(A1)亲核试剂，其通常为Ser或Cys。尽管Thr通常不存在于位置I_N+1(A1)，但是它也可以在步骤1(N-X酰基转换)中潜在地起亲核试剂的作用。步骤1(N-X酰基转换)产生替换I_N+1(A1)残基和I_N-1残基(蛋白外显子的最后一个残基)间酰胺键的酯键或硫酯键。酯或硫酯为步骤2(酯交换反应)形成良好的离去基团，但是酯或硫酯键容易水解，这可导致蛋白外显子-I_N在I_N-1和I_N+1(A1)之间的切割。因此，如果步骤2(酯交换反应)被抑制，则水解导致的I_N切割会成为副产物。参与催化N-X酰基转换的氨基酸的突变可阻断蛋白内含子反应中的步骤1。在其中形成N-X酰基键的催化口袋含有模块B中的氨基酸：B7(Thr69^Ssp DnaE、Thr70^Ssp DnaB)、B9(Asn72^Ssp DnaB)、B10(His72^Ssp DnaE、His73^Ssp DnaB)，模块F中的氨基酸：F2(Val134^Ssp DnaB)、F3(Phe139^Ssp DnaE)、F4(Asp140^Ssp DnaE)，模块A和B之间的氨基酸：Arg50^Ssp DnaE、Thr51^Ssp DnaB、Lys54^Ssp DnaB，模块A中的亲核试剂：A1(Cys1^Ssp DnaE)、模块A中的邻近氨基酸：A2(Leu2^Ssp DnaE)，以及蛋白外显子的最后一个残基：I_N-1(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105，Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)。

以下的策略可用于抑制蛋白内含子反应中的步骤1(N-X酰基转换)。这些策略可用于产生未加工蛋白内含子和双半胱氨酸蛋白内含子。

策略1.1：突变I_N+1(A1)亲核试剂。I_N+1(A1)突变为非亲核氨基酸防止了酯或硫酯的形成(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142，Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105，Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。位置I_N+1(A1)处的Ser突变为Ala阻止了Psp Pol-I蛋白内含子中的步骤1(N-X酰基转换)(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。位置I_N+1(A1)处的Cys突变为Arg、Gly或Val抑制了Sce VMA蛋白内含子中的步骤1(N-X酰基转换)(Cooper，A.A.et al.(1993)EMBO J.12：2575-2583)。当位置I_N+1处的亲核试剂突变为另一亲核氨基酸时，很多蛋白内含子被抑制。一些实例包括Psp Pol-I蛋白内含子，当SerI_N+1(A1)突变为Cys时，剪接效率低，当Ser突变为Thr时，则完全阻断(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。类似地，Sce VMA1蛋白内含子不能容忍I_N+1(A1)处的Cys突变为Ser(Hirata，R.& Anraku，Y.(1992)Biochem.Biophys.Res.Commun.188：40-47，Cooper，A.A.et al.(1993)EMBO J.12：2575-2583)。策略1.1可用于抑制采用标准机制的蛋白内含子中的步骤1(N-X酰基转换)。

策略1.2：F3氨基酸的突变。分析Ssp DnaE、PISceI和Ssp DnaB蛋白内含子结构揭示出F3位置的氨基酸位于催化口袋(N-X酰基键在这里形成)中。Ssp DnaE中位置F3处Phe突变为Ala抑制了I_N-1和I_N+1之间酯或硫酯的形成(Ghosh，I.et al.(2001)J.Biol.Chem.276：24051-24058)。

策略1.3：突变I_N+1(A1)氢键距离内的氨基酸。分析Ssp DnaE、PI SceI和Ssp DnaB蛋白内含子结构揭示出Ssp DnaE内的Arg50(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105)和Ssp DnaB内的Thr51(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)与I_N+1(A1)亲核试剂相互作用。根据可选择的实施方案，突变I_N+1(A1)氢键距离内的氨基酸可以用于破坏步骤1(N-X酰基转换)或步骤2(酯交换反应)。在可选择的方面，阻断步骤1的突变相应地可以包括位置B9、B10或F2(与SspDnaE内的Arg50和SspDnaB内的Thr51等价的氨基酸)的替换，包括这些位置处的非催化性氨基酸的替换。

步骤2：酯交换反应

酯交换反应涉及位置I_C+1(G8)的亲核氨基酸攻击步骤1(N-X酰基转换)中形成的酯或硫酯键，这导致了I_C+1(G8)和I_N-1之间酯或硫酯键的形成。酯交换反应从I_C-蛋白外显子结构域(断裂蛋白内含子产物)释放I_N结构域。在I_C+1(G8)残基和I_N-1之间形成的酯或硫酯键可以潜在地被水解而产生由I_C-蛋白外显子构成的线性蛋白内含子产物(断裂蛋白内含子产物)。发现催化口袋中I_C+2和I_N-1用于酯交换反应，并且有可能影响剪接。

以下的策略可用于抑制蛋白内含子反应中的步骤2(酯交换反应)。这些策略可用于产生未加工蛋白内含子和双半胱氨酸蛋白内含子。

策略2.1：I_C+1(G8)亲核试剂的突变。I_C+1(G8)位置的氨基酸在酯交换反应中起亲核试剂的作用。I_C+1(G8)位置的亲核氨基酸的突变抑制酯交换反应。例如，以下的在I_C+1(G8)位置的突变阻断酯交换反应：Psp pol蛋白内含子中Ser突变为Ala(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)；Mja Klb蛋白内含子中Cys突变为Ala(Southworth，M.W.et al.(2000)EMBO J.19：5019-5026)；以及Sce Tfp1蛋白内含子中Cys突变为Arg、Gly或Val(Cooper，A.A.et al.(1993)EMBO J.12：2575-2583)。Sce VMA蛋白内含子中，当I_C+1(G8)Cys突变为Pro时，在体外Asn环化被强烈抑制；被Val、Ile、Asp、Glu、Lys、Arg和His中度至强烈抑制；被Gly、Leu、Asn、Trp、Phe和Tyr中度抑制；被Met、Ala、Gln较弱抑制(New England Biolabs，IMPACT^TM-CN蛋白纯化系统)。

在Sce VMA蛋白内含子中，I_C+1(G8)处Cys突变为Ser抑制了酯交换反应，但是稳定了分支中间体(Chong，S.et al.(1996)J.Biol.Chem.271：22159-22168，Cooper，A.A.et al.(1993)EMBO J.12：2575-2583)。在I_C+1(G8)位置采用其它亲核氨基酸，某些蛋白内含子不能起作用(Shingledecker，K.et al.(2000)Archives Biochem.Biophys.375：138-144)。例如，在Psp Pol-I蛋白内含子中，当Ser I_C+1(G8)突变为Cys或Thr时，步骤2(酯交换反应)被抑制(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。类似地，在Sce VMA1蛋白内含子中，位置I_C+1(G8)处Cys突变为Ser抑制了步骤2(酯交换反应)(Hirata，R.& Anraku，Y.(1992)Biochem.Biophys.Res.Commun.188：40-47)。

策略2.2：突变B7氨基酸。分析Ssp DnaE、PI SceI和Ssp DnaB蛋白内含子结构提示位置B7处的氨基酸参与了步骤2(酯交换反应)。位置B7的氨基酸(Thr69^Ssp DnaE(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105)、Thr73^Ssp DnaE(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)以及Asp76^PI Scel(Werner，E.et al.(2002)Nucl.AcidRes.30：3962-3971))稳定了位置I_N+1(A1)处Cys的羰基氧。突变研究证实了B7在步骤2(酯交换反应)中的作用。位置B7处的Thr突变为Ala抑制了Ssp DnaE蛋白内含子中的酯交换反应；在体外可通过切割酯或硫酯键的DTT诱导I_N切割，表明带有这种突变时发生步骤1(N-X酰基转换)以及可能的步骤2(酯交换反应)(Ghosh，I.et al.(2001)J.Biol.Chem.276：24051-24058)。其它的以Mja KlbA蛋白内含子(其使用非标准机制)进行的实验显示，位置B7处的Thr突变为Ala抑制了DTT存在下的酯或硫酯切割(Southworth，M.W.et al.(2000)EMBO J.19：5019-5026)。在Mja KlbA蛋白内含子中，I_C+1亲核试剂直接攻击I_N-1和I_N+1(A1)之间的酰胺键，对DTT敏感的唯一键为步骤2(酯交换反应)形成的分支中间体中的酯或硫酯。这表明步骤2(酯交换反应)被位置B7处的突变所抑制。

策略2.3：B10氨基酸的突变。分析Ssp DnaE、PI SceI和Ssp DnaB蛋白内含子结构提示B10参与了I_N-蛋白外显子剪接。位置B10处的氨基酸(His72^Ssp DnaE(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105)，His73^Ssp DnaB(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)以及His79^PI SceI(Werner，E.et al.(2002)Nucl.Acid Res.30：3962-3971))与位置A1(I_N+1)处的Cys1^Ssp DnaE的酰胺氮形成氢键。突变研究证实了其在酯交换反应中的作用。位置B10处的His突变为Ala阻止了Ssp DnaE蛋白内含子中的剪接，但是在体外采用切割酯或硫酯键的DTT可诱导I_N切割，表明带有B10突变时发生了步骤1(N-X酰基转换)(Ghosh，I.et al.(2001)J.Biol.Chem.276：24051-24058)。其它的以Mja KlbA蛋白内含子(其使用非标准机制)进行的实验显示，位置B10处的His突变为Ala抑制了DTT存在下的酯或硫酯切割(Southworth，M.W.et al.(2000)EMBO J.19：5019-5026)。在Mja KlbA蛋白内含子中，I_C+1亲核试剂直接攻击I_N-1和I_N+1(A1)之间的酰胺键，对DTT敏感的唯一键为步骤2(酯交换反应)形成的分支中间体中的酯或硫酯。这表明步骤2(酯交换反应)被位置B10处的突变所抑制。

策略2.4：在剪接位点附近引入带电氨基酸。Psp Pol中位置I_N+2(A2)的Leu突变为Lys或Psp Pol中位置I_C-2(G6)的Ala突变为Lys阻止了对I_N结构域的切割(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。Sce VMA蛋白内含子中位置I_C-2(G6)的Val突变为Arg或Phe阻断了剪接，但是Ser、Cys、Ile和Gly突变不抑制剪接(Cooper，A.A.et al.(1993)EMBO J.12：2575-2583)。在位置I_N+2(A2)和I_C-2(G6)引入电荷的突变应该会抑制酯交换反应。

策略2.5：突变F4氨基酸。分析蛋白内含子结构揭示，位置F4氨基酸(Asp140^Ssp DnaE)与I_N-1(Tyr-1^Ssp DnaE)氨基酸的羰基氧形成氢键(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105)。Ssp DnaE蛋白内含子中Asp140突变为Ala会阻止剪接(Ghosh，I.et al.(2001)J.Biol.Chem.276：24051-24058)。

策略2.6：锌介导的抑制。锌与I_C+1(G8)亲核试剂配位并阻止剪接(Mills，K.V.& Paulus，H.(2001)J.Biol.Chem.276：10832-10838)。以大于10μM的浓度添加锌将阻断酯交换反应。

策略2.7：位置F6的氨基酸与Ser(G8)配位，用于攻击步骤1中形成的硫酯。因此，位置F6处突变为非催化性残基可以用于阻断步骤2。

步骤3：Asn环化：步骤3(Asn环化)导致从蛋白外显子切除I_C结构域。这个步骤的最常见机制涉及到Asn环化。InBase数据库中344个蛋白内含子中的327个采用了这种机制。第二种最常见的方法涉及Gln环化，其被InBase数据库中344个蛋白内含子中的15个采用。以下的氨基酸对于形成用于Asn环化的催化口袋是重要的：Block B：B11(Arg73^Ssp DnaE)；模块F：F5(Leu137^Ssp DnaB)、F6(Thr138^Ssp DnaB)、F7(Val139^Ssp DnaB、Leu143^Ssp DnaE)、F13(His143^Ssp DnaB、His147^Ssp DnaE)；模块G：G6(His153^Ssp DnaB)、G7(Asn154^Ssp DnaB、Asn159^Ssp DnaE)、G8(Ser155^Ssp DnaE、Cys160^Ssp Dna)、蛋白外显子的第二残基(I_C+2)、以及蛋白外显子的最后一个残基(I_N-1)(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105，Ding，Y.el al.(2003)J.Biol.Chem.278：39133-39142)。

为了产生套索蛋白内含子、未加工蛋白内含子和双半胱氨酸蛋白内含子，需要阻断Asn环化的突变。已开发了以下的策略抑制Asn环化。

策略3.1：突变位置I_C-1(G7)处的氨基酸。突变位置I_C-1(G7)处的氨基酸为任何非天然氨基酸都抑制步骤3(Asn环化)。位置I_C-1(G7)处的Asn突变为Gln和Asp可能不会阻断步骤3(Asn环化)(Amitai，G.et al.(2004)J.Biol.Chem.279：3121-3131)，因此应该避免。Sce Tfp1蛋白内含子中位置I_C-1(G7)处的Asn突变为Lys、Ala、Tyr、Gln、Glu、His和Asp都抑制步骤3(Asn环化)(Cooper，A.A.et al.(1993)EMBO J.12：2575-2583)。除了抑制步骤3(Asn环化)，位置I_C-1(G7)处的Asn突变为疏水性氨基酸也可以稳定步骤2(酯交换反应)中形成的酯或硫酯。这种推测是基于当位置I_C-2(G6)处的His突变为Leu、Asn或Gln时观察到分支中间体的积累(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。因此，位置I_C-1(G7)处的Asn的某些突变可以稳定套索。

当Sce VMA蛋白内含子中位置I_C-1(G7)处的Asn突变时，观察到分支中间体积累，这进一步支持了这种推测。位置I_C-1(G7)处的Asn突变为Ser或Ala(Chong，S.et al.(1996)J.Biol.Chem.271：22159-22168)不会导致分支中间体的积累，但是位置I_C-1(G7)处的Asn突变为Lys导致了分支中间体的积累(Kawasaki M.et al.(1997)J.Biol.Chem.272：15668-15674)。Sce VMA蛋白内含子中，位置I_C-1(G7)处的Asn突变为Ala并且位置I_C+1(G8)处的Cys突变为Ser导致分支中间体的积累(Chong，S.et al.(1996)J.Biol.Chem.271：22159-22168)。酯交换反应中形成的酯或硫酯键的周围环境似乎在稳定分支中间体方面起作用。

策略3.2：突变与位置I_C-1(G7)处的Asn羰基氧形成氢键的位置G6(I_C-2)或B11处的氨基酸。位置I_C-2(G6)处的His通过与位置I_C-1(G7)处的Asn羰基氧形成氢键而使这个肽键更不稳定(Klabunde，T.et al.(1998)Nat.Struct.Biol.5：31-36，Duan，X.et al.(1997)Cell89：555-564)，来协助Asn环化(Xu，M.& Perier，F.B.(1996)EMBO J.15：5146-5153)。但是，在位置I_C-2(G6)处具有Ala而不是His的Ssp DnaE和其它蛋白内含子中，关于位置I_C-2(G6)在步骤3(Asn环化)中的作用的报道不一致。对Ssp DnaE(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105)和Ssp DnaB(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)的结构分析提供了对位置I_C-2(G6)处氨基酸作用的了解。在Ssp DnaB蛋白内含子中，位置I_C-2(G6)处His结合位置I_C-1(G7)处的Asn羰基氧。在Ssp DnaE蛋白内含子中，位置B11处的Arg结合位置I_C-1(G7)处的Asn羰基氧(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)。采用His或Arg与Asn羰基氧相互作用取决于蛋白内含子中的残基。蛋白外显子中位置(I_C+2)的Phe和位置(I_N-4)的Phe形成疏水口袋，与位置I_C-2(G6)处的His的咪唑环相互作用，这防止了其与位置I_C-1(G7)处的Asn羰基氧相互作用(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105)。Psp pol-I蛋白内含子中位置I_C-2(G6)处的His突变为Leu、Asn和Gln导致分支中间体的积累(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。His I_C-2(G6)突变为Gln防止了SceVMA蛋白内含子中的Ans环化(New England Biolabs，IMPAC^TM-CN蛋白纯化系统)。但是当位置I_C-2(G6)的His突变为Leu并且位置I_C-1(G7)处Asn突变为Ala，则无分支中间体积累，表明Asn对于分支中间体积累是重要的。目前，还没有关于位置B11处的Arg在积累分支中间体中的作用的诱变研究。

策略3.3：突变位置F 13处的氨基酸。Ssp DnaB蛋白内含子中位置F13处的His突变为Gln阻断了步骤3(Asn环化)(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)。Ssp DnaB蛋白内含子中位置F13处的His突变为Ala仅部分地抑制步骤3(Asn环化)(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)。

策略3.4：突变位置F14处的氨基酸。Ssp DnaE蛋白内含子中位置F14处的Asn突变为Ala抑制了Asn环化(Ghosh，I.et al.(2001)J.Biol.Chem.276：24051-24058)。但是，Ssp DnaB蛋白内含子中位置F14处Asn突变为Ala对于步骤3(Asn环化)无影响(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)。

策略3.5：突变位置F15处的氨基酸。位置F15处的氨基酸高度保守。Ssp DnaB蛋白内含子中位置F15处Phe突变为Ala阻断了步骤3(Asn环化)(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)。SspDnaB蛋白内含子中位置F15处Phe突变为Tyr轻微抑制了步骤3(Asn环化)(Ding，Y.et al.(2003)J.Biol.Chem.278：39133-39142)。

策略4：突变蛋白外显子区域。蛋白外显子中接近剪接位点的氨基酸影响剪接。Evans等人提供证据表明，蛋白外显子-I_N连接点处I_N-1、I_N-2氨基酸，以及I_C-蛋白外显子连接点处I_C+2、I_C+3、I_C+4氨基酸为SspDnaE蛋白内含子中剪接所需(Evans，T.C.Jr.et al.(2000)J.Biol.Chem.275：9091-9094)。在Ssp DnaE蛋白内含子中，蛋白外显子中位置I_C+2处氨基酸参与了蛋白内含子介导的剪接(Iwai，H.et al.(2006)FEBSLett.580：1853-1858)。Ssp DnaE蛋白内含子中位置I_C+2处Phe突变为不同于Phe、Tyr或Trp的氨基酸抑制了蛋白内含子介导的剪接(Iwai，H.et al.(2006)FEBS Lett.580：1853-1858)。含有来自Npu DnaE蛋白内含子的I_N结构域和来自Ssp DnaE蛋白内含子的I_C结构域的混合蛋白内含子更能容忍该位置上的氨基酸替换(Iwai，H.et al.(2006)FEBS Lett.580：1853-1858)。因此当采用某些蛋白内含子时，在随机文库中固定该氨基酸可能是有益的。位置I_N-1的氨基酸出现在N-X酰基转换催化口袋中(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105)。Ssp DnaE中，已提出位置I_N-1的Tyr起开关作用，在步骤2(酯交换反应)完成之前防止步骤3(Asn环化)发生(Sun，P.et al.(2005)J.Mol.Biol.353：1093-1105)。经修饰的用于蛋白纯化的Sce VMA蛋白内含子以C末端与靶蛋白融合，该Sce VMA被突变以防止步骤3(Asn环化)和步骤2(酯交换反应)发生，仅允许步骤1(N-X酰基转换)发生。Sce VMA蛋白内含子中位置I_N-1处的某些氨基酸允许步骤1(N-X酰基转换)在体内发生：Thr、Glu、His、Arg和Asp。以下氨基酸在Sce VMA蛋白内含子中位置I_N-1处时体内抑制步骤1(N-X酰基转换)，但体外不抑制：Gly、Ala、Ile、Leu、Met、Phe、Val、Gln、Ser、Trp、Tyr和Lys。位置I_N-1处的以下氨基酸在Sce VMA蛋白内含子中、在体内和体外都抑制步骤1(N-X酰基转换)：Asn、Cys和Pro(New England Biolabs，IMPACT^TM-CN蛋白纯化系统)。在剪接连接点附近固定蛋白外显子氨基酸为产生套索蛋白内含子的有用策略。

蛋白内含子说明

未加工蛋白内含子说明

在未加工蛋白内含子中，不形成环化肽或“绞索”。I_N和I_C结构域折叠，以受限的环状构象展示肽、ScFv或基因组片段(图12)。对于构建未加工蛋白内含子而言最重要的突变为抑制步骤2(酯交换反应)的突变(图12)。当仅仅步骤2(酯交换反应)被抑制时，未加工蛋白内含子仍可能经历步骤1(N-X酰基转换)和步骤3(Asn环化)(图12)。如果发生步骤1(N-X酰基转换)，则I_N+1(A1)和I_N-1处形成蛋白外显子-I_N边界的氨基酸将通过酯或硫酯键连接。这种键比酰胺键更快速地水解，导致释放出I_N结构域。如果步骤3(Ans环化)发生，则Asn环化仍将以低速率发生，导致蛋白外显子-I_C切割。为了稳定未加工蛋白内含子，需要抑制步骤1(N-X酰基转换)和步骤3(Asn环化)。

对于所描述的每种策略，可能有多种氨基酸替换起作用。例如，在策略2.1中，可能通过将位置I_C+1(G8)处的Ser突变为Ala而阻断步骤2(酯交换反应)。也可能通过将位置I_C+1(G8)处的Ser突变为其它氨基酸而将其阻断。当策略提到突变时，有可能是达到相同结果的在该位点的多种氨基酸替换。

通过抑制步骤2(酯交换反应)产生未加工蛋白内含子可采用仅抑制步骤2(酯交换反应)的单一策略或策略组合来产生未加工蛋白内含子。如果I_C+1(G8)不是Cys，则策略2.6将没有效果，剩下策略(2.1-2.5)，产生了总共2⁵-1＝31个策略用于抑制步骤2。如果I_C+1(G8)是Cys，则所有的6种策略(2.1-2.6)都可用于抑制步骤2(酯交换反应)，产生了总共2⁶-1＝63种策略用于抑制步骤2。以下说明将上述策略2.1-2.6应用于未加工蛋白内含子。

为了采用策略2.1抑制步骤2，位置I_C+1(G8)处的氨基酸需要突变为不能在步骤2(酯交换反应)中起亲核试剂作用的氨基酸。列在InBase中的蛋白内含子在位置I_C+1(G8)处含有Ser、Cys和Thr。I_C+1(G8)突变为任何其它氨基酸将抑制步骤2(酯交换反应)。但是，某些蛋白内含子仅能在位置I_C+1(G8)采用特定的亲核氨基酸(Shingledecker，K.et al.(2000)Archives Biochem.Biophys.375：138-144)。因此，对于这些蛋白内含子，可通过以另一亲核性氨基酸替换位置I_C+1(G8)处野生型氨基酸来抑制步骤2(酯交换反应)(Shingledecker，K.et al.(2000)Arch.Biochem.Biophys.375：138-144)。例如，在Psp Pol-I蛋白内含子中，当Ser I_C+1(G8)突变为Cys或Thr时，步骤2(酯交换反应)被抑制(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。类似地，在Sce VMA1蛋白内含子中，突变位置I_C+1(G8)处的Cys为Ser抑制步骤2(酯交换反应)(Hirata，R.& Anraku，Y.(1992)Biochem.Biophys.Res.Commun.188：40-47)。

为了采用策略2.2抑制步骤2，位置B7处的氨基酸需要突变为不能与位置I_N+1(A1)处的羰基氧形成氢键的氨基酸。以下的氨基酸在InBase中列出的蛋白内含子的位置B7处出现多次：Thr、Ser、Asn、Asp、Cys以及Glu。位置B7处的氨基酸突变为除了Thr、Ser、Asn、Asp、Cys和Glu之外的任何其它氨基酸将抑制步骤2(酯交换反应)。但是，某些蛋白内含子仅能够在位置B7采用特定氨基酸。因而，对于这些蛋白内含子，可通过以任何其它氨基酸替换位置B7处野生型氨基酸来抑制步骤2(酯交换反应)。

为了采用策略2.3抑制步骤2，位置B10处氨基酸需要突变为不能与位置I_N+1(A1)处酰胺氮形成氢键的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子的位置B10处最常见氨基酸为His和Thr。氨基酸Asp和Lys也出现在位置B10，尽管频率比His和Thr低得多。这些氨基酸能够与位置I_N+1(A1)处酰胺氮形成氢键，并且将位置B10处氨基酸突变为除了His、Thr、Asp和Lys之外的任何其它氨基酸都将抑制步骤2(酯交换反应)。但是，某些蛋白内含子仅能在位置B10采用特定氨基酸。因而，对于这些蛋白内含子，可通过以另一氨基酸替换位置B10处野生型氨基酸来抑制步骤2(酯交换反应)。

为了采用策略2.4抑制步骤2，在剪接位点附近引入带电氨基酸。列在InBase中的被认为经历剪接的蛋白内含子在位置A2(I_N+2)主要含有Leu、Val、Phe和Ile。氨基酸His、Gln、Met、Gly、Cys、Ser、Thr和Tyr在少于10个蛋白内含子中出现在位置A2(I_N+2)。在位置G5(I_C-3)，最常出现的氨基酸为Val、Thr、Leu、Ala和Ser。氨基酸Cys、Ile、Asn和His在4个或更少的蛋白内含子中出现。位置A2(I_N+2)和G5(I_C-3)处最常见的氨基酸为疏水性的。在剪接位点附近引入Lys、Arg、Glu或Asp将抑制步骤2(酯交换反应)。但是，某些蛋白内含子仅能在位置A2(I_N+2)和G5(I_C-3)处采用特定氨基酸。因而，对于这些蛋白内含子，可通过以其它氨基酸替换位置A2(I_N+2)和G5(I_C-3)处野生型氨基酸来抑制步骤2(酯交换反应)。

为了采用策略2.5抑制步骤2，位置F4处的氨基酸需要突变为不能与I_N-1的羰基氧形成氢键的氨基酸。列在InBase中的被认为经历剪接的蛋白内含子在位置F4主要含有Asp、Cys、Thr、Trp、Ser和Asn。氨基酸Arg、Ala、Glu、Phe、Gly、Ile、Leu、Gln、Val和Tyr在5个或更少的蛋白内含子中出现。氨基酸Asp、Cys、Thr、Trp、Ser和Asn都可与I_N-1的羰基氧形成氢键。位置F4的氨基酸突变为不形成氢键的氨基酸将抑制步骤2(酯交换反应)。但是，某些蛋白内含子仅能在位置F4处采用特定氨基酸。因而，对于这些蛋白内含子，可通过以其它氨基酸替换位置F4处野生型氨基酸来抑制步骤2(酯交换反应)。

为了采用策略2.6抑制步骤2，I_C+1(G8)亲核试剂需要是Cys。当I_C+1(G8)亲核试剂是Cys时，向生长培养基中加入锌将抑制步骤2(酯交换反应)。

通过抑制步骤1(N-X酰基转换)产生未加工蛋白内含子

也可采用仅抑制步骤1(N-X酰基转换)的单一策略或组合策略来产生未加工蛋白内含子。有3种抑制步骤1(N-X酰基转换)的策略(1.1-1.3)，产生了总共2³-1＝7种抑制步骤1(N-X酰基转换)的策略。以下讨论应用策略1.1-1.3产生未加工蛋白内含子。

为了采用策略1.1抑制步骤1，位置A1(I_N+1)处的氨基酸需要突变为不能在步骤1(N-X酰基转换)中起亲核试剂作用的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子主要含有Cys、Ser，以及较少见的Ala。在该位置具有Ala的蛋白内含子经历如上所述的可选择的蛋白内含子机制。在标准蛋白内含子中，位置A1处的氨基酸突变为任何其它氨基酸都将抑制步骤1(N-X酰基转换)。但是，某些蛋白内含子仅能在位置A1(I_N+1)处使用特定亲核氨基酸。因此，对于这些蛋白内含子，可通过以其它亲核氨基酸替换位置A1(I_N+1)处的野生型氨基酸来抑制步骤1(N-X酰基转换)。例如，当Ser I_N+1(A1)突变为Cys时，Psp Pol-I蛋白内含子剪接较弱，而当Ser突变为Thr时，剪接被完全阻断(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。类似地，Sce VMA1蛋白内含子不能容忍位置I_N+1(A1)处的Cys突变为Ser(Hirata，R.& Anraku，Y.(1992)Biochem.Biophys.Res.Commun.188：40-47，Cooper，A.A.et al.(1993)EMBO J.12：2575-2583)。

为了采用策略1.2抑制步骤1，位置F3处的氨基酸需要突变为破坏N-X催化口袋的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子在位置F3处主要含有Tyr和Phe。氨基酸Glu、Ile、Arg、Val、Gln、Asp、Lys、Thr、His、Leu、Trp、Ser、Cys、Gly、Asn和Pro较少出现在该位置。位置F3的氨基酸突变为不同于Tyr或Phe的任何氨基酸都将抑制步骤1(N-X酰基转换)。但是，某些蛋白内含子仅能在位置F3处使用特定氨基酸。因此，对于这些蛋白内含子，可通过以其它氨基酸替换位置F3处野生型氨基酸来抑制步骤1(N-X酰基转换)。

为了采用策略1.3抑制步骤1，位于I_N+1(A1)亲核试剂的侧链的氢键距离内的氨基酸需要被突变。在这里发现的氨基酸不与保守蛋白内含子模块中的氨基酸对应。在Ssp DnaE和Ssp DnaB蛋白内含子中，Thr和Arg位于I_N+1(A1)亲核试剂的侧链的氢键距离内。Thr或Arg突变为不能与I_N+1(A1)亲核试剂的侧链形成氢键的氨基酸将抑制步骤1(N-X酰基转换)或步骤2(酯交换反应)。

通过抑制步骤1(N-X酰基转换)和步骤3(Asn环化)产生未加工蛋白内含子

可通过联合使用抑制步骤1(N-X酰基转换)的单一或组合策略和抑制步骤3(Asn环化)的单一或组合策略来产生稳定的未加工蛋白内含子。有3种抑制步骤1(N-X酰基转换)的策略(1.1-1.3)和5种抑制步骤3(Asn环化)的策略(3.1-3.5)，产生了总共(2³-1)×(2⁵-1)＝217种抑制步骤1(N-X酰基转换)和步骤3(Asn环化)的不同策略。应用策略1.1-1.3产生未加工蛋白内含子如上所述。以下说明应用策略3.1-3.5产生未加工蛋白内含子。

为了采用策略3.1抑制步骤3，位置I_C-1(G7)处的氨基酸需要突变为不能经历环化的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子在位置I_C-1(G7)处含有Asn和Gln。位置I_C-1(G7)处的氨基酸突变为不能经历侧链环化的氨基酸将抑制步骤3(Asn环化)。但是，某些蛋白内含子仅能在位置I_C-1(G7)使用特定氨基酸。因此，对于这些蛋白内含子，可通过以其它氨基酸替换位置I_C-1(G7)处的野生型氨基酸来抑制步骤3(Asn环化)。

为了采用策略3.2抑制步骤3，氨基酸G6(I_C-2)和/或B11(它们通过与位置I_C-1(G7)处的Asn羰基氧形成氢键而协助Asn环化)应该突变为不能与该氨基酸形成氢键的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子在位置G6(I_C-2)处含有His，较少见的是Gly、Ser、Ala和Cys。突变为除His外的任何氨基酸将抑制步骤3(Asn环化)。G6(I_C-2)处不存在His时，B11可通过与位置I_C-1(G7)处Asn羰基氧形成氢键而协助Asn环化。当G6不是His时，B11绝大多数情况下是Lys或Arg。在任一位置处突变为不带正电荷(Lys，Arg或His)的任何氨基酸都将抑制步骤3(Asn环化)。但是，某些蛋白内含子仅能在位置G6(I_C-2)或B11处使用特定氨基酸。因此，对于这些蛋白内含子，可通过以其它氨基酸替换位置G6(I_C-2)或B11处野生型氨基酸来抑制步骤3(Asn环化)。

为了采用策略3.3抑制步骤3，位置F13处的氨基酸需要突变为这样的氨基酸，即所述氨基酸不能通过配位水分子而作为位置I_C-1(G7)处Asn质子受体。InBase中列出的被认为经历剪接的蛋白内含子在位置F13处主要含有His，较少见的是Glu、Gln、Asn、Pro、Ser、Lys、Ala、Gly、Asp、Arg、Ile、Leu、Tyr、Trp、Val和Thr。如果野生型残基为His，则突变为其它氨基酸将抑制步骤3(Asn环化)。但是，某些蛋白内含子仅能在位置F13处使用特定氨基酸。因此，对于这些蛋白内含子，可通过以其它氨基酸替换位置F13处的野生型氨基酸来抑制步骤3(Asn环化)。

为了采用策略3.4抑制步骤3，位置F14处的氨基酸需要突变为抑制Asn环化的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子在位置F14处主要含有Asn。氨基酸Leu、Ser、Thr、Gln、Ala、Arg、Met、Phe、Val、Glu、Tyr、His、Lys、Cys、Asp和Ile较少出现。突变为任何其它氨基酸将破坏剪接位点，抑制步骤3(Asn环化)。但是，某些蛋白内含子仅能在位置F14处使用特定氨基酸。因此，对于这些蛋白内含子，可通过以其它氨基酸替换位置F14处的野生型氨基酸来抑制步骤3(Asn环化)。

为了采用策略3.5抑制步骤3，位置F15处的氨基酸需要突变为抑制Asn环化的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子在位置F15处主要含有Phe和Tyr。氨基酸Val、Gly、Asn、Ser、Thr、His、Ile、Trp、Ala和Glu也出现在位置15。F15位置与围绕剪接位点的氨基酸形成疏水接触并确定位置F13处氨基酸方向。位置F15处氨基酸从Phe或Tyr突变为除了Phe或Tyr之外的任何氨基酸都将抑制步骤3(Asn环化)。但是，某些蛋白内含子仅能在位置F15处使用特定氨基酸。因此，对于这些蛋白内含子，可通过以其它氨基酸替换位置F15处的野生型氨基酸来抑制步骤3(Asn环化)。

通过抑制步骤1(N-X酰基转换)和步骤2(酯交换反应)产生未加工蛋白内含子

3种策略(1.1-1.3)可用于抑制步骤1(N-X酰基转换)，如果I_C+1(G8)不是Cys则策略2.6不可用，并且仅有5种策略(2.1-2.5)可用于抑制步骤2(酯交换反应)，产生了总共(2³-1)×(2⁵-1)＝217种抑制步骤1(N-X酰基转换)和步骤2(酯交换反应)的策略。如果I_C+1(G8)是Cys，则有6种策略(2.1-2.6)可用于抑制步骤2(酯交换反应)，产生了总共(2³-1)×(2⁶-1)＝441种抑制步骤1(N-X酰基转换)和步骤2(酯交换反应)的策略。上文描述了应用策略1.1-1.3和2.1-2.6产生未加工蛋白内含子。

通过抑制步骤2(酯交换反应)和步骤3(Asn环化)产生未加工蛋白内含子

5种策略(3.1-3.5)可用于抑制步骤3(Asn环化)。如果I_C+1(G8)不是Cys，则策略2.6不可用，并且仅有5种策略(2.1-2.5)可用于抑制步骤2(酯交换反应)，产生了(2⁵-1)×(2⁵-1)＝961种策略用于抑制步骤1(N-X酰基转换)和步骤3(Asn环化)。如果I_C+1(G8)是Cys，则有6种策略(2.1-2.6)可用于抑制步骤2(酯交换反应)，产生了总共(2⁶-1)×(2⁵-1)＝1953种抑制步骤1(N-X酰基转换)和步骤3(Asn环化)的策略。上文描述了应用策略2.1-2.6和3.1-3.5产生未加工蛋白内含子。

通过抑制步骤1(N-X酰基转换)、步骤2(酯交换反应)和步骤3(Asn环化)产生未加工蛋白内含子

3种策略(1.1-1.3)可用于抑制步骤1(N-X酰基转换)，5种策略(3.1-3.5)可用于抑制步骤3(Asn环化)。如果I_C+1(G8)不是Cys则策略2.6不可用，剩下5种策略(2.1-2.5)抑制步骤2，产生了(2³-1)×(2⁵-1)×(2⁵-1)＝6727种策略用于抑制步骤1(N-X酰基转换)、步骤2(酯交换反应)和步骤3(Asn环化)。如果I_C+1(G8)是Cys，则有6种策略(2.1-2.6)可用于抑制步骤2，产生了(2³-1)×(2⁶-1)×(2⁵-1)＝13671种抑制步骤1(N-X酰基转换)、步骤2(酯交换反应)和步骤3(Asn环化)的策略。上文已经描述了将策略1.1-1.3、2.1-2.6和3.1-3.5应用于未加工蛋白内含子。

双半胱氨酸蛋白内含子说明

双半胱氨酸蛋白内含子在蛋白内含子介导的剪接反应中不经历任何步骤(图13)。位置I_C+1(G8)和I_N+1(A1)的Cys氨基酸被保留，而需要其它突变来抑制蛋白内含子加工。在选择了与给定靶相互作用的双半胱氨酸蛋白内含子后，可合成含有侧翼连接半胱氨酸残基的随机肽、ScFv或基因组片段的肽。然后这些肽、ScFv和基因组片段可通过二硫键或半胱氨酸交联剂约束。

位置I_C+1(G8)和I_N+1(A1)处的Cys氨基酸为双半胱氨酸蛋白内含子所需。策略2.2(锌抑制)为产生双半胱氨酸蛋白内含子的良好策略，因为它不需要I_C+1(G8)处的突变，并且抑制是可逆的。可选择地，采用不能容忍I_C+1(G8)和I_N+1(A1)处替换的蛋白内含子可用于产生双半胱氨酸蛋白内含子。例如，Psp Pol蛋白内含子在位置I_C+1和I_N+1处具有Ser，突变为Cys则抑制蛋白剪接(Xu，M.& Perler，F.B.(1996)EMBOJ.15：5146-5153)。

通过抑制步骤1(N-X酰基转换)产生双半胱氨酸蛋白内含子

可采用仅抑制步骤1(N-X酰基转换)的单一策略或组合策略来产生双半胱氨酸蛋白内含子。有3种策略(1.1-1.3)抑制步骤1(N-X酰基转换)，产生了2³-1＝7种抑制步骤1(N-X酰基转换)的策略。如果蛋白内含子在位置I_N+1(A1)处具有天然Cys，则不能使用策略1.1。因此有2²-1＝3种策略抑制步骤1(N-X酰基转换)。下文描述将策略1.1-1.3应用于双半胱氨酸蛋白内含子。

在策略1.1中，位置I_N+1(A1)处的氨基酸需要突变为Cys，或者如果其已经为Cys，则不需要改变。某些蛋白内含子仅能在位置I_N+1(A1)处使用特定亲核氨基酸。因此，对于这些蛋白内含子，以其它亲核氨基酸替换位置I_N+1(A1)处野生型氨基酸可抑制步骤1(N-X酰基转换)。例如，当Ser I_N+1(A1)突变为Cys时，Psp Pol-I蛋白内含子剪接弱(Xu，M.&Perler，F.B.(1996)EMBO J.15：5146-5153)。

为了采用策略1.2抑制步骤1(N-X酰基转换)，位置F3处的氨基酸需要突变为破坏N-X酰基转换催化口袋的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子在位置F3处主要含有Tyr和Phe。氨基酸Glu、Ile、Arg、Val、Gln、Asp、Lys、Thr、His、Leu、Trp、Ser、Cys、Gly、Asn和Pro较少出现在该位置。位置F3的氨基酸突变为不同于Tyr或Phe的任何氨基酸都将抑制步骤1(N-X酰基转换)。但是，某些蛋白内含子仅能在位置F3处使用特定氨基酸。因此，对于这些蛋白内含子，可通过以其它氨基酸替换F3处野生型氨基酸来抑制步骤1(N-X酰基转换)。

为了采用策略1.3抑制步骤1，位于I_N+1(A1)亲核试剂的侧链的氢键距离内的氨基酸需要被突变。该区域中的氨基酸不与保守蛋白内含子模块中的氨基酸对应。在Ssp DnaE和Ssp DnaB蛋白内含子中Thr51和Arg50位于I_N+1(A1)亲核试剂的侧链的氢键距离内。Thr或Arg突变为不能与I_N+1(A1)亲核试剂的侧链形成氢键的氨基酸将抑制步骤1(N-X酰基转换)或步骤2(酯交换反应)。

通过抑制步骤1(N-X酰基转换)和步骤3(Asn环化)产生双半胱氨酸蛋白内含子

可通过联合采用抑制步骤1(N-X酰基转换)的单一或组合策略和抑制步骤3(Asn环化)的单一或组合策略来产生稳定的双半胱氨酸蛋白内含子。有3种抑制步骤1(N-X酰基转换)的策略(1.1-1.3)和5种抑制步骤3(Asn环化)的策略，产生了总共(2³-1)×(2⁵-1)＝217种抑制步骤1(N-X酰基转换)和步骤3(Asn环化)的策略。如果蛋白内含子在位置I_N+1(A1)具有Cys，则策略1.1是不适合的。对于这种情况，有总共(2²-1)×(2⁵-1)＝93种策略抑制步骤1(N-X酰基转换)和步骤3(Asn环化)。应用策略1.1-1.3产生双半胱氨酸蛋白内含子如前所述。应用策略3.1-3.5产生双半胱氨酸蛋白内含子与用于未加工蛋白内含子相同。

通过抑制步骤1(N-X酰基转换)和步骤2(酯交换反应)产生双半胱氨酸蛋白内含子

可通过联合采用抑制步骤1(N-X酰基转换)的单一或组合策略和抑制步骤2(酯交换反应)的单一或组合策略来产生稳定的双半胱氨酸蛋白内含子。有3种抑制步骤1(N-X酰基转换)的策略(1.1-1.3)和6种抑制步骤2(酯交换反应)的策略，产生了总共(2³-1)×(2⁶-1)＝441种抑制步骤1(N-X酰基转换)和步骤2(酯交换反应)的策略。如果蛋白内含子的野生型氨基酸在位置I_N+1(A1)为Cys，则策略1.1是不适合的。对于这种情况，有总共(2²-1)×(2⁶-1)＝189种策略抑制步骤1(N-X酰基转换)和步骤2(酯交换反应)。如果蛋白内含子在位置I_C+1(G8)具有Cys，则策略2.1是不适合的。对于这种情况，有总共(2³-1)×(2⁵-1)＝217种策略抑制步骤1(N-X酰基转换)和步骤2(酯交换反应)。如果蛋白内含子的野生型氨基酸在位置I_C+1(G8)和I_N+1(A1)都为Cys，则策略1.1和2.1是不适合的。对于这种情况，有总共(2²-1)×(2⁵-1)＝93种策略抑制步骤1(N-X酰基转换)和步骤2(酯交换反应)。除了以下将讨论的策略2.1，对抑制步骤2(酯交换反应)的突变的描述参见未加工蛋白内含子。

在策略2.1中，位置I_C+1(G8)处的氨基酸需要突变为Cys。某些蛋白内含子仅能在位置I_C+1(G8)处使用特定亲核氨基酸，Cys突变将抑制步骤2(酯交换反应)。因此，对于这些蛋白内含子，可通过以其它亲核氨基酸替换位置I_C+1(G8)处的野生型氨基酸来抑制步骤2(酯交换反应)。例如，在Psp Pol-I蛋白内含子中，当Ser I_C+1(G8)突变为Cys时，步骤2(酯交换反应)被抑制(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)。

通过抑制步骤2(酯交换反应)和步骤3(Asn环化)产生双半胱氨酸蛋白内含子

可通过联合采用抑制步骤2(酯交换反应)的单一或组合策略和抑制步骤3(Asn环化)的单一或组合策略来产生稳定的双半胱氨酸蛋白内含子。有6种抑制步骤2(酯交换反应)的策略(2.1-2.6)和5种抑制步骤3(酯交换反应)策略(3.1-3.5)，产生了总共(2⁶-1)×(2⁵-1)＝1953种抑制步骤2(酯交换反应)和步骤3(Asn环化)的策略。如果在位置I_C+1(G8)处的野生型氨基酸为Cys，则策略2.1是不适合的，剩下5种抑制步骤2(酯交换反应)的策略(2.2-2.6)。这种情况下，有(2⁵-1)×(2⁵-1)＝961种抑制步骤2(酯交换反应)和步骤3(Asn环化)的策略。对于抑制步骤2(酯交换反应)和步骤3(Asn环化)的突变的说明参见未加工蛋白内含子，除了上述策略2.1。

通过抑制步骤1(N-X酰基转换)、步骤2(酯交换反应)和步骤3(Asn环化)产生双半胱氨酸蛋白内含子

可通过联合采用抑制步骤1(N-X酰基转换)的单一或组合策略、抑制步骤2(酯交换反应)的单一或组合策略、以及抑制步骤3(Asn环化)的单一或组合策略来产生稳定双半胱氨酸蛋白内含子。有3种抑制步骤1(N-X酰基转换)的策略(1.1-1.3)，6种抑制步骤2(酯交换反应)的策略(2.1-2.6)，5种抑制步骤3(Asn环化)的策略(3.1-3.5)，产生总共(2³-1)×(2⁶-1)×(2⁵-1)＝13671种抑制步骤1(N-X酰基转换)、步骤2(酯交换反应)和步骤3(Asn环化)的策略。如果蛋白内含子在位置I_N+1(A1)的野生型氨基酸为Cys，则策略1.1是不适合的。对于这种情况，有总共(2²-1)×(2⁶-1)×(2⁵-1)＝5859种抑制步骤1(N-X酰基转换)、步骤2(酯交换反应)和步骤3(Asn环化)的策略。如果蛋白内含子在位置I_C+1(G8)具有Cys，则策略2.1是不适合的。对于这种情况，有总共(2³-1)×(2⁵-1)×(2⁵-1)＝6727种抑制步骤1(N-X酰基转换)、步骤2(酯交换反应)和步骤3(Asn环化)的策略。如果蛋白内含子在位置I_C+1(G8)和I_N+1(A1)的野生型氨基酸都为Cys，则策略1.1和2.1是不适合的。对于这种情况，有总共(2²-1)×(2⁵-1)×(2⁵-1)＝2883种抑制步骤1(N-X酰基转换)、步骤2(酯交换反应)和步骤3(Asn环化)的策略。对抑制步骤1(N-X酰基转换)、步骤2(酯交换反应)和步骤3(Asn环化)的突变的描述参见未加工蛋白内含子，除了上述策略1.1和2.1。

套索蛋白内含子说明

通过允许蛋白内含子反应(图14)的前两步进行并阻断第三步(Asn环化)来产生套索蛋白内含子。防止水解而稳定酯键的任何围绕I_C+1(G8)的残基也应被并入。增强前两步的突变也是有益的。策略4对于产生强有力的套索文库也是有益，其中数量增加的文库成员形成套索。通过抑制步骤3(Asn环化)产生套索蛋白内含子

可通过采用抑制步骤3(Asn环化)的策略或抑制步骤3(Asn环化)的策略组合来产生套索蛋白内含子。有6种抑制步骤3(Asn环化)的策略，产生了总共2⁵-1＝31种抑制步骤3(Asn环化)的策略。策略2.6也可能适用，因为没有确定地证实锌阻断步骤2(酯交换反应)(Mills，K.V.& Paulus，H.(2001)J.Biol.Chem.276：10832-10838)。

在策略3.1中，位置I_C-1(G7)处的氨基酸需要突变为不能经历环化的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子在位置I_C-1(G7)处含有Asn和Gln。位置I_C-1(G7)处的氨基酸突变为除了Asn、Gln和Asp之外的任何氨基酸都将抑制步骤3(Asn环化)。I_C-1(G7)的特定突变也可导致分支中间体(套索)稳定。I_C-1(G7)氨基酸突变为Lys(Kawasaki M.et al.(1997)J.Biol.Chem.272：15668-15674)、Gln或Asp(Xu，M.& Perler，F.B.(1996)EMBO J.15：5146-5153)可以有助于分支中间体(套索)的稳定。当该氨基酸不突变，但是位置G6(I_C-2)处的氨基酸突变为Leu、Asn或Gln时，也观察到分支中间体的积累(Xu，M.&Perler，F.B.(1996)EMBO J.15：5146-5153)。

在策略3.2中，通过与位置I_C-1(G7)处Asn羰基氧形成氢键而协助Asn环化的氨基酸G6(I_C-2)和/或B11应突变为不能与该氨基酸形成氢键的氨基酸。InBase中列出的被认为经历剪接的蛋白内含子在位置G6(I_C-2)处含有His，较少见的是Gly、Ser、Ala和Cys。突变为除了His之外的任何氨基酸都将抑制步骤3(Asn环化)。当G6(I_C-2)处不存在His时，发现B11可与位置I_C-1(G7)处Asn羰基氧形成氢键。当G6不是His时，位置B11绝大多数情况下是Lys或Arg。任一位置突变为不带正电荷(Lys、Arg、His)的任何氨基酸都将抑制步骤3(Asn环化)。Psp Pol-I蛋白内含子中，仅当I_C-1(G7)不突变为Ala时，位置I_C-2(G6)处His突变为Leu、Asn和Gln会导致分支中间体的积累(Xu，M.&Perler，F.B.(1996)EMBO J.15：5146-5153)。目前，还没有关于位置B11处Arg在积累分支中间体中的作用的诱变研究。但是，某些蛋白内含子仅能在位置G6(I_C-2)或B11处使用特定氨基酸。因此，对于这些蛋白内含子，可通过以其它氨基酸替换位置G6(I_C-2)或B11处野生型氨基酸来抑制步骤3(Asn环化)。

关于策略3.3-3.5，抑制步骤3(Asn环化)的突变的说明参见未加工蛋白内含子。

应用套索蛋白内含子技术分离结合并抑制细菌阻遏蛋白LEXA的套索

本发明描述在酵母双杂交测定法中构建和应用“套索”、未加工蛋白内含子和双半胱氨酸蛋白内含子。套索为没有C末端的新型肽构建体，代表了新类型的环肽。通过修饰体内蛋白内含子介导的蛋白连接反应而产生套索肽。套索肽的C末端倒回成环并通过环状内酯键连接到该肽内部的特定丝氨酸(图3)。套索具有自由N末端，允许连接有用的生物学结构域，例如激活结构域，这对酵母双杂交测定法而言是必需的。

如以上所讨论的，这种方法被用于产生针对给定靶的环肽、套索、未加工蛋白内含子、以及双半胱氨酸蛋白内含子亲和试剂。通过产生细菌阻遏蛋白LexA的抑制剂而证实了这种方法的可行性。LexA代表了推定的抗菌靶点，当被抑制时应加强细胞毒性抗生素的活性。当LexA被活化的RecA结合时，其经历自体溶解而不再抑制其调节子中的基因(Lin，LL.& Little，J.W.(1988)Bacteriol.170：2163-2173)。阻断自体溶解的LexA突变体(Walker，G.C.(1984)Microbiol.Rev.48：60-93)使得细菌对诸如DNA损伤试剂丝裂霉素C(MMC)的化合物诱导的压力更敏感(Lin，LL& Little，J.W.(1988)Bacterid.170：2163-2173)，并且它们降低抗生素抗性(Cirz，R.T.et al.(2005)PLoS Biol.3：e176，Miller，C.et al.(2004)Science 305：1629-1631)。阻断自体溶解的LexA抑制剂将增强细菌对细胞毒性试剂的敏感性，并且由于LexA不存在于人体中，其将对宿主DNA损伤修复系统没有影响。

构建和筛选套索肽组合文库

通过将产生环肽系统(Scott，C.P.et al.(1999)Proc.Natl.Acad.Sci.USA 96：13638-13643)的蛋白内含子改造为在中间步骤中中止环肽反应而产生适合酵母双杂交系统的套索，这产生含有激活结构域(通过酰胺键与内酯环肽共价连接)的套索。为了防止套索中间体经历天门冬酰胺环化(其产生环肽)，位置I_C-1(G7)处的天门冬酰胺以丙氨酸替换(图15a、图15b)。创建套索的组合文库，其中“绞索”区含有氨基酸序列SXXXXXXXEY，其中X代表NNK密码子编码的氨基酸。绞索区内的谷氨酸和酪氨酸氨基酸被包括进来促进环化(Scott，C.P.et al.(2001)Chem Biol.8：801-815，Naumann，T.A.et al.(2005)Biotechnol.Bioeng.92：820-830)。在MATa酵母株EY93中构建了大约七百万套索肽的文库(图16)，并将该文库与含有LexA靶质粒(pEG202)(Gyuris，J.et al.(1993)Cell 75：791-803)和酵母双杂交报告基因的MATa株EY111交配。采用图15c中的酵母双杂交相互作用陷阱，分离了14个克隆，其编码与LexA相互作用的两独特套索(图15d)。L2套索被用于进一步分析，因为它含有更多带电氨基酸，这可能增强其溶解性。

抗LexA套索的表征

为了证实套索结构对L2套索-LexA相互作用的重要性，将来自L2套索的绞索区克隆进无活性套索蛋白内含子质粒(pIN-L2)(其在蛋白内含子介导的环化反应中不经历任何步骤)。以抗N末端蛋白内含子血凝素(HA)标签的抗体采用Western分析，我们证实了L2套索和L2无活性套索蛋白内含子在EY93中的表达，并监测了蛋白内含子介导的环化反应。pIL-L2产生未加工(～23kDa)和套索(～9kDa)产物，而无活性蛋白内含子质粒pIN-L2仅产生未加工产物。套索结构对于L2套索-LexA相互作用是重要的，因为与表达未加工产物和套索的L2套索(pIL-L2)相比，表达未加工套索的无活性L2蛋白内含子(pIN-L2)对酵母双杂交报告基因的活化基本检测不到(图17b)。

我们采用表面等离子共振分析来确定合成的对应L2套索绞索的线性肽和LexA之间是否发生直接的相互作用。该线性L2肽以1.7±0.6μM的K_d与LexA相互作用(图18)。

我们采用质谱(MS)测量在BL21 CodonPlus(BL21-CP)大肠杆菌(E.coli)中从His-标签细菌表达载体(pETIL-L2)表达的L2套索的分子量。我们观察到两种产物，15％对应于L2套索(8651Da)，85％对应于重18Da的水解套索产物(8669Da)(图17c)。套索难以通过MS观察(Scott，C.P.et al.(1999)Proc.Natl.Acad.Sci.USA 96：13638-13643，Scott，C.P.et al.(2001)Chem Biol.8：801-815)，可能是由于MS分析中采用的高温和酸性条件导致内酯键水解。为了确定MS分析前存在的套索的量，我们采用Na¹⁸OH迫使套索内酯切割(Hagelin，G.(2005)Rap.Commun.Mass Spectrom.19：3633-3642)，然后以胰蛋白酶消化套索，并采用LC-ESI-TOF MS分析片段的分子量(图17d)。Na¹⁸OH切割的套索内酯比Na¹⁸OH处理前切割的内酯重2Da。我们观察到¹⁸O并入两胰蛋白酶片段中，这两胰蛋白酶片段来自酯键的水解或者来自产生脱氢丙氨酸的α-H消除(随后是迈克尔加成)(图19)。并入这些片段中的¹⁸O部分表明46％的套索在MS分析之前环化(图20)。与很多内酯环化肽天然存在的事实(Guenewald，J.& Marahiel，M.A.(2006)Microbiol.Mol.Biol.Rev.70：121-146)结合，该数据支持套索结构在体内的存在。

抗LexA套索和环肽的生物学活性

我们监测了L2套索阻断MMC诱导的LexA切割的能力。MMC为细菌SOS应答的有力诱导剂，SOS应答活化RecA辅蛋白酶(coprotease)活性并诱导LexA的切割(Lin，L.L.& Little，J.W.(1988)Bacteriol.170：2163-2173)。我们将pETIL-L2转化进BL21-CP，并采用Western分析来监测暴露于MMC后、存在和不存在L2套索时LexA的降解(Yasuda，T.et al.(1998)EMBO J.17：3207-3216)(图21a)。在表达L2套索的细胞中，3小时后未观察到LexA切割，而在表达带有CPGC氨基酸绞索(pETIL-01)的套索蛋白内含子的细胞中，1小时后LexA被完全切割。

我们证实L2套索的表达阻断了MMC诱导的SOS应答基因的表达。我们将在SOS调节的sulA启动子(Hastings，P.J.et al.(2004)PLoSBiol.2：e399)控制下表达GFP的大肠杆菌菌株SMR6039改造为表达T7RNA聚合酶(SMR6039-DE3)，这使得能够从T7启动子表达L2套索。在不存在诱导剂(IPTG)时，对经pETIL-L2转染的SMR6039-DE3的MMC处理导致表达GFP的细胞的百分比随时间增加(图21b)。通过添加IPTG表达L2套索肽降低了表达GFP细胞的百分比(图21b)。

采用Lin和Little描述的存活测定法(Lin，LL& Little，J.W.(1988)Bacteriol.170：2163-2173)，我们测试了L2套索在存在和不存在MMC时抑制细菌生长的能力。我们在BL21-CP细胞中表达L2套索(pETIL-L2)或带有CPGC绞索的套索(pETIL-01)，将细菌暴露于含MMC的0.85％NaCl中1小时，并测定它们的存活(图21c)。表达任一种质粒都将减弱生存力至未诱导对照的～35％。单独的MMC(0.1μg/ml)减弱生存力至未处理对照的～14％。L2套索的表达增强了MMC的活性并将存活力减小至对照的＜1％，而表达带有CPGC绞索的套索不增强MMC的活性。

我们合成对应L2套索绞索的环状和线性肽，并测试它们抑制细菌生长和加强MMC活性的能力。首先，我们采用存活测定法检查了单独L2肽在0.85％NaCI⁹中抑制细菌生长的能力。以环状或线性L2肽处理BL21-CP减弱BL21-CP存活至未处理对照的～20％(图21c)。当线性L2肽从0.2μg/ml增加至0.7μg/ml时，未观察到存活的进一步降低(图22)。接着，我们研究了L2肽增强MMC效果的能力。我们监测了恒定L2肽浓度下的细胞存活并改变MMC浓度。环状和线性L2肽降低了MMC的最小抑制浓度约10倍(图21d)。

因此，本发明采用蛋白内含子介导的肽环化和酵母双杂交相互作用陷阱，提供了遗传学上选择针对给定靶蛋白的套索的方法。该系统使得能快速产生针对蛋白靶的适合于酵母双杂交系统的套索和基于该套索的绞索序列的环肽。该套索技术为分离环肽抑制剂提供了快速高通量系统，这些抑制剂可用于反向分析蛋白功能或者作为药物或拟药(pseudo-drug)来确定治疗靶点。

我们采用这种系统产生LexA的套索抑制剂并确认LexA为增强激活SOS应答途径的试剂的抗菌效果的治疗靶点。该套索可转变为环状或线性肽，它们也增强MMC的效果。

方法

试剂

线性肽来自卡尔加里大学快速多种肽合成服务(Calgary，AB)。环肽来自Anygen Co.Ltd.(韩国)。寡核苷酸来自IDT DNA(Coralville，IA)并列在在线的附表1中。

菌株和质粒

大肠杆菌菌株：BL21(DE3)来自Novagen(Madison，WI)，BL21-(DE3)-RIL(BL21-CP)来自Stratagene(La Jolla，CA)。SMR6039为Susan Rosenberg(Hastings，P.J.et al.(2004)PLoS Biol.2：e399)所赠。酿酒酵母(S.cerevisiae)菌株：EY93(MATa ura2 his3 trp1leu2 ade2::URA3)源自EGY42(Cohen，B.A.et al.(1998)Proc.Natl.Acad.Sci.USA 95：14272-14277)。EY111(MATa his3 trp1 ura3::LexA8op-lacZ ade2::URA3-LexA8op-ADE2 leu2::LexA6op-LEU2)源自EGY48(Golemis，E.A.& Brent，R.(1992)Mol.Cell.Biol.12：3006-3014)。

pIN01：该套索蛋白内含子设计是基于集胞藻(Synechocystis spp.)菌株PCC6803(Ssp)DnaE蛋白内含子基因的氨基酸序列。我们通过将8种(每种0.1μg)寡核苷酸[A-H]与2.5单位的pfu聚合酶(Fermentas，Burlington，ON)、200μM dNTPs、20mM Tris-Cl、10mM(NH₄)₂SO₄、10mM KCl，0.1％(v/v)Triton X-100、0.1mg/mL牛血清白蛋白(BSA)以及2mM MgSO₄混合而组装无活性蛋白内含子基因。我们在95℃孵育该组装反应5分钟，然后进行25个循环(95℃30秒、50℃30秒和72℃1.5分钟)，然后是最后的72℃孵育10分钟。采用上述反应条件和扩增循环，我们使用1/5(10μL)的组装反应在含有1μM PCR引物I和J的50μL PCR反应中扩增该无活性蛋白内含子基因。我们使用醋酸锂转化(Schiestl，R.H.& Gietz，R.D.(1989)Curr.Genet.16：339-346)，通过EY93中的体内同源重组(Ma，H.et al.(1987)Gene58：201-216)，以经EcoRI/Xhol(Fermentas)消化的500ng pJG4-5(Gyuris，J.et al.(1993)Cell 75：791-803)和400ng的PCR扩增无活性蛋白内含子将无活性蛋白内含子克隆进pJG4-5。

套索文库(pIL-XX)：我们采用寡核苷酸K以7氨基酸组合肽替换pIN01中的CPGC连接肽。我们采用引物L和M PCR扩增寡核苷酸K。我们使用上述反应条件，进行7个扩增循环，其由95℃30秒的变性步骤、55℃30秒的退火步骤、以及72℃15秒的延伸步骤构成。我们以RsrII(New England Biolabs，Ipswich，MA)消化pIN01，并以10单位的虾碱性磷酸酶(Fermentas)对消化的质粒脱磷酸化。我们在EY93中采用体内同源重组(Ma，H.et al.(1987)Gene 58：201-216)将该文库克隆进pIN01中。我们进行100个醋酸锂转化(Schiestl，R.H.& Gietz，R.D.(1989)Curr.Genet.16：339-346)，每个转化含有400ng的经扩增寡核苷酸K和1μg的经RsrII消化的pIN01。合起来，我们获得了2千万酵母克隆。

pIL-L2：pIL-L2为来自pILXX文库的文库成员。绞索序列为(RSWDLPGEY)。

pIN-L2：通过将I_N+1半胱氨酸突变为丙氨酸，我们构建了pIN-L2，其产生无活性蛋白内含子。两个交叠的PCR片段被用于引入点突变。我们采用引物I和N来扩增N末端区，引物O和J来扩增C末端区。我们将两PCR产物混合在一起，并采用引物I和J扩增全长蛋白内含子。我们在EY93中采用体内同源重组(Ma，H.et al.(1987)Gene58：201-216)将PCR片段克隆进经EcoRI/Xhol消化的pIN01中。

pETIL-L2：我们通过以引物P和Q扩增包含中止密码子的整个pIL-L2蛋白内含子基因来构建pETIL-L2。我们以EcoRI和XhoI(Fermentas)消化PCR片段并将其克隆进pET28b(Novagen)。

pETIL-01：我们通过采用引物P和Q扩增包含中止密码子的整个pIN-01蛋白内含子基因来构建pETIL-01。我们以EcoRI和XhoI(Fermentas)消化PCR片段并将其克隆进pET28b(Novagen)。

套索文库的表征

采用“砸窗抢劫(Smash and Grab)”酵母微量制备物(mini-prep)(Geyer，C.R.& Brent，R.(2000)Methods Enzymol.328：178-208)，我们在Trp^-葡萄糖培养基中从含有pIL-XX的EY93过夜培养物中分离出pIL-XX质粒。我们将3μL的酵母微量制备物电穿孔进MC1061大肠杆菌细胞(Invitrogen，Burlington，ON)，并在Luria肉汤培养基(LB)上以100μg/mL氨苄青霉素(LB-AMP)选择转化子。我们采用Qiagen细菌微量制备物试剂盒(Qiagen，Mississauga，ON)从17个转化子中分离质粒。我们采用引物R和ABI大染料中止剂化学(ABI big Dyeterminator chemistry)(Applied Biosciences Inc，Foster City，CA)对7氨基酸组合肽插入序列测序。

筛选套索蛋白内含子组合文库

采用酵母双杂交相互作用匹配法(Kolonin，M.G.et al.(2000)Methods Enzymol.328：26-46)，我们筛选套索文库中与LexA的相互作用。我们将LexA诱饵质粒(pEG202)(Gyuris，J.et al.(1993)Cell75：791-803)转化进EY111，并使EY111::pEG202与EY93::pIL-XX交配。我们在500mL His^-葡萄糖培养基中将EY111::pEG202培养至OD₆₀₀0.6-0.9。我们通过离心沉淀EY111::pEG202细胞并在等体积的酵母胨葡萄糖(YPD)培养基中重悬浮该沉淀物。我们以1∶20的比例将EY93::pIL-XX细胞与EY111::pEG202细胞混合。我们在YPD平板上让酵母细胞在30℃交配24小时。我们收集交配的酵母细胞并采用LEU2、ADE2和LacZ报告基因筛选2千万个双倍体酵母细胞以检测与LexA相互作用的套索。我们在含有X-Gal的His^-、Trp^-、Leu^-、Ade^-半乳糖/蔗糖平板上培养双倍体酵母细胞约7天。我们选择阳性克隆，并且通过从阳性克隆分离pILXX和重复上述酵母双杂交测定法再确认了阳性相互作用。

蛋白内含子加工和套索产物的表征

我们采用Western分析以抗HA抗体监测了套索在EY93中的表达。我们在Trp^-半乳糖/棉子糖培养基中于30℃过夜孵育含有pIL-L2或pIN-L2的EY93。我们通过离心收集细胞，在300μL珠缓冲液(20mMTris-Cl pH 7.9、10mM MgCl₂、1mM EDTA、5％甘油、1mM DTT、0.3M(NH₄)SO₄、1mM PMSF)和500μL酸洗的玻璃珠(Sigma，Oakville，ON)中重悬浮细胞，并在FastPrep FP120(Q-Biogene，Irvine，CA)中裂解细胞。我们通过在4℃离心澄清细胞裂解物。我们采用样品的OD₆₀₀对其标准化并采用标准Western分析方法(Ausubel，F.M.et al.(1997)Current protocols in Molecular Biology(现代分子生物学实验技术))以抗HA标签抗体(Santa Cruz Biotechnology，Santa Cruz，CA)(1∶200稀释)分析20μL的上清。

我们使用LC-ESI-TOF MS证实了从大肠杆菌中纯化的His标签套索的分子量。为了证实在MS分析之前套索内酯的存在，我们以0.5MNa¹⁸OH处理His标签套索，采用反相HPLC纯化产物，用胰蛋白酶对其进行消化，并采用LC-ESI-TOF MS分析胰蛋白酶片段的分子量。

LexA自体蛋白质水解的分析

我们采用抗LexA抗体监测了L2套索对MMC诱导的LexA自体蛋白质水解的作用。我们在含有30μg/ml卡那霉素的10mL LB(LB-KAN)中，让BL21-CP::pETIL-01或BL21-CP::pETIL-L2的培养物生长过夜。我们以含有1mM IPTG的LB-KAN将培养物稀释至OD₆₀₀为0.1，并且在30℃培养细胞至OD₆₀₀为约0.4-0.6。我们以100μg/mL氯霉素处理细胞，将其孵育10分钟，并将培养物分为两份。我们以0.1μg/mL MMC处理一份培养物，而留下另一份不处理。我们在标明的时间点从每份培养物中取出4mL样品，用H₂O洗涤细胞，并在-80℃保存，直至所有的时间点都取样了。我们在250μL的PBS Triton X-100(0.05％)和约300μL的酸洗玻璃珠(Sigma)中重悬浮细胞，并在FastPrepFP120(Q-biogene)中匀浆4×。我们在4℃离心细胞裂解物并采用标准Western分析方法(Ausubel，F.M.et al.(1997)Current protocols inMolecular Biology(现代分子生物学实验技术))以抗LexA抗体(Invitrogen)(1∶5000稀释)分析澄清上清。

分析MMC诱导的SOS应答基因的表达

我们采用在SOS调节的sulA启动子(Hastings，P.J.et al.(2004)PLoS Biol.2：e399)控制下表达GFP的SMR6039大肠杆菌菌株来监测对SOS应答途径的诱导。我们使用λDE3溶原化试剂盒(Novagen)将SMR6039改造为表达T7 RNA聚合酶，这使得在pETIL-L2质粒中能从T7启动子表达L2套索。我们在LB-KAN中过夜培养含有pETIL-L2的SMR6039(DE3)，在含有1mM IPTG的LB-KAN中将培养物稀释至OD₆₀₀＝0.1，并培养细胞至OD₆₀₀为约0.4-0.6。我们用0.1μg/mLMMC处理细胞，在特定时间点取出样品，在2mL 0.85％NaCl中将它们稀释为终浓度约0.5×10⁶cfu/mL。我们采用流式细胞术(Epics XL，Coultier，Mississauga，ON)测量样品的GFP荧光。如果细胞表达GFP在1个荧光单位以上，则将细胞评分为SOS诱导阳性。

细菌存活力测定

按Lin和Little所述方法(Lin，L.L.& Little，J.W.(1988)Bacteriol.170：2163-2173)，我们进行了细胞存活力测定。对于L2从pET28b质粒表达的测定，我们在37℃在LB-KAN中培养含pETIL-L2或pETIL-01的BL21(DE3)-CP至OD₆₀₀为0.4。我们将样品分为两份，以1mM IPTG诱导1份样品1小时，留下另一份样品不诱导。我们在含有或不含0.1μg/mL MMC的5mL 0.85％NaCl中将样品稀释100倍。我们取出10μL，并在冰冷的LB(1mL)中将其稀释1000倍作为零时间点对照。我们将剩余样品在37℃孵育1小时，然后取出10μL并稀释1000倍至1mL冰冷LB。我们将来自0和1小时样品的60μL等份接种在LB平板上并在37℃过夜孵育平板。对于采用合成的线性和环状L2肽的测定，除了以我们添加0.7μg/mL肽替代在MMC处理之前诱导细胞外，我们进行如上所述的存活测定。通过1小时后菌落形成单位(cfu)的数量除以0小时时间点的cfu数量，计算标准化的百分比细胞存活。未诱导的对照或无肽的对照标准化至100％。

表面等离子共振分析L2肽-LexA相互作用

我们合成了在N末端具有TAT输入序列(Vive′s，E.et al.(1997)Biol.Chem.272：16010-16017)的线性L2肽：NH₂-GRKKRRQRRRPPQSRSWDLPGEY。我们采用生产商的方法将该肽连接到羧甲基化的葡聚糖基体传感器芯片(CM5，Biacore，Piscataway，NJ)。按之前所述的方法(Little，J.W.et al.(1994)Methods Enzymol.244：266-284)，我们纯化了LexA蛋白。通过将50mM磷酸缓冲盐水、100mM NaCl中的LexA以20μL/分钟注射2分钟，并在BiacoreX(Biacore)上测量解离常数1.5分钟，我们测定了L2肽-LexA相互作用的结合动力学。我们测定了LexA浓度在11μM-110μM范围内的结合动力学。采用BiaEvaluation软件(Biacore)将每种稀释的结合曲线拟合为k_on和k_off。

纯化和表征His标签纯化的套索

我们采用Ni-NTA Spin试剂盒(Qiagen)纯化His标签套索。简言之，我们以pIL-L2转化BL21-CP大肠杆菌(Invitrogen)。通过以1mM IPTG诱导0.4OD₆₀₀的BL21-CP::pIL-L2培养物3小时，我们表达L2套索。我们洗涤细胞，将它们悬浮在磷酸缓冲盐水、0.05％Triton X-100、1mg/mL溶菌酶中，并采用超声裂解它们。我们在4℃以10,000×g离心裂解液20分钟，并让澄清的上清通过Ni-NA柱(Qiagen)。我们以50mM NaH₂PO₄和300mM NaCl洗涤柱3次并采用50mM NaH₂PO₄pH7.0、250mM NaCl和100mM EDTA洗脱L2套索。我们采用C4反相柱(Symmetry300^TM C43.5μm 2.1×50mm柱)(Waters，Milford，Massachusetts)以20分钟内5％缓冲液A/95％缓冲液至25％缓冲液A/75％缓冲液B的梯度(缓冲液A：H₂O和0.1％甲酸(v/v)，缓冲液B：乙腈和0.08％甲酸(v/v))，分离His标签纯化的套索并对其脱盐。我们采用ESI(+)-TOF MS(MicroMass LCT，Waters)确定洗脱蛋白的分子量。我们采用最大熵软件(MaxEnt3，Waters)解析多电荷的套索谱图。

为了确定MS分析前内酯环化的套索在样品中的量，我们采用Na¹⁸OH迫使内酯键断裂。通过将钠(Sigma)溶解在98％H₂ ¹⁸O(StableIsotopes，Summit，NJ)中制备0.5M Na¹⁸OH。我们将His标签纯化的L2套索冻干并采用0.5M Na¹⁶OH或0.5M Na¹⁸OH在室温(4)下处理500μg的L2套索16小时。我们以0.5N HCl酸化反应物，使最终pH在2.0-7.0。我们采用C4反相柱(Symmetry300^TM C43.5μm 2.1×50mm柱)(Waters)在之前所述相同条件下，通过HPLC纯化套索样品。我们冻干所纯化的L2套索，将其重悬浮在6M尿素和100mM Tris-HCl pH8.0中，并将样品在80℃加热10分钟来变性蛋白。我们将样品冷却至室温，在100mM Tris-HCl pH 8.0中稀释10倍，添加0.68μg经修饰的测序级胰蛋白酶(Roche，Laval，QC)，并在37℃下孵育样品过夜(18小时)。采用20分钟内5％缓冲液A/95％缓冲液B至50％缓冲液A/50％缓冲液B的梯度(缓冲液A：H₂O和0.1％甲酸(v/v)，缓冲液B：乙腈和0.08％甲酸(v/v))，我们在BioSuite^TM C18PA-A 3μm 2.1×250mm柱(Waters)上分离来自Na¹⁶OH或Na¹⁸OH处理样品的胰蛋白酶消化产物。洗脱的肽采用ESI-TOF(+)MS(MicroMass LCT，Waters)分析。

我们采用MATCHING软件(Fernandez-de-Cossio，J.et al.(2004)Rap.Commun.Mass Spectrom.18：2465-2472)处理原始图谱，该软件通过将所观察的同位素模式与预测的同位素模式进行比较而检测具有小分子量差异的蛋白。MATCHING软件被用于计算参与内酯键的两胰蛋白酶肽片段SWDLPGEY[966.42m/z][氨基酸73-80]和IFDIGLPQDHNFLLANGAIAHASR[2590.352m/z][氨基酸49-72]中的¹⁶O和¹⁸O掺入百分比。对于73-80氨基酸片段，MATCHING软件被用于确定¹⁶O和¹⁸O掺入百分比(假定掺入一个氧)。对于49-72氨基酸片段，MATCHING被用于确定¹⁶O和¹⁸O掺入百分比(假定掺入两个氧)。

我们采用MATCHING软件生成的约束条件来计算肽混合物最大强度，并以计算的峰强度对观察的峰强度作图。首先，我们采用等式1(EQ1)计算每个峰的强度。为每个峰指定索引j＝1...N，这里N为峰的数量。每种肽的最大强度由(x_i)定义，其中i＝1...P，并且P为肽的数量。基于肽分子式和自然界中发现的重同位素百分比，每种肽具有相关的同位素分布，这种分布采用MS-ISOTOPE软件(Clauser，K.R.etal.(1999)Anal.Chem.71：2871-2882)确定。每个峰的强度为在该峰中发现的所有肽的最大强度的总和乘以比例因子(Scalar Factor)(I_j)，比例因子为MS-ISOTOPE软件预测的在该峰位置处肽的最大强度百分比。

所有峰(从j＝1...N)的观察强度(Iobs_j)与计算强度(Icalc_j)的总误差(R²)通过等式2(EQ2)定义。我们将等式系统从EQ1代入EQ2，每个峰(j)一个等式。于是通过应用MATCHING软件给出的约束条件，EQ2简化为单变量。对于氨基酸73-80(SWDPLGEY)，MATCHING软件确定比例为14％¹⁶O对86％¹⁸O。对于氨基酸49-72(IFDIGLPQDHNFLLANGAIAHASR)，MATCHING软件确定比例为：两个¹⁶O掺入8.8％、一个¹⁶O掺入和一个¹⁸O掺入59.0％，以及两个¹⁸O掺入32.2。我们求EQ2的导数并相对于单个变量对最小总误差求解。该值给出肽物质之一的最大强度，其被用于计算其它肽强度的值。

等式：

EQ1：计算峰强度

∑(x_iI_j)＝Icj

i为模型中不同肽的数量，j为峰索引，x_i为肽的最大强度，I_j为通过MS-ISOTOPE确定的在该峰位置处预计的x_i分数的比例因子，以及Ic_j为在该峰位置处从模型计算的峰强度。

EQ2：总误差

∑(I_oj-I_cj)＝R²

j为峰索引，Iobs_j为观察强度，Icalc_j为计算强度。

产生和筛选混合的套索蛋白内含子文库

蛋白内含子-蛋白外显子连接点处蛋白外显子中的氨基酸可影响剪接。就发现的邻近剪接位点的氨基酸而言，Ssp DnaE蛋白内含子表现为混杂的。野生型蛋白内含子的突变或使用混合的蛋白内含子可改变这种依赖性。Iwai et al.，(Iwai，H.et al.(2006)FEBS Lett.580：1853-1858)表明，与wt Ssp DnaE蛋白内含子相比，具有Ssp DnaE I_C结构域和点状念珠藻(Nostoc punctiforme)(Npu)DnaE I_N结构域的断裂蛋白内含子能在I_C-蛋白外显子连接点(I_C+2)更有效地将线性蛋白外显子与更多种类的氨基酸连接。

Dassa et al.(Dassa，B.et al.(2007)Biochemistry 46：322-330)尝试了来自念珠藻(Nostoc sp.)PCC7120(Nsp)、湖沼颤藻(Oscillatorialimnetica)(Oli)和Thermosynechococcus Vulcanus(Tvu)的N末端和C末端结构域的所有组合。所有这些组合都经历某种剪接，证明来自不同物种的断裂蛋白内含子可结合，并且许多组合比野生型蛋白内含子更有效地剪接。这种结合被认为是部分地由于在模块B之前紧接的14氨基酸处发现的带负电荷氨基酸和在模块F之前紧接的12氨基酸处发现的带正电荷氨基酸(包括F1氨基酸)之间的电荷-电荷相互作用。

基于这些发现，我们以来自Npu DnaE的I_N结构域和来自Ssp DnaE的I_C结构域构建了混合蛋白内含子文库。如之前所述，通过将产生环肽系统(Scott，C.P.et al.(1999)Proc.Natl.Acad.Sci.USA 96：13638-13643)的蛋白内含子改造为在中间步骤处终止环肽反应(这产生了含有通过酰胺键与内酯环化肽共价连接的转录激活结构域的套索)，我们制备了与酵母双杂交系统匹配的套索。为了防止套索中间体进行Asn环化(其产生环肽)，我们让位置I_C-1(G7)处的Asn突变为Ala。质粒骨架被修饰为包含不同的选择标志物(Kan替代Amp)以及含有Npu DnaE蛋白内含子的I_N结构域和Ssp DnaE蛋白内含子的I_C结构域。

为了证实这种构建体仍然被加工，采用含有来自Ssp DnaE的两结构域(I_C-Ssp、I_N-Ssp)的蛋白内含子分离的针对LexA的L2肽(SRSWDLPGEY)被转移进(I_C-Ssp、I_N-Npu)蛋白内含子，该L2肽仍然在酵母双杂交测定中与LexA相互作用并经历加工。

我们创建三个套索组合文库。一个文库，其中“绞索”区域含有氨基酸序列SX(₁₀)，其中X表示由NNK密码子(R10)编码的氨基酸。两个文库，其中“绞索”区域含有氨基酸序列SX(₅)，其中X表示由NNK密码子(R5)或BNT密码子(B＝G、T或C)(F5)编码的氨基酸。套索肽文库构建在MATa酵母株EY93中。通过测序证实了文库的构建。R5和F5文库多样性在核苷酸水平上分别大于理论上的多样性3×10⁷和2.5×10⁵。R10文库多样性为6.5×10⁶。

每一文库的10个文库拷贝与Riz1的PR结构域以及与Jak2的各个结构域配对，Jak2结构域包括全长Jak2V617F、酪氨酸激酶结构域(JH1)、假激酶结构域(JH2V617F)、以及与假激酶结构域融合的酪氨酸激酶结构域(JH1-JH2 V617F)。分离每个筛选中最强烈的匹配，获得质粒，并在酵母双杂交测定中复查它们的相互作用。PR结构域筛选得到三个不同的套索序列，它们特异结合PR结构域。两个序列来自R10文库，一个序列来自R5文库。在分析过的针对Jak2的套索中，有一个套索针对JH1结构域，三个不同的套索针对JH2V617F结构域，以及4个不同的套索针对全长Jak2V617F。所有这些套索都来自R10文库。

方法

构建(I_C-Ssp、I_N-Npu)蛋白内含子质粒

37℃下在NEBuffer 4[50mM Tris-醋酸pH 7.9、50mM醋酸钾、10mM醋酸镁、1mM二硫苏糖醇]中以RsrII和Xhol消化pIN013小时，以除去Ssp DnaE I_N结构域。采用5个为在酿酒酵母(S.cerevisiae)中表达而优化的合成寡核苷酸构建合成的Npu DnaE(图23)。Npu DnaE基因以三个步骤构建：(1)二聚体延伸(2)全长构建(3)全长扩增。步骤1中，在含有60mM Tris-SO₄(pH 8.9)、18mM NH₄SO₄、2mM MgSO₄、10mM dNTPs和1.0单位Platinum高保真Taq(Invitrogen)的单独的PCR管中，将约1μg(20μM)的具有重叠区域的寡核苷酸npu1+npu2、npu3+npu4、以及npu5+npuVR混合在一起(图23)。采用95℃5分钟的变性步骤，接着是采用以下循环的5轮孵育：95℃30秒、55℃30秒、以及72℃15秒，延伸这些二聚体。在步骤2中，通过将步骤1中形成的二聚体在与二聚体延伸中完全相同的条件下混合于含有60mM Tris-SO₄(pH 8.9)、18mM NH₄SO₄、2mM MgSO₄、10mM dNTPs和1.0单位Platinum高保真Taq(Invitrogen)的单一反应管中，构建全长Npu DnaE基因。最后，在步骤3中，从不完全二聚体延伸池中选择性扩增全长基因而得到全长基因，步骤(2)的1∶10产物与npuVF、npuVR(图23)、60mM Tris-SO₄(pH 8.9)、18mM NH₄SO₄、2mMMgSO₄、10mM dNTPs和1.0单位Platinum高保真Taq(Invitrogen)混合。该PCR反应为以95℃变性5分钟开始，接着是25个循环：95℃30秒、55℃30秒、以及72℃15秒。采用醋酸锂转化，通过同源重组，在酵母株EY93中将合成的Npu DnaE基因克隆进以RsrII和XhoI消化的pIN01(上文)中。这种转化产生了载体pIL100。

接着将Kan^R基因在Amp^R基因位点克隆进pIL100。以Scal在NEBuffer 3[100mM NaCl、50mM Tris-HCl pH 7.9、10mM MgCl₂、1mM二硫苏糖醇]中于37℃过夜消化pIL100。采用S、T(图23)、60mMTris-SO₄(pH 8.9)、18mM NH₄SO₄、2mM MgSO₄、10mM dNTPs和1.0单位Platinum高保真Taq(Invitrogen)通过PCR扩增制备Kan^R基因，该PCR起始变性为95℃5分钟，接着是25个循环：95℃30秒、55℃30秒、以及72℃1分钟。采用体内同源重组和醋酸锂转化将Kan^R基因克隆进pIL100中。通过PCR分析复查阳性克隆，证实在LB卡那霉素培养基上生长而不在LB氨苄青霉素上生长。成功的克隆通过测序证实，得到完成的pIL500载体。

构建混合蛋白内含子文库

构建了三个另外的pIL500套索文库(pIL-XX)：随机5氨基酸文库(Lib1)，随机10氨基酸文库(Lib2)和随机5氨基酸集中库(BNT密码子，B＝G、C、T，N＝A、G、C、T)(Lib3)。采用文库寡核苷酸Lib1、Lib2或Lib3，我们以组合的5或10氨基酸肽替换pIL500中连接Ssp DnaEI_C结构域和Npu DnaE I_N结构域的Ser-Arg接头肽(图23)。我们采用引物L和npuLR PCR扩增文库寡核苷酸(图23)。我们使用上文所述的反应条件，采用7个扩增循环，所述扩增循环由95℃30秒的变性步骤，55℃30秒的退火步骤和72℃15秒的延伸步骤构成。我们以NruI(New England Biolabs，Ipswich，MA)消化pIL500，并采用10单位的虾碱性磷酸酶(Fermentas)对消化的质粒脱磷酸。我们在EY93中采用体内同源重组(Ma，H.et al.(1987)Gene 58：201-216)将所述文库克隆进pIL500中。我们进行100个醋酸锂转化(Schiestl，R.H.& Gietz，R.D.(1989)Curr.Genet.16：339-346)，每个转化含有400ng的扩增文库和1μg的经NruI消化的pIL500。

具有增强稳定性的突变套索蛋白内含子

稳定内酯环化的套索：通过在蛋白内含子环化反应中抑制Asn环化而产生通过内酯键环化的肽，生成套索肽。我们通过将套索蛋白内含子构建体中位置I_C-1(G7)处Asn突变为Ala而产生套索。环化套索的内酯键比酰胺键更容易水解，我们证实当在大肠杆菌中表达时约50％的套索以内酯环化的状态存在。为了改善我们的套索酵母双杂交测定法，使其更容易纯化并存储套索，以及扩展采用套索的应用，我们检测了突变套索是否能产生并稳定在套索中。基于蛋白内含子反应机制、蛋白内含子晶体结构和特定突变稳定正常蛋白内含子反应中的分支中间体的能力(这类似于内酯环化的套索)，我们在套索构建体中鉴定了稳定内酯键的特定突变或突变组合。我们检测了突变的小子集来确认除了在位置I_C-1(G7)处Asn突变为Ala中所观察到的之外，是否可通过向套索构建体引入以下突变来稳定套索内酯键(总结在图24中)：

(i)突变位置I_C-1(G7)处的Asn：位置I_C-1(G7)处的Asn对于蛋白内含子介导的环化反应中的Asn环化是必需的。Asn侧链经历环化以从套索切去I_N结构域，并产生内酯环化的肽。在正常的蛋白内含子反应中，当位置I_C-1(G7)处的Asn突变为Lys时，分支中间体积累(KawasakiM，et al.(1997)J.Biol.Chem.272：15668-15674)。但是，不是位置I_C-1(G7)处的所有突变都导致分支中间体的积累。例如，位置I_C-1(G7)处的Asn突变为Ser或Ala(Chong，S，et al.(1996)J.Biol.Chem.271：22159-22168)不导致分支中间体的积累。有趣的是，位置I_C-1(G7)处的Asn突变为Ala导致分支中间体的积累，如果位置I_C+1(G8)处的Cys也突变为Ser(Chong，S，et al.(1996)J.Biol.Chem.271：22159-22168)。基于这些观察结果，酯键附近的环境似乎在稳定分支中间体方面起作用。为了证实除了Asn至Ala突变外，位置I_C-1(G7)处的突变可增强内酯键的稳定性，我们将位置I_C-1(G7)处的Asn突变为Gln。这种突变导致内酯键的进一步稳定，从Ala在I_C-1(G7)处时观察到的29％内酯到Gln在I_C-1(G7)处时观察到的47％内酯。位置I_C-1(G7)处的Gln仍维持着良好的套索加工(67％)(图24)。这种结果是出乎意料的，因为根据其它蛋白内含子的结果，位置I_C-1(G7)处的Asn被Gln替换时预期会产生功能性蛋白内含子，其将一直加工至环肽。在可选择实施方案中，具有其它大侧链的氨基酸(具有烷基γ碳)可以被用于稳定内酯(例如通过阻止水接近内酯键)。因而以下的氨基酸可以在位置G7处替换(以阻止水接近内酯键的优先顺序表示)：Trp、Phe、Leu、Ile、Tyr、Met、Val、Arg、Lys、His、Glu、Asp。

(ii)位置I_C-2(G6)处His的突变：位置I_C-2(G6)处的His通过与位置I_C-1(G7)处的Asn羰基氧形成氢键而协助Asn环化。当位置I_C-2(G6)处的His突变为Leu、Asn或Gln时分支中间体积累，这也依赖于位置I_C-1(G7)处的氨基酸，因为当该位置处Asn突变为Ala时未观察到分支中间体(Xu，M.&Perler，F.B.(1996)EMBO J.15：5146-5153)。这种观察结果提示位置I_C-1(G7)处的Asn对于I_C-2(G6)突变导致分支中间体积累是重要的。为了证实位置I_C-2(G6)处的突变增强内酯环化套索的稳定性，我们将位置I_C-2(G6)处的His突变为Leu、Asn或Asp并测量内酯键的稳定性。Leu、Asn和Asp突变分别增强套索稳定性至47％、54％和55％。Leu突变维持良好的加工(72％)，而Asn和Asp突变分别降低加工至19％和8％。在可选择实施方案中，具有其它疏水侧链的氨基酸也可以用于稳定内酯键(例如，通过将水排除在反应位点之外而同时仍允许加工)。因而以下的氨基酸也可在位置G6处替换：Trp、Phe、Leu、Ile、Met、Tyr。

(iii)位置B11处Arg的突变：在I_C-2(G6)处不存在His时，已经显示位置B11处的Arg可通过与位置I_C-1(G7)处的Asn羰基氧形成氢键而协助Asn环化(Ding，Y，et al.(2003)J.Biol.Chem.278：39133-39142)。当I_C-2(G6)不是His时，B11绝大部分情况下是Lys或Arg。目前，没有关于位置B11处Arg在积累分支中间体中的作用的诱变研究。但是，某些蛋白内含子仅能在位置I_C-2(G6)或B11处具有特定氨基酸时发挥功能。我们评估了位置I_C-2(G6)或B11处单一突变稳定套索内酯的能力。套索构建体的突变、B11从Arg突变为Tyr增加套索稳定性至38％，突变为Leu对套索稳定性没有影响，突变为Asp降低套索稳定性至15％。Tyr、Leu和Asp分别降低套索加工至27％、34％和61％。我们还联合位置I_C-1(G7)处的突变，将位置I_C-2(G6)处的His也突变为Ala。I_C-2(G6)突变为Ala和I_C-1(G7)突变为Tyr增加套索稳定性至53％，而I_C-1(G7)突变为Asp或Lys对稳定性无影响。I_C-2(G6)突变为Ala并且I_C-1(G7)突变为Tyr或Lys分别降低加工至33％和58％，而I_C-1(G7)突变为Asp增强加工至89％。在可选择实施方案中，G6(His)突变为Ala并且B11(Arg)突变为另一大侧链可用于稳定内酯键(例如通过排除水而同时继续允许加工)。因而可联合G6处的Ala替换，在B11处以以下氨基酸替换：Lys、Tyr、Phe、Trp、His、Gln、Glu。

(iv)位置F4(Asp)：该位置的氨基酸在内酯键附近与水配位，并通过极化羰基协助A1和G8的亲核攻击来参与步骤1和步骤2。因而可将F4从Asp突变为Glu和Gln，以便允许步骤1和步骤2发生，同时稳定内酯键(例如通过将水排除出内酯键附近区域)。

(v)位置F13(His)：F13处的His至Ala突变不阻断步骤3，但是以大疏水氨基酸在F13处替换可以被用于稳定内酯键：包括Phe、Leu或Ile的替换。

(vi)位置F14(Asn)：F14处的大或带电氨基酸替换可被用于破坏F13的定位，因而阻断Asn环化并稳定内酯键，包括Trp、Phe、Tyr、Leu、Lys、Arg替换。

(vii)位置F15(Phe)：位置F15突变为Ala阻断Asn环化，而突变为Tyr仅轻微抑制Asn环化。因而，F15突变为大疏水氨基酸可以被用于阻断Asn环化，并且将水排除出内酯键附近，从而稳定它。以下的氨基酸因此可于F13定位替换来稳定内酯键：Trp、Leu。

方法

根据制造商的说明，采用Phusion^TM定点诱变试剂盒(Finnzymes)通过G6、G7和B11位置处的定点诱变来构建突变。我们采用Ni-NTASpin试剂盒(Qiagen)纯化His标签套索。简言之，我们以突变蛋白内含子表达质粒转化BL21-CP大肠杆菌(Invitrogen)。我们通过以1mMIPTG诱导0.6OD₆₀₀BL21-CP培养物4小时来表达突变L2套索。我们洗涤细胞，将它们悬浮在磷酸缓冲盐水、0.05％Triton X-100、1mg/mL溶菌酶中并采用FastPrep 120裂解它们。我们在4℃以10,000×g离心裂解液20分钟并让澄清上清通过Ni-NA柱(Qiagen)。我们用50mMNaH₂PO₄和300mM NaCl洗柱3次并采用50mM NaH₂PO₄pH 7.0、300mM NaCl和250mM咪唑洗脱L2套索。我们采用C4反相柱(Symmetry300^TM C4 3.5μm 2.1×50mm柱)(Waters，Milford，Massachusetts)以20分钟内95％缓冲液A/5％缓冲液B至25％缓冲液A/75％缓冲液B的梯度(缓冲液A：H₂O和0.1％甲酸(v/v)，缓冲液B：乙腈和0.08％甲酸(v/v))分离His标签纯化的套索并对其脱盐。我们采用ESI(+)-TOF MS(MicroMass LCT，Waters)确定洗脱蛋白的分子量。我们采用最大熵软件(MaxEnt，Waters)解析多电荷的套索谱图，以确定HPLC/质谱分析后水解的与未水解的套索的比例。

通过环化增强ScFv稳定性

某些蛋白结构域和基序，尤其是具有小三级结构的小基序，可能不容易被小环肽当作靶。这些类型的靶可能更有效地作为ScFv的靶，其在结合小的线性肽表位方面高效。对于涉及ScFv的医学和非医学应用而言，常见的要求是高稳定性。ScFv包含免疫球蛋白重链和轻链的可变结构域，它们通过短肽接头保持在一起(Bird，R.E.，et al.(1988)Science 242：423-426)。很多从天然抗体产生的或者通过体外选择而分离的ScFv不能在它们计划的应用中有效地发挥功能，因为它们经常变性或聚集(Worn，A.& Pluckthun，A.(2001)J.Mol.Biol.305：989-1010)。对于细胞内应用，由于在细胞质的还原条件下ScFv不能形成保守的结构域内二硫键而被去稳定化(Worn，A.& Pluckthun，A.(2001)J.Mol.Biol.305：989-1010)。包括推理和进化手段在内的多种策略已被用于增强ScFv的结构域内和结构域间稳定性(Worn，A.& Pluckthun，A.(2001)J.Mol.Biol.305：989-1010)，以产生各种互补决定区(CDR)可嫁接在其上的稳定scFv框架。这些ScFv框架通常能很好地发挥功能，但是很多情况下特异的CDR不与给定的框架匹配(Worn，A.& Pluckthun，A.(1998)FEBSLett.427：357-361)。为了产生适合于酵母双杂交和其它测定法的更通用和稳定的ScFv框架，可环化ScFv或者增加它们的表面电荷，二者都应增强稳定性和溶解性。

我们采用Tanaka等人使用的用于酵母双杂交测定的ScFv框架(Tanaka，T.，et al.，(2003)Nucl.Acids Res.31：e23)，在酵母双杂交表达载体中构建了数个ScFv文库。基于Fellouse等人报道的用在噬菌体展示中的设计(Fellouse，F.A.et al.，(2004)Proc.Natl.Acad.Sci USA101：12467-12472；Fellouse，F.A.，et al.(2005)J.Mol.Biol.348：1153-1162)，我们使三个重链可变环和一个轻链可变环随机化。用于随机化的所选残基显示在图25中。两个文库具有采用Tyr和Ser组合(称为T4)或Tyr、Ala、Asp和Ser组合(称为K4)随机化的重链上的三个CDR和轻链上的一个CDR。选择这种有限的氨基酸多样性是基于Fellouse等人的报告，其中他们证实具有微摩尔至纳摩尔结合亲和力的ScFv可采用T4(Fellouse，F.A.，et al.(2005)J.Mol.Biol.348：1153-1162)或K4(Fellouse，F.A.et al.，(2004)Proc.Natl.Acad.Sci.USA 101：12467-12472)多样性随机化的ScFv分离。通过将这些文库克隆在套索构建体中而产生基于T4和K4文库的两个另外文库，将它们命名为cyc-T4和cyc-K4。我们采用Western分析法分析了这些文库的表达(图26)。

我们采用代表性试验蛋白计算了有效的文库亲和力，其为每个文库当量的阳性相互作用数。我们使用两个酵母双杂交报告系统来评价有效文库亲和力。第一种报告子为“弱”腺嘌呤报告子，其需要较小的亲和相互作用来激活。第二种报告子为“较强”腺嘌呤/LacZ报告子，其需要较强的亲和相互作用来激活。对于非环化的和套索T4和K4文库，我们观察到弱相互作用文库成员数量的增加(图27)。T4和K4文库的套索环化增加了较强相互作用文库成员的数量(图27)。

可与套索环化策略联合使用的用于稳定的可选择方法涉及增加或降低ScFv表面电荷。最近，Lawrence等人显示，蛋白表面电荷的根本变化“增压(supercharging)”可显著减小聚集倾向并改善蛋白的溶解性，同时不破坏它们的功能(Lawrence，M.A.，et al.，(2007)J.Am.Chem.Soc.129：10110-10112)。在一些实施方案中，因而可以产生经增压的环状ScFv，例如采用将降低它们的聚集倾向的修饰(Worn，A.& Pluckthun，A.(2001)J.Mol.Biol.305：989-1010)。ScFv的晶体结构，如(Tanaka，T.，et al.，(2007)EMBO J.26：3250-3259)所报道的，可被用作鉴定待突变表面残基的指导。ScFv上溶剂可及的表面残基可采用鉴定表面残基的ASAView软件(Ahmad，S.，et al.，(2004)BMC Bioinf.5：51-56)或其它类似的软件和技术鉴定。取决于在ScFv上希望的电荷是正、负或正负电荷的混合，可将表面氨基酸突变为带正电氨基酸(Lys、Arg、His)或带负电氨基酸(Asp、Glu、Tyr、Cys)。

采用诸如酵母双杂交测定法的遗传测定法，表达为与给定靶相互作用的套索、未加工或双半胱氨酸蛋白内含子的ScFv可从合成的ScFv文库分离，其中可变区或CDR以两种或多种氨基酸随机化。一旦被分离，通过采用蛋白内含子介导的环肽/蛋白生成反应，将ScFv表达为套索或头尾相接的环化ScFv，它们可被稳定地生产。可选择地，可通过交联环化ScFv。ScFv可被改造为含有作为其N和C末端的小接头肽，它们含有可交联的氨基酸并产生环化的ScFv。

用于细胞内应用的环化和/或增压ScFv也可从杂交瘤细胞系产生的现有单克隆抗体构建。这种情况下，重和轻链抗体cDNA被用作模板来PCR扩增轻和重链可变结构域。然后这些结构域可被克隆进一个描述的蛋白内含子表达构建体，其中它们将翻译为套索、未加工或双半胱氨酸ScFv。可选择地，ScFv可被改造为含有作为其N和C末端的小接头肽，它们含有可交联的氨基酸并产生环化的ScFv。

采用诸如噬菌体展示、酵母展示等的体外筛选策略分离的针对给定靶的ScFv和抗原结合片段(Fabs)也可通过上文所述的环化和/或增压被转化为细胞内抗体。抗原结合片段(Fab片段)为抗体上的区域，其结合抗原。它由重链和轻链的各一个恒定和一个可变结构域构成。

环化或增压也可应用到单独重链或轻链片段的表达。这种情况下重链和轻链被单独用作亲和试剂。分开表达环化和/或增压的重和轻链，并且它们相互作用并形成由两条链构成的功能性Fv，这样也是可能的。

环化或增压也可应用至Fab片段的表达。Fab由重链和轻链的各一个恒定和一个可变结构域构成。Fab的轻链和重链区域通过结构域间二硫键维持在一起。这种情况下，通过采用上述方法之一环化，Fab可稳定在还原环境中，例如存在于细胞内。

纯化环状ScFv

我们预期ScFv环化和增压将减弱构象呼吸(conformationalbreathing)和疏水聚集，由此增强稳定性和溶解性。环化被证实稳定GFP(Iwai，H.，et al.，(2001)J.Biol.Chem.276：16548-16554)和β-内酰胺酶(Iwai，H.& Pluckthun，A.(1999)FEBS Lett.459：166-172)。我们采用蛋白内含子介导的环化来环化ScFv并使用蛋白L柱来纯化ScFv。如果需要可选择方法来纯化更高水平的ScFv，则我们将使用组氨酸标签作为接头来连接ScFv轻链和重链，类似于用于纯化环状GFP(Iwai，H.，et al.，(2001)J.Biol.Chem.276：16548-16554)和β-内酰胺酶(Iwai，H.&Pluckthun，A.(1999)FEBS Lett.459：166-172)的策略。

环化肽和蛋白的表达和输送

除了细胞内瞬时表达(质粒转化、腺病毒等)或通过整合进宿主基因组(稳定细胞系、逆转录病毒等)被表达外，环化肽、基因组片段和ScFv可在体外或体内应用中外源输送。现有采用脂多糖、脂肽、脂质体和聚乙二醇(PEG)偶联物的多种输送系统(参见综述Ali，M &Manolios，N.(2002)Lett.Peptide Sci.8：289-294)。也可通过将肽和蛋白共价或非共价偶联至转导肽而输送(参见综述Joliot，A& Prochiantz，A.(2004)Nature Cell Biol.6：189-196)。

方法

构建ScFv和文库设计

ScFv框架

采用为酿酒酵母表达而优化的密码子构建编码ScFv框架的合成基因。采用Tanaka等人报道的ScFv(Tanaka，T.，et al.(2003)Nucl.AcidsRes.31：e23)设计了重链和轻链的氨基酸序列。跨重链的第一和第二CDR的区域被Nrul限制性内切酶位点替换，以便能将随机氨基酸文库克隆进重链的CDR1和CDR2。重链CDR3被XhoI限制性内切酶位点替换。轻链和重链通过由甘氨酸和丝氨酸重复[G₄S]₃构成的接头肽连接。轻链CDR为不变的，其基于Martineau等人报道的抗β-半乳糖苷酶ScFv(Martineau，P.，et al.(1998)J.Mol.Biol.280：117-127)。

程序GeneDesign[http://slam.bs.jhmi.edu/gd/]被用于设计18重叠寡核苷酸(Oligo 1-18-Ab)(图28)，它们被用于构建合成的ScFv细胞内抗体基因。将18寡核苷酸(Oligo1-Ab至Oligo18-Ab)与HIFI Taq聚合酶缓冲液(60mM Tris-SO₄(pH 8.9)、18mM(NH₄)₂SO₄)(Invitrogen)、0.2mM dNTPs、2mM MgSO₄、以及1.0单位Platinum HIFI Taq聚合酶(Invitrogen)混合在一起(每种0.2ng/μL)。将反应混合物在以下条件下孵育：94℃2分钟、(94℃30秒、56℃30秒、68℃1分钟(30个循环))以及68℃10分钟。为了扩增全长基因产物，采用2μL的上述PCR产物以及0.2μM Ab-pJG4-5.FWD引物和0.2μM Ab-pJG4-5.RVS引物在上述条件下进行另一PCR(图28)。

将ScFv框架克隆进酵母表达载体

以0.5单位EcoRI内切酶、1单位XhoI内切酶、1×y+/Tango缓冲液(Fermentas)消化pIL500以除去蛋白内含子序列。反应混合物在37℃孵育过夜。采用同源重组将ScFv框架克隆进经EcoRI和XhoI消化的pIL500中。按Gietz等人的方法(Schiestl，R.H.& Gietz，R.D.(1989).Curr.Genet.16：339-346)，将经EcoRI和XhoI消化的pIL500和40μLPCR扩增的ScFv框架转化进酵母株EY93，产生ScFv框架表达质粒，称为pScFv-Fr。

CDR文库寡核苷酸

通过采用同源重组将侧翼连接不变区域的简并寡核苷酸克隆进ScFv框架而使CDR随机化。由Tyr(TAT密码子)和Ser(TCT密码子)构成的组合文库(称为T4文库)采用TMT简并密码子构建，其中T＝胸腺嘧啶，M＝腺嘌呤或胞嘧啶。T4文库在重链CDR 1-3和轻链CDR3中含有组合的Tyr和Ser CDRs。由Tyr(TAT密码子)、Ser(TCT密码子)、Asp(GAT密码子)和Ala(GCT密码子)构成的组合文库(称为K4文库)采用KMT简并密码子构建，其中M＝腺嘌呤或胞嘧啶，K＝胸腺嘧啶或鸟嘌呤。K4文库在重链CDR 1-3和轻链CDR3中含有组合的Tyr、Ser、Ala和Asp CDRs。含有简并CDR的寡核苷酸(Oligo-CDR1KMT、Oligo-CDR1TMT、Oligo-CDR2KMT、Oligo-CDR2TMT、Oligo-CDR3KMT、Oligo-CDR3TMT、L3.KMT.RVS和L3.KTMT.RVS列在图28中。

将简并重链CDR3克隆进ScFv框架

为了将简并重链CDR3克隆进ScFv框架，以XhoI消化pScFv-Fr质粒并凝胶纯化。通过采用醋酸锂转化(Schiestl，R.H.& Gietz，R.D.(1989)Curr.Genet.16：339-346)将Xhol消化的pScFv-Fr和PCR扩增的Oligo-CDR3KMT转化进EY93，利用同源重组将用于K或T文库的简并CDR3区域克隆进pScFv-Fr，这产生了新质粒pScFv-Fr-HCD3-K或pScFv-Fr-HCD3-T。在以下反应中PCR扩增Oligo-CDR3KMT：1×PCR缓冲液、0.2mM dNTPs、2mM MgSO₄、1μM CDR.FWD、1μMCDR3.RVS、0.02μM Oligo-CDR3KMT或Oligo-CDR3KMT、72μLH₂O、0.4μL Taq聚合酶。在以下条件下孵育PCR反应：95℃1分钟，95℃30秒，52℃30秒和68℃30秒(20循环)。

将简并重链CDR1和CDR2克隆进ScFv框架

为了将CDR1和CDR2引入含有简并CDR3的ScFv框架，以NruI消化pScFv-Fr-HCD3-K和pScFv-Fr-HCD3-T并凝胶纯化。在以下反应中PCR扩增CDR1和CDR2：1×PCR缓冲液、0.2mM dNTPs、2mMMgSO₄、0.02μM Oligo-CDR1TMT(或KMT)、0.02μM Oligo-CDR2 TMT(或KMT)、0.2μM CDR1-F2-CDR2.RVS、0.2μM CDR1-F2-CDR2.FWD、80μLH₂O、0.4μL Taq聚合酶。在以下条件下孵育PCR反应：95℃2分钟，95℃30秒，56℃30秒，68℃1分钟(25个循环)以及68℃10分钟。

通过采用醋酸锂转化(Schiestl，R.H.& Gietz，R.D.(1989)Curr.Genet.16：339-346)将Nrul消化的pScFv-Fr-HCD3-K或pScFv-Fr-HCD3-T和PCR扩增的CDR1和CDR2转化进EY93，来分别利用同源重组将简并K或T CDR1和CDR 2区域克隆进pScFv-Fr-HCD3-K和pScFv-Fr-HCD3-T，这产生了新质粒pScFv-Fr-HCD1-3-K和pScFv-Fr-HCD1-3-T。

将简并轻链CDR3克隆进ScFv框架

为了将轻链CDR3引入含有简并重链CDR1-3的ScFv框架中，含有简并轻链K或T文库CDR3的引物(图28)被用于从pScFv-Fr-HCD1-3-K和pScFv-Fr-HCD1-3-T扩增含有简并重链CDR1-3的ScFv。使用以下的PCR反应条件：1×PCR缓冲液(Invitrogen)、0.2mMdNTPs、1μL pScFv-Fr-HCD1-3-K或pScFv-Fr-HCD1-3-T、0.6μM P1pJG4-5chK、0.2μM TMT(或KMT)L3.RVS、0.2μM Ab33.pJG26.RVS、0.2μM pJG4-5.RVS、1μL Taq聚合酶。在以下条件下孵育反应混合物：95℃2分钟，95℃30秒，55℃30秒，72℃30秒(25循环)以及72℃10分钟。将PCR产物克隆进经EcoRI和XhoI消化的pIL500中，产生表达K4和T4文库的质粒，称为pScFv-K4或pScFv-T4。

ScFv文库的环化

以10单位的NruI和1×NEBuffer在100μL反应中消化pIL500。该反应在37℃孵育24小时。采用引物P1VH3-74/pIL500(图28)利用PCR从pScFv-K4或pScFv-T4扩增编码T4或K4文库的ScFv的DNA，所述引物含有与IC结构域的重叠互补序列。第二引物(P2L19/接头)(图28)含有编码第二接头肽的DNA，其在V_H结构域和I_N结构域之间添加接头肽。采用以下条件PCR扩增ScFv文库：1×PCR缓冲液、0.2mM dNTPs、1μL pScFv-K4或pScFv-T4、0.2μM P1VH3-74/pIL500、0.2μM P2 L19/接头、以及1μL Taq聚合酶。在以下条件下孵育PCR反应：95℃2分钟，95℃30秒，50℃30秒，72℃2分钟(30循环)以及72℃7分钟。采用引物(P2接头/pIL500)进行另一PCR反应，其将重叠序列的DNA添加到I_N结构域。该反应按上述方法进行。将PCR产物克隆进经NruI消化的pIL500中，产生表达K4和T4文库的质粒，称为pScFv-cyc-K4或pScFv-cyc-T4。来自每个文库的50个成员被测序以确定功能性ScFv的百分比和证实文库多样性。

酵母双杂交相互作用交配筛选

针对5诱饵池：Bcr-Abl SH2结构域、Bcr-Abl SH3结构域、Bcr-Abl卷曲螺旋结构域、Bcr-Abl Y177基序以及Hck Tyr激酶结构域筛选K4、cyc-K4、T4和cyc-T4文库。将K4、cyc-K4、T4和cyc-T4文库转化进EY93，以得到分别为4.2×10⁶、4.2×10⁶、20×10⁶和2.2×10⁶的最终文库多样性。ScFv文库和诱饵细胞分别在Trp-葡萄糖和His-葡萄糖培养基中过夜培养，达到高于0.5的光密度。将细胞在室温下以4000rpm离心5分钟并在1×PBS中洗涤。如上所述将细胞再次离心并重悬浮在YPD+腺嘌呤(40mg/L)培养基中。将细胞以60×10⁶ScFv文库细胞对30×10⁶每种诱饵(总诱饵150×10⁶)的比例混合并接种在YPD+腺嘌呤平板上，在30℃孵育过夜。第二天将细胞从平板上刮下，用40mL H₂O洗涤，重悬浮在甘油冷冻的溶液(根据沉淀多少)中，保存在-80℃。计算了交配效率并确定了双倍体的数量。

来自每个文库的6×10⁶细胞(对正确克隆的序列标准化)接种在His-、Trp-、Leu-半乳糖/蔗糖平板上，以便为与诱饵相互作用并激活LEU2酵母双杂交报告基因的ScFv评分。一星期后，将平板影印接种在His-、Trp-、Ade-、X-Gal半乳糖/蔗糖平板上。生长的细胞分类为弱相互作用子(interactor)，生长并变蓝的细胞分类为强相互作用子(图27)。该测定重复进行5次。

ScFv套索的Western分析

让cyc-K4文库成员的单个成员在Trp-葡萄糖培养基中过夜生长。在室温下将细胞以4000rpm离心5分钟，在40mL H₂O中洗涤，离心，重悬浮在10mL Trp-半乳糖/棉籽糖培养基中。在1、3、4、5、6、8、9.5和25小时时间点取样1mL，用于分析cyc-K4成员的表达。室温下将特定时间点的等份样品以4000rpm离心5分钟并在1mL H₂O中洗涤。将细胞重悬浮在100μL H₂O和100μL 0.2M NaOH中，轻轻震荡，并在室温下孵育5分钟。将反应离心并重悬浮在50μL SDS上样缓冲液(0.06M Tris-HCl，pH 6.8、5％甘油、2％SDS、4％β-巯基乙醇、0.0025％溴酚蓝)中，在95℃加热3分钟。采用15％SDS PAGE分析样品。以15伏45分钟将凝胶电印迹至硝酸纤维素膜。将硝酸纤维素膜在10mL封闭缓冲液(Licor Biosciences)中孵育1小时。将膜在α-HA一抗溶液(50μL α-HA抗体(Santa Cruz)、10mL封闭缓冲液、5μL吐温)中孵育过夜。以1×PBS洗涤膜3次并以α-小鼠二抗(LicorBiosciences)孵育1小时。以1×PBS洗涤膜3次并使用红外线Licor分析仪观察。

尽管本文已经公开了本发明的不同实施方案，但是依照本领域技术人员的普通常识在本发明范围内可以做出很多改动和修饰。这类修饰包括本发明的任何方面中的已知等同物替换，以便以本质上相同的方式达到相同的结果。定义范围的数包括在数字范围内。词语“包含(comprising)”在本文中作为开放式用语，基本上等同于短语“包括，但不限于”，词语“包含(comprises)”具有对应的含义。用在本文时，单数形式的“a”、“an”和“the”包括复数对象，除非上下文清楚地另有指示。因此，例如提及“a thing”包括一个以上的这种事物(thing)。本文中对参考文献的引用并非承认这类参考文献为本发明的现有技术。本说明书中引用的任何在先文献和所有的出版物(包括但不限于专利和专利申请)都通过引用并入本文，如同每个出版物都被明确地和单独地指明通过引用并入本文并且如同在本文中充分阐述。本发明包括实质上在上文中描述的以及涉及实施例和附图的所有的实施方案和变形。

Claims

1.编码断裂蛋白内含子多肽的重组核酸序列，其中按氨基至羧基的顺序，所述断裂蛋白内含子多肽包含：

包含F模块和G模块的I_C结构域，所述F模块与序列rVYDLpV**a--HNFh有至少80％的一致性，分别命名为位置F1至F16，所述G模块与序列NGhhhHNp有至少80％的一致性，分别命名为位置G1至G8；

与所述G模块的C末端部分连接的蛋白外显子结构域；以及

与所述蛋白外显子结构域的C末端部分连接的I_N结构域，所述I_N结构域包含A模块和B模块，所述A模块与序列Ch--Dp-hhh--G有至少80％的一致性，分别命名为位置A1至A13，所述B模块与序列G--h-hT--H-hhh有至少80％的一致性，分别命名为位置B1至B14；

其中：

大写字母表示通过单字母氨基酸代码命名的氨基酸；

“h”表示选自G、B、L、I、A和M的疏水残基；

“a”表示选自D和E的酸性残基；

“r”表示选自F、Y和W的芳香残基；

“p”表示选自S、T和C的极性残基；

“-”表示任何氨基酸；以及

“*”表示任选的空位；

以及其中：

位置G7处编码的残基为Q、W、F、L、I、Y、M、V、R、K、H、E或D；和/或

位置G6处编码的残基为L、N、D、W、F、I、M或Y；和/或

位置B11处编码的残基为K、Y、F、W、H、Q或E；和/或

位置G6处编码的残基为A且G7为Y；和/或

位置G6处编码的残基为A且B11为K、Y、F、W、H、Q或E；和/或

位置F4处编码的残基为E或Q；和/或

位置F13处编码的残基为F、L或I；和/或

位置F14处编码的残基为W、F、Y、L、K或R；和/或

位置F15处编码的残基为W或L；和/或

位置B9处的残基不为R或T且对于N-X酰基转换而言是非催化氨基酸；和/或

位置B10处的残基不为R或T且对于N-X酰基转换而言是非催化氨基酸；和/或

位置F2处的残基不为R或T且对于N-X酰基转换而言是非催化氨基酸；和/或

位置F6处的残基不为S、T或C且对于涉及位置G8处亲核氨基酸攻击酯键或硫酯键的酯交换反应而言是非催化氨基酸。

2.如权利要求1所述的重组核酸，其中：

位置G7处编码的残基为Q；或

位置G6处编码的残基为L、N或D；或

位置B11处编码的残基为Y；或

位置G6处编码的残基为A且G7为Y。

3.如权利要求1所述的重组核酸，其中所述蛋白外显子结构域包含编码免疫球蛋白分子的免疫球蛋白编码区，所述免疫球蛋白分子包含通过接头连接至轻链可变区的重链可变区，第一接头将所述重链可变区的C末端区连接至所述轻链可变区的N末端区，第二接头将所述重链可变区的N末端区连接至所述轻链可变区的C末端区，其中所述接头包含至少10个氨基酸的多肽链，其中：

所述重链可变区包含一个或多个选自HFR1、HFR2、HFR3和HFR4的重链框架区；并且所述重链可变区还包含一个或多个选自CDR-H1、CDR-H2、CDR-H3的互补决定区；所述重链框架区和互补决定区按式HFR1--CDR-H1--HFR2--CDR-H2--HFR3--CDR-H3--HFR4设置；以及

所述轻链可变区包含一个或多个选自LFR1、LFR2、LFR3和LFR4的轻链框架区；并且所述轻链可变区还包含一个或多个选自CDR-L1、CDR-L2和CDR-L3的互补决定区；所述轻链框架区和互补决定区按式LFR1--CDR-L1--LFR27-CDR-L2--LFR3--CDR-L3--LFR4设置；

以及其中，

(i)HFR1为第一重链框架区，由约30个氨基酸残基的序列构成；

(ii)HFR2为第二重链框架区，由约14个氨基酸残基的序列构成；

(iii)HFR3为第三重链框架区，由约29至约32个氨基酸残基的序列构成；

(iv)HFR4为第四重链框架区，由7至约9个氨基酸残基的序列构成；

(v)CDR-H1为第一重链互补决定区；

(vi)CDR-H2为第二重链互补决定区；

(vii)CDR-H3为第三重链互补决定区；

(viii)LFR1为第一轻链框架区，由约22至约23个氨基酸残基的序列构成；

(ix)LFR2为第二轻链框架区，由约13至约16个氨基酸残基的序列构成；

(x)LFR3为第三轻链框架区，由约32个氨基酸残基的序列构成；

(xi)LFR4为第四轻链框架区，由约12至约13个氨基酸残基的序列构成；

(xii)CDR-L1为第一轻链互补决定区；

(xiii)CDR-L2为第二轻链互补决定区；以及

(xiv)CDR-L3为第三轻链互补决定区。

4.包含权利要求1或2所述的重组核酸的宿主细胞，其中所述断裂蛋白内含子多肽在所述宿主细胞中以自体催化反应加工，以形成具有不超过一个线性末端的至少一种环化多肽。

5.包含权利要求3所述的重组核酸的宿主细胞，其中所述断裂蛋白内含子多肽在所述宿主细胞中以自体催化反应加工，以形成具有不超过一个线性末端并具有免疫球蛋白折叠构象的免疫球蛋白分子。

6.如权利要求4所述的宿主细胞，其中所述环化多肽具有一个线性末端，所述线性末端为C末端或N末端。

7.如权利要求6所述的宿主细胞，其中所述环化多肽形成套索肽。

8.如权利要求5所述的宿主细胞，其中所述免疫球蛋白分子形成套索肽。

9.如权利要求7或8所述的宿主细胞，其中所述套索肽包含内酯连接点。

10.如权利要求6所述的宿主细胞，其中所述环化多肽为环状并且不具有线性末端。

11.如权利要求5所述的宿主细胞，其中所述免疫球蛋白分子为环状并且不具有线性末端。

12.适合于测定融合蛋白之间相互作用的宿主细胞，所述细胞包含：

编码猎物融合蛋白的第一重组基因，所述猎物融合蛋白包含转录阻遏子或激活子结构域和第一异源氨基酸序列；

编码诱饵融合蛋白的第二重组基因，所述诱饵融合蛋白包含DNA结合结构域和第二异源氨基酸序列；以及

编码可检测基因产物的重组报告基因，所述重组报告基因包含能够与所述诱饵融合蛋白的DNA结合结构域结合的操纵基因DNA序列；

其中所述报告基因的表达响应所述第一异源氨基酸序列和所述第二异源氨基酸序列之间的结合而被调节；以及

其中所述重组基因的至少一种包含权利要求1、2或3所述的核酸。

13.在细胞中测定融合蛋白之间相互作用的方法，所述方法包括：

使所述细胞表达编码猎物融合蛋白的重组基因，所述猎物融合蛋白包含转录阻遏子或激活子结构域和第一异源氨基酸序列；

使所述细胞表达编码诱饵融合蛋白的重组基因，所述诱饵融合蛋白包含DNA结合结构域和第二异源氨基酸序列；

其中所述重组基因的至少一种包含权利要求1、2或3所述的核酸；

向所述细胞提供编码可检测基因产物的重组报告基因，所述重组报告基因包含能够与所述诱饵融合蛋白的DNA结合结构域结合的操纵基因DNA序列，其中所述报告基因的表达响应所述第一异源氨基酸序列和所述第二异源氨基酸序列之间的结合而被调节；以及

测定所述可检测基因产物的表达。

14.免疫球蛋白分子，其具有不超过一个线性末端并具有免疫球蛋白折叠构象，所述免疫球蛋白分子包含通过接头与轻链可变区连接的重链可变区，第一接头将所述重链可变区的C末端区连接至所述轻链可变区的N末端区，第二接头将所述重链可变区的N末端区连接至所述轻链可变区的C末端区，其中所述接头包含长至少约50埃的柔性共价分子键，其中：