CN104769113A

CN104769113A - 超稳定免疫球蛋白可变结构域的筛选和改造方法及其应用

Info

Publication number: CN104769113A
Application number: CN201280076586.9A
Authority: CN
Inventors: 李滢权; 金圣根; 朴荣燮; 南效廷; 金董植; 朴在燦; 尹桦
Original assignee: Mogam Biotechnology Research Institute
Current assignee: Mogam Biotechnology Research Institute
Priority date: 2012-08-22
Filing date: 2012-08-22
Publication date: 2015-07-08
Anticipated expiration: 2032-08-22
Also published as: KR101796689B1; CN104769113B; JP6073038B2; EP2888367A1; CN113234142B; WO2014030780A1; EP2888367B1; JP2015531597A; CN106986934A; EP3165535B1; US20160003844A1; EP2888367A4; EP3165535A1; CN113234142A; KR20150032337A; KR101732552B1; CN106986934B; KR20160072272A; US10078085B2

Abstract

本发明涉及被称作Tat相关蛋白质改造工程(TAPE)的方法，通过将靶蛋白和抗生素抗性蛋白连接到Tat信号序列并在大肠杆菌内表达它，筛选具有更高的溶解性和优异的热稳定性的靶蛋白，特别是源自人生殖细胞的免疫球蛋白可变结构域(VH或VL)，以及由TAPE法筛选的、具有溶解性和优异的热稳定性的、人或改造的VH和VL结构域抗体和人或改造的VH和VL结构域抗体支架。还提供了在由TAPE法筛选的人或改造的VH或VL结构域抗体支架中包括随机CDR序列的文库，以及其制备方法。海通了使用该文库筛选的具有靶蛋白质结合能力的VH或VL结构域抗体，包括该结构域抗体的药物组合物。

Description

超稳定免疫球蛋白可变结构域的筛选和改造方法及其应用

技术领域

以下公开涉及被称作Tat相关蛋白质改造工程(TAPE)的方法，通过将靶蛋白和抗生素抗性蛋白融合到Tat信号序列并在大肠杆菌内表达它，筛选具有更高的溶解性和优异的热稳定性的靶蛋白，特别是源自人种系的免疫球蛋白可变结构域(VH或VL)。本发明还涉及由TAPE法筛选的、具有优异的溶解性和热稳定性的、人重链可变结构域抗体(下文称为“VH结构域抗体”)和轻链可变结构域抗体(下文称为“VL结构域抗体”)和人或改造的VH和VL结构域抗体支架。此外，以下公开内容涉及VH和VL结构域抗体和抗体支架的氨基酸序列，以及编码所述氨基酸序列的多核苷酸。

在含有根据本发明筛选的人或改造的VH或VL支架的VH或VL结构域抗体具有相应的人或改造的VH或VL结构域抗体支架(不管CDR序列)的情况下，它仍保留溶解性和热稳定性。

此外，以下公开内容涉及在由TAPE法筛选的人或改造的VH或VL结构域抗体支架中包括随机CDR序列的文库，以及其制备方法。

此外，以下公开内容涉及使用所述文库筛选的、对靶蛋白质具有结合能力的VH或VL结构域抗体，所述结构域抗体的氨基酸序列，编码所述氨基酸序列的多核苷酸。

发明背景

片段化的小尺寸抗体因为它与全长单克隆抗体(mAb)的不同理化性质而是一种能够克服现有抗体疗法的局限性的有前途的抗体。存在单链抗体(scFv)、Fab(片段抗体结合)抗体、免疫球蛋白可变结构域抗体，例如VH或VL等作为一般抗体片段，以及串联scFv、双抗体、微型抗体等作为其修饰形式(Better et al.,Science 1988 240(4855):1041-3；Huston et al.,Proc.Natl.Acad.Sci.U S A.1988 85(16):5879-83；Bird et al.,Science 1988242(4877):423-6；Pei et al.,Proc.Natl.Acad.Sci.U S A.1997 94(18):9637-42；Iliades et al.,FEBS Lett.1997 409(3):437-41；Ward et al.,Nature 1989341(6242):544-6)。

抗体片段或小尺寸的抗体与全长单克隆抗体相比主要是丧失了Fc(可结晶片段)的功能，因此，没有由于Fc的存在而产生的预期效果，如，增加的循环半衰期、效应子功能等。

然而，小尺寸的片段化抗体被放大作为能够克服由于现有完整抗体的大尺寸造成的局限下一代抗体，所述局限例如对结构上隐藏的表位的可及性、药物渗透和生物分布、形式灵活性、高生产成本等(Zhao et al.,Blood 2007110(7):2569-77；Holliger et al.,Nat.Biotechnol.2005 23(9):1126-36；Hudsonet al.,Med.Microbiol.Immunol.2009 198(3):157-74；Enever et al.,Curr.Opin.Biotechnol.200920(4):405-11)。

此外，各种抗体片段和小尺寸抗体的优点在于可以通过化学方法或重组蛋白融合的方法进行连接来实现双重或多重特异性。

近来，这种优点已被用来引入多特异性，使得Fc功能被模块化，从而补充了已被指出作为缺点的效应子功能和短的循环半衰期。例如，将对人血清白蛋白具有结合特异性的片段或小尺寸抗体引入模块中以实现双特异性抗体，从而提高了循环半衰期，或将对免疫细胞，如自然杀伤或T细胞具有特异亲合力的小尺寸抗体引入模块中，从而赋予它细胞杀伤功能(Els et al.,J Biol Chem.2001 9；276(10):7346-50；Bargou et al.,Science 2008321(5891):974-7；et al.,Mol.Cancer Ther.20087(8):2288-97)。另外，由于单个抗体可以被设计成向预期具有不同作用模式的两个或更多个分子靶标赋予特异性，开启了显著改善抗体的效力和经济可行性的可能性。

人抗体结构中具有抗原特异性结合功能的最小单元是重链可变结构域(VH)或轻链可变结构域(VL)，这是定位在轻链或重链N-末端的可变结构域。由于各自两个N-末端已进化成具有互补结构，在从血浆B细胞生产单克隆抗体时组装重链和轻链过程中，VH和VL构成非共价结合型复合体，从而保持其结构的稳定性。人抗体可变结构域VH节段根据在框架部分的氨基酸序列的同源性被分为7个家族(VH1、VH2、VH3、VH4、VH5、VH6、VH7)，但不包括CDR(互补决定区)结合表位，每个家族中含有3至22种不同的氨基酸序列。轻链的VL分为Vκ和Vλ，Vκ分为六个家族而Vλ分为10个家族(Chothia et al.,1992J.Mol.Biol.227,799-917；Tomlinsonet al.,1995EMBO J.14,4628-4638；Williams et al.,J.Mol.Biol.264,220-232)。人们已经知道，一些VH和VL根据相互亲和力的程度而具有优选的VH/VL配对组合，并且因此，已经知晓基因的这种组合重排在扩大抗体库的多样性中起重要作用(Ruud et al.,J.Mol.Biol.1999,285,895-901)。

根据6个CDR的组合，结合型的VH/VL向特定抗原赋予互补结合特异性。轻链的CDR1、CDR2和CDR3和重链的CDR1、CDR2和CDR3，共有6个CDR，参与抗原的结合。根据人类种系序列的分析，发现各种各自的CDR大多依赖于重链可变结构域的CDR3。因此，这一分析表明抗体的结合特异性主要取决于重链的CDR3的可变性(J.Mol.Recogni.2000,13,167-187)。

与此不同，动物如骆驼和美洲驼以及具有软骨骨架的鱼如鲨鱼具有单重链结构而没有轻链结构的抗体。因此，这些抗体的可变结构域仅包括单个重链可变结构域(对于骆驼和鲨鱼分别是V_HH和V_NAR)，并且公知的是这种抗体在抗原结合和中和功能方面不比VH和VL同时参与抗原结合的人抗体差。除了在具有重链疾病的人类患者中，VH或VL单独很少存在(Hendershot et al.,J.Cell.Biol.1987 104(3):761-7；Prelli et al.,J.Immunol.1992 148(3):949-52)。其原因是VH或VL在VH或VL单独分离时由于其结构互补体而在结构上是不稳定的，并且因此，可能容易发生蛋白质聚集。已知的是这种蛋白质聚集部分地是由主要在VH和VL界面处分布的疏水性氨基酸残基所造成的疏水性相互作用而引起。不同于人抗体，在骆驼抗体的情况下，具有亲水性的氨基酸残基可以特别地定位在VH/VL边界区域的表面上。具体地，在骆驼抗体的四个位点处的氨基酸(它们是特异地与人VH3家族的那些不同的)被称为四分体。这些氨基酸位于Kabat编号系统的位置37、44、45和47处(Kabat et al.,1991J.Immunol.147(5),1709-1719)。在氨基酸序列中这种差异可以解释单可变结构域抗体(VHH)的稳定性。有人试图通过将人可变结构域抗体中在四分体位置的氨基酸替换为骆驼抗体(G44E/L45R/W47G)的亲水性氨基酸，产生改善的骆驼科抗体。

结果是，从理化性质的角度讲它们的溶解性会有所改善(Coppieters etal.,Arthritis Rheum.2006 54(6):1856-66；Dolk et al.,Proteins.2005 59(3):555-64；Ewert et al.,Biochem.200241(11):3628-36；Kortt et al.,J.Protein Chem.199514(3):167-78；Martin et al.,Protein Eng.1997 10(5):607-14)。然而，与骆驼抗体相比难以得到它们的稳定性，例如，降低的蛋白质表达产率和热稳定性(Davies et al.,FEBS Lett.1994Feb 21；339(3):285-90；Aires et al.,J.Mol.Biol.2004 340(3):525-42)。业已发现，其理由是，在VH/VL边界区域的氨基酸修饰会导致相应区域的β-折叠结构的修饰(Riechmann et al.,J.Mol.Biol.1996 259(5):957-69)。与人抗体相比较，骆驼单结构域抗体的CDR3具有异常长的环结构。根据结构分析发现，这种环结构折叠成人抗体的VH/VL边界区域，并且已经提出，这种独特的结构部分地遮蔽了位于边界区域中的疏水补丁，从而帮助稳定骆驼单结构域抗体(Joost et al.,2010Drug Discovery Today:Technologies 7(2),139-14)。

在人类抗体中由于CDR3的相对较短的环结构而难以预期该屏蔽作用。总之，与骆驼单结构域抗体相比，人单可变结构域本身有缺陷的理化性质，由此不足以被用作特定抗原的结合配体的支架。作为克服这一点的方法，仅仅替换作为骆驼抗体的结构特征的四分体氨基酸是不够的，进一步需要蛋白质结构设计和VH或VL的定向进化。

存在于自然界的人免疫球蛋白可变结构域(VH或VL)是能够维持抗原结合特性的最小尺寸的抗体(单克隆抗体大小的1/12)，因此，预计与常规的单克隆抗体在物理性质和作为治疗性蛋白质的治疗效果方面不同。因此，开发仅具有一个可变结构域的人抗体的需求也增加了。然而，当VH或VL单独存在时，蛋白质的聚集和不稳定倾向仍然是主要障碍，应该在开发特定抗原的结合支架时被克服。

因此，为了使抗体片段和小尺寸抗体提供一般的单克隆抗体不能实现的优点并保持本身的竞争力，确保物质本身的稳健的药物和理化性质是很重要的。

在已有技术中也已尝试了一些分子定向进化的方法，以便稳定人重链或轻链可变结构域(Barthelemy et al.,J.Biol.Chem.2008 283(6):3639-54)。他们用VH的CDR-改造文库构建了噬菌体展示系统，然后筛选在施加热胁迫之后对蛋白A具有结合活性的VH。有报告称通过该方法筛选到了具有增加的溶解性、并在蛋白质的热变性后允许可逆折叠的CDR改造的人VH(Jespers et al.,Nat.Biotechnol.2004 22(9):1161-5)。此外，有报告称，制备了无热变性处理下在CDR3部分和框架部分诱导突变的各种文库并用相同的方法筛选到在噬菌体展示后对蛋白A展现高结合活性的VH，因此，可以得到相比野生型的VH为热力学稳定且具有增加的可溶性表达的改造的VH(Barthelemy et al.,J Biol Chem.2008 283(6):3639-54)。在噬菌体展示系统中，靶蛋白是由融合到靶蛋白的N-末端的pelB蛋白的Sec信号序列诱导至Sec途径。然而，在这种情况下，该蛋白(其之前在大肠杆菌的细胞质内折叠)由于蛋白质的固有转位途径的限制而不能通过该途径。原因是，一般的噬菌体展示采用Sec途径，这是大肠杆菌的代表性的蛋白质转位途径，并且，由于这条途径的性质，靶蛋白质在穿过细胞膜时在分子伴侣帮助下在细胞质内具有线性结构而不是三维结构。在胞质内，sec途径特异的蛋白质(不同的线性形式)在被称作SecB的分子伴侣的帮助下，蛋白转录后直接天然存在而不折叠。sec途径靶蛋白通过Sec B被移动到由存在于细胞内的Sec A、SecYEG和SecDFYajC组成的转位复合体，以线性形式而不是三维结构穿过膜，并且已穿过的氨基酸链在到达周质前通过DsbA和DsbB的氧化和还原形成包括二硫键的完整的三维结构(Baneyx and Mujacic NatureBiotech.2004,22,1399～1408)。因此，如果由于蛋白质本身的性质而在细胞质中迅速发生一定的蛋白质折叠和三维结构形成，这种蛋白与设计用于Sec途径的噬菌体展示筛选系统不具有兼容性。

此外，据报道，当基于斑块尺寸的大小直接从遍布菌苔的平板上筛选克隆时，可选择具有改进的理化性质的野生型VH(To et al.,J.Biol.Chem.2005280(50):41395-403)。但是，通过基于平板的筛选来进行大规模处理是不可能，因此，为了减小文库的大小，制造仅用于进行蛋白质体外筛选步骤的VH3家族的初始文库。

同时，为了提高重组蛋白的折叠特性，尝试了遗传选择方法(Maxwellet al.,Protein Sci.1999 8(9):1908-11；Wigley et al.,Nat.Biotechnol.200119(2):131-6；Cabantous et al.,Nat Biotechnol.2005 23(1):102-7；Waldo GS.Curr.Opin.Chem.Biol.2003 7(1):33-8)。一个代表性用于改善重组蛋白的折叠特性的方法是通过测量以重组DNA技术融合到目的蛋白质的报告蛋白的活性来间接测定目的蛋白质的折叠程度。然而，当目的蛋白单独存在时，不能准确地反映折叠。

另外，为了提高蛋白质的溶解性，已经开发出了分子定向进化方法，其中利用Tat(双精氨酸转位)途径作为生物过滤器来确定蛋白质是否被折叠，该途径是具有校对蛋白质折叠品质的功能的蛋白质转位途径。具体地，目的蛋白融合到报告基因和Tat信号序列并通过大肠杆菌内的Tat途径表达，然后根据蛋白质的折叠程度和溶解性通过Tat ABC转位酶复合体进行蛋白折叠校对。如果靶蛋白质具有足够的溶解性，由靶蛋白和报告蛋白组成的融合蛋白穿过大肠杆菌的内膜并到达周质。通过诸如抗生素抗性测量等方法检测到达周质的融合蛋白，从而筛选具有所需溶解性程度的蛋白质(Fisher et al.,Protein Sci.2006 15(3):449-58)。由此可以看出，当重组蛋白时，不仅是在天然系统中的Tat途径底物蛋白质被应用于Tat途径时，它也显著通过Tat途径，与重组蛋白的溶解性和稳定性成正比(Lim et al.,Protein Sci.2009 18(12):2537-49)。另外，已经报道，利用Tat途径，有效筛选出允许在大肠杆菌的细胞质内进行蛋白质折叠的单链抗体(scFv)(Fisher AC and DeLisa MP.J Mol Biol.2009 385(1):299-311)。根据上述文献，分子定向进化是通过使用在大肠杆菌中不溶的并表达为模板碱基序列的scFv13完全在体外实现的。scFv内的二硫键具有约4至6kcal/mol的水平，并有助于蛋白质分子的稳定化。这一键是形成在氧化环境中，如细菌的周质或真核生物的内质网(ER)。细菌的周质通常通过电子在内膜上存在的DsbA和DsbB之间的流动保持氧化条件。因此，在通过人工穿过Tat途径而从scFv改造文库中选择的scFv13蛋白的情况下，自主自我折叠、在还原条件细胞质而不是氧化条件细胞质中没有形成二硫键的胞内抗体被优先选择。具体而言，当引导蛋白进入Tat途径的信号序列融合到靶蛋白的N-末端并且TEM-1β-内酰胺酶融合到靶蛋白的C-末端(用作报告基因)的基因在大肠杆菌内表达时，表达了三功能融合蛋白(tripartide)。

表达的融合蛋白进入Tat途径，并且通过存在于内层细胞膜的Tat ABC转位酶复合体的机制进行蛋白质折叠检查。一些研究发现，在许多重组蛋白中，只有那些具有溶解性的蛋白保持了与Tat途径的特定机制的兼容性(Sanders et al.,Mol.Microbiol.2001 41(1):241-6；DeLisa et al.,Proc.Natl.Acad.Sci.U S A.2003 100(10):6115-20；Matos et al.,EMBO J.200827(15):2055-63；Fisher AC and DeLisa MP.J.Mol.Biol.2009 385(1):299-311；Lim et al.,Protein Sci.2009 18(12):2537-49)。

但是，上述用于提高蛋白质的折叠特性的方法从未被应用于选择结构域抗体，特别是，VH或VL结构域抗体等。

总之，目前，人VH结构域抗体的改造修饰和筛选无一例外地是基于噬菌体展示和与蛋白A的结合活性来进行(Kristensen P and Winter G.Fold.Des.1998 3(5):321-8；Sieber et al.,Nat.Biotechnol.1998 16(10):955-60；Junget al.,J.Mol.Biol.1999 294(1):163-80；A and Plückthun A.J.Mol.Biol.2001 305(5):989-1010)。

因此，迫切需要发展用于选择具有更有效的溶解性和高的热稳定性的VH结构域抗体的方法，并且进一步地，迫切需要发展通过利用所选择的结构域抗体而具有改善功效的最小单位的下一代抗体。

发明内容

技术问题

本发明的一个实施方案涉及提供一种命名为Tat相关蛋白质改造工程(TAPE)的方法，能够有效地筛选具有溶解性和高的热稳定性的VH或VL结构域抗体。

进一步地，本发明的一个实施方案涉及提供由TAPE法筛选的、具有溶解性和优异的热稳定性的、人VH和VL结构域抗体和人或改造的VH和VL结构域抗体支架，以及提供所述VH和VL结构域抗体和抗体支架的氨基酸序列，和编码它的多核苷酸。

在含有根据本发明筛选的人或改造的VH或VL支架的VH或VL结构域抗体具有相应的人或改造的VH或VL结构域抗体支架(不管CDR序列)的情况下，仍保留着溶解性和热稳定性。

进一步地，本发明的一个实施方案涉及提供一种在由TAPE法筛选的人VH或VL结构域抗体支架中包括随机CDR序列的文库，及其制备方法。

进一步地，本发明的一个实施方案涉及提供对使用所述库筛选的靶蛋白具有结合能力的VH或VL结构域抗体，所述结构域抗体的氨基酸序列，及编码它的多核苷酸。

解决技术问题的技术方案

在一个总的方面，本发明提供了一种命名为Tat相关蛋白质改造工程(TAPE)的方法，能够有效地从人免疫球蛋白可变结构域文库或组合文库中筛选配体，尤其是，具有高溶解性和高的热稳定性的VH和VL结构域抗体。

另外，本发明提供了用于筛选所述配体的系统、载体和宿主细胞，并提供了由TAPE法筛选的配体，特别是VH和VL结构域抗体。

令人惊讶地，我们发现，由根据本发明的TAPE法筛选的VH结构域抗体，只要保留了VH结构域抗体支架，即，FR1至FR4框架，而不管被插入的CDR序列，即，序列CDR1至CDR3，就具有高溶解性和热稳定性，以及保持高溶解性和热稳定性。

从这个观点来看，本发明提供了由本发明的TAPE法筛选的VH结构域抗体支架，其中随机的人源性或组合的CDR序列，也就是，CDR1至CDR3序列，被插入到VH结构域抗体支架，即，FR1至FR4框架中，以及构造它的方法。

另外，本发明提供了从所构建的文库中筛选具有靶向与靶蛋白结合能力的VH结构域抗体的方法。

在本发明提供的具有高的溶解性和热稳定性的VH结构域抗体支架，即，FR1至FR4框架，具有下面的氨基酸序列：

FR1的氨基酸序列：

X₀VQLX₁X₂X₃GX₄X₅X₆X₇X₈PGX₉SX₁₀X₁₁X₁₂X₁₃CX₁₄X₁₅X₁₆GX₁₇X₁₈X₁₉-式1)

在式1)中，

X₀是E或Q，

X₁是V或L，

X₂是E或Q，

X₃是S或A，

X₄是G或A，

X₅是G，M，N，V，或E，

X₆是L，V，或W，

X₇是V，K，A，或I，

X₈是Q，K，或H，

X₉是G，T，A，R，E，S，或T，

X₁₀是L，V，R，或M，

X₁₁是R或K，

X₁₂是L，I，或V，

X₁₃是S，A，或T，

X₁₄是A，E，V，R，I，K，T，或S，

X₁₅是A，G，P，V，或T，

X₁₆是S，F，或Y，

X₁₇是F，Y，R，G，或L，

X₁₈是T，A，S，N，T，P，I，N，H，或A，和

X₁₉是F，L，V，或C；

FR2的氨基酸序列：

WX₂₀RX₂₁X₂₂PGX₂₃GX₂₄X₂₅X₂₆X₂₇X₂₈-式2)

在式2)中，

X₂₀是V，A，或L，

X₂₁是Q，N，R，I，K，Y，V，M，S，Q，W，F，L，V，或C，

X₂₂是A，G，K，S，V，M，或T，

X₂₃是K，Q，E，R，或T，

X₂₄是L，N，I，P，Y，T，V，W，A，R，M，或S，

X₂₅是V或E，

X₂₆是W，I，V，P，F，H，M，Y，L，C，或R，

X₂₇是V，M，I，或L，和

X₂₈是S，A，或G；

FR3的氨基酸序列：

X₂₉X₃₀X₃₁X₃₂X₃₃X₃₄X₃₅X₃₆X₃₇X₃₈X₃₉X₄₀X₄₁X₄₂X₄₃X₄₄X₄₅X₄₆X₄₇X₄₈X₄₉X₅₀X₅₁DX₅₂X₅₃X₅₄YX₅₅C X₅₆X₅₇-式3)

在式3)中，

X₂₉是R，H，Q，或T，

X₃₀是F，V，L，或I，

X₃₁是T，S，或I，

X₃₂是I，L，V，M，或R，

X₃₃是S，T，或D，

X₃₄是R，A，V，N，或I，

X₃₅是D，N，或A，

X₃₆是N，T，D，I，R，K，Y，或E，

X₃₇是A，S，V，或T，

X₃₈是K，R，T，Q，V，E，M，N，或I，

X₃₉是N，R，T，K，S，D，或V，

X₄₀是T，M，S，V，I，Y，或A，

X₄₁是L，V，A，或M，

X₄₂是F，Y，N，D，H，或S，

X₄₃是L或M，

X₄₄是Q，E，H，或N，

X₄₅是M，L，V，I，或W，

X₄₆是N，T，K，D，Y，I，或S，

X₄₇是S或N，

X₄₈是L或V，

X₄₉是R，K，或T，

X₅₀是D，A，S，P，T，V，I，或S，

X₅₁是E，A，D，或S，

X₅₂是T，N，或S，

X₅₃是S，A，或G，

X₅₄是V，I，L，或M，

X₅₅是Y或F，

X₅₆是A，G，V，或S，和

X₅₇是R，S，K，T，L，N，或F；和

FR4的氨基酸序列：

X₅₈GX₅₉GX₆₀X₆₁VTVSS-式4)

在式4)中，

X₅₈是W，C，Y，G，S，或A，

X₅₉是Q，R，或L，

X₆₀是A，T，I，或V，和

X₆₁是L，M，P，V，或T。

另外，本发明提供了编码VH结构域抗体支架的氨基酸序列(即，FR1至FR4框架的氨基酸序列)的多核苷酸。

更优选地，本发明提供的具有高的溶解性和热稳定性的VH结构域抗体支架，即，FR1至FR4框架，具有下面的氨基酸序列：

FR1的氨基酸序列：

X₀VQLX₁X₂SGGX₅X₆X₇X₈PGX₉SX₁₀RX₁₂SCX₁₄X₁₅SGX₁₇X₁₈X₁₉-式5)

在式5)中，

X₀是E或Q，

X₁是V或L，

X₂是E或Q，

X₅是G，N，V，或E，

X₆是L或V，

X₇是V或K，

X₈是Q，K，或H，

X₉是G，T，A，R，E，或T，

X₁₀是L或V，

X₁₂是L或V，

X₁₄是A，E，V，I，K，或S，

X₁₅是A，G，或V，

X₁₇是F，Y，R，G，或L，

X₁₈是T，A，S，N，T，P，I，N，H，或A，和

X₁₉是F，L，V，或C；

FR2的氨基酸序列：

WVRX₂₁X₂₂PGX₂₃GX₂₄X₂₅X₂₆X₂₇X₂₈-式6)

在式6)中，

X₂₁是Q，N，R，I，K，Y，V，M，S，Q，W，F，L，V，或C，

X₂₂是A，G，K，S，或M，

X₂₃是K，Q，E，R，或T，

X₂₄是L，N，I，P，Y，T，V，W，A，R，M，或S，

X₂₅是V或E，

X₂₆是W，I，V，P，F，H，M，Y，L，C，或R，

X₂₇是V，M，I，或L，和

X₂₈是S，A，或G；

FR3的氨基酸序列：

RX₃₀TX₃₂SX₃₄DX₃₆X₃₇X₃₈X₃₉X₄₀X₄₁X₄₂X₄₃X₄₄X₄₅X₄₆X₄₇X₄₈X₄₉X₅₀X₅₁DTAX₅₄YX₅₅CX₅₆X₅₇-式7)

在式7)中，

X₃₀是F，V，L，或I，

X₃₂是I，L，V，或M，

X₃₄是R，A，V，或I，

X₃₆是N，T，D，I，R，K，Y，或E，

X₃₇是A，S，V，或T，

X₃₈是K，R，T，Q，V，E，M，N，或I，

X₃₉是N，R，T，K，S，D，或V，

X₄₀是T，M，S，V，I，Y，或A，

X₄₁是L，V，A，或M，

X₄₂是F，Y，N，D，H，或S

X₄₃是L或M，

X₄₄是Q，E，H，或N，

X₄₅是M，L，V，I，或W，

X₄₆是N，T，K，D，Y，I，或S，

X₄₇是S或N，

X₄₈是L或V，

X₄₉是R，K，或T，

X₅₀是D，A，S，P，T，V，I，或S，

X₅₁是E，A，D，或S，

X₅₄是V，I，L，或M，

X₅₅是Y或F，

X₅₆是A，G，V，或S，和

X₅₇是R，S，K，T，L，N，或F；和

FR4的氨基酸序列：

X₅₈GQGX₆₀X₆₁VTVSS-式8)

在式8)中，

X₅₈是W，C，Y，G，S，或A，

X₆₀是A，T，I，或V，和

X₆₁是L，M，V，或T。

另外，本发明提供了编码重链可变结构域(VH)抗体支架的氨基酸序列(即，FR1至FR4框架的氨基酸序列)的多聚核苷酸。

更优选地，本发明中提供的具有高溶解性和热稳定性的VH结构域抗体的支架，即，FR1至FR4框架，具有在表1中记载的氨基酸序列。

[表1]通过TAPE筛选的VH抗体支架的FR1至FR4框架的氨基酸序列(来自于人种系)

另外，本发明提供了编码VH结构域抗体支架的氨基酸序列(即，FR1至FR4框架的氨基酸序列)的多聚核苷酸。

特别地，通过对框架的一部分氨基酸序列进行修饰而改进的VH结构域抗体支架，即，FR1至FR4框架，具有表2中记载的氨基酸序列。

[表2]氨基酸修饰的VH结构域抗体支架的FR1至FR4框架的氨基酸序列

根据本发明包括VH抗体支架的氨基酸序列(即，FR1至FR4框架的氨基酸序列)的VH结构域，具有由下式表示的氨基酸序列

FR1-X-FR2-X-FR3-X-FR4-式9)，

在式9)中，X从左到右的顺序是指CDR1、CDR2和CDR3。

具体地，根据本发明包括FR1至FR4框架的氨基酸序列的VH结构域具有选自表3和4所示的SEQ ID NO：37至89，和SEQ ID NO：90至131的氨基酸序列之一。

[表3]包括由TAPE筛选的VH结构域抗体支架的FR1至FR4框架的VH结构域的氨基酸序列(来自于人种系)

[表4]包括氨基酸修饰的VH结构域抗体支架的FR1至FR4框架的VH结构域的氨基酸序列

为了可以更容易地理解本发明，在详细描述本发明之前首先定义本文所使用的某些术语和缩写。

人免疫球蛋白可变结构域：这是指在构成人免疫球蛋白G的12个结构域(VH、CH1、CH2、CH3、VL和CL各一对)中直接参与结合抗原的重链可变结构域(VH)或轻链可变结构域(VL)。VH或VL结构具有这样的结构，其中9个β-折叠链相互交叉。在VH的情况下，可变区是存在于第二和第三β-折叠之间，在第四和第五β-折叠之间，以及在第八和第九β-折叠之间，从其N-末端开始，在此，这些可变区分别被称为CDR(互补决定区)1、CDR2和CDR3。当从VH的N-末端开始时，在第一和第二β-折叠不含CDR1的整个部分被称为框架1(FR1)，CDR1和CDR2之间包括第三和第四的β-折叠的部分被称为框架2(FR2)，CDR2和CDR3之间的部分被称为框架3(FR3)和CDR3后的部分被称为框架4。各框架不直接参与结合抗原，即使它们是抗原可变结构域，并且在这些区域中的大部分氨基酸序列在人免疫球蛋白上是一致的保守的。VH节段根据框架区的氨基酸序列同源性被分成7个家族(VH1、VH2、VH3、VH4、VH5、VH6和VH7)。VL节段被分成Vκ和Vλ，Vκ节段被分为六个家族而Vλ节段被分成10个家族(Chothia et al.,1992J Mol Biol 227,799-917；Tomlinson et al,1995EMBO J 14,4628-4638；Williams et al.,J Mol Biol 264,220-232)。

CDR(互补决定区)：这可以被称为超变区，并且是指定位在抗体结构的重链或轻链可变结构域之内并参与直接结合抗原表位的区域。每个可变结构域具有三个CDR区，它们由具有不同长度的氨基酸序列组成。

抗体支架：这是指抗体结构除了高变区(即，CDR区)以外的其余部分，其直接结合抗原，并且其氨基酸序列在制备CDR改造文库时是保守的。换句话说，这是指所述抗体除了CDR1、CDR2和CDR3(高变区)的氨基酸序列以外的其余部分。在本发明中，这是指整个FR1至FR4框架的区域，它对应于各人免疫球蛋白可变结构域中除了CDR1、CDR2和CDR3的区域以外的其余部分。

即，本发明中的VH结构域的抗体支架是指FR1至FR4框架的整个区域，但不包括VH结构域抗体中的CDR1至CDR3区。

该抗体支架可被用作制备用于筛选结合至靶标的蛋白质(特别是VH结构域抗体)的CDR改造文库的支架。

结构域抗体：在广义上，是指能够结合特定抗原，包括构成人免疫球蛋白结构的一些结构域的修饰蛋白。在狭义上，是指人免疫球蛋白可变结构域(VH或VL)的修饰形式，其可以合适地用作治疗性抗体。

特别地，单个结构域抗体通常是指从仅由重链组成的单重链抗体衍生的可变结构域。源自单峰驼的单结构域抗体被称为VHH(来自单重链抗体的重链可变结构域)，以及VNAR(来自于软骨鱼纲如鲨鱼的单结构域抗体被称为可变的新抗原受体)。

本发明中的单结构域抗体，例如，VH结构域抗体或VL结构域抗体，是指仅由源自人的可变结构域的一个重链或轻链组成的抗体，没有特别限制。

靶标蛋白：这是指在TAPE法中，为了改善来自文库的蛋白质特性而要选择的目的蛋白质。在本发明中，这是指由在Tat信号序列和pET-TAPE表达载体的TEM-1β内酰胺酶基因之间功能性地连接的基因所编码的蛋白质。也可以使用要求溶解性的任何蛋白质而没有限制，并且其实例包括源自于人的抗体及其片段、受体、受体配体等，并且特别包括天然型的来自人种系细胞的人免疫球蛋白可变结构域及其人工突变的蛋白。

配体：这是指具有在从文库中筛选的靶蛋白之中与特异性受体或靶向蛋白的结合能力的蛋白质。

多特异性：这是指能够特异性结合到一个或多个表位的抗体的性质。这也指识别一个目标对象中的两个或更多个表位的抗体的性质，或结合于两个或更多个目标对象的抗体的性质。

融合蛋白：这是指其中由核酸编码的、具有不同功能的至少两个蛋白质或者肽功能性地彼此连接的蛋白质，例如，Tat信号序列和靶蛋白功能性地彼此连接。这里，可加入报告基因如TEM-1β内酰胺酶，或诸如6xHis或Flag的标签。功能性地彼此连接的蛋白质的基因的表达是由一个启动子(诱导型、维持型等)在表达载体上调控的。

天然型或野生型：这是指可以在自然系统中获得的基因或其产物(例如，蛋白质)。这是一个与突变体、基因多态性和变体相反的概念，其产物由于基因序列的人工或自然改变而使特性改变。

将根据上述术语定义和缩写来描述本发明。

如上所述，根据本发明的TAPE法和用于它的TAPE系统是一种用于筛选具有溶解性和优异的热稳定性的靶蛋白如源自人种系细胞(VH或VL)、配体等的免疫球蛋白可变结构域的方法和用于执行该方法的系统，其制备其中靶蛋白和抗生素抗性蛋白被结合到Tat信号序列的基因构建体，然后用包括该基因构建体的载体转化宿主细胞，特别是大肠杆菌，在大肠杆菌中表达融合蛋白。

“Tat信号序列”是由Tat(双精氨酸转位)途径识别的序列。它将蛋白质引导到从细菌细胞质传递到细胞内的膜中的途径，以及引导到从基质转移到叶绿体的类囊体的途径。一般地，Tat信号序列被分为以下三个基序。它是由n-区(其为具有正电荷的N-端基序)，在中间由疏水性氨基酸组成的h-区，和在c-区(其是C-末端基序)组成。作为分析若干Tat信号序列的结果，人们发现，S/T-R-R-x-F-L-K这个Tat信号序列的显著的保守序列是遍布n-区和h-区存在的。其中，两个精氨酸(R)被命名为双精氨酸，因为它们在所有Tat信号序列中是保守的。

该Tat信号序列可以选自TorA、CuoO、DmsA、FdnG、FdoG、HyaA、NapA、Suf1、WcaM、TagT、YcbK、YcdB、YdhX和YnfE，但不限于此。通过在细胞质中与分子伴侣或各种辅因子结合而具有完整三维结构的蛋白质通过Tat信号途径移动到细胞膜，但不与Sec信号(它是细菌的一般细胞膜运动途径)兼容。换句话说，由于只有在细胞质中被折叠成具有完整三维结构的蛋白质可被Tat ABC转位酶复合体识别，它们参与与Sec途径具有不同特性的蛋白质转位途径(Baneyx and Mujacic,Nat.Biotech.2004,22,1399～1408)。

根据本发明的TAPE法使用Tat-信号途径的上述特性。为了使源自文库(例如，人VH结构域文库)的靶蛋白经过TAPE筛选系统途径，它需要在细胞质内被完全折叠，从而被Tat ABC转位酶复合体识别。因此，这种存在于细胞内的膜中的复合体可以用作适合性过滤器(fitness filter)来仅仅过滤适合Tat途径的底物。因此，本发明使用这样的事实，即该蛋白质通常只有当它在细胞质中完全折叠时，才通过Tat途径，这是依赖于蛋白质的可溶性和快速折叠(DeLisa et al.,2003PNAS 100(10):6115-6120；Snaders et al.,2001Mol Microbiol 41(1):241-246；Matos et al.,2008EMBO J 27(15):2055-2063；Fisher et al.,2006Protein Sci 15(3):449-458；Lim et al.,2009Protein Sci18(12):2537-2549)，如由其他研究所发现。在本发明中使用的Tat途径的信号序列优选地TorA、CueO、DmsA、FdnG、FdoG、HyaA、NapA、Suf1、WcaM、YagT、TcbK、YcdB、YdhX、and YnfE蛋白的信号序列，但并不限于此。

换句话说，由于Tat途径的性质而发生蛋白质折叠的大肠杆菌的细胞质具有不允许二硫键的还原条件，并且因此，可以从VH结构域抗体文库中过滤出在未经二硫键的帮助下快速且准确地自发发生折叠的VH结构域。找出在还原性的环境下具有功能且自主折叠的抗体是开发用于存在于还原环境的细胞质中的靶抗原(即，胞内抗体)的特异性抗体的关键点。人VH结构域或由本发明的TAPE系统筛选的生殖细胞的改造的VH结构域的物理化学性质可以通过分析所筛选的VH结构域的特征来确定。很难简单地预测细胞质内自主折叠的靶蛋白如何有助于某些物理化学性质(例如，蛋白质的溶解性、蛋白的热稳定性、蛋白质的长期贮存稳定性、蛋白质的结构稳定性等)并进一步作为抗体治疗剂。本发明的目的是引入及开发上述TAPE法并将其应用于蛋白质的技术，并且更具体地，应用这一TAPE法来筛选改善的人免疫球蛋白可变结构域抗体(VH或VL)，并应用具有由此获得的改善性能的可变结构域抗体作为开发新的治疗性抗体的支架。

与现有技术的方法相比较，根据本发明的TAPE法具有以下优点。

使用现有技术的噬菌体展示技术，通过向结构域抗体文库施加预定的压力(如温度)来执行淘选，然后测量蛋白A的结合活性(Jepsers L.et al.,Nat.Biotechnol.2004 22(9):1161-5；Barthelemy P.A.et al.,J.Biol.Chem.2008283(6):3639-54)，通过未经特殊筛选步骤的实验，意外地发现了被命名为M0的结构域(作为结构域的形式是稳定的)(J.Biol.Chem.2009May 22；284(21):14203–14210)。

然而，采用TAPE法，通过使用大肠杆菌的Tat途径可以很容易地筛选根据本发明的具有高溶解性和热稳定性的人免疫球蛋白可变结构域。

此外，已经知道通过基于板的筛选从包括Tat信号序列的文库中发现可溶性蛋白的方法。但是，这种方法必须按照下面的步骤，即当将用预定比例稀释的表达菌株涂布在含有抗生素的固体培养基(板)上时，获得由于其抗生素抗性而存活的各个克隆。(Fisher A.C.et al.,Protein Sci.2006Mar.15(3):449-58,Fisher A.C.et al.,J.Mol.Biol.2009 385(1):299-311)。因此，由于该基于板的筛选方法的限制，难以从一个板中分离10⁵或更多的单个克隆。鉴于用于选择一般的结合活性的抗体文库为10⁹至10¹⁰，使用上述方法来覆盖整个的正常大小的文库在物理上是非常困难的。结果，实质上难以在筛选中实现高通量形式。此外，当使用现有技术的方法(例如，ISELATE)确认了通过抗生素抗性从板中选择的个体菌株的质粒的基因序列时，经常发现靶基因被克隆成片段化形式而表达短蛋白形式的情况或者只有报告基因存在而没有靶蛋白(例如，仅TEM1-1β-内酰胺酶)的情况(Fisher A.C.et al.,J.Mol.Biol.2009 385(1):299-311)。这些肽的水平(由10至20个氨基酸组成)的短蛋白不受其二维或三维结构的影响，并且因此，它们本身在大多数情况下具有非常高的溶解性，从而导致假阳性。在现有技术的基于Tat的蛋白质折叠筛选方法(例如，ISELATE，Fisher JMB2009)中，这个假阳性比率趋向于随着使用抗生素抗性的筛选数量的增加而增加，并且这成为实质性的阻碍，使得不能筛选可溶性蛋白质。因此，这些方法中大多数都是用于研究晶体结构而不是检查大型文库，所述研究通过从难以确保可溶性的靶蛋白的小尺寸突变体文库(10⁵至10⁶大小)的蛋白修饰来确保可溶性表达(Pédelacq et al.,Nat Biotechnol.2002 20(9):927-32；Yanget al.,Proc.Natl.Acad.Sci.2003 100(2):455-60)。

然而，根据本发明的TAPE法，整个文库被接种于含有选择性抗生素(例如，氨苄青霉素)的液体培养基中，而不使用基于现有的固体培养基(板)的蛋白质溶解性筛选方法。因此，对于在培养基体积增大的情况下，可适用于同时筛选的文库(大肠杆菌)的大小没有限制，由此实现了高通量筛选。另外，如上所述，在现有技术的方法中，非常有可能的是在从包含抗生素的液体培养基中筛选文库后，文库向表达载体(例如，pET-TAPE)的克隆步骤过程中，其中引入了自体连接的空载体(mock vector)和上述肽水平的基因片段的克隆是作为假阳性存在。为了解决由于肽水平的基因片段造成的假阳性问题(这是这一使用连接酶的克隆方法的固有问题)，从收集到的大肠杆菌中收集总的质粒，并且将先前改造的表达靶蛋白和TEM-1β-内酰胺酶的融合蛋白的基因的两个末端用限制性内切酶处理。然后，通过凝胶电泳和凝胶洗脱方法分离完整大小的选择基因。结果，只有首先被TAPE法筛选到的所有真正的阳性VH结构域可以被完全收集。因此，根据本发明的TAPE法具有的优点在于，尽管使用抗生素抗性的重复筛选数量增加，但只有仅含有完整靶蛋白的基因构建体的真正阳性克隆可以被筛选到，而不会增加假阳性。

具体地，根据本发明的TAPE系统使用编码融合蛋白的基因构建体，其中Tat-信号序列功能性地连接到靶蛋白的N-末端，特别是重链结构域，以及抗生素抗性蛋白质，特别是赋予抗生素抗性的蛋白质，如成熟的(自身排除Sec途径信号序列)TEM-1β-内酰胺酶或类似物功能性地连接其C-末端。

TAPE系统或使用它的TAPE法使用这样的原则，即在基因构建体转化宿主细胞，特别是大肠杆菌后，只有通过Tat信号序列表达了可溶型的正确折叠的抗生素抗性蛋白质的大肠杆菌可以在含有抗生素的培养条件下生存。

当一个宿主细胞仅由一个基因构建体转化时，包括在存活宿主细胞中的靶蛋白被假定为正确折叠的可溶形式。

另外，可以通过根据本发明的TAPE法，通过使用转化有编码不同靶蛋白的基因构建体的多个宿主细胞群，特别是大肠杆菌群，以大规模高通量方式分离可溶性靶蛋白。

TAPE法包括：

(1)在含有抗生素的液体培养基中培养宿主细胞群，该宿主细胞群被转化有编码融合蛋白的基因构建体，其中Tat-信号序列功能性地连接到靶蛋白的N-末端，特别是重链可变结构域，并且抗生素抗性蛋白功能性地连接于其C-末端；

(2)从抗生素抗性的大肠杆菌中收集质粒DNA；

(3)从收集的质粒DNA中收集编码靶蛋白的核酸序列；和

(4)从收集的核酸序列中确认并筛选靶蛋白的序列。

特别地，该方法可以进一步包括，在步骤(3)之后，选自下面的一个阶段：

(3')制备基因构建体，其中所收集的核酸序列被再次功能性地连接到编码Tat-信号序列的基因和抗生素抗性基因，然后再用所产生的基因构建体转化该宿主细胞群，

或，

(3”)直接用含有所收集的核酸序列的质粒转化宿主细胞群，而不制备单独的基因构建体。

阶段(3”)相比于阶段(3')具有的优点在于更迅速地进行下一个阶段。

阶段(1)至(3')或阶段(1)至(3”)可以重复两轮或更多轮，并且这种重复过程会导致筛选具有溶解性和高水平稳定性的靶蛋白。

当阶段(1)至(3')或阶段(1)至(3”)可以重复两轮或更多轮时，最后靶蛋白质可通过在步骤(3')或(3”)之后执行确认和筛选靶蛋白的序列的阶段(4)而被识别。

将对TAPE法进行具体说明。

(1)在每个宿主细胞(尤其是大肠杆菌)的细胞质中以融合蛋白的形式表达靶蛋白(特别是人可变结构域文库)。这里，在每个宿主细胞，特别是大肠杆菌中，只有一个特定的融合蛋白被表达。在此，在该融合蛋白中，Tat-信号序列功能性地连接到靶蛋白(例如，人免疫球蛋白可变结构域，特别是VH)的N-末端，并且赋予抗生素抗性的蛋白质，如成熟的(自身排除了Sec途径信号序列)TEM-1β-内酰胺酶或类似物功能性地连接到其C-末端。

(2)将融合蛋白表达文库接种到含有抗生素的液体筛选培养基中并向其施加选择压力。这里，在第一轮，包含在液体筛选培养基中的抗生素的浓度可以基于0.1mg/ml(1×)是1×、2×、3×、4×、或5×、8×或10×。这里所用的抗生素可以是氨苄青霉素、羧苄青霉素等，但并不限于此。也可以使用根据在阶段(1)中所用的抗生素抗性蛋白来适当使用的任何抗生素而没有限制。被表达的融合蛋白根据靶蛋白的特性通过Tat途径并移动到细胞内的膜。由于靶蛋白的特性(即不具有溶解性)而没有转位的融合蛋白可以形成包涵体或可以由于Tat校对机制而在细胞质中降解。只有融合蛋白移动到周质中的大肠杆菌才可以通过功能性地连接到靶蛋白的C-末端的赋予抗生素抗性的蛋白(例如TEM-1β-内酰胺酶或类似物)的作用，在含抗生素的液体筛选培养基中获得抗性。

(3)从在液体筛选培养基中存活的大肠杆菌中收集质粒DNA，然后用先前设计的限制性内切酶处理，以通过电泳和凝胶洗脱的方法从整个融合蛋白收集仅编码所述靶蛋白和赋予抗生素抗性的蛋白质如β-内酰胺酶的融合部分的核酸。

或者，

(3')从在液体筛选培养基中存活的大肠杆菌中收集质粒DNA，然后用所收集的质粒DNA直接转化大肠杆菌，如实施例5所述，随后进行下一阶段。

(4)将收集的核酸克隆到空载体中，以便它再次功能性地连接Tat信号序列。

此后，可以再次重复阶段1)至3)，以从文库中富集表达具有所需性质的蛋白质的基因的比例。这里，用于下一轮的液体培养基可以被选择为具有比前一轮更高浓度的抗生素。

作为本发明中的靶蛋白，特别是可以通过TAPE法筛选的靶蛋白，可以使用具有所期望功能的任何类型的蛋白质。优选地，可以使用与特定靶标(scFv、胞内抗体、结构域抗体、Fab)，受体蛋白质，特别是T细胞受体(TCR)，受体配体等，具有结合能力的蛋白质，但是本发明中的靶蛋白不限于此。更优选地，结构域抗体，例如，VH结构域抗体或VL结构域抗体是适宜的。

本发明中的靶蛋白可以具有突变。对于靶蛋白的突变，基于扩增的突变方法，如合成被设计为可使在特定位点的氨基酸进行随机修饰的寡聚物，然后采用使用该寡聚物的重叠聚合酶链反应(PCR)的方法，或在PCR条件下诱导在随机位点的随机变异(易错PCR)的方法，其中DNA聚合酶的错误率是人为增加的，但是突变方法不限于此。

包括本发明的靶蛋白的融合蛋白可以包括由在其C-末端的特定氨基酸序列组成的标签，以便于其分离、纯化或检测。可以使用在本发明所属领域中通常使用的任何标签而不限制为这一标签。例如，该标签可选自6xHis标签、FLAG标签、C-myc标签等，但不限于此。

任何本发明所属的领域中已知的能够在大肠杆菌中表达的载体都可以用作表达所述融合蛋白的载体而没有限制，并且这一载体的非限制性实例可包括pET22b(Novagen)、pAE34(AthenaES)、pET9a(Novagen)、ΔpMK等(Lim HK et al.,Production Characteristics of Interferon-a Using an L-arabinose Promoter System in a High-cell-density Culture.Appl.Microbiol.Biotechnol.53(2):201-208.)。作为诱导融合蛋白表达的启动子，可以使用lac启动子、T7启动子、阿拉伯糖启动子等。

仅从由使用TAPE法筛选的文库中收集靶基因，并将其克隆到新的表达载体，使得仅靶蛋白质单独表达而没有已分别定位在N-末端和C-末端的Tat信号和TEM-1β-内酰胺酶，然后，对各命中物执行纯化步骤。这里，纯化步骤可以通过为了便于纯化和分析而在靶蛋白的C-末端包括标签来容易地进行。如上所述，可以使用在本发明所属领域中通常使用的任何标签而没有限制。例如，标签可选自6xHis标签、Flag标签、C-myc标签等，但不限于此。此外，可以根据可变结构域的类型(例如VH3)通过使用蛋白A亲和柱来执行纯化步骤。

可以根据本发明的TAPE法所使用的文库的种类，筛选具有所需性质的配体。这种配体的实例可包括免疫球蛋白可变结构域，特别是结构域抗体，受体，受体配体等，但不限于此。特别地，配体可以是野生型，以及可以是由在文库中诱导突变而具有突变的配体等，如上所述。

此外，可以相同方式获得基因序列，即用于编码该配体的碱基序列。

可以确认，通过本发明的TAPE法获得的配体，例如野生型配体，包括受体，受体配体，来自种系碱基序列的VH和VL或者从其组合文库中筛选的其突变配体展现出优选的理化性质。特别是，可以确认，该配体的溶解性、长期储存稳定性、在还原环境的细胞质中的自我折叠能力和热稳定性改善。

更优选的配体可以是，例如，从人免疫细胞cDNA文库获得的人免疫球蛋白可变结构域及其突变体。突变体可以通过使用文库来筛选并获得，在该文库中氨基酸使用NNK引物等在特定的野生型人免疫球蛋白可变结构域的框架部分的特定位置上被修饰。

当通过根据本发明的TAPE法筛选的重链或轻链可变结构域，即，VH或VL结构域抗体，具有人VH或VL结构域的对应框架序列，仍旧保持其溶解性和热稳定性，而不管CDR序列如何。

因此，通过本发明筛选的具有优异的物理性质如高溶解性、热稳定性等的VH支架可以用作所述文库中的支架用于获得特定配体，即，靶向所需靶标(即，抗原)的结构域抗体。具体地讲，在维持筛选到的突变体VH结构域抗体的支架的同时，向其中插入随机CDR序列来构建文库，然后可使用普通的方法如淘选等从文库中筛选对所需靶标(即，抗原)具有结合能力的抗体。

具体地讲，与普通的噬菌体展示方法等相似，上述抗体可通过洗脱除了结合到被固定的所需抗原的VH结构域抗体以外，所有未结合到被固定的所需抗原的VH结构域抗体来进行筛选。重复上述洗脱未结合到被固定的所需抗原的VH结构域抗体的步骤两次或更多次，从而筛选与靶向抗原具有更高的结合能力的VH结构域抗体。

为了使用如上所述在本发明中得到的VH结构域抗体的支架来构建CDR突变体文库，相应的可变区(例如，在人免疫球蛋白可变结构域的情况下的CDR)可以具有各种长度，即，氨基酸残基的数目可以改变，或特定氨基酸残基可以被其他随机的氨基酸替换。或者，只有在CDR内的超可变区的某些特定位点可以随机地被修饰。

因此，本发明提供了一种在由本发明的TAPE法筛选的VH或VL结构域抗体的支架中包括随机CDR序列的文库及其制造方法，并且提供了一种使用所述文库筛选对所需靶蛋白具有结合能力的VH或VL结构域抗体，和由所述方法筛选到的VH或VL结构域抗体，并且还提供了所筛选到的结构域抗体的氨基酸序列和编码它的多核苷酸。

这些方法可以改善人单可变结构域抗体，特别是VH结构域抗体的物理性质，从而得到单可变结构域，特别是具有这种不能在天然的VH和VL中发现的优异的溶解性和耐热性的VH结构域抗体。

附图简要说明

图1是示出由TAPE法筛选的蛋白质的溶解性图。

图2是示出通过TAPE法筛选可溶性蛋白的方法的示意图，包括：

(a)在含有抗生素的液体培养基中培养宿主细胞群；

(b)根据抗生素浓度确认宿主细胞群的生长曲线；

(c)收集质粒来检查编码靶蛋白的核酸存在与否；和

(d)制备基因构建体，其中所收集的核酸序列被再次功能性地连接到编码Tat-信号序列的基因和赋予抗生素抗性的基因，然后再用所制备的基因构建体转化该宿主细胞群。

图3是示出通过使用TAPE法从人免疫球蛋白重链可变结构域基因文库中筛选的人VH结构域的氨基酸序列的视图：

(a)所筛选的人VH结构域的FR1、CDRH1、FR2和CDRH2的序列，和

(b)所筛选的人VH结构域的FR3、CDRH3和FR4的序列。

图4示出使用SDS-PAGE关于使用TAPE法从人免疫球蛋白重链可变结构域基因文库中筛选的人VH结构域在大肠杆菌中的表达方面的分析结果，其中，sol表示细胞裂解后的可溶性级分和Incl表示细胞裂解后的不溶性级分，箭头表示在相应VH分子量的位置处的条带：

(a)现有技术中已知具有良好的溶解性的VH结构域的的表达方面，以及

(b)左框示出从源自人生殖系细胞的人免疫球蛋白重链可变结构域随机选择的VH结构域的表达方面和右框示出由TAPE法筛选的VH结构域的表达方面。

图5是示出制备首先由TAPE法筛选的VH结构域抗体支架的改造文库的方法视图。

图6是示出使用VH结构域抗体支架的改造文库通过TAPE法筛选的人VH结构域的氨基酸序列的视图：

(a)筛选的人VH结构域的FR1、CDRH1、FR2和CDRH2的序列，和

(b)筛选的人VH结构域的FR3、CDRH3和FR4的序列。

图7示出使用SDS-PAGE关于使用VH结构域抗体支架的改造文库用TAPE法筛选的人VH结构域在大肠杆菌中的表达方面的分析结果，

其中，M表示分子量标记，泳道1代表骆驼结构域抗体VHH的表达方面，泳道2是CDR合成的人结构域抗体HEL4，泳道3是MG2X1，泳道4到32代表从框架改造文库中筛选的VH支架的表达方面，各泳道的框架如下：

泳道5：MG2-47，泳道6：MG2-55，泳道7：MG2-57，泳道8：MG2-59，泳道9：MG4-2，泳道10：MG4-5，泳道11：MG4-6，泳道12：MG4-7，泳道13：MG4-12，泳道14：MG4-13，泳道15：MG4-17，泳道16：MG4-20，泳道17：MG4-28，泳道18：MG4-32，泳道19：MG4-33，泳道20：MG8-4，泳道21：MG8-5，泳道22：MG8-6，泳道23：MG8-8，泳道24：MG8-11，泳道25：MG8-12，泳道26：MG8-13，泳道27：MG2-7I，泳道28：MG2-9I，泳道29：MG2-10I，泳道30：MG2-11I，泳道31：MG2-12I，泳道32：MG2-12L

图8是示出由TAPE法筛选的VH结构域的圆二色性(CD)比较结果图。

图9是示出使用VH结构域抗体支架的改造文库由TAPE法筛选的人VH结构域的圆二色性(CD)比较结果图。

图10是示出由TAPE法筛选VH结构域的长期储存稳定性的曲线图。

图11是示出制备具有改变的CDR长度的改造文库的方法的视图。

图12是示出为提高结合抗原的能力，理性的文库中突变位置的视图：

(a)FR1、CDR H1和FR2的序列，

(b)CDR H2和FR3和序列

(c)CDR H3和FR4的序列。

图13是示出制备选择性的CDR改造文库的方法的视图。

图14示出使用SDS-PAGE在CDRH3修饰时，关于根据CDRH3的氨基酸残基数目的VH支架在大肠杆菌中表达方面的分析结果：

(a)CDRH3氨基酸残基的数目是7的情况，

(b)CDRH3氨基酸残基的数目是8的情况，

(c)CDRH3氨基酸残基的数目是9的情况，

(d)CDRH3氨基酸残基的数目是10的情况，

(e)CDRH3的氨基酸残基的数目是11的情况，

(f)CDRH3的氨基酸残基的数目是12的情况，

(g)CDRH3的氨基酸残基的数目是13的情况，和

(h)CDRH3氨基酸残基的数量不改变的情况。

具体实施方式

以下，参照实施例和附图对本发明进行详细说明。然而，这些是为了更详细地解释本发明，并且本发明的范围不受下述实施例的限制。

实施例1：用于构建TAPE系统的pET-TAPE的制备

为了构建双精氨酸转运体(Tat)相关蛋白质改造工程(TAPE)系统，使用pET9a载体，通过将一种Tat底物蛋白TorA(大肠杆菌三甲胺-N-氧化物还原酶)的途径信号序列，即ssTorA，连接到靶蛋白的N末端并且将TEM-1β-内酰胺酶连接到其C-末端来制备pET-TAPE。

然而，引导蛋白质到Tat途径的信号序列并不限于ssTorA，如上所述，对普通技术人员显而易见的是可以使用所有Tat途径蛋白的信号序列。此外，对普通技术人员显而易见的是，作为使用的载体，可以使用任何满足本发明目的的载体，例如pET9a(New England Biolab)、使用阿拉伯糖诱导启动子的ΔpMA(韩国专利申请公开No.1996-007784)、使用lac启动子的pAE34等等。

在使用pET9a作为载体的情况下，当在优化培养条件下通过IPTG诱导由ssTorA、靶蛋白和TEM-1β-内酰胺酶组成的融合蛋白表达时，该融合蛋白通过信号序列的指导穿过Tat移动通路。这里，仅可溶性的和完全折叠的融合蛋白通过Tat机制(Tat A、B、C)穿过细胞内的膜，结果是，连接到靶蛋白的TEM-1β-内酰胺酶由于靶蛋白的折叠特性而移动到大肠杆菌的周质中。大肠杆菌的抗生素抗性是根据TEM-1β-内酰胺酶的在周质中存在与否来确定的。

在本发明中，对于用于筛选人免疫球蛋白重链可变结构域的系统，人免疫球蛋白重链可变结构域文库(其为靶基因)插入到pET-TAPE载体的ssTorA和TEM-1β内酰胺酶之间。

实验步骤将详细描述如下。通过DNA寡聚物合成和重叠聚合酶链反应(Genscript USA Inc.,US)合成ssTorA基因和人免疫球蛋白重链可变结构域的VH家族2型的代表基因的融合基因(Stefan Ewert et al.,Stabilityimprovement of antibodies for extracellular and intracellular applications:CDRgrafting to stable frameworks and structure-based framework engineering.Methods 34(2004)184-199)。使用合成的ssTat-VH2基因作为模板同时使用包括NdeI序列的5'方向引物(SEQ ID NO：1)和包括NotI、6xhis和BamHI序列的3'方向引物(SEQ ID NO：2)诱导聚合酶链反应(PCR)。

使用两种引物，1mM的0.5U的I-Pfu DNA聚合酶(iNtRON)，各2.5mM的四种dNTP，以及5μl的10X反应缓冲液，并补充蒸馏水至50μl最终体积进行PCR反应。PCR反应在95℃运行2分钟，随后为94℃15秒，56℃15秒，72℃30秒，30个循环，最后为72℃5分钟。将扩增的DNA加载到1％琼脂糖凝胶上来执行电泳，然后，使用QIAquick凝胶提取试剂盒(QIAGEN，Valencia,CA,USA)分离。

将经PCR扩增的NdeI-ssTorA-VH2-NotI-6xHis-BamHI基因插入pET9a载体的多克隆位点(MCS)中存在的NdeI和BamHI切割位点，以制备pET9a-ssTorA-VH2质粒。将NotI-TEM-1β-内酰胺酶-BamHI节段插入pET9a-ssTorA-VH2质粒的NotI和BamHI切割位点之间，并且将其命名为pET-TAPE，所述NotI-TEM-1β-内酰胺酶-BamHI节段是使用5'引物(SEQID NO：3)和3'引物(SEQ ID NO：4)，同时使用TEM-1β-内酰胺酶(BLA)基因作为模板运行PCR而分离的。此后，从pET-TAPE除去VH2区并将文库基因插入其内来构建文库。为了检查所构建的TAPE系统是否依赖于相应的蛋白质的溶解性，将有代表性的天然型的人免疫球蛋白结构域抗体(Dp47d、VH2、VH3)(其在大肠杆菌中的可溶性表达程度是以前已知的)、阴性对照基因(VH3-Bla，无信号序列)和阳性对照基因(ssTorA-Bla，无靶蛋白)引入pET-TAPE中，然后测量TEM-1β-内酰胺酶的抗生素抗性的程度。已知VH家族2型在大肠杆菌中的可溶性表达是非常不利的，然后VH3和DP47d在大肠杆菌中的可溶性表达相对有利(Ewert et al.,Stability improvement of antibodies for extracellular and intracellular applications:CDR grafting to stable frameworks and structure-based framework engineering.Methods 34(2004)184-199)。

具体地，将先前已知其蛋白质溶解性的对照人类免疫球蛋白重链可变结构域、阴性对照(其中VH家族3型代表基因被插入pET-TAPE中并除去ssTorA，以防止TEM-1β-内酰胺酶到达周质的构建体)和阳性对照(pET-TAPE本身，其中VH基因未插入而是连接到ssTorA以便只表达TEM-1β-内酰胺酶的构建体)被安装在TAPE系统上，而将这些接种于含有抗生素剂的培养液中。然后，通过计数总存活细胞测量根据溶解性的抗生素抗性的程度。使用含有50μg/ml氨苄青霉素的LB培养基，并用IPTG诱导表达3小时，然后计数总存活细胞。

结果表明，相应的基因的已知溶解性与pET-TAPE系统下抗生素抗性程度成正比(参见，图1)。在图1中，每单位细胞浓度的增加计数意味着更强的抗生素抗性。

实施例2：源自人种系的免疫球蛋白重链可变结构域(VH)文库的制备

将从人的肝、外周血单核细胞(PBMC)、脾和甲状腺获得的mRNA逆转录来确保cDNA文库。

为了由此确保人免疫球蛋白重链可变区结构域的DNA序列，设计SEQID NO：5至13所示的混合引物，以确保所有的人重链可变结构域基因可用于人生殖细胞系。将各确保的人重链可变结构域基因文库插入pET-TAPE的NdeI和BamHI位点之间，以完成具有约10⁸大小的文库。

具体地，通过逆转录反应由从人的脾脏、外周血单核细胞、肝脏和胸腺提取的RNA(Clontech,Madison,WI,US)制备cDNA。AMV逆转录酶和RNase抑制剂购自Promega(Madison，WI，USA)。各自的RNA与1μl的dNTP混合液(0.2mM)和1μl的oligo dT引物混合，并向其中加入无核酸酶水以达到12μl总体积。对于RNA变性，将混合物在65℃培养，然后向其中加入4μl的5X链缓冲液，1μl的RNA酶抑制剂和2μl的0.1M DTT。逆转录反应在42℃运行15分钟，然后在70℃滞留15分钟。对于在PCR中使用的引物，同时使用几个简并引物，以获得用于各自家族类型的VH结构域。

使用SEQ ID NO：5至13(见表5)示出的并且各包括正向NcoI序列的引物和SEQ ID NO：14和15(见表5)示出的并且各包括反向NotI序列的引物(Integrated DNA Technologies,Inc.,Coralville,Iowa,US)。使用逆转录反应产生的cDNA作为模板扩增DNA，对于每种情况引物10pmolar，0.5U 1-pfu DNA聚合酶(Interon，韩国)，四种dNTP，每种2.5mM，以及5μl的10X缓冲液。PCR在95℃运行2分钟，随后为94℃20秒，56℃20秒，72℃2分钟，30个循环，最后是72℃7分钟。PCR后的反应混合物通过1％琼脂糖凝胶电泳分离，然后用凝胶提取试剂盒(QIAGEN，Valencia，CA，USA)纯化。用NcoI和NotI限制性酶切割扩增的PCR产物和pET9a-TAPE质粒，并分别通过PCR纯化试剂盒(QIAGEN)和凝胶提取试剂盒纯化。将扩增的VH基因插入pET9a-TAPE的NcoI和NotI切割位点之间，以制备源自人类生殖细胞的VH文库质粒。将制备的文库使用乙醇沉淀法浓缩。

通过电穿孔(BTX ECM630型号，Holliston，MA，USA)用1μl的DNA转化ElectroMAX^TMDH5a-E^TM(Invitrogen，Carlsbad,CA,US)(其是大肠杆菌)。为了验证该文库的大小，将转化的大肠杆菌依次稀释到10^-4至10^-8，并且在含有卡那霉素的LB琼脂培养基中培养。在此之后，对菌落进行计数。

结果是，确认了VH1家族的文库大小为9.1x10⁶，VH3是1.56x10⁹和VH5是6.05x10⁸。通过从其中随机地选择50单菌落得到VH基因，然后在含有卡那霉素的LB液体培养基中培养，然后使用DNA纯化试剂盒(QIAGEN，Valencia，CA，USA)分离各质粒。作为分析该VH基因的碱基序列的结果，确认了90％以上的基因被保持为能转录的形式。

[表5]本发明中使用的引物序列

其中，K表示G或T，S表示C或G，R表示A或G，M表示A或C，以及N表示A或T或G或C

在本发明中的“抗体序列编号系统”是指免疫球蛋白可变结构域VH或VL的氨基酸被编号的系统。在抗体的CDR中，在CDR中的氨基酸数目因抗体不同而不同。因此，需要以固定地确定的规则，从N-末端开始，对许多种类的个体的VH或VL的保守氨基酸序列(例如，框架部分)以及可变部分进行编号。Kabat、Chothia和IMGT编号系统具有代表性，它们根据以何种顺序来编号CDR部分的氨基酸而彼此不同。在本发明中，使用Kabat编号系统。例如，Kabat编号系统在编号CDR1的氨基酸时遵循以下原则。基本前提是，抗体的CDR可以根据氨基酸修饰程度被分成高变区和结构上支撑所述高变区的典型结构(canonical structure)。例如，框架1，这是第一保守框架，在第30个氨基酸结束。首先，第31个氨基酸到第35个氨基酸，其对应于所述第一可变区(CDR1)的典型结构，分别被编号为31至35。如果在第35个氨基酸之后的氨基酸被确定为与框架2不相同的可变氨基酸，它们按顺序被编号为35a，35b，35c......，直到高变区结束。因此，根据Kabat编号系统，确保了框架2是从氨基酸36起始。另外，使用Kabat编号系统编号CDR2的氨基酸是相同的。首先，将对应于必然存在于CDR2中的典型结构的第50个氨基酸到第52个氨基酸编号，然后将接下来的氨基酸按顺序编号为52a，52b，52c......。然后，在CDR2的后部的典型结构中的氨基酸按顺序编号为53至65。因此，确保了框架3是从氨基酸66起始。另外，编号CDR3的氨基酸是相同的。首先，将CDR3起始的典型结构的氨基酸分别编号为95至100，并将接下来的高变区的氨基酸按顺序编号为100a，100b，100c......。然后，在CDR3的后部的典型结构中的氨基酸按顺序编号为101至102。因此，与其连接的最后的框架，框架4，肯定起始于氨基酸103。

实施例3：通过TAPE(Tat相关蛋白质改造工程)对源自人种系的VH文库的筛选

(1)源自人种系的VH文库的构建

通过电穿孔方法用pET-TAPE文库转化大肠杆菌T7Express LysY/I^q。然后，将其在37℃在SOC培养液中培养1小时，然后在含有50μg/ml的羧苄青霉素(1X)的LB培养液中接种并培养。当大肠杆菌的OD值为0.6时，使用离心分离收集大肠杆菌，然后使用质粒DNA纯化试剂盒(QIAGEN，Valencia，CA，USA)分离质粒，并随后用限制性内切酶NcoI和BamHI切割。切割基因包括VH文库和β-内酰胺酶基因，这是用于排除可能出现在随后的液体淘选过程中的假阳性。pET-TAPE质粒也用限制酶NcoI和BamHI切割。切割后，各DNA用凝胶提取试剂盒(QIAGEN)纯化。将从在羧苄青霉素的LB培养液中筛选的pET9a-TAPE文库中获得的VH基因插入pET-TAPE的NcoI和BamHI切割位点之间，并用它再次转化大肠杆菌T7Express LysY/I^q。此后，重复执行上述过程，同时在培养液中的羧苄青霉素浓度增加至250μg/ml(5X)和500μg/ml(10X)，用于液体淘选。用于相应过程的示意图示于图2。

最后，对各浓度的羧苄青霉素进行液体淘选后，从含有氨苄青霉素的LB琼脂平板中选择50个单菌落，然后在含有氨苄青霉素的液体培养基中培养。然后，从中收集质粒，随后分析碱基序列。用于分析所筛选克隆的VH结构域的特性的培养方法如下。大肠杆菌DH5a和T7Express LysY/I^q购自NEB(New England BioLabs,INC.,Beverly,MA,US)。在大肠杆菌包括pET-TAPE质粒基的情况下，在含50μg/ml卡那霉素的LB培养液中培养大肠杆菌。在大肠杆菌包括pET22b载体的情况下，将50μg/ml氨苄青霉素或羧苄青霉素加入培养液中。对于种子培养，将从LB固体培养基中作为单一菌落形式分离的克隆接种在含有上述抗生素剂的LB液体培养基中，然后，在37℃以200rpm培养12小时或更长的时间。将菌落接种在培养基中，以便在种子培养液中的细胞浓度稀释至1：100。

(2)源自人种系的VH文库的筛选结果

使用TAPE系统从按上面所述制备的人免疫球蛋白重链可变结构域基因文库中筛选的天然型的人VH结构域抗体的氨基酸序列如图3所示。对于每一种情况，所筛选的天然型的人VH结构域抗体的支架，即，FR1至FR4框架的序列，示于表1。

当在从最后三次液体淘选分离总共154个VH序列中的重复的相同的序列被标记一次时，可以得到总共54个独特序列。在总共154个序列中，对应于其96％的148个序列被确定为VH3家族类型。已知该VH3家族是在人免疫球蛋白重链结构域的七个家族中相对高度可溶的，因此，这证明了使用本发明的TAPE系统进行筛选显著表明了基于溶解性的统计学上显著的筛选能力。

另外，我们发现了个体的54个序列中19个序列的框架序列是唯一的，并且其中，13个框架序列被归类为VH3家族类型。

为了检查所筛选的个体的VH基因没有TEM-1β-内酰胺酶(这是报告基因)而单独在大肠杆菌中表达时，可溶性表达的程度，在诱导VH表达后分离可溶性级分和不溶性级分，然后通过SDS-PAGE与各种对照VH结构域相比较(参见，图4)。

将相应的基因克隆到pET-22b(+)表达载体中，转化作为宿主细胞的大肠杆菌NEBT7。对于支架的表达，在37℃，200rpm的条件下进行培养，然后当OD值为0.6至0.8时用1mM的IPTG诱导表达。在25℃，180rpm持续3.5小时的条件后，收集细胞。

使用B-PER试剂(Thermo Scientific)分离蛋白质的可溶性级分和不溶性级分。细胞裂解后，可溶性级分(上清部分)可以通过细胞沉降而得到。将沉淀物(团粒)用PBS洗涤，然后重新悬浮于溶解缓冲液(pH 7.4，50mM NaH₂PO₄，6M UREA，0.5M NaCl，4mM DTT)，得到不溶性级分。其表达使用SDS-PAGE分析。

结果是，可以看出，在从文库中随机选择而未经筛选过程的VH结构域(1、2、3)的情况下，在可溶性部分中很少VH结构域具有相应尺寸，在诱导蛋白质表达后，可以看出，在由TAPE过程筛选的VH结构域MG4x4-44、MG4x4-25、MG10-10、MG2x1)的情况下，可溶性表达显著增加(参见图4(b))。也可以看出，由TAPE系统筛选的VH结构域比通常已知具有优异的可溶性表达程度的VH结构域(VH2、VH3、VH6、DP47d和HEL4)有相对较高的可溶性表达比率。

实施例4：基于MG2x1VH支架的框架改造的合成文库的制备

为了向基于通过TAPE法筛选的最佳天然型的人免疫球蛋白重链可变结构域(VH)候选组中的MG2X1VH支架赋予额外的溶解性和稳定性，构建“框架改造的合成文库”，其中在基于VH结构分析而合理选择的特定的7个氨基酸位点引入突变。

根据Kabat编号系统，在MG2X1VH支架中的氨基酸突变位点在图6中由方框(■)表示。

具体地讲，基于通过TAPE法首先筛选的MG2X1支架，在MG2X1VH支架的序列处引入突变。如下详细描述用于引入突变的聚合酶链反应(PCR)。

将整个基因序列分为两个片段以制备用于聚合酶链反应(PCR)的引物。制备在第一片段的3'引物和在第二个片段的5'引物处引入突变的引物并且通过PCR产生各基因片段(参见，表5的序列17和18)。然后，通过两个基因片段的重叠PCR构建最终的基于MG2X1的框架改造的合成文库(见，表5中序列18和19和图5)。从琼脂糖凝胶分离扩增的DNA，用限制酶NcoI和NotI处理，然后插入pET-TAPE载体中，由此制备pET-TAPE框架改造的重链可变结构域合成文库。

实施例5：通过TAPE(Tat相关蛋白质改造工程)系统对基于MG2X1VH支架的改造的VH结构域的筛选

使用本发明的TAPE系统按照上述来筛选新合成的具有改善的溶解性和稳定性的VH支架。对于TAPE的各个阶段，通过增加羧苄青霉素的浓度到50μg/ml(以下称为“1X TAPE”)、100μg/ml(以下称为“2X TAPE”)、200μg/ml(以下称为“4X TAPE”)和400μg/ml(以下称为”8X TAPE”)的量级来执行。

作为分析1X TAPE后的20个单菌落的碱基序列的结果，确认了没有发现仅包括TEM-1β-内酰胺酶基因的pET-TAPE文库。因此，最终确认可以在由本发明的TAPE系统筛选的初始阶段排除假阳性。然后，当进行2XTAPE，4X TAPE和8X TAPE时，在NcoI和BamHI限制性酶反应后仅收集VH基因，然后将它们再引入到TAPE系统的方法，以及不进行克隆工作而用从细胞培养液分离的pET-TAPE VH质粒文库转化大肠杆菌的方法同时进行。在这两种方法中都未发现假阳性菌落。在最终进行了8X液体淘选后，从LB固体培养基上选择50个单菌落，然后液体培养。然后，从中收集质粒，并进行氨基酸序列分析。

结果是，发现，根据Kabat编号系统，在7个修饰位置中，在位置50和58处偏向地选择了特别的氨基酸。具体地说，发现，在41个克隆中，16个克隆在位置50的丙氨酸被修饰为色氨酸，并且在41个克隆中，24个克隆在位置58的酪氨酸被修饰为色氨酸。在其余位置没有观察到氨基酸是特别有偏向的。

实施例6：筛选的VH支架候选物的分离和纯化及其物理化学性质分析

为了确定筛选的源自人的VH支架候选物(参照图3)和通过合成突变的VH结构支架候选物组(参见图6)的物理-化学性质，进行三种分析程序。

首先，检查筛选的VH支架的可溶性表达水平的比例，以确定VH支架候选物的溶解性程度。其次，进行圆二色性(CD)法以确定各自的支架候选物组的热稳定性。第三，通过凝胶过滤色谱法的单体比例和长期储存稳定性，确认纯化的支架候选物的蛋白质的无聚集特性。

(1)筛选的VH支架候选物的分离和纯化

将筛选的基因运送到大肠杆菌表达载体中，没有报告蛋白下只表达。使用pET-TAPE-VH候选物质粒作为模板并使用包括NcoⅠ限制酶碱基序列的5'引物(表6的SEQ ID NO：21)，和包括XhoⅠ限制性酶碱基序列的3'引物(表6的SEQ ID NO：22)运行PCR。通过PCR扩增对应于VH候选物的DNA片段，用NcoI和XhoI限制酶处理，然后插入到pET22b(+)质粒载体的NcoI和XhoI切割位点之间，从而制备pET22b-VH质粒。用制备的质粒转化大肠杆菌T7Express LysY/I^q。然后，选择单菌落，然后接种于含有100μg/mL氨苄青霉素，20mM MgCl₂和2％(w/v)葡萄糖的SB培养液中。当培养液的光密度是0.6时，向其中加入1mM的IPTG，然后在25℃进行培养4小时用于蛋白质表达。通过培养液的离心分离收集大肠杆菌，然后重新悬浮在磷酸盐缓冲的盐水(PBS)中。漂浮大肠杆菌冷冻和融化4次，以裂解其细胞壁，并通过离心分离收集上清液。向收集的上清液中加入NaCl以具有0.5M的浓度，并且用5N NaOH将pH值设定为7.4，随后用0.22μm过滤器过滤。使用Ni-NTA亲和层析纯化该蛋白质，这是用100mM咪唑洗涤并用300mM咪唑洗脱来洗涤的。使用购自Invitrogen的NuPAGE4-12％的Bis-Tris凝胶电泳证实纯化的蛋白质，随后用考马斯蓝染料染色。相对于洗脱的蛋白，通过PD-10脱盐柱(GE医疗集团生命科学，Piscataway,NJ,USA)进行缓冲液交换到磷酸盐缓冲的盐水(PBS)。

[表6]本发明中使用的引物序列

其中K表示G或T，S表示C或G，R表示A或G，M表示A或C，和N表示A或T或G或C

(2)筛选的VH候选物在大肠杆菌中的可溶性表达程度的分析

为了证实通过TAPE从基于MG2X1VH支架的框架改造文库首先筛选的VH在大肠杆菌中的可溶性表达方面，只将相应的VH以与实施例3(2)相同的方式表达，然后分离可溶性级分和不溶性级分，然后通过SDS-PAGE分析。

结果是，能够得到可溶性表达比从人免疫球蛋白重链可变结构域文库分离的天然型MG2X1提高的VH支架候选物。如图7所示，大多数在大肠杆菌中表达的所选择的VH结构域是可溶的。

其中，MG8-14、MG2-55、MG4-5、MG4-13和MG8-4支架候选物(图7的箭头所示)显示出优异的水溶性VH表达，并作为VH结构域的分析结果，确认了，表现出优异的可溶性表达的VH结构域的不溶性表达比率降低。

(3)热稳定性分析

为了通过VH支架候选物组的二维蛋白质结构分析来测定热稳定性，通过圆二色性(CD)法计算由TAPE过程筛选并纯化的VH支架候选物的Tm(解链温度；全部水性蛋白质的50％热变性的温度)。

折叠分数由在一定的温度下的吸光度与加热前的吸光度之比来表示。吸光度是根据温度变化在235nm的波长测量的。在由此获得的S形曲线中，Tm是指折叠分数为50％的温度。

纯化从天然型的人免疫球蛋白重链可变结构域文库和基于MG2x1VH支架的框架改造的合成文库中筛选的支架候选物，然后稀释至0.2至0.3mg/ml的浓度。然后，通过使用分光光度计(Jasco J-715型号，Jascoinc，Easton，MD，USA)测量其CD。当温度在25至85℃的范围内时，同时每1分钟增加1℃，记录并测量在235nm的波长时的CD信号。

一般而言，蛋白聚集发生在大多数存在于水溶液中的天然型的人免疫球蛋白重链可变结构域(VH)中，并且因此，CD测量是不可能的。

然而，由TAPE系统筛选的大多数的VH在单独存在时都没有聚集。从由TAPE系统筛选的VH的热稳定性的CD分析结果看，MG3-10具有约45℃的Tm值(参照表7)，而MG4x4-44、MG4x4-25、MG10-10和MG2x1具有约55至65℃的Tm值。这意味着它们的热稳定性与天然VH的平均Tm相比提高了约10至20℃(参见图8和表7)。

测量由TAPE系统从基于MG2x1VH支架的框架改造的合成文库中筛选的VH结构域(例如，MG2-12I、MG2-12L、MG4-13、MG8-4，MG8-14等)的Tm值，以具有65至75℃的平均Tm，并且因此，确认了其热稳定性提高了平均20至30℃(参见图9和表7)。

[表7]通过TAPE从人免疫球蛋白可变结构域文库筛选的结构域抗体的数值

4)筛选的VH的聚集度的分析

通过测量候选物VH框架根据长期储存而造成的聚集来调查蛋白质的稳定性。将纯化为具有0.2至0.8mg/mL的浓度的VH支架候选物储存在37℃，60％湿度下。

在约20天储存过程中以预定的间隔取样，然后通过离心分离从中除去聚集的蛋白。然后，测量保持水性的蛋白质的浓度，并计算其比率。

使用NuPAGE 4-12％的Bis-Tris凝胶经电泳分离剩余的蛋白，然后通过用考马斯蓝染料染色证实它们的质量。作为结果，可以看出，在加速条件(37℃)持续60天或更长时间时，大部分溶解在磷酸盐缓冲的盐水(PBS)中的蛋白质被稳定保持而没有蛋白质聚集。每个数据点表示当初始蛋白质含量设定为1时，保留在水性溶液中的蛋白质含量的比例(参照图10)。

实施例7：用于赋予候选物VH支架以抗原结合能力的根据CDRH3长度的改造文库的构建

为了向由TAPE法从源自人种系的VH文库筛选的MG2x1支架，以及由TAPE法从框架改造文库筛选的MG8-4和MG8-14支架赋予抗原结合能力的多样性，在相应支架的CDRH3部分处，构建根据氨基酸(7至13个氨基酸)的长度的CDR3合成文库。

这是从现有的研究结果中推导的，具有最合适的稳定性和与靶蛋白结合能力的VH结构域的CDR3长度对应于7至13个氨基酸长度(Christoper JBond.et al.,J.Mol.Biol.2005348:699–709)。另外，氨基酸由NNK核苷酸三联体编码，所以，即使在将终止密码子的比率相比NNN和NNS核苷酸三联体降低时，也可以编码所有20个氨基酸。此外，通过上述的方法构建了R94S NNK文库，其将精氨酸(前述CDR3氨基酸残基)替换为丝氨酸而增强了CDR3的灵活性。

为了从PCR减少误差，通过PCR构建包含框架1到框架3的模板DNA片段。分别以MG2x1、MG8-4和MG8-14的cDNA作为模板，使用10pmolar的5'引物(表6的SEQ ID NO：23)和3'引物(表6的SEQ IDNO：24)，0.5U的I-Pfu DNA聚合酶，四种dNTP每种2.5mM，5μL的10X缓冲液执行DNA扩增。PCR重复25个循环，条件为；

暴露于94℃2分钟，然后94℃20秒，56℃20秒，72℃25秒，循环25次，最后72℃5分钟。

为了赋予模板DNA以抗原结合能力的多样性，制备其中引入了具有7至13个氨基酸长度的组合CDRH3文库的引物(SEQ ID NO：25至31)。通过PCR，使用所构建的DNA片段为模板，根据长度而引入了氨基酸多样性的5'引物和3'引物(SEQ ID NO：25至31)，构建“根据长度的CDR3改造文库”。在以下条件，PCR反复进行25个循环；

暴露于94℃2分钟，接着25个循环的94℃持续20秒，56℃持续20秒，72℃40秒，25次，最后72℃5分钟。图11示出了关于构建根据赋予抗原结合能力多样性的长度的CDRH3改造文库的示意图。

实施例8：用于赋予候选物VH支架以抗原结合能力的多样性的合理的CDR改造文库的构建

出于与实施例7同样的目的，构建为了向基于MG2x1或MG8-4或MG8-14支架赋予抗原结合能力的VH多样性的CDR改造文库。不同于实施例7中的按照CDRH3的长度赋予多样性，只合理选择了在引入突变时预计具有抗原结合能力同时保持CDR长度的序列，将随机突变引入到相应的基因中。同时保持三个CDR的长度，通过结构分析，只将突变选择性地引入到抗原有可能结合(SDR：特定确定残基)的位置。这样的优点在于由于CDR突变造成的稳定性改变和免疫原性问题可通过将突变仅仅引入到CDR的最小位置而被最小化。

对于SDR，首先，参照SWISS-MODEL系统的建模数据及其典型结构，或根据核苷酸特性的建模数据和预期的结合能力来选择SDS。

另外，通过引入具有相对增加的酪氨酸和丝氨酸比率的偏向核苷酸来设计氨基酸，这是众所周知的比其他氨基酸具有更高的抗原结合能力，使得即使是相同的文库大小，CDR结合的概率也是高的(Akiko Koide et al.,PNAS2007 104(16):6632-6637)。为了在各CDR1、CDR2和CDR3中引入突变，将基因分成3部分并在该处引入突变(参照图12)。各个片段通过PCR法进行确认，而框架MG2x1或框架MG8-4、MG8-14的cDNA用作模板，如下所示。

通过PCR，分别使用5'引物(SEQ ID NO：23)和3'引物(SEQ IDNO：39)，5'引物(SEQ ID NO：40)和3'引物(SEQ ID NO：41)，以及5'引物(SEQ ID NO：42)和3'引物(SEQ ID NO：43)，合成基于MG8-4、MG8-14文库的第一、第二和第三DNA片段。

而且，通过PCR，分别使用5'引物(SEQ ID NO：23)和3'引物(SEQID NO：45)，5'引物(SEQ ID NO：46)和3'引物(SEQ ID NO：47)，以及5'引物(SEQ ID NO：48)和3'引物(SEQ ID NO：43)合成基于MG2x1文库的第一、第二和第三DNA片段。

通过PCR，用10pmolar每种引物，0.5U的vent DNA聚合酶，各10mM的四种dNTP和5μL的10X缓冲液，进行如上所述的DNA片段的合成。

PCR在94℃运行2分钟，随后为94℃15秒，56℃20秒，72℃25秒，25个循环，最后72℃5分钟。

通过重叠PCR，使用因此合成的3个模板片段，5'引物(SEQ ID NO：23)和3'引物(SEQ ID NO：44)完成整个尺寸的合理的CDR改造文库。PCR在94℃运行2分钟，随后是94℃20秒，56℃20秒，72℃40秒，25个循环，最后72℃5分钟。图13示出关于构建用于赋予抗原能力多样性的合理的CDR改造文库的示意图。

实施例9：研究在基于VH支架的文库(根据CDR长度的改造文库和合理的CDR改造文库)中的CDR修饰对蛋白质稳定性的影响

为了证实CDR修饰对VH支架结构的稳定性的影响，从具有7至13个氨基酸的CDRH3的合成文库和在CDRH1、CDRH2和CDRH3的特定位置合理地引入突变的文库中随机选择基因(每个CDR改造文库筛选约8个基因)，并且将它们克隆到专属的表达载体中。作为表达载体，使用pET-22b(+)表达载体，并转化作为宿主细胞的大肠杆菌DH5α。随机选择转化的菌落，并且分析其序列。将所有基因都保持良好的质粒进行分离不带终止密码子，并再次转化作为宿主细胞的大肠杆菌NEBT7，从而诱导相应基因的表达。在37℃和200rpm的表达条件下进行培养，然后当OD值为0.6至0.8时用1mM的IPTG诱导表达。在25℃180rpm，3.5小时的条件后，收获细胞。以与实施例3相同的方式分离可溶性蛋白级分和不溶性蛋白级分。

将从各CDR改造文库中随机选择的VH结构单独表达，然后分离可溶性级分和不溶性级分并通过SDS-PAGE进行分析。结果是，确认了在CDRH3具有七个氨基酸的情况下，所有样品除了一个以外都表达为可溶形式(参见，图14(a))。

确认了，在CDRH3具有八个氨基酸的情况下，8个样品中有7个表达为可溶形式(参见，图14(b))。可以确认的是，在CDRH3具有九个氨基酸的情况下，所有样品都表达为可溶形式(参见，图14(c))。可以确认的是，在CDRH3具有十个氨基酸的情况下，9个样品中有8个表达为可溶形式(参见，图14(d))。可以确认的是，在CDRH3具有十一个氨基酸的情况下，所有9个样品都表达为可溶形式(参见，图14(e))。可以确认的是，在CDRH3具有十二个氨基酸的情况下，8个样品中有6个表达为可溶形式(参见，图14(f))。可以确认的是，在CDRH3具有十三个氨基酸的情况下，7个样品中有6个表达为可溶形式(见，图14(g))。可以确认的是，在合理的改造的CDR文库的情况下，所有样品都表达为可溶形式。确认了，在基于由TAPE法筛选的VH结构域的框架的基础上制备的CDR改造文库中，可溶性表达是整体稳定地诱导的而不管CDR修饰(参见，图14和表8)。

[表8]引入CDR修饰后的VH可溶性表达的频率

实施例10：使用具有由TAPE法筛选的VH结构支架的VH结构域抗体文库，基于展示技术的VH结构域抗体候选物的筛选

在本发明中，噬菌体展示、酵母展示、核糖体展示等，优选作为可用的展示技术，以便使用具有由TAPE法筛选的VH支架的VH结构域抗体文库来筛选VH结构域抗体候选物，但并不局限于此。

根据噬菌体展示技术，外源肽和蛋白质插入并融合至噬菌体衣壳蛋白，以使外源蛋白质在噬菌体表面上表达(Smith et al.,Science 1985 228(4705):1315–1317)。在本发明中，通过将靶抗原结合至在固定噬菌体的表面上的表达的融合蛋白，筛选具有强结合能力的结构域抗体。

为了筛选与特定抗原具有结合能力的VH，使用下面提出的淘选方案(Carlos F.Barbas III et al.Phage Display-A Laboratory Manual,Cold SpringHarbor Laboratory Press)；

克隆被克隆到噬菌体载体(pComb3X)的VH文库(实施例7和8)；

在噬菌体的一端表达VH结构域；

将表达的VH结构域与靶蛋白接触；

选择与靶蛋白具有良好的结合能力的VH结构域。

将靶蛋白与在噬菌体的端部表达的VH结构域接触后，洗出未结合的噬菌体，并仅洗脱VH结构域-靶蛋白质复合体。因此，只有表达了VH结构域的噬菌体被浓缩。

通过重复5-6轮如上所述的淘选过程，可筛选强烈地结合于靶抗原的VH结构域抗体。

另外，在本发明中，还使用了酵母展示方法。根据酵母展示方法，在将VH文库克隆到酵母表面表达载体中(实施例7和8)后，VH结构域在酵母的表面表达，并结合到靶蛋白，从而筛选和仅洗脱具有良好的结合能力的结构域(Ginger Chao.et al.,Nature Protocol 2006 1(2):755-768)。将标签附着于靶蛋白或将生物素标记在靶蛋白上，其与所展示的VH结构域反应。然后，分别标记靶向所结合的蛋白质的荧光蛋白和靶向所展示的VH结构域的荧光蛋白。只有被标记的酵母-靶蛋白复合体(其示于期望的区域)使用荧光激活细胞分选(FACS)被洗脱，从而只收集展示特异于靶蛋白的VH结构域的酵母细胞。

在本发明中，使用核糖体展示方法来筛选对特定抗原具有结合能力的VH结构域。根据核糖体展示方法，从编码筛选的VH支架的mRNA中除去终止密码子，然后进行体外蛋白合成。然后，形成所述蛋白和其对应的mRNA相连的核糖体复合体(Mingyue H.et al.,Nature Protocol 20074(3)：281-288)。在靶抗原上进行淘选以筛选具有所需抗体的复合体，结果是，可以富集期望的复合体。将所筛选的mRNA反转录为DNA，而这个过程重复三次或四次，直到获得期望的结果。当通过上述方法在由实施例7和8制备的抗原结合文库中进行筛选时，可以筛选出强烈结合于靶抗原并具有稳定的性能，例如高溶解性、热稳定性和长的储存稳定性的VH结构域。

根据上面提出的3种筛选技术，使用HAS或HER3作为靶抗原，筛选出对人血清白蛋白(HAS)和人表皮生长因子受体3(HER3)具有高亲和力的VH结构域。

所筛选的VH结构域保持VH支架的性能，并且作为在大肠杆菌中可溶性形式表现出较高的生产力。

在所筛选的VH结构域中，对HAS或HER3具有高亲和力的VH的氨基酸序列和亲和力在表9中示出。

[表9]使用HAS和HER3作为靶抗原，根据CDRH3的长度从文库筛选的氨基酸序列与亲和力

序列表文本

SEQ ID NO:1至48引物序列

SEQ ID NO:49MG1X8氨基酸序列

SEQ ID NO:50MG2X1氨基酸序列

SEQ ID NO:51MG2X1-34氨基酸序列

SEQ ID NO:52MG2X2-12氨基酸序列

SEQ ID NO:53MG2X2-13氨基酸序列

SEQ ID NO:54MG3X1氨基酸序列

SEQ ID NO:55MG3X10氨基酸序列

SEQ ID NO:56MG4X1-8氨基酸序列

SEQ ID NO:57MG4X1-33氨基酸序列

SEQ ID NO:58MG4X1-35氨基酸序列

SEQ ID NO:59MG4X3-27氨基酸序列

SEQ ID NO:60MG4X4-2氨基酸序列

SEQ ID NO:61MG4X4-4氨基酸序列

SEQ ID NO:62MG4X4-25氨基酸序列

SEQ ID NO:63MG4X4-44氨基酸序列

SEQ ID NO:64MG4X5-30氨基酸序列

SEQ ID NO:65MG4X6-27氨基酸序列

SEQ ID NO:66MG4X6-48氨基酸序列

SEQ ID NO:67MG4X7-15氨基酸序列

SEQ ID NO:68MG4X8-24氨基酸序列

SEQ ID NO:69MG.0 5X-1氨基酸序列

SEQ ID NO:70MG.0 5X-3氨基酸序列

SEQ ID NO:71MG.0 5X-4氨基酸序列

SEQ ID NO:72MG.0 5X-14氨基酸序列

SEQ ID NO:73MG.0 75X-4氨基酸序列

SEQ ID NO:74MG2X-5氨基酸序列

SEQ ID NO:75MG2X-15氨基酸序列

SEQ ID NO:76MG4X-5氨基酸序列

SEQ ID NO:77MG1-4氨基酸序列

SEQ ID NO:78MG1-6氨基酸序列

SEQ ID NO:79MG1-7氨基酸序列

SEQ ID NO:80MG1-8氨基酸序列

SEQ ID NO:81MG1-9氨基酸序列

SEQ ID NO:82MG1-10氨基酸序列

SEQ ID NO:83MG5-1氨基酸序列

SEQ ID NO:84MG5-2氨基酸序列

SEQ ID NO:85MG5-4氨基酸序列

SEQ ID NO:86MG5-5氨基酸序列

SEQ ID NO:87MG5-6氨基酸序列

SEQ ID NO:88MG5-7氨基酸序列

SEQ ID NO:89MG5-9氨基酸序列

SEQ ID NO:90MG10-1氨基酸序列

SEQ ID NO:91MG10-2氨基酸序列

SEQ ID NO:92MG10-4氨基酸序列

SEQ ID NO:93MG10-5氨基酸序列

SEQ ID NO:94MG10-6氨基酸序列

SEQ ID NO:95MG10-8氨基酸序列

SEQ ID NO:96MG10-10氨基酸序列

SEQ ID NO:97MG2氨基酸序列

SEQ ID NO:98MG5氨基酸序列

SEQ ID NO:99MG6氨基酸序列

SEQ ID NO:100MG7氨基酸序列

SEQ ID NO:101MG10氨基酸序列

SEQ ID NO:102MG8-21氨基酸序列

SEQ ID NO:103MG2-12L氨基酸序列

SEQ ID NO:104MG2-7I氨基酸序列

SEQ ID NO:105MG2-9I氨基酸序列

SEQ ID NO:106MG2-10I氨基酸序列

SEQ ID NO:107MG2-11I氨基酸序列

SEQ ID NO:108MG12I氨基酸序列

SEQ ID NO:109MG2-32氨基酸序列

SEQ ID NO:110MG2-34氨基酸序列

SEQ ID NO:111MG2-40氨基酸序列

SEQ ID NO:112MG2-46氨基酸序列

SEQ ID NO:113MG2-47氨基酸序列

SEQ ID NO:114MG2-48氨基酸序列

SEQ ID NO:115MG2-51氨基酸序列

SEQ ID NO:116MG2-53氨基酸序列

SEQ ID NO:117MG2-55氨基酸序列

SEQ ID NO:118MG2-57氨基酸序列

SEQ ID NO:119MG2-58氨基酸序列

SEQ ID NO:120MG2-59氨基酸序列

SEQ ID NO:121MG2-60氨基酸序列

SEQ ID NO:122MG2-64氨基酸序列

SEQ ID NO:123MG4-12氨基酸序列

SEQ ID NO:124MG4-13氨基酸序列

SEQ ID NO:125MG4-17氨基酸序列

SEQ ID NO:126MG4-18氨基酸序列

SEQ ID NO:127MG4-20氨基酸序列

SEQ ID NO:128MG4-28氨基酸序列

SEQ ID NO:129MG4-2氨基酸序列

SEQ ID NO:130MG4-32氨基酸序列

SEQ ID NO:131MG4-33氨基酸序列

SEQ ID NO:132MG3-34氨基酸序列

SEQ ID NO:133MG4-5氨基酸序列

SEQ ID NO:134MG4-6氨基酸序列

SEQ ID NO:135MG4-7氨基酸序列

SEQ ID NO:136MG8-11氨基酸序列

SEQ ID NO:137MG8-12氨基酸序列

SEQ ID NO:138MG8-13氨基酸序列

SEQ ID NO:139MG8-14氨基酸序列

SEQ ID NO:140MG8-4氨基酸序列

SEQ ID NO:141MG8-5氨基酸序列

SEQ ID NO:142MG8-6氨基酸序列

SEQ ID NO:143MG8-8氨基酸序列

Claims

1.一种编码融合蛋白的基因构建体，其中Tat信号序列被连接到靶蛋白的N末端并且抗生素抗性蛋白被连接到靶蛋白的C末端。

2.根据权利要求1的基因构建体，其中所述靶蛋白是免疫球蛋白可变结构域、抗体片段、受体或受体配体。

3.根据权利要求2的基因构建体，其中所述靶蛋白是免疫球蛋白的重链可变结构域。

4.根据权利要求1的基因构建体，其中所述融合蛋白还包括用于分离、纯化或检测与其连接的氨基酸标签。

5.根据权利要求4的基因构建体，其中所述氨基酸标签选自6xHis标签、FLAG标签和c-myc标签。

6.根据权利要求1的基因构建体，其中所述Tat信号序列选自TorA、CuoO、DmsA、FdnG、FdoG、HyaA、NapA、Suf1、WcaM、TagT、YcbK、YcdB、YdhX和YnfE组成的组。

7.根据权利要求1的基因构建体，其中所述抗生素抗性蛋白是TEM-1β-内酰胺酶，并且所述Tat信号序列是TorA。

8.一种载体，包含权利要求1至7中任一项的基因构建体。

9.根据权利要求8的载体，其中所述载体是选自pET22b、pAE34、pET9a和ΔpMK的组中的任一种载体，并且所述基因构建体被插入到所选定的载体中。

10.根据权利要求8的载体，其中所述载体是pET-TAPE。

11.一种转化有权利要求8的载体的宿主细胞。

12.根据权利要求11的载体，其中所述宿主细胞是大肠杆菌。

13.一种宿主细胞群，包含一种或多种转化有权利要求1至7中任一项的基因构建体的宿主细胞。

14.根据权利要求13的宿主细胞群，其中在宿主细胞群中包括的宿主细胞转化有分别编码各包括不同的靶蛋白的融合蛋白的基因构建体。

15.根据权利要求13的宿主细胞群，其中所述宿主细胞是革兰氏阴性细菌菌株。

16.一种筛选可溶性靶蛋白的方法，该方法包括：

(1)在含有抗生素的液体培养基中培养权利要求13的宿主细胞群；

(2)收集存活的宿主细胞以收集质粒DNA；

(3)从收集的质粒DNA中收集编码靶蛋白的核酸序列；和

(4)从收集的核酸序列中确认并筛选靶蛋白的序列。

17.根据权利要求16的方法，还包括，在步骤(3)后，选自下组的一个阶段：

(3')制备基因构建体，其中所收集的核酸序列被再次功能性地连接到编码Tat-信号序列的基因和抗生素抗性基因，然后再用制备的基因构建体转化该宿主细胞群，

和，

(3”)直接用含有所收集的核酸序列的质粒转化宿主细胞群，而不制备单独的基因构建体，

其中，阶段(1)至(3')或阶段(1)至(3”)被重复两轮或更多轮。

18.根据权利要求16或17的方法，其中所述抗生素是氨苄青霉素或羧苄青霉素。

19.根据权利要求17的方法，其中所述抗生素是在重复所述轮时以逐渐增加的浓度加入。

20.根据权利要求16所述的方法，其中所述抗生素在初始轮时具有0.05至0.2μg/ml的浓度。

21.一种可溶性VH结构域抗体支架，具有下面的FR1至FR4的氨基酸序列：

(1)FR1：X₀VQLX₁X₂X₃GX₄X₅X₆X₇X₈PGX₉SX₁₀X₁₁X₁₂X₁₃CX₁₄X₁₅X₁₆GX₁₇X₁₈X₁₉

在FR1的氨基酸序列中，

X₀是E或Q，

X₁是V或L，

X₂是E，或Q，

X₃是S，或A，

X₄是G，或A，

X₅是G，M，N，V，或E，

X₆是L，V，或W，

X₇是V，K，A，或I，

X₈是Q，K，或H，

X₉是G，T，A，R，E，S，或T，

X₁₀是L，V，R，或M，

X₁₁是R，或K，

X₁₂是L，I，或V，

X₁₃是S，A，或T，

X₁₄是A，E，V，R，I，K，T，或S，

X₁₅是A，G，P，V，或T，

X₁₆是S，F，或Y，

X₁₇是F，Y，R，G，或L，

X₁₈是T，A，S，N，T，P，I，N，H，或A，

X₁₉是F，L，V，或C；

(2)FR2：WX₂₀RX₂₁X₂₂PGX₂₃GX₂₄X₂₅X₂₆X₂₇X₂₈

在FR2的氨基酸序列中，

X₂₀是V，A，或L，

X₂₁是Q，N，R，I，K，Y，V，M，S，Q，W，F，L，V，或C，

X₂₂是A，G，K，S，V，M，或T，

X₂₃是K，Q，E，R，或T，

X₂₄是L，N，I，P，Y，T，V，W，A，R，M，或S，

X₂₅是V，或E，

X₂₆是W，I，V，P，F，H，M，Y，L，C，或R，

X₂₇是V，M，I，或L，

X₂₈是S，A，或G；

(3)FR3：X₂₉X₃₀X₃₁X₃₂X₃₃X₃₄X₃₅X₃₆X₃₇X₃₈X₃₉X₄₀X₄₁X₄₂X₄₃X₄₄X₄₅X₄₆X₄₇X₄₈X₄₉X₅₀X₅₁DX₅₂X₅₃X₅₄YX₅₅CX₅₆X₅₇

在FR3的氨基酸序列中，

X₂₉是R，H，Q，或T，

X₃₀是F，V，L，或I，

X₃₁是T，S，或I，

X₃₂是I，L，V，M，或R，

X₃₃是S，T，或D，

X₃₄是R，A，V，N，或I，

X₃₅是D，N，或A，

X₃₆是N，T，D，I，R，K，Y，或E，

X₃₇是A，S，V，或T，

X₃₈是K，R，T，Q，V，E，M，N，或I，

X₃₉是N，R，T，K，S，D，或V，

X₄₀是T，M，S，V，I，Y，或A，

X₄₁是L，V，A，或M，

X₄₂是F，Y，N，D，H，或S，

X₄₃是L，或M，

X₄₄是Q，E，H，或N，

X₄₅是M，L，V，I，或W，

X₄₆是N，T，K，D，Y，I，或S，

X₄₇是S或N，

X₄₈是L或V，

X₄₉是R，K，或T，

X₅₀是D，A，S，P，T，V，I，或S，

X₅₁是E，A，D，或S，

X₅₂是T，N，或S，

X₅₃是S，A，或G，

X₅₄是V，I，L，或M，

X₅₅是Y或F，

X₅₆是A，G，V，或S，

X₅₇是R，S，K，T，L，N，或F；和

(4)FR4：X₅₈GX₅₉GX₆₀X₆₁VTVSS

在FR4的氨基酸序列中，

X₅₈是W，C，Y，G，S，或A，

X₅₉是Q，R，或L，

X₆₀是A，T，I，或V，

X₆₁是L，M，P，V，或T。

22.根据权利要求21的VH结构域抗体支架，其中所述FR1至FR4具有下面的氨基酸序列：

(1)FR1：X₀VQLX₁X₂SGGX₅X₆X₇X₈PGX₉SX₁₀RX₁₂SCX₁₄X₁₅SGX₁₇X₁₈X₁₉

在FR1的氨基酸序列中，

X₀是E或Q，

X₁是V或L，

X₂是E或Q，

X₅是G，N，V，或E，

X₆是L或V，

X₇是V或K，

X₈是Q，K或H，

X₉是G，T，A，R，E，或T，

X₁₀是L或V，

X₁₂是L或V，

X₁₄是A，E，V，I，K，或S，

X₁₅是A，G，或V，

X₁₇是F，Y，R，G，或L，

X₁₈是T，A，S，N，T，P，I，N，H，或A，和

X₁₉是F，L，V，或C；

(2)FR2：WVRX₂₁X₂₂PGX₂₃GX₂₄X₂₅X₂₆X₂₇X₂₈

在FR2的氨基酸序列中，

X₂₁是Q，N，R，I，K，Y，V，M，S，Q，W，F，L，V，或C，

X₂₂是A，G，K，S，或M，

X₂₃是K，Q，E，R，或T，

X₂₄是L，N，I，P，Y，T，V，W，A，R，M，或S，

X₂₅是V或E，

X₂₆是W，I，V，P，F，H，M，Y，L，C，或R，

X₂₇是V，M，I，或L，和

X₂₈是S，A，或G；

(3)FR3：RX₃₀TX₃₂SX₃₄DX₃₆X₃₇X₃₈X₃₉X₄₀X₄₁X₄₂X₄₃X₄₄X₄₅X₄₆X₄₇X₄₈X₄₉X₅₀X₅₁DTAX₅₄YX₅₅CX₅₆X₅₇

在FR3的氨基酸序列中，

X₃₀是F，V，L，或I，

X₃₂是I，L，V，或M，

X₃₄是R，A，V，或I，

X₃₆是N，T，D，I，R，K，Y，或E，

X₃₇是A，S，V，或T，

X₃₈是K，R，T，Q，V，E，M，N，或I，

X₃₉是N，R，T，K，S，D，或V，

X₄₀是T，M，S，V，I，Y，或A，

X₄₁是L，V，A，或M，

X₄₂是F，Y，N，D，H，或S，

X₄₃是L或M，

X₄₄是Q，E，H，或N，

X₄₅是M，L，V，I，或W，

X₄₆是N，T，K，D，Y，I，或S，

X₄₇是S或N，

X₄₈是L或V，

X₄₉是R，K，或T，

X₅₀是D，A，S，P，T，V，I，或S，

X₅₁是E，A，D，或S，

X₅₄是V，I，L，或M，

X₅₅是Y或F，

X₅₆是A，G，V，或S，和

X₅₇是R，S，K，T，L，N，或F和

(4)FR4：X₅₈GQGX₆₀X₆₁VTVSS

在FR4的氨基酸序列中，

X₅₈是W，C，Y，G，S，或A，

X₆₀是A，T，I，或V，和

X₆₁是L，M，V，或T。

23.根据权利要求21的VH结构域抗体支架，其中所述VH结构域抗体支架是选自具有下面的FR1至FR4的氨基酸序列的支架。

24.根据权利要求21的VH结构域抗体支架，其中所述VH结构域抗体支架是选自具有下面的FR1至FR4的氨基酸序列的支架。

25.一种多核苷酸，编码权利要求21至24中任一项的VH结构域抗体支架。

26.一种VH结构域抗体，具有权利要求21至24中任一项的VH结构域抗体支架。

27.一种多核苷酸，编码权利要求26的VH结构域抗体。

28.一种VH结构域抗体库，其中源自人的随机CDRH1、CDRH2和CDRH3插入到权利要求21至24中任一项的VH结构域抗体支架中。

29.根据权利要求28的VH结构域抗体文库，其中所插入的CDRH3具有5到15个氨基酸残基。

30.根据权利要求28的VH结构域抗体文库，其中所插入的CDRH3具有7至13个氨基酸残基。

31.根据权利要求28的VH结构域抗体文库，其中所述源自人的随机CDRH1、CDRH2和CDRH3中具有诱发突变。

32.根据权利要求31的VH结构域抗体文库，其中所述突变是根据Kabat编号系统，在选自CDRH1的位置30和31，CDRH2的位置53和CDRH3的位置97、99、100和100a中的一个或多个位置诱导的。

33.根据权利要求28的VH结构域抗体文库，其中所述文库是天然的、合成的或免疫文库。

34.一种使用根据权利要求28的文库，筛选对所需抗原具有结合能力的VH结构域抗体的方法。

35.根据权利要求33的方法，其中所述筛选VH结构域抗体是通过除了被结合到其上的VH结构域以外，洗脱未结合到固定的所需抗原的VH结构域抗体来执行的。

36.根据权利要求34的方法，其中所述洗脱未结合到固定的所需抗原的VH结构域抗体被重复两次或更多次。