CN111655296A

CN111655296A - 编码肽接头的经改良核苷酸序列

Info

Publication number: CN111655296A
Application number: CN201980010133.8A
Authority: CN
Inventors: 韦罗妮克·德布拉邦德里; 安·布里热; 帕特里克·斯坦森斯; 彼得-简·德博克; 汤姆·默契尔; 安东尼·德富勒格勒
Original assignee: Ablynx NV
Current assignee: Ablynx NV
Priority date: 2018-02-26
Filing date: 2019-02-26
Publication date: 2020-09-11
Also published as: AR114269A1; TW202000238A; JP7266611B2; JP2021514638A; US20200392512A1; WO2019162521A1; EP3758755A1

Abstract

本发明提供编码甘氨酸丝氨酸接头且使用过量GGA、GGG及GGT/GGU密码子以编码所述甘氨酸残基之经改良的核苷酸序列及核酸。本发明进一步涉及编码包含甘氨酸丝氨酸接头的(融合)蛋白质及多肽之核苷酸序列及核酸，所述核苷酸序列及核酸包含本发明此类经改良之核苷酸序列及核酸。

Description

编码肽接头的经改良核苷酸序列

本发明涉及编码肽接头的经改良核苷酸序列及核酸。

本发明还涉及编码含有肽接头的(融合)蛋白质及多肽之核苷酸序列及核酸，该等核苷酸序列及核酸含有此类编码肽接头的经改良核苷酸序列及核酸。

本发明还涉及用于表达/产生含有肽接头的(融合)蛋白质及多肽之方法，其涉及使用此类编码肽接头的经改良核苷酸序列及核酸。

本发明之其他方面、实施方案、用途及优势将自本文中之进一步描述而变得清楚。

使用肽接头以连接两个或更多个蛋白质、肽、肽部分、结合域或结合单元在此项技术中已熟知。一种常用类别之肽接头被称为”Gly-Ser”或”GS”接头。这些为基本上由甘氨酸(G)及丝氨酸(S)残基组成之接头，且通常包含诸如GGGGS基序之肽基序之一或多个重复序列(例如，具有式(Gly-Gly-Gly-Gly-Ser)_n，其中n可为1、2、3、4、5、6、7或更多)。此类GS接头的一些常用实例为15GS接头(n＝3)及35GS接头(n＝7)。举例而言，参考Chen等人,Adv.DrugDeliv.Rev.2013年10月15日；65(10):1357-1369；及Klein等人,Protein Eng.Des.Sel.(2014)27(10):325-330。

多肽及包含此类GS接头的(融合)蛋白质通常是通过适合地表达包含两个或更多个编码待连接之相关肽部分之核苷酸序列的遗传构建体来产生，其中编码肽部分之此等核苷酸序列经一或多个编码一或多个GS接头的核苷酸序列适合且可操作地连接，以使得在适合的宿主细胞或宿主生物体中适合的表达之后，视情况在适用于分离和/或纯化之步骤之后获得所需融合蛋白质或多肽。此类基因构建体之一些优选但非限制性实例(使用Nanobodies作为待连接之肽之代表性实例，参见表III之图例)示意性地显示于图1中，其中NB₁、NB₂、NB_A、NB_B等指示编码待连接之肽部分的核苷酸序列，且L₁、L₂、L₃等指示编码适合的GS接头的核苷酸序列。此类基因构建体可为DNA或RNA，且可例如呈适合载体，诸如表达载体之形式。此全部在蛋白质工程改造领域中为熟知的；例如参考标准手册，诸如本文中所提及之Sambrook等人及Ausubel等人。

通常亦已知，归因于基因密码的简并性，在编码GS接头的核苷酸序列中，四种不同密码子中之各者可用于编码甘氨酸残基，即GGU(或GGT)、GGC、GGA和/或GGG(类似地已知GS接头中之丝氨酸残基可由UCU(或TCT)、UCC(或TCC)、UCA(或TCA)、UCG(或TCG)、AGU(或AGT)和/或AGC密码子编码)。

现已发现，可藉由使用过量GGA及GGG密码子以编码GS接头中之甘氨酸残基(亦即与GGT/GGU和/或GGC密码子之量相比)来提供编码GS接头的经改良核苷酸序列。

已进一步发现，可藉由使用过量GGA、GGG及GGT/GGU密码子以编码GS接头中之甘氨酸残基(亦即与GGC密码子之量相比)来提供编码GS接头的经改良核苷酸序列。

因此，在第一方面中，本发明涉及一种编码GS接头的核苷酸序列和/或核酸(如进一步定义于本文中)，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码GS接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。

在此方面中，本发明还涉及一种编码GS接头的核苷酸序列和/或核酸(如进一步定义于本文中)，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码GS接头中之甘氨酸残基的密码子为GGA或GGG。

在此方面中，本发明还涉及一种编码GS接头的核苷酸序列和/或核酸(如进一步定义于本文中)，其中少于30％、优选少于15％、更优选少于10％，诸如少于5％及高达少于1％或更低(包括0％)之编码GS接头中之甘氨酸残基的密码子为GGC。

在另一方面中，本发明涉及一种编码肽接头的核苷酸序列和/或核酸，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码该肽接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。

在此方面中，本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如进一步定义于本文中)，其中由该核苷酸序列或核酸编码之肽接头包含甘氨酸及丝氨酸残基或基本上由甘氨酸及丝氨酸残基组成，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码该肽接头中之甘氨酸残基的密码子为GGA或GGG。

在此方面中，本发明还涉及一种编码肽接头的核苷酸序列和/或核酸，其中少于30％、优选少于15％、更优选少于10％，诸如少于5％及高达少于1％或更低(包括0％)之编码该肽接头中之甘氨酸残基的密码子为GGC。

如本文中进一步描述，由所述核苷酸序列或核酸编码之肽接头将一般包含至少5个氨基酸残基及高达50个或更多个氨基酸残基(但实际上将通常包含10个与40个之间的氨基酸残基，诸如约15个氨基酸残基至约35个氨基酸残基)。此外，如本文中进一步描述，由所述核苷酸序列或核酸编码之肽接头与丝氨酸残基之数目相比将通常含有过量甘氨酸残基，例如各丝氨酸残基之3个与6个之间的甘氨酸残基。此外，由所述核苷酸序列或核酸编码之肽接头通常将含有序列基序之一或多个(诸如两个或更多个)重复序列。

在另一方面中，本发明涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述)，其中由该核苷酸序列或核酸编码之肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或基本上由其组成，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码该肽接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。

在此方面中，本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述)，其中由该核苷酸序列或核酸编码之肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或基本上由其组成，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)编码该肽接头中之甘氨酸残基的密码子为GGA或GGG。

在此方面中，本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述)，其中由该核苷酸序列或核酸编码之肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或基本上由其组成，其中少于30％、优选少于15％、更优选少于10％，诸如少于5％及高达少于1％或更低(包括0％)之编码该肽接头中之甘氨酸残基的密码子为GGC。

举例而言，在本发明之此方面中，由该核苷酸序列或核酸编码之肽接头可包含序列基序GGGGS之2、3、4、5、6、7、8、9或10个重复序列或基本上由其组成。

在另一方面中，本发明涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述)，其中由该核苷酸序列或核酸编码之肽接头具有式(Gly-Gly-Gly-Gly-Ser)_n(其中n可为1、2、3、4、5、6、7或更大)，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码该肽接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。

在此方面中，本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述)，其中由该核苷酸序列或核酸编码之肽接头具有式(Gly-Gly-Gly-Gly-Ser)_n(其中n可为1、2、3、4、5、6、7或更大)，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码该肽接头中之甘氨酸残基的密码子为GGA或GGG。

在此方面中，本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述)，其中由该核苷酸序列或核酸编码之肽接头具有式(Gly-Gly-Gly-Gly-Ser)_n(其中n可为1、2、3、4、5、6、7或更大)，其中少于30％、优选少于15％、更优选少于10％，诸如少于5％及高达少于1％或更低(包括0％)之编码该肽接头中之甘氨酸残基的密码子为GGC。

在另一方面中，本发明涉及以下通式之核苷酸序列和/或核酸(A_x-B_p-A_y-B_q)_n，

其中：

A表示编码甘氨酸残基之密码子，其可独立地为(选自)GGU(或GGT)、GGC、GGA和/或GGG密码子；且

B表示编码丝氨酸残基之密码子，其可独立地为(选自)UCU(或TCT)、UCC(或TCC)、UCA(或TCA)、UCG(或TCG)、AGU(或AGT)和/或AGC密码子；

x为0至10(且优选0至5)之整数，且y为0至10(且优选0至5)之整数，使得(x+y)之总和在1与10之间，且优选为3、4、5、6、7或8；

p为0或1，且q为0或1，使得(p+q)之总和为2或1且优选为1；

n为1至10之整数(亦即，使得核苷酸序列和/或核酸包含基序(A_x-B_p-A_y-B_q)之n个重复序列，其中A、B、p、q、x及y如本文中所描述)；

在基序(A_x-B_p-A_y-B_q)之各重复序列中，各A、B、p、q、x及y可独立地如本文中所描述(但根据一优选方面，在基序(A_x-B_p-A_y-B_q)之各重复序列中，各A、B、p、q、x及y系相同的)；

其限制条件为超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGA、GGG或GGT/GGU；

其限制条件为超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGA或GGG；和/或

其限制条件为少于30％、优选少于15％、更优选少于10％，诸如少于5％及高达少于1％或更低(包括0％)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGC。

在另一方面中，本发明涉及以下通式之核苷酸序列和/或核酸(A_x-B)_n，

其中：

x为1至10之整数，且优选为3、4、5、6、7或8；

n为1至10之整数(亦即，使得核苷酸序列和/或核酸包含基序(A_x-B)之n个重复序列，其中各A、B及x如本文中所描述)；

在基序(A_x-B)之各重复序列中，各A、B及x可独立地如本文中所描述(但根据一优选方面，在基序(A_x-B)之各重复序列中，各A、B及x是相同的)；

在另一方面中，本发明涉及表I中所示之化学式中之一者的核苷酸序列和/或核酸，其中：

一般而言，编码Gly-Ser接头且其中所述GS接头中之甘氨酸残基显著地或排他性地由GGA、GGG或GGT/GGU密码子编码之本文中所描述的核苷酸序列及核酸在本文中亦被称为”本发明之GS接头-编码序列”。一般而言，编码Gly-Ser接头且其中所述GS接头中之甘氨酸残基显著地或排他性地由GGA或GGG密码子编码之本文中所描述的核苷酸序列及核酸在本文中亦被称为”本发明之GS接头-编码序列”。一般而言，编码Gly-Ser接头且其中所述GS接头中之甘氨酸残基中之几乎无一者或非任一者由GGC密码子编码的本文中所描述之核苷酸序列及核酸在本文中亦被称为”本发明之GS接头-编码序列”。

在本发明之一个优选但非限制性方面中，超过95％及高达99％或更多(且包括100％)之在本发明之GS接头-编码序列中编码甘氨酸残基的密码子为GGA、GGG或GGT/GGU。

在本发明之一个优选但非限制性方面中，大于95％及高达99％或更多(且包括100％)之在本发明之GS接头-编码序列中编码甘氨酸残基的密码子为GGA或GGG。

在本发明之一个优选但非限制性方面中，少于5％及高达少于1％或更低(且包括0％)之在本发明GS接头-编码序列中编码甘氨酸残基的密码子为GGC。表II给出本发明之GS接头-编码序列之一些代表性但非限制性实例。本发明之GS接头-编码序列之其他实例将基于本文中之揭示内容为技术人员所清楚。

表I：

表II：

不限于任何特定解释、假设或机制，推断使用此类核苷酸序列(亦即，相比于使用编码含有较高量/比例之GGU和/或GGC密码子之GS接头的核苷酸序列；或相比于使用编码含有较高量/比例之GGC密码子之GS接头的核苷酸序列)，会降低天冬氨酸残基被错误地包括于所需GS接头(而非预期的甘氨酸残基)中之风险和/或减少在合适宿主或宿主生物体中表达时被错误地包括于所需GS接头中之天冬氨酸残基的量。

因此，当用于表达和/或产生融合蛋白质或多肽时，本发明亦减少在表达之产物中获得之污染物(亦即，含有具有一或多个天冬氨酸残基而非预期甘氨酸残基之GS接头的污染物)的量，且亦减少与所需GS接头中不期望存在之天冬氨酸残基相关的有害作用(诸如不期望的异构化形成异天冬氨酸)，以及增加对蛋白降解之易感性。

因此在另一方面中，本发明涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸，其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经一或多个GS接头适合地连接之两个或更多个肽部分，其中一或多个GS接头由一或多个本发明之GS接头-编码序列编码(亦即，藉由其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码GS接头中之甘氨酸残基的密码子为GGG、GGG或GGT/GGU的核苷酸序列或核酸)。

在此方面中，本发明还涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸，其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适当连接之两个或更多个肽部分，其中一或多个GS接头由一或多个本发明之GS接头-编码序列编码(亦即，藉由其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码GS接头中之甘氨酸残基的密码子为GGG或GGG的核苷酸序列或核酸)。

在此方面中，本发明还涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸，其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适合地连接之两个或更多个肽部分，其中一或多个GS接头由一或多个本发明之GS接头-编码序列编码(亦即，藉由其中少于30％、优选少于15％、更优选少于10％，诸如少于5％及高达少于1％或更低(包括0％)之编码GS接头中之甘氨酸残基的密码子为GGC的核苷酸序列或核酸)。

在另一方面中，本发明涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸，其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适合地连接之两个或更多个肽部分，其中编码GS接头的核苷酸序列或核酸的部分为一或多个本发明之GS接头-编码序列(亦即，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码GS接头中之甘氨酸残基的密码子为GGG、GGG或GGT/GGU的核苷酸序列或核酸)。

在此方面中，本发明还涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸，其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适合地连接之两个或更多个肽部分，其中编码GS接头的核苷酸序列或核酸的部分为一或多个本发明之GS接头-编码序列(亦即，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码GS接头中之甘氨酸残基的密码子为GGG或GGG的核苷酸序列或核酸)。

在此方面中，本发明涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸，其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适合地连接之两个或更多个肽部分，其中编码GS接头的核苷酸序列或核酸的部分为一或多个本发明之GS接头-编码序列(亦即，其中少于30％、优选少于15％、更优选少于10％，诸如少于5％及高达少于1％或更低(包括0％)之编码GS接头中之甘氨酸残基的密码子为GGC的核苷酸序列或核酸)。

更一般而言，在另一方面中，本发明涉及一种包含或含有一或多个本发明之GS接头-编码序列的核苷酸序列或核酸。此类核苷酸序列或核酸优选使得在适合的宿主细胞或宿主生物体中表达后，其表达包含至少一个GS接头(亦即由本发明之GS接头-编码序列编码之GS接头)之(融合)蛋白质或多肽。

在另一方面中，本发明涉及一种用于表达或产生(融合)蛋白质或多肽之方法，其中该(融合)蛋白质或多肽包含两个或更多个经由一或多个GS接头适合地连接之肽部分，该方法包含在适合的宿主细胞或宿主生物体中适合地表达编码该(融合)蛋白质或多肽之核苷酸序列和/或核酸，其中该核苷酸序列和/或核酸包含或含有一或多个本发明之GS接头-编码序列(且进一步描述于本文中)。该方法可进一步包含分离/纯化由此表达之(融合)蛋白质或多肽的任选步骤。

在另一方面中，本发明涉及一种宿主细胞或宿主生物体，其包含编码(融合)蛋白质或多肽之核苷酸序列和/或核酸，该(融合)蛋白质或多肽包含一或多个GS接头，其中该核苷酸序列和/或核酸包含或含有一或多个本发明之GS接头-编码序列(且进一步如本文中所描述)。

在另一方面中，本发明涉及一种用于表达或产生(融合)蛋白质或多肽之方法，其中该(融合)蛋白质或多肽包含两个或更多个经由一或多个GS接头适合地连接之肽部分，该方法包含在以下条件下培养包含核苷酸序列和/或核酸之适合的宿主细胞或宿主生物体，该核苷酸序列和/或核酸包含或含有一或多个本发明之GS接头-编码序列(且进一步如本文中所描述)：使得该宿主细胞或宿主生物体表达/产生该(融合)蛋白质或多肽(其中该融合蛋白质或多肽包含一或多个GS接头，亦即如本发明之GS接头-编码序列编码)。该方法可进一步包含分离/纯化由此表达之(融合)蛋白质或多肽的任选步骤。

在另一方面中，本发明涉及一种(融合)蛋白质或多肽(且特定言之，涉及包含一或多个GS接头的(融合)蛋白质或多肽)，其已藉由在适合的宿主细胞或宿主生物体中表达编码该(融合)蛋白质或多肽之核苷酸序列或核酸而获得，其中该核苷酸序列或核酸含有或包含一或多个本发明之GS接头-编码序列(且如本文中进一步描述)。

在另一方面中，本发明提供一种用于降低肽接头(诸如GS接头)中之Gly向Asp错误掺入水平的方法，该方法包含在编码该肽接头的核酸序列和/或核酸中用GGG、GGA或GGT/GGU密码子置换至少一个GGC密码子之步骤。

在此方面中，本发明亦提供一种用于降低肽接头(诸如GS接头)中Gly向Asp错误掺入水平的方法，该方法包含在编码该肽接头的核酸序列和/或核酸中用GGG或GGA置换至少一个GGC密码子之步骤。

在另一方面中，本发明提供一种用于降低存在于多价(诸如二价、三价、四价)免疫球蛋白单可变结构域或纳米抗体中之肽接头(诸如GS接头)中之Gly向Asp错误掺入水平的方法，该方法包含在编码该肽接头的核酸序列和/或核酸中用GGG、GGA或GGT/GGU密码子置换至少一个GGC密码子之步骤。

在此方面中，本发明亦提供一种用于降低存在于多价(诸如二价、三价、四价)免疫球蛋白单可变结构域或纳米抗体中之肽接头(诸如GS接头)中之Gly向Asp错误掺入水平的方法，该方法包含在编码该肽接头的核酸序列和/或核酸中用GGG或GGA置换至少一个GGC密码子之步骤。

本文中所描述之核苷酸序列及核酸可为DNA或RNA(且优选为双链DNA)且可呈基因构建体之形式(例如，呈适合载体，诸如表达载体之形式)。此类基因构建体可例如除编码(融合)蛋白质或多肽之核苷酸序列以外，包含一或多种适用于表达该核苷酸序列之组件，诸如适合启动子、适合的翻译起始序列(诸如核糖体结合位点及起始密码子)、适合的终止密码子及适合的转录终止序列、3'-或5'-UTR序列、前导序列、选择标记、表达标记/报导基因和/或可有助于或增加转化或整合(之效率)的元件，所有均适合地(且若适当、可操作地)连接至编码(融合)蛋白质或多肽之核苷酸序列。此类元件之适合实例将为技术人员所清楚且可例如视其中表达该(表达)载体之宿主或宿主细胞而定。

本文中所描述之基因构建体亦可呈适用于转化预期宿主细胞或宿主生物体之形式；呈适用于整合至预期宿主细胞之基因组DNA中之形式；或呈适用于预期宿主生物体中之独立复制、维持和/或遗传之形式。举例而言，本文中所描述之基因构建体可呈载体，诸如质粒、黏粒、YAC、病毒载体或转座子之形式。特定言之，载体可为表达载体，亦即可提供体外和/或体内表达之载体(例如在适合的宿主细胞、宿主生物体和/或表达系统中)。此类基因构建体及(表达)载体形成本发明之其他方面。

优选地，本文中所描述之基因构建体之调节及其他元件使得其能够在预期宿主细胞或宿主生物体中提供其预期生物功能。

举例而言，启动子、增强子或终止子在预期宿主细胞或宿主生物体中应为”可操作的”，其意谓(例如)该启动子应能够启动或以其他方式控制/调节其可操作地连接(如本文中所定义)之核苷酸序列(例如编码序列)之转录和/或表达。

一些尤其优选启动子包括但不限于本身已知用于在本文所提及之宿主细胞中表达之启动子；且尤其用于在细菌细胞，诸如本文所提及之彼等细菌细胞中表达之启动子。

选择标记应使得其允许(亦即，在适当选择条件下)已(成功地)用核苷酸序列(如本文中所描述之)转化之宿主细胞和/或宿主生物体区别于尚未(成功地)转化之宿主细胞/生物体。此类标记之一些优选但非限制性实例为提供对抗生素(诸如卡那霉素或氨苄西林)之抗性之基因、提供耐热性之基因或允许将宿主细胞或宿主生物体在不存在某些因素、化合物和/或(食物)组分之情况下维持于培养基中的基因，所述因素、化合物和/或(食物)组分为非转化细胞或生物体之存活所必需的。

前导序列应使得(在预期宿主细胞或宿主生物体中)其允许所需翻译后修饰和/或使得其将经转录之mRNA导引至细胞之所需部分或细胞器。前导序列亦可允许自该细胞分泌表达产物。如此，前导序列可为在宿主细胞或宿主生物体中可操作之任何原序列、前序列或前原序列。细菌细胞中之表达可能不需要前导序列。举例而言，本身已知用于表达及产生抗体及抗体片段(包括但不限于单结构域抗体及ScFv片段)之前导序列可以基本上类似之方式使用。

表达标记或报导基因应使得(在宿主细胞或宿主生物体中)其允许检测基因构建体(存在于其上之基因或核苷酸序列)之表达。表达标记可任选地允许所表达之产物，例如在细胞之特定部分或细胞器中和/或多细胞生物体之特定细胞、组织、器官或部分中定位。此类报导基因亦可表达为具有经编码之氨基酸序列之蛋白质融合物。一些优选但非限制性实例包括荧光蛋白质，诸如GFP。

适合的启动子、终止子及其他元件之一些优选但非限制性实例包括可用于在本文中所提及之宿主细胞中表达之彼等启动子、终止子及其他元件；且尤其适用于在细菌细胞中表达之彼等启动子、终止子及其他元件，诸如本文中所提及之彼等启动子、终止子及其他元件。对于启动子、选择标记、前导序列、表达标记及可存在/用于本文中所描述之基因构建体中之其他元件(诸如终止子、转录和/或翻译增强子和/或整合因子)的一些(其他)非限制性实例，参考通用手册，诸如Sambrook等人,“Molecular Cloning:A Laboratory Manual”(第2版),第1-3卷,Cold Spring Harbor Laboratory Press(1989)；F.Ausubel等人,编,“Current protocols in molecular biology”,Green Publishing and WileyInterscience,New York(1987)以及参考WO 95/07463、WO 96/23810、WO 95/07463、WO 95/21191、WO 97/11094、WO 97/42320、WO 98/06737、WO 98/21355、US-A-7,207,410、US-A-5,693,492及EP 1 085 089中所给出之实例。亦参考上文所引用之一般背景技术及本文中所引用之其他参考文献。

用于产生本文所述之核苷酸序列、核酸及基因构建体之技术将为技术人员所清楚且可例如包括但不限于自动化DNA合成。本文中所描述之基因构建体一般亦可藉由将本文中所描述之核苷酸序列适合地连接至上文所描述之一或多种其他元件来提供。通常，本文中所描述之基因构建体将藉由将如本文中所描述核苷酸序列或核酸插入本身已知之适合(表达)载体中来获得。此等及其他技术将为技术人员所清楚，且再次参考标准手册，诸如上文所提及之Sambrook等人及Ausubel等人。

本文中所描述之核酸和/或本文中所描述之基因构建体可用以转化宿主细胞或宿主生物体，亦即用于表达和/或产生经编码之(融合)蛋白质或多肽。适合的宿主或宿主细胞将为技术人员所清楚，且可例如为任何适合的真菌、原核或真核细胞或细胞系或任何适合的真菌、原核或真核生物体，例如：

-细菌菌株，包括但不限于革兰氏阴性菌株(gram-negative strain)，诸如大肠杆菌(Escherichia coli)之菌株；变形杆菌属(Proteus)之菌株，例如奇异变形杆菌(Proteusmirabilis)之菌株；假单胞菌之菌株，例如荧光假单胞菌(Pseudomonas fluorescens)之菌株；及革兰氏阳性菌株(gram-positive strain)，诸如芽孢杆菌(Bacillus)之菌株，例如枯草杆菌之菌株或短芽孢杆菌(Bacillus brevis)之菌株；链霉菌之菌株，例如青紫链霉菌之菌株；葡萄球菌属之菌株，例如肉葡萄球菌(Staphylococcus carnosus)之菌株；及乳球菌属之菌株，例如乳乳球菌(Lactococcus lactis)之菌株；

-真菌细胞，包括但不限于来自木霉属(Trichoderma)之物种，例如来自里氏木霉(Trichoderma reesei)的细胞；例如来自链孢霉(Neurospora)之物种，例如来自粗糙链孢霉(Neurospora crassa)的细胞；来自粪壳菌属(Sordaria)之物种，例如来自大孢粪壳(Sordaria macrospora)的细胞；来自曲霉属(Aspergillus)之物种，例如来自黑曲霉(Aspergillus niger)或来自大豆曲霉(Aspergillus sojae)的细胞；或来自其他丝状真菌之物种的细胞；

-酵母细胞，包括但不限于来自酵母菌属(Saccharomyces)，例如酿酒酵母之物种的细胞；裂殖酵母属(Schizosaccharomyces)，例如栗酒裂殖酵母(Schizosaccharomycespombe)之物种的细胞；毕赤酵母(Pichia)，例如巴斯德毕赤酵母(Pichia pastoris)或甲醇毕赤酵母(Pichia methanolica)之物种的细胞；汉逊酵母(Hansenula)，例如多形汉逊酵母(Hansenula polymorpha)之物种的细胞；克鲁维酵母，例如乳酸克鲁维酵母(Kluyveromyces lactis)之物种的细胞；Arxula，例如Arxula adeninivorans之物种的细胞；耶氏酵母(Yarrowia)，例如解脂耶氏酵母(Yarrowia lipolytica)之物种的细胞；

-两栖动物细胞或细胞株，诸如非洲爪蟾卵母细胞(Xenopus oocytes)；

-源自昆虫之细胞或细胞株，诸如源自鳞翅目之细胞/细胞系，包括但不限于夜蛾SF9及Sf21细胞或源自果蝇之细胞/细胞系，诸如施奈德(Schneider)及Kc细胞；

-植物或植物细胞，例如烟草植物中之植物或植物细胞；和/或

-哺乳动物细胞或细胞系，例如源自人类之细胞或细胞系，包括但不限于CHO-细胞、BHK-细胞(例如BHK-21细胞)及人类细胞或细胞系，诸如HeLa、COS(例如COS-7)及PER.C6细胞；

-以及本身已知用于表达及产生抗体及抗体片段(包括但不限于(单)结构域抗体及ScFv片段)之所有其他宿主或宿主细胞，其将是技术人员了解的。亦参考上文所引用之一般背景技术，以及例如WO 94/29457；WO 96/34103；WO 99/42077；Frenken等人(1998,Res.Immunol.149(6):589-99)；Riechmann及Muyldermans(1999,J.Immunol.Methods,231(1-2):25-38)；van der Linden(2000,J.Biotechnol.80(3):261-70)；Joosten等人(2003,Microb.Cell Fact.2(1):1)；Joosten等人(2005,Appl.Microbiol.Biotechnol.66(4):384-92)；及本文中所引用之其他参考文献。

一些优选表达宿主为巴斯德毕赤酵母及用于表达/产生治疗蛋白质之人类细胞系。

如本文中所使用之术语”GS接头”一般系指由甘氨酸及丝氨酸残基构成和/或基本上由甘氨酸及丝氨酸残基组成之肽接头。

一般而言，此类GS接头(以及本文中所提及之其他肽接头)将含有至少5个氨基酸残基，诸如约10个氨基酸残基、约15个氨基酸残基、约20个氨基酸残基、约25个氨基酸残基、约35个氨基酸残基及高达50个或更多个氨基酸残基(尽管如此，实践中仍经常使用包含约10至40个氨基酸残基，诸如约15至约35个氨基酸残基之接头)。

通常，与丝氨酸残基之数目相比，此类接头将含有过量甘氨酸残基，例如每个丝氨酸残基有3至6个之间的甘氨酸残基。亦通常，此类接头将含有序列基序之一或多个(诸如两个或更多个)重复序列。此外，尽管在本发明中在其最广泛意义上不排除存在一或多个其他氨基酸(诸如改用谷氨酸残基，或苏氨酸残基，而非丝氨酸残基)，但本文中所使用之接头优选仅含有(或意欲仅含有)甘氨酸及丝氨酸残基。

如技术人员将清楚，在蛋白质工程改造之技术中最常用(且在本发明操作中亦优选)的GS接头为包含GGGGS(SEQ ID NO:1)基序之一或多个重复序列的接头，亦即通式(Gly-Gly-Gly-Gly-Ser)_n之接头，其中n可为1、2、3、4、5、6、7或更大。一些实例为15GS接头(n＝3)及35GS接头(n＝7)。可参考例如：Chen等人,Adv Drug Deliv.Rev.2013年10月15日；65(10):1357-1369；及Klein等人,Protein Eng.Des.Sel.(2014)27(10):325-330。

由本发明之GS接头-编码序列编码之GS接头可用于以合适方式将任何所需蛋白质、肽、肽部分、结合结构域或结合单元连接在一起，以便形成其中此类蛋白质、肽、肽部分、结合域或结合单元中之两者或更多者是通过一或多个GS接头连接在一起的(融合)蛋白质或多肽。一般而言，且如技术人员将清楚，由本发明之GS接头-编码序列编码之GS接头可用于任何目的，此系由于所述GS接头可用于和/或已用现有技术中。本发明之GS接头-编码序列(及由其编码之GS接头)之此类用途及应用将为技术人员所清楚。

在一个特定方面中，由本发明之GS接头-编码序列编码之GS接头可适合地用于将两个或更多个免疫球蛋白单可变结构域(诸如两个或更多个纳米抗体，例如VHH之纳米抗体、人源化VHH之纳米抗体、序列优化VHH之纳米抗体或骆驼化VH之纳米抗体，诸如骆驼化人类VH之纳米抗体)连接在一起，以形成二价、三价、双特异性、三特异性、双互补位、四价或其他合适的ISVD构建体。举例而言，参考Ablynx N.V.之各种申请案，诸如且不限于WO 2004/062551、WO 2006/122825、WO 2008/020079及WO 2009/068627。GS接头亦可例如用于将一或多个针对治疗靶标之免疫球蛋白单可变结构域或纳米抗体连接至提供增加之半衰期(例如增加之t1/2-β)之免疫球蛋白单可变结构域或纳米抗体，诸如针对血清白蛋白之免疫球蛋白单可变结构域或纳米抗体。同样，在此等用途或应用中，本发明之GS接头-编码序列(及由其编码之GS接头)可以与编码GS接头的已知核苷酸序列基本上相同的方式使用。此类免疫球蛋白单可变结构域或纳米抗体构建体之一些特定但非限制性实例示意性地显示于表III中，且编码此等构建体之核酸亦示意性地显示于图I中(表III之图例适用)。技术人员基于本文中之揭示内容将清楚其他实例。

表II：

现将藉助于以下非限制性优选方面、实例附图进一步描述本发明。

附图简述

图1示意性地显示含有接头的纳米抗体构建体之一些非限制性实例；

图2示意性地显示实施例1中用以说明本发明之四价纳米抗体构建体。图2亦显示T10肽在此构建体中之定位；

图3显示肽T10之氨基酸序列(SEQ ID NO:10)及密码子选择(SEQ ID NO:11)。在该序列中，其中观测到与天冬氨酸错误掺入(misincorporation)之氨基酸残基及密码子以粗体/下划线指示(应注意，对于以斜体/下划线指示之残基/密码子，可能已预期到错误掺入，但未观测到)。

图4显示纳米抗体构建体A中之35个GS接头的氨基酸序列(SEQ ID NO:12)及编码序列(SEQ ID NO:13至15)。容易发生天冬氨酸错误掺入的甘氨酸之特异性密码子(GGT及GGC)以粗体/下划线指示。丝氨酸之密码子标注于小帽中。

图5显示在UV 254nm(红色(下部)迹线)及UV 280nm(蓝色(上部)迹线)下记录之源15S柱(GE Healthcare Life Sciences)上之经纯化纳米抗体构建体A及pH梯度(绿色迹线，CX-1pH梯度缓冲液A(pH 5.6)及B(pH 10.2),Thermo Scientific)之阳离子交换层析图。pH记录显示于灰色迹线中。预峰为纳米抗体构建体A之酸性变体。合并级分14、15、16及17以用于酸性变体之后续表征，且级分18用于主峰之表征；

图6显示自经纯化纳米抗体构建体A之阳离子交换分级分离收集之酸性变体(上图)及主峰(下图)获得之Max-ent解卷积质谱。酸性级分中所量测之最重要的质量为59689.4Da，其比在pH-IEX主峰级分(59630.9Da，参见下图)中所量测之纳米抗体构建体A之质量高58道尔顿；

图7列出由Asp-N消化物(在天冬氨酸之N端处裂解之内切蛋白酶)产生之胰蛋白酶肽T10之肽片段(SEQ ID NO:16至33)。各裂解位点对应于与天冬氨酸交换之甘氨酸；

图8显示在(a)纳米抗体构建体A之GS接头中三个位点(C1、C2及C3)之Gly到Asp错误掺入的相对水平；(b)在藉由pH-IEX消耗之具有Asp错误掺入之变体之后的纳米抗体构建体A；(c)其中100％之GGC密码子序列经GGG、GGA或GGT密码子序列置换之纳米抗体构建体A；

图9显示产生以研究价数及接头长度对如实施例3中所描述之Gly到Asp错误掺入之影响的十个构建体；

图10显示9GS接头中两个位点(C1及C2)之Gly到Asp错误掺入之相对程度；(A)二价构建体、(B)三价构建体、(C)四价构建体；

图11显示20GS接头中五个位点(C1、C2、C3、C4及C5)之Gly到Asp错误掺入之相对水平；(A)二价构建体、(B)三价构建体、(C)四价构建体；

图12显示35GS接头中九个位点(C1至C9)之Gly到Asp错误掺入之相对水平；(A)二价构建体、(B)三价构建体及(C)四价构建体、(D)无GGC密码子之四价构建体。

贯穿本申请案所引用之所有参考文献(包括文献参考、颁予之专利、公开之专利申请及共同待决的专利申请)的全部内容以引用之方式明确地并入本文中，尤其对于上文所提及之教示内容。

实验部分

实施例1：

构建四价纳米抗体构建体之表达载体

在此实施例中，作为非限制性实例，本发明将使用由重链美洲驼之四个序列优化可变结构域组成的四价纳米抗体构建体说明，所述结构域与35GS接头头尾融合(参见图2)。所用总构建体(在本文中亦被称为”纳米抗体构建体A”)可由下式示意性地表示：

[A]-[35GS接头]-[B]-[35GS接头]-[C]-[35GS接头]-[C]

其中[A]、[B]及[C]表示三种不同纳米抗体且[35GS接头]表示35GS接头(亦参见图2)。

将含有纳米抗体构建体A之编码信息之DNA片段克隆至含有zeocin^TM抗性基因之毕赤酵母表达载体(由

等人,PLoS One.2012；7(6):e39720所描述之原始pPpT4_Alpha_S表达载体之衍生物)的多个克隆位点中，使得

序列在α交配因子(aMF)信号肽序列之下游且与其在框内。

纳米抗体构建体A编码序列的转化、构建体在巴斯德毕赤酵母中的表达及分泌

转化及表达研究执行于毕赤酵母菌株NRRL Y-11430(ARS Patent CultureCollection 1815North University St.,Peoria)中。此WT菌株用以制造过度表达内源毕赤酵母辅助蛋白质KAR2(基因ID:8198455)以及纳米抗体构建体A之衍生菌株。纳米抗体构建体A与Kar2两者皆处于AOX1甲醇诱导性启动子之控制下。转化是通过标准技术且根据标准手册执行(参见例如Methods In Molecular Biology 2007,Humana Press Inc.)。如已在毕赤酵母协议中描述(再次参见标准手册)，使转化体生长于含有吉欧霉素(Zeocin)之选择性培养基上且选择多个个别菌落且评估纳米抗体构建体A于BMCM培养基中之5mL摇瓶培养物中之表达水平且藉由添加甲醇诱导。在标准分批进料发酵中使用最佳表达克隆。执行甘油进料批次且藉由添加甲醇起始诱导。在2L规模下在pH 6、30℃下于甲醇进料速率为4ml/L*h之复合培养基中执行生产。

在分批进料发酵之后纯化纳米抗体构建体A

如下纯化纳米抗体构建体A：在发酵之后，经由中空纤维750kDa使细胞培养液之部分澄清，随后使用CIEX Poros XS树脂进行捕捉步骤，使用CIEX Nuvia HR-S树脂进行精制步骤且在AIEX Sartobind STIC PA上进行流通步骤。最后，使用Hydrosart 10kD薄膜，经由UF/DF执行浓缩及缓冲液交换步骤。

基于离子交换层析法对经纯化纳米抗体构建体A之分析及酸性变体之分子量的测定

藉由强阳离子交换层析，使用pH梯度(pH-IEX)分析经纯化纳米抗体构建体A。图5中所示之层析图显示洗脱为相对于主峰之预峰之群组的

A之酸性变体。在酸性峰及主峰级分收集之后，藉由用电喷雾Q-TOF质谱分析测定其分子量来研究酸性变体之性质。解卷积质谱显示于图6中。在酸性级分中所观测到之主要质量为59689.4Da，其比如在pH-IEX主峰级分中所测量之纳米抗体构建体A之质量高58道尔顿。针对主峰级分(59630.9Da)中之纳米抗体构建体A所测量之质量比纳米抗体构建体A之理论分子量高12ppm，亦即在仪器之测量误差内。

58道尔顿质量差可藉由甘氨酸与酸性氨基酸天冬氨酸之交换来解释。

藉由与质谱分析联合之肽图谱反相UHPLC(RP-UHPLC-MS)分析及鉴别酸性变体

纳米抗体构建体A之酸性变体级分之肽图分析(在胰蛋白酶消化物之后)产生对具有58道尔顿之质量增量之两种肽的鉴别。如图2中示意性地显示，此等两种肽中之一者(在本文中被称为”T10肽”)对应于涵盖构建体中之第一纳米抗体的少数C端氨基酸残基、第一35Gs接头及构建体中之第二纳米抗体的少数N端氨基酸残基之序列的一部分。T10肽之氨基酸序列(SEQ ID NO:10)及核苷酸序列(SEQ ID NO:11)显示于图3中。

由于质谱仪中之碰撞诱导之片段化仅导致T10肽之部分序列覆盖，因此胰蛋白酶消化物之T10肽是通过反向层析分级分离，且随后用酶Asp-N消化。酶Asp-N为水解天冬氨酸残基之N端侧上之肽键的内切蛋白酶。因为天冬氨酸残基不在此肽之序列中，因此仅在Gly->Asp错误掺入事件之情况下预期裂解。在藉由RP-UHPLC-MS之对T10肽之Asp-N消化物的分析中，用对应于质量增量为58道尔顿之T10肽之片段的质量鉴别不同片段。如图7中所示，总共鉴别9个Asp-N片段化位点。非常出乎意料地，观测到，尽管仅在GGC密码子处(亦参见图3)且不在GGT密码子处发生Asp错误掺入，但两个甘氨酸密码子原则上皆可由天冬氨酸tRNA(具有反密码子CUG及CUA)错误读取。在两种情况下皆存在G-(mRNA)/U-(tRNA)错配，亦即翻译期间最常见之错配，连同可引起氨基酸错误掺入之摇摆位置错配(C/U和/或U/U)。因此，更一般而言，根据本发明，当编码除GGA或GGG(亦即非GGA或GGG)以外的甘氨酸之密码子存在于本发明之核苷酸序列中时，可优选的系密码子为GGT或GGU，而非GGC。

如所提及，对纳米抗体构建体A之肽图谱分析亦产生对质量增量为58道尔顿之第二肽的鉴别。发现此肽对应于存在于纳米抗体构建体A中之纳米抗体中之一者的CDR中之一者。进一步分析(资料未示出)证实，亦针对此肽，所观测到之58道尔顿质量增量最可能归因于Asp错误掺入。

实施例2：35GS接头的核酸序列中之密码子优化

存在于纳米抗体构建体A之35GS接头序列中之GGC密码子序列经GGG、GGA或GGT密码子序列置换。

所获得之纳米抗体构建体表达于毕赤酵母菌株NRRL Y-11430中且如上文所描述地纯化。藉由与上文所描述之相同方法测量所获得之多肽中Asp错误掺入水平。设置质谱仪以定量9个错误掺入位点中之3个。

在用参考纳米抗体构建体A获得之多肽的35GS接头(无密码子优化)中Asp错误掺入及用密码子优化纳米抗体构建体A获得之多肽的35GS接头中Asp错误掺入之相对水平显示于图8中。

实施例3：对其他接头中Asp错误掺入之观察

在此实施例中，研究纳米抗体价数及接头长度对Gly向Asp错误掺入之影响。为此，产生各自具有9GS、20GS或35GS接头序列及纳米抗体构件序列(不同于存在于纳米抗体构建体A中之纳米抗体构件序列)之二价、三价及四价构建体。亦产生无任何GGC密码子之额外四价、35GS接头纳米抗体构建体。十个新构建体显示于图9中。9GS接头含有2个GGC密码子，20GS接头含有5个GGC密码子且35GS接头含有9个GGC密码子。

Gly向Asp错误掺入之后的各可能的新肽用如上文所描述之质谱分析方法追踪。进一步优化该方法以允许同时定量全部9个Asp-N片段化位点。错误掺入之结果显示于图10(9GS接头)、图11(20GS接头)及图12(35GS接头)中。

由这些结果可推断，价数或接头长度对Gly向Asp错误掺入水平不具有影响。移除或减少GGC密码子之数目明确降低Gly向Asp错误掺入水平。

最后，尽管在本文中主要在GS接头方面描述本发明，但技术人员应清楚，本发明一般可应用于含有甘氨酸残基之其他肽接头。

因此，在另一方面中，本发明涉及一种编码肽接头的核苷酸序列和/或核酸，其中由核苷酸序列和/或核酸编码之肽接头含有四个或更多个甘氨酸残基，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码GS接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。

在此方面中，本发明还涉及一种编码肽接头的核苷酸序列和/或核酸，其中由核苷酸序列和/或核酸编码之肽接头含有四个或更多个甘氨酸残基，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)之编码GS接头中之甘氨酸残基的密码子为GGA或GGG。

在此方面中，本发明还涉及一种编码肽接头的核苷酸序列和/或核酸，其中由核苷酸序列和/或核酸编码之肽接头含有四个或更多个甘氨酸残基，其中少于30％、优选少于1％、更优选少于10％，诸如少于5％及高达小于1％及更低(包括0％)之编码GS接头中之甘氨酸残基的密码子为GGC。

Claims

1.编码肽接头的核苷酸序列和/或核酸，其中由该核苷酸序列或核酸编码之该肽接头包含甘氨酸及丝氨酸残基或(基本上)由甘氨酸及丝氨酸残基组成，其中：

超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)的编码所述肽接头中的甘氨酸残基的密码子为GGA、GGG或GGT/GGU；

超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％及更多(包括100％)的编码所述肽接头中的甘氨酸残基的密码子为GGA或GGG；和/或

少于30％、优选少于15％、更优选少于10％，诸如少于5％及至多少于1％及更低(包括0％)的编码所述肽接头中的甘氨酸残基的密码子为GGC。

2.根据权利要求1的核苷酸序列和/或核酸，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及至多99％或更多(包括100％)的编码所述肽接头中的甘氨酸残基的密码子为GGA、GGG或GGT/GGU。

3.根据权利要求1或2中任一项的核苷酸序列和/或核酸，其中超过70％、优选超过85％、更优选超过90％，诸如超过95％及高达99％或更高(包括100％)的编码所述肽接头中的甘氨酸残基的密码子为GGA或GGG。

4.根据权利要求1至3中任一项的核苷酸序列和/或核酸，其中少于30％、优选少于15％、更优选少于10％，诸如少于5％及至多少于1％或更低(包括0％)的编码所述肽接头中的甘氨酸残基的密码子为GGC。

5.根据权利要求1至4中任一项的核苷酸序列和/或核酸，其中所述肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或(基本上)由其组成。

6.根据权利要求1至5中任一项的核苷酸序列和/或核酸，其中所述肽接头为9GS接头、15GS接头、20GS接头或35GS接头。

7.根据权利要求6的核苷酸序列和/或核酸，其中所述肽接头为35GS接头。

8.编码(融合)蛋白质或融合多肽的核苷酸序列和/或核酸，其中由所述核苷酸序列和/或核酸编码的所述融合蛋白质或多肽包含经一或多个肽接头适当连接的两个或更多个肽部分，其中所述一或多个肽接头由权利要求1至7中任一项的核苷酸序列或核酸编码。

9.根据权利要求8的核苷酸序列和/或核酸，其中所述两个或更多个肽部分均为免疫球蛋白单可变结构域。

10.根据权利要求9的核苷酸序列和/或核酸，其中所述两个或更多个肽部分均为VHH的肽部分、人源化VHH的肽部分、序列优化的VHH的肽部分或骆驼化VH的肽部分，诸如骆驼化人类VH的肽部分。

11.根据权利要求8至10中任一项的核苷酸序列和/或核酸，其编码二价、三价、双特异性、三特异性、双互补位或四价构建体。

12.基因构建体，其包含根据权利要求1至11中任一项的核苷酸序列和/或核酸。

13.一种用于表达或产生(融合)蛋白质或多肽的方法，其中所述方法至少包括在适合的宿主细胞或宿主生物体中表达权利要求8至11中任一项的核苷酸序列或核酸的步骤，且任选地还包括分离/纯化因此表达的所述(融合)蛋白质或多肽的步骤。

14.根据权利要求12的表达或产生(融合)蛋白质或多肽的方法，其中所述宿主为毕赤酵母属(Pichia)，诸如巴斯德毕赤酵母(Pichia pastoris)。

15.根据权利要求12的表达或产生(融合)蛋白质或多肽的方法，其中所述宿主为哺乳动物细胞，诸如中国仓鼠卵巢(CHO)细胞。

16.一种宿主细胞或宿主生物体，其包含根据权利要求8至11中任一项的编码(融合)蛋白质或融合多肽的核苷酸序列和/或核酸。

17.降低肽接头中Gly到Asp错误掺入水平的方法，所述方法包括在编码所述肽接头的核酸序列和/或核酸中用GGG、GGA或GGT/GGU密码子置换至少一个GGC密码子的步骤。

18.根据权利要求17的降低肽接头中Gly到Asp错误掺入水平的方法，其中所述至少一个GGC密码子用GGG或GGA密码子置换。

19.根据权利要求17或18中任一项的降低肽接头中Gly到Asp错误掺入水平的方法，其中所述肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或(基本上)由其组成。

20.根据权利要求17至19中任一项的降低肽接头中Gly到Asp错误掺入水平的方法，其中所述肽接头为9GS接头、15GS接头、20GS接头或35GS接头。

21.根据权利要求17至20中任一项的降低肽接头中Gly到Asp错误掺入水平的方法，其中所述肽接头为35GS接头。

22.根据权利要求17至21中任一项的降低肽接头中Gly到Asp错误掺入水平的方法，其中所述肽接头连接两个或更多个肽部分。

23.根据权利要求22的降低肽接头中Gly到Asp错误掺入水平的方法，其中所述肽部分为免疫球蛋白单可变结构域。

24.根据权利要求23的降低肽接头中Gly到Asp错误掺入水平的方法，其中所述肽部分为VHH的肽部分、人源化VHH的肽部分、序列优化的VHH的肽部分或骆驼化VH的肽部分，诸如骆驼化人类VH的肽部分。

25.根据权利要求22至24中任一项的降低肽接头中Gly到Asp错误掺入水平的方法，其中所述肽接头包含在二价、三价、双特异性、三特异性、双互补位或四价构建体中。