CN111727194B - 肽文库的构建方法 - Google Patents

肽文库的构建方法 Download PDF

Info

Publication number
CN111727194B
CN111727194B CN201780089941.9A CN201780089941A CN111727194B CN 111727194 B CN111727194 B CN 111727194B CN 201780089941 A CN201780089941 A CN 201780089941A CN 111727194 B CN111727194 B CN 111727194B
Authority
CN
China
Prior art keywords
peptide
peptides
cyclic
library
libraries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780089941.9A
Other languages
English (en)
Other versions
CN111727194A (zh
Inventor
王珠银
李向群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Publication of CN111727194A publication Critical patent/CN111727194A/zh
Application granted granted Critical
Publication of CN111727194B publication Critical patent/CN111727194B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/64Cyclic peptides containing only normal peptide links
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明描述了一种改进的肽文库制备方法,用于构建完整的肽文库,如,完整的三肽文库、四肽文库、五肽文库、六肽文库、七肽文库或完整的八肽文库等。所述方法,包括:构建用于表达环状肽的表达载体,每个环状肽展示不同大小和不同序列的肽阵列,并且与常规的肽化学合成相比,可显著减少用于构建完整的肽文库所需的环状肽数量。此外,通过使用构建的基因文库表达和纯化所述环状肽可易于复制环状肽文库,例如,所述改进的肽文库制备方法尤其可用于构建完整的四肽文库、完整的五肽文库、完整的六肽文库、完整的七肽文库等;所述改进的肽文库制备方法可进一步用于构建部分的五肽文库、部分的六肽文库、部分的七肽文库等。本发明还描述了其他相关方法及相关表达载体。

Description

肽文库的构建方法
技术领域
本发明涉及一种用环状肽构建部分或完整的肽文库的方法,其中,环状肽可展示如四肽文库、五肽文库、六肽文库、七肽文库、八肽文库等部分或完整的肽文库所需的短肽阵列。该方法包括:构建用于表达标记环状肽的表达载体。每个标记环状肽展示不同大小的肽阵列,并且与常规的肽化学合成相比,可显著减少用于构建部分或完整的肽文库所需的环状肽数量。此外,可易于复制文库。还可化学或酶催化合成环状肽以构建部分或完整的肽文库。例如,该改进的肽文库制备方法尤其可用于构建完整的五肽文库及六肽文库等。
背景技术
肽文库包含了大量由氨基酸有机结合而成的肽。肽文库是在大量肽中进行筛选以寻找关键生物活性肽的强有力工具,其被广泛应用于生物研究、蛋白质相关研究以及药物开发。众所周知,低分子量肽具有较低的过敏性,而肽的多种生理功能使其成为开发治疗剂的合适候选药物(Host A、Halken S.低敏配方——何时、何人以及多长时间:历经15年多的时间,我们才知道正确的指征!.2004年《过敏医学》.59(增刊78):45-52;Lax R.制药行业中肽开发的未来.《Phar Manufacturing:Int Pept》2010版;Agyei D、Danquah MK.药品级生物活性肽的工业化生产.2011年《Biotechnol Adv》.29(3):272-7)。因此,生物活性肽是新时代医药产品的适合候选药物,尤其是随着人们对小分子药物的副作用、更新鲜和“更绿色”食品以及保健品是否能够预防疾病或促进健康的关注度的提高(Danquah MK、Agyei D.生物活性肽的制药应用.2012年《OA Biotechnology》.1(2):5)。
已发现多种生物活性肽,包括抗菌肽、抗癌肽、抗氧化肽、抗高血压肽、抗血栓肽、阿片肽、抗病毒肽、细胞调节和免疫调节肽等。(Sharma S、Singh R、Rana S.生物活性肽:综述.2011年《Int.J.Bioautomation》.15(4):223-250;Danquah MK、Agyei D.生物活性肽的制药应用.2012年《OA Biotechnology》.1(2):5)。因此,肽类药物开发是新药开发中最有前景的领域之一。
由于肽文库可以为药物开发、蛋白质间相互作用以及其他生物化学和药物应用提供强有力的工具,因此已经开发了几种方法来构建肽文库。肽文库构建方法分为两类:化学合成和生物技术。
1985年,George P.Smith引入了噬菌体展示技术,通过该技术筛选大量不同的肽(Smith G.P.丝状融合噬菌体:在病毒粒子表面上展示克隆抗原的新型表达载体.1985年《科学》.228:1315-1317)。研究发现,噬菌体衍生肽的成功与否主要取决于所筛选的肽文库质量(Lindner T、Kolmar H、Haberkorn U和Mier W.用于构建噬菌体库的基因文库:统计和结构要求与合成方法.2011年《Molecules》.16:1625-1641),然而该研究并未提出切实的方法来监测或保证噬菌体展示库的质量。事实上,截至目前,仅有少数通过噬菌体展示技术筛选出的肽进入了临床应用(Lindner T、Kolmar H、Haberkorn U和Mier W.统计和结构要求与合成方法.2011年《Molecules》.16:1625-1641)。
基于Merrifield首创的固相合成法,开发出了用于构建肽文库的“分裂和混合”组合合成法(Furka、F.Sebestyen、M.Asgedom、G.Dibo.快速合成多组分肽的通用方法.《肽和蛋白质研究国际期刊》.1991年.37:487-493)。理论上来说,可通过这种方式合成大量肽,从而制备大的肽文库,而实际上,由于合成文库的成本高且产量低,以这种方式合成的肽的数量和质量均有限。
也可通过重组法产生肽。通常将短肽融合至蛋白质,然后在大肠杆菌等表达宿主中表达和纯化(S.Hara、M.Yamakawa.大肠杆菌中生产家蚕抗菌肽:一种来自家蚕的新型抗菌肽.《Bombyx mori.Biochem.Biophys.Res.Commun》.1996年.224:877-878;H.K.Kim、D.S.Chun、J.S.Kim、C.H.Yun、J.H.Lee、S.K.Hong、D.K.Kang.阳离子抗菌肽、乳铁蛋白抗菌肽和阴离子肽在大肠杆菌中的融合表达.《Appl.Microbiol.Biotechnol.》.2006年.72:330-338)。然而,实际上,由于程序冗长且成本高,以这种方式生产的肽的数量和质量也受限,并且以这种方式构建的肽文库容量非常低。
与线性肽相比,由于缺乏末端氨基和末端羧基,环状肽通常表现出更好的生物活性,因为外肽酶具有构象刚性和更高的水解抗性(Sang Hoon Joo.环状肽作为治疗剂和生物化学工具.《Biomol Ther.》.2012年.20(1):19-26),这使得环状肽成为筛选药物的更好候选药物。也可基于分裂型内含肽通过化学合成或重组法产生环状肽(Sang Hoon Joo.环状肽作为治疗剂和生物化学工具.《BiomolTher.》.2012年.20(1):19-26;ManfrediMiraula、Charmaine Enculescu、Gerhard Schenk、内含肽——注重剪接-促进蛋白质的生物技术应用.2015年《美国分子生物学期刊》.5:42-56)。正如通过重组法产生的线性肽,由于程序冗长且成本高,以这种方式生产的环状肽的数量和质量也受限,并且以这种方式构建的肽文库容量非常低。
可通过合成大量不同的肽来构建肽文库。由于没有好的方法来预测哪种肽将会是很好的候选药物,因此,需要构建含有所有可能氨基酸组合的完整肽文库,以提高肽筛选期间找到好候选药物的几率。构建一个完整的三肽文库需要20种天然氨基酸,合成8000个不同的三肽。同样地,构建一个完整的四肽文库需要合成160000个四肽;构建一个完整的五肽文库需要合成3200000个五肽;而构建一个完整的六肽文库需要合成64000000个六肽。由于合成大量肽所需的成本高且产量低,截至目前,仅通过化学方法合成了一个完整的含有20种氨基酸所有可能组合的三肽文库(8000个肽),用于开发新型COX-2抑制剂(Ermelinda V等.新型三肽作为COX-2抑制剂用于开发新型COX-2抑制剂的设计、合成和评估.《氨基酸杂志》.2013年.2013:1-7)。目前,市场上甚至还没有一个完整的四肽文库,更别说完整的五肽文库、六肽文库或其他,其中,一个完整的四肽文库应含有160000个四肽。
因此,仍需要高产工艺,用以构建大容量的肽文库。前面已经描述了一种用于构建大容量肽文库的蛋白质展示方法(PCT/CN2015/083260肽文库构建方法及相关载体),其中,在标签蛋白(如,GST)末端展示短肽阵列,以减少构建完整的四库肽、五肽文库和六肽文库等所需的肽数量。然而,使用蛋白质展示法使得每个标记的可展示多个短肽的线性肽展示的较长肽数量较少。例如,标记的含有50个氨基酸残基的线性肽可展示47个四肽、46个五肽或45个六肽,但仅有两个含有49个氨基酸残基的肽和仅有一个含有50个氨基酸残基的肽,从而限制了文库的容量。因此,需要提供一种用于构建肽文库,甚至是具有大容量的肽文库的方法。
发明内容
本发明的一个目的是提供用于构建高容量的肽文库的改进方法。该方法并不是在蛋白标签末端展示肽,而是环化线性肽,形成环状肽来展示更多的肽,从而增加肽文库的容量。例如,通过合理设计,含有50个氨基酸的环状肽实际上可展示50个连续不同的三肽、50个连续不同的四肽、50个连续不同的五肽、50个连续不同的六肽和50个连续不同的七肽等,甚至是50个连续不同的含有48个氨基酸残基的肽、50个连续不同的含有49个氨基酸残基的肽和50个含有50个氨基酸残基的肽,从而构成2400个不同的由3~50个氨基酸组成的肽。
本发明的另一个目的是提供一种用于构建完整的四肽文库的改进方法。通过合理设计,含有50个氨基酸的环状肽实际上可展示50个连续不同的四肽,而通过该蛋白质展示方法,构建一个完整的四肽文库仅需3200个含有50个氨基酸残基的环状肽而非160000个合成四肽。同样地,构建一个完整的四肽文库仅需2000个含有80个氨基酸残基的环状肽,从而可进一步减少构建一个完整的四肽文库所需的较大环状肽的数量。
本发明还有一个目的是提供一种用于构建完整的五肽文库的改进方法。通过合理设计,含有50个氨基酸的环状肽实际上可展示50个连续不同的五肽,而通过该蛋白质展示法构建一个完整的五肽文库仅需64000个含有50个氨基酸残基的环状肽,而不是3200000个合成五肽。同样地,构建一个完整的五肽文库仅需40000个含有80个氨基酸残基的环状肽,从而可进一步减少构建一个完整的五肽文库所需的较大环状肽的数量。
本发明还有一个目的是提供一种用于构建完整的六肽文库的改进方法。通过合理设计,含有50个氨基酸的环状肽实际上可展示50个连续不同的六肽,而通过该蛋白质展示法构建一个完整的六肽文库仅需1280000个含有50个氨基酸残基的环状肽,而不是64000000个合成六肽。同样地,构建一个完整的六肽文库仅需800000个含有80个氨基酸残基的环状肽,从而可进一步减少构建一个完整的六肽文库所需的较大环状肽的数量。
本发明还有一个目的是提供一种用化学合成法构建大容量肽文库的改进方法。该方法,包括:(i)设计一系列环状肽,每个环状肽展示一个短肽阵列;(ii)用化学方法在纯化或未经纯化的情况下通过相应的环状肽序列合成线性肽;(iii)用化学方法或酶催化法环化线性肽以制备环状肽;以及(iv)纯化环状肽并使用库进行筛选。
本发明还有一个目的是提供一种构建大容量环状肽文库的改进方法。该方法,包括:(i)设计一系列环状肽,每个环状肽含有一个短肽阵列和一个或多个亲和标签;(ii)构建一系列表达载体,每个载体表达一个单一环状肽;(iii)通过将亲和标签与固定于固相上的特异性配体相结合来表达和纯化环状肽;(iv)从固相上洗脱环状肽,并使用库进行筛选;以及(v)可选地,直接使用固相环状肽进行筛选,而无需从固相上洗脱。
本发明还有一个目的是提供一种用环状肽构建完整或部分的肽文库的方法,其中,环状肽的数量显著减少。对于七肽、八肽和十肽等较长的肽或甚至是含有15个或20个氨基酸残基的肽,完整的肽文库需含有大量的所有可能的肽,分别为1.28×109、2.56×1010、1.024×1013、3.277×1019和1.049×1026。因此,通过化学合成如此多的肽以制备一个完整的肽文库是不切实际的。然而,仍需构建部分的肽文库,因为一些肽具有较高的序列相似性。通过合理设计,可大大减少构建有效的部分肽文库的肽数量。本发明的这种方法将进一步减少部分肽文库中的肽数量,从而使得有效的肽文库的构建变得实用。
本发明的另一个目的是提供一种用于构建完整的肽文库的替代方法。将每个环状肽的DNA序列克隆到表达载体中,用于表达和纯化标记的环状肽。载体可存储,而肽易于在任何时候通过该载体表达或复制。与肽合成不同,每个肽都需要重新开始再合成。
本发明的一个目的是提供一种用于构建表达载体的方法,该表达载体用于在肽文库构建中表达和纯化标记的环状肽。
本发明的其他目的体现在原始权利要求中。本公开的实施例在下面的附图和说明书中有详细描述。结合说明书、附图和权利要求,本发明的其他特征、目的和优点将变得显而易见。
附图说明
通过结合附图将可更好地理解本发明的上述发明内容和下述详细说明。为了对本发明进行说明,附图中示出了当前优选的实施例。然而,应当理解的是,本发明并非仅限于提供的附图。
图中:
图1是环状肽展示多个较短肽和一个五肽(DECAF,Asp-Glu-Cys-Ala-Phe)的示例性示意图;
图2是根据本发明的实施例的用于展示短肽的高容量环状肽的示意图;
图3是用单个含有80个氨基酸残基的环状肽展示80个不同的五肽的典型实例的示意图;
图4是用于基于分裂型内含肽表达环状肽的载体的图谱示意图;和
图5是含有80个氨基酸残基的环状肽的表达和纯化示意图。
具体实施方式
除非另有定义,否则本说明书中使用的所有技术和科学术语均具有本发明所属技术领域中普通技术人员公知的相同含义。本说明书中提及的所有出版物和专利均通过引用并入本文中。
本发明的实施例涉及用于构建肽文库的方法。一方面,本发明涉及对通过常规化学合成构建肽文库的显著改进。例如,本发明提供了一种用于构建一个完整的肽文库的改进方法,其中,环状肽通过该方法来表达和纯化,而形成一个完整文库所需的环状肽数量显著减少。
在本发明的实施例中,合理设计环状肽的氨基酸序列,使得每个环状肽可展示各种不同大小的肽阵列,从而显著增加文库容量。根据环状肽大小,每个环状肽可展示10到100个,甚至200个特定大小的不同肽。因此,根据本发明实施例的方法大大减少了肽文库中的肽数量,从而显著降低构建和筛选肽文库所需的成本。
在本文中,“肽”、“文库”、“标签”、“蛋白质”、“载体”、“容量”、“环状”、“完整的”和“阵列”具有广义上的涵义。
在一个一般方面,本发明涉及一种用于构建完整的肽文库的改进方法,其中,与常规的肽合成方法相比,肽数量减少。例如,如图1和图2中所示,一个环状肽可展示多个较短的肽。换句话说,多个短肽可由单个环状肽展示,即“蛋白质展示”。例如,一个含有80个氨基酸残基的环状肽可展示80个不同的五肽,而无需合成80个不同的五肽,从而显著减少了构建一个完整的五肽文库所需的肽数量,同时提高了筛选效率。与蛋白质表达相比,相对较长的肽的化学合成既不高效,也不经济。例如,一个含有80个氨基酸残基的肽需数天进行化学合成和首尾相连环状肽环化,而类似的环状肽可以很容易地在细菌宿主中在一夜之间进行表达。化学合成80个残基长度的环状肽的总产量低,而类似的肽可以很容易地在表达宿主中以任何规模进行表达。相反地,本发明的实施例提供了一种构建完整的肽文库的方法,其中,肽的数量显著减少,这些肽可以很容易地表达和纯化,并且可以很容易地利用克隆基因在任何时候进行复制。根据本发明实施例的方法可以大大减少构建和筛选肽文库所需的时间和成本。
本发明的实施例涉及用于表达和纯化环状肽的蛋白标签。其中一种蛋白标签是GST(谷胱甘肽S-转移酶),GST常用于纯化与其融合的靶蛋白。GST可有助于靶蛋白或肽的表达。另一种常见的标签是His,His标签中含有一串用于纯化标记的肽的组氨酸残基。
在本发明的一个实施例中,蛋白标签选自但不限于GST、His、Trx、SUMO、CBD、FLAG、HA、AviTag、Myc-Tag、SBP、Strep-Tag、Fc-Tag、Halo-Tag、V5、VSV和MBP等中的一个。
在本发明的一个实施例中,蛋白标签选自但不限于GST、His、Trx、SUMO、CBD、FLAG、HA、AviTag、Myc-Tag、SBP、Strep-Tag、Fc-Tag、Halo-Tag、V5、VSV和MBP等的组合。
在本发明的又一个实施例中,可将标签添加在环状肽的任意位置,以便于表达和纯化环状肽。蛋白标签选自但不限于GST、His、Trx、SUMO、CBD、FLAG、HA、AviTag、Myc-Tag、SBP、Strep-Tag、Fc-Tag、Halo-Tag、V5、VSV、MBP等。
还可在标签和肽之间添加蛋白酶识别序列,以便在需要时利用蛋白酶从标签上切离肽。
本发明包括对上述实施例的修改,以进一步改进文库的构建,这对本领域技术人员而言是显而易见的。这些修改包括但不限于在上述实施例中添加一个或多个肽序列。例如,可在肽序列中添加一些特定的氨基酸以便进行内含肽剪接。
根据本公开,可使用多种方法来设计肽序列,以制备有效的肽文库。例如,为了促进标记的肽的可溶性表达,应避免肽序列中含有一长串的疏水性氨基酸。
可使用内含肽反式剪接系统生产环状肽,对本领域技术人员而言是显而易见的。例如,可使用Npu DnaE分裂型内含肽(Hideo Iwai、SaraJennifer Jin、Pui-HangTam.从念珠藻中自然分裂的DnaE内含肽的高效蛋白质反式剪接.《FEBS Letters》.2006年.580:1853-1858)、Ssp GyrB分裂型内含肽、Ssp DnaB分裂型内含肽、Ssp DnaE分裂型内含肽、Mxe GyrA分裂型内含肽、Mtu RecA分裂型内含肽等生产环状肽。
环状肽可以以这样的方式设计,即环状肽可以展示尽可能多的不同的短肽,从而增加肽文库的容量,这对本领域技术人员来说是显而易见的。
在图3所示的实施例中,含有80个氨基酸的表达环状肽实际上可展示80个连续不同的四肽、80个连续不同的五肽、80个连续不同的六肽、80个连续不同的七肽……80个连续不同的含有78个氨基酸残基的肽、80个连续不同的含有79个氨基酸残基的肽和80个含有80个氨基酸残基的肽,其构成了6160个大小在4到80个氨基酸之间的肽。
在上述实施例中,本领域技术人员应该理解环状肽可包含多达200个或更多个氨基酸,尽管优选包含10到100个。肽序列越长,形成三级结构的几率越高,其中一些肽序列不会暴露出进行筛选。
在上述实施例中,本领域技术人员应该理解,3200个或更多含有50个氨基酸残基的表达环状肽可构建或展示一个完整的四肽文库,或2000个或更多含有80个氨基酸残基的表达环状肽可构建或展示一个完整的四肽文库,而无需化学合成160000个四肽。
在上述实施例中,本领域技术人员应该理解,64000个或更多含有50个氨基酸残基的表达环状肽可构建或展示一个完整的五肽文库,或40000个或更多含有80个氨基酸残基的表达环状肽可构建或展示一个完整的五肽文库,而无需化学合成3200000个五肽。
在上述实施例中,本领域技术人员应该理解,肽文库中的一些肽具有较高的序列相似性,而通过合理设计可大大减少构建一个有效的肽文库所需的肽数量。因此,可用少于3200个的含有50个氨基酸残基的表达环状肽构建一个有效的四肽文库。同样地,可用少于64000个的含有50个氨基酸残基的表达环状肽构建一个有效的五肽文库。
在上述实施例中,本领域技术人员应该理解,环状肽可含有超过80个氨基酸,从而进一步减少表达环状肽的个数。因此,甚至可用更少的表达肽来构建有效的四肽文库、五肽文库,甚至是六肽文库。
在上述实施例中,本领域技术人员应该理解,肽文库中的一些肽具有较高的序列相似性和结构相似性,而通过合理设计可进一步减少构建一个有效肽文库所需的肽数量。因此,用实用数量的表达环状肽可构建有效的多肽文库,如,八肽文库、十肽文库,甚至是更长的肽文库,如,含有15个氨基酸残基的肽文库、含有20个氨基酸残基的太文库,甚至是含有30个氨基酸残基的肽文库。
在一个优选实施例中,可设计2000个或更多由His标记的含有80个氨基酸残基的表达环状肽、将其克隆到表达载体、表达并纯化,以构建一个完整的四肽文库。
在另一个优选实施例中,可设计40000个或更多由His标记的含有80个氨基酸残基的表达环状肽、将其克隆到表达载体、表达并纯化,以构建一个完整的五肽文库,该表达环状肽也可构建一个完整的四肽文库。
在上述实施例中,本领域技术人员应该理解,也可使用其他标签来代替His标签,其他标签选自但不限于GST、Trx、SUMO、CBD、FLAG、HA、AviTag、Myc-Tag、SBP、Strep-Tag、Fc-Tag、Halo-Tag、V5、VSV、MBP等。
在上述实施例中,本领域技术人员应该理解,标记的环状肽可含有多于或少于80个氨基酸,从而进一步减少或增加构建一个完整的肽文库所需的标记的表达环状肽的数量。
在图4中所示的实施例中,标记的环状肽的表达载体可构建成可选地包含一个或多个亲和标签的DNA序列、分裂型内含肽的两个互补片段的DNA序列(C端内含肽模体NpuDnaEC和N端内含肽模体Npu DnaEN)和肽表达DNA序列,以及可选地包含可在需要时用于线性化环状肽的蛋白酶识别位点。
在上述实施例中,本领域技术人员应该理解,可基于但不限于细菌表达载体、酵母表达载体、昆虫表达载体、真菌表达载体、哺乳动物表达载体和植物表达载体来构建表达载体。
在本发明的另一个实施例中,标记的环状肽可由表达宿主表达并在表达宿主中纯化。该表达宿主选自但不限于细菌细胞、酵母细胞、昆虫细胞、真菌细胞、哺乳动物细胞和植物细胞。
本领域技术人员应该容易理解,通常也可使用类似的方法来构建环状肽文库。用固定于固体表面的亲和标签来表达、纯化设计的环状肽,然后通过仍附着于固体表面的肽进行筛选。也可从固体表面洗脱后,再将设计的环状肽用于筛选。
虽然对本发明的多个实施例进行了描述,但是,应当注意的是,对这些具体实施例的描述仅仅是为了对本发明构思的原理进行说明。因此,可在不脱离本发明的精神和范围的情况下对本公开实施例做各种修改,对本领域技术人员而言是显而易见的。
下面的具体实例将对本发明的本质做了进一步说明,但是,需要理解的是,本发明并不仅限于这些实例。
蛋白质展示实例
图3A示出了含有80个氨基酸残基的环状肽的环状结构和氨基酸序列,而图3B示出了该含有80个氨基酸残基的环状肽可展示80个不同的五肽。
如下所示的DNA序列包括两个用于表达含有80个氨基酸残基的环状肽的Npu DnaE分裂型内含肽模体;将该DNA序列克隆到pET28a载体,如图4中所示。
DNA序列:
其中,C端Npu DnaE模体(Npu DnaEC)以斜体显示,含有80个氨基酸残基的环状肽以粗体显示,而N端Npu DnaE模体(Npu DnaEN)以普通字体显示。
相应的蛋白质序列:
其中,C端Npu DnaE模体(Npu DnaEC)以斜体显示,含有80个氨基酸残基的环状肽以粗体显示,而N端Npu DnaE模体(Npu DnaEN)以普通字体显示。
按照标准基因表达方法,用IPTG作为诱导物在大肠杆菌菌株中表达含有80个氨基酸残基的环状肽。图5A示出了含有80个氨基酸残基的环状肽以可溶性形式表达,其中,泳道1是蛋白质标记物,其分子量列于左侧;泳道2是未经诱导的全细胞裂解物,而泳道3是用1mMIPTG诱导的全细胞裂解物。含有80个氨基酸残基的环状肽用箭头表示。
使用Ni-IDA柱纯化含有80个氨基酸残基的环状肽。将含有80个氨基酸残基的环状肽接合到Ni-IDA柱,并用咪唑洗脱Ni-IDA柱。图5B示出了含有80个氨基酸残基的环状肽纯化,其中,泳道1是蛋白质标记物,其分子量列于左侧;泳道2是用IPTG诱导的全细胞裂解物,泳道3是全细胞裂解物样品的流出液(Flow-through),而泳道4是纯化的含有80个氨基酸残基的环状肽,其用箭头表示。
本说明书中提及的所有出版物和专利均通过引用并入本文中。在不脱离本发明的范围和精神的情况下,可对描述的主题做各种修改和变形对本领域技术人员而言是显而易见的。尽管已结合具体实施例对本发明进行了描述,但应能理解,请求保护的本发明不应过度局限于这些实施例。实际上,在所附权利要求书的范围内,可对本发明做各种修改对本领域技术人员而言是显而易见的。
序列表
<110> 湖南中晟全肽生化有限公司
<120> 肽文库的构建方法
<140> 2017800899419
<141> 2017-04-26
<160> 5
<170> SIPOSequenceListing 1.0
<210> 1
<211> 657
<212> DNA
<213> Artificial Sequence
<220>
<221> CDS
<222> (1)..(657)
<400> 1
atg atc aag att gct acg cgc aaa tac ttg gga aaa cag aac gtt tat 48
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
gat atc gga gtg gaa cgt gac cac aat ttt gct ctg aaa aac gga ttc 96
Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
atc gca agt aat tgc tgg gaa agt ggg aag atg acc ggt atc gtg aag 144
Ile Ala Ser Asn Cys Trp Glu Ser Gly Lys Met Thr Gly Ile Val Lys
35 40 45
tgg ttt aac gct gac aag ggg ttt ggt ttc att act cca gat gac ggt 192
Trp Phe Asn Ala Asp Lys Gly Phe Gly Phe Ile Thr Pro Asp Asp Gly
50 55 60
tct aag gat gtt ttc gtt cac ttt tcc gcg att caa aac gac ggg tac 240
Ser Lys Asp Val Phe Val His Phe Ser Ala Ile Gln Asn Asp Gly Tyr
65 70 75 80
aaa tcc ttg gat gag ggc caa aaa gtc tca ttt acg att gaa tcc ggg 288
Lys Ser Leu Asp Glu Gly Gln Lys Val Ser Phe Thr Ile Glu Ser Gly
85 90 95
gcc aag ggt ccc gca gca gga aac gta act agc tta tcc aaa act cac 336
Ala Lys Gly Pro Ala Ala Gly Asn Val Thr Ser Leu Ser Lys Thr His
100 105 110
cac cat cat cac tgt ttg tcc tac gag acc gag atc ctt aca gta gaa 384
His His His His Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu
115 120 125
tat ggt ttg tta ccc att gga aag atc gtg gag aag cgt atc gaa tgc 432
Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys
130 135 140
aca gtg tac agc gtt gat aac aac ggt aac att tat acc caa ccc gtg 480
Thr Val Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val
145 150 155 160
gct cag tgg cat gac cgt ggc gaa caa gag gtc ttc gag tat tgc ctt 528
Ala Gln Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu
165 170 175
gag gac ggg tct ctg atc cgc gct aca aaa gat cat aag ttt atg acc 576
Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr
180 185 190
gtt gac gga cag atg ctg cct att gac gaa att ttt gag cgt gaa ctt 624
Val Asp Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu
195 200 205
gac tta atg cgt gtc gat aac ctg cct aat taa 657
Asp Leu Met Arg Val Asp Asn Leu Pro Asn
210 215
<210> 2
<211> 218
<212> PRT
<213> Artificial Sequence
<220>
<223> 蛋白质序列
<400> 2
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
Ile Ala Ser Asn Cys Trp Glu Ser Gly Lys Met Thr Gly Ile Val Lys
35 40 45
Trp Phe Asn Ala Asp Lys Gly Phe Gly Phe Ile Thr Pro Asp Asp Gly
50 55 60
Ser Lys Asp Val Phe Val His Phe Ser Ala Ile Gln Asn Asp Gly Tyr
65 70 75 80
Lys Ser Leu Asp Glu Gly Gln Lys Val Ser Phe Thr Ile Glu Ser Gly
85 90 95
Ala Lys Gly Pro Ala Ala Gly Asn Val Thr Ser Leu Ser Lys Thr His
100 105 110
His His His His Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu
115 120 125
Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys
130 135 140
Thr Val Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val
145 150 155 160
Ala Gln Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu
165 170 175
Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr
180 185 190
Val Asp Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu
195 200 205
Asp Leu Met Arg Val Asp Asn Leu Pro Asn
210 215
<210> 3
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> C端Npu DnaE模体
<400> 3
atgatcaaga ttgctacgcg caaatacttg ggaaaacaga acgtttatga tatcggagtg 60
gaacgtgacc acaattttgc tctgaaaaac ggattcatcg caagtaat 108
<210> 4
<211> 240
<212> DNA
<213> Artificial Sequence
<220>
<223> 80-mer 环肽
<400> 4
tgctgggaaa gtgggaagat gaccggtatc gtgaagtggt ttaacgctga caaggggttt 60
ggtttcatta ctccagatga cggttctaag gatgttttcg ttcacttttc cgcgattcaa 120
aacgacgggt acaaatcctt ggatgagggc caaaaagtct catttacgat tgaatccggg 180
gccaagggtc ccgcagcagg aaacgtaact agcttatcca aaactcacca ccatcatcac 240
<210> 5
<211> 309
<212> DNA
<213> Artificial Sequence
<220>
<223> C端Npu DnaE模体
<400> 5
tgtttgtcct acgagaccga gatccttaca gtagaatatg gtttgttacc cattggaaag 60
atcgtggaga agcgtatcga atgcacagtg tacagcgttg ataacaacgg taacatttat 120
acccaacccg tggctcagtg gcatgaccgt ggcgaacaag aggtcttcga gtattgcctt 180
gaggacgggt ctctgatccg cgctacaaaa gatcataagt ttatgaccgt tgacggacag 240
atgctgccta ttgacgaaat ttttgagcgt gaacttgact taatgcgtgt cgataacctg 300
cctaattaa 309

Claims (12)

1.一种用环状肽构建部分或完整的肽文库的方法,其中,所述方法,包括:(i)设计一系列环状肽,每个环状肽展示一个短肽阵列和一个或多个亲和标签,每个肽包含短肽序列阵列,其中所述肽包含50个氨基酸的环肽,所述环肽展示50个连续不同的三肽、50个连续不同的四肽、50个连续不同的五肽、50个连续不同的六肽和50个连续不同的七肽、50个连续不同的含有48个氨基酸残基的肽、50个连续不同的含有49个氨基酸残基的肽和50个含有50个氨基酸残基的肽,它们构成了2400个不同的由3~50个氨基酸组成的肽;其中所述环状肽通过使用分裂型内含肽的内含肽剪接形成,并且相应的线性肽在C端内含肽模体和N端内含肽模体之间融合;(ii)构建一系列表达载体,每个载体表达一个单一环状肽;(iii)通过将所述亲和标签与固定于固相上的特异性配体相结合来表达和纯化所述环状肽;(iv)从所述固相上洗脱所述环状肽,并使用所述库进行筛选,或直接使用所述固相环状肽进行筛选,而无需从所述固相上洗脱。
2.根据权利要求1所述的方法,其中,所述环状肽的大小相同或不同。
3.根据权利要求1所述的方法,其中,所述亲和标签选自GST、His、Trx、SUMO、CBD、FLAG、HA、AviTag、Myc-Tag、SBP、Strep-Tag、Fc-Tag、Halo-Tag、V5、VSV和MBP。
4.根据权利要求1所述的方法,其中,表达宿主选自细菌细胞、酵母细胞、昆虫细胞、真菌细胞、哺乳动物细胞和植物细胞。
5.根据权利要求1所述的方法,其中,所述表达载体选自细菌表达载体、酵母表达载体、昆虫表达载体、真菌表达载体、哺乳动物表达载体和植物表达载体。
6.根据权利要求1所述的方法,其中,所述环状肽以可溶性或包涵体表达。
7.根据权利要求1所述的方法,其中,所述环状肽以细菌细胞的可溶性或包涵体表达。
8.根据权利要求1所述的方法,其中,所述环状肽以大肠杆菌的可溶性或包涵体表达。
9.根据权利要求1所述的方法,其中,构建所述一系列表达载体,每个载体表达一个单一环状肽,所述载体,包括:载体骨架、C端内含肽模体序列、一个或多个亲和标签DNA序列、单一环状肽DNA序列、N端内含肽模体序列;可选地,一个或多个蛋白酶识别位点。
10.根据权利要求9所述的方法,其中,所述一个或多个亲和标签放置在C端内含肽模体与N端内含肽模体之间的任意位置。
11.根据权利要求10所述的方法,其中,两个或多个所述亲和标签连接在一起或分开。
12.一种用环状肽构建部分或完整的肽文库的方法,所述方法,包括:(i)设计一系列环状肽,每个环状肽展示一个短肽阵列,每个肽包含短肽序列阵列,其中所述肽包含50个氨基酸的环肽,所述环肽展示50个连续不同的三肽、50个连续不同的四肽、50个连续不同的五肽、50个连续不同的六肽和50个连续不同的七肽、50个连续不同的含有48个氨基酸残基的肽、50个连续不同的含有49个氨基酸残基的肽和50个含有50个氨基酸残基的肽,它们构成了2400个不同的由3~50个氨基酸组成的肽;(ii)用化学方法在纯化或未经纯化的情况下通过相应的环状肽序列合成线性肽;(iii)用化学方法或酶催化法环化所述线性肽以制备环状肽;以及(iv)纯化所述环状肽并使用所述库进行筛选。
CN201780089941.9A 2017-04-26 2017-04-26 肽文库的构建方法 Active CN111727194B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/082071 WO2018195834A1 (en) 2017-04-26 2017-04-26 Peptide library constructing method

Publications (2)

Publication Number Publication Date
CN111727194A CN111727194A (zh) 2020-09-29
CN111727194B true CN111727194B (zh) 2023-11-03

Family

ID=63917987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780089941.9A Active CN111727194B (zh) 2017-04-26 2017-04-26 肽文库的构建方法

Country Status (12)

Country Link
US (1) US11978533B2 (zh)
EP (1) EP3596106B1 (zh)
JP (1) JP7013039B2 (zh)
CN (1) CN111727194B (zh)
AU (1) AU2017411195B2 (zh)
CA (1) CA3062843C (zh)
DK (1) DK3596106T3 (zh)
ES (1) ES2895224T3 (zh)
HU (1) HUE056111T2 (zh)
PL (1) PL3596106T3 (zh)
PT (1) PT3596106T (zh)
WO (1) WO2018195834A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11830582B2 (en) * 2018-06-14 2023-11-28 University Of Miami Methods of designing novel antibody mimetics for use in detecting antigens and as therapeutic agents
JP2023108850A (ja) 2022-01-26 2023-08-07 富士通株式会社 特徴量算出プログラム、特徴量算出方法、特徴量算出装置
CN114539425B (zh) * 2022-02-25 2023-04-28 湖南中晟全肽生化有限公司 一种提高线性多肽生物表达的方法
CN115261398A (zh) * 2022-08-02 2022-11-01 态创生物科技(广州)有限公司 基于噬菌体展示和内含肽切割的寡肽表达和提纯方法
CN116789762A (zh) * 2023-04-10 2023-09-22 湖南中晟全肽生化有限公司 人cd200受体的拮抗剂结合多肽分子及其应用
CN116478249B (zh) * 2023-04-21 2024-05-14 湖南中晟全肽生物科技股份有限公司 抑制il-23与il-23r结合的多肽及其应用
CN116925206B (zh) * 2023-07-18 2024-04-23 湖南中晟全肽生物科技股份有限公司 Gitr相关的多肽及其应用
CN117285604A (zh) * 2023-07-22 2023-12-26 湖南中晟全肽生化有限公司 一种对三阴性乳腺癌细胞具有抑制活性的多肽及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1354788A (zh) * 1998-12-18 2002-06-19 宾州研究基金会 环肽
WO2015166036A1 (en) * 2014-05-02 2015-11-05 Morphosys Ag Peptide libraries
WO2016023895A1 (en) * 2014-08-11 2016-02-18 Miti Biosystems GmbH Cyclic peptides expressed by a genetic package
WO2017004745A1 (en) * 2015-07-03 2017-01-12 Hohai University Peptide library constructing method and related vectors

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7105341B2 (en) * 2000-03-06 2006-09-12 Rigel Pharmaceuticals. Inc. In vivo production of cyclic peptides
GB0126887D0 (en) * 2001-11-08 2002-01-02 Univ London Method for producing and identifying soluble protein domains
WO2004020981A2 (en) 2002-08-30 2004-03-11 Rigel Pharmaceuticals, Inc. Methods of screening cyclic peptides and identifying targets therefor
GB0515974D0 (en) * 2005-08-03 2005-09-07 Ge Healthcare Ltd Compounds and imaging methods

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1354788A (zh) * 1998-12-18 2002-06-19 宾州研究基金会 环肽
WO2015166036A1 (en) * 2014-05-02 2015-11-05 Morphosys Ag Peptide libraries
WO2016023895A1 (en) * 2014-08-11 2016-02-18 Miti Biosystems GmbH Cyclic peptides expressed by a genetic package
WO2017004745A1 (en) * 2015-07-03 2017-01-12 Hohai University Peptide library constructing method and related vectors

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Jaime E. Townend等.Traceless Production of Cyclic Peptide Libraries in E. coli.ACS Chemical Biology.2016,第11卷(第11期),1624-1630. *
叶丙雨 ; 赵志虎 ; .EPL和PTS在生物合成主链环肽方面的应用研究进展.军事医学.2016,(03),252-255. *

Also Published As

Publication number Publication date
HUE056111T2 (hu) 2022-01-28
CA3062843C (en) 2023-02-14
PT3596106T (pt) 2021-09-10
EP3596106A4 (en) 2020-04-01
EP3596106B1 (en) 2021-08-11
AU2017411195A1 (en) 2019-11-14
DK3596106T3 (da) 2021-09-13
AU2017411195B2 (en) 2021-01-21
ES2895224T3 (es) 2022-02-18
EP3596106A1 (en) 2020-01-22
WO2018195834A1 (en) 2018-11-01
CN111727194A (zh) 2020-09-29
JP2020517290A (ja) 2020-06-18
JP7013039B2 (ja) 2022-01-31
US20200135299A1 (en) 2020-04-30
PL3596106T3 (pl) 2022-01-03
US11978533B2 (en) 2024-05-07
CA3062843A1 (en) 2018-11-01

Similar Documents

Publication Publication Date Title
CN111727194B (zh) 肽文库的构建方法
Hodges De novo design of α-helical proteins: basic research to medical applications
Chandrudu et al. Chemical methods for peptide and protein production
Zompra et al. Manufacturing peptides as active pharmaceutical ingredients
US20100297758A1 (en) Artificial peptide and use thereof
AU2015401336B2 (en) Peptide library constructing method and related vectors
CA2290717A1 (en) Nucleic acid binding proteins
Corbi-Verge et al. Strategies to develop inhibitors of motif-mediated protein-protein interactions as drug leads
EP1918297A1 (en) Neuronal differentiation-inducing peptide and use thereof
Muir et al. The chemical synthesis of proteins
WO2018022917A1 (en) Disulfide-rich peptide libraries and methods of use thereof
Monincová et al. Structure–activity study of macropin, a novel antimicrobial peptide from the venom of solitary bee Macropis fulvipes (Hymenoptera: Melittidae)
Matheson et al. Establishing the structure-activity relationship of teixobactin
CN101258242A (zh) 膜转位肽
CN100528899C (zh) 含有肽载体和表皮生长因子的融合蛋白和核酸及其用途
US20090012000A1 (en) Anti-Viral Peptide and Use Thereof
WO2024048050A1 (ja) キャリアペプチドフラグメント及びその利用
Kaiser Design and Construction of Biologically Active Peptides and Proteins Including Enzymes
JP4507084B2 (ja) アポトーシス誘導性ペプチド及びその利用
Buyanova et al. Bicyclic Peptide Inhibitors of Protein–Protein Interactions
JP2005192415A (ja) プリオン病治療用ペプチド及びその利用
Lee 3D organic molecular architectures: Folding into shape
Ma Molecular scaffolds: Design, synthesis and biological activities of linear and cyclic peptides with multiple pharmacophores

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant