CN113150095A - 从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白 - Google Patents

从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白 Download PDF

Info

Publication number
CN113150095A
CN113150095A CN202110414366.3A CN202110414366A CN113150095A CN 113150095 A CN113150095 A CN 113150095A CN 202110414366 A CN202110414366 A CN 202110414366A CN 113150095 A CN113150095 A CN 113150095A
Authority
CN
China
Prior art keywords
protein
sequence
synthetic
proteins
scaffold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110414366.3A
Other languages
English (en)
Inventor
M·麦克弗森
D·汤姆林森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Leeds
University of Leeds Innovations Ltd
Original Assignee
University of Leeds
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Leeds filed Critical University of Leeds
Publication of CN113150095A publication Critical patent/CN113150095A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1037Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/168Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/02Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/415Assays involving biological materials from specific organisms or of a specific nature from plants
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/04Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Hematology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Urology & Nephrology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Epidemiology (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)

Abstract

本发明涉及源自植物半胱氨酸蛋白酶抑制剂的支架蛋白以及编码它们的核酸。支架高度稳定并且具有展示肽的能力。支架尤其适于例如在噬菌体展示或相关的系统中构建文库。本发明也涉及支架的各种用途,包括在治疗、诊断、环境和安全性监测、合成生物学和研究中的用途,和涉及表达支架蛋白的细胞和细胞培养物。

Description

从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白
本申请是申请日为2014年2月14日,申请号为201480022070.5(PCT/GB2014/050435),发明名称为“从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白”的中国专利申请的分案申请。
本发明涉及新的蛋白质、编码它们的核酸,并涉及使用它们的方法。尤其地,本发明涉及可用作展示肽序列的支架的蛋白质,并且涉及这些支架在比如治疗、诊断、环境和安全性监测、合成生物学和研究领域中的用途。
背景技术
‘所谓的‘蛋白质支架的使用在生物化学中作为产生在研究和医药中使用的新配体结合蛋白质的潜在途径获得关注。用于展示一个或多个肽序列的这样的支架蛋白可潜在地提供抗体或抗体片段的可选方案。
术语‘蛋白质支架‘用于描述在不同背景下观察到的并且具有不同生物化学功能的一类多肽结构。因为它们固有的构象稳定性,已经推论这样的支架可经得起蛋白质工程化。
常规上认为免疫球蛋白(抗体)的功能归功于保守的框架区域和由高变肽区段形成的空间明确限定的抗原-结合位点的组成,这些区段的序列和构象都不同。在抗体工程化方法以及文库技术导致成功选择功能性抗体片段之后,使用其他蛋白质构造以合成有用的结合蛋白质的兴趣开始增加。
对采用的适当的蛋白质支架的期望的特性的描述包括下述;
“适当的蛋白质支架的候选物应展示紧凑和结构上刚性的核心,其能够呈现具有不同序列和长度的表面环,或能够以其他方式在连续表面区域——包括暴露的疏水性残基——中耐受侧链置换,,而不显著改变它们的折叠特性。”Skerra A:Engineered proteinscaffolds for molecular recognition.J Mol Recognit 2000,13:167-187,并且术语‘支架‘,如在蛋白质工程化中使用的,描述了单链多肽框架,其通常具有减小的尺寸(<200AA)并且包含与允许插入、缺失或其他置换的、具有高构象耐受的可变部分相关的高度结构化的核心‘。Wurch等,Trends in Biotechnology,2012年11月,30,575-582。
但是,并不是初看似乎对于环区域工程化有吸引力的所有类型的多肽折叠事实上都允许构建具有高亲和力和特异性的独立的配体结合位点。
现有技术支架包括失活的葡萄球菌核酸酶、绿色荧光蛋白(GFP)和硫氧还蛋白A(TrxA)、Ⅲ型纤连蛋白结构域('Fn3')、脂笼蛋白家族蛋白质,后胆色素结合蛋白(BBP),以及分离的蛋白质折叠,比如葡萄球菌蛋白A的Z结构域、“亲合体(affibodies)”、anticafins和锚蛋白重复序列等。
WO 2006/131749描述了在Stefin A中产生的数个合理突变,以改善其作为支架。修饰的Stefin A支架包含在下述三个位点的突变Lys71-Leu73、V48D和G4W,并且被称为STM(Stefin A三重突变体)。
WO2009/136182描述了STM支架的进一步改进。
仍需要改善的支架蛋白。尤其地,已经发现现有技术支架通常不能充分使肽适体稳定,并且支架中适体的存在实际上使得支架显著变形。见例如Woodman等,‘Design andValidation of a Neutral Protein Scaffold for the Presentation of PeptideAptamers‘,J.Mol.Biol.(2005)352,1118–1133
理想地,这样的改善的支架蛋白将提供一个或多个下述益处:
-改善的稳定性,以提供不变形的刚性框架;
-更小的尺寸;
-支持高质量和复杂性文库的改善的能力;
-选择的结合蛋白质对于它们靶的改善的亲和力;和
-由于可用的N-和C-末端而对进一步操作的简化。
发明内容
根据本发明,提供了合成蛋白,其具有源自植物半胱氨酸蛋白酶抑制剂或与植物半胱氨酸蛋白酶抑制剂相关的序列。
适当地,合成蛋白包含数个(例如10个或更多个、20个或更多个或50个或更多个)植物半胱氨酸蛋白酶抑制剂蛋白质的共有序列。
适当地,合成蛋白是支架蛋白,其包含被改造成或适于异源肽序列插入的位点。
因此,本发明的支架蛋白优选地不基于单一天然存在的蛋白质序列,而是自然中不存在的新蛋白质,其通过细心设计植物半胱氨酸蛋白酶抑制剂类的代表的共有序列获得。
在一种实施方式中,合成蛋白包含氨基酸序列
NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA(SEQ ID NO 1),或其变体。优选地变体具有与其至少50%,更优选地70%同一性的序列。
已经发现,包含这样的序列的合成蛋白提供非常稳定和有用的支架蛋白。
在另一实施方式中,合成蛋白包含氨基酸序列
GNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA(SEQ ID NO 2),或其变体。优选地变体具有与其至少50%,更优选地70%同一性的序列。
在另一实施方式中,合成蛋白包含氨基酸序列
ATGVRAVPGNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA(SEQ ID NO 3),或其变体。优选地变体具有与其至少50%,更优选地70%同一性的序列。
更优选地,本发明的合成蛋白包含与上述SEQ ID NOS 1、2或3至少75%、80%、85%、90%、95%或99%同一性的氨基酸序列。一般更高水平的同一性是优选的。
在一些情况下,合成蛋白包含与SEQ ID NO 1、2或3一致,或基本上一致的氨基酸序列,或由与SEQ ID NO 1、2或3一致,或基本上一致的氨基酸序列组成。
在本发明优选的实施方式中,上面阐释的合成蛋白包含插入其中的至少一种异源肽序列。本发明的合成蛋白尤其用作用于约束和展示肽序列的支架蛋白。因此,本发明延伸至‘空‘支架蛋白(即不存在任何异源肽序列)和具有插入其中的一个或多个异源序列的支架蛋白。
因此,本发明优选的实施方式是具有如本文所描述的序列的合成支架蛋白,所述支架蛋白展示在支架的适当点插入的一个或多个异源肽。‘展示‘意思是肽序列在使得肽在适当的条件下暴露于支架表面的位置被插入到支架蛋白中,所述适当的条件例如非变性条件,比如在体内或体外试验中。这样的展示一个或多个异源肽的支架蛋白通常称为肽适体或多个肽适体,但是应当注意,术语适体的使用多少与本领域不一致,指肽它们本身或完整的蛋白质。
优选地,异源肽序列的长度是3至30个氨基酸,更优选地4至20个氨基酸,更优选地4至16个氨基酸。已经发现本发明的合成蛋白尤其适于展示长度是5至13个氨基酸的异源序列。
优选地,异源肽序列被插入到合成蛋白的环区域中或蛋白质的N-末端。环区域可定义为这样的区域:其在常规的条件下不涉及蛋白质的有序的二级结构或三级结构(即蛋白质正确折叠并且不在变性条件下),但是可有助于蛋白质中二级结构元件的功能和/或正确的空间组织。支架蛋白中环区域的位置可当然在不同蛋白质变体之间变化。合成蛋白的环区域可通过检测蛋白质的二级和三级结构而被确定,并且实现该检测的方法是本领域熟知的,包括X射线结晶学、NMR以及生物信息学方法。
在本发明中,优选地异源肽被插入到蛋白质中的至少一个下述位置中:
-β-折叠的第一和第二区域之间的环(称为环1);和
-β-折叠的第三和第四区域之间的环(称为环2)。
当然,第一、第二、第三和第四旨在被解释为相对于蛋白质序列,即从蛋白质的N-末端至C-末端。
优选地,异源肽被插入在这两个位置,即环1和环2处。
优选地,β折叠的相邻区域之间的环长度是3至20个氨基酸的长度,更优选地5至13个氨基酸的长度,并且认为约9个氨基酸长度的环长度是最佳的。
用于插入到环1和环2中的示例性异源肽对在表2中列出,即SEQ ID NOS 25至72。这些例子形成本发明优选的实施方式。
另外,异源肽的另外的插入点位于蛋白质的N-末端或其附近(例如在4个氨基酸内)。认为在该点处的肽序列相比上面提到的在其他两个位置处的插入物对于结合靶较不关键,但是其似乎在结合中起作用。
因此在本发明的一个实施方式中,合成支架蛋白包含三个异源肽,每个异源肽均在上面讨论的每个位置中。
在上面阐释的具体序列的情况下,蛋白质序列中优选的环区域加下划线定位:
NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA(SEQ ID NO 1)
GNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKP WENFKELQEFKPVGDA(SEQ ID NO 2)
MATGVRAVPGNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA(SEQ ID NO 3)
加下划线的区域可被异源肽完全或部分置换,或异源肽可被插入到加下划线的区域中而不移除环区域。另外,异源肽可添加至SEQ ID NO 1或2的N末端。
但是,应当注意,异源肽可被插入到其他环区域中,例如α-螺旋和第一β-折叠之间的环区域和/或β-折叠的第二和第三区域之间的环区域(为了方便其可分别称为环3和环4)。当支架蛋白正确折叠时,这些环区域位于来自上面提到的那些的支架(环1和环2)的相对侧。通过在支架的两侧插入异源肽环区域,可能产生二价部分,能够结合在支架一侧上的第一靶和在另一侧(一般是相对侧)的第二靶,并且这在某些情况下可能是期望的实施方式。
在合成蛋白包含如上阐释的氨基酸序列的情况下,序列可以是连续的或非连续的。例如,在异源肽已经被插入到合成蛋白中,例如在上面提到的一个环区域处,的情况下,序列是非连续的,异源肽因此分开上面提到的序列的部分。
注意,对于本发明,一般而言,序列同一性的计算应被调整,以便考虑异源肽被插入到合成蛋白中的情况。当已经发生这样的插入时,在计算序列同一性时,通常不应考虑插入的肽序列。这是因为本发明的合成蛋白用作支架,在该情况下,插入的肽在合成蛋白中它们将被展示在蛋白质表面的位置处被插入。插入的肽序列是高度可变的,这取决于它们的性质和目的。在这样的情况下,关注的是蛋白质支架部分的序列——因为其为肽的展示提供稳定的框架,而不是有意的高度可变的插入的肽序列。
在去除或不去除在合成蛋白中正常出现的氨基酸的情况下,异源肽可被插入到合成蛋白中。也就是说,异源肽可在合成蛋白的末端被插入或在合成蛋白中的两个氨基酸之间被插入,而不去除合成蛋白的任何正常氨基酸。可选地,当肽被插入到合成蛋白中时,可去除/置换通常在合成支架蛋白中存在的一个或多个氨基酸。例如可去除上面序列1、2和3中的‘环‘氨基酸VVAG、PWE和ATG(当存在时),或序列变体中相应的环序列。
根据本发明的尤其优选的支架蛋白阐释在下面SEQ ID NOS 74至79中,以及对支架的潜在修饰的相关的描述中。
就蛋白质序列而言,术语“同一性”指鉴于氨基酸差异的蛋白质之间的相似性程度,但是其考虑在尺寸、亲脂性、酸度等方面功能上类似的不同氨基酸。可使用相似性-评分矩阵比如Henikoff S和Henikoff J.G.,P.N.A.S.USA 1992,89:10915-10919中描述的Blosum62矩阵,通过序列的最佳比对,计算同一性百分数。使用Blosum62相似性矩阵和Needleman和Wunsch(J.Mol.Biol.1970,48:443-453)的算法进行同一性百分数的计算和两条序列的最佳比对可使用Genetics Computer Group(GCG,Madison,WI,USA)的GAP程序使用程序的默认参数执行。下面描述用于计算关于本发明的蛋白质序列和核酸序列的同一性百分数的具体参数。
也形成本发明一部分的蛋白质的变体可包含氨基酸序列的变异,所述变异是由所述序列中一个或多个氨基酸的缺失、置换、插入、倒位或添加造成的或由化学连接至蛋白质的部分的变化造成的。例如,蛋白质变体可包含连接至蛋白质的碳水化合物或PEG结构。本发明的蛋白质可包括一个或多个这样的蛋白质修饰。本发明的蛋白质可包含来自N末端或C末端的一个或更多个氨基酸,例如1、2、3、4、5、6、7、8、9或10个氨基酸的缺失,条件是所述变体保持期望功能。
蛋白质的置换变体是其中氨基酸序列中的至少一个残基已经被去除并且在其位置插入不同的残基的那些变体。本发明的蛋白质可包含保守的或非保守的置换。
术语“保守置换”指用一个或多个氨基酸置换物置换具有类似生物化学特性的氨基酸残基。典型地,保守置换对所得蛋白质的活性几乎没有影响或没有影响。例如,蛋白质中的保守置换可以是基本上不影响蛋白质正确折叠的能力并以另外执行其通常的生物学功能的氨基酸置换。本发明蛋白质的变体的筛选可用于鉴定哪个氨基酸残基可耐受氨基酸置换。在一个实施例中,当实现一个或多个保守氨基酸置换时,修饰的蛋白质的相对解链温度或α-螺旋和β-折叠的量减少不大于25%,优选地不大于20%,尤其不大于10%。
一个或多个保守置换可包含在本发明的蛋白质中。在优选的实施例中,10个或更少的保守置换包含在蛋白质中。所以本发明的蛋白质可包含1、2、3、4、5、6、7、8、9、10个或更多个保守置换。通过使用例如标准程序,比如点定向诱变或PCR,操作编码多肽的核苷酸序列,可产生包含一个或多个保守置换的多肽。可选地,可通过使用本领域已知的肽合成方法产生包含一个或多个保守置换的多肽。
可用于置换蛋白质中的初始氨基酸并且被视为保守置换的氨基酸的例子包括:Ser置换Ala;Lys置换Arg;Gln或His置换Asn;Glu置换Asp;Asn置换Gln;Asp置换Glu;Pro置换Gly;Asn或Gln置换His;Leu或Val置换Ile;Ile或Val置换Leu;Arg或Gln置换Lys;Leu或Ile置换Met;Met,Leu或Tyr置换Phe;Thr置换Ser;Ser置换Thr;Tyr置换Trp;Trp或Phe置换Tyr;和Ile或Leu置换Val。在一个实施方式中,置换是在Ala、Val、Leu和Ile之间;在Ser和Thr之间;在Asp和Glu之间;在Asn和Gln之间;在Lys和Arg之间;和/或在Phe和Tyr之间。关于其他位置之间的保守置换的进一步的信息可见于Ben-Bassat等,(J.Bacteriol.169:751-7,1987),O'Regan等,(Gene 77:237-51,1989),Sahin-Toth等,(Protein Sci.3:240-7,1994),Hochuli等,(Bio/Technology 6:1321-5,1988),WO 00/67796(Curd等)以及遗传学和分子生物学的标准教科书中。
其他变体可以是例如功能变体,比如盐、酰胺、酯,尤其是C-末端酯和N-酰基衍生物。还包括的是在体内或体外,例如通过糖基化、酰胺化、羧化或磷酸化修饰的肽。
可通过各种化学技术修饰根据本发明的蛋白质,以生产具有与未修饰的肽基本上相同的活性并任选地具有其他期望特性的衍生物。例如,蛋白质——无论羧基末端或侧链——的羧酸基团可以例如药学上可接受的阳离子(caution)的盐的形式或酯化形式被提供,以形成C1-C6烷基酯;或被转化成例如式CONR1R2的酰胺,其中R1和R2每个独立地是H或C1-C6烷基;或被组合形成杂环比如5-或6-元环。肽——无论氨基末端或侧链——的氨基基团可为药学上可接受的酸加成盐的形式,比如HCl、HBr、乙酸、苯甲酸、甲苯磺酸、马来酸、酒石酸和其他有机盐,或可被修饰成C1-C6烷基或二烷基氨基,或被进一步转化成酰胺。肽侧链的羟基基团可使用公认的技术转化成烷氧基或酯基团,例如C1-C6烷氧基或C1-C6烷基酯。肽侧链的苯基和酚环可用一个或多个卤原子,比如F、Cl、Br或I置换,或用C1-C6烷基、C1-C6烷氧基、羧酸和其酯,或这样的羧酸的酰胺置换。肽侧链的亚甲基基团可延伸至同系物C2-C4亚烷基。可用许多公认的保护基团中的任何一个,比如乙酰胺基团保护硫醇。本领域技术人员也认识到将环状结构引入到本公开的肽中的方法,以为导致增强的稳定性的结构选择和提供构象约束。
在本发明优选的实施方式中,合成蛋白的解链温度(Tm)为至少90℃,更优选地至少95℃,和最优选地至少100℃。在蛋白质的情况下,Tm也称为变性中点,并且被定义为折叠的和未折叠的状态相等地存在的温度。一般为其中没有插入异源肽序列的合成蛋白测定Tm。异源序列的插入可能——通常的确——降低Tm,因此,在比较空支架蛋白时获得最有意义的值,并且这是上面提到的Tm图的基础。本发明令人吃惊的优势是已经获得如此高度稳定的蛋白质。解链温度是蛋白质稳定性非常有用的指标。可通过本领域技术人员已知的许多技术测定折叠的和未折叠的蛋白质的相对比例,所述技术包括差示扫描量热法、紫外差示光谱、荧光、圆二色谱(CD),和NMR(见Pace,C.Nick和J.Martin Scholtz."Measuring theconformational of a protein"299-321)。
当在正常温度(例如体外约25℃和体内37℃)时,本发明的合成蛋白的极高温度稳定性也是蛋白质的非常高的结构稳定性的指示。这意味着本发明的合成蛋白非常适于充当展示异源肽的支架。它们的结构稳定性意思是这样的异源肽将被一致和精确地展示,而不破坏支架蛋白结构。因为本发明的合成蛋白如此稳定,这表明它们将比没有相同水平稳定性的已知支架表现更好。
令人吃惊地,基于用作其设计基础的陆地植物的亲本蛋白质序列的来源,这样的小支架蛋白的热转变温度是例如101℃。陆地植物亲本通常在周围外部温度下生长,因此仅仅少数作物比如水稻可期望在热带温度下生长,而大部分在温和气候至冷的北方气候下生长。
如上述,异源肽的加入可以——通常的确——降低本发明合成支架蛋白的稳定性。但是,已经发现本发明支架的稳定性仍比现有技术支架更高。因此,在优选的实施方式中,具有至少一种异源肽插入其中的合成支架蛋白的Tm为60℃或更高,更优选地70℃或更高,和尤其80℃或更高。这指示具有至少一种异源肽插入其中的支架蛋白是高度稳定的。
优选地,本发明的合成蛋白包含连接体或标签。连接体或标签可以是氨基酸连接体或标签,或另一类型的连接体或标签。标签可以是为合成蛋白提供期望的功能的任何标签,例如允许容易分离或纯化蛋白质的标签。示例性标签是多组氨酸(polyhistidine)标签(也称为His-标签),和其他熟知的标签,包括Myc-标签、SBP标签、S-标签、钙调蛋白标签等。
在本发明进一步的实施方式中,提供了如上所阐释的连接基底或部分的合成蛋白。部分可以是标记、载体、蛋白质等。合成蛋白可直接连接至基底或部分,或其可经连接体连接。合成蛋白可共价或非共价连接至基底或部分。用于将蛋白质连接至基底或部分的非共价系统包括但不限于生物素-抗生物素蛋白系统。
在所述部分是标记的情况下,其可以是荧光标记、放射性标记、酶标记或本领域技术人员已知的任何其他标记。
荧光标记的例子包括但不限于有机染料(例如花菁、荧光素、若丹明、AlexaFluors、Dylight氟(fluors)、ATTO染料、BODIPY染料等)、生物荧光团(例如绿色荧光蛋白(GFP)、R-藻红素等)和量子点。
酶标记的例子包括但不限于辣根过氧化物酶(HRP)、碱性磷酸酶(AP)、葡糖氧化酶和β-半乳糖苷酶。
另一熟知的标记是生物素。生物素标记通常由生物素基基团、间隔臂和负责附着至蛋白质上的靶官能团的反应基团组成。生物素可用于使标记的蛋白质附着至包括抗生物素蛋白部分的其他部分。
用于标记蛋白质的各种策略是本领域技术人员熟知的,并且它们可容易应地用于本发明的合成蛋白。
蛋白质结合的基底可以是任何适当的表面,例如容器比如96孔板的表面。
在所述部分是载体的情况下,其可,例如,是珠(例如磁珠)或其他粒子。
通常,标记、连接体或标签被添加在蛋白质的C末端和/或N末端。但是可也经与其中插入异源肽的环充分间隔开的蛋白质的任何区域添加,从而不干扰靶结合,最优选地在具有插入物的环的相对侧上。
在本发明的实施方式中,提供了融合蛋白,其包含如上所阐释的连接第二蛋白质的合成蛋白。第二蛋白质可以是具有期望活性的蛋白质。在本发明的某些实施方式中,第二蛋白质可以是噬菌体外壳蛋白或可用于表面展示系统的另外的蛋白质,并且在下面详细描述了这样的融合蛋白在扫描方法中的用途。第二蛋白质当然可以是另外的合成蛋白,从而提供同源或异源多聚支架蛋白。
在本发明进一步的方面中,提供了包含如上所述的合成蛋白群体的文库,其中群体的各个成员包括具有不同序列的各种异源肽。可使用本领域技术人员已知的组合技术产生异源肽的合适的文库,并且可通过许多商业来源获得编码合适的异源肽序列组的核酸序列。优选地,这样的文库的复杂度为108或更高,更优选地109或更高,和最优选地1010或更高。
这样的文库可用于选择结合靶实体的特定的合成支架蛋白。靶实体可以是期望对其具有蛋白质结合特异性的任何实体。示例性靶包括但不限于蛋白质/肽(例如受体或配体)、小分子(例如药学分子)、核酸(例如DNA或RNA)和无机化合物。
文库可包括适于在适当的展示系统例如表面展示系统中展示的本发明的合成蛋白的群体。表面展示系统可适当地是噬菌体展示。可选地,表面展示系统可以是mRNA展示、核糖体展示、CIS-展示或其他非共价或共价蛋白质展示系统、细菌展示或酵母展示。酵母双杂交系统或在细菌或哺乳动物细胞系统中的表达常在体内系统中用于筛选结合靶的适体。这些展示系统通常统一称为生物淘选系统。
例如,噬菌体展示可以是丝状噬菌体(例如M13)展示系统。因此,合成蛋白可与pIII、pVIII、pVI、pVII或pIX蛋白融合。可用于本发明的其他噬菌体展示系统包括T4、T7和λ噬菌体展示。应当注意,本发明的合成蛋白是通用的并且可与任何适当的展示系统一起使用,并且各种适当的系统是本领域技术人员熟知的。噬菌体展示通常用于抗体的选择,但是该技术直接适用于本发明的蛋白质。噬菌体展示技术的概述可见,例如,Lowman H.B.,Clackson T.(2004)Phage display:a practical approach.Oxford UniversityPress.10-11页。
在本发明尤其优选的实施方式中,本发明的合成蛋白,尤其当用于构建文库时,包含序列:
NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQ(Xn)TMYYLTLEAKDGGKKKLYEAKVWVK(Xn)NFKELQEFKPVGDA(SEQ ID NO 4)
其中X是任何氨基酸和n是序列中的氨基酸的数量,并且其中n优选地是3至30,更优选地4至20,和仍更优选地4至15。
优选地,合成蛋白包含序列:
NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQ(X5-13)TMYYLTLEAKDGGKKKLYEAKVWVK(X5-13)NFKELQEFKPVGDA(SEQ ID NO 5)
更优选地,合成蛋白包含序列:
NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQ(X9)TMYYLTLEAKDGGKKKLYEAKVWVK(X9)NFKELQEFKPVGDA(SEQ ID NO 6)
如上所讨论,包含与SEQ ID NO 4、5或6具有50%,更优选地70%同一性的序列的蛋白质在本发明的范围内。更优选地,本发明的合成蛋白包含的氨基酸序列与SEQ ID NO4、5或6具有至少75%、80%、85%、90%、95%或99%的同一性。通常,更高水平的同一性是优选的。
在任何上面的实施例中,蛋白质可在N-末端包含另外的氨基酸序列。这可包含序列MATGVRAVPGNE(SEQ ID NO 80)的一些或全部。可选地或另外,其可包括例如长度为3至20个氨基酸的另外的异源肽序列。
在本发明的实施方式中,优选的是N末端氨基酸是甲硫氨酸。这可例如通过添加另外的甲硫氨酸或通过用甲硫氨酸置换正常的N-末端氨基酸来实现。
本发明尤其优选的支架蛋白阐释在SEQ ID NOS 74至79中。根据上面阐释的标准,这些蛋白质的变体也是本发明的实施方式。
在另一方面,本发明提供了编码根据本发明的合成蛋白的多核苷酸。多核苷酸可以是DNA或RNA。如果多核苷酸是DNA,则其可为单链或双链形式。单链可以是编码链或非编码(反义)链。
根据本发明的多核苷酸可包含编码具有根据SEQ ID NO 1、2、3、4、5或6,或SEQ IDNO 74至79任一条,或其变体的序列的蛋白质的序列,如上所讨论。
在一种实施方式中,多核苷酸包括序列:
aacgctctgctggaattcgttcgtgttgttaaagctaaagaacaggttgttgctggtaccatgtactacctgaccctggaagctaaagacggtggtaaaaagaaactgtacgaagctaaagtttgggttaaaccgtgggaaaacttcaaagaactgcaggagttcaaaccggttggtgacgct
(SEQ ID NO 7),其编码SEQ ID NO 1中所示的氨基酸。
在另一实施方式中,多核苷酸包含序列:
ggtaacgaaaactccctggaaatcgaagaactggctcgtttcgctgttgacgaacacaacaaaaaagaaaacgctctgctggaattcgttcgtgttgttaaagctaaagaacaggttgttgctggtaccatgtactacctgaccctggaagctaaagacggtggtaaaaagaaactgtacgaagctaaagtttgggttaaaccgtgggaaaacttcaaagaactgcaggagttcaaaccggttggtgacgct(SEQ ID NO 8),其编码SEQ ID NO 2中所示的氨基酸。
在另一实施方式中,多核苷酸包含序列:
Gctaccggtgttcgtgcagttccgggtaacgaaaactccctggaaatcgaagaactggctcgtttcgctgttgacgaacacaacaaaaaagaaaacgctctgctggaattcgttcgtgttgttaaagctaaagaacaggttgttgctggtaccatgtactacctgaccctggaagctaaagacggtggtaaaaagaaactgtacgaagctaaagtttgggttaaaccgtgggaaaacttcaaagaactgcaggagttcaaaccggttggtgacgct
(SEQ ID NO 9),其编码SEQ ID NO 3所示的氨基酸。
可通过包括下述步骤的方法分离具有作为鉴定的核酸序列的变体的核酸序列的多核苷酸:a)使包含SEQ ID NOs 7、8或9任一条所反映的鉴定序列的全部或部分的DNA在严格条件下与感兴趣的核酸杂交;和b)通过本领域技术人员已知的方法分离所述核酸。杂交条件优选地是高度严格的。
根据本发明,术语“严格的”意思是洗涤条件是1 x SSC、0.1%SDS,65℃温度;“高度严格的”条件指SSC降低至0.3 x SSC,更优选地降低至0.1 x SSC。优选地,前两次洗涤相继进行两次,每次持续15-30分钟。如果需要在高度严格条件下洗涤,则用0.1x SSC在15分钟内执行另外的洗涤一次。杂交可在具有7%SDS的pH 7.5的0.5M磷酸缓冲液中,在65℃过夜进行。这样的杂交方法公开在与分子克隆相关的任何标准教科书中,例如:MolecularCloning:a laboratory manual,第三版;编辑:Sambrook等,CSHL press,2001。
SEQ ID NOs 7、8或9中描述的序列的变体也可通过在计算机中比较该序列与可包括在计算机数据库中的其他序列而进行鉴定。所述序列可与数据库中的序列使用BLAST程序进行比较(BLASTF 2.1.2[Oct.-19-2000])(Altschul,SF,TL Madden,AA Schaffer,JZhang,Z Zhang,W Miller,和DJ Lipman,"Gapped BLAST and PSI-BLAST:a newgeneration of protein database search programs",Nucleic Acids Res.1997,25:3389-3402)。
本发明优选的实施方式是编码与SEQ ID NOS 1-6具有至少50%,更优选地70%,更优选地80%,更优选地95%同一性的蛋白质的多核苷酸,仍更优选的是编码与SEQ IDNOS 1、2、3、4、5或6或SEQ ID NO 74至79的任一条具有至少97%同一性的蛋白质的那些多核苷酸,其中,编码具有至少98或99%同一性的蛋白质的那些多核苷酸是更优选的。最优选的是编码SEQ ID NO 1、2、3、4、5或6或SEQ ID NO 74至79任一条的蛋白质的多核苷酸。
由于遗传密码的兼并性,编码一致或基本上一致的氨基酸序列的多核苷酸可使用不同的具体密码子。编码如上定义的蛋白质的所有多核苷酸被视为本发明的一部分。
在这方面,应当注意,上面讨论的序列已经被优化,用于在细菌宿主大肠埃希杆菌(Escherichia coli)中表达,因为这是方便的系统并且通常用于技术比如噬菌体展示和用于随后产生选择的结合蛋白质。但是,任何本领域技术人员可选择在可选的宿主系统中表达蛋白质,并且在该情况下,编码选择的蛋白质的核苷酸序列的改变(即密码子优化)可以是有益的,因此是本发明的一部分。针对任何具体的宿主优化密码子使用是本领域技术人员的常规手段。
在尤其优选的实施方式中,根据本发明的多核苷酸是分离的多核苷酸,其包含与SEQ ID NOs 7、8或9(在相关的时候,排除编码异源肽的序列)的核酸序列具有至少80%同一性的序列。
根据本发明的多核苷酸当然可包含另外的序列,比如编码异源肽的序列、表达控制序列或编码其他蛋白质或蛋白质亚单位的序列。
更优选的是包含与SEQ ID NOs 7、8或9的整体序列(在相关的时候,排除编码异源肽的序列)具有至少90%同一性,仍更优选的至少95%同一性,优选地99%同一性,最优选100%同一性的序列的那些多核苷酸。
多核苷酸的定义中还包括修饰的RNA或DNA。可进行核酸碱基的修饰,并且可掺入碱基比如肌苷。其他修饰可包括,例如,骨架的修饰。
“%同一性”基于它们比对的序列之间的比较限定两个或更多个多核苷酸或多肽之间的关系。
可通过已知的方法计算同一性。本文就本发明而言提到的同一性或同源性百分数是可用在GCG(Genetics Computer Group Inc.,Madison,WI,USA)下运行的GAP程序计算的那些。
对于多肽序列比较:
-比对算法:Needleman和Wunsch,J.Mol.Biol.1970,48:443-453。
-作为氨基酸相似性的比较矩阵,使用Blosum62矩阵(Henikoff和Henikoff,上文)。
-使用下述缺口评分参数:
-缺口罚分:12
-缺口长度罚分:2
-末端缺口没有罚分。
对于核苷酸序列比较:
-比对算法:Needleman和Wunsch(上文)。
-比较矩阵:
-匹配=+10,错配=0。
-缺口罚分:50。
-缺口长度罚分:3。
也可使用开发共有稳定的蛋白质的方法,其包括并入其他参数,比如系统发生学上无偏见的方法,如Jaeckel,Bloom等2010描述的。
但是,如上所讨论,应该注意,各种序列同一性计算应被修改,以考虑一个或多个异源肽任选地被插入到合成蛋白中的情况。当已经发生这样的插入时,在计算序列同一性时,由于上面阐释的原因通常不应考虑编码肽(一种或多种)的插入的序列。
根据本发明的核酸,尤其是DNA,可用于在体内或在体外表达编码的蛋白质。当根据本发明的多核苷酸用于表达编码的蛋白质时,多核苷酸除了蛋白质的编码序列还可包括其他编码或非编码序列,例如,前导序列或融合部分、连接体序列、标记物序列、启动子、增强子等。
根据本发明的多核苷酸可用于产生根据本发明的重组蛋白。这可通过在适当的宿主细胞或多细胞生物体中表达蛋白质实现。当用于编码的多肽的表达时,多核苷酸除了多肽的编码序列还可有利地包括其他编码序列,例如,信号序列、前导序列、靶向序列、融合部分、标记物序列、帮助纯化的序列等。
各种宿主细胞和克隆媒介组合均可用于克隆和表达。本发明的多核苷酸可被克隆至任何适当的表达系统。适当的表达系统包括细菌表达系统(例如大肠埃希杆菌DH5α和BL21(DE3))、病毒表达系统(例如杆状病毒属(Baculovirus))、酵母系统(例如酿酒酵母(Saccharomyces cerevisiae))或真核细胞(例如COS-7、CHO、BHK、HeLa、HD11、DT40、CEF或HEK-293T细胞)。各种适当的表达系统是商业上可得的。通常,多核苷酸在适当的组成型或诱导型启动子的控制下被克隆至适当的载体,然后被引入宿主细胞中用于表达。
因此,在另一方面中,本发明提供了包含根据本发明的多核苷酸的重组载体。适当的载体包括细菌或酵母质粒、黏粒、噬菌粒、F黏粒、宽宿主范围质粒和源自质粒和噬菌体或病毒DNA组合的载体。复制起点和/或显性选择标记物可适当地存在于载体中。
根据本发明的载体适于转化宿主细胞。适当的克隆载体的例子是质粒载体比如pBR322、各种pUC、pET、pEMBL和Bluescript质粒,或病毒载体比如逆转录病毒、慢病毒(lentiviruses)、腺病毒、腺伴随病毒。pcDNA3.1是用于在动物细胞中表达的特别优选的载体。
对于支架蛋白的文库的克隆和表达尤其有用的是噬菌体或噬菌粒载体,比如源自丝状噬菌体比如M13或fd或壳体噬菌体(caspid phage)比如噬菌体T7的那些噬菌体或噬菌粒载体。
当用于本发明的蛋白质的表达时,根据本发明的载体通常包含表达控制序列,其可操作地连接至编码蛋白质的核酸序列,以控制相关多核苷酸的表达。这样的表达控制序列一般包含启动子序列和调节转录和翻译和/或增强表达水平的另外序列。适当的表达控制序列是本领域熟知的,其包括真核、原核或病毒启动子或聚腺甘酸信号。当然,表达控制和其他序列将根据选择的宿主细胞而不同,或可以成为诱导型的。有用的启动子的例子是tac启动子(Deboer,Comstock等1983)、T7启动子(Studier和Moffatt 1986)、SV-40启动子(Science 1983,222:524-527)、金属硫蛋白启动子(Nature 1982,296:39-42)、热休克启动子(Voellmy等,P.N.A.S.USA1985,82:4949-4953)、PRV gX启动子(Mettenleiter和Rauh,J.Virol.Methods 1990,30:55-66)、人CMV IE启动子(US 5,168,062)、劳斯肉瘤病毒LTR启动子(Gorman等,P.N.A.S.USA 1982,79:6777-6781)或人延伸因子1α或泛素启动子。原核控制序列包括,例如,lac、tac T7、ara和其他已知的启动子。Goldstein MA,Doi RH,‘Prokaryotic promoters in biotechnology‘.Biotechnol Annu Rev.1995;1:105-28描述了可用于本发明的一般原核启动子。许多其他适当的控制序列是本领域已知的,并且本领域技术人员为使用的表达系统选择适当的序列的是常规技术手段。
在多核苷酸已经被克隆至适当的载体之后,构建体可通过适当的方法,比如电穿孔、CaCl2转染或脂质转染的手段而被转移至细胞(例如细菌或酵母)中。当使用杆状病毒表达系统时,包含多核苷酸的转移载体可与完整的杆状病毒(baculo)基因组一起转染。
这些技术是本领域熟知的并且分子生物材料的制造商(比如Clontech、Agilent、Promega和/或Invitrogen Life Technologies)提供了合适的试剂和关于如何使用它们的说明。此外,许多标准参考教科书提供了关于此的进一步的信息,例如Rodriguez,R.L.和D.T.Denhardt,ed.,"Vectors:A survey of molecular cloning vectors and theiruses",Butterworths,1988;Current protocols in Molecular Biology,eds.:F.M.Ausubel等,Wiley N.Y.,1995;Molecular Cloning:a laboratory manual,同上;和DNA Cloning,1-4卷,第2版1995,eds.:Glover and Hames,Oxford University Press)。
在进一步的方面中,本发明也提供了能够表达重组蛋白的细胞,特征在于细胞包含根据本发明的编码待表达重组蛋白的多核苷酸。合适地,细胞是用如上述多核苷酸或载体转化的宿主细胞。根据本发明的多核苷酸或载体可稳定整合至细胞的基因组材料中或可以是自主复制载体的一部分。在该上下文中,“重组体”指在自然中不在细胞中表达的蛋白质。
可在可被改良,例如用于适当的选择、扩增或诱导重组蛋白的转录从而诱导表达,的常规营养培养基中培养宿主细胞。宿主细胞可以是原核的或真核的。哺乳动物细胞系,例如人细胞系可以是优选的,尤其在表达的蛋白质意图在体内用于人或哺乳动物受试者的情况下。合适的示例性细胞系在上面提到了,并且用于各种合适的细胞类型的适当的培养条件是本领域技术人员熟知的。
在进一步的方面中,本发明提供了包括根据本发明的细胞的细胞培养物。
在进一步的方面中,本发明提供了筛选结合靶的合成蛋白的方法,该方法包括:
a)提供包含成支架蛋白的群的文库,所述合成支架蛋白包含如上所述的一个或多个异源肽序列;
b)将所述文库暴露于靶;和
c)选择结合所述靶的合成支架蛋白。
靶可适当地是蛋白质/肽、核酸或小分子或任何其他感兴趣的靶。靶可适当地被固定在基底上,例如被固定至微量滴定板的孔或磁珠或其他合适的颗粒。
筛选的方法可合适地是展示系统,例如表面展示系统。例如,合适的表面展示系统可以是噬菌体展示、mRNA展示、核糖体展示、CIS(Odegrip,Coomber等2004)或其他非共价或共价蛋白质展示(FitzGerald 2000)、细菌展示(Lofblom 2011)和酵母展示(Traxlmayr和Obinger 2012)或在另外的真核细胞上的展示(Makela和Oker-Blom 2008)l(Ho和Pastan2009)。
在本发明的某些实施方式中,在筛选方法中使用的蛋白质因此是支架蛋白与噬菌体外壳蛋白的融合物,以便支架蛋白展示在病毒粒子的表面上。展示在病毒粒子上的蛋白质因此对应噬菌体粒子中的基因序列。当然,在表面展示系统不是噬菌体展示系统的情况下,可提供其他合适的融合蛋白。
在靶固定在基底上的情况下,表面展示的文库暴露于其上固定靶的基底,并且在允许噬菌体结合靶的一段适当的时间之后,冲洗基底。结合靶的蛋白质仍附着于基底,而其他的被冲洗掉。
适当地,然后洗脱结合靶的蛋白质或从靶切割结合的噬菌体,并且在噬菌体展示的情况下,用于通过感染合适的细菌宿主产生更多的噬菌体。这产生新的文库,其包含富集的混合物,该混合物含有比初始文库中存在的不相干噬菌体(即包含非结合支架蛋白的噬菌体)少得多的不相干噬菌体。
任选地重复将文库暴露于靶、冲洗、洗脱和感染的步骤一次或多次,进一步富集噬菌体文库中的结合蛋白。这一般称为淘选。因此该方法可涉及进行多个淘选步骤。
一旦已经执行了期望次数的淘选步骤,可对连接表面展示的蛋白的核酸测序,以鉴定结合靶的支架蛋白。
已经发现,可获得根据本发明的支架蛋白,其以高亲和力和高特异性结合靶。例如已经获得了以1x10-9 M的亲和力结合的支架蛋白。出人意料地,由根据本发明的支架蛋白形成的文库已经揭示了这样的支架蛋白,其结合已经证明针对其不可能产生抗体或具有期望特异性抗体的蛋白质。例如,基于支架的人工结合蛋白是特异性结合人乳头瘤病毒(HPV)16E5的选择的蛋白质,所述16E5是由于选择缺少针对该靶的合适抗体的能力的重复故障而未被研究的蛋白质。HPV是宫颈癌的病原体。也已经选择了人工结合蛋白质,其区分两种形式的人小泛素样调节物(Small Ubiquitin-like Modifier)(SUMO),hSUMO1和hSUMO2,而先前选择的抗体被证明不能进行这样的区分。可合理预期,在基于抗体的技术不能提供合适的方案的情况下,可产生针对其他靶的其他有用的结合蛋白质。
在进一步方面中,本发明提供了通过上述筛选方法获得的合成支架蛋白。
在进一步方面中,本发明提供了如上所阐释的合成蛋白或编码这样的合成蛋白的核酸在研究中的用途。例如,这样的蛋白质可用于通常使用抗体或抗体片段的任何研究领域。这样的方法可包括干扰蛋白质/蛋白质相互作用,标记靶(例如荧光标记)等。
在进一步方面中,本发明提供了如上所阐释的合成蛋白或编码这样的合成蛋白的核酸在环境和安全性监测或合成生物学中的用途。
在进一步方面中,本发明提供了如上所阐释的合成蛋白或编码这样的合成蛋白的核酸在靶检测中的用途。
在进一步方面中,本发明提供了如上所阐释的合成支架蛋白或编码这样的合成蛋白的核酸在治疗或诊断中的用途。例如,这样的蛋白质可用于通常使用抗体或抗体片段的任何诊断或治疗领域。
在进一步方面中,本发明提供了药学制剂,其包含如上所阐释的合成蛋白和药学上可接受的载体或赋形剂。
在进一步方面中,本发明提供了使用如上所阐释的合成蛋白验证药物靶和鉴定靶蛋白上成药结构域的方法。
在进一步方面中,本发明提供了选择结合包括有机化合物和包括药物化合物的小分子的合成蛋白的合适方法。
适当地,本发明的合成蛋白可连接至合适的治疗剂。在这样的情况下,合成蛋白可提供靶向功能,以递送治疗性‘有效负载‘至期望的靶。
通过对于本领域技术人员而言常规的手段进行制备根据本发明药学制剂。制备可施用的组合物的方法,无论用于静脉内或皮下施用或以其他方式施用,是本领域技术人员已知的或显而易见的,并且更详细描述在如Remington:The Science and Practice ofPharmacy,Lippincott Williams and Wilkins;第21修订版(2005年5月1日)的这样出版物中。
‘合成蛋白‘指自然中未发现并且已经通过重组技术形成的蛋白质。
术语‘蛋白质‘一般与‘肽‘或‘多肽‘可互换使用,其意思是通过肽基键连接的至少两个共价结合的氨基酸。术语蛋白质包括纯化的自然产物,或可使用重组或合成技术部分或全部产生的产物。术语蛋白质可指蛋白质的聚集体,比如二聚体或其他多聚体、融合蛋白、蛋白质变体或其衍生物。该术语也包括修饰的蛋白质,例如,通过糖基化、乙酰化、磷酸化、聚乙二醇化(pegylation)、泛素化等修饰的蛋白质。
蛋白质可包含不是由核酸密码子编码的氨基酸。可通过翻译后修饰引入非天然氨基酸,例如通过在具体位置引入半胱氨酸或其他合适的残基,然后在蛋白质纯化之后将其转化成脱氢丙氨酸,然后与适当修饰的非天然氨基酸进行化学反应。可选地,通过经合适的异源tRNA/tRNA合成酶对抑制终止密码子,通常是UAG,非天然氨基酸可在翻译期间在体外或体内掺入到序列中,所述异源tRNA/tRNA合成酶对携带抑制tRNA,所述抑制tRNA具有后来可在UAG密码子的位置处被掺入到蛋白质中的非天然氨基酸。
本发明的蛋白质可以是单个亚单位蛋白质或其中至少一个亚单位包含所述序列的多亚单位蛋白质。
在某些实施方式中,蛋白质可包括两个或更多个如上所阐释的合成蛋白,例如以融合蛋白的形式。在这样的情况下,每个合成蛋白可结合相同的靶或它们可结合不同的靶。结合相同的靶可增加抗体亲抗原性和表观结合亲和力,而结合不同靶的那些可用于开发交联或双识别模块。
‘异源肽‘或‘异源肽序列‘在本发明的背景下指通常不在相关位置,例如在支架蛋白的环区域,出现的肽序列。通常,这样的肽是相对短的,即包含少于30个氨基酸,通常20个或更少。这样的肽可具有基本上任何序列。事实上,期望包含大量的异源肽序列的文库被展示在支架蛋白中。
结合本发明的具体方面、实施方式或实施例描述的特征、整体、特点、化合物、化学部分或基团将被理解为适用于本文所述任何其他方面、实施方式或实施例,除非与其矛盾。本说明书(包括任何伴随的权利要求、摘要和附图)中公开的所有特征,和/或本公开的任何方法或过程的所有的步骤,可以以任何组合结合,但是其中至少一些这样的特征和/或步骤相互排斥的组合除外。本发明不限于任何前述实施方式的细节。本发明延伸至本说明书(包括任何伴随的权利要求、摘要和附图)公开特征的任何新的特征或任何新的组合,或延伸至本公开的任何方法或过程的步骤的任何新的步骤,或任何新的组合。
请阅读者注意在该申请中提到的、并且对公众检索开放的所有文献和文档,并且所有这些文献和文档的内容通过引用并入本文。
本发明的具体实施方式
现参考附图仅仅通过举例方式具体描述本发明的实施方式,其中:
-图1显示源自57个植物半胱氨酸蛋白酶抑制剂氨基酸序列的共有植物半胱氨酸蛋白酶抑制剂PHYTC57。(A)PHYTC57合成基因,显示为与重叠寡核苷酸(P1至P6)一起的双链序列,用于通过递归式PCR产生基因。编码序列也显示为单字母氨基酸代码。显示了两个限制位点SfiI和NotI的位置。(B)基于pHEN1的pDHisII的克隆区域的示意性表示。显示了编码pelB信号序列、六组氨酸(hexhistidine)标签和M13噬菌体PIII蛋白质的N-末端部分的相关区域的位置。M13R和P10的标准M13引物结合位点的位置指示为独特的SfiI和NotI限制位点。
-图2显示缺少残基Asp86的修饰的水稻半胱氨酸蛋白酶抑制剂(OSA-IΔD86)和PHYTC57在不同浓度的植物半胱氨酸蛋白酶抑制剂的木瓜蛋白酶抑制试验的结果的图,显示增强的PHYTC57的效力。
-图3显示固定在NTA传感器芯片上的半胱氨酸蛋白酶抑制剂,和木瓜蛋白酶之间相互作用的表面等离子共振测量。以若干浓度的木瓜蛋白酶进行实验并且使用Biaevaluation3软件包(BIACORE)分析数据,其中将数据整体拟合至Langmuir 1:1结合模型。OSA-IΔD86,修饰的水稻半胱氨酸蛋白酶抑制剂I;CPA,木瓜半胱氨酸蛋白酶抑制剂;CUN,橘子半胱氨酸蛋白酶抑制剂;CEWC,卵清蛋白(chicken egg white)半胱氨酸蛋白酶抑制剂;PHYTC57,共有半胱氨酸蛋白酶抑制剂。
-图4显示(A)OSA-IΔD86(灰色正方形)和PHYTC57(黑色三角形)的热稳定性,显示为在100℃孵育显示的时间之后在25℃测定的残留的酶活性。PHYTC57显示比OSA-IΔD86更大的热稳定性),B)模拟的胃流体处理对OSA-IΔD86(灰色正方形)和PHYTC57(黑色三角形)的抑制特性的作用,显示PHYTC57比OSA-IΔD86在更长的时间段内保持活性。(C)PHYTC57和OSA-IΔD86对用模拟的胃流体进行孵育的稳定性的SDS-PAGE分析。以秒显示孵育时间并且标记物蛋白质(M)的位置以kDa指示在左边,同时指示来自试验的胃蛋白酶的位置和半胱氨酸蛋白酶抑制剂。(D)在模拟的胃流体处理指示的时间(秒)之后使用抗组氨酸标记抗体的PHYTC57的蛋白质印迹分析。以kDa指示标记物蛋白质(M)的位置。
-图5PHYTC57和OSA-IΔD86比较,显示蛋白质PHYTC57和OSA-IΔD86氨基酸之间的不同。(A)蛋白质序列的比对。(B)OSAI的3D结构上从(A)的氨基酸改变的位置的表示,其中标记了残基变化。也显示了结合区域,其中标记了N-末端、QVVAG和PW环。
-图6显示了从文库分离的Adhiron的晶体结构和源自PHYTC57的Adhiron支架的序列。(A)显示Adhiron支架,并且指示了插入的环。(B)Adhiron 81个氨基酸支架的密码子优化的核酸序列和氨基酸序列。突出了环1和环2的α螺旋、β折叠和插入区域。
-图7显示Adhiron支架的生物化学表征和文库的测序。(A)进行差示扫描量热法,以测定Adhiron支架的解链温度(Tm 101℃)。(B)圆二色谱用于检测Adhiron支架和包含环插入物的三个选择的Adhiron蛋白质的结构,并且所有的显示非常高的β结构。(C)Adhiron噬菌体文库用于感染大肠杆菌ER2738细胞。分离96个随机克隆并且测序。图表示环区域中每个氨基酸的百分数。理想的文库包含5.26%的每种氨基酸;半胱氨酸不包含在文库中。
-图8显示通过差示扫描量热法(A)Adhiron支架相比(B)代表性小的可溶性良好表征的蛋白质(small soluble well characterised protein)溶菌酶的稳定性的比较。(C)显示对于选择结合myc抗体的Adhiron,将环添加至支架使Tm降低至85℃,但是这仍代表比大部分支架蛋白更高的解链温度。该Adhiron蛋白质可经受重复循环的变性和复性,如通过一些列扫描所显示。
-图9显示酵母SUMO(ySUMO)的噬菌体ELISA结果。(A)使用分离自第三轮淘选的24个克隆的噬菌体ELISA。在包含ySUMO或对照的孔中孵育通过每个克隆产生的噬菌体。在添加3,3′,5,5′-四甲基联苯胺(TMB)底物后三分钟记录图像。(B)图显示对于ySUMO(阴影)和对照(白色)孔,噬菌体ELISA在560nm的吸光度。
-图10显示对酵母SUMO特异的Adhiron(Ad-ySUMO)的纯化和表征。(A)Ad-ySUMO在BL21细胞中表达,并且细胞溶解产物被加热至50℃、60℃、70℃、80℃、90℃和100℃,达20分钟,并且通过在15,000x g下离心去除沉淀物。对于每个温度,将透明溶解产物的5μl等分试样在15%SDS-PAGE凝胶上分离,并且用考马斯染色,以使蛋白质可视化。(B)用Ni-NTA珠子孵育溶解产物1hr。孵育后溶解产物(5μl)和纯化的Ad-ySUMO(10μl)在15%SDS-PAGE凝胶上进行电泳,并且用考马斯染色,以使其可视化。(C)生物素化的Ad-ySUMOs被用于通过ELISA检测ySUMO(阴影柱)并且不检测人SUMO(白色柱)。(D)使用生物素化的Ad-ySUMO克隆10、15、20和22针对0.5μg酵母SUMO(上图)和与20μg的HEK293细胞溶解产物混合(下图)的蛋白质印迹。
-图11显示在针对一系列靶,即生长因子蛋白质FGF1(A)、细胞表面受体CD31(B)和肽(C),的筛选中鉴定的Adhiron的噬菌体ELISA结果。图表示添加TMB之后,每个孔的吸光度读数。包含靶的孔显示为阴影柱,而对照孔显示为白色柱。
-图12显示HPV16 E5 GFP(靶)和没有Adhiron的表位的HPV16 E5 GFP(对照)的免疫荧光图。Adhiron E5被缀合至量子点并且用于检测哺乳动物细胞中的E5蛋白。细胞用DAPI(DNA染色)、GFP和E5(具有Adhiron-量子点)染色。
-图13显示靶向hSUMO2的Adhiron。(A)测试针对hSUMO2产生的ABP,以通过ELISA测定对hSUMO1和hSUMO2的特异性。hSUMO2 ABP特异性结合hSUMO2,这反映在结合亲和力中。(B)印记显示hSUMO2 ABP抑制RNF4的SUMO-靶向泛素连接酶活性的能力。(C)对照载体或hSUMO2结合剂在细胞中表达,并且使用抗FLAG抗体分析,并且用砷培养,以诱导核体,PML(绿色)。RNF4促进PML的降解。阻断hSUMO2和RNF4之间的相互作用改变PML降解。这是对特异性结合和抑制hSUMO2而不与hSUMO1相互作用的hSUMO2结合蛋白质的首次描述。hSUMO2Adhiron也特异性阻断与其相互作用的结构域,并且不影响hSUMO2的其他功能,如(C)中表示。
-图14显示代表血液凝块形成和裂解浊度试验的图。实线表示正常的形成和裂解。虚线表示五种不同的Adhiron对该过程的作用。该五种不同的Adhiron包含不同的表位并且对凝块形成和裂解具有不同的作用。一些延长凝固时间,一些延长裂解时间,而一些延长凝固和裂解时间。Adhiron中的一种完全抑制凝块形成。这表明不同的Adhiron结合和抑制血纤蛋白原的不同区域,因此,代表研究蛋白质功能的真正新的方式。
-图15显示通过血纤蛋白原结合Adhiron和不结合血纤蛋白原的对照Adhiron的凝块形成之后,FITC标记的血纤蛋白原的共焦图像。这表明Adhiron修饰正常凝结应答的能力。
-图16显示荧光透视图像,其显示功能性Adhiron在哺乳动物细胞中的表达。可见,人SUMO2结合Adhiron改变核磷蛋白PML的降解,导致这些PML核体的增加。
-图17显示FcγRIIIa和结合的Adhiron的共晶体结构。(A)Adhiron结合影响受体结合IgG的别构位点。该位点也已经被鉴定为小分子药物设计的靶,提供了Adhiron可提供关于成药位点的重要信息的证据。(B)也已经发现Adhiron靶向FcγRIIIa上IgG的直接结合位点。Adhiron包含两个环和4个氨基酸非结构化的N末端序列。N末端肽也有助于Adhiron和FcγRIIIa之间的相互作用。通过理解Adhiron和FcγRIIIa之间的结合相互作用获得的信息有助于经生物信息学筛选鉴定小分子。这为将来的药物发现方法提供了有趣的新途径。另外,晶体结构表明了支架呈递可使核心支架的β折叠延伸的环或产生可选的构象相互作用表面的更灵活的环的能力。这通过支架的内在核心稳定性而被促进,这潜在地使得该支架是独特的。
-图18.NMR光谱。(A)ABP支架(浅灰色)和酵母Sumo Adhiron 15(深灰色)的1H-15NHSQC指纹光谱的重叠。(B)酵母SUMO Adhiron 15(深灰色)的1H-15N HSQC指纹光谱和酵母SUMO蛋白质和酵母SUMO-Adhiron 15复合物(浅灰色)的1H-15N TROSY HSQC光谱的重叠。
-图19显示阻抗相对于结合SUMO的Adhiron浓度的改变的图。这提供了Adhiron在基于阻抗的生物传感器设备中的潜在用途的例子,并且显示与表面结合的Adhiron相比抗体具有更大的动力学范围。
-图20至24显示针对一系列靶选择的Adhiron的环1和环2区域的序列比对。该分析允许鉴定针对给定靶的一系列结合剂,并且在一些情况下促进开发潜在的共有结合区域。
-图20显示了结合凝集素样氧化的LDL受体-1(LOX1)的若干Adhiron的环1和环2区域的序列比对。
-图21显示结合人生长激素(HGH)的若干Adhiron的环1和环2区域的序列比对。
-图22显示结合酵母小泛素样调节物(SUMO)的若干Adhiron的环1和环2区域的序列比对。
-图23显示结合青霉素结合蛋白质2a(PBP2a)的若干Adhiron的环1和环2区域的序列比对。
-图24显示结合肽靶的若干Adhiron的环1和环2区域的序列比对。
-A图25显示在针对有机化合物泊沙康唑(posaconazole)的筛选中鉴定的Adhiron的噬菌体ELISA结果。图表示每个孔在添加TMB之后的吸光度读数。包含靶的孔显示为阴影柱,而对照孔显示为白色柱。
-图26是通过血纤蛋白原结合Adhiron,从微摩尔至渺摩尔(attomolar)的各个浓度的血纤蛋白原的基于阻抗的检测的变化的图。这提供了Adhiron在基于阻抗的生物传感器设备中潜在的用途的例子,并且显示与表面结合的Adhiron可在15分钟孵育内检测低浓度的靶蛋白质并且展示大的线性动力学范围。在添加分析物之后(下数据点)和在15分钟孵育之后(上数据点)立即测量在3x10-12微摩尔处的两个数据点。
-图27显示结合生长因子受体结合蛋白质2(Grb2)Src同源2结构域的若干Adhiron的环1和环2区域的序列比对。
-图28显示结合转录3(STAT3)Src同源2结构域的信号转导蛋白和活化剂的若干Adhiron的环1和环2区域的序列比对。
已经叙述了“为了激发对特定蛋白质支架的更大兴趣,有必要证明可产生针对不同种类的相关配体的特异性,衍生的结合蛋白尤其有用,并且它们提供至少一些相对于常规的抗体片段的益处。迄今为止提出的许多蛋白质支架不符合这些标准,并且对于它们的大部分,仅仅描述了初始工程化的努力”(Skerra 2007)。因此,本发明在提供有用的、通用的和有吸引力的蛋白质支架方面具有明确的价值,如下面所表明。
就鉴定归因于新的Adhiron支架和衍生的文库的重要的生物活性结合蛋白质而言,高水平成功大部分是由于核心支架的非常高的稳定性,其提供了高度刚性的框架,在其上可展示可变的环区域。这些环区域具有足够的挠性,以采用一系列构象,因此可与靶分子上宽范围的构象特征相互作用,允许选择针对宽范围分子靶,包括重要的小的有机分子,的结合试剂。该独特支架的这些结构方面产生了用其他支架蛋白还未实现的功能结果。
对于许多应用,尤其与人相关的那些应用,使用基于植物的蛋白也可能是有益处的,因为蛋白质不源自人蛋白质,因此,不牵涉与人蛋白质的自然相互作用。唯一潜在的相互作用是针对半胱氨酸蛋白酶,但是可与这样的蛋白质相互作用的有效结合区域通常在Adhiron支架中被替换或去除。但是,通过例如,食物、化妆品和药用组合物,人不断地接触和耐受源自植物的蛋白质。
示例性支架蛋白(称为PHYTC57)的产生
介绍
蛋白质设计的一致方法开始于蛋白质家族成员的多重序列比对,以得到其中每个位置通常由最经常出现的残基占据的单个共有序列。限定折叠蛋白质的结构、折叠途径和稳定性的残基倾向于是保守的,而通常的生物学功能需要的那些残基,比如酶中的催化残基,或与保守的靶蛋白质相互作用的残基也很可能是保守的。天然蛋白质通常不包含所有的保守共有残基,因为蛋白质仅仅进化成足够稳定,以在体内发挥它们的生物学作用,并且在许多情况下,这可包括一定程度的不稳定,以利于生物过程的转换(turnover)和调节(Steipe,Schiller等1994)。
我们感兴趣的是探索共有方法是否可用于增强植物半胱氨酸蛋白酶抑制剂的抑制特性和稳定性。植物半胱氨酸蛋白酶抑制剂是半胱氨酸蛋白酶的小(~100aa)蛋白质抑制剂(Kondo等1991)。半胱氨酸蛋白酶抑制剂超家族的详细系统发生分析揭示了不同种类的半胱氨酸蛋白酶抑制剂之间的关系(Kordis和Turk 2009)。植物半胱氨酸蛋白酶抑制剂包括参与结合半胱氨酸蛋白酶的三个区域:N-末端区域、QVVAG环和PW环(Margis等1998)。先前,基于结构模型和序列比对,我们产生了水稻半胱氨酸蛋白酶抑制剂,水稻半胱氨酸蛋白酶抑制剂I(OSA-I或OC-I),的变体,其缺少靠近保守的PW环的残基Asp 86,并且命名为OSA-IΔD86。该变体展示了针对木瓜蛋白酶和秀丽隐杆线虫(Caenorhabditis elegans)肠特异性半胱氨酸蛋白酶GCP-1二者的Ki的13倍提高(Urwin等1995;McPherson等1997;Urwin等1997;Urwin等1998;Urwin等2000;Urwin等2001;Urwin等2003;Lilley等2004)。我们然后证明了当在寄生线虫的植物中发育的专用饲养细胞中表达时,OSA-IΔD86和其他半胱氨酸蛋白酶抑制剂赋予的针对植物线虫的良好水平的转基因抗性(Urwin等1995;McPherson等1997;Urwin等1997;Urwin等1998;Urwin等2000;Urwin等2001;Urwin等2003;Lilley等2004)。
本文我们基于57个植物半胱氨酸蛋白酶抑制剂的氨基酸序列的多重序列比对,描述了共有植物半胱氨酸蛋白酶抑制剂的设计、构建和表征。我们显示该共有植物半胱氨酸蛋白酶抑制剂显示对半胱氨酸蛋白酶木瓜蛋白酶的有效抑制和在热稳定性和可消化性试验中显示增强的稳定性。
材料和方法
下文称为PHYTC57的共有植物半胱氨酸蛋白酶抑制剂的设计
根据GenBank数据库的tBLAST搜索,使用CLUSTALW(http://clustalw.genome.ad.jp/;BLOSUM62;缺口开放罚分=12;缺口延伸罚分=2),进行植物半胱氨酸蛋白酶抑制剂序列的多重比对,同时使用程序CINEMA(http://www.bioinf.manchester.ac.uk/dbbrowser/CINEMA2.1/)(Parry-Smith等1998;Lord等2002)进一步进行人工比对。确定在每个位置最常用的氨基酸,并且平截可变N-和C-末端,以产生长度为95个氨基酸的共有蛋白质。设计合成编码区域,以编码共有植物半胱氨酸蛋白酶抑制剂(phytc57),其中针对在大肠杆菌中表达通过使用合适的密码子频率表(http://www.kazusa.or.jp/codon/)优化密码子使用。由六个寡核苷酸(P1–P6;见图1)构建编码区域,每个寡核苷酸的长度约70nt,其包括相邻寡核苷酸之间至少10nt重叠的区域。侧翼寡核苷酸P1和P6还分别包含SfiI位点和NotI位点,用于克隆至载体pDHisII,其中编码序列融合至载体衍生的pelB信号序列编码区域。通过将PELB/PHYTC57蛋白质的N-末端序列提交至自动信号序列预测程序Signal P(Bendtsen等2004);http://www.cbs.dtu.dk/services/SignalP/),检查信号肽酶切割位点的保留。寡核苷酸对(P1+P2)、(P3+P4)和(P5+P6)被退火并且通过自引发转变成双链片段。反应物(10μl)包含25皮摩尔(pmole)的每种引物、0.2mM的每种dNTP、1x Pwo缓冲液(10mM Tris-HCl pH 8.85、25mM KCl、5mM(NH4)2SO4、2mM MgSO4)和5单位Pwo DNA聚合酶(Boehringher)并且进行95℃,2min,25℃,4min,然后72℃,5min,的一个循环。以相同的方式进行随后的产物(P1/P2)与(P3/P4)的连接以及然后(P1/P2/P3/P4)与(P5/P6)的连接,以产生全长产物。5μL等分试样的终反应物在50μL PCR中被用作模板,与50皮摩尔的每种侧翼引物P1和P6、0.2mM的每种dNTP、1x Pwo缓冲液和5单位Pwo一起。反应进行95℃,1min,然后30个循环的95℃,30sec,55℃,30sec和72℃,30sec。用SfiI和NotI消化产物,从琼脂糖凝胶回收并且克隆至SfiI和NotI限制性pDHisII中。对新构建的基因区域测序,以确认正确的引物组装和预期的DNA序列。共有编码区域的序列显示在图1A中。
其他植物半胱氨酸蛋白酶抑制剂基因的合成
类似地为来自水稻(稻(Oryza sativaI)I;osa-IΔD86,oc-I GenBank登录号U54702的修饰形式,其缺少Asp 86的密码子(Urwin等1995)、温州蜜柑(温州蜜柑(Citrusunshiu);cun,GenBank登录号C95263)和木瓜(番木瓜(Carcia papaya);cpa,GenBank登录号X71124(Song等1995)的植物半胱氨酸蛋白酶抑制剂设计、构建和克隆针对大肠杆菌表达优化的合成DNA序列。使用下述分别引入SfiI位点和NotI位点(加下划线的)的基因特异性引物,从pQE30衍生的重组质粒扩增卵清蛋白半胱氨酸蛋白酶抑制剂基因(cewc)序列:
cewcF 5‘ATTAGCGGCCCAGCCGGCCATGGCCAGCGAGGACCGCTCCCGGC3‘(SEQ ID NO 10)
cewcR 5‘CGCTGTACTTGCGGCCGCCCTGGCACTTGCTTTCCAGC3‘(SEQ ID NO 11)。
用50皮摩尔的每种引物、终浓度为0.2mM的每种dNTP(Promega)和约10ng模板在包含1x SuperTaq缓冲液(10mM Tris-HCl pH 9.0,1.5mM MgCl2,50mM KCl,0.1%(v/v)Triton X-100)的50μl体积中进行PCR反应。为了确保PCR期间高保真度扩增,使用10:1的SuperTaq(HT Biotechnology):Pfu(Boehringer Mannheim)DNA聚合酶的混合物,其中每个反应使用1单位的聚合酶混合物。反应进行1个循环的95℃,1min,然后进行20个循环的95℃,30sec,55℃,30sec和72℃,30sec。72℃,30sec的终步骤用于确保所有的产物是全长的。
pDHisII构建
随着基因III融合,植物半胱氨酸蛋白酶抑制剂编码区域被初始克隆至修饰形式的噬菌粒载体pHEN1(Hoogenboom等1991)中。通过添加六组氨酸区域修饰pHEN载体,所述六组氨酸区域由被磷酸化并且退火以产生具有合适的单链末端用于连接NotI切割载体的连接体的互补的寡核苷酸编码。寡核苷酸序列是:
HisF:5‘-GGCCGCAGAGGATCGCATCACCATCACCATCACGG-3‘(SEQ ID NO 12)
HisR:5‘-GGCCCCGTGATGGTGATGGTGATGCGATCCTCTGC-3‘(SEQ ID NO13)
并且NotI互补性末端是加下划线的。
用NotI消化pHEN1载体并且使用5单位的虾碱性磷酸酶(NEB)在包含100mM NaCl、50mM Tris-HCl(pH 7.9)、10mM MgCl2和1mM DTT的50μl反应物中,在37℃,去磷酸化30分钟,然后加热至65℃,15min。使用下述引物通过PCR诱变破坏末端NotI位点
XhoF:5‘ATCACGCTCGAGCAGAACAAAAACTCATCTCAG3‘(SEQ ID NO 14)
XhoR:5‘TGTTCTGCTCGAGCGTGATGGTGATGGTGATGGCG3‘(SEQ ID NO 15)
BamHIR:5‘TGGCCTTGATATTCACAAACG3‘(SEQ ID NO 16)
M13R:5‘AGCGGATAACAATTTCACACAGGA3‘(SEQ ID NO 17)
XhoF引物与BamHIR引物一起使用和XhoR与M13R引物一起,以产生两个片段,其被退火并且在包括引物M13R和BamHIR的第二PCR中扩增。引入的XhoI限制位点是加下划线的。所得产物作为SfiI/BamHI片段被克隆至类似地消化的pHEN1载体中。通过分离的噬菌粒DNA的限制分析筛选XhoI位点的存在,并且通过DNA序列分析确认了阳性克隆pDHisII中的插入片段(图1B)。
半胱氨酸蛋白酶抑制剂在pDHisII中的表达
初始,使用构建体在添加C-末端RGS(H)6和myc标签的载体pDHisII中进行半胱氨酸蛋白酶抑制剂的表达。在大肠杆菌宿主菌株HB2151中的表达研究允许抑制半胱氨酸蛋白酶抑制剂-基因III融合物中的琥珀密码子,使得周质中积聚半胱氨酸蛋白酶抑制剂。培养物(1L)在具有0.1%(v/v)葡萄糖和100μg/mL氨苄青霉素的2 x TY培养基中生长,然后通过IPTG诱导至1mM,并且在30℃生长16小时。将细胞小球在4℃下再悬浮在20mL 50mM Tris pH8,20%(w/v)蔗糖中,并且进行周质制备。向周质部分(fraction)添加1mL Ni-NTA树脂(GEHealthcare),并且,在4℃,在混合下孵育16小时。用1mL等分试样的洗涤缓冲液(50mMNaHPO4、500mM NaCl,pH 6)洗涤树脂8次,然后用包含40mM咪唑的洗涤缓冲液洗涤3次。用包含250mM咪唑的200μL洗涤缓冲液在4℃洗脱半胱氨酸蛋白酶抑制剂1小时,然后用PBS透析。等分蛋白质并且冷冻在液氮中。通过SDS-PAGE电喷射质谱分析样品。
半胱氨酸蛋白酶抑制剂在pET101中的表达
为可溶性蛋白质更有效的表达,将植物半胱氨酸蛋白酶抑制剂基因与来自pDHisII的C-末端6-组氨酸标签一起通过定向TOPO克隆(Invitrogen)亚克隆至pET101中。使用上述条件,将引物
cystaSDFWD 5‘CACCATGAAATCACTATTGCTTACG3‘(SEQ ID NO 18)
cystaSDREV 5‘CTACTAGTGATGGTGATGGTGATGCG3‘(SEQ ID NO 19)
用于PCR扩增来自初始克隆载体pDHisII的植物半胱氨酸蛋白酶抑制剂基因。通过DNA序列分析确认阳性克隆,并且将其引入到BL21(DE3)星状空泡细胞(Star cell)(Invitrogen)中。培养物在30℃下生长并且通过添加IPTG(至1mM)诱导植物半胱氨酸蛋白酶抑制剂的表达16h。通过离心(4,000x g,10min)收获细胞,在冰上超声处理(3x1min),将细胞碎片通过离心(10,000x g,10min)成球。将上清液加载至填充有0.1mM NiCl2的金属螯合柱(Pharmacia)中。在充分洗涤之后,用100mM咪唑洗脱植物半胱氨酸蛋白酶抑制剂,并且充分透析至HBS缓冲液(10mM HEPES pH 7.4,150mM NaCl,0.005%P20),并且在-70℃储存。
木瓜蛋白酶试验
使用pGlu-Phe-Leu-p-NA(Sigma)、用于半胱氨酸蛋白酶的合成底物(Filippova等1984)测定木瓜蛋白酶(Sigma)的抑制。将在50μl的孵育缓冲液(0.15M MES/OH pH 5.8,4mMNaEDTA,4mM DTT)中的100ng的木瓜蛋白酶添加至50μl样品中并且预先孵育30分钟,所述样品没有半胱氨酸蛋白酶抑制剂或包含已知浓度半胱氨酸蛋白酶抑制剂。添加50μl的1mMpGlu-Phe-Leu-p-NA(孵育缓冲液和30%DMSO中)并且通过在25℃,415nm处OD在15min内的线性增加监测木瓜蛋白酶活性。
表面等离子共振(SPR)实验
从Sigma获得作为冻干粉的木瓜蛋白酶。对于SPR实验,通过溶解在包含1mM DTT的HBS缓冲液中制备1mg/ml的贮存液。该贮存液用相同的缓冲液稀释至需要的浓度。所有的SPR实验都在BIACORE 3000仪器上使用NTA传感器芯片进行。电泳缓冲液是HBS-EP(10mMHEPES、0.15M NaCl、0.005%P20,pH 7.4)和所有的实验在25℃进行。将植物半胱氨酸蛋白酶抑制剂固定(约400个应答单位(RU)在流动吸收池(flowcell)2至4上,而流动吸收池1空白。为了监测木瓜蛋白酶与植物半胱氨酸蛋白酶抑制剂的结合,将240μl的HBS缓冲液以80μl/min的流速注入所有的流动吸收池中(结合相),随后正常缓冲液流动3min(解离相),以提供扣除空白(subtraction blank)。用木瓜蛋白酶重复该注入。使用EDTA从传感器芯片剥离蛋白质并且用镍使表面重新带电,接着用不同浓度的木瓜蛋白酶重复实验。对于每个浓度进行至少5个循环,以允许动力学分析。使用Biaevaluation3软件包(BIACORE)并且通过将数据整体拟合至Langmuir 1:1结合模型来分析来自这些结合实验的数据。
植物半胱氨酸蛋白酶抑制剂的热稳定性
以0.5μg蛋白质/mL,在50mM磷酸缓冲液pH 7.4中制备PHYTC57和OSA-IΔD86的等分试样。将样品立即放入沸水浴中。在各个时间取出样品并且投入液氮中,然后在-70℃储存。为了确定功能性半胱氨酸蛋白酶抑制剂的剩余水平,通过木瓜蛋白酶抑制试验测定残留的抑制活性。
可消化性试验
在使用之前即刻如(Astwood等1996)描述地那样制备模拟的胃流体,其在0.03MNaCl中包含0.32%(w/v)胃蛋白酶(Sigma),用浓缩的HCl调整至pH 1.2。在SGF中,37℃,孵育0.2mg/ml终浓度的四个重复的PHYTC57和OSA-IΔD86。以一定的间隔取出200μl等分试样并且立即与75μl 0.2M Na2CO3混合,以结束消化。每个样品分成三个子样品,并且如先前描述(Atkinson等2004),在15%SDS-PAGE凝胶上分离。针对总蛋白质用考马斯蓝对两个凝胶染色,一个显示模拟的胃流体对PHYTC57的作用,第二个比较PHYTC57与OSA-IΔD86的可消化性。第三个凝胶使用小鼠抗体进行蛋白质印迹分析,以用使用碱性磷酸酶活性通过可视化检测PHYTC57的6His-标签(Qiagen)。通过如上阐释的酶试验分析每个时间点的终样品针对木瓜蛋白酶的残留抑制活性。
结果
植物半胱氨酸蛋白酶抑制剂基因的合成
为了设计共有植物半胱氨酸蛋白酶抑制剂编码区域,使用OSA-I(稻;U54702)、ZMA2(玉米(Zea mays);D38130)和HAN1(向日葵(Helianthus annuus);Q10993)蛋白质序列作为搜索探针,进行Genbank数据库的tBLASTN搜索。用于衍生共有序列的序列列表显示在表1中。从数据库通过同源性搜索鉴定序列。表显示每个半胱氨酸蛋白酶抑制剂的系统名以及植物的生物体名和俗名和Genebank登录号。使用程序CLUSTALW翻译和对比编码序列并且使用程序CINEMA展示比对(Parry-Smith等1998;Lord等2002),以允许通过人工比对进行改进。然后通过鉴定在每个位置的最常见的氨基酸得到共有序列(图1A)。共有蛋白质的长度设置为95个氨基酸,其中N-末端在保守的N-末端甘氨酸残基之前四个残基被布置,因此其在第一个β-股(β1)之前。C-末端在保守的PW基序之后15个残基被设置,因此其在最后一个β-股(β5)之后。这些标准基于CEWC(Bode等1988)和人stefin B(Stubbs等1990)的X-射线结构和OSA-I的NMR结构(Nagata等2000)。
表1.用于得到共有(PHYTC57)序列的植物半胱氨酸蛋白酶抑制剂序列。
Figure BDA0003025163170000271
Figure BDA0003025163170000281
Figure BDA0003025163170000291
Figure BDA0003025163170000301
由每个约70nt,设计为如材料和方法中描述的包括相邻寡核苷酸之间的至少10nt重叠的区域的六个寡核苷酸(P1–P6)产生编码PHYTC57的合成基因。为了天然存在的植物半胱氨酸蛋白酶抑制剂的比较研究,我们采用类似的合成基因方法,使用osa-IΔD86、cun(温州蜜柑;柑橘属)和cpa(番木瓜;木瓜)植物半胱氨酸蛋白酶抑制剂编码区域的寡核苷酸,其从合适的蛋白质的独特序列设计,具有密码子改变,以反映大肠杆菌密码子使用。从pQE衍生的质粒PCR扩增卵清蛋白半胱氨酸蛋白酶抑制剂(cewc)编码区域。通过采用SfiI和NotI位点,将基因初始克隆至噬菌体展示载体pDHisII(图1B)。
半胱氨酸蛋白酶抑制剂表达
半胱氨酸蛋白酶抑制剂初始从pDHisII构建体表达并且通过Ni-NTA亲和层析纯化。出人意料地,通过电喷射电离质谱进行的纯化的半胱氨酸蛋白酶抑制剂的分析指示,在每个情况下,存在表达的蛋白质的C-末端平截。表2显示使用Protein Calculator程序(www.scripps.edu/~cdputnam/protcalc.html)计算的全长半胱氨酸蛋白酶抑制剂的和具有16个氨基酸C-末端平截的那些的预期质量以及测定的分子量。显示了蛋白质的C-末端的序列,其中主要平截位点由箭头指示。除了CUN,测定的分子量与已经丢失C-末端16个氨基酸的融合蛋白形式非常一致,但是其保留His标签(表2)。在CUN的情况下,存在小于16个残基的平截,但是其未被进一步表征。为了确保限定的蛋白质序列的表达,因此,将半胱氨酸蛋白酶抑制剂编码区域加His-标签通过PCR和TOPO促进的克隆亚克隆至pET101中,并且在BL21(DE3)星状空泡细胞(Stratagene)中表达。通过添加IPTG至1mM,诱导蛋白质表达,达16小时,并且在天然条件下通过Ni-NTA亲和层析根据它们的C-末端六组氨酸标签纯化半胱氨酸蛋白酶抑制剂。通过SDS-PAGE分开半胱氨酸蛋白酶抑制剂,以检查它们的纯度,其评估为>98%,它们的质量与通过ESI-MS的预期值(数据未显示)高度一致,因此,这些蛋白质用于进一步分析。
表2.从HB2151表达的半胱氨酸蛋白酶抑制剂的电喷射质谱结果。
Figure BDA0003025163170000311
半胱氨酸蛋白酶抑制剂结合活性
使用人工底物pGlu-Phe-Leu-对硝基苯胺(nitroanilide)用木瓜蛋白酶进行的酶试验确认PHYTC57是有效的半胱氨酸蛋白酶抑制剂。未测定Ki值,但是通过PHTYC57和OSA-IΔD86的IC50值(分别为4.6x10-8M和1.8x10-7M),显然PHYTC57是比OSA-IΔD86更有效的抑制剂。为了直接测量半胱氨酸蛋白酶抑制剂和蛋白酶之间的相互作用,我们使用BIAcore表面等离子共振分析测量结合动力学。半胱氨酸蛋白酶抑制剂通过C-末端His-标签被固定在镍涂布的传感器芯片上。然后,使得木瓜蛋白酶结合固定的半胱氨酸蛋白酶抑制剂并且以若干木瓜蛋白酶浓度进行测量。OSA-IΔD86、CPA、CUN、CEWC和PHYTC57与木瓜蛋白酶结合的传感图显示在图3中。将每个浓度的数据拟合至Langmuir 1:1结合模型并且测定动力学常数。数据显示与模型的良好拟合,与已知的1:1化学计量的半胱氨酸蛋白酶的半胱氨酸蛋白酶抑制剂抑制一致。这些半胱氨酸蛋白酶抑制剂的动力学常数的总结显示在表3中。PHYTC57相比测试的天然存在的半胱氨酸蛋白酶抑制剂显示更高的结合和降低的解离动力学,其中平衡常数KD为6.3x10-12M,指示与木瓜蛋白酶的紧密结合复合物。该值比针对卵清蛋白半胱氨酸蛋白酶抑制剂测量的KD值(3.9x10-10M)低两个数量级,比改善的植物半胱氨酸蛋白酶抑制剂OSA-IΔD86(4.7x10-9M)低三个数量级和比植物半胱氨酸蛋白酶抑制剂CUN(1.4x10-8M)和CPA(2x10-8M)低四个数量级。
表3.通过表面等离子共振测定的动力学参数。显示了结合和解离速率常数(Ka和Kd)和平衡常数(KA和KD)。
K<sub>a</sub>(1/M.s) K<sub>d</sub>(1/s) Chi<sup>2</sup> K<sub>A</sub>(1/M) K<sub>D</sub>(M)
OSAIΔD86 2.6x10<sup>5</sup> 1.2x10<sup>3</sup> 0.98 2.1x10<sup>8</sup> 4.7x10<sup>-9</sup>
CUN 2.6x10<sup>5</sup> 3.5x10<sup>3</sup> 2.3 7.3x10<sup>7</sup> 1.4x10<sup>-8</sup>
CPA 2.6x10<sup>5</sup> 5.2x10<sup>3</sup> 3.2 5.0x10<sup>7</sup> 2.0x20<sup>-8</sup>
CEWC 1.3x10<sup>6</sup> 4.9x10<sup>4</sup> 5.3 2.6x10<sup>9</sup> 3.9x10<sup>-10</sup>
PHYTC57 3.5x10<sup>5</sup> 2.2.x10<sup>6</sup> 13.9 1.6x10<sup>11</sup> 6.3x10<sup>-12</sup>
植物半胱氨酸蛋白酶抑制剂稳定性
我们感兴趣的是研究PHYTC57相比良好表征的亲本植物半胱氨酸蛋白酶抑制剂、OSA-IΔD86是否展示更大的稳定性。这些植物半胱氨酸蛋白酶抑制剂的样品在沸水浴中孵育不同的时间,冷冻,然后在木瓜蛋白酶试验中测试残留的抑制活性(图4A)。共有蛋白质PHYTC57显示比OSA-IΔD86(t1/2=6min)更大的热稳定性(t1/2=17min),同时在80min用PHYTC57可仍检测到抑制活性,相比之下,OSA-IΔD86仅仅为58min。
使用模拟的胃流体(SGF)可消化性试验,我们也测试了OSA-IΔD86和PHYTC57的稳定性。蛋白质在新鲜制备的SGF中孵育不同的时间,然后中和反应。然后,以两种方式分析样品,通过酶试验测定残留的抑制活性(图4B)和通过SDS-PAGE(图4C)确定蛋白质是否被消化。并且,在消化研究中观察到PHYTC57增强的稳定性,其中PHYTC57和OSA-IΔD86在酶试验中分别展示260sec和30sec的t1/2值。这些试验数据指示,在孵育之后30和60秒之间,模拟的胃流体中大约99%的OSA-IΔD86被破坏。对于PHYTC57,该钝化水平直到2和5分钟之间才出现,表明PHYTC57更能抵抗消化条件。鉴定全长蛋白质的考马斯染色的SDS-PAGE结果(图4C)支持了这些数据,其中在30sec仅仅存在痕量的OSA-IΔD86,而对于PHYTC57,在120sec仍存在一些蛋白质。为了确认PHYTC57的这些结果,通过蛋白质印迹分析,使用抗6组氨酸标记抗体,,我们分析了SGF消化产物。如图4D中显示,这揭示了通过300sec SGF处理,大部分蛋白质的确被破坏,但是,在300和甚至420sec处理,仍存在痕量的完整PHYTC57。如果PHYTC57用于转基因植物表达,事实是大部分全长PHYTC57蛋白质和所有的抑制活性在SGF中孵育10min之后已经丧失,这意味着PHYTC57应容易在任何偶然的宿主消化之后,在消化过程期间破坏。
讨论
蛋白质设计的共有方法提供了产生自然中不存在的序列的方法。这样的序列应优化同源蛋白质家族的保守的功能序列参数。尤其地,参与家族的结构和折叠的关键残基可能是高度保守的(Lehmann和Wyss 2001;Main等2003a;Main等2003b;Main等2005)(Forrer等2004)(Steipe 2004)。取决于家族中个体成员的生物学作用,功能性残基可能是保守或不保守的。在就半胱氨酸蛋白酶结合和抑制而言显示功能保守的植物半胱氨酸蛋白酶抑制剂的情况下,强化了参与与半胱氨酸蛋白酶活性位点相互作用的高度保守的序列基序。因此,共有方法应产生优化的蛋白质,其中增强了生物学功能、半胱氨酸蛋白酶结合以及一般的稳定性。
植物包含具有与动物半胱氨酸蛋白酶抑制剂和stefins不同特征的一类半胱氨酸蛋白酶抑制剂,并且植物不包含stefins。尤其地,对于动物半胱氨酸蛋白酶抑制剂和stefins,N-末端Gly序列对于抑制半胱氨酸蛋白酶是重要的,但是对于植物半胱氨酸蛋白酶抑制剂不这样[Abe,K.等(1988)J.Biol.Chem 263,7655-7659]。另外,植物半胱氨酸蛋白酶抑制剂包含其他半胱氨酸蛋白酶抑制剂或stefins中没有的典型序列[LVI][AGT][RKE][FY][AS][VI]X[EDQV][HYFQ]N(SEQ ID NO 81)。
通过木瓜蛋白酶进行的固定的半胱氨酸蛋白酶抑制剂的SPR分析揭示,PHYTC57比本文测试的3个亲本植物半胱氨酸蛋白酶抑制剂更有效形成和保持与木瓜蛋白酶的蛋白质:蛋白质相互作用复合物。尤其地,解离速率常数下降,指示一旦结合,PHYTC57:木瓜蛋白酶复合物比通过其他测试的半胱氨酸蛋白酶抑制剂形成的那些复合物更稳定。先前已经报道了源自动物的、包含二硫键的半胱氨酸蛋白酶抑制剂是比表征的植物半胱氨酸蛋白酶抑制剂更有效的半胱氨酸蛋白酶抑制剂,所述表征的植物半胱氨酸蛋白酶抑制剂针对木瓜蛋白酶的效力范围从对于OSA-I的约10nM(Urwin等1995)至对于大豆半胱氨酸蛋白酶抑制剂的pM(Koiwa等2001)。在我们的研究中,我们观察到PHYTC57比动物半胱氨酸蛋白酶抑制剂卵清蛋白半胱氨酸蛋白酶抑制剂更有效结合木瓜蛋白酶。另外,PHYTC57在模拟的可消化性试验中显示增强的热稳定性以及更大的稳定性。
PHYTC57显示增强特性的事实并不意味着其可能不进一步被增强。对包括结合区域的保守基序的增强可代表生物学上的最佳结合序列,但是或许不是最有效的。例如,Koiwa表明大豆半胱氨酸蛋白酶抑制剂的第三环区域的改变增强了所得变体的效力(Koiwa等2001)。已经报道了QVVAG区域中的新的序列赋予增强的抑制活性(Melo等2003)。就在转基因植物系统中的潜在用途而言,稳定性的进一步增强未必有益,因为需要确保转基因产物不在环境中积聚。
我们在这里已经关注PHYTC57相比OSA-IΔD86的相对结合效率。该水稻半胱氨酸蛋白酶抑制剂变体是产生的首个增强的植物半胱氨酸蛋白酶抑制剂,并且已经进行宽范围的研究,导致转基因植物表达和植物线虫抗性试验(Urwin等1995;McPherson等1997;Urwin等1997;Urwin等1998;Urwin等2000;Urwin等2001;Urwin等2003;Lilley等2004)。PHYTC57显示与OSA-IΔD86的34个氨基酸不同。OSA-IΔD86和PHYTC57之间的这些氨基酸差异的位置的比较显示在图5中,其中置换是有色的代码,并且表示在OSA-I的结构模型上(pdb代码1EQK)(Nagata等2000)。差异贯穿于结构支架分散并且包括保守的改变和非保守的改变。有趣的是,6个改变涉及引入带负电的氨基酸。可进行单个亲本半胱氨酸蛋白酶抑制剂分子与共有蛋白质的详细比较生物化学、序列分析和诱变研究,以定义导致增强特性的最关键的“共有”置换,因此增强了我们对蛋白质结构-功能关系的理解。
令人吃惊地,显著增强的PHTC57的稳定性使得我们考虑该小的共有蛋白质作为新支架的可能性。用新结合功能选择的蛋白质支架证明可用于宽范围的应用,如替换抗体(Skerra 2007),包括在医学应用中(Wurch,Pierre等2012)。已经报道了开发半胱氨酸蛋白酶抑制剂作为用于基于人stefin A的肽适体选择的支架的例子(Woodman,Yeh等2005)。最近报道开发了来自15个纤连蛋白或腱生蛋白Fn3样结构域序列的Fn3样共有蛋白质,其被建议作为潜在的支架(Jacobs,Diem等2012)。天然存在的Fn3结构域10是充分研究的支架,由Koide和同事开发(Koide,Bailey等1998;Karatan,Merguerian等2004;Koide,Gilbreth等2007)。由于其增强的热稳定性、小尺寸和没有半胱氨酸,我们预期共有PHYTC57将证明可用作展示变异肽环文库的结合蛋白质支架,用于针对一系列靶分子进行筛选,以鉴定新的人工结合蛋白质。
因此,PHYTC57提供了用于转基因植物抵御方案的潜在益处,因为改进的半胱氨酸蛋白酶抑制剂靶向病原体比如植物线虫,并提供了用于开发作为用于选择新结合功能的支架蛋白的潜在益处。
产生支架蛋白文库,筛选和测试‘Adhiron’的功能
介绍
基于上述57个源自植物的植物半胱氨酸蛋白酶抑制剂的共有序列,本发明人设计了新的人工结合(支架)蛋白(上面称为PHYTC57,但是下面称为‘Adhiron‘)。该人工蛋白质符合成为用于肽呈递的好支架的所有要求(小的、单体、高溶解度和高稳定性并且缺少二硫键和糖基化位点)。我们选择用于肽呈递的Adhiron支架的VVAG和PWE区域,其中在每个环中具有九个随机位置。
基于在大肠杆菌中表达的Adhiron支架的高产率,我们假设两个环中的蛋白质改变对于蛋白质表达水平和支架的稳定性具有可耐受的作用。因此,我们的支架似乎能够用于产生组合文库,用于用噬菌体展示技术进行筛选(Smith 1985)。噬菌体展示系统的成功依赖于主要通过其多样性得到的初始DNA文库的质量。改善的文库多样性可通过使用三核苷酸(三聚物)合成的寡聚核苷酸实现(Kayushin,Korosteleva等1996),其提供理论上对不同氨基酸的相同水平的引入以及避开终止密码子和半胱氨酸(Virnekas,Ge等1994;Krumpe,Schumacher等2007)。此外,三聚物插入或缺失不导致阅读框突变的移动,从而仍产生有效的功能蛋白质。因此,我们已经选择了编码用于环随机化的寡核苷酸的半胱氨酸之外的19个天然存在的氨基酸的三聚物混合物。
我们的工作表明,Adhiron非常可能在产生研究试剂、诊断以及治疗(药物发现)中起关键作用。
Adhiron支架显示非常高的热稳定性(Tm约101℃),高于针对任何其其他非重复支架蛋白所报道的,并且可以高水平在原核表达系统中表达,以可再生地产生重组蛋白。基于随机化的氨基酸序列的插入替换在Adhiron中两个环区域的残基,我们已经构建了噬菌体-展示文库。文库的复杂度是约3x1010,噬菌体产生之后具有大于86%的全长克隆,表明文库的质量非常高。作为文库效力的表示,筛选酵母小泛素样调节物蛋白质(SUMO),以鉴定能够结合该靶蛋白质的人工结合蛋白质(Adhiron)试剂。如通过噬菌体酶联免疫吸附试验(ELISA)评估的,鉴定了结合酵母SUMO(ySUMO)的大于20个单独的Adhiron。DNA测序指示,大部分显示两个环区域之一中与已知的SUMO相互作用基序(Val/Ile-X-Val/Ile-Val/Ile;其中X是任何氨基酸)部分序列同源。将四个Adhiron编码区域亚克隆至载体pET11并且表达、纯化和在ELISA和蛋白质印迹分析中测试重组蛋白。四个Adhiron对于ySUMO具有低纳摩尔亲和力并且显示对ySUMO的高特异性,以低水平结合人SUMO1蛋白质。此外,我们针对许多其他靶筛选Adhiron文库,所述其他靶即成纤维细胞生长因子(FGF1)、血小板内皮细胞粘附分子(PECAM-1)——也称为分化簇31(CD31)、和在N-末端上具有半胱氨酸用于与生物素硫醇连接的10个氨基酸的肽(Cys-Thr-His-Asp-Leu-Tyr-Met-Ile-Met-Arg-Glu),并且也针对这些靶鉴定Adhiron,如通过噬菌体ELISA确认的。因此,我们开发了通用的、高度稳定和良好表达的支架蛋白,称为Adhiron,其能够展示随机化的肽环,并且我们已经表明了从Adhiron文库针对一系列靶选择高度特异性、高亲和性结合试剂用于多种应用的能力。
材料和方法
Adhiron文库的构建
如上述鉴定源自57个植物半胱氨酸蛋白酶抑制剂序列的比对的共有序列并且合成针对在大肠杆菌中表达而设计的密码子修饰的基因(GenScript)。Adhiron支架编码区域和Adhiron文库编码区域被克隆在NheI和NotI限制位点之间,以产生融合编码区域,具有在噬菌粒载体pBSTG1中的噬菌体M13的基因III的3‘一半,所述噬菌粒载体pBSTG1是pDHisII的衍生物,其源自pHEN1(Hoogenboom,Griffiths等1991)并且也包含DsbA信号肽(pBSTG1-DsbA-Adhiron)。通过两个PCR产物的剪切重叠延伸(SOE)构建文库(Horton,Cai等1990)并且由Ella Biotech合成所有的引物。
第一PCR产物从DsbA编码序列延伸至第一插入环并且通过下述引物产生:
正向引物5‘–TCTGGCGTTTTCTGCGTC–3‘(SEQ ID NO 21),
反向引物5‘–CTGTTCTTTCGCTTTAACAAC–3‘(SEQ ID NO 22)。
第二PCR产物通过使用下述引物将两个九氨基酸环区域在环1和环2处引入支架蛋白。用于克隆的PstI位点是加下划线的:
正向环
5‘GTTGTTAAAGCGAAAGAACAGNNNNNNNNNNNNNNNNNNNNNNNNNNNACCATGTACCACTTGACCCTG–3‘(SEQ ID NO 23),
反向环
5‘CTGCGGAACTCCTGCAGTTCTTTGAAGTTNNNNNNNNNNNNNNNNNNNNNNNNNNNCTTAACCCAAACTTTCGCTTCG–3‘(SEQ ID NO 24)。
针对半胱氨酸之外的19个氨基酸的每一个引入作为代表单个密码子的三联体的简并位置(NNN)并且没有终止密码子。也设计引物,以引入NheI(正向)和PstI(反向)限制位点,以利于克隆至包含框内琥珀终止密码子的pBSTG1噬菌粒载体,以允许翻译通读(readthrough),以产生Adhiron-平截的pIII融合蛋白。使用Phusion高保真度聚合酶(NEB)进行PCR,在98℃,进行5分钟,随后进行20个循环:98℃,10sec;56℃,15sec;72℃,15sec,随后72℃,进行5分钟。通过凝胶提取(Qiagen)纯化PCR产物,并且使用上面的方案通过10个循环用于SOEing。用NheI和PstI消化PCR产物并且凝胶提取,然后克隆至也已经用NheI和PstI消化以留下Adhiron的DsbA信号序列和C-末端编码区域的pBSTG1-Adhiron噬菌粒中,以产生基于DNA的Adhiron文库。电穿孔用于将连接的文库产物引入大肠杆菌ER2738电转感受态(electrocompetent)细胞(Lucigen)中。用每50ul的ER2738细胞50ng的文库DNA使总共20ml的ER2738细胞电穿孔。允许在2TY培养基中回收细胞1hr,其然后在2升的2TY培养基中,在37℃,225rpm,生长至OD600为0.6。添加1μl M13KO7辅助噬菌体(NEB)(1014/ml)并且允许以90rpm振荡1hr感染细胞,并且然后允许培养物在25℃下在存在卡那霉素(50μg/ml)的情况下过夜产生噬菌体颗粒。用6%聚乙二醇8000和0.3M NaCl沉淀噬菌体,并且悬浮在50%甘油中用于储存。文库大小经测定为~3x1010,具有仅仅背景的最小载体。
靶制备和噬菌体展示
针对酵母SUMO描述下述方案,但是相同的方案用于筛选或其他靶。使用IPTG诱导,在BL21(DE3)细胞中表达酵母SUMO(ySUMO)蛋白,并且通过Ni-NTA树脂(Qiagen)亲和层析根据制造商的指导进行纯化。通过SDS-PAGE确认纯度。使用EZ-link NHS-SS-生物素(Pierce),根据制造商的指导,将酵母SUMO生物素化。使用缀合至辣根过氧化物酶(HRP)的链霉抗生物素确认生物素化,以检测吸收在Immuno 96 MicrowellTMNunc MaxiSorpTM(Nunc)板上的ySUMO上的生物素。如下进行噬菌体展示文库生物淘选:
包含1012噬菌粒颗粒的5μl的噬菌粒文库混合95μl磷酸缓冲液盐水、0.1%Tween-20(PBST),并且在高结合能力链霉抗生物素包被孔(Pierce)中预淘选三次,总共1小时。将100μl的100nM生物素化的ySUMO添加至淘选孔,达1小时,同时在Heidolph VIBRAMAX 100上以设置3的速度振荡,然后也在振动平台上添加预淘选的噬菌体,达2.5小时。在300μl PBST中使用洗板机(Tecan Hydroflex)洗涤淘选孔10次,并且用100μl的50mM甘氨酸-HCl(pH2.2)洗脱10分钟,用1M Tris-HCL(pH 9.1)中和,并且进一步用100μl的三乙胺100mM洗脱6分钟,并且用50μl的1M Tris-HCl(pH 7)中和。用指数生长的ER2738细胞(OD600=0.6)在37℃和90rpm下孵育洗脱的噬菌体1hr。细胞铺平板在补充100μg/ml羧苄青霉素的Lysogeny肉汤琼脂平板上并且在室温下过夜生长。第二天,将菌落刮入5ml的2TY培养基中并且接种至补充羧苄青霉素(100μg/ml)的25ml的2TY培养基中,以达到OD600为0.2,在37℃、225rpm下孵育1hr并且用约1x109M13K07辅助噬菌体感染。在90rpm下孵育1hr之后,添加卡那霉素至25μg/ml,在25℃、170rpm下孵育细胞过夜,并且用6%聚乙二醇8000、0.3M NaCl沉淀噬菌体,并且再悬浮在1ml的10mM Tris,pH 8.0,1mM EDTA(TE缓冲液)中。2μl的该噬菌体悬液被用于第二轮的选择。这时,使用链霉抗生物素磁珠(Invitrogen)进行噬菌体展示。用10μl的洗涤的珠在Stuart SB2固定速度转子(20rpm)上预淘选噬菌体1hr,并且10μl的珠用100μl的100nM生物素化的ySUMO在相同的转子上标记四小时。在PBST中洗涤酵母SUMO标记的珠三次,然后添加预淘选的噬菌体1hr。在PBST中使用磁铁洗涤珠5次,以在每次洗涤之后将珠与溶液分开,然后如上进行洗脱和扩增。使用中和亲和素(neutravidin)高结合能力板(Pierce)进行终淘选,如先前针对第一轮淘选所描述,但是这次使用100μl 100mM二硫苏糖醇(DTT)在振动平台上洗脱噬菌体20min,然后感染ER2738细胞。从包含靶蛋白质的孔和对照孔回收噬菌体,以测定靶孔中扩增的水平。
噬菌体ELISA
从终淘选挑取单个ER2738菌落并且在100μl的具有100μg/ml羧苄青霉素的2TY中在96深孔板中,37℃(900rpm),生长6hr。将25μl的培养物添加至200μl的包含羧苄青霉素的2TY中并且在37℃(900rpm)生长1hr。添加M13K07辅助噬菌体(10μl的1011/ml),随后添加卡那霉素至25μg/ml,并且细菌在25℃(450rpm)生长过夜。在37℃,用2x酪蛋白封闭缓冲液(Sigma)封闭链霉抗生物素包被的板(Pierce)过夜。第二天用0.4nM的生物素化的酵母SUMO标记板1hr,通过在3000rpm下离心5min收集细菌,并且将包含噬菌体的45μl生长培养基添加至包含生物素化的酵母SUMO的孔或包含生物素化的连接体的孔中,并且孵育1hr。使用Tecan Hydroflex洗板机在300μl PBST中洗涤孔3次,并且添加100μl PBST中1:1000稀释的HRP缀合的抗噬菌体抗体(Seramun),达1hr。在300μl PBST中洗涤孔10次,并且用100μl 3,3′,5,5′-四甲基联苯胺(TMB)液体底物(Seramun)使结合可视化并且在560nm处测量。
Adhiron蛋白生产
通过PCR扩增结合酵母SUMO的Adhiron的DNA编码序列,用NheI和PstI限制消化产物并且克隆至包含Adhiron支架并且用相同限制位点消化的pET11a中。挑取菌落并且在5mlLB培养基中,在37℃、225rpm,生长过夜,并且如minipreps(Qiagen)纯化质粒DNA并且测序,以确认正确插入的存在。通过热休克将质粒转化至BL21(DE3)细胞中,并且菌落在37℃生长过夜。第二天,将培养物添加至400ml的LB培养基中,在250rpm、37℃,生长至OD600为0.6,并且将异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)添加至1mM终浓度。细胞生长另外6hr,通过3000g离心收获,并且再悬浮在25ml的1x Bugbuster(Novagen)中。根据制造商的指导添加核酸酶(Benzonase),并且在室温下混合悬液20分钟,加热至50℃,达20分钟,并且以9400xg离心20分钟。透明的上清液与Ni-NTA树脂500μl的浆料混合1hr,在30ml洗涤缓冲液(50mMPBS、500mM NaCl、20mM咪唑,pH 7.4)中洗涤3次,并且在1ml的洗脱缓冲液(50mM PBS、500mMNaCl、300mM咪唑,pH 7.4)中洗脱。使用NHS SS-生物素(Pierce)根据制造商的指导,将100μg结合SUMO的Adhiron(Ad-ySUMO)生物素化,用于ELISA和蛋白质印迹。
ELISA分析
将PBS中5ng(除非另外指出)靶蛋白吸收至Immuno 96 MicrowellTMNuncMaxiSorpTM板孔上,在4℃过夜。第二天,将200μl的3x封闭缓冲液添加至孔并且在37℃不振荡孵育4小时。100μg/ml的生物素化的结合酵母SUMO的Adhiron在包含2x封闭缓冲液的PBST中被1:1000稀释,并且在靶孔中振荡孵育50μl等分试样1hr。在300μl PBST中洗涤孔3x,并且将缀合至辣根过氧化物酶(HRP)(Invitrogen)、在50μl PBST中1:1000稀释的链霉抗生物素添加至孔1hr。在300μl PBST中洗涤孔6x,并且用50μl TMB液体底物使结合可视化,并且在560nm处测量吸光度。
蛋白质印迹分析
将靶蛋白或与HEK293细胞溶解产物(20μg)混合的靶蛋白与上样缓冲液(Laemmli,60mM Tris-Cl pH 6.8,2%SDS、10%甘油、5%β-巯基乙醇、0.01%溴酚蓝)混合,煮沸3min,在15,000x g离心1min,然后在15%SDS-聚丙烯酰胺凝胶中分解。在4瓦特,将蛋白质转移至PVDF膜45分钟(Amersham Biosciences)并且在封闭缓冲液(PBS 0.1%Tween中的5%BSA)中孵育1hr,随后用Ad-ySUMO(100μg/ml稀释的1:1000PBST)孵育1hr。使用缀合链霉抗生物素的HRP和化学荧光(ECL Plus试剂盒,Amersham)检测结合的Ad-ySUMO。
蛋白质-蛋白质相互作用亲和力测量
BLitzTM(ForteBio)浸渍和读取链霉抗生物素生物传感器(dip and readstreptavidin biosensor)用于根据制造商的指导评估生物素化的Ad-ySUMO结合剂的结合亲和力。简言之,在不同ySUMO浓度(0.25mM–1mM)的至少4个读数用于测量每个Ad-ySUMO的亲和力。整体拟合用于计算每个Ad-ySUMO的亲和力。这些读数与使用Biacore表面等离子共振仪器进行的亲和力测量相当。
结果
Adhiron设计和噬菌体展示
初始设计Adhiron基因,以产生更有效的蛋白酶抑制剂,但是,由于其作为用于呈递针对分子识别的约束的肽区域的支架蛋白的潜能(图6A),我们决定研究其作为这样的支架的用途。基因序列被密码子优化,以增强在大肠杆菌表达系统中的表达(图6B)。引入限制位点,以利于将基因克隆至pBSTG1噬菌粒载体中,以允许琥珀终止密码子的框内翻译通读,以使得当在非抑制剂细胞比如ER2738细胞中表达时产生Adhiron-平截的pIII融合蛋白,但是允许仅仅在抑制剂细胞比如JM83中产生Adhiron。从噬菌粒载体pBSTG1表达AdhironpIII融合蛋白,而使用M13KO7辅助噬菌体引入允许噬菌粒DNA复制和包装至M13噬菌体颗粒中的其他组分。使用抗pIII抗体,通过蛋白质印迹分析,确认Adhiron-pIII融合蛋白的表达。通过差示扫描量热法测试Adhiron支架的热稳定性,其显示的解链温度为101℃(图7A)。使用圆二色谱检查共有序列的结构完整性,其表明高比例的β折叠与α螺旋和随机螺旋(图7B)。
然后,我们通过差示扫描量热法比较Adhiron支架(图8A)与代表性小的可溶性良好表征的蛋白质溶菌酶的热稳定性(图8B),其显示溶菌酶明显比Adhiron更不稳定(Tm约65℃)。我们然后测试了选择结合myc抗体的Adhiron,将环添加至支架使Tm下降至85℃,但是这仍表示比大部分支架蛋白较高的解链温度。该Adhiron蛋白可进行重循环的变性和复性,如通过一系列扫描所显示(图8C)。
文库设计
通过Adhiron结构中预测的环位置指导引入适于分子识别的肽编码序列(图6)。环1位于第一和第二β股之间,环2位于第三和第四β股之间。在两个环位置引入包括九个随机氨基酸(半胱氨酸除外)的序列,分贝置换环1和环2中的四个和三个氨基酸。为了确定这些环区域的延伸是否破坏Adhiron的结构,分离、表达具有环插入物的三个单个Adhiron并且通过圆二色谱检查(图7B)。所有的三个克隆保持高比例的β结构,其中一个克隆展示β结构含量的增加,可能指示β股延伸至新的环区域。这表明环插入不影响支架的结构。我们产生的噬菌体展示文库的复杂度是约3x1010。为了检查氨基酸组成,从用文库感染的ER2738细胞分离96个克隆。我们检测噬菌体克隆的序列,以确定噬菌体产生期间引入的氨基酸组成的任何偏好或其他非期望的结果(图7C)。没有观察到氨基酸分布的偏好。86.5%的克隆是全长变体,而3.1%的克隆是没有插入序列的Adhiron支架,和10.4%的克隆显示框移动,因此可能在文库中没有价值。在噬菌体基因组水平该非常高比例的全长编码序列表明产生的文库的高质量。
文库筛选
初始使用酵母SUMO作为靶进行文库筛选。使酵母SUMO生物素化,以允许经抗生物素蛋白结合蛋白质固定蛋白质,并且确保靶不直接吸附在可能有时导致靶蛋白变性的塑料或粒子表面。这确保靶蛋白质保持其三维结构,允许选择识别线性或构象表位的结合蛋白质。相比对照样品,通过淘选轮三,观察到菌落回收的超过1000倍扩增。分离二十四个克隆,并且通过噬菌体ELISA确定它们结合SUMO靶的能力(图9)。所有测试的克隆显示对酵母SUMO的强结合,与对照孔几乎不结合或不结合,表明Adhiron的特异性。对克隆测序,这鉴定22个不同的Adhiron并且这些克隆中的环区域的序列显示在表4中。
表4.显示从筛选鉴定的24个Ad-ySUMO结合剂的两个环序列。
Figure BDA0003025163170000401
Figure BDA0003025163170000411
克隆4和5相同并且克隆16和22也相同。有趣地,克隆15和23,以及21和22在环1中包含相同的氨基酸序列,但是环2中序列不同。该序列变化进一步支持了文库的复杂特性。序列的分析鉴定了12个克隆中IDLT在环1的1至4位通常存在的序列,指示这可能是结合ySUMO上的至少一个表位的重要基序。而且,在9个不同的克隆中在第二个环的1位出现的P或G,和在其他6个克隆中在2至5残基位置出现的P或G潜在地指示一些结构特征对于结合可能是重要的。有趣地,IDLT基序与MEF2 E3连接酶PIASx的人SUMO1结合位点类似(VDVIDLT–SEQ ID NO 73)(Song,Durrin等2004;Song,Zhang等2005)。选择四个克隆以进一步表征:克隆15和22,因为该环1序列出现大于一次,克隆20,因为其也包含IDLT基序和克隆10,因为其在环1中包含不同的基序。
Adhiron-ySUMO(Ad-YSUMO)蛋白质的表征
由于Adhiron支架的高热稳定性(图7A),我们预期为了帮助纯化,应可能加热变性和沉淀大部分大肠杆菌蛋白质而不影响表达的Adhiron的完整性。为了进行这一测试,我们在50℃、60℃、70℃、80℃、90℃和100℃加热溶解产物20分钟,将其离心使变性的蛋白质成小球,并且通过SDS-PAGE分析上清液(图10A)。加热溶解产物显著降低上清液中细菌蛋白质的量,但是不显著降低Adhiron水平。50℃的温度适合沉淀大部分细菌蛋白质,因此在将来的研究中采用。图9B使用分批金属亲和性纯化方法表明纯化的Ad-ySUMO显示高的纯度,并且,在一些样品比如克隆10中,大部分蛋白质未分离,这可能由于在该纯化中使用的限制量的树脂。表达的蛋白质的评估水平是约100mg/L。通过使用BioLayer Interferometry以及BLitzTM(ForteBio)浸渍和读取生物传感器评估Adhiron的亲和力。对于Ad-ySUMO10、15、20和22,亲和力分别是11.5、2.4、14.2和9.0nM。这些值与通常针对好的抗体看到的亲和力一致。
为了进一步评估Adhiron作为研究试剂的用途,使Ad-ySUMO生物素化并且在ELISA(图10C)和蛋白质印迹分析(图10D)中使用。Ad-ySUMO结合酵母SUMO但是不结合人SUMO1(对SUMO1蛋白质印迹数据未显示)(n=3)。为了确定试剂的特异性,将酵母SUMO与HEK293细胞溶解产物混合。有趣地,Ad-ySUMO10和15显示对酵母SUMO的特异性结合,而不结合其他蛋白质,但是Ad-ySUMO20和22通过蛋白质印迹结合溶解产物中的许多蛋白质(n=3)。
进一步的实例筛选
为了进一步评估Adhiron文库鉴定能够结合一系列靶的特异性试剂的能力,我们针对生长因子(FGF1)、受体(CD31)和肽序列进行筛选。所有的筛选进行三个淘选轮。噬菌体ELISA用于检测Adhiron结合相应靶的能力(图11)。有趣地,大部分针对FGF1和CD31测试的克隆显示特异性结合,而来自肽筛选的仅仅三个克隆显示特异性结合。针对肽的进一步淘选轮增加了标(hit)与背景的比例,以便80%挑取的克隆显示结合靶。该结果并不出人意料,原因是相比更大蛋白质因此潜在多个表位位点,肽的小尺寸和有限可能性的合适的表位呈递。
为了确认表达的Adhiron结合它们的靶,我们已经使用BlitzTM针对CD31和肽靶二者分析三个不同的重组Adhiron。表达Adhiron并且纯化为可溶性蛋白质。CD31 Adhiron的KD值范围是8.5x10-8至6.8x10-9M,而肽的那些范围是3.3x10-8至3.5x10-8
另外,如图25中显示,我们已经鉴定了结合有机分子泊沙康唑的Adhiron。
Adhiron晶体结构
图17显示了与FcgRIIIa受体结构域复合的Adhiron的晶体结构。这揭示了Adhiron的3D结构,显示了4个β股和α螺旋的关键结构元件。从更紧凑的性质角度来看,结构是出人意料的,并且比其他半胱氨酸蛋白酶抑制剂,包括例如stefin A的X-射线结构看到的扭转结构明显更少。有趣的是β结构不同程度地延伸至环区域。
通过两个环与受体蛋白质的密切相互作用,在该结构中突出了展示两个随机化的环对于针对至少一些靶选择结合分子的重要性。这些环对应下面更详细描述的环1和环2。
讨论
基于植物半胱氨酸蛋白酶抑制剂蛋白质的共有设计,我们已经开发了新的支架蛋白,称为Adhiron,并且其显示非常高的热稳定性,Tm为101℃。该支架已经用于通过引入两个9个氨基酸的可变区域产生文库。通过寡核苷酸编码这些可变序列,其中可变位置是包括针对半胱氨酸之外的每个氨基酸的单个密码子的三联体的子集。这导致文库中每个氨基酸非常类似的分布。文库具有非常高的质量,86.5%的克隆代表全长变体克隆。
文库在丝状噬菌体展示形式中被设置为平截的gp3融合物,并且已经针对各种靶蛋白被筛选。通过针对酵母SUMO筛选鉴定的Adhiron的分析揭示了在它们的可变区域中具有不同序列的许多蛋白质。在一些情况下,存在类似性,其暗示结合SUMO上的相同位点,而其他克隆不显示序列保守。所有的克隆均结合ySUMO而不结合一些对照蛋白,表明特异性。我们也已经鉴定了特异性结合生长因子、人FGF1、来自CD31的人受体蛋白质结构域、肽和有机化合物的Adhiron。选择针对有机化合物以及宽范围蛋白质的结合剂的能力是重要的发现,因为大部分支架具有利于具体类型靶分子的结构特征。
Adhiron可方便地通过包括在50℃的温度步骤纯化,其使许多内源大肠杆菌宿主蛋白质变性,因此提高了Adhiron亲和性纯化的效率。结合人FcgRIII受体的Adhiron复合物的X射线结构提供了不仅仅关于复合物而且也关于Adhiron蛋白质的有用信息,并且揭示了更紧凑和主要β结构,其支持了CD数据。支架的紧凑性质,其比在stefins或半胱氨酸蛋白酶抑制剂的其他结构中看到的更显著,很可能归因于其高热稳定性。X射线结构揭示的相互作用界面指示两个环区域都牵涉与受体结构域的相互作用。
基于该高度稳定、小的和容易纯化支架的成功的和高质量文库的证明,结合我们针对一系列蛋白质进行筛选的强大有效的策略,使得我们的Adhiron文库成为用于开发用于宽范围科学、医学和商业应用的试剂的有价值的新资源。
Adhiron的变体
已经产生了Adhiron支架的变体。SEQ ID No1和图6中显示的序列是针对检测的的最短形式的Adhiron,其在添加另外的功能序列比如连接体和His-标签或其他序列之前包括长度为81个的残基。但是,也产生了两个更长的支架蛋白(SEQ ID No 2和3),并且每个在某些情况下可以是优选的。可能地,从支架进行进一步删除或许是可能的,但是认为SEQ IDNo1或其变体接近最佳最小长度而不过度损害支架蛋白的稳定性。
全长‘Adhiron 92‘(92aa)具有下述序列(其由支架序列SEQ ID No 3加上加下划线的连接体和His-标签组成):
ATGVRAVPGN ENSLEIEELA RFAVDEHNKK ENALLEFVRV VKAKEQVVAGTMYYLTLEAKDGGKKKLYEA KVWVKPWENF KELQEFKPVG DAAAAHHHHHH(SEQ ID NO 74)
短‘Adhiron 84‘(84aa)具有下述序列(其由支架序列SEQ ID No 2加上加下划线的连接体和His-标签组成):
GNENSLEIEE LARFAVDEHN KKENALLEFV RVVKAKEQVV AGTMYYLTLEAKDGGKKKLYEAKVWVKPWE NFKELQEFKP VGDA AAAHHHHHH(SEQ ID NO 75)
图6中显示的最短‘Adhiron 81‘(81aa)具有下述序列(其由支架序列SEQ ID No1加上加下划线的连接体和His-标签组成):
NSLEIEELAR FAVDEHNKKE NALLEFVRVV KAKEQVVAGT MYYLTLEAKDGGKKKLYEAKVWVKPWENFK ELQEFKPVGD A AAAHHHHHH(SEQ ID NO 76)
加下划线的序列包括另外3个Ala连接体和6个His检测/纯化标签。该标签不是支架本身的一部分,但是明显对蛋白质是有用的添加。
用于文库的Adhiron的具体例子
可用于制备支架蛋白文库,即其中各种肽已经被插入到支架中的文库,的示例性Adhiron序列如下:
Adhiron 92(显示的序列包括和另外的Met,连接体和标签)
MATGVRAVPGNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDAAAAHHHHHH(SEQ ID NO 77)
可进行或已经进行一个或多个下述修饰:
-在N-末端添加另外的甲硫氨酸残基(粗体),以利于翻译。
-N-末端部分位于氨基酸残基2-4处(粗体和斜体),并且适当地,这3个氨基酸被通常为3至约20个氨基酸的插入序列替换。
-环1位于氨基酸残基47-50处(排除N-末端met进行编号)(粗体和斜体),并且适当地,这4个氨基酸可被通常为4至约20个氨基酸的插入序列替换。5至13个氨基酸的环长度是优选的,并且认为9个氨基酸的环长度是最佳的。
-环2位于氨基酸残基76-78处(排除N-末端met进行编号)(粗体和斜体),并且适当地,这3个氨基酸可被通常为3至约20个氨基酸的插入序列替换。5至13个氨基酸的环长度是优选的,并且认为9个氨基酸的环长度是最佳的。
-存在C-末端连接体和His-标签。连接体的长度和组成可以不同,并且标签当然可被修改以适于任何合适的纯化系统。
Adhiron 84(显示的序列包括和另外的Met、连接体和标签)
MGNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA AAAHHHHHH(SEQ ID NO 77)
可进行或已经进行一个或多个下述修饰:
-另外的甲硫氨酸残基(粗体)已经在N-末端添加,以利于翻译。
-N-末端肽序列可添加至Adhiron的N-末端(即在甲硫氨酸残基和第一甘氨酸之间,如上所显示),并且该添加物可通常为3至约20个氨基酸。
-环1位于氨基酸残基39-42处(排除N-末端met进行编号)(粗体和斜体显示),和适当地,这4个氨基酸可被通常为4至约20个氨基酸的插入序列替换。5至13个氨基酸的环长度是优选的,并且认为9个氨基酸的环长度是最佳的。
-环2位于氨基酸残基68-70处(排除N-末端met进行编号)(粗体和斜体显示),和适当地,这3个氨基酸可被通常为3至约20个氨基酸的插入序列替换。5至13个氨基酸的环长度是优选的,并且认为9个氨基酸的环长度是最佳的。
-存在C-末端连接体和His-标签。连接体的长度和组成可以不同,并且标签当然可被修改以适于任何合适的纯化系统。
Adhiron 81(不包括Met)
MNSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA AAAHHHHHH(SEQ ID NO 78)
可进行或已经进行一个或多个下述修饰:
-另外的甲硫氨酸残基(粗体)已经在N-末端添加,以利于翻译。
-N-末端环可添加至Adhiron的N-末端,并且该添加物可通常是3至约20个氨基酸。
-环1位于氨基酸残基36-39处(排除N-末端met进行编号)(粗体和斜体显示),和适当地,这4个氨基酸可被通常为4至约20个氨基酸的插入序列替换。5至13个氨基酸的环长度是优选的,并且认为9个氨基酸的环长度是最佳的。
-环2位于氨基酸残基65-67处(排除N-末端met进行编号)(粗体和斜体显示),和适当地,这3个氨基酸可被通常为3至约20个氨基酸的插入序列替换。5至13个氨基酸的环长度是优选的,并且认为9个氨基酸的环长度是最佳的。
-存在C-末端连接体和His-标签。连接体的长度和组成可以不同,并且标签当然可被修改以适于任何合适的纯化系统。
因此,以Adhiron 92作为例子,用于在展示系统中使用的尤其合适的支架蛋白可为下述形式:
N-末端肽环1MXXXXXXVRAVPGNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQXXXXXXXXXTM环2连接体和标签YYLTLEAKDGGKKKLYEAKVWVKXXXXXXXXXNFKELQEFKPVGDA AAAHHHHHH
其中X是任何氨基酸。(SEQ ID NO 79)
一般而言,认为环1和环2对于靶结合起到主要的作用,如晶体结构所支持的(图17)。在本发明的某些实施方式中,仅仅环1和环2之一可用肽序列替换,但是一般而言,优选地两个都被替换。尽管不设想N-末端为如环1和2同样重要,但是在许多情况下,在N-末端插入合适的肽可产生改善的结合亲和力和特异性。
图20至24显示了分别结合LOX1、HGH、酵母SUMO、PBP2和肽的若干Adhiron的环1和环2区域的序列比对。
另外,图27和28显示了结合Grb2和STAT3的若干Adhiron的环1和环2区域。
应当注意,肽可任选地被插入环区域中而不移除存在的氨基酸,但是这通常是较不优选的。
Adhiron广泛用途的其他例子
免疫荧光:
实施例–检测病毒蛋白的试剂
尽管许多年重复尝试,还未证明可能产生鉴定人乳头瘤病毒E5蛋白的抗体。(Quantitative measurement of human papillomavirus type 16 E5 oncoproteinlevels in epithelial cell lines by mass spectrometry.Sahab等,J Virol.2012Sep;86(17):9465-73;Wetherill,LF,Ross,R和Macdonald,A(2012).HPV E5:An enigmaticoncoprotein.Small DNA Tumour Viruses.Ed.K.Gaston.Caister Academic Press.pg55-70)
因此,通过针对用作靶——与E5蛋白的区域具有同一性的肽——的HPV16 E5病毒蛋白质产生的Adhiron的例子证明了Adhiron系统的用途。使E5 Adhiron生物素化并且在免疫荧光中使用,以检测过表达的细胞中的E5蛋白。Adhiron不与其他HPV血清型交叉反应。另外,E5 Adhiron已经被缀合至量子点并且用于检测人样品中的E5蛋白。与量子点的缀合增加了试剂的灵敏性。见图12。在哺乳动物细胞中表达HPV16 E5 GFP(靶)和没有Adhiron的表位的HPV16 E5 GFP(对照)。将Adhiron E5缀合至量子点并且用于检测哺乳动物细胞中的E5蛋白。用DAPI(DNA染色)、GFP和E5(具有Adhiron-量子点)使细胞染色。Adhiron仅仅结合靶,显示对E5蛋白的特异性。
抑制和修饰蛋白质-蛋白质相互作用:
实施例1.抑制与SUMO结合的试剂。
还未产生能够特异性和区别地结合人SUMO 2(hSUMO2)的抗体。针对hSUMO2产生Adhiron并且鉴定了特异性结合SUMO2而不是人SUMO1的多个Adhiron。图13显示了hSUMO2Adhiron通过结合hSUMO2和防止RNF4多聚SUMO特异性E3泛素连接酶结合hSUMO2,对蛋白质-蛋白质相互作用具有功能作用。hSUMO2 Adhiron具有该作用,而不影响其他蛋白质的泛素化。在存在ATP的情况下,hSUMO2正常结合造成靶蛋白质泛素化的RNF4(在泳道2中凝胶顶部的成片条带)。在存在增加浓度的Adhiron(泳道3至9)的情况下,泛素化的水平下降。
实施例2.改变血纤蛋白凝结和裂解的试剂。
筛选血纤蛋白原,以鉴定可改变凝块形成和裂解的Adhiron。已经鉴定了许多Adhiron,其改变血浆样品的该过程。图14中显示的图表示凝块形成和裂解浊度试验。黑线表示凝块形成和裂解的正常时间过程。灰色线表示五个不同Adhiron对该过程的作用。对照非血纤蛋白原结合Adhiron对该试验没有作用。Adhiron的作用包括减少凝块形成、增加裂解时间和增加凝固时间。这表明Adhiron通过抑制蛋白质-蛋白质相互作用调节蛋白质功能的能力。图15显示FITC荧光标记的血纤蛋白原在存在血纤蛋白原结合Adhiron和对照Adhiron的情况下,在凝块形成之后的共焦图像。
哺乳动物细胞中Adhiron的表达:
如实施例1中描述,针对人SUMO2产生Adhiron,并且使用pcDNA3.1哺乳动物表达载体在哺乳动物HEK293细胞中表达。Adhiron与FLAG标签和核定位信号融合。用砷(As)处理对照细胞(无Adhiron表达)和表达人SUMO2特异性Adhiron的细胞2hrs,然后洗涤并且允许恢复12和24hr。砷使得前髓细胞性白血病(PML)蛋白质体增加,但是SUMO调节这些体的降解。使用抗FLAG抗体使染色细胞,以鉴定Adhiron,并且用于PML(核体的组织者)。人SUMO2Adhiron改变PML的降解,导致这些体的增加。这表明了在哺乳动物细胞中表达功能性Adhiron的能力。结果显示在图16中。
鉴定蛋白质上成药位点的共结晶和其他结构生物学方法:
图17显示FcgRIIIa(灰色)和结合的Adhiron(白色)的共晶体结构。鉴定了结合FcgRIIIa的Adhiron,然后用于一系列试验,以显示抑制IgG结合,包括基于细胞和SPR的试验。然后使Adhiron共结晶,并且解析(solve)结构(上图)。这鉴定了FcgRIIIa上的成药位点,包括别构位点。Adhiron也适于NMR研究,并且作为例子,图18显示抗酵母SUMO Adhiron和Adhiron-酵母SUMO复合物的1H-15N HSQC光谱。快速收集有关Adhiron的结构数据的能力将具有许多应用,包括鉴定潜在的药物结合位点。
并入电子设备用于开发点护理(point of care)设备:
人SUMO2 Adhiron(实施例1中描述)的编码序列的点定向诱变允许在寡聚组氨酸标签的C-末端引入半胱氨酸。这使得Adhiron定向固定至电子设备表面,以便分子识别环对于分析物是可接近的。当靶蛋白质结合设备上的Adhiron时,可测量阻抗的改变。改变是浓度依赖性的(如图19中所显示),表明Adhiron的有效的呈递和Adhiron有成果地并入电子设备中作为用于生物传感器应用的平台的能力。
对于另一Adhiron,在该情况下是人血纤蛋白原Adhiron,重复该方案。该工作的结果显示在图26。一旦再次观察到浓度依赖性改变,并且这在从渺摩尔至微摩尔浓度范围内得到表明。
已经鉴定了结合一系列靶的Adhiron:
通过使用本文中描述的展示方法,已经将Adhiron文库用于针对宽范围的靶分子进行筛选。表5列举了针对其产生Adhiron的靶的例子;这些包括蛋白质和小分子。针对这些靶产生的Adhiron展示高的亲和力和特异性。这表明Adhiron提供通用支架分子,并且使用该支架构建的文库有效鉴定能够结合宽范围靶分子的人工结合蛋白质。已经从针对一些靶的筛选分离的一些序列的例子显示在图20-24中。我们最近也已经针对由趋磁细菌(magnetotropic bacteria)产生的磁颗粒进行筛选,并且已经鉴定了结合这些多组分生物无机复合物上的表位的Adhiron。
表5–针对其已经成功产生Adhiron的靶
Figure BDA0003025163170000481
Figure BDA0003025163170000491
Figure BDA0003025163170000501
优选的实施方式:
1.一种合成支架蛋白,其具有源自一种或多种植物半胱氨酸蛋白酶抑制剂的序列。
2.项目1所述的合成蛋白,其包含大于一种植物半胱氨酸蛋白酶抑制剂蛋白的共有序列。
3.项目1或3所述的合成蛋白,其包含下述氨基酸序列:NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAK VWVKPWENFKELQEFKPVGDA(SEQ ID NO 1),或其变体。
4.前述项目任一项所述的合成蛋白,其包含下述氨基酸序列:GNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA(SEQ IDNO 2),或其变体。
5.前述项目任一项所述的合成蛋白,其包含下述氨基酸序列:ATGVRAVPGNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA(SEQ ID NO 3),或其变体。
6.项目3至5任一项所述的合成蛋白,其中所述变体的序列分别与相关的SEQ IDNOS 1至SEQ ID NOS 3具有至少50%,更优选地70%的同一性。
7.前述项目任一项所述的合成蛋白,其包含插入其中的至少一个异源肽序列。
8.项目7所述的合成蛋白,其中所述异源肽序列的长度是3至20个氨基酸,更优选地长度是5至13个氨基酸。
9.项目7或8所述的合成蛋白,其中所述异源肽序列被插入所述合成蛋白的环区域中和任选地在所述蛋白的N-末端。
10.项目9所述的合成蛋白,其包含插入所述蛋白中下述位置中的至少一个位置的异源肽:
β-折叠的第一区域和第二区域之间的环(称为环1);和
β-折叠的第三区域和第四区域之间的环(称为环2)。
11.项目10所述的合成蛋白,其中所述异源肽在两个所述位置处被插入。
12.项目7至11任一项所述的合成蛋白,其中β折叠的相邻区域之间的环长度是3至20个氨基酸,更优选地5至13个氨基酸。
13.项目7至12任一项所述的合成蛋白,其包括在所述蛋白的N-末端或附近插入的异源肽。
14.项目3所述的合成蛋白,其中至少一个异源肽在至少一个以下加下划线的位置处被插入到所述蛋白中:
NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA(SEQ ID NO 1)。
15.项目4所述的合成蛋白,其中至少一个异源肽在至少一个以下加下划线的位置处被插入到所述蛋白中:
GNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKP WENFKELQEFKPVGDA(SEQ ID NO 2)。
16.项目5所述的合成蛋白,其中至少一个异源肽在至少一个以下加下划线的位置处被插入到所述蛋白中:
MATGVRAVPGNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQVVAGTMYYLTLEAKDGGKKKLYEAKVWVKPWENFKELQEFKPVGDA(SEQ ID NO 3)。
17.根据项目7所述的合成蛋白,其包含下述序列:
NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQ(Xn)TMYYLTLEAKDGGKKKLYEAKVWVK(Xn)NFKELQEFKPVGDA(SEQ ID NO 4)
其中X是任何氨基酸和n是序列中氨基酸的数量,和
其中n优选地是3至30,更优选地4至20,和仍更优选地4至15。
18.项目17所述的合成蛋白,其包含下述序列:
NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQ(X5-13)TMYYLTLEAKDGGKKKLYEAKVWVK(X5-13)NFKELQEFKPVGDA(SEQ ID NO 5)。
19.项目18所述的合成蛋白,其包含下述序列:
NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQ(X9)TMYYLTLEAKDGGKKKLYEAKVWVK(X9)NFKELQEFKPVGDA(SEQ ID NO 6)。
20.项目17至19任一项所述的合成蛋白,其在N-末端或附近包含另外的氨基酸序列。
21.项目20所述的合成蛋白,其中在N-末端处的所述另外的氨基酸序列包括序列MATGVRAVPGNE(SEQ ID NO 80)。
22.项目20所述的合成蛋白,其中在N-末端处的所述另外的氨基酸序列包括另外的的异源肽序列。
23.前述项目任一项所述的合成蛋白,其解链温度(Tm)为至少90℃,更优选地至少95℃,和最优选地至少100℃。
24.前述项目任一项所述的合成蛋白,其具有插入其中的至少一个异源肽,和其Tm为60℃或更高,更优选地70℃或更高,和尤其80℃或更高。
25.前述项目任一项所述的合成蛋白,其包含连接体或标签。
26.前述项目任一项所述的合成蛋白,其连接至基底或部分。
27.项目26所述的合成蛋白,其中所述部分是标记、载体或蛋白质。
28.项目26或27所述的合成蛋白,其中所述部分、基底、连接体或标签彼此连接或连接于蛋白质的C-和/或N-末端二者。
29.前述项目任一项所述的合成蛋白,其是融合蛋白。
30.包含根据项目1至29任一项所述合成蛋白的群体的文库,其中所述群体的成员包括具有不同序列的各种异源肽。
31.项目30所述的文库,其复杂性为108或更高,更优选地109或更高,和最优选地1010或更高。
32.项目30或31所述的文库,其包含本发明的合成蛋白群体,所述合成蛋白适应在适于生物淘选的展示系统中展示。
33.一种多核苷酸,其编码根据项目1至29任一项所述的合成蛋白。
34.根据项目33所述的多核苷酸,其包含编码具有根据SEQ ID NO 1、SEQ ID NO2、SEQ ID NO 3、SEQ ID NO 4、SEQ ID NO 5或SEQ ID NO 6的序列的蛋白质或其变体的序列。
35.根据项目34所述的多核苷酸,其包含下述序列之一,或与其具有至少50%同一性的序列:
aacgctctgctggaattcgttcgtgttgttaaagctaaagaacaggttgttgctggtaccatgtactacctgaccctggaagctaaagacggtggtaaaaagaaactgtacgaagctaaagtttgggttaaaccgtgggaaaacttcaaagaactgcaggagttcaaaccggttggtgacgct(SEQ ID NO 8);
ggtaacgaaaactccctggaaatcgaagaactggctcgtttcgctgttgacgaacacaacaaaaaagaaaacgctctgctggaattcgttcgtgttgttaaagctaaagaacaggttgttgctggtaccatgtactacctgaccctggaagctaaagacggtggtaaaaagaaactgtacgaagctaaagtttgggttaaaccgtgggaaaacttcaaagaactgcaggagttcaaaccggttggtgacgct(SEQ ID NO 9);和
gctaccggtgttcgtgcagttccgggtaacgaaaactccctggaaatcgaagaactggctcgtttcgctgttgacgaacacaacaaaaaagaaaacgctctgctggaattcgttcgtgttgttaaagctaaagaacaggttgttgctggtaccatgtactacctgaccctggaagctaaagacggtggtaaaaagaaactgtacgaagctaaagtttgggttaaaccgtgggaaaacttcaaagaactgcaggagttcaaaccggttggtgacgct(SEQ ID NO 10)。
36.根据项目33至35任一项所述的多核苷酸,其除了所述合成蛋白的编码序列还包含另外的编码或非编码序列。
37.项目36所述的多核苷酸,其中所述另外的编码或非编码序列是编码异源肽的序列、编码前导序列的序列、编码融合蛋白部分的序列、编码连接体的序列、编码标记物的序列、编码纯化标签的序列、编码标记物的序列、启动子序列或增强子序列。
38.重组载体,其包含根据项目33至37任一项所述的多核苷酸,所述多核苷酸适于在宿主细胞中表达。
39.根据项目38所述的载体,其包含可操作地连接至编码所述合成蛋白的核酸序列的表达控制序列,以控制所述合成蛋白的表达。
40.适于表达根据项目1至29任一项所述蛋白的细胞。
41.根据项目40所述的细胞,包含根据项目33至37任一项所述的多核苷酸或根据项目39所述的载体。
42.细胞培养物,其包含根据项目40或41所述的细胞。
43.筛选结合靶的合成蛋白的方法,所述方法包括:
a)提供根据项目30至32任一项所述的文库;
b)将所述文库暴露于靶;和
c)选择结合所述靶的合成支架蛋白。
44.项目43所述的方法,其中所述靶是蛋白质/肽、核酸或小分子。
45.项目43或44所述的方法,其使用展示系统。
46.项目43至45任一项所述的方法,其是噬菌体展示的方法。
47.项目46所述的方法,其中所述合成蛋白包括将所述合成蛋白与噬菌体外壳蛋白融合,从而支架蛋白展示在病毒粒子的表面上。
48.合成支架蛋白,其适于结合通过根据项目43至47任一项所述的方法获得的感兴趣的靶。
49.根据项目1至29任一项所述的合成蛋白,或编码这样的合成蛋白的核酸在研究中的用途。
50.根据项目1至29任一项所述的合成蛋白,或编码这样的合成蛋白的核酸在环境和安全性监测或合成生物学中的用途。
51.根据项目1至29任一项所述的合成蛋白,或编码这样的合成蛋白的核酸在靶检测中的用途。
52.根据项目1至29任一项所述的合成蛋白,或编码这样的合成蛋白的核酸在治疗或诊断中的用途。
53.一种药学制品,其包含根据项目1至29任一项所述的合成蛋白,和任选地,药学上可接受的载体或赋形剂。
54.一种验证药物靶或鉴定靶蛋白上成药结构域的方法,其使用根据项目1至29任一项所述的合成蛋白。
参考文献
Astwood,J.D.,J.N.Leach等(1996)."Stability of food allergens todigestion in vitro."Nature Biotechnology 14(10):1269-1273.
Atkinson,H.J.,K.A.Johnston等(2004)."Prima facie evidence that aphytocystatin for transgenic plant resistance to nematodes is not a toxicrisk in the human diet."Journal of Nutrition 134(2):431-434.
Bendtsen,J.D.,H.Nielsen等(2004)."Improved prediction of signalpeptides:SignalP 3.0."Journal of Molecular Biology 340(4):783-795.
Binz,H.K.,M.T.Stumpp等(2003)."Designing Repeat Proteins:Well-expressed,Soluble and Stable Proteins from Combinatorial Libraries ofConsensus Ankyrin Repeat Proteins."Journal of Molecular Biology 332(2):489-503.
Bode,W.,R.Engh等(1988)."The 2.0a X-Ray Crystal-Structure of ChickenEgg-White Cystatin and Its Possible Mode of Interaction With CysteineProteinases."Embo Journal 7(8):2593-2599.
Carter,P.J.(2011)."Introduction to current and future proteintherapeutics:A protein engineering perspective."Experimental Cell Research317(9):1261-1269.
Dai,M.H.,H.E.Fisher等(2007)."The creation of a novel fluorescentprotein by guided consensus engineering."Protein Engineering Design & Selection 20(2):69-79.
Deboer,H.A.,L.J.Comstock等(1983)."THE TAC PROMOTER-A FUNCTIONALHYBRID DERIVED FROM THE TRP AND LAC PROMOTERS."Proceedings of the National Academy of Sciences of the United States of America-Biological Sciences 80(1):21-25.
Filippova,I.Y.,E.N.Lysogorskaya等(1984)."L-Pyroglutamyl-L-Phenylalanyl-L-Leucine-Para-Nitroanilide-a Chromogenic Substrate for ThiolProteinase Assay."Analytical Biochemistry 143(2):293-297.
FitzGerald,K.(2000)."In vitro display technologies-new tools for drugdiscovery."Drug Discovery Today 5(6):253-258.
Forrer,P.,H.K.Binz等(2004)."Consensus design of repeat proteins."ChemBioChem 5:183-189.
Forrer,P.,H.K.Binz等(2004)."Consensus Design of Repeat Proteins."ChemBioChem 5(2):183-189.
Gebauer,M.和A.Skerra(2009)."Engineered protein scaffolds as next-generation antibody therapeutics."Current Opinion in Chemical Biology 13(3):245-255.
Grebien,F.,O.Hantschel等(2011)."Targeting the SH2-Kinase Interface inBcr-Abl Inhibits Leukemogenesis."Cell 147(2):306-319.
Ho,M.和I.Pastan(2009).Mammalian Cell Display for AntibodyEngineering.Methods in Molecular Biology.A.S.Dimitrov.525:337-352.
Hoffmann,T.,L.K.Stadler等(2010)."Structure-function studies of anengineered scaffold protein derived from stefin A.I:Development of the SQMvariant."Protein Eng Des Sel 23(5):403-413.
Hoogenboom,H.R.,A.D.Griffiths等(1991)."Multisubunit Proteins on theSurface of Filamentous Phage-Methodologies for Displaying Antibody(Fab)Heavyand Light-Chains."Nucleic Acids Research 19(15):4133-4137.
Horton,R.,Z.Cai等(1990)."Gene splicing by overlap extension:tailor-made genes using the polymerase chain reaction."Biotechniques 8:528-535.
Hutchison,C.A.,S.Phillips等(1978)."Mutagenesis at a specific positionin a DNA sequence."Journal of Biological Chemistry 253(18):6551-6560.
Jacobs,S.A.,M.D.Diem等(2012)."Design of novel FN3 domains with highstability by a consensus sequence approach."Protein Engineering Design & Selection25(3):107-117.
Jacobs,S.A.,M.D.Diem等(2012)."Design of novel FN3 domains with highstability by a consensus sequence approach."Protein Eng Des Sel 25(3):107-117.
Jaeckel,C.,J.D.Bloom等(2010)."Consensus Protein Design withoutPhylogenetic Bias."Journal of Molecular Biology 399(4):541-546.
Karatan,E.,M.Merguerian等(2004)."Molecular recognition properties ofFN3monobodies that bind the Src SH3 domain."Chemistry&Biology 11(6):835-844.
Kayushin,A.,M.Korosteleva等(1996)."A convenient approach to thesynthesis of trinucleotide phosphoramidites-synthons for the generation ofoligonucleotide/peptide libraries."Nucleic Acids Res 24:3748-3755.
Knappik,A.,L.Ge等(2000)."Fully synthetic human combinatorial antibodylibraries(HuCAL)based on modular consensus frameworks and CDRs randomizedwith trinucleotides."Journal of Molecular Biology 296(1):57-86.
Kohler,G.and C.Milstein(1975)."Continuous cultures of fused cellssecreting antibody of predefined specificity."Nature 256(5517):495-497.
Koide,A.,C.W.Bailey等(1998)."The fibronectin type III domain as ascaffold for novel binding proteins."Journal of Molecular Biology 284(4):1141-1151.
Koide,A.,C.W.Bailey等(1998)."The fibronectin type III domain as ascaffold for novel binding proteins."Journal of Molecular Biology 284(4):1141-1151.
Koide,A.,R.N.Gilbreth等(2007)."High-affinity single-domain bindingproteins with a binary-code interface."Proceedings of the National Academy of Sciences of the United States of America 104(16):6632-6637.
Koiwa,H.,M.P.D'Urzo等(2001)."Phage display selection of hairpin loopsoyacystatin variants that mediate high affinity inhibition of a cysteineproteinase."Plant Journal 27(5):383-391.
Komor,R.S.,P.A.Romero等(2012)."Highly thermostable fungalcellobiohydrolase I(Cel7A)engineered using predictive methods."Protein engineering,design&selection:PEDS 25(12):827-833.
Komor,R.S.,P.A.Romero等(2012)."Highly thermostable fungalcellobiohydrolase I(Cel7A)engineered using predictive methods."Protein Engineering Design and Selection 25(12):827-833.
Kondo,H.,K.Abe等(1991)."Gene Organization of Oryzacystatin-Ii,a NewCystatin Superfamily Member of Plant-Origin,Is Closely Related to That ofOryzacystatin-I But Different From Those of Animal Cystatins."Febs Letters278(1):87-90.
Kordis,D.和V.Turk(2009)."Phylogenomic analysis of the cystatinsuperfamily in eukaryotes and prokaryotes."Bmc Evolutionary Biology 9.
Krumpe,L.,K.Schumacher等(2007)."Trinucleotide cassettes increasediversity of T7 phage-displayed peptide library."BMC Biotechnology 7(1):65.
Lee,S.-C.,K.Park等(2012)."Design of a binding scaffold based onvariable lymphocyte receptors of jawless vertebrates by module engineering."Proceedings of the National Academy of Sciences 109(9):3299-3304.
Lehmann,M.,C.Loch等(2002)."The consensus concept for thermostabilityengineering of proteins:further proof of concept."Protein Engineering 15(5):403-411.
Lehmann,M.,R.Lopez-Ulibarri等(2000)."Exchanging the active sitebetween phytases for altering the functional properties of the enzyme."9(10):1866-1872.
Lehmann,M.和M.Wyss(2001)."Engineering proteins for thermostability:the use of sequence alignments versus rational design and directedevolution."Current Opinion in Biotechnology 12(4):371-375.
Lilley,C.J.,P.E.Urwin等(2004)."Preferential expression of a plantcystatin at nematode feeding sites confers resistance to Meloidogyneincognita and Globodera pallida."Plant Biotechnology Journal 2(1):3-12.
Lofblom,J.(2011)."Bacterial display in combinatorial proteinengineering."Biotechnology Journal 6(9):1115-1129.
Lord,P.W.,J.N.Selley等(2002)."CINEMA-MX:a modular multiple alignmenteditor."Bioinformatics 18(10):1402-1403.
Main,E.R.G.,S.E.Jackson等(2003)."The folding and design of repeatproteins:reaching a consensus."Current Opinion in Structural Biology 13(4):482-489.
Main,E.R.G.,A.R.Lowe等(2005)."A recurring theme in proteinengineering:the design,stability and folding of repeat proteins."Current Opinion in Structural Biology 15(4):464-471.
Main,E.R.G.,Y.Xiong等(2003)."Design of stable alpha-helical arraysfrom an idealized TPR motif."Structure 11(5):497-508.
Makela,A.R.和C.Oker-Blom(2008)."The baculovirus display technology-Anevolving instrument for molecular screening and drug delivery."Combinatorial Chemistry&High Throughput Screening 11(2):86-98.
Margis,R.,E.M.Reis等(1998)."Structural and phylogenetic relationshipsamong plant and animal cystatins."Archives of Biochemistry and Biophysics 359(1):24-30.
McPherson,M.J.,P.E.Urwin等(1997).Engineering plant nematoderesistance by an anti-feedant approach.Cellular and Molecular Basis for Plant-Nematode Interactions.C.Fenoll,S.Ohl and F.Grundler.The Netherlands,Kluwer:237-249.
Melo,F.R.,M.O.Mello等(2003)."Use of phage display to select novelcystatins specific for Acanthoscelides obtectus cysteine proteinases."Biochimica Et Biophysica Acta-Proteins and Proteomics 1651(1-2):146-152.
Mosavi,L.K.,T.J.Cammett等(2004)."The ankyrin repeat as moleculararchitecture for protein recognition."Protein Science 13(6):1435-1448.
Mosavi,L.K.,D.L.Minor等(2002)."Consensus-derived structuraldeterminants of the ankyrin repeat motif."Proceedings of the National Academy of Sciences 99(25):16029-16034.
Mullis,K.,F.Faloona等(1986)."Specific enzymatic amplification of DNAin vitro:the polymerase chain reaction."Cold Spring Harb Symp Quant Biol 51Pt 1:263-273.
Nagata,K.,N.Kudo等(2000)."Three-dimensional solution structure oforyzacystatin-I,a cysteine proteinase inhibitor of the rice,Oryza sativaL.japonica."Biochemistry 39(48):14753-14760.
Nixon AE,W.C.(2006)."Engineered protein inhibitors of proteases."Curr Opin Drug Discov Devel 9(2):261-268.
Nord,K.,J.Nilsson等(1995)."A combinatorial library of anα-helicalbacterial receptor domain."Protein Engineering 8(6):601-608.
Odegrip,R.,D.Coomber等(2004)."CIS display:In vitro selection ofpeptides from libraries of protein-DNA complexes."Proceedings of the National Academy of Sciences of the United States of America 101(9):2806-2810.
Parizek,P.,L.Kummer等(2012)."Designed Ankyrin Repeat Proteins(DARPins)as Novel Isoform-Specific Intracellular Inhibitors of c-Jun N-Terminal Kinases."ACS Chemical Biology 7(8):1356-1366.
Parmeggiani,F.,R.Pellarin等(2008)."Designed armadillo repeat proteinsas general peptide-binding scaffolds:Consensus design and computationaloptimization of the hydrophobic core."Journal of Molecular Biology 376(5):1282-1304.
Parry-Smith,D.J.,A.W.R.Payne等(1998)."CINEMA-a novel colourinteractive editor for multiple alignments(Reprinted from Gene,vol 221,pgGC57-GC63,1998)."Gene 221(1):GC57-GC63.
Polizzi,K.M.,J.F.Chaparro-Riggers等(2006)."Structure-guided consensusapproach to create a more thermostable penicillin G acylase."Biotechnology Journal 1(5):531-536.
Reichert,J.M.(2010)."Antibodies to watch in 2010."MAbs.2(1):84-100.
Saiki RK,S.S.,Faloona F,Mullis KB,Horn GT,Erlich HA,Arnheim N.(1985)."Enzymatic amplification of beta-globin genomic sequences andrestriction site analysis for diagnosis of sickle cell anemia."Science 230(4732):1350-1354.
Schlehuber,S.和A.Skerra(2005)."Anticalins as an alternative toantibody technology."Expert Opinion on Biological Therapy 5(11):1453-1462.
Skerra,A.(2007)."Alternative non-antibody scaffolds for molecularrecognition."Current Opinion in Biotechnology 18:295-304.
Smith,G.(1985)."Filamentous fusion phage:novel expression vectorsthat display cloned antigens on the virion surface."Science 228(4705):1315- 1317.
Song,I.,M.Taylor等(1995)."Inhibition of Cysteine Proteinases ByCarica-Papaya Cystatin Produced in Escherichia-Coli."Gene 162(2):221-224.
Song,J.,L.K.Durrin等(2004)."Identification of a SUMO-binding motifthat recognizes SUMO-modified proteins."Proc Natl Acad Sci U S A 101(40):14373-14378.
Song,J.,Z.Zhang等(2005)."Small ubiquitin-like modifier(SUMO)recognition of a SUMO binding motif:a reversal of the bound orientation."J Biol Chem 280(48):40122-40129.
Stadler,L.K.,T.Hoffmann等(2011)."Structure-function studies of anengineered scaffold protein derived from Stefin A.II:Development andapplications of the SQT variant."Protein Eng Des Sel 24(9):751-763.
Steipe,B.(2004)."Consensus-based engineering of protein stability:From intrabodies to thermostable enzymes."Protein Engineering 388:176-186.
Steipe,B.,B.Schiller等(1994)."Sequence Statistics Reliably PredictStabilizing Mutations in a Protein Domain."Journal of Molecular Biology 240(3):188-192.
Steipe,B.,B.Schiller等(1994)."Sequence Statistics Reliably PredictStabilizing Mutations in a Protein Domain."Journal of Molecular Biology 240(3):188-192.
Stubbs,M.T.,B.Laber等(1990)."The Refined 2.4a X-Ray Crystal-Structureof Recombinant Human Stefin-B in Complex With the Cysteine Proteinase Papain-a Novel Type of Proteinase-Inhibitor Interaction."Embo Journal 9(6):1939-1947.
Studier,F.W.和B.A.Moffatt(1986)."Use of bacteriophage T7 RNApolymerase to direct selective high-level expression of cloned genes."J Mol Biol 189(1):113-130.
Theurillat,J.-P.,B.Dreier等(2010)."Designed ankyrin repeat proteins:anovel tool for testing epidermal growth factor receptor 2expression in breastcancer."Mod Pathol 23(9):1289-1297.
Traxlmayr,M.W和C.Obinger(2012)."Directed evolution of proteins forincreased stability and expression using yeast display."Archives of Biochemistry and Biophysics 526(2):174-180.
Urwin,P.E.,H.J.Atkinson等(1995)."Engineered Oryzacystatin-I Expressedin Transgenic Hairy Roots Confers Resistance to Globodera-Pallida."Plant Journal 8(1):121-131.
Urwin,P.E.,J.Green等(2003)."Expression of a plant cystatin conferspartial resistance to Globodera,full resistance is achieved by pyramiding acystatin with natural resistance."Molecular Breeding 12(3):263-269.
Urwin,P.E.,A.Levesley等(2000)."Transgenic resistance to the nematodeRotylenchulus reniformis conferred by Arabidopsis thaliana plants expressingproteinase inhibitors."Molecular Breeding 6(3):257-264.
Urwin,P.E.,C.J.Lilley等(1997)."Resistance to both cyst and root-knotnematodes conferred by transgenic Arabidopsis expressing a modified plantcystatin."Plant Journal 12(2):455-461.
Urwin,P.E.,M.J.McPherson等(1998)."Enhanced transgenic plantresistance to nematodes by dual proteinase inhibitor constructs."Planta 204(4):472-479.
Urwin,P.E.,K.M.Troth等(2001)."Effective transgenic resistance toGlobodera pallida in potato field trials."Molecular Breeding 8(1):95-101.
Virnekas,B.,L.Ge等(1994)."Trinucleotide phosphoramidites:idealreagents for the synthesis of mixed oligonucleotides for random mutagenesis."Nucleic Acids Res 22:5600-5607.
Von Behring,E.,Kitasato,S.,(1890)."
Figure BDA0003025163170000613
das Zustandekommen derDiphterie-
Figure BDA0003025163170000611
und der Tetanus-
Figure BDA0003025163170000612
bei Thieren."Deutsche Medizinische Wochenzeitschrift 16:1113-1114.
Wojcik,J.,O.Hantschel等(2010)."A potent and highly specific FN3monobody inhibitor of the Abl SH2 domain."Nat Struct Mol Biol 17(4):519-527.
Woodman,R.,J.T.H.Yeh等(2005)."Design and validation of a neutralprotein scaffold for the presentation of peptide aptamers."Journal of Molecular Biology 352(5):1118-1133.
Wurch,T.,A.Pierre等(2012)."Novel protein scaffolds as emergingtherapeutic proteins:from discovery to clinical proof-of-concept."Trends in Biotechnology 30(11):575-582.
序列表
<110> 利兹大学
<120> 从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白
<130> P206256GB
<160> 81
<170> PatentIn版本3.5
<210> 1
<211> 81
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<400> 1
Asn Ser Leu Glu Ile Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His
1 5 10 15
Asn Lys Lys Glu Asn Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala
20 25 30
Lys Glu Gln Val Val Ala Gly Thr Met Tyr Tyr Leu Thr Leu Glu Ala
35 40 45
Lys Asp Gly Gly Lys Lys Lys Leu Tyr Glu Ala Lys Val Trp Val Lys
50 55 60
Pro Trp Glu Asn Phe Lys Glu Leu Gln Glu Phe Lys Pro Val Gly Asp
65 70 75 80
Ala
<210> 2
<211> 84
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<400> 2
Gly Asn Glu Asn Ser Leu Glu Ile Glu Glu Leu Ala Arg Phe Ala Val
1 5 10 15
Asp Glu His Asn Lys Lys Glu Asn Ala Leu Leu Glu Phe Val Arg Val
20 25 30
Val Lys Ala Lys Glu Gln Val Val Ala Gly Thr Met Tyr Tyr Leu Thr
35 40 45
Leu Glu Ala Lys Asp Gly Gly Lys Lys Lys Leu Tyr Glu Ala Lys Val
50 55 60
Trp Val Lys Pro Trp Glu Asn Phe Lys Glu Leu Gln Glu Phe Lys Pro
65 70 75 80
Val Gly Asp Ala
<210> 3
<211> 92
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<400> 3
Ala Thr Gly Val Arg Ala Val Pro Gly Asn Glu Asn Ser Leu Glu Ile
1 5 10 15
Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His Asn Lys Lys Glu Asn
20 25 30
Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala Lys Glu Gln Val Val
35 40 45
Ala Gly Thr Met Tyr Tyr Leu Thr Leu Glu Ala Lys Asp Gly Gly Lys
50 55 60
Lys Lys Leu Tyr Glu Ala Lys Val Trp Val Lys Pro Trp Glu Asn Phe
65 70 75 80
Lys Glu Leu Gln Glu Phe Lys Pro Val Gly Asp Ala
85 90
<210> 4
<211> 74
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<220>
<221> NON_CONS
<222> (36)..(37)
<223> 这些残基之间的可变区域
<220>
<221> NON_CONS
<222> (60)..(61)
<223> 这些残基之间的可变区域
<400> 4
Asn Ser Leu Glu Ile Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His
1 5 10 15
Asn Lys Lys Glu Asn Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala
20 25 30
Lys Glu Gln Thr Met Tyr Tyr Leu Thr Leu Glu Ala Lys Asp Gly Gly
35 40 45
Lys Lys Lys Leu Tyr Glu Ala Lys Val Trp Val Lys Asn Phe Lys Glu
50 55 60
Leu Gln Glu Phe Lys Pro Val Gly Asp Ala
65 70
<210> 5
<211> 74
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<220>
<221> NON_CONS
<222> (35)..(36)
<223> 这些残基之间的可变区域
<220>
<221> NON_CONS
<222> (60)..(61)
<223> 这些残基之间的可变区域
<400> 5
Asn Ser Leu Glu Ile Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His
1 5 10 15
Asn Lys Lys Glu Asn Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala
20 25 30
Lys Glu Gln Thr Met Tyr Tyr Leu Thr Leu Glu Ala Lys Asp Gly Gly
35 40 45
Lys Lys Lys Leu Tyr Glu Ala Lys Val Trp Val Lys Asn Phe Lys Glu
50 55 60
Leu Gln Glu Phe Lys Pro Val Gly Asp Ala
65 70
<210> 6
<211> 92
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<220>
<221> misc_feature
<222> (36)..(44)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (70)..(78)
<223> Xaa可以是任何天然存在的氨基酸
<400> 6
Asn Ser Leu Glu Ile Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His
1 5 10 15
Asn Lys Lys Glu Asn Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala
20 25 30
Lys Glu Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Met Tyr Tyr
35 40 45
Leu Thr Leu Glu Ala Lys Asp Gly Gly Lys Lys Lys Leu Tyr Glu Ala
50 55 60
Lys Val Trp Val Lys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asn Phe
65 70 75 80
Lys Glu Leu Gln Glu Phe Lys Pro Val Gly Asp Ala
85 90
<210> 7
<211> 183
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 7
aacgctctgc tggaattcgt tcgtgttgtt aaagctaaag aacaggttgt tgctggtacc 60
atgtactacc tgaccctgga agctaaagac ggtggtaaaa agaaactgta cgaagctaaa 120
gtttgggtta aaccgtggga aaacttcaaa gaactgcagg agttcaaacc ggttggtgac 180
gct 183
<210> 8
<211> 252
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 8
ggtaacgaaa actccctgga aatcgaagaa ctggctcgtt tcgctgttga cgaacacaac 60
aaaaaagaaa acgctctgct ggaattcgtt cgtgttgtta aagctaaaga acaggttgtt 120
gctggtacca tgtactacct gaccctggaa gctaaagacg gtggtaaaaa gaaactgtac 180
gaagctaaag tttgggttaa accgtgggaa aacttcaaag aactgcagga gttcaaaccg 240
gttggtgacg ct 252
<210> 9
<211> 276
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 9
gctaccggtg ttcgtgcagt tccgggtaac gaaaactccc tggaaatcga agaactggct 60
cgtttcgctg ttgacgaaca caacaaaaaa gaaaacgctc tgctggaatt cgttcgtgtt 120
gttaaagcta aagaacaggt tgttgctggt accatgtact acctgaccct ggaagctaaa 180
gacggtggta aaaagaaact gtacgaagct aaagtttggg ttaaaccgtg ggaaaacttc 240
aaagaactgc aggagttcaa accggttggt gacgct 276
<210> 10
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物cewcF
<400> 10
attagcggcc cagccggcca tggccagcga ggaccgctcc cggc 44
<210> 11
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物cewcR
<400> 11
cgctgtactt gcggccgccc tggcacttgc tttccagc 38
<210> 12
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> HisF寡核苷酸
<400> 12
ggccgcagag gatcgcatca ccatcaccat cacgg 35
<210> 13
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> HisR寡核苷酸
<400> 13
ggccccgtga tggtgatggt gatgcgatcc tctgc 35
<210> 14
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> XhoF引物
<400> 14
atcacgctcg agcagaacaa aaactcatct cag 33
<210> 15
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> XhoR引物
<400> 15
tgttctgctc gagcgtgatg gtgatggtga tggcg 35
<210> 16
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> BamHIR引物
<400> 16
tggccttgat attcacaaac g 21
<210> 17
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> M13R引物
<400> 17
agcggataac aatttcacac agga 24
<210> 18
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> CystaSDFW引物
<400> 18
caccatgaaa tcactattgc ttacg 25
<210> 19
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> CystaSDREV引物
<400> 19
ctactagtga tggtgatggt gatgcg 26
<210> 20
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> HIS标签
<400> 20
Arg Gly Ser His His His His His His Ala Arg Ala Glu Gln Lys Leu
1 5 10 15
Ile Ser Glu Glu Asp Leu Asn Gly Ala Ala
20 25
<210> 21
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 21
tctggcgttt tctgcgtc 18
<210> 22
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 22
ctgttctttc gctttaacaa c 21
<210> 23
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 正向环引物
<220>
<221> misc_feature
<222> (22)..(48)
<223> n是a、c、g或t
<400> 23
gttgttaaag cgaaagaaca gnnnnnnnnn nnnnnnnnnn nnnnnnnnac catgtaccac 60
ttgaccctg 69
<210> 24
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 反向环引物
<220>
<221> misc_feature
<222> (30)..(56)
<223> n是a、c、g或t
<400> 24
ctgcggaact cctgcagttc tttgaagttn nnnnnnnnnn nnnnnnnnnn nnnnnnctta 60
acccaaactt tcgcttcg 78
<210> 25
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 25
Trp Asp Leu Thr Gly Asn Val Asp Thr
1 5
<210> 26
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 26
Ile Asp Leu Thr Asn Ser Phe Ala Ser
1 5
<210> 27
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 27
Ile Asn Leu Met Met Val Ser Pro Met
1 5
<210> 28
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 28
Ile Asp Leu Thr His Ser Leu Asn Tyr
1 5
<210> 29
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 29
Ile Asp Leu Thr His Ser Leu Asn Tyr
1 5
<210> 30
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 30
Ile Asp Leu Thr Glu Trp Gln Asp Arg
1 5
<210> 31
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 31
Trp Val Asp Met Asp Tyr Tyr Trp Arg
1 5
<210> 32
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 32
Ile Asp Leu Thr Gln Thr Glu Ile Val
1 5
<210> 33
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 33
Ile Asp Leu Thr Asp Val Trp Ile Asp
1 5
<210> 34
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 34
Ile Ile Ile His Glu Asn Asp Ala Asp
1 5
<210> 35
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 35
Trp Ile Leu Asn Asn Thr Gln Phe Ile
1 5
<210> 36
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 36
Trp Tyr Glu Arg Ser Glu Asn Trp Asp
1 5
<210> 37
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 37
Trp Asp Leu Thr Thr Pro Ile Asn Ile
1 5
<210> 38
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 38
Trp Phe Asp Asp Glu Tyr Asp Trp Ile
1 5
<210> 39
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 39
Ile Asp Leu Thr Gln Pro His Asp Ser
1 5
<210> 40
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 40
Ile Asp Leu Thr Gln Ser Phe Asp Met
1 5
<210> 41
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 41
Trp Tyr Leu Leu Asp Val Met Asp Asp
1 5
<210> 42
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 42
Trp Ile Asp Arg Gly Gln Tyr Trp Asp
1 5
<210> 43
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 43
Trp Ser Glu Ala Asp Asn Asp Trp His
1 5
<210> 44
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 44
Ile Asp Leu Thr Gly Gln Trp Leu Phe
1 5
<210> 45
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 45
Ile Asp Leu Thr Gln Ser Phe Asp Met
1 5
<210> 46
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 46
Ile Asp Leu Thr Gln Ser Phe Asp Met
1 5
<210> 47
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 47
Ile Asp Leu Thr Gln Pro His Asp Ser
1 5
<210> 48
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 48
Trp Glu Asp Phe Gln Thr His Trp Glu
1 5
<210> 49
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 49
Trp Asp Asp Trp Gly Glu Arg Phe Trp
1 5
<210> 50
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 50
Asp Ile Asn Gln Tyr Trp His Ser Met
1 5
<210> 51
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 51
Gly Ile Gln Gln Asn Pro Ser His Ala
1 5
<210> 52
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 52
Gly Leu Thr Asn Glu Ile Gln Lys Met
1 5
<210> 53
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 53
Gly Leu Thr Asn Glu Ile Gln Lys Met
1 5
<210> 54
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 54
Pro Glu Pro Ile His Ser His His Ser
1 5
<210> 55
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 55
Met Asp Glu Ile Trp Ala Glu Tyr Ala
1 5
<210> 56
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 56
Glu Pro Gly Ile Ile Pro Ile Val His
1 5
<210> 57
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 57
Gly Leu Met Thr Gln Thr Asn Ser Met
1 5
<210> 58
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 58
Gly Ile Met Asp Gly Leu Asn Lys Tyr
1 5
<210> 59
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 59
Val Leu Glu Gly Pro Asp Arg Trp Thr Val
1 5 10
<210> 60
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 60
Arg Asp Tyr Gly Phe Thr Leu Val Pro
1 5
<210> 61
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 61
Tyr Glu Asp Tyr Gln Thr Pro Met Tyr
1 5
<210> 62
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 62
Asp Tyr Ala Ala Thr Asp Leu Tyr Trp
1 5
<210> 63
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 63
Tyr Glu Glu Asp Glu Tyr Trp Arg Met
1 5
<210> 64
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 64
Pro Ile Asp Ser Asn Phe Thr Gly Thr
1 5
<210> 65
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 65
His Asp Arg Arg Tyr Lys Gln Ala Glu
1 5
<210> 66
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 66
Ile His Asn Gly Tyr Thr Ile Met Asp
1 5
<210> 67
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 67
Leu Asp Leu Glu Thr Trp Gln His Phe
1 5
<210> 68
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 68
Pro Leu Trp Gln Tyr Asp Ala Gln Tyr
1 5
<210> 69
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 69
Pro Leu Trp Gln Tyr Asp Ala Gln Tyr
1 5
<210> 70
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 70
Pro Ile Asp Ser Asn Phe Thr Gly Thr
1 5
<210> 71
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 71
Pro His Asp Glu Leu Asn Trp Asn Met
1 5
<210> 72
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 环肽
<400> 72
Asp Val Gly Gln Leu Leu Ser Gly Ile
1 5
<210> 73
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> SUMO1结合位点
<400> 73
Val Asp Val Ile Asp Leu Thr
1 5
<210> 74
<211> 101
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<400> 74
Ala Thr Gly Val Arg Ala Val Pro Gly Asn Glu Asn Ser Leu Glu Ile
1 5 10 15
Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His Asn Lys Lys Glu Asn
20 25 30
Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala Lys Glu Gln Val Val
35 40 45
Ala Gly Thr Met Tyr Tyr Leu Thr Leu Glu Ala Lys Asp Gly Gly Lys
50 55 60
Lys Lys Leu Tyr Glu Ala Lys Val Trp Val Lys Pro Trp Glu Asn Phe
65 70 75 80
Lys Glu Leu Gln Glu Phe Lys Pro Val Gly Asp Ala Ala Ala Ala His
85 90 95
His His His His His
100
<210> 75
<211> 93
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<400> 75
Gly Asn Glu Asn Ser Leu Glu Ile Glu Glu Leu Ala Arg Phe Ala Val
1 5 10 15
Asp Glu His Asn Lys Lys Glu Asn Ala Leu Leu Glu Phe Val Arg Val
20 25 30
Val Lys Ala Lys Glu Gln Val Val Ala Gly Thr Met Tyr Tyr Leu Thr
35 40 45
Leu Glu Ala Lys Asp Gly Gly Lys Lys Lys Leu Tyr Glu Ala Lys Val
50 55 60
Trp Val Lys Pro Trp Glu Asn Phe Lys Glu Leu Gln Glu Phe Lys Pro
65 70 75 80
Val Gly Asp Ala Ala Ala Ala His His His His His His
85 90
<210> 76
<211> 90
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<400> 76
Asn Ser Leu Glu Ile Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His
1 5 10 15
Asn Lys Lys Glu Asn Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala
20 25 30
Lys Glu Gln Val Val Ala Gly Thr Met Tyr Tyr Leu Thr Leu Glu Ala
35 40 45
Lys Asp Gly Gly Lys Lys Lys Leu Tyr Glu Ala Lys Val Trp Val Lys
50 55 60
Pro Trp Glu Asn Phe Lys Glu Leu Gln Glu Phe Lys Pro Val Gly Asp
65 70 75 80
Ala Ala Ala Ala His His His His His His
85 90
<210> 77
<211> 102
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<400> 77
Met Ala Thr Gly Val Arg Ala Val Pro Gly Asn Glu Asn Ser Leu Glu
1 5 10 15
Ile Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His Asn Lys Lys Glu
20 25 30
Asn Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala Lys Glu Gln Val
35 40 45
Val Ala Gly Thr Met Tyr Tyr Leu Thr Leu Glu Ala Lys Asp Gly Gly
50 55 60
Lys Lys Lys Leu Tyr Glu Ala Lys Val Trp Val Lys Pro Trp Glu Asn
65 70 75 80
Phe Lys Glu Leu Gln Glu Phe Lys Pro Val Gly Asp Ala Ala Ala Ala
85 90 95
His His His His His His
100
<210> 78
<211> 94
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<400> 78
Met Gly Asn Glu Asn Ser Leu Glu Ile Glu Glu Leu Ala Arg Phe Ala
1 5 10 15
Val Asp Glu His Asn Lys Lys Glu Asn Ala Leu Leu Glu Phe Val Arg
20 25 30
Val Val Lys Ala Lys Glu Gln Val Val Ala Gly Thr Met Tyr Tyr Leu
35 40 45
Thr Leu Glu Ala Lys Asp Gly Gly Lys Lys Lys Leu Tyr Glu Ala Lys
50 55 60
Val Trp Val Lys Pro Trp Glu Asn Phe Lys Glu Leu Gln Glu Phe Lys
65 70 75 80
Pro Val Gly Asp Ala Ala Ala Ala His His His His His His
85 90
<210> 79
<211> 116
<212> PRT
<213> 人工序列
<220>
<223> 合成支架
<220>
<221> misc_feature
<222> (2)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (51)..(59)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (85)..(93)
<223> Xaa可以是任何天然存在的氨基酸
<400> 79
Met Xaa Xaa Xaa Xaa Xaa Xaa Val Arg Ala Val Pro Gly Asn Glu Asn
1 5 10 15
Ser Leu Glu Ile Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His Asn
20 25 30
Lys Lys Glu Asn Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala Lys
35 40 45
Glu Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Met Tyr Tyr Leu
50 55 60
Thr Leu Glu Ala Lys Asp Gly Gly Lys Lys Lys Leu Tyr Glu Ala Lys
65 70 75 80
Val Trp Val Lys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asn Phe Lys
85 90 95
Glu Leu Gln Glu Phe Lys Pro Val Gly Asp Ala Ala Ala Ala His His
100 105 110
His His His His
115
<210> 80
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 合成蛋白
<400> 80
Met Ala Thr Gly Val Arg Ala Val Pro Gly Asn Glu
1 5 10
<210> 81
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 共有序列
<220>
<221> VARIANT
<222> (1)..(1)
<223> Leu, Val或Ile
<220>
<221> VARIANT
<222> (2)..(2)
<223> Ala, Gly或Tyr
<220>
<221> VARIANT
<222> (3)..(3)
<223> Arg, Lys或Glu
<220>
<221> VARIANT
<222> (4)..(4)
<223> Phe或Tyr
<220>
<221> VARIANT
<222> (5)..(5)
<223> Ala或Ser
<220>
<221> VARIANT
<222> (6)..(6)
<223> Val或Ile
<220>
<221> VARIANT
<222> (7)..(7)
<223> 任何氨基酸
<220>
<221> VARIANT
<222> (8)..(8)
<223> Glu, Asp, Gln或Val
<220>
<221> VARIANT
<222> (9)..(9)
<223> His, Tyr, Phe或Gln
<400> 81
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asn
1 5 10
1

Claims (26)

1.一种合成蛋白,其包含下述序列:NSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQ(Xn)TMYYLTLEAKDGGKKKLYEAKVWVK(Xn)NFKELQEFKPVGDA(SEQ ID NO:4),或其变体,其中所述变体包含由所述序列中一个或多个氨基酸的缺失、置换、插入、倒位或添加造成的氨基酸序列的变异,其中Xn是异源肽,其中X是任何氨基酸和n是氨基酸的数量,其中n是3至30,并且其中所述合成蛋白或其变体具有解链温度Tm为70℃或更高。
2.权利要求1所述的合成蛋白,其中所述异源肽序列的长度是3至20个氨基酸。
3.权利要求2所述的合成蛋白,其中所述异源肽序列的长度是5至13个氨基酸。
4.前述权利要求中任一项的合成蛋白,其包含在N末端的另外的氨基酸序列,其中所述在N末端的另外的氨基酸序列包含序列MATGVRAVPGNE(SEQ ID NO 80),或是另外的异源肽序列。
5.权利要求1所述的合成蛋白,其Tm为80℃或更高。
6.前述权利要求任一项所述的合成蛋白,其被连接至连接体或标签。
7.权利要求6所述的合成蛋白,其中所述连接体或标签连接于所述合成蛋白的C-末端或N-末端,或连接于所述合成蛋白的C-末端和N-末端二者。
8.权利要求1-5任一项所述的合成蛋白,其被连接至基底或部分,其中所述部分是标记、载体或蛋白。
9.权利要求8所述的合成蛋白,其中所述部分或基底连接于所述合成蛋白的C-末端或N-末端,或连接于所述合成蛋白的C-末端和N-末端二者。
10.包含根据权利要求1至5任一项所述合成蛋白的群体的文库。
11.权利要求10所述的文库,其复杂性为108或更高。
12.权利要求10所述的文库,其复杂性为109或更高。
13.权利要求10所述的文库,其复杂性为1010或更高。
14.权利要求10所述的文库,其中所述合成蛋白的群体适应在适于生物淘选的展示系统中展示。
15.一种多核苷酸,其编码根据权利要求1至5任一项所述的合成蛋白。
16.重组载体,其包含根据权利要求15所述的多核苷酸,其中所述重组载体适于在宿主细胞中表达。
17.权利要求16所述的重组载体,其中所述重组载体包含可操作地连接至所述多核苷酸序列的表达控制序列,以控制所述合成蛋白的表达。
18.适于表达根据权利要求1至5任一项所述的合成蛋白的细胞或细胞培养物。
19.权利要求18所述的细胞或细胞培养物,其中所述细胞或细胞培养物包含根据权利要求15所述的多核苷酸或根据权利要求16或17任一项所述的重组载体。
20.筛选结合靶的合成蛋白的方法,所述方法包括:
a)提供根据权利要求10-14任一项所述的文库;
b)将所述文库暴露于靶;和
c)选择结合所述靶的合成蛋白。
21.权利要求20所述的筛选结合靶的合成蛋白的方法,其中所述方法使用展示系统。
22.权利要求20所述的筛选结合靶的合成蛋白的方法,其中所述方法使用噬菌体展示的方法。
23.权利要求20所述的筛选结合靶的合成蛋白的方法,其中所述靶是蛋白、核酸或小分子靶。
24.权利要求20所述的筛选结合靶的合成蛋白的方法,其中所述靶是肽。
25.根据权利要求1至5任一项所述的合成蛋白,或根据权利要求15所述的多核苷酸在研究、在环境和安全性监测、在合成生物学或在靶检测中的用途。
26.根据权利要求1至5任一项所述的合成蛋白,或根据权利要求15所述的多核苷酸在制备用于治疗或诊断的药物中的用途。
CN202110414366.3A 2013-02-14 2014-02-14 从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白 Pending CN113150095A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1302597.8A GB201302597D0 (en) 2013-02-14 2013-02-14 Novel Synthetic Proteins
GB1302597.8 2013-02-14
CN201480022070.5A CN105120885B (zh) 2013-02-14 2014-02-14 从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480022070.5A Division CN105120885B (zh) 2013-02-14 2014-02-14 从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白

Publications (1)

Publication Number Publication Date
CN113150095A true CN113150095A (zh) 2021-07-23

Family

ID=48048387

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480022070.5A Active CN105120885B (zh) 2013-02-14 2014-02-14 从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白
CN202110414366.3A Pending CN113150095A (zh) 2013-02-14 2014-02-14 从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201480022070.5A Active CN105120885B (zh) 2013-02-14 2014-02-14 从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白

Country Status (10)

Country Link
US (2) US9932575B2 (zh)
EP (2) EP3693003A1 (zh)
JP (2) JP6794111B2 (zh)
CN (2) CN105120885B (zh)
AU (2) AU2014217628B2 (zh)
CA (1) CA2900745C (zh)
ES (1) ES2784211T3 (zh)
GB (1) GB201302597D0 (zh)
HK (1) HK1217915A1 (zh)
WO (1) WO2014125290A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201302597D0 (en) * 2013-02-14 2013-04-03 Univ Leeds Novel Synthetic Proteins
GB201407852D0 (en) 2014-05-02 2014-06-18 Iontas Ltd Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules
JP7308505B2 (ja) 2016-01-08 2023-07-14 マキシオン セラピューティクス リミテッド 多様性を変化させた足場ドメインを有する結合メンバー
US20210206818A1 (en) 2016-01-22 2021-07-08 Modernatx, Inc. Messenger ribonucleic acids for the production of intracellular binding polypeptides and methods of use thereof
CN110462403B (zh) 2017-05-19 2024-01-12 菲利普莫里斯生产公司 用于区分受试者的吸烟状况的诊断测试
GB201710973D0 (en) 2017-07-07 2017-08-23 Avacta Life Sciences Ltd Scaffold proteins
WO2019012015A1 (en) 2017-07-12 2019-01-17 Iontas Limited POTASIC CHANNEL INHIBITORS
GB201711208D0 (en) 2017-07-12 2017-08-23 Iontas Ltd Ion channel inhibitors
US20220155309A1 (en) 2019-02-27 2022-05-19 National University Corporation Tokyo Medical And Dental University Fusion protein of antigen-binding protein and fluorescent protein or fluorescence-labeled tag protein
GB202101299D0 (en) 2020-06-09 2021-03-17 Avacta Life Sciences Ltd Diagnostic polypetides and methods
GB202019607D0 (en) 2020-12-11 2021-01-27 Univ Sheffield Purification of proteins

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004113521A1 (en) * 2003-06-18 2004-12-29 Direvo Biotech Ag New biological entities and the use thereof
CN101495653A (zh) * 2006-02-13 2009-07-29 达沃股份有限公司 用于通用分子识别的植物嵌合结合多肽
WO2012082069A1 (en) * 2010-12-13 2012-06-21 Agency For Science, Technology And Research Protein aptamers based on unstructured scaffold proteins

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5168062A (en) 1985-01-30 1992-12-01 University Of Iowa Research Foundation Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence
DK1176981T3 (da) 1999-05-07 2006-04-10 Genentech Inc Behandling af autoimmune sygdomme med antagonister som binder til B celleoverflademarkörer
JP4989638B2 (ja) 2005-06-10 2012-08-01 メディカル リサーチ カウンシル 足場
US20070162998A1 (en) * 2006-01-10 2007-07-12 Kai-Wun Yeh CeCPI: taro cysteine protease inhibitor
US20130305398A1 (en) * 2012-02-16 2013-11-14 Marie Coffin Genes and uses for plant enhacement
GB0807065D0 (en) 2008-04-18 2008-05-21 Univ Leeds Novel scaffolds
BRPI0916867A2 (pt) * 2008-08-05 2017-05-23 Hexima Ltd métodos para proteger uma planta de uma doença associada com infecção por um patógeno, e para identificar uma defensiva, uso de uma defensina de planta e um inibidor de proteinase ou uma forma precursora, planta geneticamente modificada ou progênie desta, e, defensiva
UY32979A (es) 2009-10-28 2011-02-28 Abbott Lab Inmunoglobulinas con dominio variable dual y usos de las mismas
KR101863033B1 (ko) * 2010-04-30 2018-06-01 얀센 바이오테크 인코포레이티드 안정화된 파이브로넥틴 도메인 조성물, 방법 및 용도
TW201211252A (en) 2010-08-26 2012-03-16 Abbott Lab Dual variable domain immunoglobulins and uses thereof
GB201302597D0 (en) * 2013-02-14 2013-04-03 Univ Leeds Novel Synthetic Proteins

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004113521A1 (en) * 2003-06-18 2004-12-29 Direvo Biotech Ag New biological entities and the use thereof
CN101495653A (zh) * 2006-02-13 2009-07-29 达沃股份有限公司 用于通用分子识别的植物嵌合结合多肽
WO2012082069A1 (en) * 2010-12-13 2012-06-21 Agency For Science, Technology And Research Protein aptamers based on unstructured scaffold proteins

Also Published As

Publication number Publication date
EP3693003A1 (en) 2020-08-12
JP6889758B2 (ja) 2021-06-18
CA2900745C (en) 2023-01-24
US9932575B2 (en) 2018-04-03
JP2019205450A (ja) 2019-12-05
EP2956156A1 (en) 2015-12-23
AU2017206237A1 (en) 2017-08-10
US10844370B2 (en) 2020-11-24
US20160032278A1 (en) 2016-02-04
EP2956156B1 (en) 2020-03-18
AU2014217628B2 (en) 2017-04-27
JP2016510219A (ja) 2016-04-07
WO2014125290A1 (en) 2014-08-21
GB201302597D0 (en) 2013-04-03
US20180245067A1 (en) 2018-08-30
JP6794111B2 (ja) 2020-12-02
CN105120885A (zh) 2015-12-02
AU2014217628A1 (en) 2015-08-06
CN105120885B (zh) 2021-05-07
AU2017206237B2 (en) 2019-09-12
CA2900745A1 (en) 2014-08-21
HK1217915A1 (zh) 2017-01-27
ES2784211T3 (es) 2020-09-23

Similar Documents

Publication Publication Date Title
CN105120885B (zh) 从植物半胱氨酸蛋白酶抑制剂衍生的支架蛋白
Tiede et al. Adhiron: a stable and versatile peptide display scaffold for molecular recognition applications
EP2917388B1 (en) Nucleic acids encoding chimeric polypeptides for library screening
JP6092773B2 (ja) フィブロネクチンクレードル分子及びそのライブラリ
Durocher et al. The molecular basis of FHA domain: phosphopeptide binding specificity and implications for phospho-dependent signaling mechanisms
CA2610976C (en) Use of stefin a as a scaffold protein
US11807671B2 (en) Methods for protein ligation and uses thereof
Steemson et al. Tracking molecular recognition at the atomic level with a new protein scaffold based on the OB-fold
Huang et al. Isolation of monobodies that bind specifically to the SH3 domain of the Fyn tyrosine protein kinase
CA3121172A1 (en) Reagents and methods for controlling protein function and interaction
Patel et al. Selection of a high-affinity WW domain against the extracellular region of VEGF receptor isoform-2 from a combinatorial library using CIS display
Cawez et al. Combinatorial design of a nanobody that specifically targets structured RNAs
Yasui et al. A sweet protein monellin as a non-antibody scaffold for synthetic binding proteins
Class et al. Patent application title: SCAFFOLD PROTEINS DERIVED FROM PLANT CYSTATINS Inventors: Michael Mcpherson (Leeds, GB) Darren Tomlinson (Leeds, GB)
JP2017530726A (ja) 抗体様タンパク質
KR100832773B1 (ko) 기능성 Fv 항체 절편 제조 방법
Sjøgaard et al. The Arabidopsis autophagy cargo receptors ATI1 and ATI2 bind to ATG8 via intrinsically disordered regions and are post-translationally modified upon ATG8 interaction
Devan et al. Deciphering the RNA-binding protein network during endosomal mRNA transport
WO2023182945A2 (en) Engineering peptides using peptide epitope linker evolution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination