CN110386986A - 人工改造蛋白质及其构建方法与应用 - Google Patents

人工改造蛋白质及其构建方法与应用 Download PDF

Info

Publication number
CN110386986A
CN110386986A CN201910532509.3A CN201910532509A CN110386986A CN 110386986 A CN110386986 A CN 110386986A CN 201910532509 A CN201910532509 A CN 201910532509A CN 110386986 A CN110386986 A CN 110386986A
Authority
CN
China
Prior art keywords
protein
ala
binding domain
target molecule
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910532509.3A
Other languages
English (en)
Other versions
CN110386986B (zh
Inventor
张建亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Langji Life Technology Co Ltd
Original Assignee
Shenzhen Langji Life Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Langji Life Technology Co Ltd filed Critical Shenzhen Langji Life Technology Co Ltd
Publication of CN110386986A publication Critical patent/CN110386986A/zh
Application granted granted Critical
Publication of CN110386986B publication Critical patent/CN110386986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01049Glucose-6-phosphate dehydrogenase (1.1.1.49)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明通过理性设计的方法,设计并构建得到了一种活性受目标分子调控的人工改造蛋白质,该蛋白质具有一个或多个人为引入的结合域,该结合域可以与目标分子特异性识别并结合,该人工改造蛋白质的活性受目标分子调控。其中,构建所述人工改造蛋白质的构建方法属于理性设计的范畴,人工改造蛋白质的构建过程简单可控,得到人工改造蛋白质的活性变化可控性强,并且不局限于蛋白质的种类、结构或生物学功能,其应用范围广泛。

Description

人工改造蛋白质及其构建方法与应用
技术领域
本发明涉及医药生物学领域,具体涉及一种人工改造蛋白质及其构建方法与应用。
背景技术
别构调控是指蛋白质一个位点上的反应能够影响另一个位点活性的能力。别构调控在细胞信号传导、酶活性调控等多方面发挥重要作用。在部分允许一定变化的氨基酸残基位置中,虽然简单的氨基酸改变不影响生物活性,但如果将此处氨基酸改造成具有结合目标分子的功能,当结合发生后,或由于目标分子的空间位阻、电荷吸引或排斥等的影响,或由于结合导致蛋白质构象变化,蛋白质的生物活力会受到影响。事实上,自然界中也存在很多同样的现象,被称为别构调控,比如,某些酶的非催化部位与某些物质可逆结合后,酶的构象发生变化,进而改变酶的活性状态。基于此,人们可以在分子水平上研究特定基因或蛋白质,在体外模拟突变、重组和选择的自然进化过程,使进化朝人们需要的方向发展,即分子定向进化。
目前,分子定向进化的主要技术有易错PCR、DNA改组、体外随机引发重组、交错延伸、过渡模板随机嵌合生长等,但上述方法的随机性大、进化结果无法预期、进化效率较低。针对上述“非理性设计”的分子定向进化,有必要提供一种“理性设计”方法,针对蛋白质的活性位点,进行靶向突变,提高进化效率。
蛋白质的生物学功能主要由其3D结构决定,不同位置的氨基酸残基对其生物学功能的影响差异非常大,部分位置的氨基酸残基变化不会影响其功能,另一部分氨基酸残基的变化则会严重影响其功能。根据已有资料,大多数情况下,与溶液直接接触的氨基酸残基的变化对蛋白质3D结构的影响较小,因此这些氨基酸残基的变化对其生物学功能的影响就相对较小。目前已经有很多蛋白质的3D结构被解析,并公布在相应的数据库中,这些信息对了解蛋白质的结构和功能的关系非常有用。可根据3D结构,结合序列保守性信息,初步判断哪些区域具有成为改造成识别目标分子的识别区域的潜力。
通过功能域融合的方式,将两个独立的功能域融合并获得具有双功能的蛋白质分子已经得到广泛应用。比如将谷胱甘肽巯基转移酶(GST)、麦芽糖结合蛋白(MBP)、6个组氨酸的多肽(His6)作为标签蛋白,与目的蛋白融合表达,可以用其对应的亲和配体,对融合蛋白进行高效的纯化。但在这些应用中,功能域的生理功能是独立的,该蛋白无法受到目标分子的别构调控。
因此,有必要提供一种能够受目标分子别构调控的人工改造蛋白质及其构建方法。
发明内容
基于此,针对上述问题,本发明的其中一个目的在于提供一种人工改造蛋白质及其构建方法,该蛋白质能够受目标分子调控,该构建方法适用范围广泛,不局限于蛋白质本身的生物学功能和用于调控的目标分子。
为实现上述目的,本发明提供了如下技术方案:
一种人工改造蛋白质,包括一个或多个人为引入的结合域,所述人为引入的结合域与改造前的蛋白质连接;其中,连接的位置为:改造前的蛋白质的能够与溶液直接接触的、外面的柔性或邻近蛋白质活性中心的位置上;所述人为引入的结合域能够特异性识别并结合目标分子;所述人工改造蛋白质的生物学活性受所述目标分子调控。
在其中一些实施例中,所述人工改造蛋白质包括多个人为引入的结合域时,所述多个人为引入的结合域分别单独特异性识别并结合目标分子,或多个人为引入的结合域协同识别并结合目标分子。
在其中一些实施例中,所述人为引入的结合域与目标分子的解离常数≤10-6摩尔/升。
在其中一些实施例中,所述结合域通过共价连接的方式与改造前的蛋白质连接。
在其中一些实施例中,所述结合域直接与改造前的蛋白质连接;或通过接头序列与改造前的蛋白质连接。
在其中一些实施例中,所述改造前的蛋白质为:葡萄糖-6-磷酸脱氢酶。
在其中一些实施例中,所述葡萄糖-6-磷酸脱氢酶的氨基酸序列如SEQ ID NO.1所示;所述人为引入的结合域与改造前的蛋白质连接为:
a)在葡萄糖-6-磷酸脱氢酶的304位的氨基酸后插入多肽配体,作为人为引入的结合域;或
b)将葡萄糖-6-磷酸脱氢酶的56位谷氨酰胺点突变为半胱氨酸,并偶联多肽配体,作为人为引入的结合域;或
c)将葡萄糖-6-磷酸脱氢酶292-297位的氨基酸删除,并在291位的氨基酸后面插入多肽配体,作为人为引入的结合域。
在其中一些实施例中,在葡萄糖-6-磷酸脱氢酶的304位的氨基酸后插入多肽配体的氨基酸序列如SEQ ID NO.2所示。
在其中一些实施例中,将葡萄糖-6-磷酸脱氢酶的56位谷氨酰胺点突变为半胱氨酸后所偶联的多肽配体的氨基酸序列如SEQ ID NO.5所示。
在其中一些实施例中,将葡萄糖-6-磷酸脱氢酶292-297位的氨基酸删除后在291位的氨基酸后面插入的多肽配体的氨基酸序列如SEQ ID NO.7所示。
在其中一些实施例中,上述人工改造蛋白质的构建方法包括:
(1)预测、选定在改造前的蛋白质上用于人为引入结合域的位置;
(2)筛选得到所述结合域,将所述结合域连接至改造前的蛋白质上用于人为引入结合域的位置,制备得到人工改造蛋白质。
本发明的另一个目的还在于,提供一种人工改造蛋白质的构建方法,具体技术方案如下:
一种人工改造蛋白质的构建方法,包括以下步骤:
(1)预测、选定在改造前的蛋白质上用于人为引入结合域的位置;所述用于人为引入结合域的位置为:改造前的蛋白质的能够与溶液直接接触的、外面的柔性或非柔性的环状结构上;
(2)筛选得到所述结合域,将所述结合域连接至改造前的蛋白质上用于人为引入结合域的位置,制备得到人工改造蛋白质。
在其中一些实施例中,步骤(1)所述的预测、选定人工改造蛋白质上人为引入结合域的位置,步骤如下:
根据改造前蛋白质的三维结构或改造前蛋白的同源序列保守信息,选取临近活性中心、但不直接发挥生物学功能的位置;或
在改造前蛋白质上随机插入已知多肽配体,得一系列改造蛋白质;鉴别多肽配体与目标分子结合后改造蛋白质的活性;根据改造蛋白质上已知多肽所在的位置,选定人工改造蛋白质上人为引入结合域的位置。
在其中一些实施例中,步骤(2)所述制备得到人工改造蛋白质,包括:
将多样化核酸序列克隆到所述的用于人为引入结合域的位置,制备表达载体,表达得多样性融合蛋白,筛选,得到能与目标分子特异性结合的蛋白质,利用蛋白质的核酸信息进行克隆表达,制备得到人工改造蛋白质;或
将多样化核酸序列克隆到表达载体,表达得多样性多肽,筛选,得到能与目标分子特异性结合的多肽,连接至改造前的蛋白质上用于人为引入结合域的位置,制备得到人工改造蛋白质;或
构建得单链寡核苷酸库,筛选,得到与目标分子有高亲和力的DNA或RNA,通过化学偶联的方式,连接到改造前的蛋白质上用于人为引入结合域的位置,制备得到人工改造蛋白质。
在其中一些实施例中,得到能与目标分子特异性结合的多肽后,将所述多肽连接至改造前的蛋白质上用于人为引入结合域的位置的方法为:
将所述能与目标分子特异性结合的多肽对应的核酸序列,克隆至所述人为引入的结合域的位置,表达得到所述人工蛋白;或
将所述能与目标分子特异性结合的多肽或单链寡核苷酸,通过化学偶联的方式连接至所述人为引入的结合域的位置,得到所述人工蛋白。
具体地,所述化学偶联的方式,以葡萄糖-6-磷酸脱氢酶为例,选择56位的谷氨酰胺,该位置接近酶的活性中心,通过点突变的方法,将该氨基酸突变成半胱氨酸,半胱氨酸的侧链有一个巯基,可以用于后续的偶联。将一段对C-反应蛋白(CRP)有特异性亲和力的多肽配体的末端进行马来酰亚胺基己酸修饰,修饰后的多肽配体上的马来酰亚胺末端可以在一定条件下与葡萄糖-6-磷酸脱氢酶上的巯基偶联。在其他一些实施方式中,多肽配体可以根据待测的目标分子而选择,其中,多肽配体上采用马来酰亚胺基己酸修饰的位置,可以是修饰后使得多肽配体可以和改造前蛋白上的巯基偶联且不影响偶联后的多肽配体与目标分子结合活性的位点。
在其中一些实施例中,步骤(2)包括:
利用噬菌体表面展示技术,构建编码一定数量氨基酸的多样化核酸序列,将多样化核酸序列克隆到表达载体上,使基因表达产物展示在丝状噬菌体表面,得噬菌体表面展示蛋白;
筛选能够与目标分子特异性结合的噬菌体表面展示蛋白,得多肽适配体,获得编码多肽适配体的基因信息;
将编码多肽适配体的基因序列插入至改造前的蛋白质上用于人为引入结合域的位置的基因序列中,得人工蛋白序列信息;
通过克隆表达或人工合成,制备得到人工蛋白。
在其中一些实施例中,所述获得编码多肽适配体的基因信息后,通过克隆表达或人工合成,得到所述多肽适配体;
通过化学偶联法将所述多肽适配体连接至改造前的蛋白质上用于人为引入结合域的位置。
在其中一些实施例中,步骤(2)包括:
利用噬菌体表面展示技术,构建编码一定数量氨基酸的多样化核酸序列,将多样化核酸序列克隆到编码改造前蛋白质的基因上编码人为引入结合域的位置,形成编码改造后蛋白质的基因序列;所述编码改造后蛋白质的基因序列在相应的结合域具有多样化核酸序列;
将编码改造后蛋白质的基因序列克隆到表达载体上,使基因表达产物展示在丝状噬菌体表面,得噬菌体表面展示蛋白;
筛选能够与目标分子特异性结合的噬菌体表面展示蛋白,得能够与目标分子特异性结合的改造后蛋白质的基因信息;
通过克隆表达或人工合成,制备得到人工蛋白。
在其中一些实施例中,所述表达载体包括噬菌体、酵母、核糖体、细菌、mRNA中的任一种。
在其中一些实施例中,所述的筛选为:计算机辅助虚拟筛选和/或生物淘洗。
在其中一些实施例中,所述目标分子蛋白质、核酸、病毒颗粒、多肽、微生物或微生物的部分结构。
在其中一些实施例中,所述目标分子的分子量≥500道尔顿。
本发明还提供一种上述人工改造蛋白质的应用,具体如下:
上述的人工改造蛋白质在检测目标分子中的应用。
本发明还提供一种利用人工改造蛋白质检测目标分子的方法,具体如下:
一种利用人工改造蛋白质检测目标分子的方法,根据所需检测的目标分子,构建得到如上所述的人工改造蛋白,所需检测的目标分子与所述人工改造蛋白上的认为引入的结合域特异性结合,并改变所述人工改造蛋白的生物学活性,通过检测所述人工改造蛋白的生物学活性变化来检测目标分子。
基于上述技术方案,本发明具有以下有益效果:
本发明通过理性设计的方法,设计并构建得到了一种活性受目标分子调控的人工改造蛋白质,该蛋白质具有一个或多个人为引入的结合域,该结合域可以与目标分子特异性识别并结合,该人工改造蛋白质的活性受目标分子调控。其中,构建所述人工改造蛋白质的构建方法属于理性设计的范畴,人工改造蛋白质的构建过程简单可控,得到人工改造蛋白质的活性变化可控性强,并且不局限于蛋白质的种类、结构或生物学功能,其应用范围广泛。
本发明还提供了一种通过人工改造蛋白检测目标分子的方法,根据所需要检测的目标分子设计并构建得到一种人工改造蛋白,其在合适位点上引入了能够与目标分子特异性结合的结合域,且生物学活性受到目标分子调控。通过在含有目标分子的样品中加入人工改造的蛋白质,检测人工改造蛋白质的生物学活性变化,即可简便快捷的得出样品中是否含有待测目标分子,或可通过标准曲线法定量检测待测目标分子的含量。
本发明还对人为引入结合域在人工改造蛋白质上的连接位点、连接方式进行了优选,并结合对于人为引入结合域与目标分子的结合形式、解离常数、目标分子种类及大小的综合考虑,设计得到的人工改造蛋白质,其更够更好地识别并结合目标分子,受目标分子调控的特异性强、灵敏度高。
附图说明
图1为人工改造蛋白质及其构建方法的原理示意图;
图2为通过蛋白质的三维构象选择人工改造蛋白质人为引入结合域的位点的方法示意图;
图3为预测并确定OP蛋白质可以引入结合域的、合适的位置的流程图;
图4-7为通过分子文库展示技术筛选并制备得到NP蛋白质不同方案的流程图;
图8为实施例1中葡萄糖-6-磷酸脱氢酶的三维结构示意图;
图9为实施例1中葡萄糖-6-磷酸脱氢酶插入结合域后的序列的三维结构预测示意图;
图10为实施例1的测试结果图;
图11为实施例2中葡萄糖-6-磷酸脱氢酶第56位氨基酸定点突变后的序列的三维结构预测示意图;
图12为实施例2的测试结果图;
图13为实施例3中将葡萄糖-6-磷酸脱氢酶进行改造构建了的融合蛋白的三维结构预测示意图;
图14为实施例3的测试结果图。
具体实施方式
本发明提供了一种受别构调控的蛋白质分子及其构建方法与应用。为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用试剂,均为市售产品。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本发明所述的人工改造蛋白质分子及其构建方法原理如下:
如图1所示,一具有生物活性的蛋白质,包括至少两个功能域,分别为蛋白质的活性中心及结合域,其中结合域可以与目标分子结合,当目标分子未与所述有生物活性的蛋白质结合,该蛋白质分子发挥正常活性;当目标分子存在时,该目标分子通过所述有生物活性的蛋白质上的结合域结合到该蛋白质分子上,对其生物活性造成影响,包括对其生物学活性的激活或抑制,或改变其生物学功能。
以图2为例,作进一步解释:图中灰色部分为具有生物活性的蛋白质,红色为底物,紫色区域(包括A、B、C三个位置)为可以引入结合域的位点。图2A中,蛋白质没有结合目标分子;图2B中,紫色区域的C位置经过改造,为具有与目标分子结合的结合域,当目标分子与蛋白质结合后,由于目标分子带来的空间位阻,活性中心难以与底物结合,蛋白质的生物活性下降。
上述人工改造蛋白在检测目标分子中的应用:例如,一种通过人工改造蛋白检测目标分子的方法,根据所需要检测的目标分子设计并构建得到一种人工改造蛋白,其在合适位点上引入了能够与目标分子特异性结合的结合域,且生物学活性收到目标分子调控。通过在含有目标分子的样品中加入人工改造的蛋白质,检测人工改造蛋白质的生物学活性变化,即可简便快捷的得出样品中是否含有待测目标分子,或可通过标准曲线法定量检测待测目标分子的含量。
当人工改造蛋白质是酶、绿色荧光蛋白等具有信号放大作用的蛋白质时,由于在一个反应体系中,目标分子浓度越高,被调控的人工改造蛋白质就越多,蛋白质活性反应的改变就越强,因此该蛋白质可以应用于目标分子的检测。检测是均相中进行的,不需要分离清洗等步骤,可以大大提高检测速度。每个目标分子的结合都可以影响对应蛋白质分子的活性,因此检测灵敏度很高。
对本发明所述的受别构调控的蛋白质分子的构建方法中,涉及的专业名词及其简称解释如下。
OP蛋白质:即改造前蛋白质分子,简称为OP蛋白质(Original Proteins)。
NP蛋白质:即经人为引入能够与目标分子特异性识别并结合的功能域的新型蛋白质(New Proteins),该蛋白质为受目标分子别构调控的蛋白质分子。
结合域:能够与目标分子特异性识别并结合的功能域。
目标分子:结合域的亲和配体,能够与结合域发生特异性的识别与结合。
功能域(functional domain):是蛋白质分子中能独立存在的功能单位,功能域可以是一个结构域,也可是由两个结构域或两个以上的结构域组成。
表达载体(Expression vectors):就是在克隆载体基本骨架的基础上增加表达元件(如启动子、RBS、终止子等),使目的基因能够表达的载体。
接头序列(linker):一小段氨基酸序列或其他化学结构,能够维持其两端结构的独立性。
生物淘洗(Biopanning):一种获得与目标分子特异性结合的亲和筛选技术,包括4个基本步骤,第一步是准备分子展示文库;第二步是捕获步骤,将目标分子固定,用来捕获能够与目标分子结合的多肽或蛋白质;第三步是清洗,将没有与目标分子结合的多肽或蛋白质清洗掉;第四步是洗脱,将能够与目标分子结合的多肽或蛋白质洗脱下来,使之与目标分子分离。
分子文库展示技术:利用基因工程的手段,将一定长度的、随机序列的寡核苷酸片段克隆到特定表达载体中,使其表达产物以融合蛋白的形式展示在特定表面。是将表型与基因型关联起来的一种技术,包括噬菌体展示技术、m RNA展示、核糖体展示、细菌展示、和酵母展示等;分子文库库容量可以做到很大,可以从中筛选到针对目标分子的合适的亲和配体。
空间位阻效应:是指分子中某些原子或基团彼此接近而引起的空间阻碍和偏离正常键角而引起的分子内的张力。如酶反应中空间位阻会降低其催化活性。
蛋白质:由氨基酸以“脱水缩合”的方式组成的多肽链经过盘曲折叠形成的具有一定空间结构的物质。
酶:具有催化活性和高度选择性的特殊蛋白质或RNA。
适配体:一小段经体外筛选得到的寡核苷酸序列或者短的多肽,能与相应的配体进行高亲和力和强特异性的结合。
基因工程:在体外对一段基因进行改造,将其克隆到合适的载体上并导入受体细胞,使基因在受体细胞中表达出符合预期的蛋白质。
蛋白质生物活性:蛋白质与其他物质作用后,引起被作用物质或其自身性质变化,称为生物活性。
活性中心:蛋白质发挥特定生物活性的核心部位,相关反应发生的位置。活性中心除了蛋白质分子的核心部位,还可能包括其他分子的某一部分。例如,对某些需要辅酶的酶,辅酶也是其活性中心的一部分。
化学偶联:两个有机分子进行某种化学反应而得到一个有机分子的过程;在此过程中,偶联剂扮演了非常重要的角色,偶联剂能够与不同种类的化学基团反应,形成共价键,从而将两个分子连接成一个分子,目前已有很多种类的偶联剂可供使用。
克隆表达:通过体外重组技术,将一段目的DNA分子经过切割、连接,插入适当的载体(如质粒),将载体通过转染或转化的方式导入细胞中,表达产生目的DNA分子编码的蛋白质。
在其中一些实施例中,本发明所述的受别构调控的蛋白质分子的构建方法步骤如下:
第一步、预测并确定OP蛋白质可以引入结合域的、合适的位置
在其中一些实施例中,参照OP蛋白质的三维结构图或同源序列保守信息,以柔性环(loop)、临近活性中心、不直接参与催化反应为原则,预测可以引入结合域的、合适的位置,如图2所示。在其他实施方式中,可以人工构建多肽适配体,随机插入到OP蛋白质的不同位置,得一系列改造蛋白质;鉴别所述改造蛋白质与目标分子结合后的活性变化情况,获取合适的可以引入结合域的的合适位置,其流程如图3所示。
可以引入结合域的合适的位置的选择以柔性环(loop)、临近活性中心、不直接参与催化反应为原则的原因为:选择邻近活性中心、不直接参与催化反应的柔性环,由于与蛋白主体结构相对独立,通常情况下其氨基酸序列的变化,对蛋白活性影响相对较小。且邻近活性中心的位置结合了目标分子后,很容易对蛋白活性产生较大影响。是一个容易预测的、符合我们上述要求的结合域。
第二步、通过分子文库展示技术筛选并制备得到NP蛋白质
在其中一些实施例中,利用分子文库展示技术,如噬菌体表面展示技术,构建编码一定数量氨基酸的多样化DNA文库,将DNA克隆到表达载体,如丝状噬菌体编码衣壳蛋白的基因g III,使基因表达产物与衣壳蛋白融合,展示在丝状噬菌体表面。将目标分子固定化,将上述展示蛋白与固定化的目标分子混匀,使之充分接触,通过生物淘洗的方式,筛选能够与目标分子特异性结合的融合蛋白,其中多样化DNA文库区域编码的氨基酸序列称为多肽适配体。此时可以获得编码多肽适配体的基因信息。将多肽适配体引入到第一步获知的可以引入结合域的合适的位置。
其中,可选地,将多肽适配体引入到第一步获知的OP蛋白质可以引入结合域的合适的位置,可以通过以下方法实现:(1)将多肽适配体对应的基因片段克隆到OP蛋白质上合适的位置,流程如图4所示;或(2)将多肽适配体通过化学偶联的方式连接到OP蛋白质上合适的位置,流程如图5所示。
在其中一些实施例中,利用分子文库展示技术,如噬菌体表面展示技术,构建编码一定数量氨基酸的多样化DNA文库,将该多样化DNA文库克隆到OP蛋白质上可以引入结合域的合适位置,形成编码NP蛋白质的DNA文库,其中所述编码NP蛋白质的DNA文库为在对应的NP蛋白质相应的结合域具有多样化的DNA文库。再将编码NP蛋白质的DNA文库克隆到表达载体上,如丝状噬菌体编码衣壳蛋白的基因g III,使基因表达产物与衣壳蛋白融合,展示在丝状噬菌体表面。将目标分子固定化,将上述展示蛋白与固定化的目标分子混匀,使之充分接触,通过生物淘洗的方式,筛选能够与目标分子特异性结合的融合蛋白,此时可以获得编码NP蛋白质的基因信息,由此确定其氨基酸序列。通过体外合成或克隆表达的方式,得到包含以上氨基酸序列的NP蛋白质,即为所需的NP蛋白质,流程如图6所示。而在其他方案中,可以视为包括两个独立步骤:获得与目标分子特异性结合的多肽配体、将多肽配体连接到OP蛋白质上可以引入结合域的位置。多肽配体分子量小,其结构较容易受与其连接的结构的影响,进而影响其特异性、亲和力,由于获得多肽配体时,多肽配体连接在支架蛋白上,将其连接到OP蛋白质上可以引入结合域的位置上时,其结构可能与在支架蛋白上时有差异,其特异性亲和力也会有所差异。虽然在多肽配体内部增加二硫键可以大大改善其结构的稳定性,但并不能完全保证其结构在支架蛋白和OP蛋白质结合域上完全一致。而在本方案中,可以理解为支架蛋白就是NP蛋白质,是直接筛选到特异性识别目标分子的NP蛋白质的方法,不存在多肽配体在不同环境中结构差异的问题。同时,与多肽配体通过化学偶联连接到OP蛋白质可以引入结合域位置的方案相比,后者的多肽配体的一端连接在OP蛋白质上,一端游离在溶液中,不利于其构象的稳定。而在本方案中,多肽配体的两端被融合到目的蛋白中时,其构象更稳定,可以保证更好的亲和力和特异性。因此,为筛选并制备得到NP蛋白质的优选方案。
在其中一些实施例中,体外化学合成一个单链寡核苷酸库,用它与固定化的目标分子混合,洗掉未与靶物质结合的核酸,分离与目标分子结合的核酸分子,以此核酸分子为模板进行PCR扩增,进行下一轮的筛选过程。通过重复的筛选与扩增,将与目标分子有高亲和力的DNA或RNA(核酸适配体)从非常大的随机文库中分离出来。将此核酸适配体通过化学偶联的方式,连接到OP蛋白质可以引入结合域的合适的位置,得到对应的NP蛋白质,流程如图7所示。
其中,上述方法制备得到的NP蛋白质中,人为引入的结合域与OP蛋白质相连接的位点,可以是人为引入的结合域与OP蛋白质直接连接得到NP蛋白质,也可以是人为引入的结合域与OP蛋白质通过接头序列(linker)连接,得到NP蛋白质。
另外,上述实验前,还可通过计算机辅助设计的方法,根据目前积累的分子动力学、结构生物学、蛋白质化学等背景知识,编辑成相应的算法,通过引入一种或几种算法,直接对大量氨基酸序列的结构信息进行分析、计算,可以更加精确可控的预测关键残基及相关突变体的催化特性,更加精确地设计得到所需的NP蛋白质。
构建得到的NP蛋白质,鉴别与确定NP蛋白质与目标分子结合后活性发生变化的方法,具体步骤如下:
(1)取上述制备得到的NP蛋白质,用合适的缓冲液将NP蛋白质稀释至合适浓度,得第一组样本;
(2)另取上述制备得到的NP蛋白质,用含有一定浓度的目标分子的与步骤(1)相同的缓冲液,将NP蛋白质稀释至与步骤(1)相同的浓度,得第二组样本;
(3)生物活性测试:比较测试两组样本中NP蛋白质的生物活性的变化。
以下采用具体的实施例对本发明进行进一步解释。
其中,实施例中所使用的试剂来源如下:
链霉亲和素购自北京慧华晨,CRP蛋白购自南京立顶,葡萄糖-6-磷酸购自阿拉丁,NADP购自罗氏,BSA购自proliant,其他化学品购自国药(沪试)。多肽由上海淘普合成。
实施例1
来自肠系膜明串珠菌(Leuconostoc mesenteroides)的葡萄糖-6-磷酸脱氢酶,该酶是一个二聚体,氨基酸序列如SEQ ID NO.1所示,其291-310位的氨基酸呈现一个相对独立于酶体外面的环,该位置接近酶的活性中心,三维结构图如图8所示。
VSEIKTLVTFFGGTGDLAKRKLYPSVFNLYKKGYLQKHFAIVGTARQALNDDEFKQLVRDSIKDFTDDQAQAEAFIEHFSYRAHDVTDAASYAVLKEAIEEAADKFDIDGNRIFYMSVAPRFFGTIAKYLKSEGLLADTGYNRLMIEKPFGTSYDTAAELQNDLENAFDDNQLFRIDHYLGKEMVQNIAALRFGNPIFDAAWNKDYIKNVQVTLSEVLGVEERAGYYDTAGALLDMIQNHTMQIVGWLAMEKPESFTDKDIRAAKNAAFNALKIYDEAEVNKYFVRAQYGAGDSADFKPYLEELDVPADSKNNTFIAGELQFDLPRWEGVPFYVRSGKRLAAKQTRVDIVFKAGTFNFGSEQEAQEAVLSIIIDPKGAIELKLNAKSVEDAFNTRTIDLGWTVSDEDKKNTPEPYERMIHDTMNGDGSNFADWNGVSIAWKFVDAISAVYTADKAPLETYKSGSMGPEASDKLLAANGDAWVFKG(SEQ ID NO.1)
通过在葡萄糖-6-磷酸脱氢酶的304位的氨基酸后面插入链霉亲和素(SA蛋白)蛋白有特异性亲和力的多肽配体的方法构建了一个融合蛋白。所插入的多肽配体的氨基酸序列如SEQ ID NO.2所示。融合蛋白的氨基酸序列如SEQ ID NO.3所示,利用SWISS-MODEL对该的结构进行预测,选择1DPG作为模板,预测的3D结构如图9所示,该酶是一个二聚体,其中图中圈出的序列为插入的氨基酸序列。其中,所插入的配体中的两个半胱氨酸形成一对分子内二硫键。上述酶的详细构建和获取方法如下:
1)根据上述氨基酸序列合成基因;
2)将基因连接到T载体上。
3)从T载体上把基因用限制性内切酶切下来。
4)将上一步的基因插入到表达载体上(如PET系列的质粒,含有GST标签蛋白,标签蛋白与目标蛋白之间含有蛋白酶切位点)。
5)将表达载体转化到感受态的大肠杆菌表达菌中。
6)培养大肠杆菌后,破碎细胞,离心收集上清液。
7)利用GST亲和纯化,得到含标签蛋白的目标蛋白。
8)利用蛋白酶消化去掉标签蛋白,纯化得到目标蛋白。
RLEICQNVCYYLGTL(SEQ ID NO.2)
VSEIKTLVTFFGGTGDLAKRKLYPSVFNLYKKGYLQKHFAIVGTARQALNDDEFKQLVRDSIKDFTDDQAQAEAFIEHFSYRAHDVTDAASYAVLKEAIEEAADKFDIDGNRIFYMSVAPRFFGTIAKYLKSEGLLADTGYNRLMIEKPFGTSYDTAAELQNDLENAFDDNQLFRIDHYLGKEMVQNIAALRFGNPIFDAAWNKDYIKNVQVTLSEVLGVEERAGYYDTAGALLDMIQNHTMQIVGWLAMEKPESFTDKDIRAAKNAAFNALKIYDEAEVNKYFVRAQYGAGDSADFKPYLEELRLEICQNVCYYLGTLDVPADSKNNTFIAGELQFDLPRWEGVPFYVRSGKRLAAKQTRVDIVFKAGTFNFGSEQEAQEAVLSIIIDPKGAIELKLNAKSVEDAFNTRTIDLGWTVSDEDKKNTPEPYERMIHDTMNGDGSNFADWNGVSIAWKFVDAISAVYTADKAPLETYKSGSMGPEASDKLLAANGDAWVFKG(SEQ ID NO.3)
测试:将以上酶用含有0.2M Tris,10-50g/L BSA,pH7.5-8.5的溶液稀释至0.2-0.8mg/L,作为组分1;用PBS缓冲液将SA蛋白稀释成不同浓度梯度(包括不含SA的梯度),作为组分2;用含有1-3g/L的葡萄糖-6-磷酸,2-7g/L的NADP的溶液作为组分3。将200μl组分1在37℃下孵育1-5分钟,加入10μl的不同浓度梯度的组分2,孵育1-5分钟,加入50μl的组分3,读取加入组分3后72秒至216秒的吸光度,计算吸光度变化率(单位为ΔA/分钟)。比较含SA蛋白和不含SA蛋白吸光度变化率,计算不同浓度梯度SA蛋白对酶的抑制。结果如表1及图10所示:
表1
SAμg/mL 吸光度变化率(ΔA/分钟) 抑制率
0 0.612 100%
12.5 0.5977 97.7%
25 0.5867 95.9%
50 0.5681 92.8%
100 0.537 87.7%
应用:根据上述数据可知,蛋白浓度与吸光度变化率具有明确的相关性,该经人工改造的酶可以用于检测目的蛋白的浓度,具体而言,其可以检测溶液中链霉亲和素或链霉亲和素标记的蛋白的浓度。
目前检测目标分子的方法主要是利用抗原抗体特异性结合来实现的,如酶联免疫分析(ELISA)、免疫层析等,这些方法一般都涉及到分离、清洗步骤,导致检测时间较长。而本检测方法是一种均相的检测方法,所有组分混匀后即可测试,操作简便、检测时间非常短。
实施例2
来自肠系膜明串珠菌(Leuconostoc mesenteroides)的葡萄糖-6-磷酸脱氢酶,氨基酸序列如SEQ ID NO.1所示,其56位的氨基酸是谷氨酰胺,该位置接近酶的活性中心,但并不是柔性环。通过点突变的方法,将该氨基酸突变成半胱氨酸,半胱氨酸的侧链有一个巯基,可以用于后续的偶联,突变后的葡萄糖-6-磷酸脱氢酶的氨基酸序列如SEQ ID NO.4所示,利用SWISS-MODEL对该序列的结构进行预测,选择1DPG作为模板,预测的3D结构如图11所示,其中图中箭头所指的序列为定点突变的氨基酸序列。
VSEIKTLVTFFGGTGDLAKRKLYPSVFNLYKKGYLQKHFAIVGTARQALNDDEFKCLVRDSIKDFTDDQAQAEAFIEHFSYRAHDVTDAASYAVLKEAIEEAADKFDIDGNRIFYMSVAPRFFGTIAKYLKSEGLLADTGYNRLMIEKPFGTSYDTAAELQNDLENAFDDNQLFRIDHYLGKEMVQNIAALRFGNPIFDAAWNKDYIKNVQVTLSEVLGVEERAGYYDTAGALLDMIQNHTMQIVGWLAMEKPESFTDKDIRAAKNAAFNALKIYDEAEVNKYFVRAQYGAGDSADFKPYLEELDVPADSKNNTFIAGELQFDLPRWEGVPFYVRSGKRLAAKQTRVDIVFKAGTFNFGSEQEAQEAVLSIIIDPKGAIELKLNAKSVEDAFNTRTIDLGWTVSDEDKKNTPEPYERMIHDTMNGDGSNFADWNGVSIAWKFVDAISAVYTADKAPLETYKSGSMGPEASDKLLAANGDAWVFKG(SEQ ID NO.4)
同时,我们合成了一段对C-反应蛋白(CRP)有特异性亲和力的多肽配体,其氨基酸序列为EWACNDRGFNCQLQR(SEQ ID NO.5),其中多肽配体上的两个半胱氨酸形成一对分子内二硫键,其N端进行马来酰亚胺基己酸修饰。将酶和多肽配体按照1:(30-300)的摩尔比,加入到以下溶液中(0.1M的PBS,ph7.2),4℃反应过夜后,用脱盐柱或透析去除多余的多肽配体,将酶浓度调整到约为0.1mg/ml。
偶联机制:马来酰亚胺末端在反应pH值在6.5-7.5范围内时特异性地与酶上的巯基偶联。
测试:将以上酶用含有0.2M Tris,5-30g/L BSA,pH7.5-8.5的溶液稀释100-400倍,作为组分1;用PBS缓冲液将CRP蛋白稀释成不同浓度梯度(包括不含CRP的梯度),作为组分2;用含有1-3g/L的葡萄糖-6-磷酸,2-7g/L的NADP的溶液作为组分3。将200μl组分1在37℃下孵育1-5分钟,加入10μl的不同浓度梯度的组分2,孵育1-5分钟,加入50μl的组分3,读取加入组分3后72秒至216秒的吸光度,计算吸光度变化率(单位为ΔA/分钟)。比较含CRP蛋白和不含CRP蛋白吸光度变化率,计算不同浓度梯度CRP蛋白对酶的抑制。结果如表2和图12所示。
表2
CRPμg/mL 吸光度变化率(ΔA/分钟) 抑制率
0 0.6273 100%
6.25 0.6193 98.7%
12.5 0.6123 97.6%
25 0.6043 96.3%
50 0.595 94.9%
应用:根据上述数据可知,蛋白浓度与吸光度变化率具有明确的相关性,该酶可以用于检测样品中的C反应蛋白的浓度。
实施例3
来自肠系膜明串珠菌(Leuconostoc mesenteroides)的葡萄糖-6-磷酸脱氢酶,氨基酸序列如SEQ ID NO.1所示,其291-310位的氨基酸呈现一个相对独立于酶体外面的环,该位置接近酶的活性中心。我们通过将其292-297位的氨基酸删除,并在291位的氨基酸后面插入对CRP有特异性亲和力的多肽配体的方法构建了一个融合蛋白(SEQ ID NO.6),其中,多肽配体的氨基酸序列为EWACNDRGFNCQLQR(SEQ ID NO.5),其中两个半胱氨酸形成一对分子内二硫键,利用SWISS-MODEL对该序列的结构进行预测,选择1DPG作为模板,预测的3D结构如图13所示,该酶是一个二聚体,其中图中圈出的序列为插入的氨基酸序列。
VSEIKTLVTFFGGTGDLAKRKLYPSVFNLYKKGYLQKHFAIVGTARQALNDDEFKQLVRDSIKDFTDDQAQAEAFIEHFSYRAHDVTDAASYAVLKEAIEEAADKFDIDGNRIFYMSVAPRFFGTIAKYLKSEGLLADTGYNRLMIEKPFGTSYDTAAELQNDLENAFDDNQLFRIDHYLGKEMVQNIAALRFGNPIFDAAWNKDYIKNVQVTLSEVLGVEERAGYYDTAGALLDMIQNHTMQIVGWLAMEKPESFTDKDIRAAKNAAFNALKIYDEAEVNKYFVRAQYGAEWACN DRGFNCQLQRKPYLEELDVPADSKNNTFIAGELQFDLPRWEGVPFYVRSGKRLAAKQTRVDIVFKAGTFNFGSEQEAQEAVLSIIIDPKGAIELKLNAKSVEDAFNTRTIDLGWTVSDEDKKNTPEPYERMIHDTMNGDGSNFADWNGVSIAWKFVDAISAVYTADKAPLETYKSGSMGPEASDKLLAANGDAWVFKG(SEQ ID NO.6)
测试:将以上酶用含50mM HEPES,2-10g/L BSA,pH 7.5的溶液稀释至0.1-0.6mg/L,作为组分1;用PBS缓冲液将CRP蛋白稀释成不同浓度梯度(包括不含CRP的梯度),作为组分2;用含有1-3g/L的葡萄糖-6-磷酸,2-7g/L的NADP的溶液作为组分3。将200ul组分1在37℃下孵育1-5分钟,加入10ul的不同浓度梯度的组分2,孵育1-5分钟,加入50ul的组分3,读取加入组分3后72秒至216秒的吸光度,计算吸光度变化率(单位为ΔA/分钟)。比较含CRP蛋白和不含CRP蛋白吸光度变化率,计算不同浓度梯度CRP蛋白对酶的抑制。结果如表3和图14所示。
表3
应用:根据上述数据可知,蛋白浓度与吸光度变化率具有明确的相关性,该酶可以用于检测样品中的C反应蛋白的浓度。
实施例4α互补-化学偶联
大肠杆菌的β半乳糖苷酶是一个四聚体酶,每个亚基可以分成大小两个酶片段大的片段称为EA,小的片段称为ED,每个酶片段分开时没有活性,两个酶片段在一起则形成有活力的酶,这被称为α互补。将ED片段通过化学偶联的方式,连接上一小段(如5-15个氨基酸)能够跟特定蛋白或目标分子结合的适配体,并不会影响其与EA片段的互补。但当ED片段上的适配体与相应的蛋白或目标分子结合后,由于空间位阻效应,会影响ED和EA蛋白结合,导致酶活力下降。相应蛋白或目标分子的含量越高,无法形成活力蛋白的酶片段越多,酶活力越低。通过酶活力的检测,可以定性或定量检测目标分子。
将每个亚基可以分成大小两个酶片段后,能够实现每个酶片段分开时没有活性、两个酶片段在一起则形成有活力的切分ED片段和EA片段的形式有许多,只要是可以实现当ED片段上的适配体与相应的蛋白或目标分子结合后会影响ED和EA蛋白结合、导致酶活力下降的切分形式,均可用于采用本实施例类似的方案改造β半乳糖苷酶,以实现检测目标分子的目的。
在其中一些实施例中,一个可行的ED、EA片段如下:
ED片段的序列(SEQ ID NO.7):
DPSGDPRASSNSLAVVLQRRDWENPGVTELNRLAAHPPFASWRNCEEARTDRPSQQLRSLNGLESRSAGMPLE
EA片段的序列(SEQ ID NO.8)
TMITDSLAVVLQEARTDRPSQQLRSLNGEWRFAWFPAPEAVPESWLECDLPEADTVVVPSNWQMHGYDAPIYTNVTYPITVNPPFVPTENPTGCYSLTFNVDESWLQEGQTRIIFDGVNSAFHLWCNGRWVGYGQDSRLPSEFDLSAFLRAGENRLAVMVLRWSDGSYLEDQDMWRMSGIFRDVSLLHKPTTQISDFHVATRFNDDFSRAVLEAEVQMCGELRDYLRVTVSLWQGETQVASGTAPFGGEIIDERGGYADRVTLRLNVENPKLWSAEIPNLYRAVVELHTADGTLIEAEACDVGFREVRIENGLLLLNGKPLLIRGVNRHEHHPLHGQVMDEQTMVQDILLMKQNNFNAVRCSHYPNHPLWYTLCDRYGLYVVDEANIETHGMVPMNRLTDDPRWLPAMSERVTRMVQRDRNHPSVIIWSLGNESGHGANHDALYRWIKSVDPSRPVQYEGGGADTTATDIICPMYARVDEDQPFPAVPKWSIKKWLSLPGETRPLILCEYAHAMGNSLGGFAKYWQAFRQYPRLQGGFVWDWVDQSLIKYDENGNPWSAYGGDFGDTPNDRQFCMNGLVFADRTPHPALTEAKHQQQFFQFRLSGQTIEVTSEYLFRHSDNELLHWMVALDGKPLASGEVPLDVAPQGKQLIELPELPQPESAGQLWLTVRVVQPNATAWSEAGHISAWQQWRLAENLSVTLPAASHAIPHLTTSEMDFCIELGNKRWQFNRQSGFLSQMWIGDKKQLLTPLRDQFTRAPLDNDIGVSEATRIDPNAWVERWKAAGHYQAEAALLQCTADTLADAVLITTAHAWQHQGKTLFISRKTYRIDGSGQMAITVDVEVASDTPHPARIGLNCQLAQVAERVNWLGLGPQENYPDRLTAACFDRWDLPLSDMYTPYVFPSENGLRCGTRELNYGPHQWRGDFQFNISRYSQQQLMETSHRHLLHAEEGTWLNIDGFHMGIGGDDSWSPSVSAEFQLSAGRYHYQLVWCQK
本实施例是为了说明,人工引入的结合域(即上述能够跟特定蛋白结合的适配体)与蛋白质生物活性中心不在同一个蛋白质上时,也可以具有本发明所述的效果。
实施例5
1)获取待改造蛋白质的核酸信息,构建一系列突变株:在原始核酸序列中,每隔一定距离(如15-30个核苷酸序列)插入或替换一段随机核酸序列(NX,其中N代表A,T,G,C中的任意一个,X代表3的整数倍,X以大于15为宜;插入或替换不应改变其他位置编码的氨基酸序列;采用替换的方式时,不一定等长度替换),构建不同位置的核苷酸多样化文库。将改造后的不同位置的核酸序列分别克隆到合适的质粒(如PET系列的质粒载体),将改造后的质粒转化到大肠杆菌中。
2)分别表达相应的蛋白,纯化上述蛋白,纯度应不低于90%,计算各蛋白的生物活力。
3)计算突变蛋白和原始蛋白的相对活力比值。其中相对活力较高的蛋白所对应的核苷酸插入位置为结合域最适插入或替换位置,相应的核苷酸多样化文库为最佳多样化文库。
4)将第3步获得的最佳核苷酸多样化文库,通过酶切连接将其重组至噬菌粒载体中后,电穿孔转化至高效率的感受态大肠杆菌细胞中,即获得噬菌体展示文库。
5)将目标分子(预期与人工改造蛋白质结合的)固定到磁珠或其他固相载体上。利用淘洗(panning)的方法对展示库进行筛选,便能得到与目标分子特异性结合的人工改造蛋白质的噬菌体。
6)将上述噬菌体再次侵染大肠杆菌宿主,通过ELISA筛选获得高亲和的单克隆并进行测序,确定其核酸序列。
7)根据上述核酸序列,经过克隆、表达等步骤获得改造后的蛋白质。
8)鉴定目标分子对上述蛋白质生物活性的抑制效果。
实施例6
1)获取待改造蛋白质的核酸信息,构建一系列突变株:在原始核酸序列中,每隔一定距离(如15-30个核苷酸序列)插入或替换一段随机核酸序列(NX,其中N代表A,T,G,C中的任意一个,X代表3的整数倍,X以大于15为宜;插入或替换不应改变其他位置编码的氨基酸序列;采用替换的方式时,不一定等长度替换),构建不同位置的核苷酸多样化文库。将改造后的不同位置的核酸序列分别克隆到合适的质粒(如PET系列的质粒载体),将改造后的质粒转化到大肠杆菌中。
2)分别表达相应的蛋白,纯化上述蛋白,纯度应不低于90%,计算各蛋白的生物活力。
3)计算突变蛋白和原始蛋白的相对活力比值。其中相对活力较高的蛋白所对应的核苷酸插入位置为结合域最适插入或替换位置。
4)在上述最适插入或替换位置中选择其中两个(或以上),在这两个(或以上)的位置同时插入随机核酸序列,构建具有两个(或以上)多样化位点的文库。
5)将第3步获得的多样化文库,通过酶切连接将其重组至噬菌粒载体中后,电穿孔转化至高效率的感受态大肠杆菌细胞中,即获得噬菌体展示文库。
6)将目标分子(预期与人工改造蛋白质结合的)固定到磁珠或其他固相载体上。利用淘洗(panning)的方法对展示库进行筛选,便能得到与目标分子特异性结合的人工改造蛋白质的噬菌体。
7)将上述噬菌体再次侵染大肠杆菌宿主,通过ELISA筛选获得高亲和的单克隆并进行测序,确定其核酸序列。
8)根据上述核酸序列,经过克隆、表达等步骤获得改造后的蛋白质。
9)鉴定目标分子对上述蛋白质生物活性的抑制效果。
实施例7
Leuconostoc mesenteroides的葡萄糖-6-磷酸脱氢酶,其291-310位的氨基酸呈现一个相对独立于酶体外面的环,该位置接近酶的活性中心。(根据我们的数据,)删除292-297位氨基酸并在291位氨基酸后插入一定长度的氨基酸序列,对酶活力影响很小,这些酶倾向于保留很高的活力。
1)将该酶292-297位的氨基酸对应的核苷酸删除,并在291位的氨基酸对应的核酸序列后面插入一定长度的(如15-45个核苷酸)多样化核苷酸序列,构建核酸多样化文库。
2)将上述核酸多样化文库,通过酶切连接将其重组至噬菌粒载体中后,电穿孔转化至高效率的感受态大肠杆菌细胞中,即获得噬菌体展示文库。
3)将目标分子(预期与人工改造酶结合的)固定到磁珠或其他固相载体上。利用淘洗(panning)的方法对展示库进行筛选,便能得到与目标分子特异性结合的人工改造酶的噬菌体。
4)将上述噬菌体再次侵染大肠杆菌宿主,通过ELISA筛选获得高亲和的单克隆并进行测序,确定其核酸序列。
5)根据上述核酸序列,经过克隆、表达等步骤获得改造后的酶。
6)鉴定目标分子对上述酶活力的抑制效果。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对以下实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 深圳琅技生命科技有限公司
<120> 人工改造蛋白质及其构建方法与应用
<150> 201810649101X
<151> 2018-06-22
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 485
<212> PRT
<213> Leuconostoc mesenteroides
<400> 1
Val Ser Glu Ile Lys Thr Leu Val Thr Phe Phe Gly Gly Thr Gly Asp
1 5 10 15
Leu Ala Lys Arg Lys Leu Tyr Pro Ser Val Phe Asn Leu Tyr Lys Lys
20 25 30
Gly Tyr Leu Gln Lys His Phe Ala Ile Val Gly Thr Ala Arg Gln Ala
35 40 45
Leu Asn Asp Asp Glu Phe Lys Gln Leu Val Arg Asp Ser Ile Lys Asp
50 55 60
Phe Thr Asp Asp Gln Ala Gln Ala Glu Ala Phe Ile Glu His Phe Ser
65 70 75 80
Tyr Arg Ala His Asp Val Thr Asp Ala Ala Ser Tyr Ala Val Leu Lys
85 90 95
Glu Ala Ile Glu Glu Ala Ala Asp Lys Phe Asp Ile Asp Gly Asn Arg
100 105 110
Ile Phe Tyr Met Ser Val Ala Pro Arg Phe Phe Gly Thr Ile Ala Lys
115 120 125
Tyr Leu Lys Ser Glu Gly Leu Leu Ala Asp Thr Gly Tyr Asn Arg Leu
130 135 140
Met Ile Glu Lys Pro Phe Gly Thr Ser Tyr Asp Thr Ala Ala Glu Leu
145 150 155 160
Gln Asn Asp Leu Glu Asn Ala Phe Asp Asp Asn Gln Leu Phe Arg Ile
165 170 175
Asp His Tyr Leu Gly Lys Glu Met Val Gln Asn Ile Ala Ala Leu Arg
180 185 190
Phe Gly Asn Pro Ile Phe Asp Ala Ala Trp Asn Lys Asp Tyr Ile Lys
195 200 205
Asn Val Gln Val Thr Leu Ser Glu Val Leu Gly Val Glu Glu Arg Ala
210 215 220
Gly Tyr Tyr Asp Thr Ala Gly Ala Leu Leu Asp Met Ile Gln Asn His
225 230 235 240
Thr Met Gln Ile Val Gly Trp Leu Ala Met Glu Lys Pro Glu Ser Phe
245 250 255
Thr Asp Lys Asp Ile Arg Ala Ala Lys Asn Ala Ala Phe Asn Ala Leu
260 265 270
Lys Ile Tyr Asp Glu Ala Glu Val Asn Lys Tyr Phe Val Arg Ala Gln
275 280 285
Tyr Gly Ala Gly Asp Ser Ala Asp Phe Lys Pro Tyr Leu Glu Glu Leu
290 295 300
Asp Val Pro Ala Asp Ser Lys Asn Asn Thr Phe Ile Ala Gly Glu Leu
305 310 315 320
Gln Phe Asp Leu Pro Arg Trp Glu Gly Val Pro Phe Tyr Val Arg Ser
325 330 335
Gly Lys Arg Leu Ala Ala Lys Gln Thr Arg Val Asp Ile Val Phe Lys
340 345 350
Ala Gly Thr Phe Asn Phe Gly Ser Glu Gln Glu Ala Gln Glu Ala Val
355 360 365
Leu Ser Ile Ile Ile Asp Pro Lys Gly Ala Ile Glu Leu Lys Leu Asn
370 375 380
Ala Lys Ser Val Glu Asp Ala Phe Asn Thr Arg Thr Ile Asp Leu Gly
385 390 395 400
Trp Thr Val Ser Asp Glu Asp Lys Lys Asn Thr Pro Glu Pro Tyr Glu
405 410 415
Arg Met Ile His Asp Thr Met Asn Gly Asp Gly Ser Asn Phe Ala Asp
420 425 430
Trp Asn Gly Val Ser Ile Ala Trp Lys Phe Val Asp Ala Ile Ser Ala
435 440 445
Val Tyr Thr Ala Asp Lys Ala Pro Leu Glu Thr Tyr Lys Ser Gly Ser
450 455 460
Met Gly Pro Glu Ala Ser Asp Lys Leu Leu Ala Ala Asn Gly Asp Ala
465 470 475 480
Trp Val Phe Lys Gly
485
<210> 2
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Arg Leu Glu Ile Cys Gln Asn Val Cys Tyr Tyr Leu Gly Thr Leu
1 5 10 15
<210> 3
<211> 500
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Val Ser Glu Ile Lys Thr Leu Val Thr Phe Phe Gly Gly Thr Gly Asp
1 5 10 15
Leu Ala Lys Arg Lys Leu Tyr Pro Ser Val Phe Asn Leu Tyr Lys Lys
20 25 30
Gly Tyr Leu Gln Lys His Phe Ala Ile Val Gly Thr Ala Arg Gln Ala
35 40 45
Leu Asn Asp Asp Glu Phe Lys Gln Leu Val Arg Asp Ser Ile Lys Asp
50 55 60
Phe Thr Asp Asp Gln Ala Gln Ala Glu Ala Phe Ile Glu His Phe Ser
65 70 75 80
Tyr Arg Ala His Asp Val Thr Asp Ala Ala Ser Tyr Ala Val Leu Lys
85 90 95
Glu Ala Ile Glu Glu Ala Ala Asp Lys Phe Asp Ile Asp Gly Asn Arg
100 105 110
Ile Phe Tyr Met Ser Val Ala Pro Arg Phe Phe Gly Thr Ile Ala Lys
115 120 125
Tyr Leu Lys Ser Glu Gly Leu Leu Ala Asp Thr Gly Tyr Asn Arg Leu
130 135 140
Met Ile Glu Lys Pro Phe Gly Thr Ser Tyr Asp Thr Ala Ala Glu Leu
145 150 155 160
Gln Asn Asp Leu Glu Asn Ala Phe Asp Asp Asn Gln Leu Phe Arg Ile
165 170 175
Asp His Tyr Leu Gly Lys Glu Met Val Gln Asn Ile Ala Ala Leu Arg
180 185 190
Phe Gly Asn Pro Ile Phe Asp Ala Ala Trp Asn Lys Asp Tyr Ile Lys
195 200 205
Asn Val Gln Val Thr Leu Ser Glu Val Leu Gly Val Glu Glu Arg Ala
210 215 220
Gly Tyr Tyr Asp Thr Ala Gly Ala Leu Leu Asp Met Ile Gln Asn His
225 230 235 240
Thr Met Gln Ile Val Gly Trp Leu Ala Met Glu Lys Pro Glu Ser Phe
245 250 255
Thr Asp Lys Asp Ile Arg Ala Ala Lys Asn Ala Ala Phe Asn Ala Leu
260 265 270
Lys Ile Tyr Asp Glu Ala Glu Val Asn Lys Tyr Phe Val Arg Ala Gln
275 280 285
Tyr Gly Ala Gly Asp Ser Ala Asp Phe Lys Pro Tyr Leu Glu Glu Leu
290 295 300
Arg Leu Glu Ile Cys Gln Asn Val Cys Tyr Tyr Leu Gly Thr Leu Asp
305 310 315 320
Val Pro Ala Asp Ser Lys Asn Asn Thr Phe Ile Ala Gly Glu Leu Gln
325 330 335
Phe Asp Leu Pro Arg Trp Glu Gly Val Pro Phe Tyr Val Arg Ser Gly
340 345 350
Lys Arg Leu Ala Ala Lys Gln Thr Arg Val Asp Ile Val Phe Lys Ala
355 360 365
Gly Thr Phe Asn Phe Gly Ser Glu Gln Glu Ala Gln Glu Ala Val Leu
370 375 380
Ser Ile Ile Ile Asp Pro Lys Gly Ala Ile Glu Leu Lys Leu Asn Ala
385 390 395 400
Lys Ser Val Glu Asp Ala Phe Asn Thr Arg Thr Ile Asp Leu Gly Trp
405 410 415
Thr Val Ser Asp Glu Asp Lys Lys Asn Thr Pro Glu Pro Tyr Glu Arg
420 425 430
Met Ile His Asp Thr Met Asn Gly Asp Gly Ser Asn Phe Ala Asp Trp
435 440 445
Asn Gly Val Ser Ile Ala Trp Lys Phe Val Asp Ala Ile Ser Ala Val
450 455 460
Tyr Thr Ala Asp Lys Ala Pro Leu Glu Thr Tyr Lys Ser Gly Ser Met
465 470 475 480
Gly Pro Glu Ala Ser Asp Lys Leu Leu Ala Ala Asn Gly Asp Ala Trp
485 490 495
Val Phe Lys Gly
500
<210> 4
<211> 485
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Val Ser Glu Ile Lys Thr Leu Val Thr Phe Phe Gly Gly Thr Gly Asp
1 5 10 15
Leu Ala Lys Arg Lys Leu Tyr Pro Ser Val Phe Asn Leu Tyr Lys Lys
20 25 30
Gly Tyr Leu Gln Lys His Phe Ala Ile Val Gly Thr Ala Arg Gln Ala
35 40 45
Leu Asn Asp Asp Glu Phe Lys Cys Leu Val Arg Asp Ser Ile Lys Asp
50 55 60
Phe Thr Asp Asp Gln Ala Gln Ala Glu Ala Phe Ile Glu His Phe Ser
65 70 75 80
Tyr Arg Ala His Asp Val Thr Asp Ala Ala Ser Tyr Ala Val Leu Lys
85 90 95
Glu Ala Ile Glu Glu Ala Ala Asp Lys Phe Asp Ile Asp Gly Asn Arg
100 105 110
Ile Phe Tyr Met Ser Val Ala Pro Arg Phe Phe Gly Thr Ile Ala Lys
115 120 125
Tyr Leu Lys Ser Glu Gly Leu Leu Ala Asp Thr Gly Tyr Asn Arg Leu
130 135 140
Met Ile Glu Lys Pro Phe Gly Thr Ser Tyr Asp Thr Ala Ala Glu Leu
145 150 155 160
Gln Asn Asp Leu Glu Asn Ala Phe Asp Asp Asn Gln Leu Phe Arg Ile
165 170 175
Asp His Tyr Leu Gly Lys Glu Met Val Gln Asn Ile Ala Ala Leu Arg
180 185 190
Phe Gly Asn Pro Ile Phe Asp Ala Ala Trp Asn Lys Asp Tyr Ile Lys
195 200 205
Asn Val Gln Val Thr Leu Ser Glu Val Leu Gly Val Glu Glu Arg Ala
210 215 220
Gly Tyr Tyr Asp Thr Ala Gly Ala Leu Leu Asp Met Ile Gln Asn His
225 230 235 240
Thr Met Gln Ile Val Gly Trp Leu Ala Met Glu Lys Pro Glu Ser Phe
245 250 255
Thr Asp Lys Asp Ile Arg Ala Ala Lys Asn Ala Ala Phe Asn Ala Leu
260 265 270
Lys Ile Tyr Asp Glu Ala Glu Val Asn Lys Tyr Phe Val Arg Ala Gln
275 280 285
Tyr Gly Ala Gly Asp Ser Ala Asp Phe Lys Pro Tyr Leu Glu Glu Leu
290 295 300
Asp Val Pro Ala Asp Ser Lys Asn Asn Thr Phe Ile Ala Gly Glu Leu
305 310 315 320
Gln Phe Asp Leu Pro Arg Trp Glu Gly Val Pro Phe Tyr Val Arg Ser
325 330 335
Gly Lys Arg Leu Ala Ala Lys Gln Thr Arg Val Asp Ile Val Phe Lys
340 345 350
Ala Gly Thr Phe Asn Phe Gly Ser Glu Gln Glu Ala Gln Glu Ala Val
355 360 365
Leu Ser Ile Ile Ile Asp Pro Lys Gly Ala Ile Glu Leu Lys Leu Asn
370 375 380
Ala Lys Ser Val Glu Asp Ala Phe Asn Thr Arg Thr Ile Asp Leu Gly
385 390 395 400
Trp Thr Val Ser Asp Glu Asp Lys Lys Asn Thr Pro Glu Pro Tyr Glu
405 410 415
Arg Met Ile His Asp Thr Met Asn Gly Asp Gly Ser Asn Phe Ala Asp
420 425 430
Trp Asn Gly Val Ser Ile Ala Trp Lys Phe Val Asp Ala Ile Ser Ala
435 440 445
Val Tyr Thr Ala Asp Lys Ala Pro Leu Glu Thr Tyr Lys Ser Gly Ser
450 455 460
Met Gly Pro Glu Ala Ser Asp Lys Leu Leu Ala Ala Asn Gly Asp Ala
465 470 475 480
Trp Val Phe Lys Gly
485
<210> 6
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Glu Trp Ala Cys Asn Asp Arg Gly Phe Asn Cys Gln Leu Gln Arg
1 5 10 15
<210> 6
<211> 494
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Val Ser Glu Ile Lys Thr Leu Val Thr Phe Phe Gly Gly Thr Gly Asp
1 5 10 15
Leu Ala Lys Arg Lys Leu Tyr Pro Ser Val Phe Asn Leu Tyr Lys Lys
20 25 30
Gly Tyr Leu Gln Lys His Phe Ala Ile Val Gly Thr Ala Arg Gln Ala
35 40 45
Leu Asn Asp Asp Glu Phe Lys Gln Leu Val Arg Asp Ser Ile Lys Asp
50 55 60
Phe Thr Asp Asp Gln Ala Gln Ala Glu Ala Phe Ile Glu His Phe Ser
65 70 75 80
Tyr Arg Ala His Asp Val Thr Asp Ala Ala Ser Tyr Ala Val Leu Lys
85 90 95
Glu Ala Ile Glu Glu Ala Ala Asp Lys Phe Asp Ile Asp Gly Asn Arg
100 105 110
Ile Phe Tyr Met Ser Val Ala Pro Arg Phe Phe Gly Thr Ile Ala Lys
115 120 125
Tyr Leu Lys Ser Glu Gly Leu Leu Ala Asp Thr Gly Tyr Asn Arg Leu
130 135 140
Met Ile Glu Lys Pro Phe Gly Thr Ser Tyr Asp Thr Ala Ala Glu Leu
145 150 155 160
Gln Asn Asp Leu Glu Asn Ala Phe Asp Asp Asn Gln Leu Phe Arg Ile
165 170 175
Asp His Tyr Leu Gly Lys Glu Met Val Gln Asn Ile Ala Ala Leu Arg
180 185 190
Phe Gly Asn Pro Ile Phe Asp Ala Ala Trp Asn Lys Asp Tyr Ile Lys
195 200 205
Asn Val Gln Val Thr Leu Ser Glu Val Leu Gly Val Glu Glu Arg Ala
210 215 220
Gly Tyr Tyr Asp Thr Ala Gly Ala Leu Leu Asp Met Ile Gln Asn His
225 230 235 240
Thr Met Gln Ile Val Gly Trp Leu Ala Met Glu Lys Pro Glu Ser Phe
245 250 255
Thr Asp Lys Asp Ile Arg Ala Ala Lys Asn Ala Ala Phe Asn Ala Leu
260 265 270
Lys Ile Tyr Asp Glu Ala Glu Val Asn Lys Tyr Phe Val Arg Ala Gln
275 280 285
Tyr Gly Ala Glu Trp Ala Cys Asn Asp Arg Gly Phe Asn Cys Gln Leu
290 295 300
Gln Arg Lys Pro Tyr Leu Glu Glu Leu Asp Val Pro Ala Asp Ser Lys
305 310 315 320
Asn Asn Thr Phe Ile Ala Gly Glu Leu Gln Phe Asp Leu Pro Arg Trp
325 330 335
Glu Gly Val Pro Phe Tyr Val Arg Ser Gly Lys Arg Leu Ala Ala Lys
340 345 350
Gln Thr Arg Val Asp Ile Val Phe Lys Ala Gly Thr Phe Asn Phe Gly
355 360 365
Ser Glu Gln Glu Ala Gln Glu Ala Val Leu Ser Ile Ile Ile Asp Pro
370 375 380
Lys Gly Ala Ile Glu Leu Lys Leu Asn Ala Lys Ser Val Glu Asp Ala
385 390 395 400
Phe Asn Thr Arg Thr Ile Asp Leu Gly Trp Thr Val Ser Asp Glu Asp
405 410 415
Lys Lys Asn Thr Pro Glu Pro Tyr Glu Arg Met Ile His Asp Thr Met
420 425 430
Asn Gly Asp Gly Ser Asn Phe Ala Asp Trp Asn Gly Val Ser Ile Ala
435 440 445
Trp Lys Phe Val Asp Ala Ile Ser Ala Val Tyr Thr Ala Asp Lys Ala
450 455 460
Pro Leu Glu Thr Tyr Lys Ser Gly Ser Met Gly Pro Glu Ala Ser Asp
465 470 475 480
Lys Leu Leu Ala Ala Asn Gly Asp Ala Trp Val Phe Lys Gly
485 490
<210> 7
<211> 73
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Asp Pro Ser Gly Asp Pro Arg Ala Ser Ser Asn Ser Leu Ala Val Val
1 5 10 15
Leu Gln Arg Arg Asp Trp Glu Asn Pro Gly Val Thr Glu Leu Asn Arg
20 25 30
Leu Ala Ala His Pro Pro Phe Ala Ser Trp Arg Asn Cys Glu Glu Ala
35 40 45
Arg Thr Asp Arg Pro Ser Gln Gln Leu Arg Ser Leu Asn Gly Leu Glu
50 55 60
Ser Arg Ser Ala Gly Met Pro Leu Glu
65 70
<210> 8
<211> 995
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Thr Met Ile Thr Asp Ser Leu Ala Val Val Leu Gln Glu Ala Arg Thr
1 5 10 15
Asp Arg Pro Ser Gln Gln Leu Arg Ser Leu Asn Gly Glu Trp Arg Phe
20 25 30
Ala Trp Phe Pro Ala Pro Glu Ala Val Pro Glu Ser Trp Leu Glu Cys
35 40 45
Asp Leu Pro Glu Ala Asp Thr Val Val Val Pro Ser Asn Trp Gln Met
50 55 60
His Gly Tyr Asp Ala Pro Ile Tyr Thr Asn Val Thr Tyr Pro Ile Thr
65 70 75 80
Val Asn Pro Pro Phe Val Pro Thr Glu Asn Pro Thr Gly Cys Tyr Ser
85 90 95
Leu Thr Phe Asn Val Asp Glu Ser Trp Leu Gln Glu Gly Gln Thr Arg
100 105 110
Ile Ile Phe Asp Gly Val Asn Ser Ala Phe His Leu Trp Cys Asn Gly
115 120 125
Arg Trp Val Gly Tyr Gly Gln Asp Ser Arg Leu Pro Ser Glu Phe Asp
130 135 140
Leu Ser Ala Phe Leu Arg Ala Gly Glu Asn Arg Leu Ala Val Met Val
145 150 155 160
Leu Arg Trp Ser Asp Gly Ser Tyr Leu Glu Asp Gln Asp Met Trp Arg
165 170 175
Met Ser Gly Ile Phe Arg Asp Val Ser Leu Leu His Lys Pro Thr Thr
180 185 190
Gln Ile Ser Asp Phe His Val Ala Thr Arg Phe Asn Asp Asp Phe Ser
195 200 205
Arg Ala Val Leu Glu Ala Glu Val Gln Met Cys Gly Glu Leu Arg Asp
210 215 220
Tyr Leu Arg Val Thr Val Ser Leu Trp Gln Gly Glu Thr Gln Val Ala
225 230 235 240
Ser Gly Thr Ala Pro Phe Gly Gly Glu Ile Ile Asp Glu Arg Gly Gly
245 250 255
Tyr Ala Asp Arg Val Thr Leu Arg Leu Asn Val Glu Asn Pro Lys Leu
260 265 270
Trp Ser Ala Glu Ile Pro Asn Leu Tyr Arg Ala Val Val Glu Leu His
275 280 285
Thr Ala Asp Gly Thr Leu Ile Glu Ala Glu Ala Cys Asp Val Gly Phe
290 295 300
Arg Glu Val Arg Ile Glu Asn Gly Leu Leu Leu Leu Asn Gly Lys Pro
305 310 315 320
Leu Leu Ile Arg Gly Val Asn Arg His Glu His His Pro Leu His Gly
325 330 335
Gln Val Met Asp Glu Gln Thr Met Val Gln Asp Ile Leu Leu Met Lys
340 345 350
Gln Asn Asn Phe Asn Ala Val Arg Cys Ser His Tyr Pro Asn His Pro
355 360 365
Leu Trp Tyr Thr Leu Cys Asp Arg Tyr Gly Leu Tyr Val Val Asp Glu
370 375 380
Ala Asn Ile Glu Thr His Gly Met Val Pro Met Asn Arg Leu Thr Asp
385 390 395 400
Asp Pro Arg Trp Leu Pro Ala Met Ser Glu Arg Val Thr Arg Met Val
405 410 415
Gln Arg Asp Arg Asn His Pro Ser Val Ile Ile Trp Ser Leu Gly Asn
420 425 430
Glu Ser Gly His Gly Ala Asn His Asp Ala Leu Tyr Arg Trp Ile Lys
435 440 445
Ser Val Asp Pro Ser Arg Pro Val Gln Tyr Glu Gly Gly Gly Ala Asp
450 455 460
Thr Thr Ala Thr Asp Ile Ile Cys Pro Met Tyr Ala Arg Val Asp Glu
465 470 475 480
Asp Gln Pro Phe Pro Ala Val Pro Lys Trp Ser Ile Lys Lys Trp Leu
485 490 495
Ser Leu Pro Gly Glu Thr Arg Pro Leu Ile Leu Cys Glu Tyr Ala His
500 505 510
Ala Met Gly Asn Ser Leu Gly Gly Phe Ala Lys Tyr Trp Gln Ala Phe
515 520 525
Arg Gln Tyr Pro Arg Leu Gln Gly Gly Phe Val Trp Asp Trp Val Asp
530 535 540
Gln Ser Leu Ile Lys Tyr Asp Glu Asn Gly Asn Pro Trp Ser Ala Tyr
545 550 555 560
Gly Gly Asp Phe Gly Asp Thr Pro Asn Asp Arg Gln Phe Cys Met Asn
565 570 575
Gly Leu Val Phe Ala Asp Arg Thr Pro His Pro Ala Leu Thr Glu Ala
580 585 590
Lys His Gln Gln Gln Phe Phe Gln Phe Arg Leu Ser Gly Gln Thr Ile
595 600 605
Glu Val Thr Ser Glu Tyr Leu Phe Arg His Ser Asp Asn Glu Leu Leu
610 615 620
His Trp Met Val Ala Leu Asp Gly Lys Pro Leu Ala Ser Gly Glu Val
625 630 635 640
Pro Leu Asp Val Ala Pro Gln Gly Lys Gln Leu Ile Glu Leu Pro Glu
645 650 655
Leu Pro Gln Pro Glu Ser Ala Gly Gln Leu Trp Leu Thr Val Arg Val
660 665 670
Val Gln Pro Asn Ala Thr Ala Trp Ser Glu Ala Gly His Ile Ser Ala
675 680 685
Trp Gln Gln Trp Arg Leu Ala Glu Asn Leu Ser Val Thr Leu Pro Ala
690 695 700
Ala Ser His Ala Ile Pro His Leu Thr Thr Ser Glu Met Asp Phe Cys
705 710 715 720
Ile Glu Leu Gly Asn Lys Arg Trp Gln Phe Asn Arg Gln Ser Gly Phe
725 730 735
Leu Ser Gln Met Trp Ile Gly Asp Lys Lys Gln Leu Leu Thr Pro Leu
740 745 750
Arg Asp Gln Phe Thr Arg Ala Pro Leu Asp Asn Asp Ile Gly Val Ser
755 760 765
Glu Ala Thr Arg Ile Asp Pro Asn Ala Trp Val Glu Arg Trp Lys Ala
770 775 780
Ala Gly His Tyr Gln Ala Glu Ala Ala Leu Leu Gln Cys Thr Ala Asp
785 790 795 800
Thr Leu Ala Asp Ala Val Leu Ile Thr Thr Ala His Ala Trp Gln His
805 810 815
Gln Gly Lys Thr Leu Phe Ile Ser Arg Lys Thr Tyr Arg Ile Asp Gly
820 825 830
Ser Gly Gln Met Ala Ile Thr Val Asp Val Glu Val Ala Ser Asp Thr
835 840 845
Pro His Pro Ala Arg Ile Gly Leu Asn Cys Gln Leu Ala Gln Val Ala
850 855 860
Glu Arg Val Asn Trp Leu Gly Leu Gly Pro Gln Glu Asn Tyr Pro Asp
865 870 875 880
Arg Leu Thr Ala Ala Cys Phe Asp Arg Trp Asp Leu Pro Leu Ser Asp
885 890 895
Met Tyr Thr Pro Tyr Val Phe Pro Ser Glu Asn Gly Leu Arg Cys Gly
900 905 910
Thr Arg Glu Leu Asn Tyr Gly Pro His Gln Trp Arg Gly Asp Phe Gln
915 920 925
Phe Asn Ile Ser Arg Tyr Ser Gln Gln Gln Leu Met Glu Thr Ser His
930 935 940
Arg His Leu Leu His Ala Glu Glu Gly Thr Trp Leu Asn Ile Asp Gly
945 950 955 960
Phe His Met Gly Ile Gly Gly Asp Asp Ser Trp Ser Pro Ser Val Ser
965 970 975
Ala Glu Phe Gln Leu Ser Ala Gly Arg Tyr His Tyr Gln Leu Val Trp
980 985 990
Cys Gln Lys
995

Claims (16)

1.一种人工改造蛋白质,其特征在于,包括一个或多个人为引入的结合域,所述人为引入的结合域与改造前的蛋白质连接;其中,连接的位置为:改造前的蛋白质的能够与溶液直接接触的、邻近蛋白质活性中心的位置;
所述人为引入的结合域能够特异性识别并结合目标分子;所述人工改造蛋白质的生物学活性受所述目标分子调控。
2.根据权利要求1所述的人工改造蛋白质,其特征在于,
所述人为引入的结合域与目标分子的解离常数≤10-6摩尔/升;和/或
所述结合域通过共价连接的方式与改造前的蛋白质连接;和/或
所述人工改造蛋白质包括多个人为引入的结合域时,所述多个人为引入的结合域分别单独特异性识别并结合目标分子,或多个人为引入的结合域协同识别并结合目标分子。
3.根据权利要求2所述的人工改造蛋白质,其特征在于,所述结合域直接与改造前的蛋白质连接;或通过接头序列与改造前的蛋白质连接。
4.根据权利要求1-3任一项所述的人工改造蛋白质,其特征在于,所述改造前的蛋白质为:葡萄糖-6-磷酸脱氢酶。
5.根据权利要求4所述的人工改造蛋白质,其特征在于,所述葡萄糖-6-磷酸脱氢酶的氨基酸序列如SEQ ID NO.1所示;所述人为引入的结合域与改造前的蛋白质连接为:
a)在葡萄糖-6-磷酸脱氢酶的304位的氨基酸后插入多肽配体,作为人为引入的结合域;或
b)将葡萄糖-6-磷酸脱氢酶的56位谷氨酰胺点突变为半胱氨酸,并偶联多肽配体,作为人为引入的结合域;或
c)将葡萄糖-6-磷酸脱氢酶292-297位的氨基酸删除,并在291位的氨基酸后面插入多肽配体,作为人为引入的结合域。
6.一种人工改造蛋白质的构建方法,其特征在于,包括以下步骤:
(1)预测、选定在改造前的蛋白质上用于人为引入结合域的位置;所述用于人为引入结合域的位置为:改造前的蛋白质的能够与溶液直接接触的、邻近蛋白质活性中心的位置;
(2)筛选得到所述结合域,将所述结合域连接至改造前的蛋白质上用于人为引入结合域的位置,制备得到人工改造蛋白质。
7.根据权利要求6所述的构建方法,其特征在于,
步骤(1)所述的预测、选定在改造前的蛋白质上用于人为引入结合域的区域,步骤如下:
根据改造前蛋白质的三维结构或改造前蛋白的同源序列保守信息,选取临近活性中心、但不直接发挥生物学功能的位置;或
在改造前蛋白质上随机插入已知多肽配体,得一系列改造蛋白质;鉴别多肽配体与目标分子结合后改造蛋白质的活性;根据改造蛋白质上已知多肽所在的位置,选定人工改造蛋白质上人为引入结合域的位置。
8.根据权利要求7所述的构建方法,其特征在,所述改造前的蛋白质上用于人为引入结合域的区域为:能够与溶液直接接触的、柔性的环状结构。
9.根据权利要求6所述的构建方法,其特征在于,步骤(2)所述制备得到人工改造蛋白质,包括:
将多样化核酸序列克隆到所述的用于人为引入结合域的位置,制备表达载体,表达得多样性融合蛋白,筛选,得到能与目标分子特异性结合的蛋白质,利用蛋白质的核酸信息进行克隆表达,制备得到人工改造蛋白质;或
将多样化核酸序列克隆到表达载体,表达得多样性多肽,筛选,得到能与目标分子特异性结合的多肽,通过化学偶联的方式,连接至改造前的蛋白质上用于人为引入结合域的位置,制备得到人工改造蛋白质;或
构建得单链寡核苷酸库,筛选,得到与目标分子有高亲和力的DNA或RNA,通过化学偶联的方式,连接到改造前的蛋白质上用于人为引入结合域的位置,制备得到人工改造蛋白质。
10.根据权利要求9所述的构建方法,其特征在于,得到能与目标分子特异性结合的多肽后,将所述多肽连接至改造前的蛋白质上用于人为引入结合域的位置的方法为:
将所述能与目标分子特异性结合的多肽对应的核酸序列,克隆至所述人为引入的结合域的位置,表达得到所述人工蛋白;或
将所述能与目标分子特异性结合的多肽或单链寡核苷酸,通过化学偶联的方式连接至所述人为引入的结合域的位置,得到所述人工蛋白。
11.根据权利要求根据权利要求9所述的构建方法,其特征在于,步骤(2)包括:
利用噬菌体表面展示技术,构建编码一定数量氨基酸的多样化核酸序列,将多样化核酸序列克隆到表达载体上,使基因表达产物展示在噬菌体表面,得噬菌体表面展示多肽;
筛选能够与目标分子特异性结合的噬菌体表面展示多肽,得多肽适配体,获得编码多肽适配体的基因信息;
将编码多肽适配体的基因序列插入至改造前的蛋白质上用于人为引入结合域的位置的基因序列中,得人工蛋白序列信息;
通过克隆表达或人工合成,制备得到人工蛋白。
12.根据权利要求11所述的构建方法,其特征在于,所述获得编码多肽适配体的基因信息后,通过克隆表达或人工合成,得到所述多肽适配体;
通过化学偶联法将所述多肽适配体连接至改造前的蛋白质上用于人为引入结合域的位置。
13.根据权利要求9所述的构建方法,其特征在于,步骤(2)包括:
利用噬菌体表面展示技术,构建编码一定数量氨基酸的多样化核酸序列,将多样化核酸序列克隆到编码改造前蛋白质的基因上编码人为引入结合域的位置,形成编码改造后蛋白质的基因序列;所述编码改造后蛋白质的基因序列在相应的结合域具有多样化核酸序列;
将编码改造后蛋白质的基因序列克隆到表达载体上,使基因表达产物展示在噬菌体表面,得噬菌体表面展示蛋白;
筛选能够与目标分子特异性结合的噬菌体表面展示蛋白,得能够与目标分子特异性结合的改造后蛋白质的基因信息;
通过克隆表达或人工合成,制备得到人工蛋白。
14.根据权利要求6-13任一项所述的构建方法,其特征在于,所述表达载体包括噬菌体、酵母、核糖体、细菌、mRNA中的任一种;和/或
所述的筛选为:计算机辅助虚拟筛选和/或生物淘洗;和/或
所述目标分子为蛋白质、核酸、病毒颗粒、多肽、微生物或微生物的部分结构;和/或
所述的构建方法还包括:在制备得到人工改造蛋白质后,进行调控活性鉴定;和/或
所述目标分子的分子量≥500道尔顿。
15.如权利要求1-5任一项所述的人工改造蛋白质在检测目标分子中的应用。
16.一种利用人工改造蛋白质检测目标分子的方法,其特征在于,根据所需检测的目标分子,构建得到如权利要求1-5任一项所述的人工改造蛋白,所需检测的目标分子与所述人工改造蛋白上的人为引入的结合域特异性结合,并改变所述人工改造蛋白的生物学活性,通过检测所述人工改造蛋白的生物学活性变化来检测目标分子。
CN201910532509.3A 2018-06-22 2019-06-19 人工改造蛋白质及其构建方法与应用 Active CN110386986B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810649101X 2018-06-22
CN201810649101 2018-06-22

Publications (2)

Publication Number Publication Date
CN110386986A true CN110386986A (zh) 2019-10-29
CN110386986B CN110386986B (zh) 2024-01-26

Family

ID=68285502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910532509.3A Active CN110386986B (zh) 2018-06-22 2019-06-19 人工改造蛋白质及其构建方法与应用

Country Status (1)

Country Link
CN (1) CN110386986B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111413383A (zh) * 2020-04-20 2020-07-14 深圳市梅丽纳米孔科技有限公司 一种构建双识别位点纳米孔的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5362625A (en) * 1991-05-15 1994-11-08 Microgenics Corporation Methods and compositions for enzyme complementation assays using the omega region of β-galactosidase
JP2001120273A (ja) * 1999-10-22 2001-05-08 Toyobo Co Ltd タンパク質の改変方法および改変タンパク質
CN102269762A (zh) * 2010-06-04 2011-12-07 深圳迈瑞生物医疗电子股份有限公司 结合物的制备方法及相关试剂盒
US20110301334A1 (en) * 2010-06-08 2011-12-08 Sunil Bhakta Cysteine engineered antibodies and conjugates

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5362625A (en) * 1991-05-15 1994-11-08 Microgenics Corporation Methods and compositions for enzyme complementation assays using the omega region of β-galactosidase
JP2001120273A (ja) * 1999-10-22 2001-05-08 Toyobo Co Ltd タンパク質の改変方法および改変タンパク質
CN102269762A (zh) * 2010-06-04 2011-12-07 深圳迈瑞生物医疗电子股份有限公司 结合物的制备方法及相关试剂盒
US20110301334A1 (en) * 2010-06-08 2011-12-08 Sunil Bhakta Cysteine engineered antibodies and conjugates

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LEE,W.T., ET AL.: ""RecName: Full=Glucose-6-phosphate 1-dehydrogenase; Short=G6PD; AltName: Full=Glucose-6-phosphate dehydrogenase (NAD(P)(+)),UniProtKB/Swiss-Prot:P11411.4"", 《NCBI GENBANK》 *
LEE,W.T., ET AL.: ""RecName: Full=Glucose-6-phosphate 1-dehydrogenase; Short=G6PD; AltName: Full=Glucose-6-phosphate dehydrogenase (NAD(P)(+)),UniProtKB/Swiss-Prot:P11411.4"", 《NCBI GENBANK》, 25 October 2017 (2017-10-25), pages 1 - 2 *
PAUL ROWLAND, ET AL.: ""The three–dimensional structure of glucose 6–phosphate dehydrogenase from Leuconostoc mesenteroides refined at 2.0 Å resolution"", 《CELL PRESS》 *
PAUL ROWLAND, ET AL.: ""The three–dimensional structure of glucose 6–phosphate dehydrogenase from Leuconostoc mesenteroides refined at 2.0 Å resolution"", 《CELL PRESS》, 1 November 1994 (1994-11-01) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111413383A (zh) * 2020-04-20 2020-07-14 深圳市梅丽纳米孔科技有限公司 一种构建双识别位点纳米孔的方法
CN111413383B (zh) * 2020-04-20 2021-03-02 深圳市梅丽纳米孔科技有限公司 一种构建双识别位点纳米孔的方法

Also Published As

Publication number Publication date
CN110386986B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
Koide et al. Target-binding proteins based on the 10th human fibronectin type III domain (10Fn3)
CA2583009C (en) Ubiquitin or gamma-crystalline conjugates for use in therapy, diagnosis and chromatography
Plückthun et al. In vitro selection and evolution of proteins
CN101652386B (zh) Ob-fold作为支架用于工程化新的特异性结合物
US5843701A (en) Systematic polypeptide evolution by reverse translation
ES2860453T3 (es) Bibliotecas universales del dominio de unión del lado inferior de la fibronectina de tipo III
JP4493271B2 (ja) C型レクチン様ドメインの骨格構造を有する蛋白質のコンビナトリアルライブラリ
Rajan et al. Simplified synthetic antibody libraries
CN101258243A (zh) 新的噬菌体展示技术
KR20100113481A (ko) 단백질 스캐폴드
CN101506227A (zh) Ob折叠结构域
WO1993008278A1 (en) Peptide library and screening method
WO1993003172A1 (en) Systematic polypeptide evolution by reverse translation
CN109970858B (zh) Cd22单域抗体、核苷酸序列及试剂盒
CN105247050B (zh) 用于文库构建、亲和力结合剂筛选和其表达的整合系统
EP4130260A1 (en) Construction method and application of antigen-specific binding polypeptide gene display vector
Zwick et al. The maltose-binding protein as a scaffold for monovalent display of peptides derived from phage libraries
TW201410709A (zh) 肽庫及其利用
EP3650465A1 (en) Novel populations of polypeptides having a triple-helical structure
EP1773994A2 (en) Polypeptide
CN105247118A (zh) 支架化肽文库以及其制备和筛选方法
CN110386986A (zh) 人工改造蛋白质及其构建方法与应用
Pedrazzi et al. Affinity and folding properties both influence the selection of antibodies with the selectively infective phage (SIP) methodology
WO2009107682A1 (ja) ヒト型Fcレセプターをコードするポリヌクレオチド、およびそれを利用したヒト型Fcレセプターの製造方法
TW201309720A (zh) 胜肽庫

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant