CN108197429A - 一种基于分子对接技术的代谢物肽适体快速筛选方法 - Google Patents

一种基于分子对接技术的代谢物肽适体快速筛选方法 Download PDF

Info

Publication number
CN108197429A
CN108197429A CN201810004249.8A CN201810004249A CN108197429A CN 108197429 A CN108197429 A CN 108197429A CN 201810004249 A CN201810004249 A CN 201810004249A CN 108197429 A CN108197429 A CN 108197429A
Authority
CN
China
Prior art keywords
peptide
amino acid
target metabolite
peptide aptamer
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810004249.8A
Other languages
English (en)
Other versions
CN108197429B (zh
Inventor
冯泽猛
贺玉敏
邓磊
印遇龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Subtropical Agriculture of CAS
Original Assignee
Institute of Subtropical Agriculture of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Subtropical Agriculture of CAS filed Critical Institute of Subtropical Agriculture of CAS
Priority to CN201810004249.8A priority Critical patent/CN108197429B/zh
Publication of CN108197429A publication Critical patent/CN108197429A/zh
Application granted granted Critical
Publication of CN108197429B publication Critical patent/CN108197429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一种基于分子对接模拟计算技术的代谢物肽适体快速筛选方法,该方法包括(1)目标代谢物的确定;(2)获得潜在的与目标代谢物具有结合力的多肽库;(3)潜在多肽库与目标代谢物的分子对接预测等步骤。本方法速度快、目标范围广、无需大量人力物力投入、对实验人员身体无损害,解决了目前肽适体广泛应用的限制因素。本发明可以通过简化肽适体筛选的程序,在最大程度上增大库容,进而便于筛选出特异性与亲和力合适的代谢物肽适体,用于检测试剂盒、传感器等的设计,应用于营养学、生物学以及临床诊断等领域的检测。

Description

一种基于分子对接技术的代谢物肽适体快速筛选方法
技术领域
本发明涉及计算机科学、结构生物学以及营养学等交叉科学,具体涉及一种基于分子对接技术的代谢物肽适体快速筛选方法。
背景技术
蛋白是生命活动的直接执行者,在转运、转化、催化等生理生化过程中,蛋白行使功能的第一步就是对体内代谢物的识别。因此,理论上动物体内与某代谢物相关的感知蛋白应该具有与之相关的特异识别位点,由于蛋白质的高级结构由一级结构决定,识别位点信息应该蕴含在蛋白的一级结构上,具有与与目标特异结合能力的多肽已有研究。肽适体是具有特异性识别特定目标能力的短肽,长度通常为5-20个氨基酸残基,作为“人造抗体”,肽适体在疾病诊断、抗炎、抗肿瘤以及药物靶向呈递中扮演着重要角色,肽适体还可作为新颖的代谢物特异结合配体而用于其识别与检测。目前,肽适体的筛选主要依赖于酵母双杂交、噬菌体展示、核糖体展示、随机多肽库合成等技术来实现。由于多肽合成、鉴定的繁琐以及随机多肽库中与目标结合的多肽含量低,在筛选过程中的人力物力消耗,使得肽适体的研究进展缓慢,筛选过程中使用的有毒试剂对人体也存在危害。此外,肽库容量是筛选出特异性强,亲和力高的肽适体的重要限制因素,是传统方法筛选肽适体的阻碍。
分子对接技术主要应用于药物分子设计领域,是基于计算机科学,通过受体的特征以及受体和药物分子之间的相互作用方式来进行药物设计的方法。主要研究分子间(如配体和受体)相互作用,并预测其结合模式和亲合力的一种理论模拟方法。同时,分子对接也可用于预测小分子之间的结合。通过对肽库中多肽的结构进行模拟,预测其与对应目标分子结合的方法可以节省大量的在肽适体筛选过程中的人力物力消耗,避免筛选过程中的有毒试剂对实验人员的危害,极大的提高筛选效率和肽库容量带来的限制等问题。
分子对接技术目前在核酸适配体的筛选中也有应用。分子对接技术在核酸适配体筛选中的应用主要体现在生成指定长度的完全随机序列,并与靶标分子的对接预测计算。用分子对接进行肽适体筛选的主要优势在于可以充分利用肽适体序列在生物中的可追溯性以及必然存在性。
发明内容
本发明旨在克服现有技术的不足(库容小,人力物力消耗大,时间长,有毒试剂对人体的危害等),提供一种基于分子对接技术的代谢物肽适体快速筛选方法。
为了达到上述目的,本发明提供的技术方案为:
所述基于分子对接技术的代谢物肽适体快速筛选方法包括如下步骤:
(1)确定目标代谢物;
(2)获得潜在的可与目标结合的多肽库:①蛋白查询:在蛋白库如(Uniprot,PDB和NCBI等)中搜索某一动物内源代谢物的所有相关感知、转运及代谢等蛋白,并保存相关蛋白的氨基酸序列;②肽链连接:以转运载体以及感知蛋白一级结构为基础,将所有氨基酸序列连接成一个长度为x个氨基酸残基组成的长肽链,连接方式为第n条氨基酸序列的C末端与第n+1条氨基酸序列的N末端相连;③肽链切割:设定短肽链长度为y,切割方式为以步骤②中获得的长肽链为基础,从第1个氨基酸的N末端开始到第y个氨基酸的C末端切断得到第1条短肽链,从第2个氨基酸的N末端开始到第y+1个氨基酸的C末端切断得到第2条短肽链,以此类推,得到容量为x-y+1个长度为y的肽适体冗余库Library1;④重复序列去除:对短肽库Library1进行去重,若短肽库中的短肽连从N末端到C末端的氨基酸序列完全一致将被认定为重复,重复序列仅保存其中一条,去除重复序列后得到潜在的可与目标结合的肽适体非冗余库Library2;
(3)将肽适体非冗余库Library2中的所有短肽与目标代谢物进行对接预测,筛选出可特异性结合代谢物的短肽,即为代谢物肽适体。
其中,步骤(3)所述对接预测的具体步骤包括:
1)确定目标代谢物,建立代谢物结构参数的“配体.pdb”文件;
2)准备目标代谢物肽适体非冗余库Library2中多肽结构参数,建立“受体.pdb”文件;
3)基于“配体.pdb”和“受体.pdb”文件,预先计算对接配体中每一个原子类型的格
点图;
4)基于“配体.pdb”和“受体.pdb”文件,建立对接参数文件;
5)基于步骤1)至步骤4)生成的文件进行对接计算,对接结果保存在“结果.pbf”中。
优选地,在步骤(3)之后还包括将代谢物肽适体与目标在工作条件(生理条件、实验室分析)特异性结合的验证步骤。
本发明还提供了基于上述方法的氨基酸肽适体库构建方法,该方法是以经试验验证后的长度为y的代谢物肽适体为基础,继续设计新多肽库Library3(多肽链长度在5-20之间),再次经分子对接预测(同步骤(3))和特异性结合试验验证后即得可用传感器等检测技术的氨基酸肽适体优化库Library4。
下面结合原理对本发明作进一步说明:
本发明包括如下内容:
(1)候选多肽库的构建:依据目标代谢物(氨基酸),在蛋白数据库中选择下载人和其他灵长类、常用试验动物(小鼠、大鼠)、猪等物种的与目标代谢物代谢相关的蛋白一级结构即其氨基酸序列。将所有氨基酸序列连接成一个长度为x个氨基酸残基组成的长肽链,连接方式为第n条的C末端与第n+1条的N末端相连;设定短肽链长度为y,切割方式为以获得的长肽链为基础,从第1个氨基酸的N末端开始到第y个氨基酸的C末端切断得到第1条短肽链,从第2个氨基酸的N末端开始到第y+1个氨基酸的C末端切断得到第2条短肽链,依次类推;在此过程中,可得到容量为x-y+1,长度为y的肽适体冗余库Library1。从N末端到C末端氨基酸序列完全一致将被认定为重复,重复序列仅保存其中一条,去除重复序列后得到肽适体非冗余库Library2;
(2)分子对接结合预测:已知三维结构数据库中的分子逐一放在目标分子的活性位点处,通过不断优化受体化合物的位置、构象、分子内部可旋转键的二面角和受体的氨基酸残基侧链和骨架,寻找配体小分子化合物与目标大分子作用的最佳构象,并预测其结合模式、亲和力和通过打分函数挑选出接近天然构象的与受体,得到预测的可与目标特异性结合的肽库Library3。
(3)初选肽适体的试验验证:利用等温滴定量热仪(ITC)、表面等离子体共振(SPR)或毛细管电泳(CE)等小分子结合试验验证手段,对初步筛选得到的肽适体与目标代谢物的特异性结合进行验证。
本发明提供了一种基于分子对接技术的代谢物肽适体快速筛选方法,本方法库容大、速度快、目标范围广、无需大量人力物力投入、对实验人员身体无损害,从而解决了目前肽适体广泛应用的限制因素。本发明可以通过简化肽适体筛选的程序,在最大程度上增大库容从而便于筛选出特异性范围更合适的肽适体而推动肽适体在医疗及营养学中的应用。
另外,所述代谢物包括但不限于代谢物,还包括其前体营养物质,本发明的设计思路还可用于药物及其前体化合物、毒素及其他异生质、离子、矿物质和重金属等的肽适体快速筛选及其研究领域。
具体实施方式
所述基于分子对接技术的氨基酸肽适体快速筛选方法包括如下步骤:
(1)确定目标代谢物(氨基酸);
(2)获得与目标潜在结合的多肽库:以氨基酸作为目标,在蛋白数据库(NCBI)中选择下载与人(1679条)、常用试验动物小鼠(6940条)、大鼠(4020条)、猪(1546条)的与氨基酸代谢相关的蛋白一级结构即其氨基酸序列。将所有氨基酸序列连接成一个长肽链;设定短肽链长度为8个氨基酸残基,切割去除重复序列后得到非冗余多肽库Library2,库容为约285万条多肽;
(3)使用autodock,将多肽库Library2中已知三维结构数据库中的分子逐一放在目标分子的活性位点处,通过不断优化受体化合物的位置、构象、分子内部可旋转键的二面角和受体的氨基酸残基侧链和骨架,寻找Library2中多肽与氨基酸作用的最佳构象,并预测其结合模式、亲和力和通过打分函数挑选出接近天然构象的与受体,将多肽库Library2中的所有短肽与对应的氨基酸进行对接预测,得出可单一结合氨基酸的多肽653条代谢物肽适体;
(4)初选肽适体的试验验证:利用等温滴定量热仪(ITC),对初步筛选得到的肽适体与氨基酸的特异性结合进行验证,验证结果表明部分多肽与氨基酸在试验验证条件下(模拟生理条件,PBS缓冲液,pH7.4,温度为37℃)也具有结合;
(5)以经试验验证的长度为8的氨基酸肽适体为基础,在5-20多肽之间,设计新的多肽库Library3,重复步骤(3)与(4),获得了可用于传感器等检测技术的氨基酸肽适体库Library4。

Claims (4)

1.一种基于分子对接模拟计算技术的代谢物肽适体快速筛选方法,其特征在于速度快、目标范围广、无需大量人力物力投入、对实验人员身体无损害,解决了目前肽适体广泛应用的限制因素,所述方法包括如下步骤:
(1)确定目标代谢物;
(2)获得潜在的与目标代谢物具有结合力的多肽库:
①目标代谢物代谢相关蛋白一级序列的获得:在蛋白库如(Uniprot,PDB和NCBI等)中搜索目标代谢物所有相关感知、转运及代谢等蛋白,并查询保存这些蛋白的一级氨基酸序列;②目标代谢物潜在肽适体冗余库构建,以目标代谢物所有相关感知、转运及代谢等蛋白一级氨基酸序列为基础,将所有蛋白氨基酸序列连接成一个长度为x个氨基酸残基组成的长肽链,连接方式为第n条氨基酸序列的C末端与第n+1(n≥1)条氨基酸序列的N末端相连;设定短肽长度为y(5-20),切割方式为以前一步获得的长肽链为基础,从第1个氨基酸N末端开始到第y个氨基酸的C末端切断得到第1条短肽,从第2个氨基酸N末端开始到第y+1个氨基酸的C末端切断得到第2条短肽,以此类推,得到容量为x-y+1个长度为y的目标代谢物肽适体冗余库Library1;③重复序列去除:对目标代谢物潜在肽适体冗余库Library1进行去重,若短肽库中的短肽链从N末端到C末端的氨基酸序列完全一致将被认定为重复,重复序列仅保存其中一条,去除重复序列后得到目标代谢物潜在肽适体非冗余库Library2;
(3)将目标代谢物潜在肽适体非冗余库Library2中的所有多肽与目标代谢物进行分子对接模拟计算预测,筛选出可与目标代谢物特异结合的多肽,即为目标代谢物肽适体。
2.如权利要求1所述的方法,其特征在于,步骤(3)所述对接预测的具体步骤包括:
1)确定目标代谢物并建立代谢物结构参数的配体.pdb文件;
2)准备目标代谢物肽适体非冗余库Library2中多肽结构参数,建立受体.pdb文件;
3)基于配体.pdb和受体.pdb文件,预先计算对接配体中每一个原子类型的格点图;
4)基于配体.pdb和受体.pdb文件,建立对接参数文件;
5)基于步骤1)至步骤4)生成的文件进行对接计算,对接结果保存在结果.pbf文件中。
3.如权利要求1所述的方法,其特征在于,在步骤(3)之后还包括将代谢物肽适体与目标代谢物在工作条件(生理条件、实验室分析)下的特异性结合力的验证步骤。
4.基于权利要求3所述目标代谢物肽适体库构建方法,其特征在于,所述目标代谢物肽适体库构建方法是以试验验证后的长度为y的代谢物肽适体为基础,设计新的多肽库Library3,经分子对接模拟计算预测和特异性结合试验验证后即得氨基酸肽适体优化库Library4。
CN201810004249.8A 2018-01-03 2018-01-03 一种基于分子对接技术的代谢物肽适体快速筛选方法 Active CN108197429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810004249.8A CN108197429B (zh) 2018-01-03 2018-01-03 一种基于分子对接技术的代谢物肽适体快速筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810004249.8A CN108197429B (zh) 2018-01-03 2018-01-03 一种基于分子对接技术的代谢物肽适体快速筛选方法

Publications (2)

Publication Number Publication Date
CN108197429A true CN108197429A (zh) 2018-06-22
CN108197429B CN108197429B (zh) 2021-08-06

Family

ID=62587582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810004249.8A Active CN108197429B (zh) 2018-01-03 2018-01-03 一种基于分子对接技术的代谢物肽适体快速筛选方法

Country Status (1)

Country Link
CN (1) CN108197429B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109456385A (zh) * 2018-12-13 2019-03-12 无限极(中国)有限公司 一种筛选具有抗衰活性的多肽的方法
CN110148438A (zh) * 2019-04-12 2019-08-20 中山大学 一种基于最优几何匹配的锌酶对接方法
CN110246538A (zh) * 2019-06-14 2019-09-17 北京市计算中心 基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体
CN110257388A (zh) * 2019-07-05 2019-09-20 中国科学院亚热带农业生态研究所 一种特异性识别精氨酸的多肽适配体及应用
CN110426435A (zh) * 2019-07-05 2019-11-08 中国科学院亚热带农业生态研究所 一种基于肽适体的精氨酸生物传感器及其制备方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ONAT KADIOGLU等: "Peptide aptamer identified by molecular docking targeting", 《INVEST NEW DRUGS》 *
乔会晶等: "分子对接技术在新药研发领域中的应用进展", 《南阳师范学院学报》 *
戚兴保等: "多肽与蛋白质对接的研究进展", 《计算机与应用科学》 *
江丽等: "适体家族新成员――肽适体", 《中国生物化学与分子生物学报》 *
赵安等: "基于骨架蛋白的噬菌体肽库研究", 《军事医学科学院院刊》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109456385A (zh) * 2018-12-13 2019-03-12 无限极(中国)有限公司 一种筛选具有抗衰活性的多肽的方法
CN110148438A (zh) * 2019-04-12 2019-08-20 中山大学 一种基于最优几何匹配的锌酶对接方法
CN110148438B (zh) * 2019-04-12 2023-03-21 中山大学 一种基于最优几何匹配的锌酶对接方法
CN110246538A (zh) * 2019-06-14 2019-09-17 北京市计算中心 基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体
CN110246538B (zh) * 2019-06-14 2021-05-07 北京市计算中心 基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体
CN110257388A (zh) * 2019-07-05 2019-09-20 中国科学院亚热带农业生态研究所 一种特异性识别精氨酸的多肽适配体及应用
CN110426435A (zh) * 2019-07-05 2019-11-08 中国科学院亚热带农业生态研究所 一种基于肽适体的精氨酸生物传感器及其制备方法
CN110426435B (zh) * 2019-07-05 2021-10-19 中国科学院亚热带农业生态研究所 一种基于肽适体的精氨酸生物传感器及其制备方法
CN110257388B (zh) * 2019-07-05 2023-01-03 中国科学院亚热带农业生态研究所 一种特异性识别精氨酸的多肽适配体及应用

Also Published As

Publication number Publication date
CN108197429B (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
CN108197429A (zh) 一种基于分子对接技术的代谢物肽适体快速筛选方法
Ploug et al. Peptide-derived antagonists of the urokinase receptor. affinity maturation by combinatorial chemistry, identification of functional epitopes, and inhibitory effect on cancer cell intravasation
Rich et al. Grading the commercial optical biosensor literature—Class of 2008:‘The Mighty Binders’
Li et al. Re-dating Zhoukoudian Upper Cave, northern China and its regional significance
Özkan et al. An extracellular interactome of immunoglobulin and LRR proteins reveals receptor-ligand networks
Moore et al. Engineering knottins as novel binding agents
MY171913A (en) Methods for determining ligand binding to a target protein using a thermal shift assay
WO2006124644A3 (en) Protein and antibody profiling using small molecule microarrays
Barozzi et al. Affibody-binding ligands
Gitlin et al. Inhibitors of Matriptase‐2 Based on the Trypsin Inhibitor SFTI‐1
EA201170762A1 (ru) Способы отбора устойчивых к протеазе полипептидов
CN103951731A (zh) 胶原蛋白-整联蛋白α2β1相互作用的多肽抑制剂及筛选方法
Bowen et al. Screening of yeast display libraries of enzymatically treated peptides to discover macrocyclic peptide ligands
ATE393395T1 (de) Elastinpeptid-fingerabdrücke und analyseverfahren für mit copd in verbindung stehendes mmp12
ES2647243T3 (es) Medios y métodos para la determinación de la cantidad de polipéptido Neurotoxina y de sus actividades catalíticas y proteolíticas
Takita et al. Cyclic peptides for efficient detection of collagen
CN103534265A (zh) 具有抗肿瘤形成和抗血管生成活性的环肽
WO2012126118A8 (en) Polypeptides with affinity for heat shock proteins (hsps) and hsp associated complexes (hacs) and their use in diagnosis and therapy
Ariani et al. Effect of D-amino acid substitutions on Ni (II)-assisted peptide bond hydrolysis
Moscetti et al. MDM2–MDM4 molecular interaction investigated by atomic force spectroscopy and surface plasmon resonance
Ali et al. Effects of sequence context on the binding of tryptophan-containing peptides by the cucurbit [8] uril–methyl viologen complex
Baker et al. The Plasma Protein Binding Proteome of Ertapenem: A Novel Compound-Centric Proteomic Approach for Elucidating Drug–Plasma Protein Binding Interactions
US11830582B2 (en) Methods of designing novel antibody mimetics for use in detecting antigens and as therapeutic agents
Li et al. Chemical modification of cellulose membranes for SPOT synthesis
Mallick et al. Tools for predicting metal binding sites in protein: a review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant