CN106503487A - 一种统计分析蛋白质肽键的顺式和反式结构的方法 - Google Patents

一种统计分析蛋白质肽键的顺式和反式结构的方法 Download PDF

Info

Publication number
CN106503487A
CN106503487A CN201610934882.8A CN201610934882A CN106503487A CN 106503487 A CN106503487 A CN 106503487A CN 201610934882 A CN201610934882 A CN 201610934882A CN 106503487 A CN106503487 A CN 106503487A
Authority
CN
China
Prior art keywords
atom
cis
protein
unit
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610934882.8A
Other languages
English (en)
Other versions
CN106503487B (zh
Inventor
何建锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201610934882.8A priority Critical patent/CN106503487B/zh
Publication of CN106503487A publication Critical patent/CN106503487A/zh
Application granted granted Critical
Publication of CN106503487B publication Critical patent/CN106503487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Peptides Or Proteins (AREA)

Abstract

一种统计分析蛋白质肽键的顺式和反式结构的方法,属于蛋白质结构分析、结构预测和顺式与反式构型异构研究领域。主要特点为:采用蛋白质肽平面碳、氮、氧原子建立坐标标架,计算待考察原子在单位球面上中的经纬度角,并将所有待考察原子投影到这个单位球面上,得到待考察原子的三维统计分布图;这是一种直观地、可视化的蛋白质结构分析方法,能有效地展现肽键的顺式和反式结构中的差异,揭示肽键的顺式和反式结构中原子的分布特征。比现有的基于结构化学的方法更新颖;可分析任意侧链原子的结构特性;能够直观地能够展现蛋白质中某种原子或某类原子的几何结构特性;对蛋白质结构预测、结构优化、结构约束、顺式和反式结构异构化分析具有重要意义。

Description

一种统计分析蛋白质肽键的顺式和反式结构的方法
技术领域
本发明涉及一种蛋白质分子三维空间结构特性的分析方法,尤其涉及一种统计分析蛋白质肽键的顺式和反式结构的方法,属于蛋白质结构分析、结构预测和顺式与反式构型异构研究领域。
背景技术
在蛋白质中,肽键是氨基酸链接的基本方式。由于酰胺氮和羧基氧之间的共振相互作用,肽键具有部分双键性质,不能自由转动,参与肽键的六个原子(Cα 1、Cα 2、C、H、O、N)趋于共面。因而,蛋白质的肽基团仅有顺式和反式两种平面构型。顺式构型中,Cα i-Ni-Ci+1-Cα i+1原子形成的二面角约为0度;反式构型中,Cα i-Ni-Ci+1-Cα i+1原子的二面角约为180度。由于空间位阻作用,顺式构型的能量高于反式构型。顺式与反式构型间转换能垒约20kcal/mol,它们异构化较困难。数据显示,自然折叠的蛋白质中,绝大多数肽基团为反式构型。通过量子化学计算和小分子有机物实验研究估计,反式与顺式构型间能量差约为2.5kcal/mol。通过对蛋白质数据银行(PDB)中晶体数据统计表明,肽键中顺式构型的比率约0.3%。其中,由脯氨酸参与组成的肽键,顺式构型出现的几率较大。
研究表明,顺式和反式构型的形成、肽键顺式与反式异构化在蛋白质折叠、生物学功能实现等方面具有非常重要的作用。然而,我们对蛋白质肽键的反式与顺式构型分析方法有限,对它们的形成、几何特性和功能等了解还较少,需要更多、更有效的分析手段和方法。目前,对顺式和反式构型的研究通常采用传统的结构化学方法,主要关注肽基团原子形成的键长、键角和扭转角,结构分析没有精度到原子尺度。例如,Cα i-Ni-Ci+1-Cα i+1原子二面角的分析法、以Ci-Cα i键扭转角和Cα i-Ni键扭转角为坐标的拉氏图法。
发明内容
本发明的目的是针对目前还没有精细到原子尺度统计分析蛋白质中肽键结构的技术现状,提出了一种统计分析蛋白质肽键的顺式和反式结构的方法。
本发明所提方法的主要特点为:采用蛋白质肽平面碳、氮、氧原子建立坐标标架,计算待考察原子在单位球面上中的经纬度角,并将所有待考察原子投影到这个单位球面上,得到待考察原子的三维统计分布图;这是一种直观地、可视化的蛋白质结构分析方法,能有效地展现肽键的顺式和反式结构中的差异,揭示肽键的顺式和反式结构中原子的分布特征。
为实现上述目的,一种统计分析蛋白质肽键的顺式和反式结构的方法,步骤如下:
步骤(1):获取蛋白质实验结构,建立蛋白质结构数据库;
获取蛋白质实验结构的优选方案之一是从蛋白质数据银行(PDB,http://www.rcsb.org)中下载;具体的,可从此蛋白质数据银行下载X-Ray晶体衍射的蛋白质实验结构,可选择分辨率优于1.0埃的蛋白质实验结构进行高精度的统计分析;
步骤(2):建立碳氮氧坐标标架,即CNO坐标标架,具体为:
从步骤(1)建立的蛋白质结构数据库的蛋白质实验结构中提取每个氨基酸残基上的主链碳、氮、氧原子坐标,以主链碳原子为坐标原点,引入单位切向矢量、单位副法向矢量和单位法向矢量,构成右手正交的碳氮氧坐标标架,称为CNO坐标标架,它与笛卡尔坐标系类似;
其中,主链碳、氮、氧原子记为C、N、O,它们从蛋白质的氮末端到碳末端根据氨基酸残基顺序编号,编号记为i,i=1,2,3,…,M,M是一个蛋白质中氨基酸残基总数;第i个氨基酸残基上的主链碳、氮、氧原子记为Ci、Ni、Oi;它们的坐标记为rCi、rNi、rOi;第i+1个氨基酸残基上的主链碳、氮、氧原子记为Ci+1、Ni+1、Oi+1;它们的坐标记为rCi+1、rNi+1、rOi+1
其中,单位切向矢量记为ui,单位副法向矢量记为wi,单位法向矢量记为vi
其中,采用i个肽平面上主链Ci、Ni+1、Oi原子建立的碳氮氧坐标标架记为第i个CNO标架;
其中,第i个肽平面指由第i和(i+1)个氨基酸残基形成平面;
其中,单位切向矢量、单位副法向矢量、单位法向矢量表述为如下公式(1):
其中,
步骤(3):确定待考察原子在CNO坐标标架中的坐标,具体为:
从步骤(1)建立的蛋白质结构数据库的蛋白质实验结构中,提取待考察的中心碳原子、主链碳原子、主链氮原子、主链氧原子、侧链碳原子的坐标;在蛋白质实验结构中,采用的是实验室坐标系;根据这个坐标系下待考察原子坐标,计算待考察原子在CNO坐标标架中的坐标;
其中,中心碳原子、主链碳原子、主链氮原子、主链氧原子、侧链碳原子采用与步骤(2)一致的编号;
其中,中心碳原子记为Cα,第i和(i+1)个氨基酸残基上的中心碳原子记为Cα i、Cα i+1
其中,沿着侧链第1个碳原子记为Cβ,第(i+1)个氨基酸残基的侧链第1个碳原子记为Cβ i+1
其中,计算Cα i+1、Ci+1、Oi+1、Cβ i+1原子在CNO坐标标架中的坐标表述为如下公式(2):
其中,为Cα i+1、Ci+1、Oi+1、Cβ i+1原子在CNO坐标标架中的坐标;
其中,公式(2)中的坐标都可以分解为三个分量形式,表述为如下公式(3):
其中,符号A表示Cα i+1、Ci+1、Oi+1、Cβ i+1原子中的任意一个;
其中,x′A、y′A、z′A表示A原子在CNO坐标标架中ui、wi、vi方向上的分量;
步骤(4):根据CNO坐标标架建立单位球面,计算待考察原子在单位球面中的经纬度角,具体为:
根据步骤(2)中建立的CNO坐标标架,建立单位球面;由球坐标和步骤(3)中CNO坐标标架的坐标转换关系,计算考察原子在单位球面中的经纬度角;
其中,待考察原子在单位球面中的经纬度角记为
其中,单位球面建立方法为:球面半径为1,第i个单位球面的球心在主链碳原子Ci上;步骤(2)中CNO坐标标架的单位切向矢量ui的顶点位于单位球面的北极,单位球面北极处的纬度为0度;过CNO坐标标架的单位切向矢量ui和单位法向矢量vi的大半圆的经度为0度;
其中,球坐标与CNO坐标标架的坐标转换关系表述为如下公式(4):
步骤(5):将步骤(1)蛋白质结构数据库的蛋白质实验结构中所有顺式和反式结构的待考察原子投影到单位球面上,得到顺式和反式结构中待考察原子的分布,具体为:
步骤(5).1:采用肽平面原子形成的二面角,判断肽平面的顺式和反式结构,由步骤(1)蛋白质结构数据库,得到顺式结构肽平面数据组、反式结构肽平面数据组;
其中,顺式和反式结构辨别方法为:Cα i-Ni-Ci+1-Cα i+1原子形成的二面角在[-90°,90°]范围是顺式结构,Cα i-Ni-Ci+1-Cα i+1原子的二面角在[90°,-90°]范围是反式结构;
步骤(5).2:根据顺式结构中,后一个氨基酸残基是否为脯氨酸,将由步骤(5).1的顺式结构肽平面数据组分成含脯氨酸顺式结构肽平面数据组和不含脯氨酸顺式结构肽平面数据组;
其中,含脯氨酸顺式结构肽平面数据组和不含脯氨酸顺式结构肽平面数据组分别记为cis-proline和cis-nonproline;
步骤(5).3:根据反式结构肽平面数据组,计算所有待考察原子的经纬度角,由经纬度角确定单位球面上待考察原子的投影点,得到反式结构中待考察原子的统计分布;
步骤(5).4:根据含脯氨酸顺式结构肽平面数据组,计算所有待考察原子的经纬度角,由经纬度角确定单位球面上待考察原子的投影点,得到所有cis-proline中待考察原子的统计分布;
步骤(5).5:根据不含脯氨酸顺式结构肽平面数据组,计算所有待考察原子的经纬度角,由经纬度角确定单位球面上待考察原子的投影点,得到所有cis-nonproline中待考察原子的统计分布;
其中,步骤(5).3-5中单位球面上投影点的经纬度角与步骤(4)的经纬度角表述一致;
至此,从步骤(1)到步骤(5),完成了一种统计分析蛋白质肽键的顺式和反式结构的方法。
有益效果
一种统计分析蛋白质肽键的顺式和反式结构的方法,与现有的蛋白质结构分析方法相比,具有如下有益效果:
(1)本发明采用CNO坐标标架和单位球面研究蛋白质结构特性,包含顺式和反式构型的特性,比现有的基于结构化学的方法更新颖;
(2)本发明所提方法既可以分析主链原子的结构特性,又可以分析任意侧链原子的结构特性;
(3)本发明所提方法能够肽平面上观察顺式和反式结构中原子的分布特性,这是一个新角度;
(4)如果设想观察者站在球心,他所看到的球面上原子分布就像夜空中的繁星一样,因而,本发明的另一个明显优势是“所见即所得”,能够直观地提供蛋白质几何结构信息;
(5)拉氏图是蛋白质结构研究中应用最广泛的方法,它通过肽平面的扭转反映蛋白质结构分布特性;与之相比,本发明所提方法在原子尺度上揭示蛋白质结构信息,能够展现蛋白质中某种原子或某类原子的几何结构特性;
(6)本发明所提方法对蛋白质结构预测、蛋白质结构优化、蛋白质结构约束、顺式和反式结构异构化分析等具有基础和应用意义。
附图说明
图1为一种统计分析蛋白质肽键的顺式和反式结构的方法流程图;
图2为一种统计分析蛋白质肽键的顺式和反式结构的方法在具体实施时针对高精度统计分析蛋白质肽键的顺式和反式结构中的中心碳原子几何特征的流程示意图;
图3为第i个肽平面CNO坐标标架上观察到的Cα i+1原子分布图;
图4为第i个肽平面CNO坐标标架上观察到的Cβ i+1原子分布图;
图5为第i个肽平面CNO坐标标架上观察到的Ci+1原子分布图。
具体实施方式
下面结合附图和实施例对本发明的方法作进一步说明。
实施例1
本实施例详细阐述了本发明“一种统计分析蛋白质肽键的顺式和反式结构的方法”在具体实施时针对高精度统计分析蛋白质肽键的顺式和反式结构中的中心碳原子几何特征的流程。
图1为一种统计分析蛋白质肽键的顺式和反式结构的方法的流程图。从图中可以看出,本方法包含步骤有:步骤(1):获取蛋白质实验结构,建立蛋白质结构数据库;步骤(2):建立碳氮氧坐标标架;步骤(3):确定待考察原子在CNO坐标标架中的坐标;步骤(4):计算待考察原子在单位球面中的经纬度角;步骤(5):将步骤(1)蛋白质结构数据库的蛋白质实验结构中所有顺式和反式结构的待考察原子投影到单位球面上,得到顺式和反式结构中待考察原子的分布;
图2为本实施例的流程图,从图中可以看出,高精度统计分析蛋白质肽键的顺式和反式结构中的中心碳原子几何特征包含如下步骤:
步骤(一):从蛋白质数据银行中下载分辨率优于1.0埃的晶体衍射蛋白质实验结构,建立高分辨率蛋白质结构数据库;
步骤(二):基于氨基酸残基上的C、N、O原子坐标,建立右手正交的CNO坐标标架,具体为:
从步骤(一)高分辨率蛋白质结构数据库中的蛋白质实验结构,提取任一蛋白质中第i个氨基酸残基上的Ci、Oi原子和第(i+1)个氨基酸残基上的Ni+1原子坐标rCi、rOi、rNi+1,采用发明内容步骤(2)中公式(1)引入单位切向矢量ui、单位副法向矢量wi、单位法向矢量vi,建立第i个右手正交的CNO标架;
步骤(三):计算中心碳原子Cα i+1在CNO坐标标架中的坐标,具体为:
从步骤(一)高分辨率的蛋白质结构数据库中的蛋白质实验结构,提取任一蛋白质中第(i+1)个氨基酸残基上中心碳原子Cα i+1的坐标rC α i+1,采用发明内容步骤(3)中的公式(2)或(3),计算Cα i+1原子在CNO坐标标架中的坐标
步骤(四):计算中心碳原子Cα i+1在单位球面中的经纬度,具体为:
由步骤(二)构建的CNO坐标标架,采用发明内容步骤(4)的方法,构建单位球面,采用发明内容步骤(4)的公式(4),计算中心碳原子Cα i+1在单位球面中的经纬度角
步骤(五):将步骤(一)高分辨率的蛋白质结构数据库的蛋白质实验结构中所有顺式和反式结构的中心碳原子Cα i+1投影到单位球面上,得到顺式和反式结构中心碳原子Cα i+1的分布,具体为:
步骤(五).1:采用肽平面Cα i-Ni-Ci+1-Cα i+1原子形成的二面角,根据发明内容步骤(5).1的方法判断肽平面的顺式和反式结构,将步骤(一)高分辨率的的蛋白质结构数据库分为顺式结构肽平面数据组、反式结构肽平面数据组;
步骤(五).2:根据发明内容步骤(5).2的方法,将步骤(五).1的顺式结构肽平面数据组分成含脯氨酸顺式结构肽平面数据组cis-proline和不含脯氨酸顺式结构肽平面数据组cis-nonproline;
步骤(五).3:由反式结构肽平面数据组,利用步骤(二)-(四),计算所有中心碳原子Cα i+1的经纬度值画出单位球面上Cα i+1原子的投影点,得到反式结构中Cα i+1原子的统计分布;
步骤(五).4:根据顺式结构肽平面数据组,利用步骤(二)-(四),计算所有Cα i+1原子的经纬度,确定单位球面上Cα i+1原子的投影点,得到所有顺式结构中Cα i+1原子的统计分布;
步骤(五).5:根据不含脯氨酸顺式结构肽平面数据组cis-nonproline,利用步骤(二)-(四),计算所有Cα i+1原子的经纬度,确定单位球面上Cα i+1原子的投影点,得到所有cis-nonproline中Cα i+1原子的统计分布;
图3是高分辨率的蛋白质结构数据库的蛋白质实验结构中所有顺式和反式结构的中心碳原子Cα i+1在单位球面上分布图;图中,符号ui、wi、vi标示了CNO坐标标架轴,trans、cis、cis-nonproline表示反式结构、顺式结构、不含脯氨酸顺式结构的Cα i+1原子分布;图3显示,反式结构中Cα i+1原子局域分布在经纬度(0°,90°)周围区域,顺式结构中Cα i+1原子局域分布在经纬度(0°,-30°)区域,而不含脯氨酸顺式结构相对于一般的顺式结构而言,分布较为分散;
至此,从步骤(一)到步骤(五),完成了高精度统计分析蛋白质肽键的顺式和反式结构中的中心碳原子几何特征的方法。
实施例2
本实施例按照本发明“一种统计分析蛋白质肽键的顺式和反式结构的方法”的步骤和实施例1所述流程,阐述统计分析侧链Cβ i+1原子在蛋白质肽键的顺式和反式结构中分布特性及其结果。
高精度统计分析侧链Cβ i+1原子在蛋白质肽键的顺式和反式结构中的分布特性,步骤A、B与实施例1步骤(一)、(二)相同;步骤C、D、E与实施例1步骤(三)、(四)、(五)的区别是本实施例计算侧链Cβ i+1原子的坐标、经纬度和画侧链Cβ i+1原子在单位球面分布,其步骤(五)中加入二级结构α-helix、α-left-handed-helix、β-strand判定,其方法采用STRIDE算法确定;
图4是高分辨率蛋白质结构数据库的蛋白质实验结构中所有顺式和反式结构的侧链Cβ i+1原子在单位球面上分布图;图中,符号ui、wi、vi标示CNO坐标标架轴,trans、cis、cis-nonproline指出了反式结构、顺式结构、不含脯氨酸顺式结构的Cβ i+1原子分布,α-helix、αL-helix、β-strand表示螺旋、左手螺旋、片层对应的Cβ i+1原子分布位置;图4显示,反式结构trans中Cβ i+1原子局域分布两个分离的区域,αL-helix中反式结构Cβ i+1原子主要分布在经纬度(70°,80°)区域,α-helix和β-strand中反式结构Cβ i+1原子主要集中在经度(-90°,30°)与纬度(80°,120°)区域;顺式结构中Cβ i+1原子局域分布在经纬度(30°,140°)区域,不含脯氨酸顺式结构Cβ i+1原子分布较为分散;
实施例3
本实施例按照本发明步骤和实施例1所述流程,具体阐述统计分析主链Ci+1原子在蛋白质肽键的顺式和反式结构的分布特性,结果如图5。
图5是高分辨率蛋白质结构数据库的蛋白质实验结构中所有顺式和反式结构的主链Ci+1原子在单位球面上分布图;图中,符号ui、wi、vi标示CNO坐标标架轴,trans、cis、cis-nonproline指出了反式结构、顺式结构、不含脯氨酸顺式结构的主链Ci+1原子分布,α-helix、αL-helix、β-strand表示螺旋、左手螺旋、片层对应的主链Ci+1原子分布位置;图5显示,反式结构trans中主链Ci+1原子主要收敛到两个分离的聚集区,α-helix中反式结构主链Ci+1原子主要分布在经纬度(50°,70°)区域,β-strand中反式结构主链Ci+1原子主要分布在经纬度(40°,100°)区域;顺式结构中主链Ci+1原子局域分布在经纬度(-50°,160°)区域,不含脯氨酸顺式结构主链Ci+1原子分布较为分散;
以上所述为本发明的几个典型实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。

Claims (6)

1.一种统计分析蛋白质肽键的顺式和反式结构的方法,主要特点为:采用蛋白质肽平面碳、氮、氧原子建立坐标标架,计算待考察原子在单位球面上中的经纬度角,并将所有待考察原子投影到这个单位球面上,得到待考察原子的三维统计分布图;这是一种直观地、可视化的蛋白质结构分析方法,能有效地展现肽键的顺式和反式结构中的差异,揭示肽键的顺式和反式结构中原子的分布特征,其特征在于:包括如下步骤:
步骤(1):获取蛋白质实验结构,建立蛋白质结构数据库;
步骤(2):建立碳氮氧坐标标架,即CNO坐标标架;
步骤(3):确定待考察原子在CNO坐标标架中的坐标;
步骤(4):根据CNO坐标标架建立单位球面,计算待考察原子在单位球面中的经纬度角;
步骤(5):将步骤(1)建立的蛋白质结构数据库的蛋白质实验结构中所有顺式和反式结构的待考察原子投影到单位球面上,得到顺式和反式结构中待考察原子的分布;
至此,从步骤(1)到步骤(5),完成了一种统计分析蛋白质肽键的顺式和反式结构的方法。
2.根据权利要求1所述的一种统计分析蛋白质肽键的顺式和反式结构的方法,其特征在于:步骤(1)中,获取蛋白质实验结构的优选方案之一是从蛋白质数据银行(PDB,http://www.rcsb.org)中下载;具体的,可从此蛋白质数据银行下载X-Ray晶体衍射的蛋白质实验结构,可选择分辨率优于1.0埃的蛋白质实验结构。
3.根据权利要求1所述的一种统计分析蛋白质肽键的顺式和反式结构的方法,其特征在于:步骤(2),具体为:
从步骤(1)建立的蛋白质结构数据库的蛋白质实验结构中提取每个氨基酸残基上的主链碳、氮、氧原子坐标,以主链碳原子为坐标原点,引入单位切向矢量、单位副法向矢量和单位法向矢量,构成右手正交的碳氮氧坐标标架,称为CNO坐标标架,它与笛卡尔坐标系类似;
其中,主链碳、氮、氧原子记为C、N、O,它们从蛋白质的氮末端到碳末端根据氨基酸残基顺序编号,编号记为i,i=1,2,3,…,M,M是一个蛋白质中氨基酸残基总数;第i个氨基酸残基上的主链碳、氮、氧原子记为Ci、Ni、Oi;它们的坐标记为rCi、rNi、rOi;第i+1个氨基酸残基上的主链碳、氮、氧原子记为Ci+1、Ni+1、Oi+1;它们的坐标记为rCi+1、rNi+1、rOi+1
其中,单位切向矢量记为ui,单位副法向矢量记为wi,单位法向矢量记为vi
其中,采用i个肽平面上主链Ci、Ni+1、Oi原子建立的碳氮氧坐标标架记为第i个CNO标架;
其中,第i个肽平面指由第i和(i+1)个氨基酸残基形成平面;
其中,单位切向矢量、单位副法向矢量、单位法向矢量表述为如下公式(1):
其中,
4.根据权利要求1所述的一种统计分析蛋白质肽键的顺式和反式结构的方法,其特征在于:步骤(3),具体为:
从步骤(1)建立的蛋白质结构数据库的蛋白质实验结构中,提取待考察的中心碳原子、主链碳原子、主链氮原子、主链氧原子、侧链碳原子的坐标;在蛋白质实验结构中,采用的是实验室坐标系;根据这个坐标系下待考察原子坐标,计算待考察原子在CNO坐标标架中的坐标;
其中,中心碳原子、主链碳原子、主链氮原子、主链氧原子、侧链碳原子采用与步骤(2)一致的编号;
其中,中心碳原子记为Cα,第i和(i+1)个氨基酸残基上的中心碳原子记为Cα i、Cα i+1
其中,沿着侧链第1个碳原子记为Cβ,第(i+1)个氨基酸残基的侧链第1个碳原子记为Cβ i+1
其中,计算Cα i+1、Ci+1、Oi+1、Cβ i+1原子在CNO坐标标架中的坐标表述为如下公式(2):
r C i + 1 α ′ = r C i + 1 α - r C i , r C i + 1 ′ = r C i + 1 - r C i , r O i + 1 ′ = r O i + 1 - r C i , r C i + 1 β ′ = r C i + 1 β - r C i - - - ( 2 )
其中,为Cα i+1、Ci+1、Oi+1、Cβ i+1原子在CNO坐标标架中的坐标;
其中,公式(2)中的坐标都可以分解为三个分量形式,表述为如下公式(3):
x A ′ = x A - x C i , y A ′ = y A - y C i , z A ′ = z A - z C i - - - ( 3 )
其中,符号A表示Cα i+1、Ci+1、Oi+1、Cβ i+1原子中的任意一个;
其中,x′A、y′A、z′A表示A原子在CNO坐标标架中ui、wi、vi方向上的分量。
5.根据权利要求1所述的一种统计分析蛋白质肽键的顺式和反式结构的方法,其特征在于:步骤(4),具体为:
根据步骤(2)中建立的CNO坐标标架,建立单位球面;由球坐标和步骤(3)中CNO坐标标架的坐标转换关系,计算考察原子在单位球面中的经纬度角;
其中,待考察原子在单位球面中的经纬度角记为
其中,单位球面建立方法为:球面半径为1,第i个单位球面的球心在主链碳原子Ci上;步骤(2)中CNO坐标标架的单位切向矢量ui的顶点位于单位球面的北极,单位球面北极处的纬度为0度;过CNO坐标标架的单位切向矢量ui和单位法向矢量vi的大半圆的经度为0度;
其中,球坐标与CNO坐标标架的坐标转换关系表述为如下公式(4):
6.根据权利要求1所述的一种统计分析蛋白质肽键的顺式和反式结构的方法,其特征在于:步骤(5),具体为:
步骤(5).1:采用肽平面原子形成的二面角,判断肽平面的顺式和反式结构,由步骤(1)蛋白质结构数据库,得到顺式结构肽平面数据组、反式结构肽平面数据组;
其中,顺式和反式结构辨别方法为:Cα i-Ni-Ci+1-Cα i+1原子形成的二面角在[-90°,90°]范围是顺式结构,Cα i-Ni-Ci+1-Cα i+1原子的二面角在[90°,-90°]范围是反式结构;
步骤(5).2:根据顺式结构中,后一个氨基酸残基是否为脯氨酸,将由步骤(5).1的顺式结构肽平面数据组分成含脯氨酸顺式结构肽平面数据组和不含脯氨酸顺式结构肽平面数据组;
其中,含脯氨酸顺式结构肽平面数据组和不含脯氨酸顺式结构肽平面数据组分别记为cis-proline和cis-nonproline;
步骤(5).3:根据反式结构肽平面数据组,计算所有待考察原子的经纬度角,由经纬度角确定单位球面上待考察原子的投影点,得到反式结构中待考察原子的统计分布;
步骤(5).4:根据含脯氨酸顺式结构肽平面数据组,计算所有待考察原子的经纬度角,由经纬度角确定单位球面上待考察原子的投影点,得到所有cis-proline中待考察原子的统计分布;
步骤(5).5:根据不含脯氨酸顺式结构肽平面数据组,计算所有待考察原子的经纬度角,由经纬度角确定单位球面上待考察原子的投影点,得到所有cis-nonproline中待考察原子的统计分布;
其中,步骤(5).3-5中单位球面上投影点的经纬度角与步骤(4)的经纬度角表述一致。
CN201610934882.8A 2016-11-01 2016-11-01 一种统计分析蛋白质肽键的顺式和反式结构的方法 Active CN106503487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610934882.8A CN106503487B (zh) 2016-11-01 2016-11-01 一种统计分析蛋白质肽键的顺式和反式结构的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610934882.8A CN106503487B (zh) 2016-11-01 2016-11-01 一种统计分析蛋白质肽键的顺式和反式结构的方法

Publications (2)

Publication Number Publication Date
CN106503487A true CN106503487A (zh) 2017-03-15
CN106503487B CN106503487B (zh) 2019-03-01

Family

ID=58318965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610934882.8A Active CN106503487B (zh) 2016-11-01 2016-11-01 一种统计分析蛋白质肽键的顺式和反式结构的方法

Country Status (1)

Country Link
CN (1) CN106503487B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629151A (zh) * 2018-03-22 2018-10-09 浙江工业大学 一种基于拉氏图的群体蛋白质结构预测方法
CN108896591A (zh) * 2018-05-11 2018-11-27 深圳晶泰科技有限公司 一种晶体粉末衍射的指标化方法
CN114694759A (zh) * 2020-12-28 2022-07-01 富士通株式会社 稳定结构搜索方法、存储介质和稳定结构搜索装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080058276A1 (en) * 2006-01-13 2008-03-06 Cornell Research Foundation, Inc. Alzheimer's disease therapeutics based on pin-1 catalyzed conformational changes in phosphorylated amyloid precursor protein
CN101249091A (zh) * 2002-11-22 2008-08-27 约翰斯·霍普金斯大学 治疗认知功能障碍的靶位
WO2010067563A1 (ja) * 2008-12-08 2010-06-17 国立大学法人 北海道大学 糖ペプチドの製造方法
CN105447338A (zh) * 2015-11-19 2016-03-30 中国科学技术大学 蛋白质三维结构中金属离子结合位点单配体残基模板库的建立方法及基于此的预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101249091A (zh) * 2002-11-22 2008-08-27 约翰斯·霍普金斯大学 治疗认知功能障碍的靶位
US20080058276A1 (en) * 2006-01-13 2008-03-06 Cornell Research Foundation, Inc. Alzheimer's disease therapeutics based on pin-1 catalyzed conformational changes in phosphorylated amyloid precursor protein
WO2010067563A1 (ja) * 2008-12-08 2010-06-17 国立大学法人 北海道大学 糖ペプチドの製造方法
CN105447338A (zh) * 2015-11-19 2016-03-30 中国科学技术大学 蛋白质三维结构中金属离子结合位点单配体残基模板库的建立方法及基于此的预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PENG XUBIAO等: "Clustering and percolation in protein loop structures", 《BMC STRUCTURAL BIOLOGY》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629151A (zh) * 2018-03-22 2018-10-09 浙江工业大学 一种基于拉氏图的群体蛋白质结构预测方法
CN108629151B (zh) * 2018-03-22 2021-06-18 浙江工业大学 一种基于拉氏图的群体蛋白质结构预测方法
CN108896591A (zh) * 2018-05-11 2018-11-27 深圳晶泰科技有限公司 一种晶体粉末衍射的指标化方法
CN108896591B (zh) * 2018-05-11 2020-10-16 深圳晶泰科技有限公司 一种晶体粉末衍射的指标化方法
CN114694759A (zh) * 2020-12-28 2022-07-01 富士通株式会社 稳定结构搜索方法、存储介质和稳定结构搜索装置

Also Published As

Publication number Publication date
CN106503487B (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
Petrey et al. GRASP2: visualization, surface properties, and electrostatics of macromolecular structures and sequences
Pirani et al. An atomic model of the thin filament in the relaxed and Ca2+-activated states
Bookstein Tensor biometrics for changes in cranial shape
CN106503487A (zh) 一种统计分析蛋白质肽键的顺式和反式结构的方法
Samsó et al. 25 Å resolution structure of a cytoplasmic dynein motor reveals a seven-member planar ring
CN109448787A (zh) 基于改进pssm进行特征提取与融合的蛋白质亚核定位方法
CN103593869B (zh) 一种扫描设备及其图像显示方法
Gouet et al. ENDscript: a workflow to display sequence and structure information
Li et al. Refining urban built-up area via multi-source data fusion for the analysis of dongting lake eco-economic zone spatiotemporal expansion
Sun et al. The phase behavior study of human antibody solution using multi-scale modeling
Giuliani et al. A complexity score derived from principal components analysis of nonlinear order measures
CN103955676B (zh) 一种人脸识别方法及系统
Nikundiwe et al. Lamellar organization of pontocerebellar neuronal populations. A multi‐tracer and 3‐D computer reconstruction study in the cat
Hou et al. Intrinsic protein geometry with application to non-proline cis peptide planes
Zhang et al. Human-Scale sustainability assessment of urban intersections based upon multi-source big data
Yamaji Theories of strain analysis from shape fabrics: A perspective using hyperbolic geometry
Lin et al. The structure of rabbit muscle phosphoglucomutase at intermediate resolution.
Joseph et al. Characterizing protein–glycosaminoglycan interactions using solution NMR spectroscopy
CN106485277B (zh) 一种基于多连接决策流形对准的高分辨率多时相遥感图像分类方法
CN109190451A (zh) 基于lfp特征的遥感图像车辆检测方法
Lin et al. Persistent local raw material transport at Shuidonggou Locality 2
CN109033753A (zh) 一种基于二级结构片段组装的群体蛋白质结构预测方法
Zhang et al. Relationship of population migration, crop production pattern, and socioeconomic development: evidence from the early 21st century
Price et al. On the representation of electrostatic fields around ab initio charge distributions
Hyde et al. Knotting fingerprints resolve knot complexity and knotting pathways in ideal knots

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant