CN109273048A - 一种蛋白质表面残基的快速确定方法 - Google Patents

一种蛋白质表面残基的快速确定方法 Download PDF

Info

Publication number
CN109273048A
CN109273048A CN201811059193.2A CN201811059193A CN109273048A CN 109273048 A CN109273048 A CN 109273048A CN 201811059193 A CN201811059193 A CN 201811059193A CN 109273048 A CN109273048 A CN 109273048A
Authority
CN
China
Prior art keywords
coordinate
denoted
coordinate points
protein
cos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811059193.2A
Other languages
English (en)
Other versions
CN109273048B (zh
Inventor
胡俊
刘俊
肖璐倩
张贵军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zhaoji Biotechnology Co ltd
Shenzhen Xinrui Gene Technology Co ltd
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201811059193.2A priority Critical patent/CN109273048B/zh
Publication of CN109273048A publication Critical patent/CN109273048A/zh
Application granted granted Critical
Publication of CN109273048B publication Critical patent/CN109273048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种蛋白质表面残基的快速确定方法,首先,抽取蛋白质所有残基的中心碳原子在笛卡尔坐标系下的坐标信息;其次,计算这些中心碳原子的中心点坐标信息;再次,计算这些中心碳原子与计算得到的中心点之间的位置关系;最后,根据这些位置关系,判断对应残基是否为蛋白质表面残基。本发明提供一种计算代价低、精确度高的蛋白质表面残基确定方法。

Description

一种蛋白质表面残基的快速确定方法
技术领域
本发明涉及生物学信息学及计算机应用领域,具体而言涉及一种蛋白质表面残基的快速确定方法。
背景技术
蛋白质是一种由20种常见氨基酸组成的有机大分子。它是生命活动的物质基础,是与各种形式的生命活动紧密联系在一起的物质。在生命活动中,蛋白质需要与其他的生物分子产生相互作用,来完成特定的生物学功能。而在与其他生物分子产生相互作用时,大多数情况下都是暴露在蛋白质表面的残基(称为表面残基)与其他生物学分子发生物理化学作用。因此,准确识别蛋白质中的表面残基,对于研究蛋白质的功能与进一步的生物制药具有重要的指导意义。
目前,专门用于确定蛋白质表面残基的计算方法还很欠缺。查阅文献可以发现,Mandler在1988年提出的ANTIGEN方法(Mandler J.ANTIGEN:protein surface residueprediction[J].Bioinformatics,1988,4(4):493-493.)是使用蛋白质二级结构等信息来辅助确定表面残基的。PyMol软件(Delano W L.The PyMOL Molecular Graphic System[J].2002.)中是使用探针的方式来确定蛋白质表面残基。除此之外,还可以通过计算蛋白质中每个残基的溶剂可及性面积来辅助判断蛋白质的表面残基。尽管这些为数不多的计算方法可以用于确定蛋白质表面残基,但这些方法均存在计算复杂度较高、识别精度较低的问题,并不能有效地用于实际应用。
综上所述,专门用于确定蛋白质表面残基的计算方法还很欠缺,现存的蛋白质表面残基确定方法在计算代价、精确度方面,距离实际应用的要求还有很大差距,迫切地需要改进。
发明内容
为了克服现有的蛋白质表面残基确定方法在计算代价、精确性方面的不足,本发明提出一种能从蛋白质结构信息出发,计算代价低、精确度高的蛋白质表面残基确定方法。
本发明解决其技术问题所采用的技术方案是:
一种蛋白质表面残基的快速确定方法,所述方法包括以下步骤:
1)输入待确定表面残基的蛋白质结构信息,记作A;
2)将A中的每个残基的中心碳原子Cα看做是笛卡尔坐标系下的一个坐标点,记作R={R1,R2,…,RN},其中Ri为表示A的第i个残基的Cα的坐标点,N是A的残基数目;
3)从蛋白质结构信息A中,抽取R中所有坐标点的坐标信息,记为P={p1,p2,…,pN},其中pi=(xi,yi,zi)T表示坐标点Ri的坐标信息,xi、yi与zi分别表示坐标点Ri在笛卡尔坐标系下的三个维度信息,T表示向量的转置;
4)计算R中所有坐标点的中心点O的坐标信息,记作o:
并计算R中所有坐标点与O之间的欧氏距离,记作D={d1,d2,…,dN},其中di
表示坐标点Ri与O之间的欧氏距离;
5)针对R中的任意两个不同坐标点Ri与Rj,计算它们与O组成的角∠RiORj的余弦值
其中,||·||为向量的模运算符;
6)计算R中距离最远的两个坐标点的距离,记作df:
并根据计算得到的df,计算阈值thcos
thcos=cos(2·arcsin(k/df))
其中,k为控制thcos大小的参数,cos与arcsin分别为余弦与反正弦运算符;7)选择D中值最大的元素,记为di′,并将其对应坐标点Ri′对应的残基标记为表面残基,然后将元素di′从D中移除,再将Ri′从R中移除,最后检查R中余下的每一个坐标点Rj,若大于thcos,则将Rj标记为非表面残基,从R和D中移除Rj与dj
8)若D中元素数目不为0,返回步骤7),否则,将A中所有残基是否为表面残基的标记信息返回。
本发明的技术构思为:首先,抽取蛋白质所有残基的中心碳原子在笛卡尔坐标系下的坐标信息;其次,计算这些中心碳原子的中心点坐标信息;再次,计算这些中心碳原子与计算得到的中心点之间的位置关系;最后,根据这些位置关系,判断对应残基是否为蛋白质表面残基。本发明提供一种计算代价低、精确度高的蛋白质表面残基确定方法。
本发明的有益效果表现在:直接从蛋白质结构信息出发,快速精确地确定了蛋白质表面残基,对理解蛋白质的结构与功能起到了促进作用。
附图说明
图1为一种蛋白质表面残基的快速确定方法的示意图。
图2为使用一种蛋白质表面残基的快速确定方法对蛋白质1XEFA确定表面残基后得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种蛋白质表面残基的快速确定方法,包括以下步骤:
1)输入待确定表面残基的蛋白质结构信息,记作A;
2)将A中的每个残基的中心碳原子Cα看做是笛卡尔坐标系下的一个坐标点,记作R={R1,R2,…,RN},其中Ri为表示A的第i个残基的Cα的坐标点,N是A的残基数目;
3)从蛋白质结构信息A中,抽取R中所有坐标点的坐标信息,记为P={p1,p2,…,pN},其中pi=(xi,yi,zi)T表示坐标点Ri的坐标信息,xi、yi与zi分别表示坐标点Ri在笛卡尔坐标系下的三个维度信息,T表示向量的转置;
4)计算R中所有坐标点的中心点O的坐标信息,记作o:
并计算R中所有坐标点与O之间的欧氏距离,记作D={d1,d2,…,dN},其中di表示坐标点Ri与O之间的欧氏距离;
5)针对R中的任意两个不同坐标点Ri与Rj,计算它们与O组成的角∠RiORj的余弦值
其中,||·||为向量的模运算符;
6)计算R中距离最远的两个坐标点的距离,记作df:
并根据计算得到的df,计算阈值thcos
thcos=cos(2·arcsin(k/df))
其中,k为控制thcos大小的参数,cos与arcsin分别为余弦与反正弦运算符;7)选择D中值最大的元素,记为di′,并将其对应坐标点Ri′对应的残基标记为表面残基,然后将元素di′从D中移除,再将Ri′从R中移除,最后检查R中余下的每一个坐标点Rj,若大于thcos,则将Rj标记为非表面残基,从R和D中移除Rj与dj
8)若D中元素数目不为0,返回步骤7),否则,将A中所有残基是否为表面残基的标记信息返回。
本实施例以确定蛋白质1XEFA的表面残基为实施例,一种蛋白质表面残基的快速确定方法,包括以下步骤:
1)输入待确定表面残基的蛋白质结构信息,记作A;
2)将A中的每个残基的中心碳原子Cα看做是笛卡尔坐标系下的一个坐标点,记作R={R1,R2,…,RN},其中Ri为表示A的第i个残基的Cα的坐标点,N是A的残基数目;
3)从蛋白质结构信息A中,抽取R中所有坐标点的坐标信息,记为P={p1,p2,…,pN},其中pi=(xi,yi,zi)T表示坐标点Ri的坐标信息,xi、yi与zi分别表示坐标点Ri在笛卡尔坐标系下的三个维度信息,T表示向量的转置;
4)计算R中所有坐标点的中心点O的坐标信息,记作o:
并计算R中所有坐标点与O之间的欧氏距离,记作D={d1,d2,…,dN},其中di表示坐标点Ri与O之间的欧氏距离;
5)针对R中的任意两个不同坐标点Ri与Rj,计算它们与O组成的角∠RiORj的余弦值
其中,||·||为向量的模运算符;
6)计算R中距离最远的两个坐标点的距离,记作df:
并根据计算得到的df,计算阈值thcos
thcos=cos(2·arcsin(k/df))
其中,控制thcos大小的参数k的值为3.8埃,cos与arcsin分别为余弦与反正弦运算符;
7)选择D中值最大的元素,记为di′,并将其对应坐标点Ri′对应的残基标记为表面残基,然后将元素di′从D中移除,再将Ri′从R中移除,最后检查R中余下的每一个坐标点Rj,若大于thcos,则将Rj标记为非表面残基,从R和D中移除Rj与dj
8)若D中元素数目不为0,返回步骤7),否则,将A中所有残基是否为表面残基的标记信息返回。
以确定蛋白质1XEFA的表面残基为实施例,运用以上方法得到了蛋白质1XEFA的表面残基,蛋白质1XEFA的表面残基的数目为137,表面残基结构如图2所示。
以上说明是本发明以确定蛋白质1XEFA的表面残基为实例所得出的结果,并非限定本发明的实施范围,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

Claims (1)

1.一种蛋白质表面残基的快速确定方法,其特征在于,所述快速确定方法包括以下步骤:
1)输入待确定表面残基的蛋白质结构信息,记作A;
2)将A中的每个残基的中心碳原子Cα看做是笛卡尔坐标系下的一个坐标点,记作R={R1,R2,…,RN},其中Ri为表示A的第i个残基的Cα的坐标点,N是A的残基数目;
3)从蛋白质结构信息A中,抽取R中所有坐标点的坐标信息,记为P={p1,p2,…,pN},其中pi=(xi,yi,zi)T表示坐标点Ri的坐标信息,xi、yi与zi分别表示坐标点Ri在笛卡尔坐标系下的三个维度信息,T表示向量的转置;
4)计算R中所有坐标点的中心点O的坐标信息,记作o:
并计算R中所有坐标点与O之间的欧氏距离,记作D={d1,d2,…,dN},其中di表示坐标点Ri与O之间的欧氏距离;
5)针对R中的任意两个不同坐标点Ri与Rj,计算它们与O组成的角∠RiORj的余弦值
其中,||·||为向量的模运算符;
6)计算R中距离最远的两个坐标点的距离,记作df:
并根据计算得到的df,计算阈值thcos
thcos=cos(2·arcsin(k/df))
其中,k为控制thcos大小的参数,cos与arcsin分别为余弦与反正弦运算符;
7)选择D中值最大的元素,记为di′,并将其对应坐标点Ri′对应的残基标记为表面残基,然后将元素di′从D中移除,再将Ri′从R中移除,最后检查R中余下的每一个坐标点Rj,若大于thcos,则将Rj标记为非表面残基,从R和D中移除Rj与dj
8)若D中元素数目不为0,返回步骤7),否则,将A中所有残基是否为表面残基的标记信息返回。
CN201811059193.2A 2018-09-12 2018-09-12 一种蛋白质表面残基的快速确定方法 Active CN109273048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811059193.2A CN109273048B (zh) 2018-09-12 2018-09-12 一种蛋白质表面残基的快速确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811059193.2A CN109273048B (zh) 2018-09-12 2018-09-12 一种蛋白质表面残基的快速确定方法

Publications (2)

Publication Number Publication Date
CN109273048A true CN109273048A (zh) 2019-01-25
CN109273048B CN109273048B (zh) 2021-08-03

Family

ID=65188567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811059193.2A Active CN109273048B (zh) 2018-09-12 2018-09-12 一种蛋白质表面残基的快速确定方法

Country Status (1)

Country Link
CN (1) CN109273048B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110600076A (zh) * 2019-08-14 2019-12-20 浙江工业大学 一种基于距离和角度信息的蛋白质atp对接方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018152434A1 (en) * 2017-02-17 2018-08-23 The Regents Of The University Of California Systems and methods for making assignments in isotope-labelled proteins using nuclear magnetic resonance data
CN108475298A (zh) * 2015-11-09 2018-08-31 英属哥伦比亚大学 通过集体坐标偏置预测错误折叠的蛋白质表位的系统和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108475298A (zh) * 2015-11-09 2018-08-31 英属哥伦比亚大学 通过集体坐标偏置预测错误折叠的蛋白质表位的系统和方法
WO2018152434A1 (en) * 2017-02-17 2018-08-23 The Regents Of The University Of California Systems and methods for making assignments in isotope-labelled proteins using nuclear magnetic resonance data

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FEILU WANG ET AL.: "Prediction of Protein-Protein Interaction Sites Using Back Propagation Neural Networks", 《2013 NINTH INTERNATIONAL CONFERENCE ON NATURAL COMPUTATION (ICNC)》 *
汪一亭: "隐马尔科夫模型基于残基对蛋白质序列的分析", 《池州学院学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110600076A (zh) * 2019-08-14 2019-12-20 浙江工业大学 一种基于距离和角度信息的蛋白质atp对接方法
CN110600076B (zh) * 2019-08-14 2021-11-23 浙江工业大学 一种基于距离和角度信息的蛋白质atp对接方法

Also Published As

Publication number Publication date
CN109273048B (zh) 2021-08-03

Similar Documents

Publication Publication Date Title
Chen et al. Seqtrack: Sequence to sequence learning for visual object tracking
Li et al. Cdpn: Coordinates-based disentangled pose network for real-time rgb-based 6-dof object pose estimation
Vriend WHAT IF: a molecular modeling and drug design program
CN106289262B (zh) 用于混合虚拟和实体楼层地图的技术
EP3255609B1 (en) A method of automatically identifying a sequence of marking points in 3d medical image
CN103885583B (zh) 对眼动追踪器进行硬件校准的装置和方法
CN103488415B (zh) 基于纸介质的手书文字和图形识别系统及识别方法
CN107918925A (zh) 磁跟踪系统与成像装置的配准
CN107256230A (zh) 一种基于多元化地理信息点的融合方法
KR20210049655A (ko) 특징맵 생성방법 및 특징맵 생성장치
CN112825129A (zh) 用于文档处理的位置嵌入
CN104864821A (zh) 计算设备和方法
CN109273048A (zh) 一种蛋白质表面残基的快速确定方法
Li et al. Automatic Labanotation generation from motion-captured data based on hidden Markov models
AU2022271364A1 (en) Facilitating identification of fillable regions in a form
CN108175500A (zh) 基于手持式三维扫描仪的手术导航空间配准方法
CN109346125A (zh) 一种快速精确的蛋白质绑定口袋结构对齐方法
CN103778182B (zh) 一种快速图形相似度判别方法
Yu et al. Beyond textual constraints: Learning novel diffusion conditions with fewer examples
CN109558809A (zh) 一种图像处理方法及装置
CN109583484A (zh) 一种三类海域地标点自动选取方法
Ji et al. Accuracy analysis of line-based registration for image guided neurosurgery at different operating areas–a phantom study
CN114119684B (zh) 基于四面体结构的标记点配准方法
Liu et al. Magnetostatic active contour model with classification method of sparse representation
Raghuram et al. Short Review on Contrastive Learning-based Segmentation Techniques for Medical Image Processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231227

Address after: 518054, D1101, Building 4, Software Industry Base, No. 19, 17, and 18 Haitian 1st Road, Binhai Community, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Xinrui Gene Technology Co.,Ltd.

Address before: 510075 No. n2248, floor 3, Xingguang Yingjing, No. 117, Shuiyin Road, Yuexiu District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU ZHAOJI BIOTECHNOLOGY CO.,LTD.

Effective date of registration: 20231227

Address after: 510075 No. n2248, floor 3, Xingguang Yingjing, No. 117, Shuiyin Road, Yuexiu District, Guangzhou City, Guangdong Province

Patentee after: GUANGZHOU ZHAOJI BIOTECHNOLOGY CO.,LTD.

Address before: The city Zhaohui six districts Chao Wang Road Hangzhou City, Zhejiang province 310014 18

Patentee before: JIANG University OF TECHNOLOGY

TR01 Transfer of patent right