CN109273048B - 一种蛋白质表面残基的快速确定方法 - Google Patents

一种蛋白质表面残基的快速确定方法 Download PDF

Info

Publication number
CN109273048B
CN109273048B CN201811059193.2A CN201811059193A CN109273048B CN 109273048 B CN109273048 B CN 109273048B CN 201811059193 A CN201811059193 A CN 201811059193A CN 109273048 B CN109273048 B CN 109273048B
Authority
CN
China
Prior art keywords
coordinate
residues
information
calculating
cos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811059193.2A
Other languages
English (en)
Other versions
CN109273048A (zh
Inventor
胡俊
刘俊
肖璐倩
张贵军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zhaoji Biotechnology Co ltd
Shenzhen Xinrui Gene Technology Co ltd
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201811059193.2A priority Critical patent/CN109273048B/zh
Publication of CN109273048A publication Critical patent/CN109273048A/zh
Application granted granted Critical
Publication of CN109273048B publication Critical patent/CN109273048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种蛋白质表面残基的快速确定方法,首先,抽取蛋白质所有残基的中心碳原子在笛卡尔坐标系下的坐标信息;其次,计算这些中心碳原子的中心点坐标信息;再次,计算这些中心碳原子与计算得到的中心点之间的位置关系;最后,根据这些位置关系,判断对应残基是否为蛋白质表面残基。本发明提供一种计算代价低、精确度高的蛋白质表面残基确定方法。

Description

一种蛋白质表面残基的快速确定方法
技术领域
本发明涉及生物学信息学及计算机应用领域,具体而言涉及一种蛋白质表面残基的快速确定方法。
背景技术
蛋白质是一种由20种常见氨基酸组成的有机大分子。它是生命活动的物质基础,是与各种形式的生命活动紧密联系在一起的物质。在生命活动中,蛋白质需要与其他的生物分子产生相互作用,来完成特定的生物学功能。而在与其他生物分子产生相互作用时,大多数情况下都是暴露在蛋白质表面的残基(称为表面残基)与其他生物学分子发生物理化学作用。因此,准确识别蛋白质中的表面残基,对于研究蛋白质的功能与进一步的生物制药具有重要的指导意义。
目前,专门用于确定蛋白质表面残基的计算方法还很欠缺。查阅文献可以发现,Mandler在1988年提出的ANTIGEN方法(Mandler J.ANTIGEN:protein surface residueprediction[J].Bioinformatics,1988,4(4):493-493.)是使用蛋白质二级结构等信息来辅助确定表面残基的。PyMol软件(Delano W L.The PyMOL Molecular Graphic System[J].2002.)中是使用探针的方式来确定蛋白质表面残基。除此之外,还可以通过计算蛋白质中每个残基的溶剂可及性面积来辅助判断蛋白质的表面残基。尽管这些为数不多的计算方法可以用于确定蛋白质表面残基,但这些方法均存在计算复杂度较高、识别精度较低的问题,并不能有效地用于实际应用。
综上所述,专门用于确定蛋白质表面残基的计算方法还很欠缺,现存的蛋白质表面残基确定方法在计算代价、精确度方面,距离实际应用的要求还有很大差距,迫切地需要改进。
发明内容
为了克服现有的蛋白质表面残基确定方法在计算代价、精确性方面的不足,本发明提出一种能从蛋白质结构信息出发,计算代价低、精确度高的蛋白质表面残基确定方法。
本发明解决其技术问题所采用的技术方案是:
一种蛋白质表面残基的快速确定方法,所述方法包括以下步骤:
1)输入待确定表面残基的蛋白质结构信息,记作A;
2)将A中的每个残基的中心碳原子Cα看做是笛卡尔坐标系下的一个坐标点,记作R={R1,R2,…,RN},其中Ri为表示A的第i个残基的Cα的坐标点,N是A的残基数目;
3)从蛋白质结构信息A中,抽取R中所有坐标点的坐标信息,记为P={p1,p2,…,pN},其中pi=(xi,yi,zi)T表示坐标点Ri的坐标信息,xi、yi与zi分别表示坐标点Ri在笛卡尔坐标系下的三个维度信息,T表示向量的转置;
4)计算R中所有坐标点的中心点O的坐标信息,记作o:
Figure BDA0001796618880000021
并计算R中所有坐标点与O之间的欧氏距离,记作D={d1,d2,…,dN},其中di
表示坐标点Ri与O之间的欧氏距离;
5)针对R中的任意两个不同坐标点Ri与Rj,计算它们与O组成的角∠RiORj的余弦值
Figure BDA0001796618880000022
Figure BDA0001796618880000023
其中,||·||为向量的模运算符;
6)计算R中距离最远的两个坐标点的距离,记作df:
Figure BDA0001796618880000024
并根据计算得到的df,计算阈值thcos
thcos=cos(2·arcsin(k/df))
其中,k为控制thcos大小的参数,cos与arcsin分别为余弦与反正弦运算符;7)选择D中值最大的元素,记为di′,并将其对应坐标点Ri′对应的残基标记为表面残基,然后将元素di′从D中移除,再将Ri′从R中移除,最后检查R中余下的每一个坐标点Rj,若
Figure BDA0001796618880000025
大于thcos,则将Rj标记为非表面残基,从R和D中移除Rj与dj
8)若D中元素数目不为0,返回步骤7),否则,将A中所有残基是否为表面残基的标记信息返回。
本发明的技术构思为:首先,抽取蛋白质所有残基的中心碳原子在笛卡尔坐标系下的坐标信息;其次,计算这些中心碳原子的中心点坐标信息;再次,计算这些中心碳原子与计算得到的中心点之间的位置关系;最后,根据这些位置关系,判断对应残基是否为蛋白质表面残基。本发明提供一种计算代价低、精确度高的蛋白质表面残基确定方法。
本发明的有益效果表现在:直接从蛋白质结构信息出发,快速精确地确定了蛋白质表面残基,对理解蛋白质的结构与功能起到了促进作用。
附图说明
图1为一种蛋白质表面残基的快速确定方法的示意图。
图2为使用一种蛋白质表面残基的快速确定方法对蛋白质1XEFA确定表面残基后得到的三维结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种蛋白质表面残基的快速确定方法,包括以下步骤:
1)输入待确定表面残基的蛋白质结构信息,记作A;
2)将A中的每个残基的中心碳原子Cα看做是笛卡尔坐标系下的一个坐标点,记作R={R1,R2,…,RN},其中Ri为表示A的第i个残基的Cα的坐标点,N是A的残基数目;
3)从蛋白质结构信息A中,抽取R中所有坐标点的坐标信息,记为P={p1,p2,…,pN},其中pi=(xi,yi,zi)T表示坐标点Ri的坐标信息,xi、yi与zi分别表示坐标点Ri在笛卡尔坐标系下的三个维度信息,T表示向量的转置;
4)计算R中所有坐标点的中心点O的坐标信息,记作o:
Figure BDA0001796618880000031
并计算R中所有坐标点与O之间的欧氏距离,记作D={d1,d2,…,dN},其中di表示坐标点Ri与O之间的欧氏距离;
5)针对R中的任意两个不同坐标点Ri与Rj,计算它们与O组成的角∠RiORj的余弦值
Figure BDA0001796618880000032
Figure BDA0001796618880000041
其中,||·||为向量的模运算符;
6)计算R中距离最远的两个坐标点的距离,记作df:
Figure BDA0001796618880000042
并根据计算得到的df,计算阈值thcos
thcos=cos(2·arcsin(k/df))
其中,k为控制thcos大小的参数,cos与arcsin分别为余弦与反正弦运算符;7)选择D中值最大的元素,记为di′,并将其对应坐标点Ri′对应的残基标记为表面残基,然后将元素di′从D中移除,再将Ri′从R中移除,最后检查R中余下的每一个坐标点Rj,若
Figure BDA0001796618880000043
大于thcos,则将Rj标记为非表面残基,从R和D中移除Rj与dj
8)若D中元素数目不为0,返回步骤7),否则,将A中所有残基是否为表面残基的标记信息返回。
本实施例以确定蛋白质1XEFA的表面残基为实施例,一种蛋白质表面残基的快速确定方法,包括以下步骤:
1)输入待确定表面残基的蛋白质结构信息,记作A;
2)将A中的每个残基的中心碳原子Cα看做是笛卡尔坐标系下的一个坐标点,记作R={R1,R2,…,RN},其中Ri为表示A的第i个残基的Cα的坐标点,N是A的残基数目;
3)从蛋白质结构信息A中,抽取R中所有坐标点的坐标信息,记为P={p1,p2,…,pN},其中pi=(xi,yi,zi)T表示坐标点Ri的坐标信息,xi、yi与zi分别表示坐标点Ri在笛卡尔坐标系下的三个维度信息,T表示向量的转置;
4)计算R中所有坐标点的中心点O的坐标信息,记作o:
Figure BDA0001796618880000044
并计算R中所有坐标点与O之间的欧氏距离,记作D={d1,d2,…,dN},其中di表示坐标点Ri与O之间的欧氏距离;
5)针对R中的任意两个不同坐标点Ri与Rj,计算它们与O组成的角∠RiORj的余弦值
Figure BDA0001796618880000051
Figure BDA0001796618880000052
其中,||·||为向量的模运算符;
6)计算R中距离最远的两个坐标点的距离,记作df:
Figure BDA0001796618880000053
并根据计算得到的df,计算阈值thcos
thcos=cos(2·arcsin(k/df))
其中,控制thcos大小的参数k的值为3.8埃,cos与arcsin分别为余弦与反正弦运算符;
7)选择D中值最大的元素,记为di′,并将其对应坐标点Ri′对应的残基标记为表面残基,然后将元素di′从D中移除,再将Ri′从R中移除,最后检查R中余下的每一个坐标点Rj,若
Figure BDA0001796618880000054
大于thcos,则将Rj标记为非表面残基,从R和D中移除Rj与dj
8)若D中元素数目不为0,返回步骤7),否则,将A中所有残基是否为表面残基的标记信息返回。
以确定蛋白质1XEFA的表面残基为实施例,运用以上方法得到了蛋白质1XEFA的表面残基,蛋白质1XEFA的表面残基的数目为137,表面残基结构如图2所示。
以上说明是本发明以确定蛋白质1XEFA的表面残基为实例所得出的结果,并非限定本发明的实施范围,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。

Claims (1)

1.一种蛋白质表面残基的快速确定方法,其特征在于,所述快速确定方法包括以下步骤:
1)输入待确定表面残基的蛋白质结构信息,记作A;
2)将A中的每个残基的中心碳原子Cα看做是笛卡尔坐标系下的一个坐标点,记作R={R1,R2,…,RN},其中Ri为表示A的第i个残基的Cα的坐标点,N是A的残基数目;
3)从蛋白质结构信息A中,抽取R中所有坐标点的坐标信息,记为P={p1,p2,…,pN},其中pi=(xi,yi,zi)T表示坐标点Ri的坐标信息,xi、yi与zi分别表示坐标点Ri在笛卡尔坐标系下的三个维度信息,T表示向量的转置;
4)计算R中所有坐标点的中心点O的坐标信息,记作o:
Figure FDA0002998695820000011
并计算R中所有坐标点与O之间的欧氏距离,记作D={d1,d2,…,dN},其中di表示坐标点Ri与O之间的欧氏距离;
5)针对R中的任意两个不同坐标点Ri与Rj,计算它们与O组成的角∠RiORj的余弦值
Figure FDA0002998695820000012
Figure FDA0002998695820000013
其中,||·||为向量的模运算符;
6)计算R中距离最远的两个坐标点的距离,记作df:
Figure FDA0002998695820000014
并根据计算得到的df,计算阈值thcos
thcos=cos(2·arcsin(k/df))
其中,k为控制thcos大小的参数,cos与arcsin分别为余弦与反正弦运算符;
7)选择D中值最大的元素,记为di′,并将其对应坐标点Ri′对应的残基标记为表面残基,然后将元素di′从D中移除,再将Ri′从R中移除,最后检查R中余下的每一个坐标点Rj,若
Figure FDA0002998695820000021
大于thcos,则将Rj标记为非表面残基,从R中移除Rj,从D中移除dj
8)若D中元素数目不为0,返回步骤7),否则,将A中所有残基是否为表面残基的标记信息返回。
CN201811059193.2A 2018-09-12 2018-09-12 一种蛋白质表面残基的快速确定方法 Active CN109273048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811059193.2A CN109273048B (zh) 2018-09-12 2018-09-12 一种蛋白质表面残基的快速确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811059193.2A CN109273048B (zh) 2018-09-12 2018-09-12 一种蛋白质表面残基的快速确定方法

Publications (2)

Publication Number Publication Date
CN109273048A CN109273048A (zh) 2019-01-25
CN109273048B true CN109273048B (zh) 2021-08-03

Family

ID=65188567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811059193.2A Active CN109273048B (zh) 2018-09-12 2018-09-12 一种蛋白质表面残基的快速确定方法

Country Status (1)

Country Link
CN (1) CN109273048B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110600076B (zh) * 2019-08-14 2021-11-23 浙江工业大学 一种基于距离和角度信息的蛋白质atp对接方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018152434A1 (en) * 2017-02-17 2018-08-23 The Regents Of The University Of California Systems and methods for making assignments in isotope-labelled proteins using nuclear magnetic resonance data
CN108475298A (zh) * 2015-11-09 2018-08-31 英属哥伦比亚大学 通过集体坐标偏置预测错误折叠的蛋白质表位的系统和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108475298A (zh) * 2015-11-09 2018-08-31 英属哥伦比亚大学 通过集体坐标偏置预测错误折叠的蛋白质表位的系统和方法
WO2018152434A1 (en) * 2017-02-17 2018-08-23 The Regents Of The University Of California Systems and methods for making assignments in isotope-labelled proteins using nuclear magnetic resonance data

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Prediction of Protein-Protein Interaction Sites Using Back Propagation Neural Networks;Feilu Wang et al.;《2013 Ninth International Conference on Natural Computation (ICNC)》;20130723;第1057-1061页 *
隐马尔科夫模型基于残基对蛋白质序列的分析;汪一亭;《池州学院学报》;20140630;第28卷(第3期);第25-27页 *

Also Published As

Publication number Publication date
CN109273048A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
JP5020395B2 (ja) 画像処理装置および画像処理方法
JPH06176200A (ja) パターン認識方法及び装置
CN112150523B (zh) 一种低重叠率的三维点云配准方法
CN110930442B (zh) 基于标定块的机器人手眼标定中关键点位置确定方法与装置
JP2009020014A (ja) 自己位置推定装置
US20200051278A1 (en) Information processing apparatus, information processing method, robot system, and non-transitory computer-readable storage medium
JP2010033447A (ja) 画像処理装置および画像処理方法
CN103699623A (zh) 地理编码实现方法和装置
CN109273048B (zh) 一种蛋白质表面残基的快速确定方法
CN110717385A (zh) 一种动态手势识别方法
CN109346125B (zh) 一种快速精确的蛋白质绑定口袋结构对齐方法
CN112633423A (zh) 文本识别模型的训练方法、文本识别方法、装置及设备
CN109463003A (zh) 对象识别
Nanni et al. Set of approaches based on 3D structure and position specific-scoring matrix for predicting DNA-binding proteins
CN116051873A (zh) 关键点匹配方法、装置及电子设备
KR20170114408A (ko) 도로의 특성 정보를 이용한 도로 유형 정보 제공 시스템 및 방법
KR102492230B1 (ko) 영상 워핑을 이용한 번호판 검출 장치 및 방법
CN103778182A (zh) 一种快速图形相似度判别方法
CN110399892B (zh) 环境特征提取方法和装置
CN111899235A (zh) 图像检测方法、装置、电子设备和存储介质
CN112287763A (zh) 图像处理方法、装置、设备及介质
JP4525526B2 (ja) パターンマッチング方法及び装置
CN111859100B (zh) 一种检索意图转移识别方法及装置
JP2006139713A (ja) 3次元物体位置検出装置、プログラム
Peng et al. An Improved Monocular-Vision-Based Method for the Pose Measurement of the Disc Cutter Holder of Shield Machine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231227

Address after: 518054, D1101, Building 4, Software Industry Base, No. 19, 17, and 18 Haitian 1st Road, Binhai Community, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Xinrui Gene Technology Co.,Ltd.

Address before: 510075 No. n2248, floor 3, Xingguang Yingjing, No. 117, Shuiyin Road, Yuexiu District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU ZHAOJI BIOTECHNOLOGY CO.,LTD.

Effective date of registration: 20231227

Address after: 510075 No. n2248, floor 3, Xingguang Yingjing, No. 117, Shuiyin Road, Yuexiu District, Guangzhou City, Guangdong Province

Patentee after: GUANGZHOU ZHAOJI BIOTECHNOLOGY CO.,LTD.

Address before: The city Zhaohui six districts Chao Wang Road Hangzhou City, Zhejiang province 310014 18

Patentee before: JIANG University OF TECHNOLOGY