CN102930180B - 确定蛋白质疏水能量的方法与装置 - Google Patents

确定蛋白质疏水能量的方法与装置 Download PDF

Info

Publication number
CN102930180B
CN102930180B CN201210415104.XA CN201210415104A CN102930180B CN 102930180 B CN102930180 B CN 102930180B CN 201210415104 A CN201210415104 A CN 201210415104A CN 102930180 B CN102930180 B CN 102930180B
Authority
CN
China
Prior art keywords
amino acid
hydrophobic
residue
energy
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210415104.XA
Other languages
English (en)
Other versions
CN102930180A (zh
Inventor
孙卫涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201210415104.XA priority Critical patent/CN102930180B/zh
Publication of CN102930180A publication Critical patent/CN102930180A/zh
Priority to US14/353,578 priority patent/US20150178444A1/en
Priority to PCT/CN2013/079910 priority patent/WO2014063506A1/zh
Application granted granted Critical
Publication of CN102930180B publication Critical patent/CN102930180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Abstract

本发明公开了一种确定蛋白质疏水能量的方法与装置。其中,确定蛋白质疏水能量的方法包括:根据各氨基酸的空间坐标,确定各氨基酸与其他氨基酸之间的距离;基于所确定的氨基酸之间的距离,确定各氨基酸的包埋系数;以及基于所述各氨基酸的包埋系数,确定所述蛋白质疏水能量。利用该方法,能够有效确定蛋白质疏水能量。

Description

确定蛋白质疏水能量的方法与装置
技术领域
本发明涉及分子生物领域,具体而言,本发明涉及一种确定蛋白质疏水能量的方法与装置,更具体的,本发明涉及一种蛋白质分子结构折叠的计算机模拟方法,特别是驱动分子发生折叠的疏水作用能量计算方法。
背景技术
蛋白质是生物体赖以存在和生长的重要大分子有机化合物,是一切生命活动的基础。目前,蛋白质分子结构的测定方法包括:X-射线散射方法、核磁共振方法、低温电镜方法等,另外通过建立发展理论模型和计算方法,在计算机上实现蛋白质结构预测及动力学模拟已成为近年来的研究热点。疏水作用是水溶液环境下球形蛋白质折叠的主要驱动力[1-3],疏水残基远离溶液环境并向蛋白质核心的埋藏过程导致了结构的快速折叠,是蛋白质折叠过程中最为重要的能量因素。
然而,目前确定蛋白质疏水作用能量的方法与装置,仍有待改进。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出了可以有效确定蛋白质疏水能量的方法与装置。
在本发明的一个方面,本发明提出了一种确定蛋白质疏水能量的方法。根据本发明的实施例,该方法包括:根据各氨基酸的空间坐标,确定各氨基酸与其他氨基酸之间的距离;基于所确定的氨基酸之间的距离,确定各氨基酸的包埋系数;以及基于所述各氨基酸的包埋系数,确定所述蛋白质疏水能量。由此,利用根据本发明实施例的确定蛋白质疏水能量的方法对蛋白质进行检测,可以有效地确定蛋白质的疏水能量,从而进一步对于有效地提高蛋白质折叠和结构的预测效率以及准确性具有非常重要的意义。
根据本发明的一些实施例,上述确定蛋白质疏水能量的方法还可以具有下列附加技术特征:
根据本发明的一个实施例,基于所确定的氨基酸之间的距离,确定各氨基酸的包埋系数进一步包括:基于所述各氨基酸与其他氨基酸之间的距离,确定所述各氨基酸之间的残基相邻关系;针对每个氨基酸,基于与其相邻的氨基酸数目,确定各氨基酸的包埋系数。由此,利用根据本发明实施例的确定蛋白质疏水能量的方法对蛋白质进行检测,可以有效地快速分析氨基酸残基包埋程度,进一步可以有效地确定疏水基团尺度变化程度,从而可以有效地估 算去浸润效应,并且可以有效地确定疏水能量。
根据本发明的一个实施例,确定所述多个氨基酸之间的残基相邻关系的原则为:设rij AB是残基A中原子i与残基B中原子j之间的距离,dAB是残基A和B表面之间范德华力的作用范围,原子i的半径为ri,原子j的半径为rj,则满足下式时,残基A和B相互接触,互为邻居:
r ij AB < r i + r j + d AB ,
所述dAB为5埃。由此,利用根据本发明实施例的确定蛋白质疏水能量的方法对蛋白质进行检测,可以有效地根据氨基酸原子的空间坐标计算出氨基酸之间的距离,进一步可以有效地快速分析氨基酸残基包埋程度,从而可以有效地确定疏水基团尺度变化程度。
根据本发明的一个实施例,针对每个氨基酸,按照公式确定各氨基酸的包埋系数C,其中nc为与所述氨基酸相互接触的邻居有数目,q为所述氨基酸周围空间中可能容纳的最多邻居数,其中,q为3~6。由此,利用根据本发明实施例的确定蛋白质疏水能量的方法对蛋白质进行检测,可以有效地定量判断氨基酸残基包埋程度,进一步可以有效地确定疏水基团尺度变化程度,从而可以有效地估算去浸润效应,并且可以有效地确定疏水能量。
根据本发明的一个实施例,基于所述各氨基酸的包埋系数C,确定所述蛋白质疏水能量进一步包括:基于各氨基酸的包埋系数C,确定各氨基酸残基的疏水强度因子p,所述疏水强度因子p按照公式 p = 1 - 1 1 + ex p - ( C - 1 ) 确定;
按照下列公式计算包含各氨基酸的疏水基团的能量降低:
dE A = p &Sigma; n = 1 n c d E An
其中,nc为与所述氨基酸接触的邻居数目,dEAn为所述氨基酸与第n个残基之间发生聚集带来的疏水能量。由此,利用根据本发明实施例的确定蛋白质疏水能量的方法对蛋白质进行检测,可以有效地确定疏水基团尺度变化程度以及可以有效地估算去浸润效应,并且可以有效地确定疏水能量。
在本发明的又一个方面,本发明提出了一种确定蛋白质疏水能量的装置,所述蛋白质由多个氨基酸构成。根据本发明的实施例,所述装置可以应用于前面所述的确定蛋白质疏水能量的方法。由此,利用根据本发明实施例的确定蛋白质疏水能量的装置对蛋白质进行检测,可以有效地确定蛋白质的疏水能量,从而进一步对于有效地提高蛋白质折叠和结构的预测效 率以及准确性具有非常重要的意义。
根据本发明的实施例,所述装置包括:距离计算单元,所述距离计算单元用于根据各氨基酸的空间坐标,确定各氨基酸与其他氨基酸之间的距离;包埋系数计算单元,所述包埋计算单元与所述距离计算单元相连,并且用于基于所确定的氨基酸之间的距离,确定各氨基酸的包埋系数;以及疏水能量计算单元,所述疏水能量计算单元与所述包埋系数计算单元相连,并且用于基于所述各氨基酸的包埋系数,确定所述蛋白质疏水能量。由此,利用根据本发明实施例的确定蛋白质疏水能量的装置对蛋白质进行检测,可以有效地确定蛋白质的疏水能量,从而进一步对于有效地提高蛋白质折叠和结构的预测效率以及准确性具有非常重要的意义。
根据本发明的一些实施例,上述确定蛋白质疏水能量的装置还可以具有下列附加技术特征:
根据本发明的一个实施例,所述包埋系数计算单元进一步包括:残基相邻关系确定模块,所述残基相邻关系确定模块用于基于所述各氨基酸与其他氨基酸之间的距离,确定所述各氨基酸之间的残基相邻关系;以及包埋系数确定模块,所述包埋系数确定模块与所述残基相邻关系确定模块相连,并且用于针对每个氨基酸,基于与其相邻的氨基酸数目,确定各氨基酸的包埋系数。由此,利用根据本发明实施例的确定蛋白质疏水能量的装置对蛋白质进行检测,可以有效地根据氨基酸原子的空间坐标计算出氨基酸之间的距离,进一步可以有效地快速分析氨基酸残基包埋程度,同时可以有效地定量判断氨基酸残基包埋程度,进一步可以有效地确定疏水基团尺度变化程度,从而可以有效地估算去浸润效应,并且可以有效地确定疏水能量。
根据本发明的一个实施例,残基相邻关系确定模块确定所述多个氨基酸之间的残基相邻关系的原则为:
设rij AB是残基A中原子i与残基B中原子j之间的距离,dAB是残基A和B表面之间范德华力的作用范围,原子i的半径为ri,原子j的半径为rj,则满足下式时,残基A和B相互接触,互为邻居:
r ij AB < r i + r j + d AB ,
所述dAB为5埃。由此,利用根据本发明实施例的确定蛋白质疏水能量的装置对蛋白质进行检测,可以有效地根据氨基酸原子的空间坐标计算出氨基酸之间的距离,进一步可以有效地快速分析氨基酸残基包埋程度,从而可以有效地确定疏水基团尺度变化程度。
根据本发明的一个实施例,其特征在于,包埋系数确定模块适于针对每个氨基酸,按照公式确定各氨基酸的包埋系数,其中nc为与所述氨基酸相互接触的邻居有数目, q为所述氨基酸周围空间中可能容纳的最多邻居数,其中,q为3~6。由此,利用根据本发明实施例的确定蛋白质疏水能量的装置对蛋白质进行检测,可以有效地定量判断氨基酸残基包埋程度,进一步可以有效地确定疏水基团尺度变化程度,从而可以有效地估算去浸润效应,并且可以有效地确定疏水能量。
根据本发明的一个实施例,所述疏水能量计算单元进一步包括:疏水强度因子计算模块,所述疏水因子确定模块用于基于各氨基酸的包埋系数C,确定各氨基酸残基的疏水强度因子p,所述疏水强度因子p按照公式确定;疏水基团能量降低计算模块,所述疏水基团能量降低计算模块与所述疏水强度因子计算模块相连,并且用于按照下列公式计算包含各氨基酸的疏水基团的能量降低:
dE A = p &Sigma; n = 1 n c d E An
其中,nc为与所述氨基酸接触的邻居数目,dEAn为所述氨基酸与第n个残基之间发生聚集带来的疏水能量。由此,利用根据本发明实施例的确定蛋白质疏水能量的装置对蛋白质进行检测,可以有效地确定疏水基团尺度变化程度以及可以有效地估算去浸润效应,并且可以有效地确定疏水能量。
根据本发明的实施例的确定蛋白质疏水能量的方法可以实现下列优点至少之一:
1、根据本发明的实施例的确定蛋白质疏水能量的方法,本项发明具有依据蛋白质分子结构状态自动调整疏水作用的特点,可以在模拟结构折叠的同时,根据氨基酸基团所处的状态,自然形成疏水作用和氢键作用之间的相对强度,正确计算疏水作用对结构稳定的能量贡献;
2、根据本发明的实施例的确定蛋白质疏水能量的方法,可以提高蛋白质结构的灵活性,可以根据结构紧密程度不断调整疏水作用对结构塌缩的驱动强度,允许结构过于紧密时重新打开,摆脱错误折叠结构的束缚,有助于加速蛋白质分子结构折叠;
3、根据本发明的实施例的确定蛋白质疏水能量的方法,该方法提供了一个自适应的疏水-氢键能量平衡机制,有利于疏水核心-二级结构之间的协调平衡,结构的灵活调整能力有助于形成更多氢键、二级以及三级结构。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的确定蛋白质疏水能量的方法流程示意图;以及
图2显示了根据本发明一个实施例的确定蛋白质疏水能量的装置的结构示意图;
图3显示了根据本发明又一个实施例的确定蛋白质疏水能量的装置的结构示意图;
图4是根据本发明一个实施例的肌红蛋白(晶体结构代号2BLH)的折叠模拟的三维空间初始展开状态分子结构示意图;
图5是根据本发明一个实施例的肌红蛋白(晶体结构代号2BLH)的X射线结构示意图;
图6是根据本发明一个实施例的非去浸润效应条件下的旋转半径和去浸润因子变化曲线;
图7是根据本发明一个实施例的去浸润效应条件下的旋转半径和去浸润因子变化曲线;
图8是根据本发明一个实施例的非去浸润效应条件下的疏水-氢键能量和氢键数量变化曲线;
图9是根据本发明一个实施例的去浸润效应条件下的疏水-氢键能量和氢键数量变化曲线。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“厚度”、“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
疏水作用是水溶液环境下球形蛋白质折叠的主要驱动力[1-3],对蛋白质折叠的能量贡献与蛋白质结构状态有关,而疏水作用和氢键作用的协调与平衡是蛋白质结构折叠的关键,但是同时也是蛋白质分子结构折叠计算机模拟的难点。发明人在研究中发现,在非去浸润效应条件下,疏水作用和氢键作用之间的相对强度关系难以协调,具体表现如下:
1、当参数设定使疏水作用强于氢键作用时,疏水作用对自由能起主导作用,分子结构过早被压缩成球状结构,很难再打开调整残基之间距离,这阻碍了氢键的形成,导致出现无规则结构的“绒线团”;
2、当参数设定疏水作用弱于氢键作用时,氢键作用对自由能起主导作用,结构具备调整残基距离的柔韧性,有助于形成氢键和规则结构,但是无法形成疏水核心,分子结构过于松散,规则结构也会不断打开,无法形成稳定结构;
3、寻找合理的疏水作用计算方法,使疏水作用和氢键作用在整个折叠过程中都有助于 二级结构和三级结构的形成十分困难。
基于以上原因,在非去浸润效应条件下,难以实现对蛋白质疏水能量的确定。
发明人惊奇地发现,在去浸润效应条件下,按照本发明的技术方案,疏水作用和氢键作用之间的相对强度关系可以得到很好地协调,具体表现如下:
1、本项技术方案可以根据结构紧密程度不断调整疏水作用对结构塌缩的驱动强度,允许结构过于紧密时重新打开,摆脱错误折叠结构的束缚,有助于加速蛋白质分子结构折叠,可以提高蛋白质结构的灵活性,解决了以往疏水作用强度模型固定,不是导致结构过于紧密、氢键数目不够,就是导致结构过于松散、无法形成疏水核心的难题。
2、本项技术方案可以提供一个自适应的疏水-氢键能量平衡机制,有利于疏水核心-二级结构之间的协调平衡,结构的灵活调整能力有助于形成更多氢键和二级结构,可以促进蛋白质折叠过程中氢键和二级结构的形成。
基于上述考虑,发明人提出在去浸润效应基础上对蛋白质疏水能量进行确定的方法,首先根据氨基酸原子的空间坐标计算出氨基酸之间的距离,采用基于原子距离的空间接触判断准则快速分析氨基酸残基包埋程度,接着根据包埋程度可以确定疏水基团尺度变化程度,然后再根据疏水基团尺度变化程度可以估算去浸润效应,在此基础上再确定蛋白质疏水能量。
在本发明的一个方面,本发明提出了一种确定蛋白质疏水能量的方法。参考图1,根据本发明的实施例,确定蛋白质疏水能量的方法可以包括以下步骤:
S100:根据各氨基酸的空间坐标,确定各氨基酸与其他氨基酸之间的距离
在该步骤中,根据各氨基酸的空间坐标,确定各氨基酸与其他氨基酸之间的距离。由此,可以确定氨基酸残基的相互距离关系。
根据本发明的实施例,确定所述多个氨基酸之间的残基相邻关系的原则为:设rij AB是残基A中原子i与残基B中原子j之间的距离,dAB是残基A和B表面之间范德华力的作用范围,原子i的半径为ri,原子j的半径为rj,则满足下式时,残基A和B相互接触,互为邻居:
所述dAB为5埃。由此,可以有效地根据氨基酸原子的空间坐标计算出氨基酸之间的相互接触关系,进一步可以有效地利用空间判断法则快速分析氨基酸残基包埋程度,从而可以有效地确定疏水基团尺度变化程度。
根据本发明的实施例,通过哈希表存储氨基酸相互接触关系。氨基酸之间两两接触关系是判断包埋程度的基础,通常需要一个n×n的稀疏矩阵保存,然而当n很大时,需要消耗很大内存空间。发明人发现,利用哈希表来保存残基相邻关系,将残基序号作为哈希函数输入生成哈希表值,可以大大降低了蛋白质结构折叠模拟计算的内存需求量。由此,利用哈希表可以有效地存储氨基酸相互接触关系。
S200:基于所确定的氨基酸之间的距离,确定各氨基酸的包埋系数
在该步骤中,根据步骤S100中所得到氨基酸之间的距离,确定各氨基酸的包埋系数。由此,可以确定氨基酸残基的包埋程度。
根据本发明的实施例,针对每个氨基酸,按照公式确定各氨基酸的包埋系数C,其中nc为与所述氨基酸相互接触的邻居有数目,q为所述氨基酸周围空间中可能容纳的最多邻居数,其中,q为3~6。由此,可以有效地定量判断氨基酸残基包埋程度,进一步可以有效地确定疏水基团尺度变化程度,从而可以有效地估算去浸润效应,并且可以有效地确定疏水能量。
S300:基于所确定的各氨基酸的包埋系数,确定蛋白质疏水能量
在该步骤中,根据步骤S200中所得到的各氨基酸的包埋系数确定疏水基团尺度变化程度,然后再根据疏水基团尺度变化程度可以估算去浸润效应,在此基础上再确定蛋白质疏水能量。由此,可以确定蛋白质的疏水能量。
疏水基团尺度大小与去浸润效应的相互关系如下:
疏水基团的尺度大小决定了水分子与残基之间的相互作用程度,疏水基团越大,水分子越难以紧密包围疏水基团,反之疏水基团越小,水分子越容易包裹疏水基团,而去浸润效应是由蛋白质分子跟水分子之间相互作用的关系引起的,大疏水基团周围的水分子较稀疏,疏水作用强度降低,则去浸润效应明显;小疏水基团周围的水分子较密集,疏水作用强度升高,则去浸润效应不明显。在本研究中,引入与包埋系数c有关的疏水强度因子p,疏水作用强度的具体程度由疏水强度因子p来衡量,该因子描述了氨基酸残基与周围残基形成疏水基团之后,疏水残基聚集效应对蛋白质分子结构稳定的能量贡献大小,当包埋系数c越大时,p值越小,去浸润效应越明显,疏水作用对结构稳定性的能量贡献越弱;反之,当包埋系数c越小时,p值越大,去浸润效应越不明显,疏水作用对结构稳定性的能量贡献越强。由此,可以对去浸润效应进行估算,从而可以有效地确定疏水能量。
根据本发明的实施例,所述疏水强度因子p按照公式确定。由此,可以有效地确定疏水基团尺度变化程度以及可以有效地估算去浸润效应,从而可以有效地确定疏水能量。
本研究中,在估算去浸润效应的基础上确定疏水基团的能量,设残基A周围存在nc个接触邻居,把A与水溶液环境隔离开来,A与第n个残基之间发生聚集带来的疏水能量下降表示为dEAn,则形成包含A的整个疏水基团带来的能量降低为:
dE A = p &Sigma; n = 1 n c d E An
其中,p表示与当前基团包埋程度有关的疏水强度因子。将测得每个基团的疏水能量求 和,进而得到整个蛋白质分子的疏水能量。由此,利用根据本发明实施例的确定蛋白质疏水能量的方法对蛋白质进行检测,可以有效地确定蛋白质的疏水能量。
在本发明的又一个方面,本发明提出了一种确定蛋白质疏水能量的装置,所述蛋白质由多个氨基酸构成。参考图2,根据本发明的实施例,该确定蛋白质疏水能量的装置1000包括:距离计算单元100、包埋系数计算单元200以及疏水能量计算单元300。根据本发明的实施例,距离计算单元100用于根据各氨基酸的空间坐标,确定各氨基酸与其他氨基酸之间的距离;包埋计算单元200与距离计算单元100相连,并且用于基于所确定的氨基酸之间的距离,确定各氨基酸的包埋系数;疏水能量计算单元300与包埋系数计算单元200相连,并且用于基于各氨基酸的包埋系数,确定所述蛋白质疏水能量。根据本发明的实施例,该装置能够有效地应用于前面所述的确定蛋白质疏水能量的方法,从而有效确定蛋白质的疏水能量。
参考图3,在本发明的一个实施例中,所述包埋系数计算单元200进一步包括:残基相邻关系确定模块210以及包埋系数确定模块220。根据本发明的实施例,残基相邻关系确定模块210用于基于所述各氨基酸与其他氨基酸之间的距离,确定所述各氨基酸之间的残基相邻关系;包埋系数确定模块220与残基相邻关系确定模块210相连,并且用于针对每个氨基酸,基于与其相邻的氨基酸数目,确定各氨基酸的包埋系数。
在本发明的一个实施例中,残基相邻关系确定模块210确定所述多个氨基酸之间的残基相邻关系的原则为:设是残基A中原子i与残基B中原子j之间的距离,dAB是残基A和B表面之间范德华力的作用范围,原子i的半径为ri,原子j的半径为rj,则满足下式时,残基A和B相互接触,互为邻居:
r ij AB < r i + r j + d AB ,
所述dAB为5埃。由此,可以有效地根据氨基酸原子的空间坐标计算出氨基酸之间的相互接触关系,进一步可以有效地利用空间判断法则快速分析氨基酸残基包埋程度,从而可以有效地确定疏水基团尺度变化程度。
在本发明的一个实施例中,包埋系数确定模块220适于针对每个氨基酸,按照公式 确定各氨基酸的包埋系数c,其中nc为与所述氨基酸相互接触的邻居有数目,q为所述氨基酸周围空间中可能容纳的最多邻居数,其中,q为3~6。由此,可以有效地定量判断氨基酸残基包埋程度,进一步可以有效地确定疏水基团尺度变化程度,从而可以有效地估算去浸润效应,并且可以有效地确定疏水能量。
在本发明的一个实施例中,所述疏水能量计算单元300进一步包括:疏水因子计算模块310,所述疏水因子确定模块310用于基于各氨基酸的包埋系数c,确定各氨基酸残基的疏 水因子p,所述疏水因子p按照公式确定;疏水基团能量降低计算模块320,所述疏水基团能量降低计算模块320与所述疏水因子计算模块310相连,并且用于按照下列公式计算包含各氨基酸的疏水基团的能量降低为:
dE A = p &Sigma; n = 1 n c dE An
其中,nc为与所述氨基酸接触的邻居数目,dEAn为所述氨基酸与第n个残基之间发生聚集带来的疏水能量。将测得每个基团的疏水能量求和,进而得到整个蛋白质分子的疏水能量。由此,利用根据本发明实施例的确定蛋白质疏水能量的装置对蛋白质进行检测,可以有效地确定疏水基团尺度变化程度以及可以有效地估算去浸润效应,并且可以有效地确定蛋白质的疏水能量。
根据本发明的实施例,检测蛋白质的种类不受特别限制,例如根据本发明的一个实施例,对肌红蛋白进行检测,相关技术人员当然也可以扩大本发明的检测对象范围,在此不予赘述,这些均在本发明的权利保护范围之内。
根据本发明的实施例,关于蛋白质疏水能量检测的具体条件不受特别限制,例如根据本发明的一个实施例,采用全原子CSAW折叠计算法[4],根据本发明的另外一个实施例,可以在折叠初期(70步之前)进行疏水能量检测,本领域技术人员可以采用任何的已知方法和设备,还可以通过或者通过预先实验来确定所需要的工艺参数,在此不再赘述。
本发明的确定蛋白质疏水能量的方法与装置可以应用在提高蛋白质折叠和结构的预测效率以及准确性领域,相关技术人员当然也可以将其扩大至其它其应用领域,在此不予赘述,这些均在本发明的权利保护范围之内。
下面通过具体的实施例,对本发明进行说明,需要说明的是这些实施例仅仅是为了说明目的,而不能以任何方式解释成对本发明的限制。另外,在下列实施例中如果没有特别说明,则所采用的设备和材料均为市售可得的。
在下列实施例中,确定蛋白质疏水能量的方法的主要步骤是:
1、计算氨基酸距离,通过哈希表存储氨基酸相互接触关系;
2、通过残基空间堆积模型的归一化,定量判断残基包埋程度;
3、根据残基包埋程度,判断疏水基团的大小,基于去浸润效应,确定疏水强度系数;
4、疏水基团整体能量计算,得到蛋白质分子疏水能。
实施例1
按照上述确定蛋白质疏水能量方法的主要步骤,采用全原子CSAW折叠算法[4]对肌红蛋白(晶体结构代号2BLH)进行检测,肌红蛋白的结构如4图与图5所示。在经过折叠初期的疏水塌缩阶段后,如图7所示,蛋白质分子旋转半径随着折叠步数仍在不断上下起伏,表明仍 然具备不断调整结构的能力,而疏水强度因子p随着结构半径降低而降低,这表示蛋白质分子在折叠到较紧密状态后,疏水作用会因去浸润效应而减弱,是结构有更多机会做局部调整。对比不采用去浸润疏水作用计算技术的曲线(如图6所示),疏水强度因子p不随结构状态改变,分子旋转半径在经过初期塌缩阶段后趋近于一条平坦直线,这表明分子结构始终被强度很大的疏水作用仅仅束缚,无法打开结构作局部调整。
以往的固定疏水作用强度的模型,不是导致结构过于紧密、氢键数目不够,就是导致结构过于松散、无法形成疏水核心,而本实施例却可以根据结构紧密程度不断调整疏水作用对结构塌缩的驱动强度,允许结构过于紧密时重新打开,摆脱错误折叠结构的束缚,有助于加速蛋白质分子结构折叠。由此可见,采用本发明技术方案,提高了蛋白质结构的灵活性,取得了明显的积极效果。
实施例2
按照上述确定蛋白质疏水能量方法的主要步骤,采用全原子CSAW折叠算法[4]对肌红蛋白(晶体结构代号2BLH)进行检测。如图9所示,在折叠初期(70步之前),疏水作用占据主导地位,疏水能量低于氢键能量,引导结构向有利于疏水作用能量降低的方向发展,之后,结构半径降低到一个相对稳定的阶段,考虑去浸润效应的疏水能量计算技术显示出优势。由于去浸润效应,疏水作用强度降低,疏水能量对结构折叠的引导作用减弱,而氢键能量的地位相对变得更重要,两条能量曲线在90步附近发生相交,之后,氢键能量低于疏水能量,引导结构向有利于形成更多氢键的方向发展,而氢键数量的不断增加,显然有助于生成折叠态结构。对比不采用去浸润疏水作用计算技术的曲线(如图8所示),非浸润效应的能量计算导致疏水能量始终小于氢键能量,分子结构始终朝有利于疏水作用能量降低的方向发展,阻碍了更多氢键的形成,氢键生成数量100步之后基本不增长,停留在13个左右。
本实施例无论在提高分子结构柔韧性方面,还是在促进氢键形成与加速结构折叠方面均具有优越性。由此可见,采用本发明的技术方案,有助于促进蛋白质折叠过程中氢键和二级结构的形成,取得了明显的积极效果。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型,这些均落在本发明的权利保护范围。
参考文献如下:
[1]Kauzmann W.Some Factors in the Interpretation of Protein Denaturation.Advances in Protein Chemistry.1959;14:1-63.
[2]Tanford C.The Hydrophobic Effect:Formation of Micelles and Biological Membranes2nd edition ed.New York:John Wiley&Sons Inc;1980.
[3]Privalov PL.Stability of Protein-Structure and Hydrophobic Interactions.Biol Chem H-S.1988;369:199-.
[4]Sun W.Protein folding simulation by all-atom CSAW method2007. 

Claims (6)

1.一种确定蛋白质疏水能量的方法,所述蛋白质由多个氨基酸构成,其特征在于,所述方法包括:
根据各氨基酸的空间坐标,确定各氨基酸与其他氨基酸之间的距离;
基于所确定的氨基酸之间的距离,确定各氨基酸的包埋系数;以及
基于所述各氨基酸的包埋系数,确定所述蛋白质疏水能量,
其中,基于所确定的氨基酸之间的距离,确定各氨基酸的包埋系数进一步包括:
基于所述各氨基酸与其他氨基酸之间的距离,确定所述各氨基酸之间的残基相邻关系;
针对每个氨基酸,基于与其相邻的氨基酸数目,确定各氨基酸的包埋系数,
确定所述多个氨基酸之间的残基相邻关系的原则为:
是残基A中原子i与残基B中原子j之间的距离,dAB是残基A和B表面之间范德华力的作用范围,原子i的半径为ri,原子j的半径为rj,则满足下式时,残基A和B相互接触,互为邻居:
r ij AB < r i + r j + d AB ,
所述dAB为5埃。
2.根据权利要求1所述的方法,其特征在于,针对每个氨基酸,按照公式确定各氨基酸的包埋系数,其中nc为与所述氨基酸相互接触的邻居数,q为所述氨基酸周围空间中可能容纳的最多邻居数,其中,q为3~6。
3.根据权利要求2所述的方法,其特征在于,基于所述各氨基酸的包埋系数,确定所述蛋白质疏水能量进一步包括:
基于各氨基酸的包埋系数C,确定各氨基酸残基的疏水强度因子p,所述疏水强度因子p按照公式 p = 1 - 1 1 + exp - ( C - 1 ) 确定;
按照下列公式计算包含各氨基酸的疏水基团的能量降低:
dE A = p &Sigma; n = 1 n c dE An
其中,nc为与所述氨基酸接触的邻居数目,dEAn为所述氨基酸与第n个残基之间发生聚集带来的疏水能量。
4.一种确定蛋白质疏水能量的装置,所述蛋白质由多个氨基酸构成,其特征在于,所述装置包括:
距离计算单元,所述距离计算单元用于根据各氨基酸的空间坐标,确定各氨基酸与其他氨基酸之间的距离;
包埋系数计算单元,所述包埋系数计算单元与所述距离计算单元相连,并且用于基于所确定的氨基酸之间的距离,确定各氨基酸的包埋系数;以及
疏水能量计算单元,所述疏水能量计算单元与所述包埋系数计算单元相连,并且用于基于所述各氨基酸的包埋系数,确定所述蛋白质疏水能量,
其中,所述包埋系数计算单元进一步包括:
残基相邻关系确定模块,所述残基相邻关系确定模块用于基于所述各氨基酸与其他氨基酸之间的距离,确定所述各氨基酸之间的残基相邻关系;以及
包埋系数确定模块,所述包埋系数确定模块与所述残基相邻关系确定模块相连,并且用于针对每个氨基酸,基于与其相邻的氨基酸数目,确定各氨基酸的包埋系数,
残基相邻关系确定模块确定所述多个氨基酸之间的残基相邻关系的原则为:
是残基A中原子i与残基B中原子j之间的距离,dAB是残基A和B表面之间范德华力的作用范围,原子i的半径为ri,原子j的半径为rj,则满足下式时,残基A和B相互接触,互为邻居:
r ij AB < r j + r j + d AB ,
所述dAB为5埃。
5.根据权利要求4所述的装置,其特征在于,包埋系数确定模块适于针对每个氨基酸,按照公式确定各氨基酸的包埋系数,其中nc为与所述氨基酸相互接触的邻居数,q为所述氨基酸周围空间中可能容纳的最多邻居数,其中,q为3~6。
6.根据权利要求5所述的装置,其特征在于,所述疏水能量计算单元进一步包括:
疏水因子计算模块,所述疏水因子计算模块用于基于各氨基酸的包埋系数C,确定各氨基酸残基的疏水强度因子p,所述疏水强度因子p按照公式确定;疏水基团能量降低计算模块,所述疏水基团能量降低计算模块与所述疏水因子计算模块相连,并且用于按照下列公式计算包含各氨基酸的疏水基团的能量降低:
dE A = p &Sigma; n = 1 n c dE An
其中,nc为与所述氨基酸接触的邻居数目,dEAn为所述氨基酸与第n个残基之间发生聚集带来的疏水能量。
CN201210415104.XA 2012-10-25 2012-10-25 确定蛋白质疏水能量的方法与装置 Active CN102930180B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201210415104.XA CN102930180B (zh) 2012-10-25 2012-10-25 确定蛋白质疏水能量的方法与装置
US14/353,578 US20150178444A1 (en) 2012-10-25 2013-07-23 Method and device for determining hydrophobic energy of protein
PCT/CN2013/079910 WO2014063506A1 (zh) 2012-10-25 2013-07-23 确定蛋白质疏水能量的方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210415104.XA CN102930180B (zh) 2012-10-25 2012-10-25 确定蛋白质疏水能量的方法与装置

Publications (2)

Publication Number Publication Date
CN102930180A CN102930180A (zh) 2013-02-13
CN102930180B true CN102930180B (zh) 2015-07-29

Family

ID=47644977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210415104.XA Active CN102930180B (zh) 2012-10-25 2012-10-25 确定蛋白质疏水能量的方法与装置

Country Status (3)

Country Link
US (1) US20150178444A1 (zh)
CN (1) CN102930180B (zh)
WO (1) WO2014063506A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930180B (zh) * 2012-10-25 2015-07-29 清华大学 确定蛋白质疏水能量的方法与装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101086503A (zh) * 2007-06-08 2007-12-12 中国科学院力学研究所 一种判断蛋白质分子间生理属性相似性的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030224338A1 (en) * 2000-12-05 2003-12-04 Emberly Eldon G. Method of generating non-naturally occuring protein models
US20050130224A1 (en) * 2002-05-31 2005-06-16 Celestar Lexico- Sciences, Inc. Interaction predicting device
US20060025928A1 (en) * 2004-07-29 2006-02-02 International Business Machines Corporation Hydropathy plots and fourier analysis with an ellipsoidal distance metric
US20080046192A1 (en) * 2006-08-16 2008-02-21 Richard Lathrop Polypepetide-encoding nucleotide sequences with refined translational kinetics and methods of making same
CN100590649C (zh) * 2008-02-27 2010-02-17 中山大学 基于蚁群算法的蛋白质折叠优化方法
CN102930180B (zh) * 2012-10-25 2015-07-29 清华大学 确定蛋白质疏水能量的方法与装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101086503A (zh) * 2007-06-08 2007-12-12 中国科学院力学研究所 一种判断蛋白质分子间生理属性相似性的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蛋白质结构动力学研究进展;孙卫涛;《力学进展》;20090325;第39卷(第2期);第129-153页 *

Also Published As

Publication number Publication date
US20150178444A1 (en) 2015-06-25
WO2014063506A1 (zh) 2014-05-01
CN102930180A (zh) 2013-02-13

Similar Documents

Publication Publication Date Title
Kuhn et al. On phase field modeling of ductile fracture
Christensen Modeling diffusion-induced stress in Li-ion cells with porous electrodes
Shen et al. rMATS: robust and flexible detection of differential alternative splicing from replicate RNA-Seq data
US11340298B2 (en) Apparatus and method for calculating state of charge of battery by reflecting noise
Ooi et al. A hybrid finite element-scaled boundary finite element method for crack propagation modelling
Nguyen-Xuan et al. An edge-based finite element method (ES-FEM) with adaptive scaled-bubble functions for plane strain limit analysis
CN103902004B (zh) 一种充电剩余时间计算方法、装置及移动设备
Yamamoto Correlated cluster mean-field theory for spin systems
Huang et al. Well-balanced finite volume scheme for shallow water flooding and drying over arbitrary topography
Kou et al. Parameters identification of nonlinear state space model of synchronous generator
Wang et al. An arc-length method for controlled cohesive crack propagation using high-order XFEM and Irwin’s crack closure integral
CN111130074B (zh) 基于电压首极值时间的直流输电线超高速保护系统及方法
CN102930180B (zh) 确定蛋白质疏水能量的方法与装置
Li et al. Grain boundary traction signatures: quantitative predictors of dislocation emission
CN105137244B (zh) 用于实现电力系统中静态电压稳定监测的方法及系统
CN106372275A (zh) 用于蠕变裂纹扩展数值模拟结果的修正方法
CN108877969A (zh) 核功率理论模型建立及验证方法、系统及终端设备
Chen Combination determining weights method for multiple attribute decision making based on maximizing deviations
CN107024666A (zh) 用于估计电池soc的装置
Talachutla et al. Improved indicator algorithms for tracking a hydrated proton as a local structural defect in Grotthuss diffusion in aqueous solutions
Ge et al. Adaptive finite element approximation for a constrained optimal control problem via multi-meshes
CN102590750B (zh) 电池容量计算方法及电池容量计算装置
Liang et al. Boundary elements for half‐space problems via fundamental solutions: A three‐dimensional analysis
TW201504801A (zh) 可攜式電子裝置及電源管理方法
Du et al. Investigation of the cathodic protection potential distribution on the exterior of steel tank bottom

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CI01 Publication of corrected invention patent application

Correction item: Claim statement

Correct: Correct

False: Error

Number: 07

Volume: 29

CI02 Correction of invention patent application

Correction item: Claim statement

Correct: Correct

False: Error

Number: 07

Page: Description

Volume: 29

ERR Gazette correction

Free format text: CORRECT: CLAIM OF RIGHT SPECIFICATION; FROM: ERROR TO: CORRECT

RECT Rectification
C14 Grant of patent or utility model
GR01 Patent grant