CN116343912B - 生物信号通路中磷酸化系统的磷酸化活性预测方法及系统 - Google Patents

生物信号通路中磷酸化系统的磷酸化活性预测方法及系统 Download PDF

Info

Publication number
CN116343912B
CN116343912B CN202310601374.8A CN202310601374A CN116343912B CN 116343912 B CN116343912 B CN 116343912B CN 202310601374 A CN202310601374 A CN 202310601374A CN 116343912 B CN116343912 B CN 116343912B
Authority
CN
China
Prior art keywords
protein
phosphorylation
concentration
signal path
information entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310601374.8A
Other languages
English (en)
Other versions
CN116343912A (zh
Inventor
张瑞
蔺香运
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN202310601374.8A priority Critical patent/CN116343912B/zh
Publication of CN116343912A publication Critical patent/CN116343912A/zh
Application granted granted Critical
Publication of CN116343912B publication Critical patent/CN116343912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/13Differential equations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Computational Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioethics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Medicinal Chemistry (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请涉及一种生物信号通路中磷酸化系统的磷酸化活性预测方法及系统,属于生物信息计算领域,该预测方法采用实验测量和数学计算相结合的方式,对磷酸化系统进行拟合建模,利用实验测量数据与拟合模型的理论数据估计磷酸化系统的随机扰动,并以此计算磷酸化系统的信息熵作为信号通路中磷酸化系统的磷酸化活性的指标,该预测方法成本低且误差小,对磷酸化系统的磷酸化活性测定的准确度较高,该预测方法对与磷酸化相关的疾病研究以及药物设计具有重要的意义,具有较高的产业应用价值。

Description

生物信号通路中磷酸化系统的磷酸化活性预测方法及系统
技术领域
本申请涉及一种生物信号通路中磷酸化系统的磷酸化活性预测方法及系统,属于生物信息计算技术领域。
背景技术
真核生物中蛋白质磷酸化(Protein phosphorylation)是迄今为止最重要和最普遍的翻译修饰,并协调各种生物过程包括信号传导、自噬和新陈代谢。生物体内高度复杂的网络由信号通路构成,信号通路由典型的模块组成,这些模块包括Ras蛋白、G蛋白、磷酸化系统和MAP激酶级联。信号通路中的磷酸化事件大多发生在ATP消耗时,磷酸化系统所采用的机制为:在使用ATP进行初始磷酸化后,磷酸基团从一个蛋白质转移到下一个蛋白质,而对磷酸化系统的磷酸化活性的测定会影响分子生物学的许多领域,且对相关疾病的研究以及药物设计等有重大意义。
现有技术中完全采用实验方法存在时间长成本高且测量误差大的问题,且在实践中会受到其他因素的干扰和限制,因此非常有必要提供一种成本低、误差小而且准确度高的磷酸化活性测定方法。
发明内容
为了解决上述问题,提供了一种生物信号通路中磷酸化系统的磷酸化活性预测方法及系统,该方法结合实验测量和数学计算的方式对磷酸化系统的磷酸化活性进行测量,具有成本低、误差小以及准确度高的优点,该预测方法对磷酸化相关的疾病研究以及药物的设计工作具有非常重大的意义,具有较高的产业运用价值。
根据本申请的一个方面,提供了一种生物信号通路中磷酸化系统的磷酸化活性预测方法,包括以下步骤:
S1.基于生物信号通路模型,即该生物信号通路模型中所涉及的各蛋白以及磷酸基团在各蛋白间转移的各化学通路,并以各蛋白的瞬时浓度和各化学通路的反应速率常数建立该生物信号通路模型的常微分方程组数学模型;
S2.在实验室条件下施加能够引起该生物信号通路模型变化的刺激,并测量该生物信号通路模型中各蛋白在施加刺激过程中不同时刻的浓度数据,利用上述获得的浓度数据采用Newton-raphson算法对所述常微分方程组数学模型进行多变量非线性方程拟合,求解所述常微分方程组数学模型中各化学通路的反应速率常数;
S3.对随机过程进行采样,实验测量的浓度数据减去利用数学模型计算的理论浓度数据,获得随机过程的样本矩阵数据,并利用该样本矩阵数据计算各蛋白浓度变化的信息熵;
S4.计算整个系统的信息熵,整个系统的信息熵为各蛋白浓度变化的信息熵之和,以整个系统的信息熵大小表征该信号通路中的磷酸化活性。
可选的,所述步骤S2中Newton-raphson算法中目标函数为式(I)所示,其中表示第/>个蛋白,/>表示实验测量浓度,/>表示以迭代变化量/>计算的理论浓度,/>表示统计标准差,/>表示迭代过程中各化学通路的反应速率常数的矩阵,
式(I)。
可选的,所述步骤S3中样本矩阵为,如式(II)所示,各蛋白的信息熵为/>,计算公式如式(III)所示,整个系统的信息熵/>的计算公式如式(IV)所示;
式(II);
式(III);
式(IV);
其中表示该生物信号通路模型中所涉及的蛋白总数,/>表示第/>个蛋白,/>表示施加刺激的时长,/>表示第/>时刻,/>的计算方式为第/>个蛋白第/>时刻的实验测量浓度减去代入数学模型计算的理论浓度,其中/>表示第/>个蛋白的信息熵,/>表示第/>个蛋白第/>时刻的实验测量浓度。
根据本申请的另一个方面,提供了一种生物信号通路中磷酸化系统的磷酸化活性预测系统,包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器处理该指令时实现如任一上述预测方法步骤。
本申请的有益效果包括但不限于:
1.根据本申请的磷酸化活性预测方法,采用实验测量以及数学计算相结合的方式,通过对磷酸化信号通路模型进行拟合,并结合实验测量的数据计算磷酸化系统的信息熵,用于表征磷酸化系统的磷酸化活性,具有成本低、误差小的优点,且该预测方法具有较高的准确度。
2.根据本申请的磷酸化活性预测方法,采用Newton-raphson算法对信号通路模型进行拟合和求解,该方法具有较快的收敛速度,拟合过程不需要对非线性模型进行线性化,消除了线性误差,并可以通过对阈值的设定得到较高的精度,在保证准确度的同时获得较快的计算速度。
3.根据本申请的磷酸化活性预测方法,在对磷酸化系统状态空间建模之后,利用实验测量的数值与拟合建模的理论数值之间的差值作为随机扰动计算磷酸化系统的信息熵,并以该信息熵的定量方式对磷酸化系统的磷酸化活性进行表征,由于随机扰动来自于实际实验数值的计算,因此具有计算简单、结果明确、误差较小的优点。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例涉及的高渗透压甘油信号通路的磷酸化系统示意图;
图2为本申请实施例涉及的实施方案的流程图;
图3为本申请实施例涉及的案例1的轨道图;
图4为本申请实施例涉及的案例2的轨道图;
图5为本申请实施例涉及的案例3的轨道图。
具体实施方式
下面结合实施例详述本申请,但本申请并不局限于这些实施例。
根据本申请的一个方面,提供了一种生物信号通路中磷酸化系统的磷酸化活性预测方法,如图2中流程图中所示,包括以下步骤:
通过蛋白质分子检测仪检测出生物信号通路中各蛋白质分子的浓度;
基于生物信号通路模型,即该生物信号通路模型中所涉及的各蛋白以及磷酸基团在各蛋白间转移的各化学通路,并以各蛋白的瞬时浓度和各化学通路的反应速率常数建立该生物信号通路模型的常微分方程组数学模型;
在实验室条件下施加能够引起该生物信号通路模型变化的刺激,并测量该生物信号通路模型中各蛋白在施加刺激过程中不同时刻的浓度数据,利用上述获得的浓度数据采用Newton-raphson算法对所述常微分方程组数学模型进行多变量非线性方程拟合,求解所述常微分方程组数学模型中各化学通路的反应速率常数;
对随机过程进行采样获得样本矩阵如式(II)所示:
式(II);
中/>表示该生物信号通路模型中所涉及的蛋白总数,/>表示第/>个蛋白,/>表示施加刺激的时长,/>表示第/>时刻,/>的计算方式为第/>个蛋白第/>时刻的实验测量浓度减去代入数学模型计算的理论浓度,计算个蛋白质分子的信息熵如式(III)所示:
式(III);
其中表示第/>个蛋白的信息熵,/>表示第/>个蛋白第/>时刻的实验测量浓度;
计算整个系统的信息熵S如式(IV)所示:
式(IV);
其中,以信息熵S的大小表征信号通路中的磷酸化活性;
式(I);
其中Newton-raphson算法的目标函数如式(I)所示,其中表示第/>个蛋白,/>表示实验测量浓度,/>表示以迭代变化量/>计算的理论浓度,/>表示统计标准差,/>表示迭代过程中各化学通路的反应速率常数的矩阵。
本申请还提供了一种生物信号通路中磷酸化系统的磷酸化活性预测系统,包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器处理该指令时实现如任一上述预测方法步骤。
本申请提供的磷酸化活性预测系统,采用实验测量以及数学计算相结合的方式,相比于完全使用实验测量的方式具有成本低、测量难度小以及误差小的特点,由于实验测量过程中存在误差,通过实验测量与数学计算的方式对磷酸化系统的磷酸化活性进行估计和测量,能够减少因实验测量带来的误差,提高磷酸化活性的检测准确度。
首先对磷酸化信号通路进行数学建模,基于信号通路的生物模型,建立通路中各蛋白浓度与各化学通路反应速率常数的常微分方程组,利用实验室测量的各蛋白浓度数据,采用Newton-raphson算法对常微分方程组进行拟合,获得拟合后的数学模型,之后利用实验测量数据与拟合后的数学模型的理论浓度数据之间的差值,计算该磷酸化系统的信息熵,并通过该磷酸化系统信息熵的大小衡量该磷酸化系统的磷酸化活性,具有计算量少、拟合速度快的优点,且利用实验测量的浓度数据与拟合后数据模型计算的理论浓度之差,即该磷酸化系统的扰动进行各蛋白信息熵的计算,进而利用各蛋白的信息熵计算磷酸化系统的信息熵,并将该磷酸化系统的信息熵作为该磷酸化系统的磷酸化活性的衡量标志,具有成本低、易于获得且定量准确度高的优点。在降低成本、降低操作难度的同时,能够保证较低的误差以及较高的准确度,还能获得较快的收敛速度,对与磷酸化相关的信号通路的研究以及产品设计、药物研究具有重要的应用价值。
下面具体结合高渗透压甘油信号通路的磷酸化系统对本申请的方案进行具体说明。
如图1所示为高渗透压甘油信号通路的磷酸化系统示意图,跨膜蛋白Sln1感受外界的高渗透压信号,并将信号通过Ypd1转移到Ssk1并向外输出。在正常或低渗透压条件下,ATP消耗的过程如下:Sln1均匀地分布在细胞膜上,Sln1的组氨酸激酶活性催化自身的一个组氨酸残基磷酸化,该磷酸基团可以从该组氨酸残基转移到Sln1 C末端的受体结构域(Rec)1144位的天冬氨酸残基上,该磷酸基团继续传递给磷酸基团携带中间体蛋白Ypd1的64位组氨酸残基,并最终传递给调控蛋白Ssk1天冬氨酸残基,Ssk1的持续被磷酸化阻止了Ssk1与其下游的MAPKKK Ssk2(或称Ssk22)之间的相互作用,因此Ssk22处于非活性状态。
在高渗透压胁迫条件下,以上该途径被外部渗透压的增加和细胞内伴随的膨压损失所阻断,膨压急剧降低,细胞溶质体积缩小,从而引起细胞膜与细胞壁之间的距离加大,Sln1因为两者之间的距离变化而被激活,由膜上的均匀分布状态迅速聚集成点状结构,Sln1的组氨酸激酶活性被抑制,导致下游Ypd1和Ssk1不能被磷酸化,Ssk1的浓度增高,构成输出信号,非磷酸化的Ssk1能够与MAPKKK Ssk2相结合,引起MAPKKK Ssk2的自身磷酸化并被激活。
该高渗透压甘油信号通路中主要涉及Sln1、Ypd1和Ssk1三种蛋白及各自的磷酸化形式Sln1.P、Ypd1.P和Ssk1.P三种蛋白共计六种蛋白,结合图1中的化学通路,根据各蛋白的浓度与各通路的反应速率常数构建该磷酸化系统的常微分方程组数学模型,之后采用实验数据对该方程进行拟合,并以此计算磷酸化系统的扰动,利用该扰动计算磷酸化系统的信息熵,用于衡量磷酸化系统的磷酸化活性,下面结合具体的实施过程对本方案进行阐述。
1.建立常微分方程组数学模型
根据图1,用以下一组微分方程组描述该磷酸化系统的时间行为,等式左项为对应蛋白的变化量,等式右项对应图1信号通路中的各化学通路变化,其中为对应化学通路的反应速率常数:
对于上式中的常微分方程组系统,有以下守恒关系成立:
即上述三对蛋白的总数不变,磷酸基团在三对蛋白之间进行转移。
2.建立磷酸化系统的状态空间系统模型
基于上述的常微分方程系统,将实验室中实际测得的六个蛋白在各个时刻的浓度值分别标记为,并用/>来表示浓度状态向量,从0时刻起对细胞进行200s的HOG压力刺激,获得浓度状态向量随时间的变化数据集合,并根据此数据集合来对上述的微分方程组进行拟合,从而确定模型中的反应速率常数。由于磷酸化系统中存在扰动,因此施加随机波动/>,通过估计系统的随机性来估计系统的信息熵,其中状态空间为:
将上面的微分方程组数据模型中的微分项进行展开,并依据上述状态空间进行变换后,获得的磷酸化系统的非线性离散时间系统模型为:
为了检测磷酸化系统中的磷酸化活性,需要计算该磷酸化系统的信息熵,而信息熵的计算以磷酸化系统系统模型中各蛋白的扰动变化为依据,因此需要计算各蛋白的扰动变化,对上述非线性离散时间系统模型加上随机波动后,获得带随机波动项的磷酸化系统的非线性离散时间系统模型为:
利用实验室测量的各蛋白浓度状态集合对磷酸化系统的非线性离散时间系统模型进行拟合,然后通过计算实验室测量值与利用该模型计算的理论值即可获得该随机波动的数据集合。
首先采用Newton-raphson算法利用非线性拟合的方法来求解参数的值,即求解参数/>使得/>统计量取得极小值,其中目标函数为/>
以此求解参数,具体过程为:
(1)给定初始参数计算目标函数值
目标函数展开为:
写为一维序列为:
(2)计算雅可比矩阵
写为6×4矩阵形式:
(3)估计参数的变化
(4)收敛判断
如果则结束迭代,当前参数/>即为最终所求;如果/>则进入步骤(5)继续下一迭代过程;
(5)计算新的参数值
(6)以作为/>返回第(1)步继续迭代。
经过上述计算步骤,最后能够迭代完成获得参数值为,其中参数误差估计过程为:通过迭代过程找到一组最优参数解,用/>表示/>,参数/>的协方差矩阵为/>,其反映了参数的拟合误差,其主轴元素的根值/>给出了参数的统计标准差,其中阈值/>由计算精度确定,为了得到较高的计算精度,可以根据需要设置阈值大小。
3.采样并计算系统的随机性
(1)对随机过程进行采样获得/>
当不考虑随机项时,已知系统的状态空间方程组为:
而直接利用实验测得的实际数值减去通过状态空间方程组计算相应采样所得的数值/>,就能够获得样本容量为/>的/>的实际随机样本轨道:
(2)计算离散系统的样本观察值获得样本观察值矩阵
(3)计算每个对应的/>
(4)计算各蛋白的信息熵
4.计算系统的总信息熵,并估计磷酸化系统磷酸化活性
整个系统的信息熵为S:
信息熵的大小说明了信号传导通路中的磷酸化活性,信息熵越大,说明磷酸化活性越高,信号传导越活跃;信息熵越小,说明磷酸化活性越低,信号传导越迟钝,因此以信息熵的大小作为指标来表示信号通路中的磷酸化活性。
根据上述预测方法,发明人通过实验室测量以及数学计算方式获得如下表1中三种案例下的系统特征,其中表1为经拟合后三种案例下迭代获得的参数的值,即获得了拟合后的数学模型,三种案例下对应的轨道图分别如图3、图4和图5所示,轨道图中横坐标为时间,单位为秒,纵坐标为蛋白质分子的浓度,单位为nmol/L,而根据上述预测方法对三种案例下磷酸化系统的信息熵的计算值以及磷酸化活性结果如表2所示。
表1 三种案例下迭代获得的反应速率常数的值
表2 三种案例下磷酸化系统的信息熵计算值及磷酸化活性
现有技术中常用的磷酸化活性判断方法是通过实验仪器进行观察,将标记过的供体与标记过的受体相互靠近,用光源(激光或闪光灯)激发供体,会触发向受体方向的荧光共振能量转移,进而在特定波长发出荧光,通过荧光信号的强弱来观察磷酸化活性,其中特异性信号与磷酸化水平成正比。该方法采用间接的传感装置进行信号转换,结果为静态值,只能反映磷酸化系统中特定某种蛋白质的磷酸化水平,无法反映在现在及将来的动态活性,而本方案通过实验室测量以及数学计算相结合的方式,能够反应磷酸化系统在时间维度上的磷酸化活性变化情况。
现有技术中利用实验测量与数学计算的方法目前有两种:第一种是在得到系统的状态空间模型后,先进行全局线性化,得到系统的线性化模型,然后计算磷酸化系统的信息熵,判断系统的磷酸化活性;第二种是采用inferA算法计算磷酸化活性,inferA算法判断磷酸化活性的步骤是,首先采集到磷酸化系统各蛋白质的分子数,然后计算各蛋白质的概率分布,之后在概率分布的基础上,采用吉布斯采样法,推断出随机样本,最后计算系统的信息熵,判断系统的磷酸化活性。
在本申请中使用qPTM数据库中的数据yeast,HOG1,log2ratio,将本申请提供的上述预测方法与现有技术中上述两种预测方法的预测效果进行对比,结果如表3所示。
表3 本方案与现有技术方法预测效果的对比结果
根据表3结果所示,可知本申请提供的磷酸化活性的预测方法,预测的误差要小于全局线性化方法及inferA算法,预测效果更好,准确度更高。
本申请提供的预测方法,首先对磷酸化系统进行简化,减少中间过程的蛋白,减少实验测量引入的误差,获得了磷酸化系统的微分方程组数学模型,然后通过Newton-raphson拟合方法得到系统的状态空间非线性方程组模型,拟合过程中可以通过threshold的设置得到更高的精度,由于Newton-raphson拟合方法的特点可以得到比较快的收敛速度,随后用实验测得的实际数据减去各采样点处通过方程组计算出的数据,得到随机项的样本轨道,最后通过计算各样本轨道的信息熵,判断磷酸化系统的磷酸化活性。
本申请提供的方法相较于仅通过实验观测的方式,具有结果简单明确且能够定量表示的优点,能够在时间维度上预测磷酸化系统的磷酸化活性,而非仅仅观测某一静止状态的磷酸化活性,相较于对非线性系统采用全局线性化方法再求信息熵的方式,本方法由于不采用非线性系统的线性化步骤,从而不会引入线性误差,使得预测的结果更加准确,能够快速收敛获得迭代结果;相较于inferA算法通过概率分布进行随机采样,本方法用实际数据减去拟合方程数据直接进行随机采样,得到随机项的轨道,数据最接近于实际测量结果,因此误差更小准确度也更高。因此本申请提供的上述磷酸化系统的磷酸化活性预测方法具有非常广阔的应用前景,无论是对理论研究还是磷酸化相关的疾病研究、药物开发等具有重要的实际意义。
以上所述,仅为本申请的实施例而已,本申请的保护范围并不受这些具体实施例的限制,而是由本申请的权利要求书来确定。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的技术思想和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (4)

1.一种生物信号通路中磷酸化系统的磷酸化活性预测方法,其特征在于,包括以下步骤:
S1.基于生物信号通路模型,即该生物信号通路模型中所涉及的各蛋白以及磷酸基团在各蛋白间转移的各化学通路,并以各蛋白的瞬时浓度和各化学通路的反应速率常数建立该生物信号通路模型的常微分方程组数学模型;
S2.在实验室条件下施加能够引起该生物信号通路模型变化的刺激,并测量该生物信号通路模型中各蛋白在施加刺激过程中不同时刻的浓度数据,利用上述获得的浓度数据采用Newton-raphson算法对所述常微分方程组数学模型进行多变量非线性方程拟合,求解所述常微分方程组数学模型中各化学通路的反应速率常数;
S3.对随机过程进行采样,实验测量的浓度数据减去利用数学模型计算的理论浓度数据,获得随机过程的样本矩阵数据,并利用该样本矩阵数据计算各蛋白浓度变化的信息熵;
S4.计算整个系统的信息熵,整个系统的信息熵为各蛋白浓度变化的信息熵之和,以整个系统的信息熵大小表征该信号通路中的磷酸化活性。
2.根据权利要求1所述的生物信号通路中磷酸化系统的磷酸化活性预测方法,其特征在于,所述步骤S2中Newton-raphson算法中目标函数为式(I)所示,其中表示第/>个蛋白,表示实验测量浓度,/>表示以迭代变化量/>计算的理论浓度,/>表示统计标准差,/>表示迭代过程中各化学通路的反应速率常数的矩阵,
式(I)。
3.根据权利要求1所述的生物信号通路中磷酸化系统的磷酸化活性预测方法,其特征在于,所述步骤S3中样本矩阵为,如式(II)所示,各蛋白的信息熵为/>,计算公式如式(III)所示,整个系统的信息熵/>的计算公式如式(IV)所示;
式(II);
式(III);
式(IV);
其中表示该生物信号通路模型中所涉及的蛋白总数,/>表示第/>个蛋白,/>表示施加刺激的时长,/>表示第/>时刻,/>的计算方式为第/>个蛋白第/>时刻的实验测量浓度减去代入数学模型计算的理论浓度,其中/>表示第/>个蛋白的信息熵,/>表示第/>个蛋白第/>时刻的实验测量浓度。
4.一种生物信号通路中磷酸化系统的磷酸化活性预测系统,其特征在于,包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器处理该指令时实现如权利要求1~3任一项所述预测方法步骤。
CN202310601374.8A 2023-05-26 2023-05-26 生物信号通路中磷酸化系统的磷酸化活性预测方法及系统 Active CN116343912B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310601374.8A CN116343912B (zh) 2023-05-26 2023-05-26 生物信号通路中磷酸化系统的磷酸化活性预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310601374.8A CN116343912B (zh) 2023-05-26 2023-05-26 生物信号通路中磷酸化系统的磷酸化活性预测方法及系统

Publications (2)

Publication Number Publication Date
CN116343912A CN116343912A (zh) 2023-06-27
CN116343912B true CN116343912B (zh) 2023-07-28

Family

ID=86877446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310601374.8A Active CN116343912B (zh) 2023-05-26 2023-05-26 生物信号通路中磷酸化系统的磷酸化活性预测方法及系统

Country Status (1)

Country Link
CN (1) CN116343912B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002088383A2 (en) * 2001-04-27 2002-11-07 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Method and system for identifying targets by nucleocytoplasmic cycling and use thereof
CN109935281A (zh) * 2018-12-28 2019-06-25 温州医科大学 一种解析大黄酸对肾间质纤维化疗效的定量网络药理学模型构建方法
CN115938502A (zh) * 2022-12-08 2023-04-07 广东辛孚科技有限公司 一种基于分子级反应机理的化工产物特性预测方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070009977A1 (en) * 2005-01-12 2007-01-11 Boyce James P Kinase-directed, activity-based probes
US20190259470A1 (en) * 2018-02-19 2019-08-22 Protabit LLC Artificial intelligence platform for protein engineering

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002088383A2 (en) * 2001-04-27 2002-11-07 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Method and system for identifying targets by nucleocytoplasmic cycling and use thereof
CN109935281A (zh) * 2018-12-28 2019-06-25 温州医科大学 一种解析大黄酸对肾间质纤维化疗效的定量网络药理学模型构建方法
CN115938502A (zh) * 2022-12-08 2023-04-07 广东辛孚科技有限公司 一种基于分子级反应机理的化工产物特性预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
人类病毒蛋白质磷酸化修饰位点的识别研究;黄淑云;向芸;曾鸿雁;;萍乡学院学报(第06期);全文 *
前列腺癌分子机制的动力学研究进展;赵静怡;闵明;张大庆;孙茂民;;现代医学(第07期);全文 *

Also Published As

Publication number Publication date
CN116343912A (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
McLean et al. Mathematical modelling of chemical processes—obtaining the best model predictions and parameter estimates using identifiability and estimability procedures
Savinell et al. Optimal selection of metabolic fluxes for in vivo measurement. I. Development of mathematical methods
Höhna et al. A Bayesian approach for estimating branch-specific speciation and extinction rates
Cournede et al. Some parameter estimation issues in functional-structural plant modelling
Pantazis et al. Parametric sensitivity analysis for biochemical reaction networks based on pathwise information theory
CN110285781B (zh) 一种相对于基准面的平面平行度快速评定方法
López C et al. A computational framework for identifiability and ill-conditioning analysis of lithium-ion battery models
Golabgir et al. Observability analysis of biochemical process models as a valuable tool for the development of mechanistic soft sensors
Costa et al. An extended dynamic model of Lactococcus lactis metabolism for mannitol and 2, 3-butanediol production
CN111190211A (zh) 一种gps失效位置预测定位方法
Tellinghuisen Optimizing experimental parameters in isothermal titration calorimetry: variable volume procedures
CN110161181A (zh) 混合气体的组分浓度识别方法及系统
CN116343912B (zh) 生物信号通路中磷酸化系统的磷酸化活性预测方法及系统
Ostrowska et al. Comparison of accuracy of virtual articulated arm coordinate measuring machine based on different metrological models
Roston et al. Analysis of phosphoryl-transfer enzymes with QM/MM free energy simulations
Kerr et al. OrgAlkCalc: Estimation of organic alkalinity quantities and acid-base properties with proof of concept in Dublin Bay
CN110632247A (zh) 一种多维滴定分析的数据处理方法及其应用
CN116338094A (zh) 一种用于碳排放气体检测的气体浓度校准方法及装置
Montesino-San Martín et al. Can crop-climate models be accurate and precise? A case study for wheat production in Denmark
Boudjemaa et al. Parameter estimation methods in data fusion.
CN101051052B (zh) 高精度液态乙醇浓度在线检测方法与装置
Geng et al. A bootstrapping-based statistical procedure for multivariate calibration of sensor arrays
Hurlebaus et al. MMT-A pathway modeling tool for data from rapid sampling experiments
Intosalmi et al. Data-driven multiscale modeling reveals the role of metabolic coupling for the spatio-temporal growth dynamics of yeast colonies
Anderson et al. Gibbs–Duhem-based relationships among derivatives expressing the concentration dependences of selected chemical potentials for a multicomponent system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant