CN105184049B - 基于调控‑代谢网络整合模型预测微生物生长表型的方法 - Google Patents

基于调控‑代谢网络整合模型预测微生物生长表型的方法 Download PDF

Info

Publication number
CN105184049B
CN105184049B CN201510484159.XA CN201510484159A CN105184049B CN 105184049 B CN105184049 B CN 105184049B CN 201510484159 A CN201510484159 A CN 201510484159A CN 105184049 B CN105184049 B CN 105184049B
Authority
CN
China
Prior art keywords
transcription factor
gene
network
fdr
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510484159.XA
Other languages
English (en)
Other versions
CN105184049A (zh
Inventor
王卓
沈方舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201510484159.XA priority Critical patent/CN105184049B/zh
Publication of CN105184049A publication Critical patent/CN105184049A/zh
Application granted granted Critical
Publication of CN105184049B publication Critical patent/CN105184049B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于调控‑代谢网络整合模型预测微生物生长表型的方法。该方法首先构建基因调控网络,基于大量基因表达谱数据,运行多次线性回归推断每个目标基因随转录因子表达变化的线性方程,计算错误发现率FDR;然后取FDR<=0.05的调控关系作为全局的调控网络,找出调控网络中调控代谢基因的转录因子,根据转录因子的类型,计算转录因子敲除时生长速率对应的反应流值F,并由原始代谢网络进行同样的流平衡分析得到最大细胞生长速率Fmax,通过计算F/Fmax预测微生物在转录因子敲除时的生长表型的变化。本发明方法使得分析的精确度提高,得以更好地预测微生物的生长表型。

Description

基于调控-代谢网络整合模型预测微生物生长表型的方法
技术领域
本发明属于微生物技术领域,具体的说,涉及一种基因调控网络与代谢网络联合建模的方法,其可用于预测微生物的生长表型。
背景技术
目前,代谢网络建模是预测基因敲除对代谢表型影响的主要方法。代谢网络包含所有酶、代谢物和生化反应之间的相互作用,全基因组范围代谢网络重构与分析能够发现基因敲除、插入、异常表达、环境变化等对生物系统表型的影响。
动力学模拟是分析代谢网络最直接有效的手段,但由于很多动力学参数未知使得大规模网络的动力学分析受到限制。而基于约束的代谢流分析、基元模式和极端途经分析、最优化方法等得到更加广泛的应用,其中流平衡分析最为常用。流平衡分析(Flux BalanceAnalysis)是一种基于约束的代谢网络分析方法,通过加入化学计量信息、热力学信息、代谢能力约束等,将系统行为约束在一个封闭的解空间内,然后设置目标函数通过线性规划得到最优解。通常目标函数设为细胞生物质合成最大、生长速率最快或某个目标代谢物产量最高。
以大肠杆菌和酵母为代表的微生物代谢模型研究中,流平衡分析能够比较准确地模拟基因敲除对细胞生长的影响。流平衡分析可以不依赖于反应动力学参数等信息,快速识别对生长或目标代谢物合成具有重要影响的必需基因,如果某个基因敲除造成生长速率为零,则属于致死基因,不能改动;如果某个基因敲除或过表达能够提高目标代谢物产量,则成为候选的改造基因。通过这种计算模拟的手段能够寻找可行的改造途径,对于代谢工程高产菌株设计具有重要的指导意义。
如果能够将基因调控网络整合进来,采用合理方式设定约束,将有助于提高代谢流的预测,发现生物在不同环境下的响应变化,使得现有的代谢模型能更加精确地模拟基因敲除对生长表型的影响。基因调控网络描述调控因子与目标基因之间的相互作用关系,近年来有很多研究分别对两种网络进行构建和分析,但是将二者整合起来揭示转录调控对代谢表型影响的研究较少。这是由于调控网络是基于统计推断的,而代谢网络是基于生化知识的,如何实现基因组范围的调控网络与代谢网络整合是极富挑战的问题。
发明内容
针对现有技术的不足,本发明的目的在于提供一种基于调控-代谢网络预测微生物在不同环境下生长表型的方法。该方法简单、高效,预测结果准确。
本发明提供一种基于调控-代谢网络整合模型预测微生物生长表型的方法,具体步骤如下:
(1)首先构建基因调控网络,基于大量基因表达谱数据,用线性回归推断每个目标基因随转录因子表达变化的线性方程,然后随机抽取部分表达谱数据进行若干次bootstrap线性回归,根据转录因子和目标基因的调控关系在这若干个线性方程中出现与否的概率,计算错误发现率FDR(False Discovery Rate),FDR表明该转录因子没有调控该基因的比例。
(2)然后取FDR<=0.05的调控关系作为全局的调控网络;
(3)接着找出调控网络中调控代谢基因的转录因子,根据转录因子的类型,设定敲除该转录因子时目标代谢基因表达的概率P(Gene=ON|Factor=OFF),如果是激活因子,则P=FDR,如果是抑制因子,则P=1-FDR;
(4)由代谢网络的流变分析FVA(Flux Variability Analysis)可得每个反应的最大流值Vmax,对每个转录因子进行模拟敲除时,对每个反应施加相应的约束为Vmax*P,接着进行目标函数为生长速率最大的流平衡分析,得出细胞生长速率对应的反应流值F。
(5)对于没有任何基因敲除的野生型代谢网络进行同样的流平衡分析得出最大细胞生长速率Fmax,然后计算突变体相对于野生型的生长速率之比F/Fmax,即代表生长表型的变化。
本发明中,随机抽取部分表达谱数据进行150-300次bootstrap线性回归。
本发明的有益效果在于,对比不施加其他约束的流平衡分析,结合了基因调控网络的信息,使得分析的精确度提高,得以更好地预测微生物的生长表型。
附图说明
图1是本发明方法预测生长表型的总体流程示意图。
图2是以葡萄糖-铵为细胞生长底物时的ROC曲线的结果图示。
图3是以半乳糖-铵为细胞生长底物时的ROC曲线的结果图示。
图4是以葡萄糖-尿素为细胞生长底物时的ROC曲线的结果图示。
具体实施方式
以下结合附图和实施例对本发明的技术方案作进一步描述。
本发明的实施例中,采用的算法流程图如图1所示。本实施例以酵母为例,首先基于已搜集的2929组酵母的基因表达谱数据,用线性回归推断每个目标基因随转录因子表达变化的线性方程,若某转录因子在方程中的系数为正,则代表有激活作用,若系数为负,则代表有抑制作用,若系数为零,则代表没有调控作用。然后随机抽取2929组表达谱数据中的子集进行200次bootstrap线性回归,根据转录因子和目标基因的调控关系在这200个线性方程中出现与否的概率,计算错误发现率FDR;然后取FDR<=0.05的可靠调控关系,形成包含2588对转录因子与目标基因的相互作用的酵母全局调控网络。
接下来输入酵母的代谢网络,以Yeast6模型为例,该模型包含1888个反应,1458个代谢物,900个编码酶的基因,用流平衡分析得出最大细胞生长速率Fmax。找出其中有调控关系的代谢基因,根据调控其的转录因子类型,设定转录因子敲除时,该代谢基因表达的概率P(Gene=ON|Factor=OFF),如果是激活因子,则P=FDR,如果是抑制因子,则P=1-FDR;再对完整的Yeast6代谢网络进行流变分析,可得每个反应的最大流值Vmax,则对每个转录因子进行模拟敲除时,将对每个反应施加新的约束为Vmax*P;接着进行目标函数为生长速率最大的流平衡分析,得出细胞生长速率的反应流值F;最后计算突变体相对于野生型的生长速率之比F/Fmax。
下面验证预测结果的有效性,实验数据来源于文献1,共有三种环境下的实验数据,分别以葡萄糖-铵,半乳糖-铵,葡萄糖-尿素为细胞生长的底物,对此我们也预测了这三种情况下敲除转录因子的生长表型。将我们预测的突变体相对于野生型的生长速率之比与实验中对应的比值进行比较,与实验对应上的有51个转录因子敲除的突变体,对每个环境计算预测值与实验值这两组数据的pearson相关性,结果如表1所示。
表1预测值与实验值这两组数据的pearson相关性结果
葡萄糖-铵 半乳糖-铵 葡萄糖-尿素
相关系数 0.4594311 0.3128724 0.3535231
p-value 0.0006953 0.02539 0.01093
结果显示p值均小于0.05,可以认为我们的预测值与实验值显著线性相关。另外,对实验值设定阈值,将数据二元化,表示是否影响生长;以此为标准,通过ROC曲线判断预测结果是否能正确反映转录因子敲除对突变体生长的影响。
图2、图3、图4分别显示了以葡萄糖-铵,半乳糖-铵,葡萄糖-尿素为细胞生长底物的三种环境下ROC曲线的结果,其中对实验值设定了三个阈值分别为0.2、0.5和0.8;总体来说,所有的ROC曲线都在对角线之上,曲线下面积值如各图所示,因此说明预测的结果可以有效判断转录因子敲除对生长的影响。综上,我们通过DIRAM方法可以有效地预测酵母在三种不同环境下的生长表型。
参考文献:
1、Fendt S M,Oliveira A P,Christen S,et al.Unraveling condition‐dependent networks of transcription factors that control metabolic pathwayactivity in yeast[J].Molecular systems biology,2010,6(1):432.

Claims (2)

1.一种基于调控-代谢网络整合模型预测微生物生长表型的方法,其特征在于将调控与代谢两个层次有机结合,预测转录调控对生长表型的影响,具体步骤如下:
(1)首先构建基因调控网络,基于大量基因表达谱数据,用线性回归推断每个目标基因随转录因子表达变化的线性方程,然后随机抽取部分表达谱数据进行若干次bootstrap线性回归,根据转录因子和目标基因的调控关系在这若干个线性方程中出现与否的概率,计算错误发现率FDR,FDR表明该转录因子没有调控该基因的比例;
(2)然后取FDR<=0.05的调控关系作为全局的调控网络;
(3)接着找出调控网络中调控代谢基因的转录因子,根据转录因子的类型,设定敲除该转录因子时目标代谢基因表达的概率P(Gene=ON|Factor=OFF),如果是激活因子,则P=FDR,如果是抑制因子,则P=1-FDR;
(4)由代谢网络的流变分析FVA可得每个反应的最大流值Vmax,对每个转录因子进行模拟敲除时,对每个反应施加相应的约束为Vmax*P,接着进行目标函数为生长速率最大的流平衡分析,得出细胞生长速率对应的反应流值F;
(5)对于没有任何基因敲除的野生型代谢网络进行同样的流平衡分析得出最大细胞生长速率Fmax,然后计算突变体相对于野生型的生长速率之比F/Fmax,即代表生长表型的变化。
2.根据权利要求1所述的方法,其特征在于,步骤(1)中,随机抽取部分表达谱数据进行150-300次bootstrap线性回归。
CN201510484159.XA 2015-08-10 2015-08-10 基于调控‑代谢网络整合模型预测微生物生长表型的方法 Expired - Fee Related CN105184049B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510484159.XA CN105184049B (zh) 2015-08-10 2015-08-10 基于调控‑代谢网络整合模型预测微生物生长表型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510484159.XA CN105184049B (zh) 2015-08-10 2015-08-10 基于调控‑代谢网络整合模型预测微生物生长表型的方法

Publications (2)

Publication Number Publication Date
CN105184049A CN105184049A (zh) 2015-12-23
CN105184049B true CN105184049B (zh) 2018-02-13

Family

ID=54906127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510484159.XA Expired - Fee Related CN105184049B (zh) 2015-08-10 2015-08-10 基于调控‑代谢网络整合模型预测微生物生长表型的方法

Country Status (1)

Country Link
CN (1) CN105184049B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862176A (zh) * 2017-10-13 2018-03-30 浙江大学 一种基于多组学数据整合的植物全基因组多层次生物网络重建方法
CN109256176A (zh) * 2018-10-28 2019-01-22 浙江师范大学 基于代谢产物测量的微生物生长过程评估模型
MX2021011623A (es) * 2019-03-29 2021-10-13 Amgen Inc Prediccion del rendimiento de cultivos celulares en biorreactores.
CN110517724B (zh) * 2019-07-15 2020-05-22 太原理工大学 利用单细胞转录和基因敲除数据推断基因调控网络的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013071159A1 (en) * 2011-11-10 2013-05-16 The Regents Of The University Of California Bacterial metastructure and methods of use

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013071159A1 (en) * 2011-11-10 2013-05-16 The Regents Of The University Of California Bacterial metastructure and methods of use

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Metabolic constraint-based refinement of transcriptional regulatory networks;Sriram Chandrasekaran等;《PLOS computational biology》;20131205;第9卷(第12期);1-14 *
Transcriptional regulation of metabolism and behavior:insights from reconstruction and modeling of complex biochemical networks;Sriram Chandrasekaran;《Graduate dissertations and theses at illinois》;20130822;全文 *
调控_代谢网络的集成建模与分析方法研究;赵月等;《计算机应用与软件》;20110731;第28卷(第7期);1-5 *

Also Published As

Publication number Publication date
CN105184049A (zh) 2015-12-23

Similar Documents

Publication Publication Date Title
CN105184049B (zh) 基于调控‑代谢网络整合模型预测微生物生长表型的方法
Österlund et al. Mapping condition-dependent regulation of metabolism in yeast through genome-scale modeling
Yang et al. EMILiO: a fast algorithm for genome-scale strain design
Gadkar et al. Estimating optimal profiles of genetic alterations using constraint‐based models
Park et al. Constraints-based genome-scale metabolic simulation for systems metabolic engineering
Machado et al. Co-evolution of strain design methods based on flux balance and elementary mode analysis
CN106873372B (zh) 基于防洪调度数据自适应控制的水库防洪调度优化方法
Lee et al. Application of metabolic flux analysis in metabolic engineering
Jabarivelisdeh et al. Optimization of bioprocess productivity based on metabolic‐genetic network models with bilevel dynamic programming
CN102841985B (zh) 一种基于结构域特征的关键蛋白质识别方法
KR20200084341A (ko) 소규모 조건에서의 성능을 기반으로 하는 대규모 조건에서의 성능을 위한 유기체 최적화
Yen et al. Designing metabolic engineering strategies with genome-scale metabolic flux modeling
Retamal et al. Parameter estimation of a dynamic model of Escherichia coli fed-batch cultures
Zhu et al. The generalized predictive control of bacteria concentration in marine lysozyme fermentation process
Oh et al. Multiobjective flux balancing using the NISE method for metabolic network analysis
Çakır et al. Effect of carbon source perturbations on transcriptional regulation of metabolic fluxes in Saccharomyces cerevisiae
Pozo et al. Gobal optimization of hybrid kinetic/FBA models via outer-approximation
de Oliveira et al. Nonlinear predictive control of a bioreactor by surrogate model approximation of flux balance analysis
Yuan et al. Pathway identification using parallel optimization for a nonlinear hybrid system in batch culture
Wang et al. Deformation prediction model of surrounding rock based on GA-LSSVM-markov
Hu et al. Discovering an integrated network in heterogeneous data for predicting lncRNA-miRNA interactions
Parambil et al. In silico analysis of bioethanol overproduction by genetically modified microorganisms in coculture fermentation
Xu et al. Identifying the shared metabolic objectives of glycerol bioconversion in Klebsiella pneumoniae under different culture conditions
Kim et al. In silico analysis of the effects of H2 and CO2 on the metabolism of a capnophilic bacterium Mannheimia succiniciproducens
Li et al. Optimization of bioethanol ethanol production in fed-batch fermentation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180213

Termination date: 20200810