CN102663924A - 一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法 - Google Patents

一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法 Download PDF

Info

Publication number
CN102663924A
CN102663924A CN2012100977332A CN201210097733A CN102663924A CN 102663924 A CN102663924 A CN 102663924A CN 2012100977332 A CN2012100977332 A CN 2012100977332A CN 201210097733 A CN201210097733 A CN 201210097733A CN 102663924 A CN102663924 A CN 102663924A
Authority
CN
China
Prior art keywords
network model
gene
pichia stipitis
genome
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100977332A
Other languages
English (en)
Inventor
刘立明
刘婷
徐楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN2012100977332A priority Critical patent/CN102663924A/zh
Publication of CN102663924A publication Critical patent/CN102663924A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明以树干毕赤酵母为例具体阐述了一种整合的基因组规模代谢网络模型构建及分析方法,属于系统生物学领域。基于此方法对构建所得的树干毕赤酵母基因组规模代谢网络模型进行系统层次的细胞生长模拟和最小基因、反应集合的鉴别,为全面理解树干毕赤酵母的代谢特征和机理提供了重要的平台。

Description

一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法
技术领域
本发明涉及一种以整合基因组注释技术为核心的树干毕赤酵母基因组规模代谢网络模型构建方法及对构建所得模型的分析方法,属于系统生物学领域。
背景技术
人类基因组计划的完成标志着后基因组时代的到来,后基因组时代各种高通量的组学技术的发展使的生物学的研究从传统的分子生物学进入到系统生物学时代,而基因组规模代谢网络模型(Genome Scale Metabolic Model)无疑是研究热点之一。继流感嗜血杆菌基因组规模代谢网络模型构建完成,迄今已有80多个不同物种的基因组规模代谢网络模型被公布。基因组规模代谢网络模型就是将细胞内所有的生化反应看作一个整体,在系统水平上研究所有参与代谢过程的基因、酶和反应物之间的相互作用。根据拟稳态的假设,代谢网络处于一种瞬时平衡稳态,运用模拟算法可得到完整的细胞代谢流分布图,揭示细胞代谢变化规律,为代谢工程改造和生理生化代谢特点解析提供依据。
作为一种非传统型酵母,树干毕赤酵母(Scheffersomyces stipitis CBS6054)因其宽广的碳源代谢能力而成为纤维素乙醇的潜在生产菌。由于自然环境的进化选择,树干毕赤酵母不仅可以利用葡萄糖、甘露糖、半乳糖等六碳糖,还可以发酵木糖、阿拉伯糖等酿酒酵母不能利用的五碳糖,甚至可以代谢纤维二糖、木聚糖等。在其已公布的全基因组测序结果中也证实了大量糖代谢相关基因的存在。此外,树干毕赤酵母利用木糖发酵产乙醇的得率最高已达0.47g/g木糖,并且利用树干毕赤酵母发酵还具有营养要求简单、抗污染能力强等优点。然而,工业化应用也存在许多不可避免的问题,如底物吸收较低,发酵乙醇需要严格控制溶氧水平等。因此,我们需要在系统层面上研究树干毕赤酵母的代谢机理,为树干毕赤酵母更为广泛的应用提供一个有效的平台。
常规的基因组规模代谢网络模型构建以公布的基因组测序结果为信息源提取具有代谢功能的基因,再整合生化数据库信息,进而组合成能代表此微生物细胞内发生的所有已知生化反应的反应列表。本发明提出的是一种半自动化的整合微生物基因组规模代谢网络模型构建方法。运用此方法进行代谢网络模型构建的优点是更加省时、方便,且所得模型更为全面、准确。
发明内容
本发明的目的是提供一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法。
本发明的技术方案:
1.基因组规模代谢网络模型构建与分析包括全基因组注释与粗略模型的构建、模型的精炼、数学模型的建立、模型的验证与分析四个步骤。
1)全基因组注释与粗略模型的构建:首先从Uniprot、NCBI Entre Gene或者EBI等公共数据库平台上下载最新的FASTA格式基因组序列,后采用多种全自动化的基因组注释方法,包括在线数据库KAAS(KEGG Automatic Annotation Server)、IdentiCS、和位点特异比对(PSI-BLAST)对特定的全基因组序列进行整合注释得到关于目的微生物全面的代谢基因信息,构建出以基因-蛋白质-反应关联为核心的粗略代谢网络模型。
2)模型的精炼:模型精炼的主要目标是通过整合生化数据库和文献组学的数据来建立物种特异的详细反应列表,具体工作包括验证补充基因-蛋白质-反应关联信息,添加必要的运输交换反应,文献信息的挖掘与补充,生物量方程及能量维持反应的建立等。
3)数学模型的建立:将上述反应列表转换成数学模型,其核心内容是计量系数矩阵,通常用S表示。在安装COBRA工具箱之后,通过加载Matlab程序可将精细代谢模型转换成系统生物学语言格式的文件(SBML)后可在计算机上模拟。为使模拟结果更加接近微生物真实的代谢通常要添加一定的约束条件如代谢通量平衡(S·v=0)、热力学平衡(ΔE=0)等。
4)模型的验证与分析:基于约束条件的模拟优化方法是基因组规模代谢网络模型常用的模拟算法,而通量平衡分析(FBA:Flux Balance Analysis)是Matlab平台上最常用的算法,通过函数调用和COBRA工具箱的使用,模拟微生物在特定条件下的代谢状况。
2.树干毕赤酵母的基因组规模代谢网络模型。
基于上述原理,构建获得树干毕赤酵母基因组规模代谢网络模型iTL779,注释出的具有代谢功能的779个基因占树干毕赤酵母总基因的13.2%。运用通量平衡分析方法证实模型的准确性后,运用COBRA单基因、单反应敲除程序鉴定出树干毕赤酵母细胞生长所需的最小基因、反应集合分别为110个基因和158个反应。
附图说明
图1树干毕赤酵母的基因组规模代谢网络模型构建示意流程图
具体实施方式
以下是树干毕赤酵母的基因组规模代谢网络模型构建、分析的实施例。
实施例1
树干毕赤酵母基因组规模代谢网络模型构建过程:
1)从NCBI Entre Gene数据库中下载最新的Scheffersomyces stipitis CBS6054基因组序列,采用以下三种方法对其进行基因组注释。①在KAAS中上传S.stipitis FASTA格式的基因组序列,选择与之亲缘关系较近的多种菌种的数据库进行双向BLAST。②IdentiCS是一种快速的独立基因组注释软件,采用简化的两步注释法,用公共数据库如Uniprot的基因注释信息来比对所要注释的基因序列而鉴别出更多可能的基因编码序列。③PSI-BLAST是一种利用迭代的BLAST搜索,在线提交目的微生物序列后返回与选定的在线数据库的比对结果特点是可增加发现远亲进化关系的相似序列数目。整合三种自动化基因组注释结果,得到树干毕赤酵母的初始代谢反应列表。关于基因编码的蛋白质的定位我们采用在线注释的方法在PA-SUB和CELLO上得到细胞器定位结果,据此将模型划分为细胞质、线粒体、过氧化物酶体和胞外四个区室。
2)从KEGG,MetaCyc and PubMed等专业数据库中以树干毕赤酵母为关键词检索树干毕赤酵母代谢相关信息,补充添加到粗模型中,同时从文献和测序结果中提取生物量组成等模拟所需组分,由此得到精确的树干毕赤酵母代谢网络模型。
3)将上述精细模型加载到Matlab,设置合适的约束条件对模型进行通量平衡分析。
表1建模过程使用的数据库
Figure BSA00000695959800031
实施例2
树干毕赤酵母基因组规模代谢网络模型特点:
运用上述模型构建方法,我们得到一个树干毕赤酵母基因组规模代谢网络模型,包括1222个反应、889个代谢物和779个基因,分布在4个亚细胞系统,命名为iTL779。为证实所建模型,从中统计出iTL779与已发表的酿酒酵母模型iMM904的典型参数,比较发现所构建树干毕赤酵母iTL779注释出的具有代谢功能的基因占树干毕赤酵母全部基因的13.2%,这一数据合理的反映了真核细胞基因注释率一般在10%-15%之间,此外模型的其他各项参数也均在正常范围之内。
表2模型特点比较
Figure BSA00000695959800041
实施例3
树干毕赤酵母基因组规模代谢网络模型验证与分析:
基于Matlab运用通量平衡分析方法,设置一定的底物吸收和其他非限制性模拟条件(如氮源、硫源、溶氧等)以细胞生长为目标方程考察不同碳源(纤维素水解液中含量最多的五种单糖:D-葡萄糖,D-甘露糖,D-半乳糖,D-木糖和L-阿拉伯糖)下细胞生长结果,发现模拟所得的最大比生长速率和实验实际测得的结果很接近,从而证实了所构建树干毕赤酵母iTL779的准确性。
基于COBRA的单基因、单反应敲除程序鉴定出在以葡萄糖为碳源的最小培养基上,维持树干毕赤酵母细胞生长所需的最小基因、反应集合分别为110个核心基因和158个核心生化反应。
表3糖代谢模拟
Figure BSA00000695959800042
表4部分核心基因和反应
Figure BSA00000695959800051

Claims (6)

1.一种以整合基因组注释技术为核心的树干基因组规模代谢网络模型的构建方法,其特征在于:根据公布的目的微生物的测序结果,采用多种基因组注释技术进行全基因注释,同时补充生化数据库和文献组学数据,构建具有基因-蛋白质-反应关联的基因组规模代谢网络模型,后使用基于Matlab平台的COBRA工具箱对所构建的模型进行模拟验证与分析。
2.根据权利要求1所述,其涉及的目的微生物为Scheffersomyces stipitis CBS6054,其构建的最终模型为iTL779。
3.根据权利要求1所述,整合基因组注释技术包括KAAS、IdentiCS和位点特异比对(PSI-BLAST)相结合的基因组序列比对方法。
4.根据权利要求1所述,补充信息来源于KEGG和MetaCyc生化数据库及PubMed文献组学数据。
5.根据权利要求1所述,模型证实运用通量平衡分析方法考察五种碳源对生长的影响,并与文献实验数据进行比较。
6.根据权利要求1所述,模型分析鉴定出维持树干毕赤酵母细胞生长所需的最小基因、反应集合分别为110个基因和158个生化反应。
CN2012100977332A 2012-04-06 2012-04-06 一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法 Pending CN102663924A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100977332A CN102663924A (zh) 2012-04-06 2012-04-06 一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100977332A CN102663924A (zh) 2012-04-06 2012-04-06 一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法

Publications (1)

Publication Number Publication Date
CN102663924A true CN102663924A (zh) 2012-09-12

Family

ID=46773396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100977332A Pending CN102663924A (zh) 2012-04-06 2012-04-06 一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法

Country Status (1)

Country Link
CN (1) CN102663924A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104745661A (zh) * 2015-04-10 2015-07-01 江南大学 一种游动放线菌基因组规模代谢网络模型构建及分析方法
CN103279689B (zh) * 2013-05-20 2016-08-17 天津大学 基于fk506生产菌筑波链霉菌基因组尺度代谢网络模型指导下次级途径改造方法
CN107301329A (zh) * 2016-04-15 2017-10-27 泽塔生物科技(上海)有限公司 一种微生物识别方法及系统
CN107862176A (zh) * 2017-10-13 2018-03-30 浙江大学 一种基于多组学数据整合的植物全基因组多层次生物网络重建方法
CN110544507A (zh) * 2019-07-29 2019-12-06 天津科技大学 基于组学整合技术调控固态发酵的方法及系统和应用
CN111684531A (zh) * 2018-01-22 2020-09-18 X开发有限责任公司 分析和优化代谢的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030224363A1 (en) * 2002-03-19 2003-12-04 Park Sung M. Compositions and methods for modeling bacillus subtilis metabolism
US20030228567A1 (en) * 2001-10-26 2003-12-11 Imandokht Famili Compostions and methods for modeling Saccharomyces cerevisiae metabolism
US20090259451A1 (en) * 2008-04-11 2009-10-15 University Of Delaware Reverse engineering genome-scale metabolic network reconstructions for organisms with incomplete genome annotation and developing constraints using proton flux states and numerically-determined sub-systems
CN101894211A (zh) * 2010-06-30 2010-11-24 深圳华大基因科技有限公司 一种基因注释方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030228567A1 (en) * 2001-10-26 2003-12-11 Imandokht Famili Compostions and methods for modeling Saccharomyces cerevisiae metabolism
US20030224363A1 (en) * 2002-03-19 2003-12-04 Park Sung M. Compositions and methods for modeling bacillus subtilis metabolism
US20090259451A1 (en) * 2008-04-11 2009-10-15 University Of Delaware Reverse engineering genome-scale metabolic network reconstructions for organisms with incomplete genome annotation and developing constraints using proton flux states and numerically-determined sub-systems
CN101894211A (zh) * 2010-06-30 2010-11-24 深圳华大基因科技有限公司 一种基因注释方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘立明等: "基因组规模代谢网络模型构建及其应用", 《生物工程学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279689B (zh) * 2013-05-20 2016-08-17 天津大学 基于fk506生产菌筑波链霉菌基因组尺度代谢网络模型指导下次级途径改造方法
CN104745661A (zh) * 2015-04-10 2015-07-01 江南大学 一种游动放线菌基因组规模代谢网络模型构建及分析方法
CN107301329A (zh) * 2016-04-15 2017-10-27 泽塔生物科技(上海)有限公司 一种微生物识别方法及系统
CN107862176A (zh) * 2017-10-13 2018-03-30 浙江大学 一种基于多组学数据整合的植物全基因组多层次生物网络重建方法
CN111684531A (zh) * 2018-01-22 2020-09-18 X开发有限责任公司 分析和优化代谢的方法
CN111684531B (zh) * 2018-01-22 2023-09-29 X开发有限责任公司 分析和优化代谢网络的方法
CN110544507A (zh) * 2019-07-29 2019-12-06 天津科技大学 基于组学整合技术调控固态发酵的方法及系统和应用
CN110544507B (zh) * 2019-07-29 2023-07-18 天津科技大学 基于组学整合技术调控固态发酵的方法及系统和应用

Similar Documents

Publication Publication Date Title
Widiastuti et al. Genome‐scale modeling and in silico analysis of ethanologenic bacteria Zymomonas mobilis
Österlund et al. Fifteen years of large scale metabolic modeling of yeast: developments and impacts
CN102663924A (zh) 一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法
King et al. The automation of science
Kim et al. Flux balance analysis of primary metabolism in the diatom Phaeodactylum tricornutum
Duarte et al. Reconstruction and validation of Saccharomyces cerevisiae iND750, a fully compartmentalized genome-scale metabolic model
Schilling et al. Toward metabolic phenomics: analysis of genomic data using flux balances
Man et al. Differential translation efficiency of orthologous genes is involved in phenotypic divergence of yeast species
Edwards et al. How will bioinformatics influence metabolic engineering?
CA2439260C (en) Models and methods for determining systemic properties of regulated reaction networks
JP2014211907A (ja) ヒト代謝モデルおよび方法
Epstein et al. A standardized workflow for submitting data to the Minimum Information about a Biosynthetic Gene cluster (MIBiG) repository: prospects for research-based educational experiences
Ye et al. Comprehensive understanding of Saccharomyces cerevisiae phenotypes with whole‐cell model WM_S288C
Sohn et al. Genome-scale metabolic model of the fission yeast Schizosaccharomyces pombe and the reconciliation of in silico/in vivo mutant growth
Greene et al. Kinetic ensemble model of gas fermenting Clostridium autoethanogenum for improved ethanol production
CA2462099A1 (en) Compositions and methods for modeling saccharomyces cerevisiae metabolism
Norman et al. Genome‐scale model of C. autoethanogenum reveals optimal bioprocess conditions for high‐value chemical production from carbon monoxide
Greene et al. Acceleration strategies to enhance metabolic ensemble modeling performance
Slininger et al. Evaluation of a kinetic model for computer simulation of growth and fermentation by Scheffersomyces (Pichia) stipitis fed D‐xylose
Wilken et al. In silico identification of microbial partners to form consortia with anaerobic fungi
Xu et al. Genome-scale biological models for industrial microbial systems
Castillo et al. Yeast genome-scale metabolic models for simulating genotype–phenotype relations
Hendry et al. Metabolic flux analysis reaching genome wide coverage: lessons learned and future perspectives
Faraji et al. Improving bioenergy crops through dynamic metabolic modeling
CN110767261A (zh) 一种自动化构建高精度基因组尺度代谢网络模型的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120912