CN107862176A - 一种基于多组学数据整合的植物全基因组多层次生物网络重建方法 - Google Patents

一种基于多组学数据整合的植物全基因组多层次生物网络重建方法 Download PDF

Info

Publication number
CN107862176A
CN107862176A CN201710952881.0A CN201710952881A CN107862176A CN 107862176 A CN107862176 A CN 107862176A CN 201710952881 A CN201710952881 A CN 201710952881A CN 107862176 A CN107862176 A CN 107862176A
Authority
CN
China
Prior art keywords
rice
network
level
gene
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710952881.0A
Other languages
English (en)
Inventor
陈铭
刘丽丽
梅茜
张子钧
俞振泞
孙天昊
薛继统
张霈婧
胡大辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201710952881.0A priority Critical patent/CN107862176A/zh
Publication of CN107862176A publication Critical patent/CN107862176A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于多组学数据整合的植物全基因组多层次生物网络重建方法,该方法通过整合水稻基因调控网络、蛋白质互作网络和代谢网络,完成了水稻多层次调控网络的构建,同时通过整合水稻不同组织生长过程中的表达谱数据,根据建好的水稻多层次调控网络,进行特定组织多层次基因调控网络的构建,从而构建出第一个目前数据水平上最为完整的高质量的水稻基因组尺度的多层次生物网络,为植物多层次生物网络的构建提供一种新的思路,构建的水稻多层次基因调控网络数据库实现了多层次调控网络的3D可视化。

Description

一种基于多组学数据整合的植物全基因组多层次生物网络重 建方法
技术领域
本发明属于生物网络构建技术领域,具体涉及一种基于多组学数据整合的植物全基因组多层次生物网络重建方法。
背景技术
分子生物学研究表明基因型到表型发生的过程涉及到细胞内多种组分间的多层次的时空调控以及代谢产物在不同细胞器或组织中的分布,这些调控过程基本上呈现一个逐步细化的级联层次方式:基因组到转录组、转录组到蛋白质组、蛋白质组到代谢组、代谢组到表型,而中间各个过程又相互关联、密不可分。生物体在不同的生物过程中都对应着多层次网络的动态调控,包括基因调控网络(GRNs)、蛋白质互作网络(PPIs)和代谢网络(GSMN)等。目前已有上千个公共生物学数据库汇集了海量的基因组学、蛋白质组学和代谢组学的数据,使得预测基因、蛋白质间的调控关系和重建代谢途径变得可能。然而,生物过程背后的分子网络是个极其复杂的系统,其相应的属性和规律目前仍然是个需要深入研究的领域。我们必须在获得生物网络结构的基础上研究其动态属性,然后才能系统地分析其功能并预测未知的功能基因、蛋白和反应。所以最重要的一步就是如何有效挖掘和整合现有的分子生物学数据,构建组学尺度的生物网络,包括基因调控网络、蛋白质互作网络、代谢网络以及通过网络间的整合构建多层次的调控网络。
随着测序技术的不断发展,物种全基因组测序工作的相继完成引领基因组尺度代谢网络的构建研究进入了一个崭新的时代。基因组尺度代谢网络的构建是从基因组序列出发,通过构建基因-蛋白质-反应的相互作用关系,结合计算机模型和实验数据,从系统的角度分析复杂的生物系统,定量研究生命体的代谢过程的一个必不可少的工具,它对于生命活动的理论研究和物种改良都具有重要的理论和实践意义。植物基因组尺度代谢网络模型,是在网络水平上研究植物代谢和指导植物代谢工程必不可少的工具。然而,由于植物自身的复杂性和基因组注释信息的不完整,植物代谢网络构建方面的研究仍面临着重大的挑战。目前,仅有拟南芥和玉米的基因组尺度的代谢网络模型被初步构建,其中de OliveiraDal'Molin等人通过构建拟南芥代谢网络模型(AraGEM,a Genome-Scale Reconstructionof the Primary Metabolic Network in Arabidopsis.Plant Physiology 152(2):579-589.2010),鉴定了呼吸循环所需的最少反应,强调了光合代谢和非光合代谢的显著差异;Poolman等人利用拟南芥代谢网络揭示了维持和生产拟南芥细胞中生物组分所需的最少ATP(三磷酸腺苷)量(A Genome-Scale Metabolic Model ofArabidopsis and Some ofIts Properties.Plant Physiol 151(3):1570-1581.2009)。
另外Grafahrend-Belau等人和Dal'Molin等人构建了特定生理条件和特定组织类型的植物代谢网络,前者构建了大麦种子的代谢网络,对不同生理条件下谷物产量和流分布进行了模拟预测;后者构建了C4GEM模型,主要针对C4植物,研究了C4光合作用过程中叶肉和维管束鞘细胞的代谢流的分布。目前,植物代谢网络的研究还只要停留在模型构建和特定条件或组织下代谢流的分析,如何利用植物代谢网络模型来指导植物代谢工程和品种改良,仍是一个需要研究人员攻克的重要难题。然而,水稻作为全世界最重要的粮食作物之一和禾本科植物的模式生物,其网络水平上的全基因组尺度代谢网络研究还处于空白阶段。
近年来,一些科研团队在水稻一维组学模型构建方面取得了快速的进展。首先,Lee I等人基于24种不同类型的实验数据,高质量的完成了水稻基因组尺度上的蛋白编码基因调控网络的构建(Genetic dissection of the biotic stress response using agenome-scale gene network for rice.Proc Natl Acad Sci USA 45:18548-18553.2011);其次,MengY等人完成了水稻基因组尺度MicroRNA介导的基因调控网络的预测与构建(Construction of microRNA-and microRNA*-mediatedregulatory networksinplants.RNABiology 8:6,1124-1148.2011),并通过了蛋白质降解组测序数据的验证;此外,Gu H等人构建完成第一个水稻蛋白质互作数据库PRIN(PRIN:apredicted riceinteractome network.BMC Bioinformatics 12:161.2011),通过数学预测的方法成功的扩展了现有的水稻蛋白质间的互作网络,完成了水稻组学尺度蛋白质间互作网络的构建。
水稻多层次基因调控网络的构建,即通过对水稻不同一维组学尺度网络模型的整合包括基因调控网络,蛋白质互作网络和代谢网络等,完成水稻多维组学尺度网络模型的构建涉及基因组学,蛋白质组学和代谢组学。目前,水稻基因组尺度代谢网络模型的构建仍处于空白阶段,但水稻组学尺度基因调控网络模型,小分子核糖核酸介导的基因调控网络模型和蛋白质间相互作用网络模型的构建已相继完成。虽然当前不同组学间网络模型的整合研究尚未深入,但其一维组学尺度网络模型构建的相继完成为水稻多维组学尺度网络模型的构建带来了新的机遇。
发明内容
鉴于上述,本发明提出了一种基于多组学数据整合的植物全基因组多层次生物网络重建方法,通过对现有生物学公共数据库信息的整合,以及运用生物信息学的方法对水稻基因组尺度的代谢网络进行初步构建,进而通过实验手段和文本挖掘的方法对网络进行精细的修正和评估,拟构建出了一个目前数据水平上最为完整的高质量的水稻基因组尺度的代谢网络。
一种基于多组学数据整合的植物全基因组多层次生物网络重建方法,包括如下步骤:
(1)收集整合植物多组学数据;
(2)基于所述植物多组学数据通过整合和修正构建水稻基因组尺度上的代谢网络模型;
(3)基于所述代谢网络模型通过整合构建水稻多层次基因调控网络;
(4)基于所述调控网络开发出水稻多层次基因调控网络数据库RiceNetDB以及该调控网络的3D可视化平台。
进一步地,所述步骤(1)的具体实现为:首先,从各生物公共数据库(Tigr、KEGG、RiceCyc、Uniprot、Brenda等)中挖掘水稻全基因组注释信息和水稻反应及代谢的相关信息,并将数据库间的信息进行整合,去除数据库中错误和冗余的信息;然后,从基因调控网络数据库(如RiceNET)中提取水稻基因调控信息,从蛋白互作数据库(如BIND、PlaPid、PRIN等)中提取水稻蛋白互作信息,用于水稻多层次网络的整合和构建;从NCBI(NationalCenter for Biotechnology Information,美国国立生物技术信息中心)数据库中挖掘水稻各组织在生长过程中的基因表达谱数据,用于水稻生长过程基因调控网络的构建。
进一步地,所述步骤(2)的具体实现为:首先,基于水稻全基因组注释信息鉴定水稻基因组尺度上与代谢相关的基因,并整合水稻反应及代谢的相关信息,建立关于基因-酶-反应的相互关系列表,完成水稻代谢网络模型的初步构建;然后,利用实验手段和文本挖掘对初建的水稻代谢网络模型中每条信息进行修正,包括化学反应方程式的配平、反应可逆性的判断、辅因子信息的添加、基因以及反应的亚细胞定位、细胞生物量组份含量的测定、转运和交换反应的鉴定和添加、代谢途径中缺失反应(Gap)的分析和填补、每条基因-酶-反应链接关系的可信性评估,从而完成水稻基因组尺度上代谢网络模型的构建工作。
进一步地,所述步骤(3)的具体实现为:首先,对水稻基因组尺度上的蛋白编码基因调控网络与MicroRNA介导的基因调控网络进行整合,完成水稻基因组尺度上的基因调控网络模型的构建;然后,整合蛋白质互作数据库中与水稻相关的蛋白质互作信息,完成水稻基因组尺度上的蛋白质互作网络模型的构建;最后,将构建好的基因调控网络模型和蛋白质互作网络模型整合到所述代谢网络模型中,完成水稻多层次基因调控网络的构建。
进一步地,所述步骤(4)的具体实现为:基于所述水稻多层次基因调控网络搭建一个水稻多层次基因调控网络数据库RiceNetDB,并基于包括javascrpit及Flash在内的建模工具开发搭建水稻多层次基因调控网络的3D可视化平台,供学术界共享使用,从而为水稻内分子调控机制的研究提供了一个整合的可视化资源。
本发明通过整合水稻基因调控网络、蛋白质互作网络和代谢网络,完成了水稻多层次调控网络的构建,同时通过整合水稻不同组织生长过程中的表达谱数据,根据建好的水稻多层次调控网络,进行特定组织多层次基因调控网络的构建,从而构建出第一个目前数据水平上最为完整的高质量的水稻基因组尺度的多层次生物网络,为植物多层次生物网络的构建提供一种新的思路,构建的水稻多层次基因调控网络数据库实现了多层次调控网络的3D可视化。
附图说明
图1为本发明RiceNetDB数据库的简要ER图。
图2为本发明RiceNetDB的多层次3D网络结构示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
本发明基于多组学数据整合的植物全基因组多层次生物网络重建方法,包括如下步骤:
(1)收集植物多组学数据。
首先,从生物公共数据库中(Tigr、KEGG、RiceCyc、Uniprot、Brenda等)挖掘水稻基因组注释信息和水稻代谢相关的信息,将数据库间的信息进行整合,去除数据库中错误和冗余的信息。然后,从基因调控网络数据库(如RiceNET)中,提取水稻基因调控信息,从蛋白互作数据库(如BIND、PlaPid、PRIN等)中,提取水稻蛋白互作信息,用于水稻多层次网络的整合和构建;从NCBI数据库中挖掘水稻各组织在生长过程中的基因表达谱数据,用于水稻生长过程基因调控网络的构建。
水稻基因组注释相关的数据来自于TIGR,该数据库收集了水稻12个染色体内基因的数据,还包含了日本晴的序列信息,通过该数据库为全部66310个基因提供相关的注释信息。
水稻基因与酶之间的互作信息数据来源于KEGG著名的代谢通路数据库、RiceCyc(采用的是3.3版本)、Uniport以及Brenda等数据库;不同来源的数据库存在冗余和差异,通过整合和去冗余等操作,共收集到了与水稻相关的4470个编码酶的基因以及14005对基因与反应的关系。
代谢分子的鉴别以及相关反应的数据源于PubChem Compounds和ChemiaclEntities ofBiological Interest这几个数据库,通过进一步整合归一化处理,共收集到了4470个代谢相关基因,2876个代谢物分子,3055个代谢相关反应。
水稻的基因网络和microRNA调节基因网络主要是由Probabilistic FunctionalGene Network ofOryza sativa数据库所提供的数据构建,通过挖掘整理得到了包括662936对基因调控关系互作以及基因与1763个microRNA靶点互作信息,这些数据将对深入的解析水稻基因调控网络提供支持。
蛋白质互作网络数据是由PRIN、BIND以及PlaPID等数据库提供,经过整合各个来源的数据共取得了90358对蛋白-蛋白互作。
挖掘与整合水稻基因组注释信息、基因-蛋白质-反应的相互关系信息、基因间的调控信息、蛋白质间的互作信息等数据,所有相关的各种公共数据信息来源如表1所示:
表1
(2)构建基因组尺度代谢网络。
首先,基于水稻全基因组注释信息,鉴定水稻基因组水平代谢相关的基因,整合现有代谢数据库中水稻相关的反应及代谢的信息(KEGG、RiceCyc、Uniprot、Brenda等),建立基因-酶-反应的相互关系列表,完成水稻代谢网络的初步构建;然后,利用实验手段和文本挖掘等方法,对水稻初步代谢网络中的每条信息进行修正。
根据各数据库中水稻代谢相关的信息,建立各数据库基因-酶-反应相互关系的列表,再将数据库间的信息进行整合,去除数据库中错误和冗余的信息,具体实现过程为:首先,创建数据库间相同化合物的列表;然后,对数据库间相同化合物所参与的反应进行比较,如果两个反应的反应物、生成物以及催化反应的酶都相同,则视为相同的反应,并写入数据库间相同反应列表;如果两个反应具有一个不同的反应物(生成物),对这两种物质进行进一步的人工鉴定包括对两种物质的名字、化学方程式、化学结构式进行鉴定;经鉴定若为相同物质,则将两物质加入数据库间相同化合物列表,将反应加入数据库间相同反应的列表;如果两个反应只有催化反应的酶不同,结合水稻基因组的注释信息对此反应的酶进行修正,并将此反应写入数据库间相同反应的列表;最后,根据新的数据库间相同化合物的列表,重复以上步骤直到没有新的相同化合物被鉴定出来为止。将得到的水稻基因-酶-反应间的相互关系,进行数据库可信度的打分,完成水稻基因组尺度代谢网络的初步构建,具体数据间的关系如图1所示。
利用实验手段和文本挖掘等方法,对水稻初步代谢网络中的每条信息进行修正,主要包括化学反应方程式的配平、反应可逆性的判断、辅因子(cofactor)信息的添加、基因以及反应的亚细胞定位、细胞生物量组份含量的测定、转运和交换反应的鉴定和添加、代谢途径中Gap的分析及填补等,其中:
a.化学反应方程式的配平;该项目拟利用Marvin软件(version5.3.3,ChemAxonKft)计算出代谢网络初步模型中所有化合物在PH=7.2下的价态形式和化学方程式.利用线性代数法原理对反应进行配平。
b.化学反应可逆性的判定;该项目拟使用Marvinbeans软件(ChemAxon Kft)根据Aiberty(2003)所描述的方法,将各反应的标准吉布斯自由能校正为PH=7.2下的吉布斯自由能,以此为判据,对各化学反应的可逆性进行判定。
c.水稻蛋白的亚细胞定位;该项目试图采用软件整合的方法,将现有植物亚细胞等位的实验数据作为数据集,利用机器学习的方法,训练得到每个亚细胞定位预测精度最高的软件组合,并对水稻细胞内蛋白进行亚细胞定位的预测。
d.水稻细胞生物量(Biomass)组分含量的测定;水稻细胞生物量组分含量的测定,是实现生物量组分合成反应的添加以及代谢网络流平衡分析(Flux Balance Analysis)必不可少的步骤;截止到目前为止,水稻细胞生物量组分含量的实验数据还未被报道。为此,该项目将利用实验手段对水稻水稻悬浮细胞生物量组分的含量进行测定包括细胞壁的提取和含量测定(Sriram et al.2006)、淀粉含量的测定(酶标法测定淀粉含量)、脂类含量的测定、蛋白含量的测定(考马斯亮蓝法)、蛋白质氨基酸组分的测定、DNA含量的测定(十六烷基三甲基溴化铵法)、RNA含量的测定(LiCl法)等。
e.化学反应辅因子信息以及转运和交换反应的鉴定和添加;水稻化学反应辅因子的信息可以通过数据库信息提取和文献挖掘两种方式来获取,水稻转运和交换反应,一方面可以通过文献挖掘的方法,将已报道的水稻种的转运反应和交换反应进行收集和添加;另一方面,可以根据各亚细胞定位下的代谢网络的拓扑结构进行转运和交换反应的添加。
最后,利用Gapfinder等软件对已构建的水稻代谢网络进行Gap分析和填补,将修正好的网络根据Palsson等人提出的方法进行网络可信性的评估和打分。
(3)整合多层次基因调控网络。
首先,对Lee I等人构建的水稻基因组尺度上的蛋白编码基因的调控网络与MengY等人构建的水稻基因组尺度MicroRNA介导的基因调控网络进行整合,完成水稻基因组尺度基因调控网络模型的构建;然后,再整合现有蛋白质互作数据库中的水稻相关的蛋白质互作信息(BIND、PlaPid、PRIN),完成水稻基因组尺度蛋白质互作网络模型的构建,将构建好的基因调控网络模型和蛋白质互作网络模型,根据数据库间ID的转换整合到代谢网络模型中,完成水稻多层次基因调控网络的构建;最后,采取文本发掘和实验数据收集的手段,建立合理的可信性打分系统,对水稻多层次基因调控网络中的每一条边及整个网络进行可信性评估。
(4)开发多层次调控网络数据库。
将构建好的水稻多层次基因调控网络的调控信息整合到一个网络数据库中,命名为RiceNetDB,该数据库主要包括:①水稻基因、蛋白质、化合物的基本注释信息;②水稻基因、蛋白质、化合物间的调控关系;③水稻基因-蛋白质-反应间的相关信息;④水稻各基因在各组织中的表达模式信息;⑤基于Flash平台实现水稻多层次网络的3D可视化。
该项目构建出包括基因调控网络、蛋白质互作网络以及代谢网络的三层次水稻多层次基因调控网络,此传统的网络可视化工具已经很难进行相应的可视化展示。本发明拟利用javascrpit以及Flash平台进行多层次网络3D可视化工具的开发,并开发新的网络节点排布算法,将多层次网络在三维空间中较为清晰的展示,如图2所示,使得每一个层次的网络节点进行排布使得层与层之间边的覆盖度最小,可供学术界共享使用,为水稻内分子调控机制的研究提供一个整合的可视化资源。
由此可见,本发明收集了水稻基因多层次调控网络数据,并且通过整合挖掘多来源数据搭建了多层次的基因调控网络并建立了调控网络Web数据库;本发明开发完成的RiceNetDB提供了丰富的查询接口,方便用户在使用时能够已多种简单的方式获得想要的结果;本发明通过完整的基因调控网络构建,基因为中心的水稻多层次调控网络的可视化过程得以实现;本发明通过蛋白质互作网络,可以实现蛋白质亚细胞定位,这为研究蛋白质提供巨大便利。RiceNetDB根据所收集整合的注释信息以及KEGG等通路数据提供的数据,可以对数据集进行进一步的分析,此外RiceNetDB还提供了对外工具接口能提供对水稻表型和基因型数据的关联研究。综上所述,本发明构建了一个完整的水稻基因多层级调控网络构建思路,并成功构建了RiceNetDB这一完整的水稻基因调控数据库,这将对水稻基因组学,蛋白组学,代谢组学等多个领域深入研究提供重要的参考依据和数据支持。
上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims (5)

1.一种基于多组学数据整合的植物全基因组多层次生物网络重建方法,包括如下步骤:
(1)收集整合植物多组学数据;
(2)基于所述植物多组学数据通过整合和修正构建水稻基因组尺度上的代谢网络模型;
(3)基于所述代谢网络模型通过整合构建水稻多层次基因调控网络;
(4)基于所述调控网络开发出水稻多层次基因调控网络数据库RiceNetDB以及该调控网络的3D可视化平台。
2.根据权利要求1所述的植物全基因组多层次生物网络重建方法,其特征在于:所述步骤(1)的具体实现为:首先,从各生物公共数据库中挖掘水稻全基因组注释信息和水稻反应及代谢的相关信息,并将数据库间的信息进行整合,去除数据库中错误和冗余的信息;然后,从基因调控网络数据库中提取水稻基因调控信息,从蛋白互作数据库中提取水稻蛋白互作信息,用于水稻多层次网络的整合和构建;从NCBI数据库中挖掘水稻各组织在生长过程中的基因表达谱数据,用于水稻生长过程基因调控网络的构建。
3.根据权利要求1所述的植物全基因组多层次生物网络重建方法,其特征在于:所述步骤(2)的具体实现为:首先,基于水稻全基因组注释信息鉴定水稻基因组尺度上与代谢相关的基因,并整合水稻反应及代谢的相关信息,建立关于基因-酶-反应的相互关系列表,完成水稻代谢网络模型的初步构建;然后,利用实验手段和文本挖掘对初建的水稻代谢网络模型中每条信息进行修正,包括化学反应方程式的配平、反应可逆性的判断、辅因子信息的添加、基因以及反应的亚细胞定位、细胞生物量组份含量的测定、转运和交换反应的鉴定和添加、代谢途径中缺失反应的分析和填补、每条基因-酶-反应链接关系的可信性评估,从而完成水稻基因组尺度上代谢网络模型的构建工作。
4.根据权利要求1所述的植物全基因组多层次生物网络重建方法,其特征在于:所述步骤(3)的具体实现为:首先,对水稻基因组尺度上的蛋白编码基因调控网络与MicroRNA介导的基因调控网络进行整合,完成水稻基因组尺度上的基因调控网络模型的构建;然后,整合蛋白质互作数据库中与水稻相关的蛋白质互作信息,完成水稻基因组尺度上的蛋白质互作网络模型的构建;最后,将构建好的基因调控网络模型和蛋白质互作网络模型整合到所述代谢网络模型中,完成水稻多层次基因调控网络的构建。
5.根据权利要求1所述的植物全基因组多层次生物网络重建方法,其特征在于:所述步骤(4)的具体实现为:基于所述水稻多层次基因调控网络搭建一个水稻多层次基因调控网络数据库RiceNetDB,并基于包括javascrpit及Flash在内的建模工具开发搭建水稻多层次基因调控网络的3D可视化平台,供学术界共享使用,从而为水稻内分子调控机制的研究提供了一个整合的可视化资源。
CN201710952881.0A 2017-10-13 2017-10-13 一种基于多组学数据整合的植物全基因组多层次生物网络重建方法 Pending CN107862176A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710952881.0A CN107862176A (zh) 2017-10-13 2017-10-13 一种基于多组学数据整合的植物全基因组多层次生物网络重建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710952881.0A CN107862176A (zh) 2017-10-13 2017-10-13 一种基于多组学数据整合的植物全基因组多层次生物网络重建方法

Publications (1)

Publication Number Publication Date
CN107862176A true CN107862176A (zh) 2018-03-30

Family

ID=61698640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710952881.0A Pending CN107862176A (zh) 2017-10-13 2017-10-13 一种基于多组学数据整合的植物全基因组多层次生物网络重建方法

Country Status (1)

Country Link
CN (1) CN107862176A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110491442A (zh) * 2019-08-15 2019-11-22 电子科技大学 单细胞miRNA调控网络的识别方法、装置、设备及存储介质
CN110718271A (zh) * 2019-09-25 2020-01-21 君维安(武汉)生命科技有限公司 一种抑制结直肠癌致病菌的益生菌配方及其筛选方法
CN112986411A (zh) * 2019-12-17 2021-06-18 中国科学院地理科学与资源研究所 一种生物代谢物筛查方法
CN113377765A (zh) * 2021-07-09 2021-09-10 深圳华大基因科技服务有限公司 一种多组学数据分析系统及其数据转换方法
CN114882942A (zh) * 2022-04-01 2022-08-09 苏州大学 一种flash照射组织的定量蛋白质组学分析方法
CN115148294A (zh) * 2022-06-30 2022-10-04 上海美吉生物医药科技有限公司 一种基于多组学数据进行功能富集分析的分析方法、装置及应用
CN118298933A (zh) * 2024-02-29 2024-07-05 湖北科技学院 一种桂花多组学数据库及其构建方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101701221A (zh) * 2009-11-25 2010-05-05 天津师范大学 水稻矮杆卷叶突变体(cdl)基因及其应用
CN102663924A (zh) * 2012-04-06 2012-09-12 江南大学 一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法
CN103778349A (zh) * 2014-01-29 2014-05-07 思博奥科生物信息科技(北京)有限公司 一种基于功能模块的生物分子网络分析的方法
US20140172384A1 (en) * 2012-12-11 2014-06-19 Wayne State University Genetic, Metabolic and Biochemical Pathway Analysis System and Methods
CN105184049A (zh) * 2015-08-10 2015-12-23 上海交通大学 基于调控-代谢网络整合模型预测微生物生长表型的方法
CN106156538A (zh) * 2016-06-29 2016-11-23 天津诺禾医学检验所有限公司 一种全基因组变异数据的注释方法和注释系统
CN107103205A (zh) * 2017-05-27 2017-08-29 湖北普罗金科技有限公司 一种基于蛋白质质谱数据注释真核生物基因组的生物信息学方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101701221A (zh) * 2009-11-25 2010-05-05 天津师范大学 水稻矮杆卷叶突变体(cdl)基因及其应用
CN102663924A (zh) * 2012-04-06 2012-09-12 江南大学 一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法
US20140172384A1 (en) * 2012-12-11 2014-06-19 Wayne State University Genetic, Metabolic and Biochemical Pathway Analysis System and Methods
CN103778349A (zh) * 2014-01-29 2014-05-07 思博奥科生物信息科技(北京)有限公司 一种基于功能模块的生物分子网络分析的方法
CN105184049A (zh) * 2015-08-10 2015-12-23 上海交通大学 基于调控-代谢网络整合模型预测微生物生长表型的方法
CN106156538A (zh) * 2016-06-29 2016-11-23 天津诺禾医学检验所有限公司 一种全基因组变异数据的注释方法和注释系统
CN107103205A (zh) * 2017-05-27 2017-08-29 湖北普罗金科技有限公司 一种基于蛋白质质谱数据注释真核生物基因组的生物信息学方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘丽丽: "水稻组学尺度多层次生物网络的构建与工具开发", 《中国博士学位论文全文数据库 基础科学辑》 *
刘林: "整合组学数据构建条件特异性代谢网络模型", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110491442A (zh) * 2019-08-15 2019-11-22 电子科技大学 单细胞miRNA调控网络的识别方法、装置、设备及存储介质
CN110491442B (zh) * 2019-08-15 2021-06-04 电子科技大学 单细胞miRNA调控网络的识别方法、装置、设备及存储介质
CN110718271A (zh) * 2019-09-25 2020-01-21 君维安(武汉)生命科技有限公司 一种抑制结直肠癌致病菌的益生菌配方及其筛选方法
CN110718271B (zh) * 2019-09-25 2022-02-01 君维安(武汉)生命科技有限公司 一种抑制结直肠癌致病菌的益生菌配方及其筛选方法
CN112986411A (zh) * 2019-12-17 2021-06-18 中国科学院地理科学与资源研究所 一种生物代谢物筛查方法
CN112986411B (zh) * 2019-12-17 2022-08-09 中国科学院地理科学与资源研究所 一种生物代谢物筛查方法
CN113377765A (zh) * 2021-07-09 2021-09-10 深圳华大基因科技服务有限公司 一种多组学数据分析系统及其数据转换方法
CN114882942A (zh) * 2022-04-01 2022-08-09 苏州大学 一种flash照射组织的定量蛋白质组学分析方法
CN115148294A (zh) * 2022-06-30 2022-10-04 上海美吉生物医药科技有限公司 一种基于多组学数据进行功能富集分析的分析方法、装置及应用
CN118298933A (zh) * 2024-02-29 2024-07-05 湖北科技学院 一种桂花多组学数据库及其构建方法

Similar Documents

Publication Publication Date Title
CN107862176A (zh) 一种基于多组学数据整合的植物全基因组多层次生物网络重建方法
Serin et al. Learning from co-expression networks: possibilities and challenges
Li et al. Plant pan-genomics: recent advances, new challenges, and roads ahead
Plant Cell Atlas Consortium Ahmed Jahed Louvain Institute of Biomolecular Science and Technology, UCLouvain Louvain La Neuve Belgium Alaba Oluwafemi School of Biology and Ecology, University of Maine Orono United States Ameen Gazala Washington State University Pullman United States Arora Vaishali University of Delhi Delhi India Arteaga-Vazquez Mario A Universidad Veracruzana Xalapa Mexico Arun Alok Inter American University of Puerto Rico Barranquitas United States Bailey-Serres Julia Center for Plant Cell Biology and Department of Botany and Plant Sciences, University of California, Riverside Riverside United States Bartley Laura E Washington State University Pullman United States Bassel George W University of Warwick Coventry United Kingdom Bergmann Dominique C Stanford University and Howard Hughes Medical Institute Stanford United States Bertolini Edoardo Donald Danforth Plant Science Center St. Louis United States Bhati Kaushal Kumar Louvain Institute of Biomolecular Sciences, Catholic University of Louvain Louvain La Neuve Belgium Blanco-Touriñán Noel Plant Vascular Development Group, ETH Zürich Zurich Switzerland Briggs Steven P University of California San Diego La Jolla United States Brumos Javier Instituto de Biologia Molecular y Celular de Plantas (IBMCP) Consejo Superior de Investigaciones Científicas (CSIC) Valencia Spain Buer Benjamin Bayer AG, Monheim am Rhein Germany Burlaocot Adrien HHMI, Department of Plant and Microbial Biology, University of California, Berkeley Berkeley United States Cervantes-Pérez Sergio Alan LANGEBIO-CINVESTAV Irapuato Mexico Chen Sixue Department of Biology, University of Florida Gainesville United States Contreras-Moreira Bruno European Bioinformatics Institute-EMBL Hinxton United Kingdom CORPAS Francisco J Estación Experimental del Zaidin (CSIC) Granada Spain Cruz-Ramirez Alfredo National Laboratory of Genomics for Biodiversity CINVESTAV Irapuato Mexico Cuevas-Velazquez Cesar L Departamento de Bioquímica, Facultad de Química, Universidad Nacional Autónoma de México, Cd. Irapuato Mexico Cuperus Josh T University of Washington Seattle United States David Lisa I North Carolina State University Raleigh United States de Folter Stefan Unidad de Genómica Avanzada (UGA-LANGEBIO), Centro de Investigación y de Estudios Avanzados del Instituto Politécnico Nacional (CINVESTAV-IPN) Irapuato Mexico Denolf Peter H BASF Innovation Center Gent Zwijnaarde Belgium Ding Pingtao Institute of Biology Leiden, Leiden University Leiden Netherlands Dwyer William P Department of Plant Biology, Carnegie Institution for Science Stanford United States Evans Matthew MS Department of Plant Biology, Carnegie Institution for Science Stanford United States George Nancy European Bioinformatics Institute Cambridge United Kingdom Handakumbura Pubudu P Environmental Molecular Sciences Division, Pacific Northwest National Laboratory Richland United States Harrison Maria J Boyce Thompson Institute Ithaca United States Haswell Elizabeth S Washington University in St. Louis St. Louis United States Herath Venura University of Peradeniya Peradeniya Sri Lanka Jiao Yuling Institute of Genetics and Developmental Biology, Chinese Academy of Sciences Beijing China Jinkerson Robert E University of California, Riverside Riverside United States John Uwe Alfrd-Wegener-Institute Helmholtz centre for Polar and Marine Research Bremerhaven Germany Joshi Sanjay University of Kentucky Lexington United States Joshi Abhishek Mohanlal Sukhadia University Udaipur India Joubert Lydia-Marie Stanford University Stanford United States Katam Ramesh Florida A&M University Tallahassee United States Kaur Harmanpreet Punjab Agricultural University Ludhiana India Kazachkova Yana Weizmann Institute of Science Rehovot Israel Raju Sunil K Kenchanmane Michigan State University East Lansing United States Khan Mather A Heinrich Heine University Dusseldorf Germany Khangura Rajdeep Purdue University West Lafayette United States Kumar Ajay ICAR-NIPB New Delhi India Kumar Arun Biotechnology Division, CSIR-Institute of Himalayan Bioresource Technology Palampur India Kumar Pankaj Dr Yashwant Singh Parmar University of Horticulture and Forestry Nauni Solan Himachal Pradesh Solan India Kumar Pradeep Centre for Cellular & Molecular Biology Hyderabad India Lavania Dhruv University of Alberta Edmonton Canada Lew Tedrick Thomas Salim Institute of Materials Research and Engineering Singapore Singapore Lewsey Mathew G La Trobe University Bundoora Australia Lin Chien-Yuan Joint BioEnergy Institute, Lawrence Berkeley National Laboratory Emeryville United States Liu Dianyi Donald Danforth Plant Science Center Saint Louis United States Liu Le Department of Biology, University of Massachusetts Amherst Amherst United States Liu Tie University of Florida Gainesville United States Lokdarshi Ansul University of Tennessee Knoxville United States My Luong Ai Louvain Institute of Biomolecular Science and Technology Louvain-la-Neuve Belgium Macaulay Iain C Earlham Institute Norwich United Kingdom Mahmud Sakil Plant Cell Biology, IZMB, University of Bonn Bonn Germany Mähönen Ari Pekka Institute of Biotechnology, HiLIFE, University of Helsinki Helsinki Finland Malukani Kamal Kumar Molecular Biology Hyderabad India Marand Alexandre P University of Georgia Athens United States Martin Carly A MIT Cambridge United States McWhite Claire D Princeton University Princeton United States Mehta Devang University of Alberta Edmonton Canada Martín Miguel Miñambres Heinrich Heine University Düsseldorf Germany Mortimer Jenny C University of Adelaide Adelaide Australia Nikolov Lachezar A University of California, Los Angeles, Los Angeles United States Nobori Tatsuya Salk Institute for Biological Studies, San Diego United States Nolan Trevor M Duke University Durham United States Ogden Aaron J Pacific Northwest National Laboratory Richland United States Otegui Marisa S University of Wisconsin-Madison Madison United States Ott Mark-Christoph Bayer AG, Monheim am Rhein Germany Palma José M Estación Experimental del Zaidín, CSIC Granada Spain Paul Puneet University of Nebraska-Lincoln Lincoln United States Rehman Atique U Department of Agronomy, Bahauddin Zakariya University Multan Multan Pakistan Romera-Branchat Maida Institute of Plant Biology and Biotechnology, University of Münster Muenster (Germany) Germany Romero Luis C Instituto de Bioquimica Vegetal y Fotosintesis, CSIC-US Seville Spain Roth Ronelle Department of Plant Sciences, University of Oxford Oxford United Kingdom Sah Saroj K The Pennsylvania State University University Park United States Shahan Rachel Duke University Durham United States Solanki Shyam Washington State University Pullman United States Song Bao-Hua University of North Carolina at Charlotte Charlotte United States Sozzani Rosangela North Carolina State University Raleigh United States Stacey Gary University of Missouri Columbia United States Stepanova Anna N North Carolina State University Raleigh United States Taylor Nicolas L The University of Western Australia Perth Australia Tello-Ruiz Marcela K Cold Spring Harbor Laboratory, Cold Spring Harbor United States Tran Tuan M Nanyang Technological University Singapore Singapore Tripathi Rajiv Kumar University of Manitoba Winnipeg Canada Vadde Batthula Vijaya Lakshmi Vadde Cornell University Ithaca United States Varga Tamas Environmental Molecular Sciences Division, Pacific Northwest National Laboratory,(PNNL) Richland United States Vidovic Marija Institute of Molecular Genetics and Genetic Engineering, University of Belgrade Belgrade Serbia Walley Justin W Iowa State University Ames United States Wang Zhiyong Carnegie Institution for Science, Dept. of Plant Biology Stanford United States Weizbauer Renate A Carnegie Institution for Science, Dept. of Plant Biology Stanford United States Whelan James La Trobe University Melbourne Australia Wijeratne Asela J Arkansas State University Jonesboro United States Xiang Tingting University of North Carolina at Charlotte Charlotte United States Xu Shouling Carnegie Institution for Science Stanford United States Yadegari Ramin University of Arizona Tucson United States Yu Houlin Department of Biochemistry and Molecular Biology, University of Massachusetts Amherst Amherst United States Yuan Hai Ying University of Saskatchewan Saskatoon Canada Zanini Fabio UNSW Sydney Australia Zhao Feng Laboratoire Reproduction et Développement des Plantes, Université de Lyon Lyon France Zhu Jie University of California, Davis Davis United States Zhuang Xiaohong Centre for Cell and Developmental Biology, State Key Laboratory of Agrobiotechnology, School of Life Sciences, The Chinese University of Hong Kong, Hong Kong SAR Shatin Hong Kong et al. Vision, challenges and opportunities for a Plant Cell Atlas
Rai et al. A new era in plant functional genomics
Gu et al. Novel sequencing and genomic technologies revolutionized rice genomic study and breeding
Singh et al. Bioinformatics: methods and applications
Song et al. Proteogenomics-based functional genome research: approaches, applications, and perspectives in plants
WO2019235567A1 (ja) タンパク質相互作用解析装置及び解析方法
Upadhyay et al. Application of bioinformatics in understanding of plant stress tolerance
Wang et al. Towards a comprehensive picture of the genetic landscape of complex traits
Chen et al. Innovative computational tools provide new insights into the polyploid wheat genome
Krishnan et al. Integrative approaches for mining transcriptional regulatory programs in Arabidopsis
Sajid et al. The y-ome conundrum: insights into uncharacterized genes and approaches for functional annotation
WO2001080151A2 (en) Method for constructing, representing or displaying protein interaction maps
Sucaet et al. Evolution and applications of plant pathway resources and databases
Parray et al. Advancement in sustainable agriculture: Computational and bioinformatics tools
East et al. A Comprehensive Examination of Metabolic Flux Analysis Techniques and Applications in Systems Biology
Palsson Genome‐Scale Models: Two Decades of Progress and a 2020 Vision
Ge et al. VEGA: visual comparison of phylogenetic trees for evolutionary genome analysis (ChinaVis 2019)
Bevan Genomics and plant cells: application of genomics strategies to Arabidopsis cell biology
Saini et al. Omics and System Biology Approaches for Delivering Better Cereals
Tan Comprehensive Analysis of Resistance Genes, Structural Variation, and Recent Genome Rearrangements in Plant Genomes
Chavhan et al. Bioinformatics for Molecular Breeding and Enhanced Crop Performance: Applications and Perspectives
Kumari et al. Chapter–9 An insight of bioinformatics in agriculture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180330