CN109448788B - 基因组学及生物信息学的微生物组学在线分析平台架构 - Google Patents
基因组学及生物信息学的微生物组学在线分析平台架构 Download PDFInfo
- Publication number
- CN109448788B CN109448788B CN201811244122.XA CN201811244122A CN109448788B CN 109448788 B CN109448788 B CN 109448788B CN 201811244122 A CN201811244122 A CN 201811244122A CN 109448788 B CN109448788 B CN 109448788B
- Authority
- CN
- China
- Prior art keywords
- analysis
- data
- layer
- module
- biological information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本发明公开了一种基因组学及生物信息学的微生物组学在线分析平台架构,包括:底层支撑层,包括生物信息分析模块和云平台支撑模块,生物信息分析模块用于利用云平台支撑模块针对16S、ITS、18S以及微生物宏基因组测序进行个性化分析,与数据以及功能层、交互层交互,最后通过交互层以交互界面的形式对用户呈现,云平台支撑模块包含云平台所需的软硬件条件;数据以及功能层,用于向底层支撑层提供用户数据和系统数据;交互层,用于将生物信息分析模块的分析结果以交互界面的形式对用户呈现,本发明可解决传统高通量测序科研服务模式的弊端,使得无生物信息基础的科研工作者也可根据需要自主选择参数、一键生成分析结果、图形完全动态,便于实时解析。
Description
技术领域
本发明涉及生物信息分析技术领域,特别是涉及一种基因组学及生物信息学的微生物组学在线分析平台架构。
背景技术
基因测序目前全球市场规模约有200亿美元,高通量测序技术已成为生命科学研究重要工具,对该技术的应用水准直接影响一个国家的生物技术发展水平。数据的检测与挖掘是组学研究的两个核心内容。随着测序技术的进步与发展,数据检测手段不断丰富的同时,其检测的准确性也大大提高。数据的大量形成与累积,带来的下一个烦恼就是数据的挖掘。目前,高通量测序技术产生的数据总量已达EB级,因此如何利用生物信息技术从海量数据中挖掘有价值的核心信息,数据展示便于实时解析和关键报告数据挖掘,已成为该领域科研人员的核心难题。
在生物信息分析平台方面,比较著名的国内外平台包括:国外的Galaxy生物信息分析平台、华大基因的BGI online平台。这些平台功能强大,适合专业生物信息用户,但对没有任何生物信息基础的用户使用尚有难度。市面大部分高通量测序服务公司,都只提供的传统静态结题报告,在数据挖掘方面费时费力,不利于该领域科研人员进行数据分析研究,而且若客户下机数据如需修改参数,需经公司技术和生物信息工程师进行反复交流商讨修改且重新分析需客户缴纳补充分析费用,此过程极为浪费时间以和经济成本。
总之,目前在国内外暂时没有同时具有操作简单、安全性高、个性化分析丰富的生物信息学在线服务平台,因此,若能够提供一种可动态化数据挖掘和实时解析数据结果的生物信息分析平台,将会有巨大的行业需求。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种基因组学及生物信息学的微生物组学在线分析平台架构,以解决传统高通量测序科研服务模式的弊端,使得无生物信息基础的科研工作者也可根据需要自主选择参数、一键生成分析结果、图形完全动态,便于实时解析。
为达上述及其它目的,本发明提出一种基因组学及生物信息学的微生物组学在线分析平台架构,包括:
底层支撑层,包括生物信息分析模块和云平台支撑模块,所述生物信息分析模块用于利用云平台支撑模块针对16S、ITS、18S以及微生物宏基因组测序进行个性化分析,与数据以及功能层、交互层交互,最后通过交互层以交互界面的形式对用户呈现,所述云平台支撑模块包含云平台所需的软硬件条件;
数据以及功能层,用于向所述底层支撑层提供用户数据和系统数据;
交互层,用于将所述生物信息分析模块的分析结果以交互界面的形式对用户呈现。
优选地,所述生物信息分析模块的分析包括但不限于分组分析、OTU筛选、物种组成分析、OTU物种注释、Alpha多样性分析、Beta多样性分析、功能分析、差异分析、个性报告生成。
优选地,所述生物信息分析模块的分析过程如下:从所述数据以及功能层获得原始数据;对原始数据进行处理;进行OTU聚类及统计;进行物种组成分析、Alpha多样性分析、Beta多样性分析、功能分析、环境因子分析;生物信息分析模块于实现个性化分析后,通过交互层以交互界面的形式对用户呈现。
优选地,所述云平台支撑模块包括底层基础的硬件层,为软件运行和用户交互提供环境的平台架构层,以及为用户提供数据分析的应用软件层。
优选地,所述数据以及功能层的用户数据包含从客户样本相关的环境因素数据、动态分析结果,以及其他用户数据等,所述系统数据包括为用户提供的可以自主选用的各类分析流程和各类个性化分析工具。
优选地,所述交互层包括分析操作模块和个性化结果导出模块。
与现有技术相比,本发明一种基因组学及生物信息学的微生物组学在线分析平台架构通过云端服务平台封装式的设计,将后台复杂的实验、分析流程以简单、交互式的方式呈现给终端用户,使非生物信息背景的用户,也能够通过平台简单的操作界面完成复杂的生物信息分析,本发明解决了传统高通量测序科研服务模式的弊端,对无生物信息基础的科研工作者也可根据需要自主选择参数、一键生成分析结果、图形完全动态,便于实时解析。
附图说明
图1为本发明一种基因组学及生物信息学的微生物组学在线分析平台架构的系统架构图;
图2为本发明具体实施例中云平台支撑模块的示意图;
图3为本发明具体实施例中生物信息分析模块的示意图;
图4为本发明具体实施例中生物信息分析模块的在线报告生成过程示意图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种基因组学及生物信息学的微生物组学在线分析平台架构的系统架构图。如图1所示,本发明一种基因组学及生物信息学的微生物组学在线分析平台架构,包括:
底层支撑层10,包括生物信息分析模块101和云平台支撑模块102,其中,生物信息分析模块101,用于利用云平台支撑模块102针对16S、ITS、18S以及微生物宏基因组测序进行个性化分析,与数据以及功能层、交互层交互,最后通过交互层以交互界面的形式对用户呈现,在本发明具体实施中,生物信息分析模块101所进行的分析不仅包括分组分析、OTU筛选等相对基础的分析,还包括OTU分析、物种组成分析、Alpha多样性分析、Beta多样性分析、功能分析、差异分析等多个重要分析点;云平台支撑模块102包含云平台所需的软硬件条件,承担平台运行所需的运算、存储、带宽、安全性等方面的支持性要求,如图2所示,其包括三个层级:底层基础的硬件层,为软件运行和用户交互提供环境的平台架构层,以及为用户提供数据分析的应用软件层;底层支撑层具体设计如下:
①硬件层:采用多核多线程CPU以满足云生物信息分析高效运算;采用大内存、存储空间和网络带宽,使多用户同步登录使用的情况下,保证平台流畅度的基础,配置交换机、路由器等其他配套硬件,优化与提升服务器运算与存储能力、网络带宽等;
②应用软件层:生物信息云分析软件开发和拓展、云分析软件用户交互界面优化、相关技术说明文档的编辑等。
③云分析平台架构:提供具有安全性、友好易用性和可拓展性的云分析平台。
在本发明中,底层支撑层10为整个平台架构的核心,终端用户不直接接触底层支撑层10,而是通过交互层、数据以及功能层间接对其实现操作。
数据以及功能层20,用于提供用户数据和系统数据,所述用户数据包含从客户样本相关的环境因素数据、动态分析结果,以及其他用户数据等,所述系统数据则包括为用户提供的可以自主选用的各类分析流程和各类个性化分析工具。由于分析数据庞大、分析方法众多且复杂,数据以及功能层20依然需要通过交互层,才能更为友好地与用户互动
交互层30,用于以交互界面的形式对用户呈现。交互层包括分析操作模块和个性化结果导出模块。通过该两个模块,用户可以利用交互界面完成复杂的数据处理、信息获取等应用性操作。
在本发明具体实施例中,生物信息分析模块101针对16S、ITS以及18S测序实现个性化分析。如图3所示,为针对16s Meta测序实现的个性化分析内容,生物信息分析模块101包括物种组成分析、Alpha多样性分析、Beta多样性分析、功能分析、环境因子分析、差异分析等。具体地,生物信息分析模块101的分析过程如下:从数据以及功能层20获得原始数据;对原始数据进行处理,例如reads过滤、reads拼接、Tag过滤以及嵌合体去除等;进行OTU聚类及统计,如OTU聚类以及组间OTU比较;进行物种组成分析、Alpha多样性分析、Beta多样性分析、功能分析、环境因子分析,其中物种组成分析包括进行OTU物种注释,输出物种分类树,Alpha多样性分析包括Alpha多样性分析指数、稀释曲线、rank abundance、Shannon曲线以及差异检验分析,Beta多样性分析包括组间相似性、PCoA分析、PCA分析、NMDS分析以及UPGMA聚类树,功能分析,即KEGG注释,环境因子分析即互作模型分析,包括CCA分析以及RDA分析,差异分析包括样本差异分析与物种差异分析,生物信息分析模块101实现个性化分析后,并通过交互层以交互界面的形式对用户呈现。
如图4所示为本发明具体实施例中生物信息分析模块101的在线报告生成过程示意图。首先输入样本数据;对样本数据进行分组;对分组样本进行个性化分析,这里的个性化分析包括基础分析和高级分析,基础分析包括分组分析、OTU筛选、物种分组分析等,高级分析包括OTU物种注释、Alpha多样性分析、Beta多样性分析、功能分析、差异分析等;根据分析结果绘制图表;导出个性化分析报告。
综上所述,本发明一种基因组学及生物信息学的微生物组学在线分析平台架构通过云端服务平台封装式的设计,将后台复杂的实验、分析流程以简单、交互式的方式呈现给终端用户,使非生物信息背景的用户,也能够通过平台简单的操作界面完成复杂的生物信息分析,本发明解决了传统高通量测序科研服务模式的弊端,对无生物信息基础的科研工作者也可根据需要自主选择参数、一键生成分析结果、图形完全动态,便于实时解析。
与现有技术相比,本发明具有如下优点:
1)可以利用平台进行抽平处理,统一样本数据量,一键操作且结果呈现快捷;
2)可以通过选择按样本或分组展示,挑选合适的物种组成、α多样性指数、β多样性指数展示效果;
3)可以筛选关心物种,根据目的需求选择不同检验模型或p值等过滤参数;
4)可以合理展示群落分组结构,简单快捷的选择不同多样性指数或者样本距离;
5)可以寻找最佳的群落分组,根据需要选择不同多元分析模型(PCA、PCoA、NMDS)。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。
Claims (3)
1.一种基因组学及生物信息学的微生物组学在线分析平台架构,包括:
底层支撑层,包括生物信息分析模块和云平台支撑模块,所述生物信息分析模块用于利用云平台支撑模块针对16S、ITS、18S以及微生物宏基因组测序进行个性化分析,与数据以及功能层、交互层交互,最后通过交互层以交互界面的形式对用户呈现,所述云平台支撑模块包含云平台所需的软硬件条件,所述生物信息分析模块从所述数据以及功能层获得原始数据;
所述生物信息分析模块的分析包括但不限于分组分析、OTU筛选、物种组成分析、OTU物种注释、Alpha多样性分析、Beta多样性分析、功能分析、差异分析、个性报告生成;
所述生物信息分析模块的分析过程包括对原始数据进行处理;进行OTU聚类及统计;进行物种组成分析、Alpha多样性分析、Beta多样性分析、功能分析、环境因子分析;生物信息分析模块于实现个性化分析后,通过交互层以交互界面的形式对用户呈现;
数据以及功能层,用于向所述底层支撑层提供用户数据和系统数据,所述数据以及功能层的用户数据包含客户样本相关的环境因素数据、动态分析结果,以及其他用户数据,所述系统数据包括为用户提供的自主选用的各类分析流程和各类个性化分析工具;
交互层,用于将所述生物信息分析模块的分析结果以交互界面的形式对用户呈现。
2.如权利要求1所述的一种基因组学及生物信息学的微生物组学在线分析平台架构,其特征在于:所述云平台支撑模块包括底层基础的硬件层,为软件运行和用户交互提供环境的平台架构层,以及为用户提供数据分析的应用软件层。
3.如权利要求1所述的一种基因组学及生物信息学的微生物组学在线分析平台架构,其特征在于:所述交互层包括分析操作模块和个性化结果导出模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811244122.XA CN109448788B (zh) | 2018-10-24 | 2018-10-24 | 基因组学及生物信息学的微生物组学在线分析平台架构 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811244122.XA CN109448788B (zh) | 2018-10-24 | 2018-10-24 | 基因组学及生物信息学的微生物组学在线分析平台架构 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109448788A CN109448788A (zh) | 2019-03-08 |
CN109448788B true CN109448788B (zh) | 2022-03-15 |
Family
ID=65548418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811244122.XA Active CN109448788B (zh) | 2018-10-24 | 2018-10-24 | 基因组学及生物信息学的微生物组学在线分析平台架构 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109448788B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110010203B (zh) * | 2019-03-29 | 2022-05-27 | 广州基迪奥生物科技有限公司 | 一种基于生物云平台的交互式动态qtl分析系统及方法 |
CN110008427B (zh) * | 2019-03-29 | 2023-03-21 | 广州基迪奥生物科技有限公司 | 一种整合多组学知识库的交互式生物信息云分析平台 |
CN111933218B (zh) * | 2020-07-01 | 2022-03-29 | 广州基迪奥生物科技有限公司 | 一种优化的宏基因组binning分析微生物群落的方法 |
CN112037861A (zh) * | 2020-09-15 | 2020-12-04 | 中国科学院微生物研究所 | 微生物信息分析结果处理方法、装置、电子设备及介质 |
CN112397146B (zh) * | 2020-12-02 | 2021-08-24 | 广东美格基因科技有限公司 | 一种基于云平台的微生物组学数据交互分析系统 |
CN112669899B (zh) * | 2020-12-24 | 2023-03-03 | 广州基迪奥生物科技有限公司 | 一种16s和宏基因组测序数据关联分析方法、系统及设备 |
CN113223621B (zh) * | 2021-05-17 | 2023-10-31 | 上海交通大学 | 一种用于生物医学的全链条数据分析系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016164831A1 (en) * | 2015-04-09 | 2016-10-13 | Edico Genome, Inc. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
CN107368700A (zh) * | 2017-07-21 | 2017-11-21 | 上海桑格信息技术有限公司 | 基于计算云平台的微生物多样性交互分析系统及其方法 |
CN108537008A (zh) * | 2018-03-20 | 2018-09-14 | 常州大学 | 高通量基因测序大数据分析云平台系统 |
CN108694305A (zh) * | 2018-03-30 | 2018-10-23 | 武汉光谷创赢生物技术开发有限公司 | 基于云计算的生物信息分析平台 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447336B (zh) * | 2015-12-29 | 2018-06-19 | 北京百迈客生物科技有限公司 | 基于生物云平台的微生物多样性分析系统 |
US20170270245A1 (en) * | 2016-01-11 | 2017-09-21 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods for performing secondary and/or tertiary processing |
EP3937178A1 (en) * | 2016-01-11 | 2022-01-12 | Edico Genome Corporation | Genomic infrastructure for on-site or cloud-based dna and rna processing and analysis |
CN107066836A (zh) * | 2017-06-15 | 2017-08-18 | 上海思路迪生物医学科技有限公司 | 基因检测管理方法及系统 |
CN107368704A (zh) * | 2017-07-21 | 2017-11-21 | 上海桑格信息技术有限公司 | 基于云计算平台的有参考基因组的转录组项目的交互式分析系统及方法 |
CN107590365A (zh) * | 2017-08-22 | 2018-01-16 | 武汉古奥基因科技有限公司 | Docker技术在高通量测序数据分析中的应用 |
-
2018
- 2018-10-24 CN CN201811244122.XA patent/CN109448788B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016164831A1 (en) * | 2015-04-09 | 2016-10-13 | Edico Genome, Inc. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
CN107368700A (zh) * | 2017-07-21 | 2017-11-21 | 上海桑格信息技术有限公司 | 基于计算云平台的微生物多样性交互分析系统及其方法 |
CN108537008A (zh) * | 2018-03-20 | 2018-09-14 | 常州大学 | 高通量基因测序大数据分析云平台系统 |
CN108694305A (zh) * | 2018-03-30 | 2018-10-23 | 武汉光谷创赢生物技术开发有限公司 | 基于云计算的生物信息分析平台 |
Non-Patent Citations (1)
Title |
---|
利用Galaxy与高性能计算集群构建本地化一站式生物信息学平台;王小磊等;《军事医学》;20131031;第37卷(第10期);第780-783页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109448788A (zh) | 2019-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109448788B (zh) | 基因组学及生物信息学的微生物组学在线分析平台架构 | |
CN112071366B (zh) | 一种基于二代测序技术的宏基因组数据分析方法 | |
Höllt et al. | Cytosplore: interactive immune cell phenotyping for large single‐cell datasets | |
Heyer et al. | Challenges and perspectives of metaproteomic data analysis | |
CN112133368B (zh) | 一种基于三代测序技术的宏基因组测序数据的自动化分析方法 | |
CN107368700A (zh) | 基于计算云平台的微生物多样性交互分析系统及其方法 | |
de Vienne et al. | Phylo-MCOA: a fast and efficient method to detect outlier genes and species in phylogenomics using multiple co-inertia analysis | |
Fu et al. | Spark–a big data processing platform for machine learning | |
CN102135938A (zh) | 一种软件产品测试方法及系统 | |
CN112669899B (zh) | 一种16s和宏基因组测序数据关联分析方法、系统及设备 | |
CN107748752A (zh) | 一种数据处理方法及装置 | |
Amin et al. | A comparison of two oversampling techniques (smote vs mtdf) for handling class imbalance problem: A case study of customer churn prediction | |
CN108920609A (zh) | 基于多维度分析的电力实验数据挖掘方法 | |
CN111815432A (zh) | 金融服务风险预测方法及装置 | |
Pommier et al. | RAMI: a tool for identification and characterization of phylogenetic clusters in microbial communities | |
CN112163017A (zh) | 一种知识挖掘系统及方法 | |
CN105095501A (zh) | 专利分析系统 | |
CN109582292B (zh) | 一种基于基因组学以及生物信息学的在线交互云平台 | |
CN109523031B (zh) | 一种用于深度分析的大数据智能机器学习系统 | |
CN112214524A (zh) | 一种基于深度数据挖掘的数据评估系统及评估方法 | |
Lashin et al. | An integrated information system on bioresource collections of the FASO of Russia | |
CN110321911B (zh) | 一种油品质量群落分析系统 | |
CN111274123A (zh) | 基于软件基因的安全防护软件测试集自动生成方法、架构 | |
CN111261227B (zh) | 测序数据存储方法、装置、设备及计算机可读存储介质 | |
Legetth et al. | CellexalVR: a virtual reality platform for the exploration and analysis of single-cell gene expression data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |