CN111883204A - 基于生物云平台的lncRNA与mRNA关联分析系统 - Google Patents

基于生物云平台的lncRNA与mRNA关联分析系统 Download PDF

Info

Publication number
CN111883204A
CN111883204A CN202010778211.3A CN202010778211A CN111883204A CN 111883204 A CN111883204 A CN 111883204A CN 202010778211 A CN202010778211 A CN 202010778211A CN 111883204 A CN111883204 A CN 111883204A
Authority
CN
China
Prior art keywords
lncrna
analysis
mrna
unit
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010778211.3A
Other languages
English (en)
Inventor
周煌凯
夏昊强
艾鹏
陈建周
张秋雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Gene Denovo Biotechnology Co ltd
Original Assignee
Guangzhou Gene Denovo Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Gene Denovo Biotechnology Co ltd filed Critical Guangzhou Gene Denovo Biotechnology Co ltd
Priority to CN202010778211.3A priority Critical patent/CN111883204A/zh
Publication of CN111883204A publication Critical patent/CN111883204A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于生物云平台的lncRNA与mRNA关联分析系统,涉及生物分析技术领域,包括客户端和后台数据处理中心;后台数据处理中心包括服务器端程序和数据库模块、分布式计算集群管理模块、数据分析处理模块、数据分析工具模块;所述数据分析处理模块包括lncRNA分析模块、mRNA分析模块、lncRNA‑mRNA关联分析模块。本发明与传统的方案相比,不仅单独针对lncRNA或mRNA进行分析,而且还进行了lncRNA与mRNA的关联分析;且分析结果展示在客户端界面,当用户需要对结果进一步数据挖掘或者个性化解析,只需在客户端界面一键式选择参数和做相应调整即可;分析结果具有交互式图表功能,在线分析报告的表格和图形是交互分析的,提高了分析报告的可读性和个性化程度。

Description

基于生物云平台的lncRNA与mRNA关联分析系统
技术领域
本发明涉及生物分析技术领域,尤其是涉及基于生物云平台的lncRNA与mRNA关联分析系统。
背景技术
近年来高通量测序在基础科研领域中的应用情境被不断拓宽,且随着测序成本的下降,测序数据量越来越大。由于测序数据分析存在专业门槛,因此将数据分析需求外包是科研院所采用的主流方式。目前,市面上的数据分析服务需要生物信息分析服务公司的专业生物信息人员来配置分析脚本和参数来完成测序数据分析。而分析结果一般以标准化分析报告的形式展现给客户(即一个数据压缩包文件),标准化报告中的数据分析参数以及图表不可调整修改。但基础科研并非完全流线型式的标准化过程,千篇一律的标准化报告无法满足客户的所有需求。客户在得到基础标准化分析报告的基础上,往往需要基于研究目的和背景,对报告中的参数进行优化,对报告中的图表进行调整修改,以求完成数据的个性化解析。这种个性化的分析结果调整,本身具有专业门槛,一般需要将个性分析需求返回生物信息服务公司,由专业生物信息分析人员进行结果调整。但这一过程需要双方多次沟通,费时费力,效率低下。基于这个行业痛点,目前上具备自主开发能力的生物信息服务公司,一般会开发可视化的在线数据分析平台,利于客户自主完成对数据调整修改,降低售后成本,提高项目执行效率。
lncRNA是近年来基础科研领域的研究热点。lncRNA本身不编码蛋白质,最常见的功能是通过调控mRNA参与细胞内的基因调控网络,从而行使特定的生物学功能。因此,对于lncRNA的测序数据分析,lncRNA与mRNA的关联分析尤为重要。但目前市面上的在线分析平台一般单独针对lncRNA或mRNA进行分析,将两类分子的分析过程分离,尚缺乏两类分子关联分析的在线分析平台。这样的设计虽然降低了数据分析平台的开发难度,却不利于客户以mRNA为线索挖掘lncRNA的功能。基于这一行业痛点,我们开发了lncRNA与mRNA关联分析的在线数据可视化分析平台。这一平台将协助科研院所非生物信息背景的从业者,自主完成lncRNA和mRNA关联分析结果的个性化解析。
发明内容
有鉴于此,有必要针对上述的问题,提供基于生物云平台的lncRNA与mRNA关联分析系统,对lncRNA与mRNA进行在线关联分析,且实现了前端图表数据实时交互及参数一键修改,提高了分析效率和个性化程度,使得分析结果更加直观。
为实现上述目的,本发明是根据以下技术方案实现的:
基于生物云平台的lncRNA与mRNA关联分析系统,所述系统包括客户端和后台数据处理中心;
所述后台数据处理中心包括服务器端程序和数据库模块、分布式计算集群管理模块、数据分析处理模块、数据分析工具模块;
所述客户端连接所述服务器端程序和数据库模块,用于实现用户权限管理及前端界面交互;
所述服务器端程序和数据库模块,用于感应接收客户端的请求和数据存储,并将客户端请求传输至分布式计算集群管理模块进行进一步处理;
所述分布式计算集群管理模块,用于集群的状态监控、资源调度、任务管理、队列管理;
所述数据分析处理模块,包括lncRNA分析模块、mRNA分析模块、lncRNA-mRNA关联分析模块,分别用于进行lncRNA分析、mRNA分析、lncRNA-mRNA关联分析;
所述数据分析工具模块包括生物信息学流程分析软件,根据客户端需求灵活组织生物信息学软件进行分析,并将用户的数据分析请求转化为计算任务,提交到分布式计算集群管理模块进行计算。
进一步地,所述客户端实现的功能包括:用户的注册和登录、用户提交数据的上传、参数一键式调整、图表交互式结果页面的展示、结果导出和下载。
进一步地,所述参数一键式调整,包括:图形颜色、图片标题、更换阈值、样本名称的自定义修改;
进一步地,所述参数一键式调整、图表交互式结果页面的展示,具体为:包括lncRNA分析内容、mRNA分析内容、lncRNA-mRNA关联分析内容三个部分,用户通过在客户端界面直接进行参数调整、或者直接勾选表格中不同数据或者参数,则可在客户端界面上得到对应结果的图形展示,实现数据结果可视化。
进一步地,所述lncRNA分析模块包括lncRNA集筛选单元,样本关系分析单元,差异分析单元,目标lncRNA分析单元,任务查看单元;
所述lncRNA集筛选单元,用于根据各样本已知基因的表达量和注释结果,一键式筛选编辑部分lncRNA集;
所述样本关系分析单元,用于将样本进行分组以及进行样本间关系分析;
所述差异分析单元,用于对比较组样本的lncRNA进行表达量差异基本分析,包括柱状图分析、热图分析、小提琴图分析、火山图分析、雷达图分析,以及对不同比较组中的共有和特有的目标基因以韦恩图形式展示;
所述目标lncRNA分析单元,用于基于差异分析单元的结果,挑选出目标差异lncRNA基因集绘制目标差异lncRNA韦恩图、热图,以及进行趋势分析;
所述任务查看单元,用于查看对应任务。
进一步地,所述mRNA分析模块包括基因集筛选单元,样本关系分析单元,差异分析单元,目标基因分析单元,任务查看单元。
进一步地,所述lncRNA-mRNA关联分析模块包括:基因/lncRNA集筛选单元、antisense单元、cis单元、trans单元;
所述基因/lncRNA集筛选单元包括mRNA和lncRNA的所有表格,用于对基因/lncRNA集进行一键式筛选编辑,还可合并基因/lncRNA集。
具体地,所述antisense单元可实现对antisense lncRNA与mRNA之间的作用进行预测的功能,包括以下三方面的分析:
关系统计:使用柱形图展示antisense lncRNA与mRNA靶基因对的数量,以及对应的lncRNA和mRNA数目;
mRNA热图:根据mRNA的表达量绘制靶基因在不同样本/比较组中的表达量热图,展示antisense lncRNA的靶基因在不同比较组或样品中的表达量;
lncRNA热图:根据lncRNA在不同样本/比较组中的表达量绘制热图,展示antisense lncRNA在不同比较组或样品中的表达量。
具体地,所述cis单元可实现对lncRNA与mRNA之间的cis作用进行预测的功能,包括以下三方面的分析:
关系统计:使用柱形图展示具有cis作用的lncRNA与mRNA靶基因对的数量,以及对应的lncRNA和mRNA数目;
mRNA热图:根据mRNA的表达量绘制靶基因在不同样本/比较组中的表达量热图,展示具有cis作用的lncRNA的靶基因在不同比较组或样品中的表达量;
lncRNA热图:根据lncRNA在不同样本/比较组中的表达量绘制热图,展示具有cis作用的lncRNA在不同比较组或样品中的表达量。
具体地,所述trans单元可实现通过样本间lncRNA与蛋白编码基因的表达量相关性分析或共表达分析方法来预测其靶基因的功能,包括以下四方面的分析:
关系统计:使用柱形图展示具有trans作用的lncRNA与靶基因对的数量,以及对应的lncRNA和mRNA数目;
网络图:根据样本间lncRNA与蛋白编码基因的表达量,绘制有trans关系的lncRNA和mRNA网络图;
mRNA热图:根据mRNA的表达量绘制靶基因在不同样本/比较组中的表达量热图,展示具有trans作用的lncRNA的靶基因在不同比较组或样品中的表达量;
lncRNA热图:根据lncRNA在不同样本/比较组中的表达量绘制热图,展示具有trans作用的lncRNA在不同比较组或样品中的表达量。
与现有技术相比,本发明的优点和积极效果至少包括:
(1)本发明不仅单独针对lncRNA或mRNA进行分析,而且还进行了lncRNA与mRNA的关联分析,包括三部分内容,其中每部分分析报告又包括差异分析、趋势分析、富集分析以及关联分析内容等,条理清楚,每一部分框架清晰,简洁明了,分析内容丰富。
(2)本发明的在线分析结果展示在客户端界面,当用户需要对分析结果进一步数据挖掘时候,用户只需在客户端界面一键式选择参数和做相应调整即可,本发明允许用户直接在客户端界面完成数据的个性化解析,利于用户自主完成数据参数调整修改,提高项目执行效率。
(3)本发明客户端所展示的分析结果具有交互式图表功能,本发明的在线报告的表格和图形是交互分析的,直接进行参数调整、或者直接勾选表格中的数据或者参数,即可得到对应的图形,从而提高了分析效率以及分析报告的可读性和可修改性,使得分析报告更加清晰,灵活修改也满足了用户的个性化解析需求。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明分析系统的整体框架示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
实施例1
lncRNA-seq测序针对样本中的lncRNA和mRNA进行高通量测序,将得到的reads比对到参考基因(组)上,计算出每个lncRNA和mRNA的表达量,可以根据样本设计进行lncRNA差异比较,与mRNA关联分析,从而找出与mRNA相关的lncRNA。
基于lncRNA-seq数据,进行在线分析,可以根据客户的需求获得定制化的结果,包括对选择的分组样本进行样本关系的分析、根据输入的lncRNA名称或功能筛选出lncRNA或序列信息、对比较组样本进行差异分析、对选定的lncRNA集或差异分析结果集目标lncRNA分析和关联分析。除此之外,还可以在前端进行韦恩图、趋势分析等。lncRNA数据研究涉及到数据挖掘和可视化的问题,本发明可以解决这两方面问题,通过对参数的设定和更改,获得实时交互的结果,对数据进行深入挖掘;在线报告还可以根据不同的需求,对图形样式、配色、坐标名称等细节进行修改,获得定制化的图形。
图1给出了本发明分析系统的整体框架示意图,如图1所示,本发明提供了基于生物云平台的lncRNA与mRNA关联分析系统,所述系统包括客户端和后台数据处理中心;
所述后台数据处理中心包括服务器端程序和数据库模块、分布式计算集群管理模块、数据分析处理模块、数据分析工具模块;
所述客户端连接所述服务器端程序和数据库模块,用于实现用户权限管理及前端界面交互;
所述服务器端程序和数据库模块,用于感应接收客户端的请求和数据存储,并将客户端请求传输至分布式计算集群管理模块进行进一步处理;
所述分布式计算集群管理模块,用于集群的状态监控、资源调度、任务管理、队列管理;
所述数据分析处理模块,包括lncRNA分析模块、mRNA分析模块、lncRNA-mRNA关联分析模块,分别用于进行lncRNA分析、mRNA分析、lncRNA-mRNA关联分析;
所述数据分析工具模块包括生物信息学流程分析软件,可以根据客户端需求灵活组织生物信息学软件进行分析,并将用户的数据分析请求转化为计算任务,提交到分布式计算集群管理模块,进行计算。
在本发明一种优选实施例中,流程分析后,参数调整、数据挖掘时只需在客户端前端界面操作即可完成,无需返回后台数据处理端,分析效率更高,分析内容更全面。
具体而言,所述客户端实现的功能包括:用户的注册和登录、用户提交数据的上传、参数一键式调整、图表交互式结果页面的展示、结果导出和下载。
进一步地,所述参数一键式调整,包括:图形颜色、图片标题、更换阈值、样本名称的自定义修改;
进一步地,所述参数一键式调整、图表交互式结果页面的展示,具体为:包括lncRNA分析内容、mRNA分析内容、lncRNA-mRNA关联分析内容三个部分,用户通过在客户端界面直接进行参数调整、或者直接勾选表格中不同数据或者参数,则可在客户端界面上得到对应结果的图形展示,实现数据结果可视化。
综合上述内容所述,本发明进行分析的大概工作流程为:用户通过用户端注册和登录,提交(lncRNA分析,mRNA分析,lncRNA-mRNA关联分析)数据分析请求,服务器端程序和数据库接收请求,进一步服务器端程序和数据库将请求传递到分布式计算集群管理进行分析,分析过程中也会借助数据分析工具,最终到分布式计算集群管理将分析图表结果,通过服务器端程序和数据库,在展示在用户分析界面。当用户需要对分析结果参数进行修改重新分析,进行进一步数据挖掘或者解析的时候,用户只需在前端界面选择参数和做相应调整即可。
实施例2
对于lncRNA的测序数据分析,本发明不仅单独针对lncRNA或mRNA进行分析,而且还进行了lncRNA与mRNA的关联分析。
具体而言,上述lncRNA分析模块包括lncRNA集筛选单元,样本关系分析单元,差异分析单元,目标lncRNA分析单元,任务查看单元。
所述lncRNA集筛选单元,用于根据各样本已知基因的表达量和注释结果,一键式筛选编辑部分lncRNA集;
本发明一种优选实施例中,所述lncRNA集筛选单元可实现lncRNA集筛选,删除lncRNA集,重新生成lncRNA集,新增lncRNA集,合并lncRNA集等功能。
所述样本关系分析单元,用于将样本进行分组以及进行样本间关系分析;目的在于基于各样本已知基因的表达量结果,通过PCA分析、计算样本间pearson相关系数、样本关系聚类和样本间相关性分析、样本关系韦恩图、小提琴图等,以上分析内容在系统客户端界面为图表交互模式呈现,用户可以了解样本之间的重复性情况,也可根据图上样本展示情况,一键式勾选或剔除表中样本,进而图上会实时发生展示变化,辅助排除离群样本。
本发明一种优选实施例中,以PCA为例,发现CSK样本分组中可能存在离群样本,可通过取消对CSK1离群样本数据列表的勾选,进而图形会实时发生变化,实现一键式分析样本数据选择和实时结果呈现;除上述所述的数据勾选图形变化外,图形的参数,样本名称等也可根据用户需要一键式切换筛选:客户端界面点击不同的基因集(即不同的“颜色模块”),下方数据列表将会同步实时自动展示出对应的lncRNA基因及基因在每个样本之间的表达情况;也可同时选择多个“颜色模块”,下方数据列表将展示出多个“颜色模块”的基因情况及基因在每个样本之间的表达情况。
所述差异分析单元,用于对比较组样本的lncRNA进行表达量差异基本分析,包括柱状图分析、热图分析、小提琴图分析、火山图分析、雷达图分析,以及对不同比较组中的共有和特有的目标基因以韦恩图形式展示。具体操作为:差异基本分析:输入数据为基因表达水平分析中得到的reads count数据,使用edgeR和Deseq2软件分析,包括对reads count标准化,计算P值和FDR值;差异韦恩图:用R语言的VennDiagram包和UpSetR包绘制差异韦恩图,韦恩图可以快速寻找不同比较组中的共有基因和特有lncRNA。(此处的差异分析采用不同图形展示方式,对基础科研来讲,不同图形展示可发现不同实验背景下的科研意义,因此本技术方案在图形展示和各种参数切换方面的交互,前端实时性交互强,对依赖数据结果的基础科研而言,挖掘和分析结果是极为重要的。)
本发明一种优选实施例中,在客户端界面上,差异分析单元更换阈值绘图可一键式修改(差异基本分析和差异韦恩图分析都有此项功能),可以一键式选择是选P值还是Q值,是选上调差异倍数或下调差异倍数或者上下调都选,修改更换阈值后,可点击重新绘图,实现重新绘图。
所述目标lncRNA分析单元,用于基于差异分析单元的结果,挑选出目标差异lncRNA基因集绘制目标差异lncRNA韦恩图、热图,以及进行趋势分析;具体为:根据目标lncRNA在样本中的表达量绘制热图,展示lncRNA在样本中的变化情况;趋势分析为针对多个连续型样本(至少3个)的特点(样本间包含特定的时间、空间或处理剂量大小顺序)而对lncRNA的表达模式(在多阶段中表达曲线的形状)进行聚类,可以从聚类结果中挑选符合一定生物学特性(如表达量持续上升)的lncRNA集。
所述任务查看单元,用于查看对应任务。点击分析名称,即可跳转到对应任务中。
实施例3
进一步地,所述mRNA分析模块包括基因集筛选单元,样本关系分析单元,差异分析单元,目标基因分析单元,任务查看单元。
上述各单元与lncRNA分析模块中的各单元作用基本一致,具体为:
所述基因集筛选单元,用于根据各样本已知基因的表达量和注释结果,一键式筛选编辑部分mRNA集;
所述样本关系分析单元,用于将样本进行分组以及进行样本间关系分析;
所述差异分析单元,用于对比较组样本的mRNA进行表达量差异基本分析,包括柱状图分析、热图分析、小提琴图分析、火山图分析、雷达图分析,以及对不同比较组中的共有和特有的目标基因以韦恩图形式展示;
所述目标基因分析单元,用于基于差异分析单元的结果,挑选出目标差异mRNA基因集绘制目标差异mRNA韦恩图、热图,以及进行趋势分析;
所述任务查看单元,用于查看对应任务。
实施例4
lncRNA分析模块和mRNA分析模块的报告中生成的目标基因表格,会同步在关联报告中。lncRNA-mRNA关联报告包括mRNA和lncRNA的所有表格;lncRNA与mRNA主要有三种关系:(1)Antisense:与mRNA反义互补,调控基因沉默、转录及mRNA的稳定性;(2)Cis:lncRNA的功能与其邻近的蛋白编码基因相关;(3)Trans:lncRNA跟编码基因距离太远,没有了位置关系,但是存在表达量上的正相关或负相关关系。
具体而言,在本发明中,所述lncRNA-mRNA关联分析模块包括:基因/lncRNA集筛选单元、antisense单元、cis单元、trans单元;
所述基因/lncRNA集筛选单元包括mRNA和lncRNA的所有表格,用于对基因/lncRNA集进行一键式筛选编辑,还可合并基因/lncRNA集。即所述基因/lncRNA集筛选单元包括基因/lncRNA集名称,类别,对应分组等信息;为lncRNA集筛选单元与基因集筛选单元的数据结果,可查看基因/lncRNA集在lncRNA集筛选单元和基因集筛选单元中设置的参数情况;也可通过勾选数据列表中的相关数据,筛选及重新生成基因/lncRNA集和表达量表;更重要的,还可合并基因/lncRNA集。
完成基因/lncRNA集筛选后,对筛选的基因/lncRNA集进行一键式选择,进行以下三方面的关联分析:
其一,所述antisense单元可实现对antisense lncRNA与mRNA之间的作用进行预测的功能,包括以下三方面的分析:
关系统计:使用柱形图展示antisense lncRNA与mRNA靶基因对的数量,以及对应的lncRNA和mRNA数目;
mRNA热图:根据mRNA的表达量绘制靶基因在不同样本/比较组中的表达量热图,展示antisense lncRNA的靶基因在不同比较组或样品中的表达量;
lncRNA热图:根据lncRNA在不同样本/比较组中的表达量绘制热图,展示antisense lncRNA在不同比较组或样品中的表达量。
其二,所述cis单元可实现对lncRNA与mRNA之间的cis作用进行预测的功能,包括以下三方面的分析:
关系统计:使用柱形图展示具有cis作用的lncRNA与mRNA靶基因对的数量,以及对应的lncRNA和mRNA数目;
mRNA热图:根据mRNA的表达量绘制靶基因在不同样本/比较组中的表达量热图,展示具有cis作用的lncRNA的靶基因在不同比较组或样品中的表达量;
lncRNA热图:根据lncRNA在不同样本/比较组中的表达量绘制热图,展示具有cis作用的lncRNA在不同比较组或样品中的表达量。
其三,所述trans单元可实现通过样本间lncRNA与蛋白编码基因的表达量相关性分析或共表达分析方法来预测其靶基因的功能,包括以下四方面的分析:
关系统计:使用柱形图展示具有trans作用的lncRNA与靶基因对的数量,以及对应的lncRNA和mRNA数目;
网络图:根据样本间lncRNA与蛋白编码基因的表达量,绘制有trans关系的lncRNA和mRNA网络图;
mRNA热图:根据mRNA的表达量绘制靶基因在不同样本/比较组中的表达量热图,展示具有trans作用的lncRNA的靶基因在不同比较组或样品中的表达量;
lncRNA热图:根据lncRNA在不同样本/比较组中的表达量绘制热图,展示具有trans作用的lncRNA在不同比较组或样品中的表达量。
需要说明的是,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
与现有技术相比,本发明的优点和积极效果至少包括:
(1)本发明不仅单独针对lncRNA或mRNA进行分析,而且还进行了lncRNA与mRNA的关联分析,包括三部分内容,其中每部分分析报告又包括差异分析、趋势分析、富集分析以及关联分析内容等,条理清楚,每一部分框架清晰,简洁明了,分析内容丰富。
(2)本发明的在线分析结果展示在客户端界面,当用户需要对分析结果进一步数据挖掘时候,用户只需在客户端界面一键式选择参数和做相应调整即可,本发明允许用户直接在客户端界面完成数据的个性化解析,利于用户自主完成数据参数调整修改,提高项目执行效率。
(3)本发明客户端所展示的分析结果具有交互式图表功能,本发明的在线报告的表格和图形是交互分析的,直接进行参数调整、或者直接勾选表格中的数据或者参数,即可得到对应的图形,从而提高了分析效率以及分析报告的可读性和可修改性,使得分析报告更加清晰,灵活修改也满足了用户的个性化解析需求。
下表列出了本技术领域中现有技术与本发明所述技术方案的部分对比,用以辅助说明本发明的技术方案的优越性。需要说明的是,下表中所列的区别技术特征点仅为本发明与现有技术的部分区别点,而不能理解为对本发明与现有技术区别技术特征点的限制,也不能理解为对本发明专利保护范围的限制。应当指出的是,本发明与现有技术区别技术特征点应包括所附权利要求与现有技术的所有区别特征,本发明的保护范围应以所附权利要求为准。
表1本发明与现有技术的技术方案部分对比
Figure BDA0002619256900000121
上表中所述现有技术一可参照专利:基于云计算平台的有参考基因组的转录组项目的交互式分析系统及方法(CN107368704A),RNA测序数据处理的方法和装置(CN104504302A),无参转录组分析系统及方法(CN105653900A),以及其他相关专利;所述现有技术二可参照北京百迈客生物科技有限公司于2015年12月25日所申请的发明专利:基于生物云平台的lncRNA分析系统及方法(CN201510996788),以及其他相关专利。
从上表中可以看出,现有技术对lncRNA、mRNA的分析报告内容比较多,逻辑不清,且报告不够动态,大部分参数不能调整,表格和图形不能够交互分析。本发明在线报告内容丰富:报告差异分析、趋势分析、富集分析以及关联分析内容。条理清楚,每一部分框架清晰,简洁明了。
现有技术不包含单独的lncRNA-mRNA关联分析结果,本发明包括lncRNA-mRNA关联分析结果,关联分析部分是单独的模块,包括三部分内容,其中共表达网络图可以进行多方面调整。
现有技术表格和图形不可交互,有的分析结果不存在图形绘制的结果。本发明的在线报告的表格和图形是交互分析的。勾选表格中的数据或者参数,即可得到对应的图形。如:市面大多同类产品只有图形颜色和图片标题可以修改,其他参数均不能修改;在线报告所有的图形均可以进行参数修改,还包括自定义更换阈值、样本名称修改等参数,每部分可修改的参数大于20个。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述系统包括客户端和后台数据处理中心;
所述后台数据处理中心包括服务器端程序和数据库模块、分布式计算集群管理模块、数据分析处理模块、数据分析工具模块;
所述客户端连接所述服务器端程序和数据库模块,用于实现用户权限管理及前端界面交互;
所述服务器端程序和数据库模块,用于感应接收客户端的请求和数据存储,并将客户端请求传输至分布式计算集群管理模块进行进一步处理;
所述分布式计算集群管理模块,用于集群的状态监控、资源调度、任务管理、队列管理;
所述数据分析处理模块,包括lncRNA分析模块、mRNA分析模块、lncRNA-mRNA关联分析模块,分别用于进行lncRNA分析、mRNA分析、lncRNA-mRNA关联分析;
所述数据分析工具模块包括生物信息学流程分析软件,根据客户端需求灵活组织生物信息学软件进行分析,并将用户的数据分析请求转化为计算任务,提交到分布式计算集群管理模块进行计算。
2.根据权利要求1所述的基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述客户端实现的功能包括:用户的注册和登录、用户提交数据的上传、参数一键式调整、图表交互式结果页面的展示、结果导出和下载。
3.根据权利要求2所述的基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述参数一键式调整,包括:图形颜色、图片标题、更换阈值、样本名称的自定义修改。
4.根据权利要求2所述的基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述参数一键式调整、图表交互式结果页面的展示,具体为:包括lncRNA分析内容、mRNA分析内容、lncRNA-mRNA关联分析内容三个部分,用户通过在客户端界面直接进行参数调整、或者直接勾选表格中不同数据或者参数,则可在客户端界面上得到对应结果的图形展示,实现数据结果可视化。
5.根据权利要求1所述的基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述lncRNA分析模块包括lncRNA集筛选单元,样本关系分析单元,差异分析单元,目标lncRNA分析单元,任务查看单元;
所述lncRNA集筛选单元,用于根据各样本已知基因的表达量和注释结果,一键式筛选编辑部分lncRNA集;
所述样本关系分析单元,用于将样本进行分组以及进行样本间关系分析;
所述差异分析单元,用于对比较组样本的lncRNA进行表达量差异基本分析,包括柱状图分析、热图分析、小提琴图分析、火山图分析、雷达图分析,以及对不同比较组中的共有和特有的目标基因以韦恩图形式展示;
所述目标lncRNA分析单元,用于基于差异分析单元的结果,挑选出目标差异lncRNA基因集绘制目标差异lncRNA韦恩图、热图,以及进行趋势分析;
所述任务查看单元,用于查看对应任务。
6.根据权利要求1所述的基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述mRNA分析模块包括基因集筛选单元,样本关系分析单元,差异分析单元,目标基因分析单元,任务查看单元。
7.根据权利要求1所述的基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述lncRNA-mRNA关联分析模块包括:基因/lncRNA集筛选单元、antisense单元、cis单元、trans单元;
所述基因/lncRNA集筛选单元包括mRNA和lncRNA的所有表格,用于对基因/lncRNA集进行一键式筛选编辑,还可合并基因/lncRNA集。
8.根据权利要求7所述的基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述antisense单元可实现对antisense lncRNA与mRNA之间的作用进行预测的功能,包括以下三方面的分析:
关系统计:使用柱形图展示antisense lncRNA与mRNA靶基因对的数量,以及对应的lncRNA和mRNA数目;
mRNA热图:根据mRNA的表达量绘制靶基因在不同样本/比较组中的表达量热图,展示antisense lncRNA的靶基因在不同比较组或样品中的表达量;
lncRNA热图:根据lncRNA在不同样本/比较组中的表达量绘制热图,展示antisenselncRNA在不同比较组或样品中的表达量。
9.根据权利要求7所述的基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述cis单元可实现对lncRNA与mRNA之间的cis作用进行预测的功能,包括以下三方面的分析:
关系统计:使用柱形图展示具有cis作用的lncRNA与mRNA靶基因对的数量,以及对应的lncRNA和mRNA数目;
mRNA热图:根据mRNA的表达量绘制靶基因在不同样本/比较组中的表达量热图,展示具有cis作用的lncRNA的靶基因在不同比较组或样品中的表达量;
lncRNA热图:根据lncRNA在不同样本/比较组中的表达量绘制热图,展示具有cis作用的lncRNA在不同比较组或样品中的表达量。
10.根据权利要求7所述的基于生物云平台的lncRNA与mRNA关联分析系统,其特征在于,所述trans单元可实现通过样本间lncRNA与蛋白编码基因的表达量相关性分析或共表达分析方法来预测其靶基因的功能,包括以下四方面的分析:
关系统计:使用柱形图展示具有trans作用的lncRNA与靶基因对的数量,以及对应的lncRNA和mRNA数目;
网络图:根据样本间lncRNA与蛋白编码基因的表达量,绘制有trans关系的lncRNA和mRNA网络图;
mRNA热图:根据mRNA的表达量绘制靶基因在不同样本/比较组中的表达量热图,展示具有trans作用的lncRNA的靶基因在不同比较组或样品中的表达量;
lncRNA热图:根据lncRNA在不同样本/比较组中的表达量绘制热图,展示具有trans作用的lncRNA在不同比较组或样品中的表达量。
CN202010778211.3A 2020-08-05 2020-08-05 基于生物云平台的lncRNA与mRNA关联分析系统 Pending CN111883204A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010778211.3A CN111883204A (zh) 2020-08-05 2020-08-05 基于生物云平台的lncRNA与mRNA关联分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010778211.3A CN111883204A (zh) 2020-08-05 2020-08-05 基于生物云平台的lncRNA与mRNA关联分析系统

Publications (1)

Publication Number Publication Date
CN111883204A true CN111883204A (zh) 2020-11-03

Family

ID=73210639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010778211.3A Pending CN111883204A (zh) 2020-08-05 2020-08-05 基于生物云平台的lncRNA与mRNA关联分析系统

Country Status (1)

Country Link
CN (1) CN111883204A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112967757A (zh) * 2021-04-06 2021-06-15 广州基迪奥生物科技有限公司 一种环状rna测序数据在线交互分析系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112967757A (zh) * 2021-04-06 2021-06-15 广州基迪奥生物科技有限公司 一种环状rna测序数据在线交互分析系统

Similar Documents

Publication Publication Date Title
CN105447336B (zh) 基于生物云平台的微生物多样性分析系统
CN107368700A (zh) 基于计算云平台的微生物多样性交互分析系统及其方法
US20200257927A1 (en) Data Analyzing Device
US20060047697A1 (en) Microarray database system
CN104572775B (zh) 广告分类方法、装置及服务器
CN104484558A (zh) 生物信息项目的分析报告自动生成方法及系统
CN115730605B (zh) 基于多维信息的数据分析方法
CN113761334A (zh) 一种可视化推荐方法、装置、设备和存储介质
CN112541635A (zh) 业务数据统计预测方法、装置、计算机设备及存储介质
CN112185468A (zh) 一种用于基因数据分析和处理的云端管理系统及方法
CN115472298A (zh) 基于ai的高通量测序数据智能分析系统及方法
CN111883204A (zh) 基于生物云平台的lncRNA与mRNA关联分析系统
CN109447694B (zh) 一种用户特征分析方法及其系统
CN112397146B (zh) 一种基于云平台的微生物组学数据交互分析系统
CN112328951B (zh) 一种分析样品的实验数据的处理方法
CN109918069B (zh) 应用于工业互联网的交互界面生成方法及系统
CN113434568A (zh) 一种多源数据处理方法、装置、智能终端及存储介质
CN106934480A (zh) 投保等级分析方法、服务器及终端
CN110471586B (zh) 项目推荐方法、装置、计算机设备和存储介质
CN114511372A (zh) 一种智能数据处理方法
CN110008427B (zh) 一种整合多组学知识库的交互式生物信息云分析平台
CN113076480A (zh) 页面推荐方法、装置、电子设备及介质
CN111080150A (zh) 生产数据分析方法、装置、设备及介质
CN110765119A (zh) 客户趋势变化呈现方法、装置及计算机可读存储介质
CN111984637A (zh) 数据建模中的缺失值处理方法和装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201103

RJ01 Rejection of invention patent application after publication