CN105279392B - 一种基于云平台的大数据分析装置 - Google Patents

一种基于云平台的大数据分析装置 Download PDF

Info

Publication number
CN105279392B
CN105279392B CN201510626221.4A CN201510626221A CN105279392B CN 105279392 B CN105279392 B CN 105279392B CN 201510626221 A CN201510626221 A CN 201510626221A CN 105279392 B CN105279392 B CN 105279392B
Authority
CN
China
Prior art keywords
analysis
data
module
analysis result
process frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510626221.4A
Other languages
English (en)
Other versions
CN105279392A (zh
Inventor
李国庆
陈刚
芦长欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Technology Solutions Co Ltd
Original Assignee
BGI Technology Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Technology Solutions Co Ltd filed Critical BGI Technology Solutions Co Ltd
Priority to CN201510626221.4A priority Critical patent/CN105279392B/zh
Publication of CN105279392A publication Critical patent/CN105279392A/zh
Application granted granted Critical
Publication of CN105279392B publication Critical patent/CN105279392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于云平台的大数据分析装置,包括云服务模块,获取生物数据,并存储获取的生物数据;数据匹配模块,动态设定关键词,从云服务模块中采集与设定的关键词相匹配的生物数据;数据分类模块,对采集的生物数据进行分类,并存储到相应的数据库中;数据分析模块,将数据库中存储的生物数据依次进行信息分析、领域分析、关系挖掘分析,得到分析结果和分析流程框架,并依据分析结果建立数据索引表;显示模块,调用得到的分析结果和分析流程框架,显示分析结果和分析流程框架,并将分析结果和分析流程框架上传至云服务模块。采用本发明实施例,分析效率高,分析结果清晰,易读性好,且便于用户分享。

Description

一种基于云平台的大数据分析装置
技术领域
本发明涉及数据分析领域,尤其涉及一种基于云平台的大数据分析装置。
背景技术
随着人类社会的不断发展,生命科技相关各行业越来越受到人们的关注,它包括一系列的重要动植物、人类健康、微生物、海洋生物、生物能源等基因组的研究,基因科技可以造福人类,促进生物经济产业的蓬勃发展。这些主要涉及基因、蛋白质测序等工作,目前的基因、蛋白质测序等工作中,在测序、数据整理等工作完成后,需要对大量的生物数据进行分析,并将分析结果提交给用户,但现有的数据分析装置分析效率不高,不能得到分析流程框架,得到的分析结果单一,且不便于分享。
发明内容
本发明实施例提出一种基于云平台的大数据分析装置,通过该装置将获取的生物数据进行分析归类,并将分析结果和分析流程框架上传至云服务模块,分析效率高,分析结果清晰,易读性好,且便于用户分享。
本发明实施例提供一种基于云平台的大数据分析装置,包括云服务模块、数据匹配模块、数据分类模块、数据分析模块、显示模块;
所述云服务模块,获取生物数据,并存储获取的生物数据;
所述数据匹配模块,动态设定关键词,从所述云服务模块中采集与设定的关键词相匹配的生物数据;
所述数据分类模块,对采集的生物数据进行分类,并存储到相应的数据库中;
所述数据分析模块,将所述数据库中存储的生物数据依次进行信息分析、领域分析、关系挖掘分析,得到分析结果和分析流程框架,并依据所述分析结果建立数据索引表;
所述显示模块,调用得到的所述分析结果和所述分析流程框架,显示所述分析结果和所述分析流程框架,并将所述分析结果和所述分析流程框架上传至所述云服务模块。
进一步的,当用户输入关键词时,首先检索输入的关键词是否存在于所述数据索引表中;若存在,则从所述云服务模块中直接调用与所述输入的关键词相关联的所述分析结果和所述分析流程框架,并显示所述分析结果和所述分析流程框架;若不存在,则根据所述输入的关键词执行数据分析流程。
又进一步的,所述分析结果的显示类型为饼状图、柱状图、表格。
更进一步的,所述分析结果和所述分析流程框架还通过所述云服务模块导出或定时发送到用户的手机或邮箱中。
本发明实施例提供的基于云平台的大数据分析装置,通过获取并存储生物数据,采集与设定的关键词相匹配的生物数据,对其进行分类后存储到相应的数据库中,然后对其依次进行信息分析、领域分析、关系挖掘分析,并依据分析结果建立数据索引表,显示分析结果和分析流程框架,并将分析结果和分析流程框架上传至云服务模块。所述的数据分析装置能够有效地对生物数据进行分析归类,分析效率高;在给出分析结果的同时给出相关的分析流程框架,使分析结果清晰,易读性好;最终将分析结果和分析流程框架上传到云服务模块,便于用户在其科研团队内分享,提高协作分析的效率。
附图说明
图1是本发明提供的基于云平台的大数据分析装置的实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明提供的基于云平台的大数据分析装置的实施例的结构示意图。
本发明实施例提供一种基于云平台的大数据分析装置,包括云服务模块11、数据匹配模块12、数据分类模块13、数据分析模块14、显示模块15;
所述云服务模块11,获取生物数据,并存储获取的生物数据;
所述云服务模块11负责从一个或多个基因测序装置或其他生物测量仪器中获取生物数据,并将获取的生物数据存储在所述云服务模块11中以供调用。
所述生物数据包括基因组学、转录组学、蛋白质组学、代谢组学等生物学数据。
在具体实施当中,可以直接从基因测序装置或其他生物测量仪器中获取生物数据,也可以通过常规的计算机显示器和键盘输入试验样品的数据结果,即获取了生物数据。
所述数据匹配模块12,动态设定关键词,从所述云服务模块11中采集与设定的关键词相匹配的生物数据;
根据初始设定的关键词,从获取的生物数据中采集与设定的关键词相匹配的生物数据,从大量的原始生物数据中提取出有用的数据,抛弃无用的数据,减少后续分析操作所需处理的数据量,提高数据处理的效率。
所述数据分类模块13,对采集的生物数据进行分类,并存储到相应的数据库中;
采集相匹配的数据后,对相匹配的数据根据生物数据的分类方法进行分类,并按类别将分类后的生物数据存储到相应的数据库中。
需要说明的是,数据库需提供某种形式的冗余以在故障的情况下确保数据整体性和系统可靠性。且数据库应确保快速的存储速率,因为当大量数据被传输到数据库中时,数据库需要应对大量的数据存储,数据库的存储速率应大于数据被采集的速率。
所述数据分析模块14,将所述数据库中存储的生物数据依次进行信息分析、领域分析、关系挖掘分析,得到分析结果和分析流程框架,并依据所述分析结果建立数据索引表;
针对不同类别数据库中的生物数据,分别进行有针对性的信息分析、领域分析、关系挖掘分析,得到对应的分析结果和分析流程框架,并针对相应的分析过程建立数据索引表,以便于用户对分析结果和分析流程框架进行查找,提高查找的效率。
所述显示模块15,调用得到的所述分析结果和所述分析流程框架,显示所述分析结果和所述分析流程框架,并将所述分析结果和所述分析流程框架上传至所述云服务模块11。
优选的,所述分析结果的显示类型为饼状图、柱状图、表格。
需要说明的是,本实施例仅以所述分析结果的显示类型是饼状图、柱状图、表格为例进行说明,所述分析结果的显示类型还可以是文字、数字、符号或其他形式。
优选的,所述分析结果和所述分析流程框架还通过所述云服务模块11导出或定时发送到用户的手机或邮箱中。
分析过程结束后,需要将分析结果和分析流程框架提交给用户,可以通过在显示器上显示的方式或打印的方式将分析结果和分析流程框架显示出来,并将分析结果和分析流程框架上传至云服务模块11,然后可以通过所述云服务模块11导出或定时发送到用户的手机或邮箱中。
本装置还提供了数据、项目共享的功能,可以通过开通权限的方式,用户科研团队的其他成员访问云服务模块11获得分析结果和分析流程框架,并控制共享的程度(可读、可写、可执行等),这样更有利于科研团队的协作分析。
进一步的,当用户输入关键词时,首先检索输入的关键词是否存在于所述数据索引表中;若存在,则从所述云服务模块11中直接调用与所述输入的关键词相关联的所述分析结果和所述分析流程框架,并显示所述分析结果和所述分析流程框架;若不存在,则根据所述输入的关键词执行数据分析流程。
当用户输入关键词对分析结果进行检索,首先在分析过程完成后得到的数据索引表中查找输入的关键词,如果输入的关键词存在于现有的数据索引表中,则从云服务模块11中直接调用与所述关键词相关联的分析结果和分析流程框架,并将相关联的分析结果和分析流程框架显示给用户,还可通过云服务模块11导出或定时发送到用户的手机或邮箱中;如果在现有的数据索引表中找不到输入的关键词,则会重新执行数据分析流程,对与输入的关键词相关联的生物数据执行分析过程。
本发明实施例提供的基于云平台的大数据分析装置,通过获取并存储生物数据,采集与设定的关键词相匹配的生物数据,对其进行分类后存储到相应的数据库中,然后对其依次进行信息分析、领域分析、关系挖掘分析,并依据分析结果建立数据索引表,显示分析结果和分析流程框架,并将分析结果和分析流程框架上传至云服务模块。所述的数据分析装置能够有效地对生物数据进行分析归类,分析效率高;在给出分析结果的同时给出相关的分析流程框架,使分析结果清晰,易读性好;最终将分析结果和分析流程框架上传到云服务模块,便于用户在其科研团队内分享,提高协作分析的效率。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (4)

1.一种基于云平台的大数据分析装置,其特征在于,包括云服务模块、数据匹配模块、数据分类模块、数据分析模块、显示模块;
所述云服务模块,获取生物数据,并存储获取的生物数据;
所述数据匹配模块,动态设定关键词,从所述云服务模块中采集与设定的关键词相匹配的生物数据;
所述数据分类模块,对采集的生物数据进行分类,并存储到相应的数据库中;
所述数据分析模块,将所述数据库中存储的生物数据依次进行信息分析、领域分析、关系挖掘分析,得到分析结果和分析流程框架,并依据所述分析结果建立数据索引表;其中,针对不同类别数据库中的生物数据,分别进行所述信息分析、领域分析、关系挖掘分析,得到对应的分析结果和分析流程框架,并针对相应的分析过程得到的分析结果建立数据索引表;
所述显示模块,调用得到的所述分析结果和所述分析流程框架,显示所述分析结果和所述分析流程框架,并将所述分析结果和所述分析流程框架上传至所述云服务模块。
2.如权利要求1所述的基于云平台的大数据分析装置,其特征在于,当用户输入关键词时,首先检索输入的关键词是否存在于所述数据索引表中;
若存在,则从所述云服务模块中直接调用与所述输入的关键词相关联的所述分析结果和所述分析流程框架,并显示所述分析结果和所述分析流程框架;
若不存在,则根据所述输入的关键词执行数据分析流程。
3.如权利要求1所述的基于云平台的大数据分析装置,其特征在于,所述分析结果的显示类型为饼状图、柱状图、表格。
4.如权利要求1所述的基于云平台的大数据分析装置,其特征在于,所述分析结果和所述分析流程框架还通过所述云服务模块导出或定时发送到用户的手机或邮箱中。
CN201510626221.4A 2015-09-28 2015-09-28 一种基于云平台的大数据分析装置 Active CN105279392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510626221.4A CN105279392B (zh) 2015-09-28 2015-09-28 一种基于云平台的大数据分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510626221.4A CN105279392B (zh) 2015-09-28 2015-09-28 一种基于云平台的大数据分析装置

Publications (2)

Publication Number Publication Date
CN105279392A CN105279392A (zh) 2016-01-27
CN105279392B true CN105279392B (zh) 2018-07-24

Family

ID=55148395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510626221.4A Active CN105279392B (zh) 2015-09-28 2015-09-28 一种基于云平台的大数据分析装置

Country Status (1)

Country Link
CN (1) CN105279392B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105706088A (zh) * 2016-01-31 2016-06-22 深圳市博信诺达经贸咨询有限公司 大数据的应用方法及系统
CN106027539A (zh) * 2016-05-30 2016-10-12 成都云材智慧数据科技有限公司 一种材料源数据设备及分布式材料数据搜集系统
CN106067084A (zh) * 2016-05-30 2016-11-02 成都云材智慧数据科技有限公司 一种材料信息云服务系统
CN105930682A (zh) * 2016-06-16 2016-09-07 成都才智圣有科技有限责任公司 数据分析装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164405A (zh) * 2011-12-08 2013-06-19 盛乐信息技术(上海)有限公司 相关视频数据库生成方法、相关视频推荐方法及系统
CN103440139A (zh) * 2013-09-11 2013-12-11 北京邮电大学 一种面向主流微博网站微博id的采集方法及工具
CN103577935A (zh) * 2013-11-14 2014-02-12 宜昌市科学技术情报研究所 一种用于企业创新的服务系统
CN104376406A (zh) * 2014-11-05 2015-02-25 上海计算机软件技术开发中心 一种基于大数据的企业创新资源管理与分析系统和方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7917492B2 (en) * 2007-09-21 2011-03-29 Limelight Networks, Inc. Method and subsystem for information acquisition and aggregation to facilitate ontology and language-model generation within a content-search-service system
CN103106573A (zh) * 2013-02-20 2013-05-15 中国科学院信息工程研究所 一种基于关系图的海量电子邮件分析方法及系统
CN104268254A (zh) * 2014-10-09 2015-01-07 浪潮电子信息产业股份有限公司 一种安全态势分析统计方法
CN104881726B (zh) * 2014-12-31 2020-12-01 国家电网公司 一种实现调控操作票与在线联合计算一体化的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164405A (zh) * 2011-12-08 2013-06-19 盛乐信息技术(上海)有限公司 相关视频数据库生成方法、相关视频推荐方法及系统
CN103440139A (zh) * 2013-09-11 2013-12-11 北京邮电大学 一种面向主流微博网站微博id的采集方法及工具
CN103577935A (zh) * 2013-11-14 2014-02-12 宜昌市科学技术情报研究所 一种用于企业创新的服务系统
CN104376406A (zh) * 2014-11-05 2015-02-25 上海计算机软件技术开发中心 一种基于大数据的企业创新资源管理与分析系统和方法

Also Published As

Publication number Publication date
CN105279392A (zh) 2016-01-27

Similar Documents

Publication Publication Date Title
Hartmann et al. Meta-mass shift chemical profiling of metabolomes from coral reefs
Birkebak et al. A systematic, morphological and ecological overview of the Clavariaceae (Agaricales)
JP6894534B2 (ja) 情報処理方法及び端末、コンピュータ記憶媒体
Puillandre et al. Large‐scale species delimitation method for hyperdiverse groups
CN105389482B (zh) 一种基于云平台的大数据分析方法
CN105279392B (zh) 一种基于云平台的大数据分析装置
WO2017092622A1 (zh) 法律条文的搜索方法及装置
CN106095966B (zh) 一种用户可扩展的标签标注方法及系统
List et al. Using phylogenetic networks to model Chinese dialect history
CN107909088B (zh) 获取训练样本的方法、装置、设备和计算机存储介质
CN108959453B (zh) 基于文本聚类的信息提取方法、装置及可读存储介质
Bik et al. Phinch: an interactive, exploratory data visualization framework for–Omic datasets
WO2014080287A4 (en) Method and system for generating search results from a user-selected area
Durkin et al. When mycologists describe new species, not all relevant information is provided (clearly enough)
Noguti et al. Legal document classification: An application to law area prediction of petitions to public prosecution service
Meng et al. Mining user reviews: from specification to summarization
Ballesteros et al. Species delimitation of the North American orchard-spider Leucauge venusta (Walckenaer, 1841)(Araneae, Tetragnathidae)
CN109522413B (zh) 一种导诊医学术语库的构建方法及装置
CN106709273B (zh) 微藻蛋白质特征序列标签匹配的快速检测方法及系统
Han et al. Computational tools for Hi-C data analysis
Koo et al. Tracking, synthesizing, and sharing global Batrachochytrium data at AmphibianDisease. org
Shan et al. Palynological recovery of small carbonaceous fossils (SCFs) indicates that the late Cambrian acritarch Goniomorpha Yin 1986 represents the teeth of a priapulid worm
CN111126034A (zh) 医学变量关系的处理方法及装置、计算机介质和电子设备
Burkhardt et al. Nkululeko: A tool for rapid speaker characteristics detection
JP2008065468A (ja) テキスト多重分類装置、テキストを多重分類する方法、プログラムおよび記憶媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant