CN103744880A - 一种基于云计算的dna数据管理方法及系统 - Google Patents

一种基于云计算的dna数据管理方法及系统 Download PDF

Info

Publication number
CN103744880A
CN103744880A CN201310711671.4A CN201310711671A CN103744880A CN 103744880 A CN103744880 A CN 103744880A CN 201310711671 A CN201310711671 A CN 201310711671A CN 103744880 A CN103744880 A CN 103744880A
Authority
CN
China
Prior art keywords
data
server
engine server
user
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310711671.4A
Other languages
English (en)
Other versions
CN103744880B (zh
Inventor
张光振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201310711671.4A priority Critical patent/CN103744880B/zh
Publication of CN103744880A publication Critical patent/CN103744880A/zh
Application granted granted Critical
Publication of CN103744880B publication Critical patent/CN103744880B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于云计算的DNA数据管理方法及系统。应用在云计算技术领域,包括以下步骤:负载机获取输入数据后,分配给对应的比对引擎服务器;数据库服务器获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据;所述引擎服务器根据所述请求,反馈查询比对结果给用户。本发明可以将信息量庞大的DNA数据统一管理,快速查询,减少机器总体数目,减少能耗;并且保证了数据的安全性,可靠性。

Description

一种基于云计算的DNA数据管理方法及系统
技术领域
本发明涉及云计算技术领域,尤其涉及一种基于云计算的DNA数据管理方法及系统。
背景技术
当前,DNA作为生物体的遗传物质,人类对DNA的研究越来越深,了解越来越多,DNA技术应用也越来越广泛,如基因工程,环境检测,环境净化,农业,畜牧业,食品业,药品和基因治疗,克隆等,这些应用也在不同的领域上造福于人类;然而,DNA中所包含的信息量十分巨大,如何储存这些大量信息并能快速检索匹配调用呢,现有技术中还没有一种高效的解决方案。
发明内容
本发明提供一种基于云计算的DNA数据管理方法及系统,以解决上述问题。
本发明提供一种基于云计算的DNA数据管理方法。上述方法包括以下步骤:
负载机获取输入数据后,分配给对应的比对引擎服务器;
数据库服务器获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据;
所述引擎服务器根据所述请求,反馈查询比对结果给用户。
本发明还提供一种基于云计算的DNA数据管理系统,包括:负载机,比对引擎服务器,数据库服务器,备份服务器,用户端;用户端通过负载机与比对引擎服务器相连;用户端通过数据库服务器与比对引擎服务器相连;比对引擎服务器与备份服务器相连;
负载机,用于获取输入数据后,分配给对应的比对引擎服务器;
数据库服务器,用于获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据;
所述引擎服务器,用于根据所述请求,反馈查询比对结果给用户;
所述备份服务器,用于比对引擎服务器中的数据进行实时或定时备份。
通过实施本发明的技术方案,将许多机器以SAAS模式通过互联网连接全部集中当作一个整体,借助于云服务平台强大的计算处理能力快速储存检索大量信息;这样,不仅可以大大提高DNA信息的管理、查询效率,也可以降低能耗、管理的复杂度及维护成本;本发明引入云计算技术,通过集群应用、分布式文件系统等技术,将设备通过软件集合起来协同工作,共同提供计算存储服务,增强了数据的安全性、可靠性,可扩展性强;本发明的有益效果是:可以将信息量庞大的DNA数据统一管理,快速查询,减少机器总体数目,减少能耗;并且保证了数据的安全性,可靠性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1所示为本发明实施例1的DNA数据管理系统架构图;
图2所示为本发明实施例2的DNA数据管理方法流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明提供了一种基于云计算的DNA数据管理方法,包括以下步骤:
负载机获取输入数据后,分配给对应的比对引擎服务器;
数据库服务器获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据;
所述引擎服务器根据所述请求,反馈查询比对结果给用户。
其中,负载机获取输入数据的过程为:用户在本机上安装用户端并通过所述用户端输入数据到负载机。
其中,数据库服务器获取关键序列数据信息的过程为:用户输入关键序列数据信息至数据库服务器。
其中,数据库服务器获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据的过程为:
当用户输入关键序列数据信息后,数据库服务器进行检索匹配,然后根据获得的匹配结果,向数据所在引擎服务器请求调用数据结果返回给用户;其中,数据库服务器存储有关键序列数据。
其中,备份服务器对比对引擎服务器中的数据进行实时或定时备份。
图1所示为本发明实施例1的DNA数据管理系统架构图,如图1所示,包括:负载机,比对引擎服务器,数据库服务器,备份服务器,用户端。
用户在本机上安装用户端用于连接系统;其中,用户端,用户交互界面。用户使用用户端通过互联网可远程登录访问DNA数据管理系统,更加便利的操作DNA数据管理系统。
用户通过用户端输入数据到负载机;
负载机采用分布式文件系统技术将数据合理的分配给后台机器(即比对引擎服务器);
当用户想要检索查询某些数据时,首先由数据库服务器通过关键序列数据匹配,再在后台机器上查询调用结果返回给用户。
备份服务器负责对重要数据的备份工作,具体而言,备份服务器对比对引擎服务器中的数据进行实时或定时备份。
下面对负载机,比对引擎服务器,数据库服务器,备份服务器,用户端的功能进行详细描述:
负载机,用户在前端输入数据,负载机根据输入数据中的关键信息以及后台机器的使用情况合理的将数据分配给后台机器;当对系统新加入机器时,负载机可根据后台所有机器的使用情况以及数据的重要性级别选择将哪部分数据自动迁移过来。
比对引擎服务器,是将多台可单独提供DNA比对服务的机器通过集群应用技术连接集中当作一个整体对外提供比对服务;可以储存大量数据信息并可以高效快速的将比对结果返回给用户;比对引擎服务器下的机器可根据需要增加减少,可维护性、可扩展性强。
数据库服务器,存储有DNA关键序列数据;当用户输入关键序列数据后,首先在数据库服务器检索匹配,然后根据匹配结果指向从数据所在机器存储中调用数据结果返回给用户;可在数据库服务器中新增DNA关键序列数据,亦可删除无用的关键序列数据;数据库服务器,主要是存储DNA关键序列数据,方便比对引擎快速搜索,为客户及时返回DNA比对结果。
备份服务器,提供数据备份服务。
用户端,为用户提供本地服务,方便用户使用此系统。
图2所示为本发明实施例2的DNA数据管理方法流程图,说明如下:
步骤201:负载机获取输入数据后,分配给对应的比对引擎服务器;
步骤202:数据库服务器获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据;
步骤203:所述引擎服务器根据所述请求,反馈查询比对结果给用户。
本发明还提供了一种基于云计算的DNA数据管理系统,包括:负载机,比对引擎服务器,数据库服务器,备份服务器,用户端;用户端通过负载机与比对引擎服务器相连;用户端通过数据库服务器与比对引擎服务器相连;比对引擎服务器与备份服务器相连;
负载机,用于获取输入数据后,分配给对应的比对引擎服务器;
数据库服务器,用于获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据;
所述引擎服务器,用于根据所述请求,反馈查询比对结果给用户;
所述备份服务器,用于比对引擎服务器中的数据进行实时或定时备份。
通过实施本发明的技术方案,将许多机器以SAAS模式通过互联网连接全部集中当作一个整体,借助于云服务平台强大的计算处理能力快速储存检索大量信息;这样,不仅可以大大提高DNA信息的管理、查询效率,也可以降低能耗、管理的复杂度及维护成本;本发明引入云计算技术,通过集群应用、分布式文件系统等技术,将设备通过软件集合起来协同工作,共同提供计算存储服务,增强了数据的安全性、可靠性,可扩展性强;本发明的有益效果是:可以将信息量庞大的DNA数据统一管理,快速查询,减少机器总体数目,减少能耗;并且保证了数据的安全性,可靠性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于云计算的DNA数据管理方法,其特征在于,包括以下步骤:
负载机获取输入数据后,分配给对应的比对引擎服务器;
数据库服务器获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据;
所述引擎服务器根据所述请求,反馈查询比对结果给用户。
2.根据权利要求1所述的方法,其特征在于:负载机获取输入数据的过程为:用户在本机上安装用户端并通过所述用户端输入数据到负载机。
3.根据权利要求1所述的方法,其特征在于:数据库服务器获取关键序列数据信息的过程为:用户输入关键序列数据信息至数据库服务器。
4.根据权利要求1所述的方法,其特征在于:数据库服务器获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据的过程为:
当用户输入关键序列数据信息后,数据库服务器进行检索匹配,然后根据获得的匹配结果,向数据所在引擎服务器请求调用数据结果返回给用户;其中,数据库服务器存储有关键序列数据。
5.根据权利要求1所述的方法,其特征在于:备份服务器对比对引擎服务器中的数据进行实时或定时备份。
6.一种基于云计算的DNA数据管理系统,其特征在于,包括:负载机,比对引擎服务器,数据库服务器,备份服务器,用户端;用户端通过负载机与比对引擎服务器相连;用户端通过数据库服务器与比对引擎服务器相连;比对引擎服务器与备份服务器相连;
负载机,用于获取输入数据后,分配给对应的比对引擎服务器;
数据库服务器,用于获取关键序列数据信息后,进行检索匹配并根据获得的匹配结果,向对应的引擎服务器请求获取对应的数据;
所述引擎服务器,用于根据所述请求,反馈查询比对结果给用户;
所述备份服务器,用于比对引擎服务器中的数据进行实时或定时备份。
CN201310711671.4A 2013-12-20 2013-12-20 一种基于云计算的dna数据管理方法及系统 Active CN103744880B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310711671.4A CN103744880B (zh) 2013-12-20 2013-12-20 一种基于云计算的dna数据管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310711671.4A CN103744880B (zh) 2013-12-20 2013-12-20 一种基于云计算的dna数据管理方法及系统

Publications (2)

Publication Number Publication Date
CN103744880A true CN103744880A (zh) 2014-04-23
CN103744880B CN103744880B (zh) 2018-07-31

Family

ID=50501898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310711671.4A Active CN103744880B (zh) 2013-12-20 2013-12-20 一种基于云计算的dna数据管理方法及系统

Country Status (1)

Country Link
CN (1) CN103744880B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104270463A (zh) * 2014-10-21 2015-01-07 无锡云捷科技有限公司 一种cdn网络动态服务器选择方法
CN105046109A (zh) * 2015-06-26 2015-11-11 四川云合创智科技有限公司 一种用于生物信息序列分析的加速平台
CN108804877A (zh) * 2018-06-08 2018-11-13 南京森林警察学院 一种生物学基因dna序列比对系统
CN111723261A (zh) * 2019-03-22 2020-09-29 昆明逆火科技股份有限公司 基于搜索引擎的dna比对算法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101748213A (zh) * 2008-12-12 2010-06-23 深圳华大基因研究院 一种环境微生物检测方法和系统
CN101867607A (zh) * 2010-05-21 2010-10-20 北京无限立通通讯技术有限责任公司 一种分布式数据存取方法、装置及系统
CN102195950A (zh) * 2010-03-16 2011-09-21 无锡指网生物识别科技有限公司 基于云计算的指纹认证平台
CN103246716A (zh) * 2013-04-26 2013-08-14 中国传媒大学 基于对象集群文件系统的对象副本高效管理方法及系统
US20130339321A1 (en) * 2012-06-13 2013-12-19 Infosys Limited Method, system, and computer-readable medium for providing a scalable bio-informatics sequence search on cloud

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101748213A (zh) * 2008-12-12 2010-06-23 深圳华大基因研究院 一种环境微生物检测方法和系统
CN102195950A (zh) * 2010-03-16 2011-09-21 无锡指网生物识别科技有限公司 基于云计算的指纹认证平台
CN101867607A (zh) * 2010-05-21 2010-10-20 北京无限立通通讯技术有限责任公司 一种分布式数据存取方法、装置及系统
US20130339321A1 (en) * 2012-06-13 2013-12-19 Infosys Limited Method, system, and computer-readable medium for providing a scalable bio-informatics sequence search on cloud
CN103246716A (zh) * 2013-04-26 2013-08-14 中国传媒大学 基于对象集群文件系统的对象副本高效管理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张文静: ""基于云计算的生物DNA指纹图谱大范围比对方法"", 《科技通报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104270463A (zh) * 2014-10-21 2015-01-07 无锡云捷科技有限公司 一种cdn网络动态服务器选择方法
CN105046109A (zh) * 2015-06-26 2015-11-11 四川云合创智科技有限公司 一种用于生物信息序列分析的加速平台
CN105046109B (zh) * 2015-06-26 2018-06-29 四川云合创智科技有限公司 一种用于生物信息序列分析的加速平台
CN108804877A (zh) * 2018-06-08 2018-11-13 南京森林警察学院 一种生物学基因dna序列比对系统
CN108804877B (zh) * 2018-06-08 2019-07-05 南京森林警察学院 一种生物学基因dna序列比对方法
CN111723261A (zh) * 2019-03-22 2020-09-29 昆明逆火科技股份有限公司 基于搜索引擎的dna比对算法

Also Published As

Publication number Publication date
CN103744880B (zh) 2018-07-31

Similar Documents

Publication Publication Date Title
US11354314B2 (en) Method for connecting a relational data store's meta data with hadoop
US11347761B1 (en) System and methods for distributed database query engines
CN108536761B (zh) 报表数据查询方法及服务器
CN103036956B (zh) 一种分布式组态化海量数据归档系统及实现方法
CN107943841B (zh) 流式数据处理方法、系统和计算机可读存储介质
US9384361B2 (en) Distributed event system for relational models
CN106776829A (zh) 一种数据导出系统及其工作方法
CN103744880A (zh) 一种基于云计算的dna数据管理方法及系统
CN106776783A (zh) 非结构化数据存储管理方法、服务器和系统
CN102971703A (zh) 数据库搜索的加强查询
CN110096521A (zh) 日志信息处理方法及装置
CN102456004A (zh) 一种页面数据查询控制方法及系统
CN103593737A (zh) 基于云计算的档案管理系统
CN103856353A (zh) 一种业务日志数据访问与统计分析的方法及装置
CN111343269A (zh) 一种数据下载方法、装置、计算机设备和存储介质
CN111159300A (zh) 基于区块链的数据处理方法及装置
CN107220129B (zh) 一种软件模块间的通信方法和系统
CN107563850A (zh) 基于共享经济的虚拟资源管理方法、使用方法、装置及系统
CN110929126A (zh) 一种基于远程过程调用实现的分布式爬虫调度方法
CN115630122A (zh) 一种数据同步方法、装置、存储介质和计算机设备
CN104050284A (zh) 一种基于单进程的数据异步查询方法及系统
CN107657458A (zh) 名单获取方法及装置
CN113780704A (zh) 一种任务处理方法和装置
CN106528337B (zh) 数据的备份方法、装置及系统
CN111191251A (zh) 一种数据权限控制方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant