CN114242163A - 蛋白质组学的质谱数据的处理系统 - Google Patents
蛋白质组学的质谱数据的处理系统 Download PDFInfo
- Publication number
- CN114242163A CN114242163A CN202010939999.1A CN202010939999A CN114242163A CN 114242163 A CN114242163 A CN 114242163A CN 202010939999 A CN202010939999 A CN 202010939999A CN 114242163 A CN114242163 A CN 114242163A
- Authority
- CN
- China
- Prior art keywords
- data
- mass spectrum
- module
- spectrum data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001819 mass spectrum Methods 0.000 title claims abstract description 90
- 238000012545 processing Methods 0.000 title claims abstract description 29
- 238000002474 experimental method Methods 0.000 claims abstract description 88
- 238000004364 calculation method Methods 0.000 claims abstract description 60
- 108010026552 Proteome Proteins 0.000 claims abstract description 21
- 238000013523 data management Methods 0.000 claims abstract description 21
- 238000007726 management method Methods 0.000 claims abstract description 19
- 238000003860 storage Methods 0.000 claims abstract description 16
- 238000004949 mass spectrometry Methods 0.000 claims description 22
- 239000000523 sample Substances 0.000 description 25
- 238000000034 method Methods 0.000 description 5
- 101150105138 nas2 gene Proteins 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000005464 sample preparation method Methods 0.000 description 2
- 101100348008 Caenorhabditis elegans nas-2 gene Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000006101 laboratory sample Substances 0.000 description 1
- 208000025402 neoplasm of esophagus Diseases 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5038—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5021—Priority
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/54—Indexing scheme relating to G06F9/54
- G06F2209/548—Queue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种蛋白质组学的质谱数据的处理系统,包括客户端、服务端和NAS;服务端包括数据上传模块、数据管理模块、数据计算模块、数据库和若干服务器;数据上传模块用于接收用户经对应的客户端上传的质谱数据文件,并将质谱数据文件传输至数据管理模块;数据管理模块用于将质谱数据文件存储至NAS;数据计算模块用于根据实验的计算参数信息提交质谱数据计算任务,将质谱数据计算任务发布到不同优先等级的消息队列中,抓取消息队列中的任务信息,将质谱数据计算任务分配到若干服务器上执行;质谱数据计算任务用于将质谱数据文件经计算得到对应的蛋白质组表达数据。本发明能够一站式解决质谱数据的管理、存储和计算,用户使用方便,操作简单。
Description
技术领域
本发明属于蛋白质组学的质谱数据技术领域,特别涉及一种蛋白质组学的质谱数据的处理系统。
背景技术
随着基于质谱的蛋白质组学技术的大规模运用,蛋白质组学的质谱数据呈现爆炸性地增长,针对实验室质谱仪器产生的大量的蛋白质组学的质谱数据,非常需要一套可靠易用的系统对质谱数据进行统一管理、存储和计算。现有的解决方案有基于本地计算资源的软件,该软件能够实现对质谱数据的计算,使用前需要用户自行安装软件,利用本机计算资源进行分析,该方案存在计算分析受本机性能影响的缺点。还有一些现有的系统只提供数据托管的功能,要完成质谱数据的管理、存储和计算需要在多个平台之间进行切换,操作重复且繁杂。
发明内容
本发明要解决的技术问题是为了克服现有技术中质谱数据的处理系统受所在机器性能限制以及平台切换导致操作重复且繁杂的缺陷,提供一种能够一站式解决蛋白质组学的质谱数据的管理、存储和计算的蛋白质组学的质谱数据的处理系统。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供了一种蛋白质组学的质谱数据的处理系统,所述处理系统包括客户端、服务端和NAS(Network Attached Storage,网络附属存储);
所述服务端包括数据上传模块、数据管理模块、数据计算模块、数据库和若干服务器;
所述数据上传模块用于接收用户经对应的所述客户端上传的质谱数据文件,并将所述质谱数据文件传输至所述数据管理模块;
所述数据管理模块用于将所述质谱数据文件存储至所述NAS;
所述数据计算模块用于根据实验的计算参数信息提交质谱数据计算任务,将所述质谱数据计算任务发布到不同优先等级的消息队列中,抓取所述消息队列中的任务信息,将所述质谱数据计算任务分配到若干所述服务器上执行;所述质谱数据计算任务用于将所述质谱数据文件经计算得到对应的蛋白质组表达数据;
所述数据管理模块还用于将所述蛋白质组表达数据保存至所述数据库。
本方案提供了一种能够一站式解决蛋白质组学的质谱数据的管理、存储和计算的处理系统,用户使用方便,操作简单,避免了完成质谱数据的管理、存储和计算需要在多个平台之间进行切换,操作重复且繁杂的问题。采用多个高性能超算即性能比较强的服务器执行质谱数据计算任务,避免了单机带来的性能瓶颈。
较佳地,所述服务端还包括第一申请模块和第二申请模块;
所述第一申请模块用于根据用户经对应的所述客户端提供的样品信息得到对应的样品号;所述样品号用于唯一识别所述样品信息对应的样品;
所述第二申请模块用于根据用户经对应的所述客户端提供的样品号、质谱仪器型号、所述计算参数信息得到对应的实验号;
所述质谱数据文件与所述实验号一一对应。
本方案服务端根据用户提供的信息能够生成处理系统中用来标识样品唯一性的样品号和标识实验唯一性的实验号。实验号和样品号用于处理系统中对应数据的存储与查询等。
较佳地,所述质谱数据文件的文件名中包括对应的所述实验号;
所述客户端用于根据所述质谱数据文件的文件名中的实验号自动上传所述质谱数据文件至所述服务端的所述数据上传模块。
本方案中,实验室产出的质谱数据根据对应的文件名中的实验号能够自动上传至服务端,以实验号为单位对质谱数据文件进行存储和备份。
较佳地,所述数据计算模块还用于监察所述质谱数据计算任务的运行状态;所述数据管理模块还用于将所述运行状态保存至所述数据库;所述数据管理模块还用于将所述数据计算模块进行计算时产生的中间结果存储至所述数据库。
较佳地,所述服务端还包括项目管理模块;
所述项目管理模块用于根据用户经对应的所述客户端提供的项目信息生成对应的项目;
每个所述项目包括多个实验,每个实验对应一个所述实验号;
所述项目管理模块还用于根据用户经对应的所述客户端提供的所述实验的信息在所述项目中添加和删除实验;
所述数据库中以及所述NAS中按照每个所述项目分别存储数据。
本方案中,用户可以根据实验策略将相关实验归入一个项目,以项目为单位将实验信息归入项目中,填选项目的描述信息生成项目,在项目中添加和删除实验。实验策略包括样品制备方法。
较佳地,所述服务端还包括状态追踪模块;
所述状态追踪模块用于响应用户经对应的所述客户端发出的针对目标实验号的查询请求,查询所述数据库以获取所述目标实验号对应的所述运行状态。
本方案中,通过运行状态的保存实现对数据计算过程的实时监测和状态更新,供用户查询。
较佳地,所述服务端还包括下载模块;
所述下载模块用于响应用户经对应的所述客户端发出的针对目标实验号的下载请求,根据所述目标实验号从所述NAS中获取所述目标实验号对应的所述质谱数据文件并反馈至所述用户,和/或根据所述目标实验号从所述数据库中获取所述目标实验号对应的所述中间结果和/或所述蛋白质组表达数据并反馈至所述用户。
较佳地,所述下载模块还用于响应用户经对应的所述客户端发出的针对目标项目的下载请求,根据所述目标项目从所述NAS中获取所述目标项目所包括的所有实验号对应的所述质谱数据文件并反馈至所述用户,和/或根据所述目标项目从所述数据库中获取所述目标项目所包括的所有实验号对应的所述中间结果和/或所述蛋白质组表达数据并反馈至所述用户。
本方案中,对质谱数据文件、计算的中间结果和计算结果即蛋白质组表达数据提供快速的下载功能,既可以以实验为单位操作也可以以项目为单位进行操作。还可以提供分享和下载链接以供他人使用。
较佳地,所述数据计算模块用于执行任务工具抓取所述消息队列中的任务信息。
较佳地,所述客户端为APP(Application,应用程序)、网页、FTP(File TransferProtocol,文件传输协议)或者Aspera(一种高速文件传输软件)。
外部实验室用户包括两种用户,第一种是部署了本系统的本地数据上传模块的用户,他们只需要将质谱数据文件拷贝至NAS中,客户端会自动整理和上传质谱数据文件。第二种是未部署的用户,他们只能通过FTP或者Aspera上传工具上传。本方案中,客户端的表形式多种多样,其中APP为本系统对应的APP,即供第一种用户使用。
本发明的积极进步效果在于:本发明提供了一种能够一站式解决蛋白质组学的质谱数据的管理、存储和计算的处理系统,用户使用方便,操作简单,避免了完成质谱数据的管理、存储和计算的需要在多个平台之间进行切换,操作重复且繁杂的问题。采用多个高性能超算即性能比较强的服务器执行质谱数据计算任务,避免了单机带来的性能瓶颈。
附图说明
图1为本发明一较佳实施例的蛋白质组学的质谱数据的处理系统的结构示意图。
图2为本发明一较佳实施例的服务端的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
如图1所示,本实施例提供了一种蛋白质组学的质谱数据的处理系统,该处理系统包括服务端1、NAS2和若干个客户端3。本实施例中客户端3可以为APP、网页端、FTP或者Aspera。
如图2所示,本实施例中,服务端1包括数据上传模块12、数据管理模块13、数据计算模块14、第一申请模块15、第二申请模块16、项目管理模块17、状态追踪模块18、下载模块19、数据库10和若干高性能的服务器11。
本实施例中,第一申请模块15用于根据用户根据蛋白质组样品制备流程经对应的网页端的客户端3提供的样品信息得到对应的样品号;样品信息可以包括物种、器官、组织、制备方法等,样品号用于唯一识别样品信息对应的样品。第二申请模块16用于根据用户经对应的客户端3提供的样品号、质谱仪器型号、计算参数信息得到对应的实验号。质谱数据文件与实验号一一对应,质谱数据文件的文件名中包括对应的实验号。从质谱数据到蛋白质组表达数据,会经过数据库搜索,蛋白组装和定量过程,计算参数信息是指这三个计算过程中设定的质谱仪器检测运行的参数。本实施例中服务端根据用户提供的信息能够生成处理系统中用来标识每个样品唯一性的样品号和每个实验唯一性的实验号。实验信息中包含样品号,一个样品号可以对应多个实验号,一个实验号对应一个质谱数据文件。实验号和样品号用于处理系统中对应数据的存储与查询等。
项目管理模块17用于根据用户经对应的客户端3提供的项目信息生成对应的项目;每个项目包括多个实验,每个实验对应一个实验号;项目管理模块17还用于根据用户经对应的客户端3提供的实验的信息在项目中添加和删除实验。数据库10中以及NAS2中按照每个项目分别存储数据。本实施例中,用户可以根据实验策略将相关实验归入一个项目,以项目为单位将实验信息归入项目中,填选项目的描述信息生成项目,在项目中添加和删除实验。实验策略包括样品制备方法。
数据上传模块12用于接收用户经对应的客户端3上传的质谱数据文件,并将质谱数据文件传输至数据管理模块13。
数据计算模块14用于根据实验的计算参数信息提交质谱数据计算任务,将质谱数据计算任务发布到不同优先等级的消息队列中,执行任务工具抓取消息队列中的任务信息,将质谱数据计算任务分配到若干不同的服务器上执行;质谱数据计算任务用于将质谱数据文件经计算得到对应的蛋白质组表达数据;数据计算模块14还用于监察质谱数据计算任务的运行状态。
数据管理模块13用于将质谱数据文件存储至NAS2;数据管理模块13还用于将蛋白质组表达数据保存至数据库。数据管理模块13还用于将运行状态保存至数据库;数据管理模块13还用于将数据计算模块14进行计算时产生的中间结果存储至数据库。
状态追踪模块18用于响应用户经对应的客户端3发出的针对目标实验号的查询请求,查询数据库以获取目标实验号对应的运行状态。本实施例中,目标实验号为用户待查询的实验号,通过运行状态的保存实现对数据计算过程的实时监测和状态更新,供用户查询。
下载模块19用于响应用户经对应的客户端3发出的针对目标实验号的下载请求,根据目标实验号从NAS2中获取目标实验号对应的质谱数据文件并反馈至用户,和/或根据目标实验号从数据库中获取目标实验号对应的中间结果和/或蛋白质组表达数据并反馈至用户。下载模块19还用于响应用户经对应的客户端3发出的针对目标项目的下载请求,根据目标项目从NAS2中获取目标项目所包括的所有实验号对应的质谱数据文件并反馈至用户,和/或根据目标项目从数据库中获取目标项目所包括的所有实验号对应的中间结果和/或蛋白质组表达数据并反馈至用户。
本实施例中,对质谱数据文件、计算的中间结果和计算结果即蛋白质组表达数据提供快速的下载功能,既可以以实验为单位操作也可以以项目为单位进行操作。还可以提供分享和下载链接以供他人使用。
本实施例中客户端3可以用于根据质谱数据文件的文件名中的实验号自动上传质谱数据文件至服务端1的数据上传模块12。本实施例中,实验室产出的质谱数据根据对应的文件名中的实验号能够自动上传至服务端,以实验号为单位对质谱数据文件进行存储和备份。外部实验室用户利用客户端上传质谱数据文件。外部实验室用户包括两种用户,第一种是部署了本系统的本地数据上传模块的用户,他们只需要将质谱数据文件拷贝至NAS2中,APP会自动整理和上传质谱数据文件。第二种是未部署本系统的用户,只能通过FTP或者Aspera等上传工具客户端上传。
用户使用本处理系统时需要先申请样品号和实验号,在系统中生成相应的编号。其中,编号就是对应的样品号和实验号。生成质谱数据文件后对质谱仪器产生的质谱数据文件按照命名规范命名,然后把文件上传至指定的NAS盘,“Exp035418_DingC_FFPE_Esophagus_Tumor_HFX4_75min_50per_20181221_F1_R1.raw”为一种供参考的文件名,对应为“实验号_实验室_样本类型_仪器_梯度_上样量_日期_fraction_repeat”。后续在服务端完成存储和计算,用户可以浏览本系统关注实验的状态信息,数据上传和计算的过程,会把状态存储到数据库中,在网页端可以供用户浏览。
本实施例提供了一种能够一站式解决蛋白质组学的质谱数据的管理、存储和计算的处理系统,是一种提供蛋白质组学的质谱数据存储管理及计算的云服务,用户使用方便,操作简单,避免了完成质谱数据的管理、存储和计算的需要在多个平台之间进行切换,操作重复且繁杂的问题。采用多个高性能超算即性能比较强的服务器执行质谱数据计算任务,避免了单机带来的性能瓶颈。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (10)
1.一种蛋白质组学的质谱数据的处理系统,其特征在于,所述处理系统包括客户端、服务端和NAS;
所述服务端包括数据上传模块、数据管理模块、数据计算模块、数据库和若干服务器;
所述数据上传模块用于接收用户经对应的所述客户端上传的质谱数据文件,并将所述质谱数据文件传输至所述数据管理模块;
所述数据管理模块用于将所述质谱数据文件存储至所述NAS;
所述数据计算模块用于根据实验的计算参数信息提交质谱数据计算任务,将所述质谱数据计算任务发布到不同优先等级的消息队列中,抓取所述消息队列中的任务信息,将所述质谱数据计算任务分配到若干所述服务器上执行;所述质谱数据计算任务用于将所述质谱数据文件经计算得到对应的蛋白质组表达数据;
所述数据管理模块还用于将所述蛋白质组表达数据保存至所述数据库。
2.如权利要求1所述的蛋白质组学的质谱数据的处理系统,其特征在于,所述服务端还包括第一申请模块和第二申请模块;
所述第一申请模块用于根据用户经对应的所述客户端提供的样品信息得到对应的样品号;所述样品号用于唯一识别所述样品信息对应的样品;
所述第二申请模块用于根据用户经对应的所述客户端提供的样品号、质谱仪器型号、所述计算参数信息得到对应的实验号;
所述质谱数据文件与所述实验号一一对应。
3.如权利要求2所述的蛋白质组学的质谱数据的处理系统,其特征在于,所述质谱数据文件的文件名中包括对应的所述实验号;
所述客户端用于根据所述质谱数据文件的文件名中的实验号自动上传所述质谱数据文件至所述服务端的所述数据上传模块。
4.如权利要求3所述的蛋白质组学的质谱数据的处理系统,其特征在于,所述数据计算模块还用于监察所述质谱数据计算任务的运行状态;所述数据管理模块还用于将所述运行状态保存至所述数据库;所述数据管理模块还用于将所述数据计算模块进行计算时产生的中间结果存储至所述数据库。
5.如权利要求4所述的蛋白质组学的质谱数据的处理系统,其特征在于,所述服务端还包括项目管理模块;
所述项目管理模块用于根据用户经对应的所述客户端提供的项目信息生成对应的项目;
每个所述项目包括多个实验,每个实验对应一个所述实验号;
所述项目管理模块还用于根据用户经对应的所述客户端提供的所述实验的信息在所述项目中添加和删除实验;
所述数据库中以及所述NAS中按照每个所述项目分别存储数据。
6.如权利要求4所述的蛋白质组学的质谱数据的处理系统,其特征在于,所述服务端还包括状态追踪模块;
所述状态追踪模块用于响应用户经对应的所述客户端发出的针对目标实验号的查询请求,查询所述数据库以获取所述目标实验号对应的所述运行状态。
7.如权利要求5所述的蛋白质组学的质谱数据的处理系统,其特征在于,所述服务端还包括下载模块;
所述下载模块用于响应用户经对应的所述客户端发出的针对目标实验号的下载请求,根据所述目标实验号从所述NAS中获取所述目标实验号对应的所述质谱数据文件并反馈至所述用户,和/或根据所述目标实验号从所述数据库中获取所述目标实验号对应的所述中间结果和/或所述蛋白质组表达数据并反馈至所述用户。
8.如权利要求7所述的蛋白质组学的质谱数据的处理系统,其特征在于,所述下载模块还用于响应用户经对应的所述客户端发出的针对目标项目的下载请求,根据所述目标项目从所述NAS中获取所述目标项目所包括的所有实验号对应的所述质谱数据文件并反馈至所述用户,和/或根据所述目标项目从所述数据库中获取所述目标项目所包括的所有实验号对应的所述中间结果和/或所述蛋白质组表达数据并反馈至所述用户。
9.如权利要求1所述的蛋白质组学的质谱数据的处理系统,其特征在于,所述数据计算模块用于执行任务工具抓取所述消息队列中的任务信息。
10.如权利要求1所述的蛋白质组学的质谱数据的处理系统,其特征在于,所述客户端为APP、网页、FTP或者Aspera。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010939999.1A CN114242163B (zh) | 2020-09-09 | 2020-09-09 | 蛋白质组学的质谱数据的处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010939999.1A CN114242163B (zh) | 2020-09-09 | 2020-09-09 | 蛋白质组学的质谱数据的处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114242163A true CN114242163A (zh) | 2022-03-25 |
CN114242163B CN114242163B (zh) | 2024-01-30 |
Family
ID=80742563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010939999.1A Active CN114242163B (zh) | 2020-09-09 | 2020-09-09 | 蛋白质组学的质谱数据的处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114242163B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020080626A (ko) * | 2001-04-16 | 2002-10-26 | 학교법인연세대학교 | 프로테옴 데이터 제공 장치 및 방법 |
US20030036207A1 (en) * | 2001-07-13 | 2003-02-20 | Washburn Michael P. | System and method for storing mass spectrometry data |
WO2003019417A1 (en) * | 2001-08-29 | 2003-03-06 | Bioinfomatix Inc. | System and method for proteome analysis and data management |
US20060190184A1 (en) * | 2005-02-23 | 2006-08-24 | Incogen, Inc. | System and method using a visual or audio-visual programming environment to enable and optimize systems-level research in life sciences |
US20110313809A1 (en) * | 2003-10-31 | 2011-12-22 | International Business Machines Corporation | System, method and program product for management of life sciences data and related research |
CN102411680A (zh) * | 2010-09-26 | 2012-04-11 | 中国科学院计算技术研究所 | 一种蛋白质鉴定的大规模分布式并行加速方法及其系统 |
KR20120131678A (ko) * | 2011-05-26 | 2012-12-05 | 주식회사 이노테라피 | 클라우드 컴퓨팅 네트워크 기반의 프로테오믹스 서비스 제공 시스템 및 그에 의한 서비스 제공방법 |
US20140156612A1 (en) * | 2012-05-07 | 2014-06-05 | Infoclinika, Inc. | Preparing lc/ms data for cloud and/or parallel image computing |
CN108363908A (zh) * | 2017-02-16 | 2018-08-03 | 北京毅新博创生物科技有限公司 | 用于检测生物分子的智谱系统 |
CN108537008A (zh) * | 2018-03-20 | 2018-09-14 | 常州大学 | 高通量基因测序大数据分析云平台系统 |
US20190034047A1 (en) * | 2017-07-31 | 2019-01-31 | Wisconsin Alumni Research Foundation | Web-Based Data Upload and Visualization Platform Enabling Creation of Code-Free Exploration of MS-Based Omics Data |
CN110277136A (zh) * | 2019-07-05 | 2019-09-24 | 湖南大学 | 蛋白质序列数据库并行搜索鉴定方法与装置 |
CN111316106A (zh) * | 2017-09-05 | 2020-06-19 | 迪森德克斯公司 | 自动化样品工作流程门控和数据分析 |
-
2020
- 2020-09-09 CN CN202010939999.1A patent/CN114242163B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020080626A (ko) * | 2001-04-16 | 2002-10-26 | 학교법인연세대학교 | 프로테옴 데이터 제공 장치 및 방법 |
US20030036207A1 (en) * | 2001-07-13 | 2003-02-20 | Washburn Michael P. | System and method for storing mass spectrometry data |
WO2003019417A1 (en) * | 2001-08-29 | 2003-03-06 | Bioinfomatix Inc. | System and method for proteome analysis and data management |
US20110313809A1 (en) * | 2003-10-31 | 2011-12-22 | International Business Machines Corporation | System, method and program product for management of life sciences data and related research |
US20060190184A1 (en) * | 2005-02-23 | 2006-08-24 | Incogen, Inc. | System and method using a visual or audio-visual programming environment to enable and optimize systems-level research in life sciences |
CN102411680A (zh) * | 2010-09-26 | 2012-04-11 | 中国科学院计算技术研究所 | 一种蛋白质鉴定的大规模分布式并行加速方法及其系统 |
KR20120131678A (ko) * | 2011-05-26 | 2012-12-05 | 주식회사 이노테라피 | 클라우드 컴퓨팅 네트워크 기반의 프로테오믹스 서비스 제공 시스템 및 그에 의한 서비스 제공방법 |
US20140156612A1 (en) * | 2012-05-07 | 2014-06-05 | Infoclinika, Inc. | Preparing lc/ms data for cloud and/or parallel image computing |
CN108363908A (zh) * | 2017-02-16 | 2018-08-03 | 北京毅新博创生物科技有限公司 | 用于检测生物分子的智谱系统 |
US20190034047A1 (en) * | 2017-07-31 | 2019-01-31 | Wisconsin Alumni Research Foundation | Web-Based Data Upload and Visualization Platform Enabling Creation of Code-Free Exploration of MS-Based Omics Data |
CN111316106A (zh) * | 2017-09-05 | 2020-06-19 | 迪森德克斯公司 | 自动化样品工作流程门控和数据分析 |
CN108537008A (zh) * | 2018-03-20 | 2018-09-14 | 常州大学 | 高通量基因测序大数据分析云平台系统 |
CN110277136A (zh) * | 2019-07-05 | 2019-09-24 | 湖南大学 | 蛋白质序列数据库并行搜索鉴定方法与装置 |
Non-Patent Citations (5)
Title |
---|
BRENDEN JUDSON 等: "Cloud IaaS for Mass Spectrometry and Proteomics: On-Demand Coupling of Cloud Computing to Experimental Facilities", 《SCIENCECLOUD \'17: PROCEEDINGS OF THE 8TH WORKSHOP ON SCIENTIFIC CLOUD COMPUTING》, pages 17 * |
刘洋 等: "小鼠肝脏蛋白质组数据门户", 《生物工程学报》, vol. 35, no. 2019, pages 1715 - 1722 * |
刘海军 等: "基于Make2D-DB Ⅱ构建水稻二维电泳-质谱联动数据库", 《生物信息学》, no. 02, pages 105 - 108 * |
孙瑞祥 等: "基于质谱技术的计算蛋白质组学研究", 《中国科学E辑:信息科学》, no. 2006, pages 222 - 234 * |
张琳 等: "基于MongoDB的蛋白质组学大数据存储系统设计", 《计算机应用》, no. 1, pages 232 - 236 * |
Also Published As
Publication number | Publication date |
---|---|
CN114242163B (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150237113A1 (en) | Method and system for file transmission | |
CN112084098A (zh) | 资源监控系统及工作方法 | |
CN107770229B (zh) | 云端文件分享方法、系统和云服务器 | |
CN106168963B (zh) | 实时流数据的处理方法、装置及服务器 | |
CN104426718B (zh) | 数据监听服务器、缓存服务器和重定向下载方法 | |
US20140359066A1 (en) | System, method and device for offline downloading resource and computer storage medium | |
US20170034020A1 (en) | System and method for monitoring bittorrent content and the computers that share bittorrent content | |
US20140143339A1 (en) | Method, apparatus, and system for resource sharing | |
US10423662B1 (en) | Efficient and scalable time-series data storage and retrieval over a network | |
CN109818934A (zh) | 一种自动化日志处理的方法、装置及计算设备 | |
CN103248636B (zh) | 离线下载的系统及方法 | |
CN113704077A (zh) | 测试用例生成方法及装置 | |
CN103457976B (zh) | 数据下载方法和系统 | |
CN114242163B (zh) | 蛋白质组学的质谱数据的处理系统 | |
US11592809B2 (en) | System and method for measurement data management in a distributed environment | |
Xu et al. | Gatorshare: a file system framework for high-throughput data management | |
US20030115172A1 (en) | Electronic file management | |
US20220300321A1 (en) | Data pipeline | |
CN110187829A (zh) | 一种数据处理方法、装置、系统及电子设备 | |
CN115426216A (zh) | 一种基于复杂虚拟仪器软件的物联网节点互联方法 | |
CN114817256A (zh) | 一种物联网快速统一存储系统 | |
CN112631996A (zh) | 日志搜索方法及装置 | |
KR20130077357A (ko) | P2p기반 업데이트 클라이언트, 서버 장치, 시스템 및 방법 | |
CN112685047A (zh) | 一种基于大文件的快速解析系统 | |
Choi et al. | Sdm: A scientific dataset delivery platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |