CN111352837A - 一种生物信息学高性能计算平台的测试方法 - Google Patents

一种生物信息学高性能计算平台的测试方法 Download PDF

Info

Publication number
CN111352837A
CN111352837A CN202010123124.4A CN202010123124A CN111352837A CN 111352837 A CN111352837 A CN 111352837A CN 202010123124 A CN202010123124 A CN 202010123124A CN 111352837 A CN111352837 A CN 111352837A
Authority
CN
China
Prior art keywords
performance
computing platform
bioinformatics
testing
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010123124.4A
Other languages
English (en)
Inventor
江玥
戴俊程
何元林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hundred Million Co ltd Of Population Health Research Institute Of Section Of Nanjing
Original Assignee
Hundred Million Co ltd Of Population Health Research Institute Of Section Of Nanjing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hundred Million Co ltd Of Population Health Research Institute Of Section Of Nanjing filed Critical Hundred Million Co ltd Of Population Health Research Institute Of Section Of Nanjing
Priority to CN202010123124.4A priority Critical patent/CN111352837A/zh
Publication of CN111352837A publication Critical patent/CN111352837A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种生物信息学高性能计算平台的测试方法,具体包括以下步骤:S1、了解生物信息学需要进行计算测试的需求,并将需求内容记录下来,再根据计算需求选择与生物信息学相匹配的高性能计算平台;S2、根据S1中,选择好匹配的高性能计算平台后,根据计算测试的需求,创建性能测试任务的信息,根据任务信息,本发明涉及生物信息学技术领域。该生物信息学高性能计算平台的测试方法,该测试方法通过选择与生物信息学相匹配的计算平台,然后在对该平台进行高性能测试,将得到的性能指标与标准性能指标进行分析对比,可得出准确的性能测试结果,同时在不同的生物信息学中具有通用性,满足对生物信息学计算平台的测试要求。

Description

一种生物信息学高性能计算平台的测试方法
技术领域
本发明涉及生物信息学技术领域,具体为一种生物信息学高性能计算平台的测试方法。
背景技术
生物信息学是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科,它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘,生物信息学是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学,它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一,其研究重点主要体现在基因组学和蛋白质组学两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息;
计算平台是计算机系统硬件与软件的设计和开发的基础,具有一定的标准性和公开性,同时也决定了该计算机系统的硬件与软件的性能,硬件的基础是中央处理器(CPU),软件的基础是操作系统,因此,通常用作为计算机系统CPU的某种处理机类型和该系统使用的操作系统,即处理机/操作系统来表征计算平台。
在基因组学研究方向内,对于测序数据的分析需要借助高性能的计算平台进行操作,因此高性能计算平台在生物信息学领域起到了至关重要的作用,现有的计算平台只能对其进行基本的系统常规检测,对于生物信息学来说,并未考虑到应用软件的性能特征,同时也未将得到的性能指标与标准性能指标进行比较,使得最终测试结果还存在一定误差的问题,因此本发明针对以上不足,提供了一种生物信息学高性能计算平台的测试方法。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种生物信息学高性能计算平台的测试方法,解决了现有的计算平台只能对其进行基本的系统常规检测,对于生物信息学来说,并未考虑到应用软件的性能特征,同时也未将得到的性能指标与标准性能指标进行比较,使得最终测试结果还存在一定误差的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种生物信息学高性能计算平台的测试方法,具体包括以下步骤:
S1、了解生物信息学需要进行计算测试的需求,并将需求内容记录下来,再根据计算需求选择与生物信息学相匹配的高性能计算平台;
S2、根据S1中,选择好匹配的高性能计算平台后,根据计算测试的需求,创建性能测试任务的信息,根据任务信息,搭建测试环境,安装生物信息学软件,选择具有代表性的测试用例;
S3、创建标准的测试性能指标存储与数据库中,同时调用计算平台的环境接口,在计算平台环境的虚拟主机中部署待测试应用,接收到测试任务开始指令后,为性能测试任务确定目标集群;
S4、将S3中的性能测试任务的场景信息以及测试脚本发送到目标集群中,以便由目标集群中的节点根据存储地址下载测试脚本,并通过执行测试脚本向计算平台的虚拟主机中部署的应用发起访问请求,获取到性能数据后返回,最终接收目标集群返回的性能数据,因而得出计算平台的性能指标数据;
S5、将S4中得出的性能指标数据于S3中的标准性能指标进行比较,最终得出测试结果,并将测试结果通过无线传输模块发送至显示终端上,供人员查看。
优选的,所述步骤S2中性能测试任务的信息包括待测试应用的标识信息、测试场景信息以及场景对应的测试脚本。
优选的,所述步骤S1中的高性能计算平台选用了356GB的内存容量,存储空间为4TB。
优选的,所述步骤S2中的搭建测试环境是指在确定计算平台配置后,在其内部安装操作系统,系统中部署软件,安装编译器,并行环境。
优选的,所述步骤S5中的显示终端是计算机、手机或平板显示器中其中的一种。
优选的,所述步骤S5中的无线传输模块是利用无线技术进行无线传输的一种模块,由发射器、接收器和控制器组成。
(三)有益效果
本发明提供了一种生物信息学高性能计算平台的测试方法。具备以下有益效果:该生物信息学高性能计算平台的测试方法,通过S1、了解生物信息学需要进行计算测试的需求,并将需求内容记录下来,再根据计算需求选择与生物信息学相匹配的高性能计算平台;S2、根据S1中,选择好匹配的高性能计算平台后,根据计算测试的需求,创建性能测试任务的信息,根据任务信息,搭建测试环境,安装生物信息学软件,选择具有代表性的测试用例;S3、创建标准的测试性能指标存储与数据库中,同时调用计算平台的环境接口,在计算平台环境的虚拟主机中部署待测试应用,接收到测试任务开始指令后,为性能测试任务确定目标集群;S4、将S3中的性能测试任务的场景信息以及测试脚本发送到目标集群中,以便由目标集群中的节点根据存储地址下载测试脚本,并通过执行测试脚本向计算平台的虚拟主机中部署的应用发起访问请求,获取到性能数据后返回,最终接收目标集群返回的性能数据,因而得出计算平台的性能指标数据;S5、将S4中得出的性能指标数据于S3中的标准性能指标进行比较,最终得出测试结果,并将测试结果通过无线传输模块发送至显示终端上,供人员查看,该测试方法通过选择与生物信息学相匹配的计算平台,然后在对该平台进行高性能测试,将得到的性能指标与标准性能指标进行分析对比,可得出准确的性能测试结果,同时在不同的生物信息学中具有通用性,满足对生物信息学计算平台的测试要求。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种技术方案:一种生物信息学高性能计算平台的测试方法,该测试方法通过选择与生物信息学相匹配的计算平台,然后在对该平台进行高性能测试,将得到的性能指标与标准性能指标进行分析对比,可得出准确的性能测试结果,同时在不同的生物信息学中具有通用性,满足对生物信息学计算平台的测试要求,具体包括以下步骤:
S1、了解生物信息学需要进行计算测试的需求,并将需求内容记录下来,再根据计算需求选择与生物信息学相匹配的高性能计算平台;
S2、根据S1中,选择好匹配的高性能计算平台后,根据计算测试的需求,创建性能测试任务的信息,根据任务信息,搭建测试环境,安装生物信息学软件,选择具有代表性的测试用例;
S3、创建标准的测试性能指标存储与数据库中,同时调用计算平台的环境接口,在计算平台环境的虚拟主机中部署待测试应用,接收到测试任务开始指令后,为性能测试任务确定目标集群,数据库是“按照数据结构来组织、存储和管理数据的仓库”,是一个长期存储在计算机内的、有组织的、有共享的、统一管理的数据集合,数据库是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合,可视为电子化的文件柜(存储电子文件的处所),用户可以对文件中的数据进行新增、查询、更新和删除等操作,它的存储空间很大,可以存放百万条、千万条、上亿条数据,但是数据库并不是随意地将数据进行存放,是有一定的规则的,否则查询的效率会很低,当今世界是一个充满着数据的互联网世界,充斥着大量的数据,即这个互联网世界就是数据世界,数据的来源有很多,比如出行记录、消费记录、浏览的网页和发送的消息等,除了文本类型的数据,图像、音乐、声音都是数据;
S4、将S3中的性能测试任务的场景信息以及测试脚本发送到目标集群中,以便由目标集群中的节点根据存储地址下载测试脚本,并通过执行测试脚本向计算平台的虚拟主机中部署的应用发起访问请求,获取到性能数据后返回,最终接收目标集群返回的性能数据,因而得出计算平台的性能指标数据,性能测试包括对硬件的测试和对软件的测试,测试脚本一般指的是一个特定测试的一系列指令,这些指令可以被自动化测试工具执行,为了提高测试脚本的可维护性和可复用性,必须在执行测试脚本之前对它们进行构建;
S5、将S4中得出的性能指标数据于S3中的标准性能指标进行比较,最终得出测试结果,并将测试结果通过无线传输模块发送至显示终端上,供人员查看。
本发明中,步骤S2中性能测试任务的信息包括待测试应用的标识信息、测试场景信息以及场景对应的测试脚本。
本发明中,步骤S1中的高性能计算平台选用了356GB的内存容量,存储空间为4TB。
本发明中,步骤S2中的搭建测试环境是指在确定计算平台配置后,在其内部安装操作系统,系统中部署软件,安装编译器,并行环境。
本发明中,步骤S5中的显示终端是计算机、手机或平板显示器中其中的一种。
本发明中,步骤S5中的无线传输模块是利用无线技术进行无线传输的一种模块,由发射器、接收器和控制器组成。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种生物信息学高性能计算平台的测试方法,其特征在于:具体包括以下步骤:
S1、了解生物信息学需要进行计算测试的需求,并将需求内容记录下来,再根据计算需求选择与生物信息学相匹配的高性能计算平台;
S2、根据S1中,选择好匹配的高性能计算平台后,根据计算测试的需求,创建性能测试任务的信息,根据任务信息,搭建测试环境,安装生物信息学软件,选择具有代表性的测试用例;
S3、创建标准的测试性能指标存储与数据库中,同时调用计算平台的环境接口,在计算平台环境的虚拟主机中部署待测试应用,接收到测试任务开始指令后,为性能测试任务确定目标集群;
S4、将S3中的性能测试任务的场景信息以及测试脚本发送到目标集群中,以便由目标集群中的节点根据存储地址下载测试脚本,并通过执行测试脚本向计算平台的虚拟主机中部署的应用发起访问请求,获取到性能数据后返回,最终接收目标集群返回的性能数据,因而得出计算平台的性能指标数据;
S5、将S4中得出的性能指标数据于S3中的标准性能指标进行比较,最终得出测试结果,并将测试结果通过无线传输模块发送至显示终端上,供人员查看。
2.根据权利要求1所述的一种生物信息学高性能计算平台的测试方法,其特征在于:所述步骤S2中性能测试任务的信息包括待测试应用的标识信息、测试场景信息以及场景对应的测试脚本。
3.根据权利要求1所述的一种生物信息学高性能计算平台的测试方法,其特征在于:所述步骤S1中的高性能计算平台选用了356GB的内存容量,存储空间为4TB。
4.根据权利要求1所述的一种生物信息学高性能计算平台的测试方法,其特征在于:所述步骤S2中的搭建测试环境是指在确定计算平台配置后,在其内部安装操作系统,系统中部署软件,安装编译器,并行环境。
5.根据权利要求1所述的一种生物信息学高性能计算平台的测试方法,其特征在于:所述步骤S5中的显示终端是计算机、手机或平板显示器中其中的一种。
6.根据权利要求1所述的一种生物信息学高性能计算平台的测试方法,其特征在于:所述步骤S5中的无线传输模块是利用无线技术进行无线传输的一种模块,由发射器、接收器和控制器组成。
CN202010123124.4A 2020-02-27 2020-02-27 一种生物信息学高性能计算平台的测试方法 Pending CN111352837A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010123124.4A CN111352837A (zh) 2020-02-27 2020-02-27 一种生物信息学高性能计算平台的测试方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010123124.4A CN111352837A (zh) 2020-02-27 2020-02-27 一种生物信息学高性能计算平台的测试方法

Publications (1)

Publication Number Publication Date
CN111352837A true CN111352837A (zh) 2020-06-30

Family

ID=71197202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010123124.4A Pending CN111352837A (zh) 2020-02-27 2020-02-27 一种生物信息学高性能计算平台的测试方法

Country Status (1)

Country Link
CN (1) CN111352837A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111770006A (zh) * 2020-07-29 2020-10-13 上海仁童电子科技有限公司 一种多功能车辆总线网络的通信质量评估方法及装置
CN116340070A (zh) * 2023-03-25 2023-06-27 郑州航空工业管理学院 一种生物信息学高性能计算平台的测试方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984882A (zh) * 2014-05-12 2014-08-13 浪潮电子信息产业股份有限公司 一种生物信息学高性能计算平台的测试方法
CN104156274A (zh) * 2014-08-19 2014-11-19 浪潮(北京)电子信息产业有限公司 一种测试生物信息学计算平台性能的方法
CN104461856A (zh) * 2013-09-22 2015-03-25 阿里巴巴集团控股有限公司 基于云计算平台的性能测试方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104461856A (zh) * 2013-09-22 2015-03-25 阿里巴巴集团控股有限公司 基于云计算平台的性能测试方法、装置及系统
CN103984882A (zh) * 2014-05-12 2014-08-13 浪潮电子信息产业股份有限公司 一种生物信息学高性能计算平台的测试方法
CN104156274A (zh) * 2014-08-19 2014-11-19 浪潮(北京)电子信息产业有限公司 一种测试生物信息学计算平台性能的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111770006A (zh) * 2020-07-29 2020-10-13 上海仁童电子科技有限公司 一种多功能车辆总线网络的通信质量评估方法及装置
CN116340070A (zh) * 2023-03-25 2023-06-27 郑州航空工业管理学院 一种生物信息学高性能计算平台的测试方法

Similar Documents

Publication Publication Date Title
Bouyssié et al. Proline: an efficient and user-friendly software suite for large-scale proteomics
CN103608809B (zh) 推荐数据富集
US7721288B2 (en) Organizing transmission of repository data
US20110282861A1 (en) Extracting higher-order knowledge from structured data
Holman et al. Identifying Proteomic LC‐MS/MS Data Sets with Bumbershoot and IDPicker
US20150227535A1 (en) Caseless file lookup in a distributed file system
US10909086B2 (en) File lookup in a distributed file system
WO2018040270A1 (zh) 在Windows系统中加载Linux系统ELF文件的方法及装置
CN111352837A (zh) 一种生物信息学高性能计算平台的测试方法
Shi et al. A case study of tuning MapReduce for efficient Bioinformatics in the cloud
CN107679186B (zh) 基于实体库进行实体搜索的方法及装置
CN105354318A (zh) 一种文件查找方法及装置
CN113838541B (zh) 设计配体分子的方法和装置
CN111596945A (zh) 嵌入式系统动态多分区固件的差分升级方法
CN110352410A (zh) 跟踪索引节点的访问模式以及预提取索引节点
KR20100083778A (ko) 저장 영역 네트워크 상호 동작 관계의 획득 및 확장
Eisenacher et al. Search and decoy: the automatic identification of mass spectra
CN107463590B (zh) 自动的对话阶段发现
CN109800273A (zh) 一种数据处理的方法、装置、计算机存储介质及终端
CN114237588A (zh) 一种代码仓库选择方法、装置、设备及存储介质
CN112328630A (zh) 数据查询方法、装置、设备及存储介质
CN113760822A (zh) 基于hdfs的分布式智慧校园文件管理系统优化方法及装置
CN113625967A (zh) 数据存储方法、数据查询方法及服务器
KR20220099745A (ko) 지리공간 블록체인 데이터 검색을 위한 공간 분할 기반의 트리 인덱싱 및 질의어 처리 방법 및 장치
CN106776772B (zh) 一种数据检索的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination