CN104537713A - 一种新型三维重构系统 - Google Patents

一种新型三维重构系统 Download PDF

Info

Publication number
CN104537713A
CN104537713A CN201510006885.0A CN201510006885A CN104537713A CN 104537713 A CN104537713 A CN 104537713A CN 201510006885 A CN201510006885 A CN 201510006885A CN 104537713 A CN104537713 A CN 104537713A
Authority
CN
China
Prior art keywords
lsf
module
appion
novel
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510006885.0A
Other languages
English (en)
Other versions
CN104537713B (zh
Inventor
杨涛
徐艳姬
王亚坤
葛云峰
林宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201510006885.0A priority Critical patent/CN104537713B/zh
Publication of CN104537713A publication Critical patent/CN104537713A/zh
Application granted granted Critical
Publication of CN104537713B publication Critical patent/CN104537713B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Processing Or Creating Images (AREA)

Abstract

一种新型三维重构系统包括Appion系统的工作流展现模块、数据指令转换模块、数据配置模块、LSF系统的网格作业队列模块、LSF调度库模块、LSF计费库模块及网络资源池模块。本发明提出的一种新的基于LSF系统、Appion系统和冷冻电子显微镜技术实现三维重构的系统,该系统开创性地将基于Appion系统、冷冻电镜生物结构研究技术和基于LSF的网格计算技术三者有机结合在一起,形成一种新的冷冻电子显微镜三维重构技术,该技术的重要特点是三维重构的流水线技术的实现,该流水线技术能有效降低生物样品电镜图像解析的工作强度,并有效提高结构生物学电镜三维重构方法的研究效率。

Description

一种新型三维重构系统
技术领域
本技术属于结构尘物学领域,具体涉及一种基于LSF系统和Appion系统的冷冻电子显微镜实现三维重构流水线系统。
背景技术
1974年由Taylor K和Glaeser RM创立了冷冻电镜技术(Cryo-ElectronMicroscopy,简称Cryo-EM)。Cryo-EM是一种新兴的尘物大分子三维重构方法,也是一种典型的多学科综合技术,包括电子显微技术、成像技术,计算机三维重构技术和生物信息技术。
Cryo-EM的主要思路是利用冷冻电镜和低剂量电子束成像技术对样本进行电子成像,利用高灵敏底片进行成像记录,并对记录图像进行图像处理,包括尘物分子颗粒识别、校正、去噪等,最后完成样本的三维重构计算。
人类基因组工作草图的绘制完成,标志着生命科学进入了后基因时代。在人类基因组测定之后,人们发现仅从基因组序列的角度根本无法完整、系统地阐明生物体的功能,必须对蛋白质进行结构和功能上的研究,才能更好地理解尘命过程。而以蛋白质为主体的生物大分子的功能主要决定于它们的三维结构。因此,研究生物大分子三维结构和功能之间的关系成为了现代生命科学的一个重要研究领域,生物大分子高分辨率三维结构的研究甚至原子水平结构的研究也已经成为现代结构尘物学的主要内容之一。随着技术设备的进一步成熟和参与研究的人员日益增加,Cryo-EM已逐步发展成为确定蛋白质分子,蛋白质复合物和细胞器结构的一种非常有效和具有美好前景的方法。
传统的生物大分子三维重构技术包括:X射线晶体衍射技术(X-Ray)和核磁共振成像技术(NMR)。对比用于测定结构的传统典型技术,Cryo-EM技术主要具备如下优势:显微镜真空环境的样品制备条件,减少辐射损伤的策略,提高未经染色的电子显微像的信噪比的方法和二位投影三位重构的不同方法;冷冻电镜通过高压快速液氮冷冻的制样方法能够使样品处在接近于生理环境的玻璃态冰中从而保持其天然构像;由于快速冷冻可以捕捉到某个反应过程的中间状态从而可以对大分子复合物进行尘物学功能的动态研究。
随着高性能计算机集群技术和冷冻电子显微镜技术的进一步发展,以及生物医疗领域内对关键尘物样品结构和功能解析的迫切需求,冷冻电子显微镜三维重构方法,已经成为了学术界和工业界的研究热点之一。
LSF(Load Sharing Facility)是Platform公司开发的基于负载均衡的作业调度和资源管理软件系统,是商用网格计算系统的代表性产品,对于解决大规模的计算问题具有很强的优势。LSF是目前使用最为广泛的网格平台搭建工具,相比其他网格计算解决方案来说,它拥有更加强大的底层资源调度能力,能基于现有高级计算资源构建网格数据处理平台。
LSF支持不同的主机架构和操作系统,它把网络中的异构机群当作一个虚拟网络计算机来看待,收集、监控和管理虚拟网络计算机的内在资源(如CPU、内存等)和外部定义的虚拟资源(如许可证等),自动调度用户提交的计算作业到最佳的运算主机,以满足作业对资源的请求。
LSF可持续提供资源管理服务,即使系统中部分主机节点发生问题,主机上运行的作业也不会丢失,可以被及时恢复运行,而发生问题的主机也可被及时调整,恢复高质量的运行能力。该系统同时为计算机系统提供灵活有效的作业管理,保证用户间资源共享,确保优质完成各种复杂的高要求的作业,LSF提供的管理工具能够实时动态提供系统的各种资源的最新状态信息,并以图表的方式直观地显示出来,从而看出资源的使用情况,为领导层的科学决策提供依据。
基于LSF的网格计算目前已经成为了科研院所高性能计算的主流标准配置之一。
Appion是一种著名的开源单颗粒三维重构图像处理流水线系统,主要处理由冷冻电镜产生的大量结构生物图像。此系统利用基于网页,以及流水线和集成化的简单快速图像分析和解析、处理的配套机制,集成了大量电镜图像处理第三方软件,覆盖颗粒挑选、初始模型构建到三维模型修正诸多过程,能在最大限度内对操作过程进行全尘命周期的跟踪和记录,以便新课题的快速复用以及知识的便捷共享。
但目前在尘物学电镜三维重构方面,还没有相关的技术将LSF系统、Appion系统、冷冻电子显微镜相结合来进行三维重构,也没有一种有效的技术手段实现两者的有效沟通,也即无法实现无缝关联和高速传输。
发明内容
本发明的目的就是针对现有技术存在的问题,提出一种结合LSF系统、Appion系统和冷冻电子显微镜技术的三维重构系统,该系统能有效降低尘物样品电镜图像解析的工作强度,并有效提高结构尘物学电镜三维重构方法的研究效率。
一种新型三维重构系统包括Appion系统的工作流展现模块、数据指令转换模块、数据配置模块、LSF系统的网格作业队列模块、LSF系统调度库模块、LSF系统计费库模块及网络资源池模块;
所述Appion系统的工作流展现模块主要实现工作流程界面展示,同时用于Appion系统的参数进行设置;
所述数据指令转换模块主要实现将Appion系统的数据处理作业指令转换为LSF系统队列任务模型;
所述数据配置模块主要完成对Appion系统和LSF系统对接环境的具体设定,主要包括用户设置、作业队列的设置、网格资源池的连接属性设置;
所述LSF系统的网格作业队列模块主要负责接收来经数据指令转换模块转换的Appion系统的数据处理作业,同时,依照LSF调度库模块的策略对LSF系统队列任务模型进行调度管理,最后,将LSF系统队列任务模型的执行状态和结果信息返回给数据指令转换模块;
所述LSF系统调度库模块主要负责对Appion系统数据处理作业进行调度策略的管理;
所述LSF系统计费库模块负责完成对Appion系统数据处理作业进行计费管理,主要依据Appion系统数据处理作业的资源耗费和运行状态信息进行计费;
所述网络资源池模块负责执行Appion系统数据处理作业,并依照LSF系统的网格作业队列模块申请计算机资源的数量和LSF调度库模块的策略,调配空闲的网格资源对实际数据进行处理。
进一步的,所述数据指令转换模块能同时将2两个以上Appion系统的数据处理指令转换为LSF系统的队列任务处理模型,所述数据指令转换模块处理数据的数量与和网格资源池模块所包含资源的大小成正比。
进一步的,所述LSF系统网格作业队列模块能同时在网络资源池模块上调度多个LSF系统队列任务模型。
进一步的,所述LSF调度库模块的调度策略包括先来先到和小作业优先策略。
本发明的有益效果在于:本发明提出的一种新的基于LSF系统、Appion系统和冷冻电子显微镜技术实现三维重构的系统,该系统开创性地将基于Appion系统、冷冻电镜生物结构研究技术和基于LSF系统的网格计算技术三者有机结合在一起,形成一种新的冷冻电子显微镜三维重构技术,该技术的重要特点是三维重构的流水线技术的实现,该流水线技术能有效降低生物样品电镜图像解析的工作强度,并有效提高结构生物学电镜三维重构方法的研究效率。
附图说明
图1为本发明所述一种新型三维重构系统的框架说明图;
图2为本发明所述一种新型三维重构系统的数据处理流程示意图;
图3为本发明所述数据指令转换模块数据处理流程示意图。
具体实施方式
如图1所示,本发明所述的一种新型三维重构系统包括Appion系统的工作流展现模块、数据指令转换模块、数据配置模块、LSF系统的网格作业队列模块、LSF系统调度库模块、LSF系统计费库模块及网络资源池模块。其中:
所述Appion系统的工作流展现模块主要实现工作流程界面展示,同时用于Appion系统的参数进行设置;
所述数据指令转换模块主要实现将Appion系统的数据处理作业指令转换为LSF系统队列任务模型;
所述数据配置模块主要完成对Appion系统和LSF系统对接环境的具体设定,主要包括用户设置、作业队列的设置、网格资源池的连接属性设置;
所述LSF系统的网格作业队列模块主要负责接收来经数据指令转换模块转换的Appion系统的数据处理作业,同时,依照LSF调度库模块的策略对LSF系统队列任务模型进行调度管理,最后,将LSF系统队列任务模型的执行状态和结果信息返回给数据指令转换模块;
所述LSF系统调度库模块主要负责对Appion系统数据处理作业进行调度策略的管理;
所述LSF系统计费库模块负责完成对Appion系统数据处理作业进行计费管理,主要依据Appion系统数据处理作业的资源耗费和运行状态信息进行计费;
所述网络资源池模块负责执行Appion系统数据处理作业,并依照LSF系统的网格作业队列模块申请计算机资源的数量和LSF调度库模块的策略,调配空闲的网格资源对实际数据进行处理。
本发明所述的一种新型三维重构系统关键在于通过设计和实现Appion系统与LSF模块系统的互联互通,也就是本技术方案中提及的数据指令转换模块,将科研人员从事的Appion系统的数据处理工作自动转换成LSF异步任务指令,利用网格资源进行高速并行数据处理,并将任务结果反馈给科研人员。
如图2所示,本发明所述的一种新型三维重构系统的整体数据流程及步骤如下:
步骤一:启动Appion系统和LSF系统并初始化,用户Appion系统和LSF系统,同时搭建计算网格系统环境;
步骤二:在Appion系统中指定工作目录和处理工具;
步骤三:对Appion设置图像处理工具的相关参数;
步骤四:设置LSF队列相关参数;
步骤五:将Appion系统的数据处理工作自动转换成LSF系统异步任务指令并提交给LSF进行调度和执行;
步骤六:科研员或系统管理员对LSF系统队列的执行情况和状态进行实时监控;
步骤七:LSF系统任务完成并返回结果给科研员,本次任务会话完成。
如图3所示,本发明所述数据指令转换模块的工作流程图,也即将Appion系统的数据处理工作自动转换成LSF系统异步任务指令的工作流程为:
步骤一:加载一种新型三维重构系统的数据指令转换模块,并对建立Appion系统和LSF系统之间的协同工作环境;
步骤二:数据指令转换模块接收到科研员的特定数据处理任务指令,开启一个新的任务会话;
步骤三:数据指令转换模块加载LSF系统任务脚本的前缀等信息,并形成初始任务模板;所述前缀信息包括:bsub,#BSUB-a,#BSUB-e,#BSUB-o等;
步骤四:数据指令转换模块加载用户、环境变量和队列等信息到任务模板;
步骤五:数据指令转换模块加载用户数据、指令或程序、参数和资源申请等信息到任务模板;
步骤六:数据指令转换模块完成科研员本次数据处理的LSF系统任务清单的组装并提交给LSF系统进行调度和执行;
步骤七:基于bjobs方式返回LSF系统的处理状态和结果给科研员。
利用本发明所述的一种新型三维重构系统实现三维重构的过程为:冷冻电子显微镜按照科研员的操作对指定生物样品进行原始图像的拍摄,拍摄后的图像由本发明所述一种新型三维重构系统进行分发处理以得到相应结。具体的为图像是由Appion系统的数据处理工作自动转换成LSF系统异步任务指令并提交给LSF系统进行调度和执行。
LSF系统的执行包括:对原始图像进行样品大分子颗粒图像的挑选,去除质量低下的图像;基于筛选过的颗粒图像进行二维分类和平均等计算处理;构建该生物样品大分子的初始三维模型;修正模型各种参数设置,并进行迭代、收敛和求精等计算处理;获取该生物样品大分子的最终三维模型。

Claims (4)

1.一种新型三维重构系统,其特征在于:所述的三维重构系统包括Appion系统的工作流展现模块、数据指令转换模块、数据配置模块、LSF系统的网格作业队列模块、LSF系统调度库模块、LSF系统计费库模块及网络资源池模块;
所述Appion系统的工作流展现模块主要实现工作流程界面展示,同时用于Appion系统的参数进行设置;
所述数据指令转换模块主要实现将Appion系统的数据处理作业指令转换为LSF系统队列任务模型;
所述数据配置模块主要完成对Appion系统和LSF系统对接环境的具体设定,主要包括用户设置、作业队列的设置、网格资源池的连接属性设置;
所述LSF系统的网格作业队列模块主要负责接收来经数据指令转换模块转换的Appion系统的数据处理作业,同时,依照LSF调度库模块的策略对LSF系统队列任务模型进行调度管理,最后,将LSF系统队列任务模型的执行状态和结果信息返回给数据指令转换模块;
所述LSF系统调度库模块主要负责对Appion系统数据处理作业进行调度策略的管理;
所述LSF系统计费库模块负责完成对Appion系统数据处理作业进行计费管理,主要依据Appion系统数据处理作业的资源耗费和运行状态信息进行计费;
所述网络资源池模块负责执行Appion系统数据处理作业,并依照LSF系统的网格作业队列模块申请计算机资源的数量和LSF调度库模块的策略,调配空闲的网格资源对实际数据进行处理。
2.如权利要求1所述的一种新型三维重构系统,其特征在于:所述数据指令转换模块能同时将2两个以上Appion系统的数据处理指令转换为LSF系统的队列任务处理模型,所述数据指令转换模块处理数据的数量与和网格资源池模块所包含资源的大小成正比。
3.如权利要求1所述的一种新型三维重构系统,其特征在于:所述LSF系统网格作业队列模块能同时在网络资源池模块上调度多个LSF系统队列任务模型。
4.如权利要求1所述的一种新型三维重构系统,其特征在于:所述LSF调度库模块的调度策略包括先来先到和小作业优先策略。
CN201510006885.0A 2015-01-05 2015-01-05 一种新型三维重构系统 Expired - Fee Related CN104537713B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510006885.0A CN104537713B (zh) 2015-01-05 2015-01-05 一种新型三维重构系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510006885.0A CN104537713B (zh) 2015-01-05 2015-01-05 一种新型三维重构系统

Publications (2)

Publication Number Publication Date
CN104537713A true CN104537713A (zh) 2015-04-22
CN104537713B CN104537713B (zh) 2017-10-03

Family

ID=52853232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510006885.0A Expired - Fee Related CN104537713B (zh) 2015-01-05 2015-01-05 一种新型三维重构系统

Country Status (1)

Country Link
CN (1) CN104537713B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590338A (zh) * 2015-12-07 2016-05-18 中国科学院微电子研究所 一种扫描电子显微图像的三维重构方法
CN106568402A (zh) * 2016-11-16 2017-04-19 上海大学 一种测试微小孔洞深度的方法
CN108884133A (zh) * 2017-03-02 2018-11-23 智能病毒成像公司 使用水合状态成像定量测量颗粒含量的方法
CN111461054A (zh) * 2020-04-14 2020-07-28 上海月新生科信息科技有限公司 一种关于冷冻电镜单颗粒分析数据全流程自动分析的方法
US20220300321A1 (en) * 2021-03-19 2022-09-22 Regeneron Pharmaceuticals, Inc. Data pipeline

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521024B (zh) * 2011-11-23 2013-07-31 北京市计算中心 基于生物信息云平台的作业调度方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GABRIEL C.LANDER ET AL: "Appion:An integrated,database-driven pipeline to facilitate EM image processing", 《JOURNAL OF STRUCTURAL BIOLOGY》 *
LAUREN S.FISHER ET AL: "A helical processing pipeline for EM structure determination of membrane proteins", 《METHODS》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590338A (zh) * 2015-12-07 2016-05-18 中国科学院微电子研究所 一种扫描电子显微图像的三维重构方法
CN105590338B (zh) * 2015-12-07 2018-08-10 中国科学院微电子研究所 一种扫描电子显微图像的三维重构方法
CN106568402A (zh) * 2016-11-16 2017-04-19 上海大学 一种测试微小孔洞深度的方法
CN108884133A (zh) * 2017-03-02 2018-11-23 智能病毒成像公司 使用水合状态成像定量测量颗粒含量的方法
CN111461054A (zh) * 2020-04-14 2020-07-28 上海月新生科信息科技有限公司 一种关于冷冻电镜单颗粒分析数据全流程自动分析的方法
CN111461054B (zh) * 2020-04-14 2021-04-27 上海月新生科信息科技有限公司 一种关于冷冻电镜单颗粒分析数据全流程自动分析的方法
US20220300321A1 (en) * 2021-03-19 2022-09-22 Regeneron Pharmaceuticals, Inc. Data pipeline

Also Published As

Publication number Publication date
CN104537713B (zh) 2017-10-03

Similar Documents

Publication Publication Date Title
Abd Elaziz et al. Advanced optimization technique for scheduling IoT tasks in cloud-fog computing environments
Teodoro et al. High-throughput analysis of large microscopy image datasets on CPU-GPU cluster platforms
Sun et al. Automatic remotely sensed image classification in a grid environment based on the maximum likelihood method
Wong et al. The top 10 challenges in extreme-scale visual analytics
CN104537713A (zh) 一种新型三维重构系统
Cao et al. Distributed parallel particle swarm optimization for multi-objective and many-objective large-scale optimization
US10484479B2 (en) Integration of quantum processing devices with distributed computers
Reaño et al. CU2rCU: Towards the complete rCUDA remote GPU virtualization and sharing solution
WO2018196296A1 (zh) 一种非一致性内存访问架构下的虚拟机调度装置及方法
CN108665963A (zh) 一种影像数据分析方法及相关设备
CN103984529B (zh) 基于飞腾处理器的x图形系统并行加速方法
Li et al. nnsam: Plug-and-play segment anything model improves nnunet performance
Wei et al. Parallel clustering for visualizing large scientific line data
Moreland et al. Flexible analysis software for emerging architectures
Kang et al. Rapid implementation of COVID-19 AI assisted diagnosis system based on supercomputing platform
CN102866881A (zh) 矢量网络分析仪数据转换的一般化及并行化的实现方法
Wang et al. Dual threshold adaptive dynamic migration strategy of virtual resources based on bbu pool
Camarasu-Pop et al. Exploiting GPUs on distributed infrastructures for medical imaging applications with VIP and DIRAC
Chiang et al. Thread-aware mechanism to enhance inter-node load balancing for multithreaded applications on numa systems
Agulleiro et al. Dynamic load scheduling on CPU-GPU for iterative tomographic reconstruction
CN103150212A (zh) 量子力学计算的实现方法和装置
CN102385668A (zh) 一种基于蛋白质分子场预测相互作用位点的方法
Teodoro et al. CPU-GPU Cluster Platforms
Demiralp et al. Performance Assessment of Diffusive Load Balancing for Distributed Particle Advection
Shen et al. An AP SoC for a unified architecture

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171003

Termination date: 20210105

CF01 Termination of patent right due to non-payment of annual fee