CN111681703A - 一种蛋白结构的对接方法及分布式蛋白结构对接系统 - Google Patents

一种蛋白结构的对接方法及分布式蛋白结构对接系统 Download PDF

Info

Publication number
CN111681703A
CN111681703A CN202010388918.3A CN202010388918A CN111681703A CN 111681703 A CN111681703 A CN 111681703A CN 202010388918 A CN202010388918 A CN 202010388918A CN 111681703 A CN111681703 A CN 111681703A
Authority
CN
China
Prior art keywords
task
thread
protein structure
docking
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010388918.3A
Other languages
English (en)
Inventor
谢敬聃
袁普卫
王志伟
王晶晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Neuron Smart Technology Co ltd
Original Assignee
Beijing Neuron Smart Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Neuron Smart Technology Co ltd filed Critical Beijing Neuron Smart Technology Co ltd
Priority to CN202010388918.3A priority Critical patent/CN111681703A/zh
Publication of CN111681703A publication Critical patent/CN111681703A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本公开提供了一种蛋白结构的对接方法及分布式蛋白结构对接系统,该方法包括:获取待处理任务的所有蛋白结构,根据待处理任务创建至少一个线程任务,其中,线程任务用于处理待处理任务中的至少一个蛋白结构;将所有线程任务分配至至少一个运算节点中,使运算节点执行线程任务中的蛋白结构的对接,并生成线程任务对接的评估数据,其中,每个运算节点至少分配有一个线程任务。本公开对运算资源通过中央处理单元实现了统一的调度使用,以并行形式实现了海量蛋白结构的分配,使每个运算节点可以实现同时进行蛋白结构的对接处理,加快整体蛋白结构的对接速度,提升了整体任务处理效率,实现了海量蛋白结构的对接。

Description

一种蛋白结构的对接方法及分布式蛋白结构对接系统
技术领域
本公开涉及医学药物领域,特别涉及一种蛋白结构的对接方法及分布式蛋白结构对接系统。
背景技术
在抗体研发过程中,通过计算机模拟蛋白与蛋白的结构对接是非常重要的一个环节,因抗体研发属于医药专业领域,从业人员很少有专业的计算机软件研发能力,绝大多数专家与学者是通过已有的专业软件或在线网络服务进行该工作的,蛋白-蛋白对接如今比较著名的软件有Hex Protein Docking,ZDock,rDock,Rosetta等等。其中Hex ProteinDocking虽算法比较复杂,但没有评分功能,ZDock一般作为前期的初对接,rDock为ZDock的升级算法,一般将ZDock对接后的前几个得分构象使用rDock进行进一步对接。但是这些算法均存在如下主要问题,即运算速度缓慢,对接效率较低,单个蛋白对接需要耗费的时间为5-10分钟不等,对于海量蛋白结构数据的对接任务是无法完成的,进而影响了抗体的研发和药物的开发进度。
发明内容
本公开实施例的目的在于提供一种蛋白结构的对接方法及分布式蛋白结构对接系统,以解决现有技术中的对接算法运算速度慢,对接效率低,无法实现海量蛋白结构对接的问题。
为了解决上述技术问题,本公开的实施例采用了如下技术方案:一种蛋白结构的对接方法,包括:获取待处理任务的所有蛋白结构,根据所述待处理任务创建至少一个线程任务,其中,所述线程任务用于处理所述待处理任务中的至少一个蛋白结构;将所有所述线程任务分配至至少一个运算节点中,使所述运算节点执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对接的评估数据,其中,每个所述运算节点至少分配有一个线程任务。
进一步,所述在获取待处理任务的所有蛋白结构之前,还包括:接收预设算力;根据所述预设算力从所有运算资源中为所述待处理任务分配至少一个运算节点,其中,所述运算资源至少包括以下之一:服务器、中央处理器、硬盘、云盘。
进一步,所述根据所述待处理任务创建至少一个线程任务之后,还包括:对每个所述线程任务中的所述蛋白结构进行第一预设处理,其中,所述第一预设处理至少包括以下之一:蛋白结构完整性验证、蛋白结构的文件的有效性验证、蛋白结构的文件的存储位置验证。
进一步,所述将所有所述线程任务分配至至少一个运算节点中,使所述运算节点执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对接的评估数据之后,还包括:接收所有所述运算节点发送的所述评估数据,对所述评估数据进行第二预设处理,得到所述待处理任务的蛋白结构对接结果,其中,所述第二预设处理至少包括以下之一:所述评估数据的有效性分析、所述评估数据的过滤、所述评估数据的排序。
进一步,还包括:接收预设对接位置信息;在所述蛋白结构上确定所述预设对接位置对应的角度范围;创建第一线程任务用于处理所述蛋白结构上处于所述角度范围内的抗体结合位点,并将所述第一线程任务分配至第一运算节点。
本公开实施例还公开了一种分布式的蛋白结构对接系统,包括:中央处理单元,用于在获取待处理任务的所有蛋白结构后,创建至少一个线程任务,并将所有所述线程任务分配至至少一个运算节点中,其中,所述线程任务用于处理所述待处理任务中的至少一个蛋白结构;至少一个运算节点,用于执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对应的评估数据,其中,每个所述运算节点至少分配有一个线程任务。
进一步,所述中央处理单元还用于:接收预设算力;根据所述预设算力从所有运算资源中为所述待处理任务分配至少一个运算节点,其中,所述运算资源至少包括以下之一:服务器、中央处理器、硬盘、云盘。
进一步,所述中央处理单元还用于:在创建至少一个线程任务后,对每个所述线程任务中的所述蛋白结构进行第一预设处理,其中,所述第一预设处理至少包括以下之一:蛋白结构完整性验证、蛋白结构的文件的有效性验证、蛋白结构的文件的存储位置验证。
进一步,所述运算节点还用于,将每个线程任务的评估数据发送至所述中央处理单元;所述中央处理单元还用于,在接收到所述运算节点发送的所述评估数据后,对所述评估数据进行第二预设处理,得到所述待处理任务的蛋白结构对接结果,其中,所述第二预设处理至少包括以下之一:所述评估数据的有效性分析、所述评估数据的过滤、所述评估数据的排序。
进一步,所述中央处理单元还用于:接收预设对接位置信息;在所述蛋白结构上确定所述预设对接位置对应的角度范围;创建第一线程任务用于处理所述蛋白结构上处于所述角度范围内的抗体结合位点,并将所述第一线程任务分配至第一运算节点;所述第一运算节点,用于执行所述第一线程任务中的所述蛋白结构在所述角度范围内的对接。
本公开实施例的有益效果在于:对各种分布式部署的运算资源通过中央处理单元实现了统一的调度和使用,以并行的形式实现了待处理任务中海量蛋白结构的分配,使每个运算节点可以实现同时进行蛋白结构的对接处理,加快整体蛋白结构的对接速度,提升了整体任务处理效率,实现了海量蛋白结构的对接。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开第一实施例中蛋白结构的对接方法的流程图;
图2为本公开第一实施例中蛋白结构的对接方法的另一种流程图;
图3为本公开第二实施例中分布式的蛋白结构对接系统的结构示意图。
具体实施方式
此处参考附图描述本公开的各种方案以及特征。
应理解的是,可以对此处申请的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本公开的范围和精神内的其他修改。
包含在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且与上面给出的对本公开的大致描述以及下面给出的对实施例的详细描述一起用于解释本公开的原理。
通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本公开的这些和其它特性将会变得显而易见。
还应当理解,尽管已经参照一些具体实例对本公开进行了描述,但本领域技术人员能够确定地实现本公开的很多其它等效形式,它们具有如权利要求的特征并因此都位于借此所限定的保护范围内。
当结合附图时,鉴于以下详细说明,本公开的上述和其他方面、特征和优势将变得更为显而易见。
此后参照附图描述本公开的具体实施例;然而,应当理解,所申请的实施例仅仅是本公开的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本公开模糊不清。因此,本文所申请的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本公开。
本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本公开的相同或不同实施例中的一个或多个。
本公开的第一实施例提供了一种蛋白结构的对接方法,其主要应用于分布式的系统中,该系统通过对一定数量的物理服务器的集群部署作为硬件基础,通过一中央处理单元实现对上述物理服务器的统一调配,该方法的流程图如图1所示,主要包括步骤S1和S2:
S1,获取待处理任务的所有蛋白结构,根据待处理任务创建至少一个线程任务;
S2,将所有线程任务分配至至少一个运算节点中,使运算节点执行线程任务中的蛋白结构的对接,并生成线程任务对接的评估数据。
在实际使用时,组成分布式系统的物理服务器可以是任意运算资源,例如具有计算处理功能的服务器、中央处理器CPU、具有存储功能的硬盘或各类云盘,如超算云、商业共有云、私有云等,中央处理单元通过对上述运算资源的统一调配和并行的运算框架安装,使其在使用时可以实现弹性的运算资源调配。具体地,研究人员在执行需要运算的待处理任务时只需要手动设置所需要的预设算力,并将该预设算力发送至中央处理单元,由中央处理单元根据该预设算力从上述部署的所有运算资源中为本次待处理任务分配至少一个运算节点,以满足用户申请的预设算力,并在相应的运算节点上自动部署运算框架,使其形成处理任务的一个独立的运算节点,至此完成了任务处理之前的环境配置。其中,算力是指运算资源,如服务器、CPU、硬盘等运算资源,同时也涵盖超算云、商业公有云、私有云等资源。
获取待处理任务后,获取待处理任务中所包含的所有蛋白结构的文件,保存在中央处理单元的待执行任务池中,随后根据待处理任务创建至少一个线程任务,使上述创建的至少一个线程任务以并行的形式在待执行任务池中读取待处理任务的至少一个蛋白结构。需要注意的是,具体创建的线程任务的数量是中央处理单元基于待处理任务的蛋白结构的总量和预设算力进行确定的,当蛋白结构较多且具有足够的算力进行处理时,线程任务的数量也会相应较多,以提升同时可被处理的蛋白结构的数量。
进一步地,在线程任务创建后,还可以对每个线程任务中的蛋白结构进行第一预设处理,其中,第一预设处理至少包括以下之一:蛋白结构完整性验证、蛋白结构的文件的有效性验证、蛋白结构的文件的存储位置验证等,以提升准确性,降低后续处理过程中出现问题的概率;经过中央处理单元第一预设处理后未出现结构不完整、文件失效或存储位置不可读等问题的线程任务可以被分配至各个运算节点进行后续处理,而出现了上述问题的线程任务可由中央处理单元记录具体的问题情况,可进行二次验证或直接向研究人员反馈问题原因,由研究人员人为进行问题的解决。
各个线程任务被分配至各个运算节点后,由各个运算节点进行线程任务中蛋白结构的对接,应当了解的是,运算节点中进行蛋白对接的方式可以直接使用现有的对接算法实现,例如同源建模法、折叠识别法等,也可以根据需求开发新的对接算法,本实施例在此不进行限制,并且,在不同的运算节点中也可以使用不同的算法进行对接,只要能实现蛋白结构的对接即可。具体地,运算节点实质上为集群部署的分布式运算资源,每个运算节点均为独立运行的,多个运算节点之间可以同时进行不同线程任务的并行处理,进而提升了同一时刻蛋白结构对接的数量,加快了整体的任务处理效率。
当运算节点完成一个线程任务中所有蛋白结构的对接之后,生成该线程任务对应的评估数据,主要为蛋白的亲和力评估数据,并将该评估数据发送至中央处理单元,至此,单个线程任务完结。中央处理单元在接收到各个运算节点反馈回的评估数据后,将其统一置于自身的数据处理池中,在针对当前待处理任务的所有线程任务均执行完毕后,由中央处理单元对数据处理池中的所有评估数据进行第二预设处理,以形成完整的蛋白结构对接结果,其中,第二预设处理至少包括以下之一:评估数据的有效性分析、评估数据的过滤、评估数据的排序等。
另外,在现有技术中,如Hex Protein Docking,ZDock,rDock,Rosetta等等均为单个蛋白与蛋白的对接处理,处理过程固化,大致过程为固定受体蛋白不动,配体蛋白质在360*360*180的旋转空间进行旋转,每旋转一个角度,都进行一次三维平移空间搜索。此时往往会产生过多的冗余数据,最明显的就是相邻的10至15度左右的旋转,得到的最终效果极为接近。另外,依试验基础经验获得,在蛋白与蛋白对接时往往只是某些位点的对接评分是比较高的,又或者一些研究者仅想了解某些固定位点的对接情况,以现有的软件或服务器是无法完成的。因此,本实施例所提供的对接方法还可以实现以下流程,如图2所示。
S11,接收预设对接位置信息;该信息由研究人员发出,其内所包含的预设对接位置对应的即是研究人员指定的抗体结合位点,在本实施例中以一个数值表示;
S12,在蛋白结构上确定预设对接位置对应的角度范围;中央处理单元在接到该预设对接位置信息之后,将代表指定抗体结合点位的数值转化为蛋白结构在三维空间内的一个角度范围;
S13,创建第一线程任务用于处理蛋白结构上处于角度范围内的抗体结合位点,并将第一线程任务分配至第一运算节点;通过创建一个第一线程任务用于处理该蛋白结构上处于该角度范围内的抗体结合位点,并将其分配至第一运算节点进行处理,第一运算节点可以为任意一个运算节点,在接收到指定对接位置的第一线程任务后,在进行蛋白结构对接处理时,第一运算节点将自动调整抗原位置与抗体位置,在指定角度范围内进行旋转与对接,在得到相关评估数据后,将其发回至中央和处理单元,并由中央处理单元实现评估数据的验证和筛选,并得到研究人员指定点位的蛋白结构对接结果。
本实施例基于分布式的系统,对各种运算资源通过中央处理单元实现了统一的调度和使用,以并行的形式实现了待处理任务中海量蛋白结构的分配,使每个运算节点可以实现同时进行蛋白结构的对接处理,加快整体蛋白结构的对接速度,提升了整体任务处理效率,实现了海量蛋白结构的对接。与此同时,本实施例通过对蛋白结构固定的对接位置进行设定,实现了更明确更高效更精确的蛋白对接要求,避免了大量的冗余数据处理,提升了蛋白结构对接的针对性和效率。
本公开的第二实施例提供了一种分布式的蛋白结构对接系统,该对接系统基于云计算平台,对计算机CPU、内存、硬盘以及各类云盘等运算资源,在进行海量蛋白结构对接时,以分布式的形式通过多个运算节点进行同时处理,实现了高性能、高可靠性、高精度的对接系统,为研发人员提供了更准确更多可能的蛋白对接评分结果。该对接系统的结构示意图如图3所示,主要包括中央处理单元10和至少一个运算节点20,中央处理单元10主要用于获取待处理任务,并进行任务分配和接收计算结果等;各个运算节点20则主要用于进行并行的蛋白结构对接操作,并上传各自的计算结果至中央处理单元10。
在实际使用时,通过对一定数量的物理服务器的集群部署,形成了对接系统的硬件基础,上述物理服务器可以是任意运算资源,例如具有计算处理功能的服务器、中央处理器CPU、具有存储功能的硬盘或各类云盘,如超算云、商业共有云、私有云等,通过对上述运算资源的统一调配和并行的运算框架,使对接系统在使用时可以实现弹性的运算资源调配。具体地,研究人员在执行需要运算的待处理任务时只需要手动设置所需要的预设算力,即可由中央处理单元10根据该预设算力从上述部署的所有运算资源中为本次待处理任务分配至少一个运算节点20,其中,算力是指运算资源,默认情况下是不开通不使用的,在用户需要进行使用时,向中央处理单元10申请预设算力的调配,中央处理单元10会根据申请的预设算力,从所有运算资源中为本次任务分配指定的运算资源,以满足用户申请的预设算力,例如中央处理单元10会自动选择超算云、商业共有云、私有云上的资源,实现自动的动态申请、开通,并在其上自动部署运算框架,使其形成处理任务的一个独立的运算节点,至此完成了任务处理之前的环境配置。
在获取待处理任务后,中央处理单元10自动获取待处理任务中所包含的所有蛋白结构的文件,保存在自身的待执行任务池中,随后通过多线程任务管理子单元,创建至少一个线程任务,使上述创建的至少一个线程任务以并行的形式在待执行任务池中读取待处理任务的至少一个蛋白结构。需要注意的是,具体创建的线程任务的数量是中央处理单元10基于待处理任务的蛋白结构的总量和预设算力进行确定的,当蛋白结构较多且具有足够的算力进行处理时,线程任务的数量也会相应较多,以提升同时可被处理的蛋白结构的数量。
进一步地,中央处理单元10在线程任务创建后,还可以对每个线程任务中的蛋白结构进行第一预设处理,其中,第一预设处理至少包括以下之一:蛋白结构完整性验证、蛋白结构的文件的有效性验证、蛋白结构的文件的存储位置验证等,以提升准确性,降低后续处理过程中出现问题的概率;经过第一预设处理后未出现结构不完整、文件失效或存储位置不可读等问题的线程任务可以被分配至各个运算节点20进行后续处理,而出现了上述问题的线程任务可由中央处理单元10记录具体的问题情况,可进行二次验证或直接向研究人员反馈问题原因,由研究人员人为进行问题的解决。
各个线程任务被分配至各个运算节点20后,由各个运算节点20进行线程任务中蛋白结构的对接,应当了解的是,运算节点20中进行蛋白对接的方式可以直接使用现有的对接算法实现,例如同源建模法、折叠识别法等,也可以根据需求开发新的对接算法,本实施例在此不进行限制,并且,在不同的运算节点20中也可以使用不同的算法进行对接,只要能实现蛋白结构的对接即可。具体地,运算节点20实质上为集群部署的分布式运算资源,每个运算节点20均为独立运行的,多个运算节点20之间可以同时进行不同线程任务的并行处理,进而提升了同一时刻蛋白结构对接的数量,加快了整体的任务处理效率。
当运算节点20完成一个线程任务中所有蛋白结构的对接之后,生成该线程任务对应的评估数据,主要为蛋白的亲和力评估数据,并将该评估数据发送至中央处理单元10,至此,单个线程任务完结,此时运算节点20可向中央处理单元10请求下一个线程任务,或在自身的线程任务队列中获取下一个线程任务进行处理。中央处理单元10在接收到各个运算节点20反馈回的评估数据后,将其统一置于自身的数据处理池中,在针对当前待处理任务的所有线程任务均执行完毕后,由中央处理单元10对数据处理池中的所有评估数据进行第二预设处理,以形成完整的蛋白结构对接结果,其中,第二预设处理至少包括以下之一:评估数据的有效性分析、评估数据的过滤、评估数据的排序等。
另外,在现有技术中,如Hex Protein Docking,ZDock,rDock,Rosetta等等均为单个蛋白与蛋白的对接处理,处理过程固化,大致过程为固定受体蛋白不动,配体蛋白质在360*360*180的旋转空间进行旋转,每旋转一个角度,都进行一次三维平移空间搜索。此时往往会产生过多的冗余数据,最明显的就是相邻的10至15度左右的旋转,得到的最终效果极为接近。另外,依试验基础经验获得,在蛋白与蛋白对接时往往只是某些位点的对接评分是比较高的,又或者一些研究者仅想了解某些固定位点的对接情况,以现有的软件或服务器是无法完成的。因此,本实施例所提供的对接系统还可以实现以下功能,接收由研究人员发出的预设对接位置信息,该信息内所包含的预设对接位置对应的即是研究人员指定的抗体结合位点,在本实施例中以一个数值表示,中央处理单元10在接到该预设对接位置信息之后,将代表指定抗体结合点位的数值转化为蛋白结构在三维空间内的一个角度范围,通过创建一个第一线程任务用于处理该蛋白结构上处于该角度范围内的抗体结合位点,并将其分配至第一运算节点进行处理。第一运算节点可以为任意一个运算节点20,在接收到指定对接位置的第一线程任务后,在进行蛋白结构对接处理时,第一运算节点将自动调整抗原位置与抗体位置,在指定角度范围内进行旋转与对接,在得到相关评估数据后,将其发回至中央和处理单元10,并由中央处理单元10实现评估数据的验证和筛选,并得到研究人员指定点位的蛋白结构对接结果。
本实施例基于分布式的对接系统,对各种运算资源通过中央处理单元实现了统一的调度和使用,以并行的形式实现了待处理任务中海量蛋白结构的分配,使每个运算节点可以实现同时进行蛋白结构的对接处理,加快整体蛋白结构的对接速度,提升了整体任务处理效率,实现了海量蛋白结构的对接。与此同时,本实施例通过对蛋白结构固定的对接位置进行设定,实现了更明确更高效更精确的蛋白对接要求,避免了大量的冗余数据处理,提升了蛋白结构对接的针对性和效率。
以上对本公开多个实施例进行了详细说明,但本公开不限于这些具体的实施例,本领域技术人员在本公开构思的基础上,能够做出多种变型和修改实施例,这些变型和修改都应落入本公开所要求保护的范围之内。

Claims (10)

1.一种蛋白结构的对接方法,其特征在于,包括:
获取待处理任务的所有蛋白结构,根据所述待处理任务创建至少一个线程任务,其中,所述线程任务用于处理所述待处理任务中的至少一个蛋白结构;
将所有所述线程任务分配至至少一个运算节点中,使所述运算节点执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对接的评估数据,其中,每个所述运算节点至少分配有一个线程任务。
2.根据权利要求1所述的对接方法,其特征在于,所述在获取待处理任务的所有蛋白结构之前,还包括:
接收预设算力;
根据所述预设算力从所有运算资源中为所述待处理任务分配至少一个运算节点,其中,所述运算资源至少包括以下之一:服务器、中央处理器、硬盘、云盘。
3.根据权利要求1所述的对接方法,其特征在于,所述根据所述待处理任务创建至少一个线程任务之后,还包括:
对每个所述线程任务中的所述蛋白结构进行第一预设处理,其中,所述第一预设处理至少包括以下之一:蛋白结构完整性验证、蛋白结构的文件的有效性验证、蛋白结构的文件的存储位置验证。
4.根据权利要求1所述的对接方法,其特征在于,所述将所有所述线程任务分配至至少一个运算节点中,使所述运算节点执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对接的评估数据之后,还包括:
接收所有所述运算节点发送的所述评估数据,对所述评估数据进行第二预设处理,得到所述待处理任务的蛋白结构对接结果,其中,所述第二预设处理至少包括以下之一:所述评估数据的有效性分析、所述评估数据的过滤、所述评估数据的排序。
5.根据权利要求1至4中任一项所述的对接方法,其特征在于,还包括:
接收预设对接位置信息;
在所述蛋白结构上确定所述预设对接位置对应的角度范围;
创建第一线程任务用于处理所述蛋白结构上处于所述角度范围内的抗体结合位点,并将所述第一线程任务分配至第一运算节点。
6.一种分布式的蛋白结构对接系统,其特征在于,包括:
中央处理单元,用于在获取待处理任务的所有蛋白结构后,创建至少一个线程任务,并将所有所述线程任务分配至至少一个运算节点中,其中,所述线程任务用于处理所述待处理任务中的至少一个蛋白结构;
至少一个运算节点,用于执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对应的评估数据,其中,每个所述运算节点至少分配有一个线程任务。
7.根据权利要求6所述的对接系统,其特征在于,所述中央处理单元还用于:
接收预设算力;
根据所述预设算力从所有运算资源中为所述待处理任务分配至少一个运算节点,其中,所述运算资源至少包括以下之一:服务器、中央处理器、硬盘、云盘。
8.根据权利要求6所述的对接系统,其特征在于,所述中央处理单元还用于:
在创建至少一个线程任务后,对每个所述线程任务中的所述蛋白结构进行第一预设处理,其中,所述第一预设处理至少包括以下之一:蛋白结构完整性验证、蛋白结构的文件的有效性验证、蛋白结构的文件的存储位置验证。
9.根据权利要求6所述的对接系统,其特征在于,所述运算节点还用于,将每个线程任务的评估数据发送至所述中央处理单元;
所述中央处理单元还用于,在接收到所述运算节点发送的所述评估数据后,对所述评估数据进行第二预设处理,得到所述待处理任务的蛋白结构对接结果,其中,所述第二预设处理至少包括以下之一:所述评估数据的有效性分析、所述评估数据的过滤、所述评估数据的排序。
10.根据权利要求6至9中任一项所述的对接系统,其特征在于,所述中央处理单元还用于:接收预设对接位置信息;在所述蛋白结构上确定所述预设对接位置对应的角度范围;创建第一线程任务用于处理所述蛋白结构上处于所述角度范围内的抗体结合位点,并将所述第一线程任务分配至第一运算节点;
所述第一运算节点,用于执行所述第一线程任务中的所述蛋白结构在所述角度范围内的对接。
CN202010388918.3A 2020-05-09 2020-05-09 一种蛋白结构的对接方法及分布式蛋白结构对接系统 Pending CN111681703A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010388918.3A CN111681703A (zh) 2020-05-09 2020-05-09 一种蛋白结构的对接方法及分布式蛋白结构对接系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010388918.3A CN111681703A (zh) 2020-05-09 2020-05-09 一种蛋白结构的对接方法及分布式蛋白结构对接系统

Publications (1)

Publication Number Publication Date
CN111681703A true CN111681703A (zh) 2020-09-18

Family

ID=72433632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010388918.3A Pending CN111681703A (zh) 2020-05-09 2020-05-09 一种蛋白结构的对接方法及分布式蛋白结构对接系统

Country Status (1)

Country Link
CN (1) CN111681703A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001038973A2 (en) * 1999-11-29 2001-05-31 Glaxo Group Limited Thread-based methods and systems for using the idle processing power of one or more networked computers to solve complex scientific problems
CN102385668A (zh) * 2011-09-19 2012-03-21 浙江大学 一种基于蛋白质分子场预测相互作用位点的方法
CN103678950A (zh) * 2012-08-30 2014-03-26 中国科学院计算技术研究所 一种开放式蛋白质鉴定的分布式加速方法及其系统
CN105608341A (zh) * 2015-12-19 2016-05-25 中国人民解放军国防科学技术大学 基于动态数据划分和冲突消解的高通量药物虚拟筛选方法
CN105765592A (zh) * 2013-09-27 2016-07-13 科德克希思公司 酶变体的自动筛选

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001038973A2 (en) * 1999-11-29 2001-05-31 Glaxo Group Limited Thread-based methods and systems for using the idle processing power of one or more networked computers to solve complex scientific problems
CN102385668A (zh) * 2011-09-19 2012-03-21 浙江大学 一种基于蛋白质分子场预测相互作用位点的方法
CN103678950A (zh) * 2012-08-30 2014-03-26 中国科学院计算技术研究所 一种开放式蛋白质鉴定的分布式加速方法及其系统
CN105765592A (zh) * 2013-09-27 2016-07-13 科德克希思公司 酶变体的自动筛选
CN105608341A (zh) * 2015-12-19 2016-05-25 中国人民解放军国防科学技术大学 基于动态数据划分和冲突消解的高通量药物虚拟筛选方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈云侠等: "基于JPPF的异构分布式MTH1虚拟筛选系统", 计算机与现代化 *

Similar Documents

Publication Publication Date Title
US10871998B2 (en) Usage instrumented workload scheduling
Deelman et al. Pegasus: A framework for mapping complex scientific workflows onto distributed systems
Somasundaram et al. CLOUDRB: A framework for scheduling and managing High-Performance Computing (HPC) applications in science cloud
Mian et al. Provisioning data analytic workloads in a cloud
TWI336863B (en) Method, apparatus and computer program product for operating a virtual machine within a data processing system
US8230070B2 (en) System and method for grid and cloud computing
CN111105006B (zh) 一种深度学习网络训练系统及方法
EP3226133A1 (en) Task scheduling and resource provisioning system and method
Iordache et al. Resilin: Elastic mapreduce over multiple clouds
Somasundaram et al. CARE Resource Broker: A framework for scheduling and supporting virtual resource management
CN110688230A (zh) 一种同步训练方法、装置、计算机设备和存储介质
US11443244B2 (en) Parallel ensemble of machine learning algorithms
JP2022548579A (ja) コンテナに対する外部操作とミューテーション・イベントとの対応関係
Kurowski et al. Grid scheduling simulations with GSSIM
Sundas et al. An introduction of CloudSim simulation tool for modelling and scheduling
Liu et al. Yarnsim: Simulating hadoop yarn
Li et al. An improved algorithm for optimizing MapReduce based on locality and overlapping
Zonca et al. Deploying Jupyter Notebooks at scale on XSEDE resources for Science Gateways and workshops
Casajus et al. Status of the DIRAC Project
Lovas et al. Cloud agnostic Big Data platform focusing on scalability and cost-efficiency
In et al. Sphinx: A scheduling middleware for data intensive applications on a grid
Smowton et al. A cost-effective approach to improving performance of big genomic data analyses in clouds
CN111681703A (zh) 一种蛋白结构的对接方法及分布式蛋白结构对接系统
Mandal et al. Toward prioritization of data flows for scientific workflows using virtual software defined exchanges
Shiekh et al. A load-balanced hybrid heuristic for allocation of batch of tasks in cloud computing environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination