CN112882810A - 基于超级计算机的高通量任务处理方法 - Google Patents

基于超级计算机的高通量任务处理方法 Download PDF

Info

Publication number
CN112882810A
CN112882810A CN202110209486.XA CN202110209486A CN112882810A CN 112882810 A CN112882810 A CN 112882810A CN 202110209486 A CN202110209486 A CN 202110209486A CN 112882810 A CN112882810 A CN 112882810A
Authority
CN
China
Prior art keywords
job
task
workflow
supercomputer
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110209486.XA
Other languages
English (en)
Other versions
CN112882810B (zh
Inventor
李庚�
孟祥飞
冯景华
庞晓磊
菅晓东
李菲菲
贾子傲
郑刚
李长松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Supercomputer Center In Tianjin
Original Assignee
National Supercomputer Center In Tianjin
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Supercomputer Center In Tianjin filed Critical National Supercomputer Center In Tianjin
Priority to CN202110209486.XA priority Critical patent/CN112882810B/zh
Publication of CN112882810A publication Critical patent/CN112882810A/zh
Application granted granted Critical
Publication of CN112882810B publication Critical patent/CN112882810B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/48Indexing scheme relating to G06F9/48
    • G06F2209/482Application
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于超级计算机的高通量任务处理方法,包括获取待执行任务的任务参数,所述任务参数包括任务物理信息和任务执行信息,所述任务物理信息包括作业链类型和应用程序类型,所述任务执行信息包括待执行任务对应的作业链数量M,作业链之间的逻辑关系、每一作业链的作业数量N,作业结构文件、作业之间的逻辑关系以及执行精度;根据所述待执行任务的任务参数从预设的数据库中获取对应的工作流模板生成M个与M个作业链一一对应的工作流;根据当前计算资源将所述M个工作流分配到所述超级计算机对应的计算节点上并行执行,并将最终的任务执行结果存储至所述数据库中。本发明提高了高通量计算任务的计算效率。

Description

基于超级计算机的高通量任务处理方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于超级计算机的高通量任务处理方法。
背景技术
现有的超级计算机通常用来执行大规模、长时间的高性能计算任务,这计算任务通常仅包括几个作业链,但每个作业链所需占用的计算资源很多,执行周期很长,因此高性能计算通常关注于短时间内提供的巨大计算能力,例如气候气象预测、石油勘探等。而在实际的使用过程中,有非常多的用户需要执行任务量小、运行时间短的计算任务,这类任务通常包含很多个需要同时并行执行的作业链,通常在一千个以上,这类任务称为高通量任务。这些作业链相较于高性能计算的作业链占用计算资源相对较少,执行周期也较短,例如材料计算模拟,这种计算任务往往计算过程复杂、任务数目繁多、任务配置准备时间长,相比于高性能计算关注于短时间内提供的巨大计算能力,执行高通量任务更关注于在一段时间内完成的工作数目。如果直接采用超级计算机的执行高性能计算的技术来执行高通量计算任务,将极大地降低超级计算系统的使用效率,使得高通量任务处理效率低。因此,如何利用超级计算机的计算资源来提高高通量计算任务的执行效率,成为亟待解决的技术问题。
发明内容
本发明目的在于,提供一种基于超级计算机的高通量任务处理方法,提高了高通量计算任务的计算效率。
根据本发明第一方面,提供了一种基于超级计算机的高通量任务处理方法,包括:
获取待执行任务的任务参数,所述任务参数包括任务物理信息和任务执行信息,所述任务物理信息包括作业链类型和应用程序类型,所述任务执行信息包括待执行任务对应的作业链数量M,作业链之间的逻辑关系、每一作业链的作业数量N,作业结构文件、作业之间的逻辑关系以及执行精度,其中M和N均为正整数,M大于等于1000;
根据所述待执行任务的任务参数从预设的数据库中获取对应的工作流模板生成M个与M个作业链一一对应的工作流;
根据当前计算资源将所述M个工作流分配到所述超级计算机对应的计算节点上并行执行,并将最终的任务执行结果存储至所述数据库中。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种基于超级计算机的高通量任务处理方法可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
本发明通过建立高通量、自动流程的计算流程,提高了高通量计算任务的计算效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明实施例提供的基于超级计算机的高通量任务处理方法流程图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于超级计算机的高通量任务处理方法的具体实施方式及其功效,详细说明如后。
本发明实施例提供了一种基于超级计算机的高通量任务处理方法,如图1所示,包括:
步骤S1、获取待执行任务的任务参数,所述任务参数包括任务物理信息和任务执行信息,所述任务物理信息包括作业链类型和应用程序类型,应用程序类型指的是超级计算机上执行待执行任务所需的应用程序类型,所述任务执行信息包括待执行任务对应的作业链数量M,作业链之间的逻辑关系、每一作业链的作业数量N,作业结构文件、作业之间的逻辑关系以及执行精度;
其中,M和N均为正整数,M大于等于1000,进一步的M的取值范围可设置为[1000,10000]。
步骤S2、根据所述待执行任务的任务参数从预设的数据库中获取对应的工作流模板生成M个与M个作业链一一对应的工作流;
可以理解的是,每个待执行的任务包括M个并行的作业链,每一作业链对应生成一个可以自动执行的工作流,每一作业链包括多个作业,多个作业按照作业间的逻辑关系连接。M个工作流之间按照作业链之间的逻辑关系连接,需要说明的是,也可能无需连接,具体根据应用需求来设定,例如,需要分别输出并行的M个工作流的输出结果,则M个工作流无需再进行关联,直接输出各自对应的结果即可。再如最终需要输出一个结果,则需将M个工作流的输出结果进行关联,并按照计算需求获取最重的执行结果进行输出。当然,也可输出[1,M]之间任意一值对应的的数量的结果。同时并行M个作业链实现了高通量计算,基于M个作业链生成对应M个能够自动计算的工作流,实现了自动流程。
作为示例,所述工作流为有向无环的逻辑工作流。
步骤S3、根据当前计算资源将所述M个工作流分配到所述超级计算机对应的计算节点上并行执行,并将最终的任务执行结果存储至所述数据库中。
本发明实施例通过建立高通量、自动流程的计算流程,提高了高通量计算任务的计算效率。
作为示例,现有的天河系列超级超算系统上每年运行的任务数有30%左右来用于材料模拟计算。因此,本发明实施例所述方法可直接应用于天河超级计算机系统来执行模拟计算任务,例如可用于建立材料基因数据库。
作为一种示例,所述步骤S3中,根据当前计算资源将所述M个工作流分配到所述超级计算机对应的计算节点上并行执行,包括:
步骤S31、根据当前超级计算机的计算资源和M个工作流所需的计算资源在超级计算机确定所需节点,以及每一节点上所要分配的工作流;
步骤S32、将每一工作流分配至对应的节点上,所述节点执行对应的工作流,得到每一工作流的输出结果;
步骤S33、根据每一工作流的输出结果、作业链之间的逻辑关系、应用程序类型,从所述数据中调取对应的应用程序进行执行,获取最终的任务执行结果。
作为一种示例,步骤S32中,在所述节点执行对应的工作流的过程中,还包括:
步骤S302、将所述工作流的每一作业的执行结果以及所述数据库中预先存储的工作流的该作业的预设执行结果进行相互校验;
步骤S312、若所述执行结果与所述预设执行结果的误差超过预设的误差范围,则判断所述预设执行结果的准确度是否高于所述执行结果:
若是,则将所述预设执行结果替换所述执行结果;
否则,将所述执行结果替换所述预设执行结果。
可以理解的是,预设的误差范围可根据任务参数里的执行精度来设定。通过步骤S302和步骤S303可以实现当前执行的工作流数据与工作流模板数据的相互校验,提高了任务执行结果的准确性。
作为一种示例,所述步骤S32中,所述节点执行对应的工作流,得到每一工作流的输出结果,包括:
步骤S321、所述节点依次执行对应工作流中的每一作业,每一作业得到一个作业输出结果,每一作业将其对应的作业输出结果作为该工作流中下一作业的输入,直至该工作流中最后一个作业输出该工作流的输出结果。
作为一种示例,所述步骤S321中,所述节点依次执行对应工作流中的每一作业,每一作业得到一个作业输出结果,包括:
步骤S3211、获取当前作业对应的结构作业结构文件;
步骤S3212、根据所述任务物理信息从所述作业结构文件中提取对应的原始数据;
步骤S3213、根据作业链之间的逻辑关系和应用程序类型从所述数据库中调用对应的应用程序,将所述原始数据输入对应的应用程序中执行生成目标数据;
步骤S3214、将所述目标数据按照预设的筛选规则进行筛选,得到该作业的输出结果,将该作业的输出结果存储至所述数据库中。
高通量、自动流程计算会产生大量的数据,高通量计算的本质也是为了快速地汇聚和积累各种性质地数据,建立一个高效的、方便的、快速的、智能的数据库与高通量、自动流程计算相辅相成,相互补充。数据库贯穿在整个任务执行的流程中,整个任务执行过程中的数据、指令、信息、输入、输出都是在所述数据库中存储或获取,通过数据库进行管理和调用。
作为一种示例,可采用python、mongoDB、JSON的技术创建数据库,并实现对数据的全流程自动控制。在可扩展的ceph分布式存储系统上部署非关系型数据库mongoDB来管理数据,部署redis存储系统和CouchDB数据库来管理工作流,部署关系型数据库管理系统MySQL来管理用户信息。其中MongoDB是一个基于分布式文件存储的数据库,支持JSON文件,具有强大的查询语言。通过这样一个数据库实现控制并行计算、数据结果分析、数据传输、数据验证。同时前端用户与数据管理系统可以交互访问,文件下载,结果展示和数据查询。
具体地,数据库中用于预先存储根据工作流设置的模板数据、具体可包括工作流输入、工作流执行逻辑控制、计算结果提取等模板,从而实现模板复用,提高任务执行的效率。可采用JSON文本的格式来存储,预先定义了关键字信息,关键子信息可以设置为根据输入信息进行更改或者不能更改的形式。除了JSON格式文件外,所述数据库中还可采用CSV或XML的格式文件来存储和流通,通过为应用程序构建集成数据接口来调用所述格式文件与所述数据库交互,驱动数据运转,从而执行工作流中的每一作业。
作为一种示例,所述为应用程序构建集成数据接口包括:
步骤S41、获取所述应用程序的运行特征;
步骤S42、从所述运行特征中分离出所述应用程序对应的交互操作信息、参数配置信息、资源需求信息、数据文件信息四个层次信息;
步骤S43、分别基于各层次信息获取各层次信息的数类共性特征,抽象数值模拟活动,得到层次化组件模型,所述层次化组件模型包括描述层、定制层、工具层和状态层,将所述描述层、定制层、工具层和状态层进行封装,得到所述集成数据接口,其中,所述描述层用于供交互工具使用,提供组件的功能与使用操作信息;所述定制层用于为预设问题配置对应的解决策略;所述工具层用于描述应用程序的资源需求、交互模式的运行特征,为数值模拟工作流中任务的自动执行提供基础;所述状态层用于描述应用程序的执行过程。
此外,数据库还可对文本,图片,二进制等多类型的执行结果数据能够进行分类和高速存储,形成可检索数据库所述方法还包括:通过API接口或web交互,从所述数据库中获取任务执行结果,供其他数据库调用或者外部访问读取。
为了能够实时监控多任务的资源使用情况和工作状态等信息,所述方法还可包括:步骤S5、实时监测每一工作流的运行状态、运行进度和资源使用情况,并进行可视化显示。
为了保证整个任务执行过程的顺利进行,除了对整个任务执行过程进行监测外,还需对应设置容错机制,能够根据实时反馈实现自动纠错与恢复续算,作为一种示例,容错服务可采取非侵入方式以独立服务的形式提供,采用可插拔式的解耦设计,这样使得容错服务自身的稳定性不会影响高通量、自动流程计算的整体效率。实现容错的统一服务接口,支持并发处理各流程实例的错误、并对容错过程及状态进行管理。作为示例,具体包括以下步骤:
步骤S51、当监测到工作流的状态为异常状态时,生成错误事件,并将错误信息存储至所述数据库中的日志信息中;
其中,异常状态可包括任务异常退出、数据无效等。
步骤S52、通过预设的容错服务从所述日志中周期性地获取错误信息,并对所述错误信息进行识别和分类;
步骤S53、基于错误类别启动对应的自动纠错服务进行纠错处理。
作为示例任务执行过程中的错误分为三类:1)第一类错误是超级计算系统本身报的错误,比如系统维护、内存不足、作业排队报错等;2)第二类错误是应用程序运行的底层环境报的错误,比如缺少底层数学库依赖、软件安装或者版本不正确等;3)第三类错误是由于计算参数设置不合理导致应用运行本身报错,这是最常见的,也是最多的错误。可以根据错误类型设计对应的容错策略,自动启动纠错动作 ,保证了任务执行过程的顺利进行,提高了任务执行的效率。
本发明实施例还提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行本发明实施例所述的方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机指令用于执行本发明实施例所述的方法。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (10)

1.一种基于超级计算机的高通量任务处理方法,其特征在于,包括:
获取待执行任务的任务参数,所述任务参数包括任务物理信息和任务执行信息,所述任务物理信息包括作业链类型和应用程序类型,所述任务执行信息包括待执行任务对应的作业链数量M,作业链之间的逻辑关系、每一作业链的作业数量N,作业结构文件、作业之间的逻辑关系以及执行精度,其中M和N均为正整数,M大于等于1000;
根据所述待执行任务的任务参数从预设的数据库中获取对应的工作流模板生成M个与M个作业链一一对应的工作流;
根据当前计算资源将所述M个工作流分配到所述超级计算机对应的计算节点上并行执行,并将最终的任务执行结果存储至所述数据库中。
2.根据权利要求1所述的基于超级计算机的高通量任务处理方法,其特征在于,
所述根据当前计算资源将所述M个工作流分配到所述超级计算机对应的计算节点上并行执行,包括:
根据当前超级计算机的计算资源和M个工作流所需的计算资源在超级计算机确定所需节点,以及每一节点上所要分配的工作流;
将每一工作流分配至对应的节点上,所述节点执行对应的工作流,得到每一工作流的输出结果;
根据每一工作流的输出结果、作业链之间的逻辑关系、应用程序类型,从所述数据中调取对应的应用程序进行执行,获取最终的任务执行结果。
3.根据权利要求2所述的基于超级计算机的高通量任务处理方法,其特征在于,在所述节点执行对应的工作流的过程中,还包括:
将所述工作流的每一作业的执行结果以及所述数据库中预先存储的工作流的该作业的预设执行结果进行相互校验;
若所述执行结果与所述预设执行结果的误差超过预设的误差范围,则判断所述预设执行结果的准确度是否高于所述执行结果:
若是,则将所述预设执行结果替换所述执行结果;
否则,将所述执行结果替换所述预设执行结果。
4.根据权利要求2所述的基于超级计算机的高通量任务处理方法,其特征在于,
所述节点执行对应的工作流,得到每一工作流的输出结果,包括:
所述节点依次执行对应工作流中的每一作业,每一作业得到一个作业输出结果,每一作业将其对应的作业输出结果作为该工作流中下一作业的输入,直至该工作流中最后一个作业输出该工作流的输出结果。
5.根据权利要求4所述的基于超级计算机的高通量任务处理方法,其特征在于,
所述节点依次执行对应工作流中的每一作业,每一作业得到一个作业输出结果,包括:
获取当前作业对应的结构作业结构文件;
根据所述任务物理信息从所述作业结构文件中提取对应的原始数据;
根据作业链之间的逻辑关系和应用程序类型从所述数据库中调用对应的应用程序,将所述原始数据输入对应的应用程序中执行生成目标数据;
将所述目标数据按照预设的筛选规则进行筛选,得到该作业的输出结果,将该作业的输出结果存储至所述数据库中。
6.根据权利要求5所述的基于超级计算机的高通量任务处理方法,其特征在于,
所述数据库中采用JSON、CSV或 XML的格式文件来存储和流通,通过为应用程序构建集成数据接口来调用所述格式文件与所述数据库交互,驱动数据运转,从而执行工作流中的每一作业。
7.根据权利要求6所述的基于超级计算机的高通量任务处理方法,其特征在于,
所述为应用程序构建集成数据接口包括:
获取所述应用程序的运行特征;
从所述运行特征中分离出所述应用程序对应的交互操作信息、参数配置信息、资源需求信息、数据文件信息四个层次信息;
分别基于各层次信息获取各层次信息的数类共性特征,抽象数值模拟活动,得到层次化组件模型,所述层次化组件模型包括描述层、定制层、工具层和状态层,将所述描述层、定制层、工具层和状态层进行封装,得到所述集成数据接口,其中,
所述描述层用于供交互工具使用,提供组件的功能与使用操作信息;所述定制层用于为预设问题配置对应的解决策略;所述工具层用于描述应用程序的资源需求、交互模式的运行特征,为数值模拟工作流中任务的自动执行提供基础;所述状态层用于描述应用程序的执行过程。
8.根据权利要求1所述的基于超级计算机的高通量任务处理方法,其特征在于,
所述方法还包括:
实时监测每一工作流的运行状态、运行进度和资源使用情况,并进行可视化显示。
9.根据权利要求8所述的基于超级计算机的高通量任务处理方法,其特征在于,
所述方法还包括:
当监测到工作流的状态为异常状态时,生成错误事件,并将错误信息存储至所述数据库中的日志信息中;
通过预设的容错服务从所述日志中周期性地获取错误信息,并对所述错误信息进行识别和分类;
基于错误类别启动对应的自动纠错服务进行纠错处理。
10.根据权利要求1所述的基于超级计算机的高通量任务处理方法,其特征在于,
所述方法还包括:通过API接口或web交互,从所述数据库中获取任务执行结果,供其他数据库调用或者外部访问读取。
CN202110209486.XA 2021-02-25 2021-02-25 基于超级计算机的高通量任务处理方法 Active CN112882810B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110209486.XA CN112882810B (zh) 2021-02-25 2021-02-25 基于超级计算机的高通量任务处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110209486.XA CN112882810B (zh) 2021-02-25 2021-02-25 基于超级计算机的高通量任务处理方法

Publications (2)

Publication Number Publication Date
CN112882810A true CN112882810A (zh) 2021-06-01
CN112882810B CN112882810B (zh) 2023-02-07

Family

ID=76054404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110209486.XA Active CN112882810B (zh) 2021-02-25 2021-02-25 基于超级计算机的高通量任务处理方法

Country Status (1)

Country Link
CN (1) CN112882810B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723931A (zh) * 2021-09-09 2021-11-30 中国工程物理研究院计算机应用研究所 一种适用于多尺度高通量材料计算的工作流建模方法
CN113742125A (zh) * 2021-09-06 2021-12-03 中国工程物理研究院计算机应用研究所 一种轻量级高通量计算模式及其容错方法
CN114462260A (zh) * 2022-04-14 2022-05-10 国家超级计算天津中心 基于超级计算机的磁约束聚变融合数值处理系统
CN115495224A (zh) * 2022-11-18 2022-12-20 天河超级计算淮海分中心 基于优先级的超算节点使用方法、电子设备和存储介质
CN117453376A (zh) * 2023-12-20 2024-01-26 宁德时代新能源科技股份有限公司 高通量计算的控制方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101410863A (zh) * 2006-04-07 2009-04-15 国际商业机器公司 客户可配置的工作流系统
CN104077669A (zh) * 2014-07-23 2014-10-01 中国科学院自动化研究所 一种计算机工作流的自主定制与驱动执行的通用方法
US20150006735A1 (en) * 2013-06-28 2015-01-01 International Business Machines Corporation Framework to improve parallel job workflow
US20190370058A1 (en) * 2018-05-29 2019-12-05 American Express Travel Related Services Company, Inc. Automated execution of batch job workflows
CN110912724A (zh) * 2018-09-18 2020-03-24 亿阳信通股份有限公司 一种基于参数驱动的自动业务编排方法及装置
CN111897622A (zh) * 2020-06-10 2020-11-06 中国科学院计算机网络信息中心 基于容器技术的高通量计算方法及系统
CN112015528A (zh) * 2020-07-21 2020-12-01 中国科学院西安光学精密机械研究所 一种工业控制系统软件控制流程构建和解析方法
CN112308443A (zh) * 2020-11-09 2021-02-02 中国科学院空天信息创新研究院 一种遥感信息产品生成工作流的批量调度方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101410863A (zh) * 2006-04-07 2009-04-15 国际商业机器公司 客户可配置的工作流系统
US20150006735A1 (en) * 2013-06-28 2015-01-01 International Business Machines Corporation Framework to improve parallel job workflow
CN104077669A (zh) * 2014-07-23 2014-10-01 中国科学院自动化研究所 一种计算机工作流的自主定制与驱动执行的通用方法
US20190370058A1 (en) * 2018-05-29 2019-12-05 American Express Travel Related Services Company, Inc. Automated execution of batch job workflows
CN110912724A (zh) * 2018-09-18 2020-03-24 亿阳信通股份有限公司 一种基于参数驱动的自动业务编排方法及装置
CN111897622A (zh) * 2020-06-10 2020-11-06 中国科学院计算机网络信息中心 基于容器技术的高通量计算方法及系统
CN112015528A (zh) * 2020-07-21 2020-12-01 中国科学院西安光学精密机械研究所 一种工业控制系统软件控制流程构建和解析方法
CN112308443A (zh) * 2020-11-09 2021-02-02 中国科学院空天信息创新研究院 一种遥感信息产品生成工作流的批量调度方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘一骏等: "一个高可用的高通量材料计算任务管理系统", 《科研信息化技术与应用》 *
康波等: "云化与业务流技术支撑的新一代超级计算应用平台", 《计算机工程与科学》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742125A (zh) * 2021-09-06 2021-12-03 中国工程物理研究院计算机应用研究所 一种轻量级高通量计算模式及其容错方法
CN113723931A (zh) * 2021-09-09 2021-11-30 中国工程物理研究院计算机应用研究所 一种适用于多尺度高通量材料计算的工作流建模方法
CN113723931B (zh) * 2021-09-09 2024-04-19 中国工程物理研究院计算机应用研究所 一种适用于多尺度高通量材料计算的工作流建模方法
CN114462260A (zh) * 2022-04-14 2022-05-10 国家超级计算天津中心 基于超级计算机的磁约束聚变融合数值处理系统
CN114462260B (zh) * 2022-04-14 2022-07-08 国家超级计算天津中心 基于超级计算机的磁约束聚变融合数值处理系统
CN115495224A (zh) * 2022-11-18 2022-12-20 天河超级计算淮海分中心 基于优先级的超算节点使用方法、电子设备和存储介质
CN117453376A (zh) * 2023-12-20 2024-01-26 宁德时代新能源科技股份有限公司 高通量计算的控制方法、装置、设备及存储介质
CN117453376B (zh) * 2023-12-20 2024-05-03 宁德时代新能源科技股份有限公司 高通量计算的控制方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112882810B (zh) 2023-02-07

Similar Documents

Publication Publication Date Title
CN112882810B (zh) 基于超级计算机的高通量任务处理方法
CN110050257B (zh) 可执行数据流图的差分
CN112579653B (zh) 工业数据的逐步情境化和分析
US11074107B1 (en) Data processing system and method for managing AI solutions development lifecycle
US9275172B2 (en) Systems and methods for analyzing performance of virtual environments
US11327749B2 (en) System and method for generating documentation for microservice based applications
CN112581303A (zh) 用于工业自动化的人工智能通道
CN112580813B (zh) 工业数据在装置级处的情境化
CN113820993A (zh) 生成工业控制编程的方法、系统和非暂态计算机可读介质
US11314808B2 (en) Hybrid flows containing a continous flow
CN102375731A (zh) 一种免编码集成应用软件平台系统
US20200089533A1 (en) Methods and systems for cloud application optimization
EP4124956A1 (en) Automated system and method for detection and remediation of anomalies in robotic process automation environment
US20220091897A1 (en) Rule-based assignment of event-driven application
CN113010598A (zh) 面向遥感大数据处理的动态自适应分布式协同工作流系统
Incerto et al. Symbolic performance adaptation
Balliu et al. A big data analyzer for large trace logs
CN114781648A (zh) 面向机器学习任务的自动化编排、构建、执行方法及系统
CN114089889B (zh) 模型训练方法、装置以及存储介质
TW202006614A (zh) 使用方塊式工作流程的限制編程
Guo et al. GEO-WMS: an improved approach to geoscientific workflow management system on HPC
CN110766163B (zh) 用于实施机器学习过程的系统
CN116643950A (zh) 一种基于FaaS的云原生应用自动化运维方法
Henning Prototype of a scalable monitoring infrastructure for Industrial DevOps
Alnafessah et al. AI‐Driven Performance Management in Data‐Intensive Applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant