CN106570604A - 用于地球物理高性能计算的用户作业信息管理方法及系统 - Google Patents

用于地球物理高性能计算的用户作业信息管理方法及系统 Download PDF

Info

Publication number
CN106570604A
CN106570604A CN201510659426.2A CN201510659426A CN106570604A CN 106570604 A CN106570604 A CN 106570604A CN 201510659426 A CN201510659426 A CN 201510659426A CN 106570604 A CN106570604 A CN 106570604A
Authority
CN
China
Prior art keywords
job information
user job
user
geophysics
performance calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510659426.2A
Other languages
English (en)
Inventor
葛鑫
姜游
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Sinopec Geophysical Research Institute
Original Assignee
China Petroleum and Chemical Corp
Sinopec Geophysical Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Sinopec Geophysical Research Institute filed Critical China Petroleum and Chemical Corp
Priority to CN201510659426.2A priority Critical patent/CN106570604A/zh
Publication of CN106570604A publication Critical patent/CN106570604A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

公开了一种用于地球物理高性能计算的用户作业信息管理方法及系统。该方法可以包括:获得多个应用的调度系统的作业信息;对各调度系统的作业信息进行解析收集,获得相应的用户作业信息;以及在同一页面中对所述用户作业信息进行展示。

Description

用于地球物理高性能计算的用户作业信息管理方法及系统
技术领域
本发明涉及地震勘探领域,更具体地,涉及一种用于地球物理高性能计算的用户作业信息管理方法及系统。
背景技术
在地震勘探领域,随着勘探对象日趋复杂,对勘探地震资料的处理的需求也不断提高,已越来越多地应用安装有多种地震资料处理应用软件的地球物理勘探地震资料处理计算中心对各种地震资料进行处理。目前,在大的计算中心,在有多种应用软件使用的情况下,为提高计算资源的利用率和减少用户作业等待的时间,通常采用的方法是通过开源或定制的作业调度系统将用户提交的作业放入作业等待队列,再根据一定的策略选取合适的作业分配到适合作业申请条件的计算资源上去运行。
发明人发现,每种应用一般都会有自己的调度系统,同一用户也可能会使用多种应用,当用户查看作业信息时,需要调取不同应用里面调度系统的作业信息,有的调度系统还需要使用linux命令的形式获取作业信息,这样会给用户的使用增加难度。因此,有必要开发一种能够查看并管理所有应用的调度系统信息的方法及系统。
公开于本公开背景技术部分的信息仅仅旨在加深对本公开的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本公开提出了一种用于地球物理高性能计算的用户作业信息管理方法及系统,其能够通过将所有应用的调度系统信息综合起来并展示给用户,实现所有用户作业信息的统一查看和管理。
根据本公开的一方面,提出了一种用于地球物理高性能计算的用户作业信息管理方法。所述方法可以包括:获得多个应用的调度系统的作业信息;对各调度系统的作业信息进行解析收集,获得相应的用户作业信息;以及在同一页面中对所述用户作业信息进行展示。
根据本公开的另一方面,提出了一种用于地球物理高性能计算的用户作业信息管理系统,所述系统可以包括:用于获得多个应用的调度系统的作业信息的单元;用于对各调度系统的作业信息进行解析收集,获得相应的用户作业信息的单元;以及用于在同一页面中对所述用户作业信息进行展示的单元。
本公开的方法和装置具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施例中将是显而易见的,或者将在并入本文中的附图和随后的具体实施例中进行详细陈述,这些附图和具体实施例共同用于解释本公开的特定原理。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1示出了根据本公开的用于地球物理高性能计算的用户作业信息管理方法的步骤的流程图。
图2示出了根据本公开的一个实施例的多个应用的调度系统的示意图。
图3示出了根据本公开的一个实施例的用户作业完成情况的展示页面的示意图。
图4示出了根据本公开的一个实施例的用户作业所占节点运行情况的展示页面的示意图。
图5示出了根据本公开的一个实施例的用户作业进程运行情况的展示页面的示意图。
图6示出了根据本公开的一个实施例的用户资源利用情况的展示页面的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
实施例1
图1示出了根据本公开的用于地球物理高性能计算的用户作业信息管理方法的步骤的流程图。
在该实施例中,根据本公开的用于地球物理高性能计算的用户作业信息管理方法可以包括:步骤101,获得多个应用的调度系统的作业信息;步骤102,对各调度系统的作业信息进行解析收集,获得相应的用户作业信息;以及步骤103,在同一页面中对所述用户作业信息进行展示。
该实施例通过将所有应用的调度系统信息综合起来并展示给用户,实现所有用户作业信息的统一查看和管理。
下面详细说明根据本公开的用于地球物理高性能计算的用户作业信息管理方法的具体步骤。
获得调度系统的作业信息
在一个示例中,可以获得多个应用的调度系统的作业信息。
在使用多种应用的情况下,每个应用或几个应用可以具有自己的调度系统。其中,调度系统可以根据用户作业提出的需求分配对应的资源给作业,告诉作业给它分配哪些节点,避免作业之间无序干扰,尽量让整个高性能集群系统的负载一致,保证用户占用资源的长期内公平。
图2示出了根据本公开的一个实施例的多个应用的调度系统的示意图。如图2所示,以常用的地震资料处理应用软件为例,应用omega具有调度系统jss;应用Cgg具有调度系统acp;而应用Paradigm、mpich以及openmpi具有共同的调度系统openlava。
获得用户作业信息
在一个示例中,可以对各调度系统的作业信息进行解析收集,获得相应的用户作业信息。在实际操作中,可以使用shell命令解析器对各调度系统的作业信息解析收集。
但本领域技术人员应当理解,本公开的解析收集方式并不限于此,可以采用本领域已知的各种常规方法,完成对各调度系统的作业信息的解析收集。
如图2所示,可以解析收集调度系统jss、acp以及openlava的作业信息,以对相应的用户作业信息进行统一展示。
展示用户作业信息
在一个示例中,可以在同一页面中对用户作业信息进行展示。
在一个示例中,对用户作业信息进行展示可以包括:通过网页形式展示所述用户作业信息。在实际操作中,可以使用java,php等进行前台网页开发,以展示解析收集获得的用户作业信息,方便用户对自己的作业进行查看和管理。
但本领域技术人员应当理解,本公开的网页开发方式并不限于此,可以采用本领域已知的各种常规方法,完成对用户作业信息的展示。
在一个示例中,用户作业信息可以包括:用户作业完成情况、用户作业所占节点运行情况、用户作业进程运行情况,以及用户资源利用情况。图3-图6分别示出了根据本公开的一个实施例的用户作业完成情况、用户作业所占节点运行情况、用户作业进程运行情况,以及用户资源利用情况的展示页面的示意图。如图3-6所示,可以分别在同一页面中展示不同的用户作业信息,方便用户对自己的作业进行查看和管理。页面的左上部分可以为用户作业信息的总览,用户可以根据需要来选择,以进行查看和管理;页面的下半部分可以为用户作业信息的详细情况展示。例如,可以点击运行、排队、当日完成等选项来查看用户作业完成情况(图3);可以点击节点状态选项来查看用户作业所占节点运行情况(图4);可以点击进程状态选项来查看用户作业进程运行情况(图5);点击资源利用情况选项来查看用户资源利用情况(图6)。当点击运行选项来查看用户作业完成情况时,可以在页面的右上部分展示作业运行数量;当点击资源利用情况选项来查看用户资源利用情况时,可以在页面的右上部分展示存储占用空间大小和软件所用机时。通过上述页面展示,用户可以对自己的所有作业进行统一查看和管理。
在一个示例中,根据本公开的用于地球物理高性能计算的用户作业信息管理方法还可以包括:根据所展示的用户作业信息,在发生故障的情况下,对发生故障的用户作业信息进行定位。
基于所展示的用户作业信息,可以在发生故障的情况下进行分析和判断,可以通过该系统快速的掌握高性能集群的使用情况,快速的定位发生故障的事件点的位置。该系统通过采集用户作业信息,对用户作业从开始运行到结束运行整个过程进行监控,并且根据监控的情况,将用户作业按照用户分类,按照作业类型分类,按照作业所运行节点分类等,并对这些分类信息进行展示,从而精准地了解整个高性能集群的作业运行情况。如果某个作业意外中断,或者某个作业超时,则可以在该系统中快速地找到该作业的相关信息(比如什么时候提交,什么时候中断,在哪些节点上运行,作业所占系统资源等),这样就可以快速判断是什么原因导致用户作业中断或异常。
根据本公开的用于地球物理高性能计算的用户作业信息管理方法通过将所有应用的调度系统信息综合起来并展示给用户,实现了所有用户作业信息的统一查看和管理。
本领域技术人员应理解,上面对本公开的实施例的描述的目的仅为了示例性地说明本公开的实施例的有益效果,并不意在将本公开的实施例限制于所给出的任何示例。
实施例2
根据本公开的实施例,提供了一种用于地球物理高性能计算的用户作业信息管理系统,所述系统可以包括:用于获得多个应用的调度系统的作业信息的单元;用于对各调度系统的作业信息进行解析收集,获得相应的用户作业信息的单元;以及用于在同一页面中对所述用户作业信息进行展示的单元。
该实施例通过将所有应用的调度系统信息综合起来并展示给用户,实现所有用户作业信息的统一查看和管理。
在一个示例中,所述用户作业信息可以包括:用户作业完成情况、用户作业所占节点运行情况、用户作业进程运行情况,以及用户资源利用情况。
在一个示例中,对所述用户作业信息进行展示可以包括:通过网页形式展示所述用户作业信息。
在一个示例中,所述系统还可以包括:用于根据所展示的用户作业信息,在发生故障的情况下,对发生故障的用户作业信息进行定位的单元。
本领域技术人员应理解,上面对本公开的实施例的描述的目的仅为了示例性地说明本公开的实施例的有益效果,并不意在将本公开的实施例限制于所给出的任何示例。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (8)

1.一种用于地球物理高性能计算的用户作业信息管理方法,包括:
获得多个应用的调度系统的作业信息;
对各调度系统的作业信息进行解析收集,获得相应的用户作业信息;以及
在同一页面中对所述用户作业信息进行展示。
2.根据权利要求1所述的用于地球物理高性能计算的用户作业信息管理方法,其中,所述用户作业信息包括:用户作业完成情况、用户作业所占节点运行情况、用户作业进程运行情况,以及用户资源利用情况。
3.根据权利要求1所述的用于地球物理高性能计算的用户作业信息管理方法,其中,对所述用户作业信息进行展示包括:通过网页形式展示所述用户作业信息。
4.根据权利要求1所述的用于地球物理高性能计算的用户作业信息管理方法,其中,所述方法还包括:根据所展示的用户作业信息,在发生故障的情况下,对发生故障的用户作业信息进行定位。
5.一种用于地球物理高性能计算的用户作业信息管理系统,包括:
用于获得多个应用的调度系统的作业信息的单元;
用于对各调度系统的作业信息进行解析收集,获得相应的用户作业信息的单元;以及
用于在同一页面中对所述用户作业信息进行展示的单元。
6.根据权利要求5所述的用于地球物理高性能计算的用户作业信息管理系统,其中,所述用户作业信息包括:用户作业完成情况、用户作业所占节点运行情况、用户作业进程运行情况,以及用户资源利用情况。
7.根据权利要求5所述的用于地球物理高性能计算的用户作业信息管理系统,其中,对所述用户作业信息进行展示包括:通过网页形式展示所述用户作业信息。
8.根据权利要求5所述的用于地球物理高性能计算的用户作业信息管理系统,其中,所述系统还包括:用于根据所展示的用户作业信息,在发生故障的情况下,对发生故障的用户作业信息进行定位的单元。
CN201510659426.2A 2015-10-12 2015-10-12 用于地球物理高性能计算的用户作业信息管理方法及系统 Pending CN106570604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510659426.2A CN106570604A (zh) 2015-10-12 2015-10-12 用于地球物理高性能计算的用户作业信息管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510659426.2A CN106570604A (zh) 2015-10-12 2015-10-12 用于地球物理高性能计算的用户作业信息管理方法及系统

Publications (1)

Publication Number Publication Date
CN106570604A true CN106570604A (zh) 2017-04-19

Family

ID=58508889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510659426.2A Pending CN106570604A (zh) 2015-10-12 2015-10-12 用于地球物理高性能计算的用户作业信息管理方法及系统

Country Status (1)

Country Link
CN (1) CN106570604A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063336A (zh) * 2011-01-12 2011-05-18 国网电力科学研究院 一种分布式计算多应用功能异步并发调度方法
CN104077662A (zh) * 2014-07-04 2014-10-01 用友软件股份有限公司 作业调度管理方法和装置
CN104793994A (zh) * 2015-04-27 2015-07-22 中国农业银行股份有限公司 批量作业处理方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063336A (zh) * 2011-01-12 2011-05-18 国网电力科学研究院 一种分布式计算多应用功能异步并发调度方法
CN104077662A (zh) * 2014-07-04 2014-10-01 用友软件股份有限公司 作业调度管理方法和装置
CN104793994A (zh) * 2015-04-27 2015-07-22 中国农业银行股份有限公司 批量作业处理方法、装置及系统

Similar Documents

Publication Publication Date Title
CN107809331B (zh) 识别异常流量的方法和装置
CN109460664B (zh) 风险分析方法、装置、电子设备及计算机可读介质
CN107516090B (zh) 一体化人脸识别方法和系统
CN106354645B (zh) 基于后台系统服务或接口的测试方法和测试平台
US11488064B2 (en) Machine learning model for micro-service compliance requirements
CN110851342A (zh) 故障预测方法、装置、计算设备以及计算机可读存储介质
US9710260B2 (en) Increasing proficiency status of developers
CN109344170B (zh) 流数据处理方法、系统、电子设备及可读存储介质
US20180276508A1 (en) Automated visual information context and meaning comprehension system
CN103154905B (zh) 用于组合应用的自动化分析的装置和方法
US9772896B2 (en) Identifying intervals of unusual activity in information technology systems
US11488014B2 (en) Automated selection of unannotated data for annotation based on features generated during training
US11546380B2 (en) System and method for creation and implementation of data processing workflows using a distributed computational graph
US11044155B2 (en) Utilizing unstructured data in self-organized networks
CN109685089A (zh) 评估模型性能的系统及方法
CN108170538A (zh) 一种信息处理方法、装置以及电子设备
CN106325988A (zh) 任务调度方法及装置
US10372572B1 (en) Prediction model testing framework
CN115981902A (zh) 一种细粒度分布式微服务系统异常根因定位方法及装置
US11721099B2 (en) Cloud based active commissioning system for video analytics
US11601347B2 (en) Identification of incident required resolution time
CN114297475A (zh) 一种对象推荐方法、装置、电子设备及存储介质
CN112383436B (zh) 一种网络监控的方法和装置
US10693736B2 (en) Real time simulation monitoring
US20170185942A1 (en) Generation of optimal team configuration recommendations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170419

RJ01 Rejection of invention patent application after publication