CN106909465A - 一种Linux作业管理方法及其Windows客户端 - Google Patents

一种Linux作业管理方法及其Windows客户端 Download PDF

Info

Publication number
CN106909465A
CN106909465A CN201510966392.1A CN201510966392A CN106909465A CN 106909465 A CN106909465 A CN 106909465A CN 201510966392 A CN201510966392 A CN 201510966392A CN 106909465 A CN106909465 A CN 106909465A
Authority
CN
China
Prior art keywords
linux
job
scp
client
job management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510966392.1A
Other languages
English (en)
Inventor
吕海港
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan Super Online Technology Co Ltd
Original Assignee
Taiyuan Super Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan Super Online Technology Co Ltd filed Critical Taiyuan Super Online Technology Co Ltd
Priority to CN201510966392.1A priority Critical patent/CN106909465A/zh
Publication of CN106909465A publication Critical patent/CN106909465A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/541Interprogram communication via adapters, e.g. between incompatible applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/541Client-server
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/549Remote execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种Linux作业管理方法及其Windows客户端。本发明的方法包括:在Windows计算机上安装ssh和scp命令以及进行作业管理的图形客户端,通过图形界面编写输入文件,并通过scp传输到Linux集群,再通过ssh命令提交并监控作业,作业完成后通过scp把作业结果传回Windows计算机,最后在图形界面查看和分析作业结果。

Description

一种Linux作业管理方法及其Windows客户端
技术领域
本发明涉及计算机应用技术领域,具体涉及一种Linux作业管理方法及其Windows客户端。
背景技术
在高性能计算领域,计算作业主要由Linux系统组成的计算机集群完成。而普通用户主要使用Windows系统进行工作。在计算时,用户通过SSH客户端(比如PuTTY)登录到Linux集群的管理节点,上传或编写输入文件,提交计算作业到作业调度系统,监控作业,查看并下载完成的作业结果。这一系列过程都需要输入命令,对于习惯于Windows图形界面的普通用户非常困难。另一方面,作业提交过程是相对重复和繁琐的,可以通过一个图形应用程序来完成这个过程,从而方便了普通用户的使用。
目前一些集群系统上安装有基于http协议的Web作业管理系统,它在Linux集群的管理节点上安装一个Web服务器,用户通过Web浏览器登录Linux集群,上传输入文件,提交作业,监控作业运行状态,下载计算结果。这种方法极大地方便了Linux集群的使用。但是,这种Web作业管理系统必须在管理节点安装,启动httpd服务,并且只能由管理员进行操作,按照管理员设定的方式,使用管理员安装好的程序。因此,这种方式远远不能满足计算用户的多样化计算所带来的个性化需求。
发明内容
为了给科学计算用户提供个性化的Linux集群作业管理系统,本发明公开了一种基于SSH协议的Linux作业管理方法及其Windows客户端。
为了达到上述目的,本发明的技术方案是如下方式实现的。
步骤1. 在Windows计算机上安装ssh和scp命令,在Linux集群的管理节点上启动sshd服务。
步骤2. 在Windows计算机上编写图形客户端,用于通过图形方式制作计算作业所需的输入文件,监控作业运行状态,查看计算结果。
步骤3. 通过scp命令自动从Windows计算机上传输入文件和从Linux集群下载计算结果。
步骤4. 通过ssh命令从Windows计算机向Linux集群发送命令,完成作业提交、作业监控和终止作业等一系列工作。
本发明的有益效果有以下三个方面。
1. Windows图形客户端与普通用户所用的各种常用Windows图形界面相似,用户非常容易操作和使用。
2. Windows客户端安装在用户的个人计算机上,用户可以对客户端的各种界面、参数和命令进行按需更改,完全不依赖于Linux集群管理员。
3. 本发明只使用基于SSH协议的sshd服务,它是Linux集群上必备的服务。因此在Linux集群是不需要启动额外的服务,具有普遍的适用性。
4. 用户的输入文件的上传和计算结果的下载都是在后台自动进行的,减轻了用户的工作量。
附图说明
图1是高性能计算Linux集群的网络拓扑图。
图2是作业管理方法的Windows界面和基本运行过程图。
具体实施方式
为了使本发明的目的,技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
附图1是高性能计算Linux集群的网络拓扑图。在常见的科学计算中,用户主要在Windows计算机上工作,生成输入文件后,使用ftp或sftp上传到Linux集群管理节点上,再登录到Linux集群管理节点,通过作业调度系统(比如PBS和Platform LSF等)提交到Linux集群计算节点。作业运行期间,用户可以通过命令监控作业是否运行,运行状态,是否完成等。作业完成之后,用户再通过ftp或sftp把输出结果下载到Windows计算机中,进行后续处理和分析。
可见,常见的科学计算的过程比较程序化,可以使用程序完成这个作业管理过程。
附图2是作业管理方法的Windows界面和基本运行过程图。我们以最常见的matlab作业的管理进行说明。
首先要在Windows计算机上安装所必需的软件,包括PuTTY软件包的plink和pscp命令(它们分别对应于Linux系统下的ssh和scp命令),使用java语言编写图形客户端。本界面包括作业输入界面,作业监控界面和作业结果界面。
在Linux集群的管理节点和计算节点上安装并配置作业调度系统,为普通用户建立用户名和密码。这些需要Linux集群的管理员进行专业的安装和配置,无需普通用户进行操作的。在本实施例中,假定Linux管理主机地址为192.168.1.100,作用调度系统为PBS。
下面描述使用Windows下的图形客户端进行matlab作业管理的完整过程。
1. 在图形客户端的界面上编写matlab的输入文件input.m。
2. 在图形界面上点击提交作业,则input.m文件被保存在Windows计算机中,并且在后台执行两个命令以提交并运行作业。
(1)用pscp命令把输入文件input.m自动传输到Linux集群的用户主目录的工作目录work下:pscp -l 用户名 -pw 用户密码 input.m 192.168.1.100:work/ 。
(2)用plink命令在Linux管理节点提交到作业队列里:plink -l 用户名 -pw 用户密码 192.168.1.100 qsub matlab work/input.m > work/output.log 。
3.在图形界面上刷新监控作业状态时,在后台向Linux系统发送下列命令以查看作业运行状态:plink -l 用户名 -pw 用户密码 192.168.1.100 qstat 。
4.在作业完成后,在后台通过plink命令把计算结果output.log传回Windows计算机,并且在图形界面上进行查看和处理: pscp -l 用户名 -pw 用户密码 192.168.1.100:work/output.log . 。
通过上述过程,用户就可以在Windows计算机的图形界面上向Linux集群提交Matlab任务,并且在本Windows计算机上查看计算结果。
根据用户需要,还可以增加类似于matlab的其它计算程序的提交作业和查看作业结果的模块,比如计算化学Gaussian,材料化学VASP,流体力学软件ANSYS等。这样就能满足不同专业用户的个性化需求。
以上所述仅为本发明的一个实施例而已,并不用以限制本发明。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (2)

1.一种Linux作业管理方法及其Windows客户端,包括:在Windows计算机上安装ssh和scp命令,在Linux集群的管理节点上启动sshd服务;在Windows计算机上客户端编写输入文件,通过scp上传输入文件;通过ssh运行和监控作业;通过scp把计算完成的作业输出下载到Windows计算机,在客户端上进行查看和分析。
2.根据权利要求1所述的Windows客户端,其特征在于所述的Windows客户端以图形界面形式呈现,用于编写输入文件,监控作业运行状态和查看从Linux集群下载的输出文件。
CN201510966392.1A 2015-12-22 2015-12-22 一种Linux作业管理方法及其Windows客户端 Pending CN106909465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510966392.1A CN106909465A (zh) 2015-12-22 2015-12-22 一种Linux作业管理方法及其Windows客户端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510966392.1A CN106909465A (zh) 2015-12-22 2015-12-22 一种Linux作业管理方法及其Windows客户端

Publications (1)

Publication Number Publication Date
CN106909465A true CN106909465A (zh) 2017-06-30

Family

ID=59200856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510966392.1A Pending CN106909465A (zh) 2015-12-22 2015-12-22 一种Linux作业管理方法及其Windows客户端

Country Status (1)

Country Link
CN (1) CN106909465A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109471710A (zh) * 2018-10-25 2019-03-15 网易(杭州)网络有限公司 任务请求的处理方法、装置、处理器、终端及服务器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109471710A (zh) * 2018-10-25 2019-03-15 网易(杭州)网络有限公司 任务请求的处理方法、装置、处理器、终端及服务器
CN109471710B (zh) * 2018-10-25 2021-05-25 网易(杭州)网络有限公司 任务请求的处理方法、装置、处理器、终端及服务器

Similar Documents

Publication Publication Date Title
US10795656B2 (en) Deploying an application in a cloud computing environment
US9612853B2 (en) Virtual machine monitoring in cloud infrastructures
KR102409347B1 (ko) 정책 기반 자원 관리 및 할당 시스템
US10361916B2 (en) Cloud system order and configuration using customized templates
WO2007081919A3 (en) Project management system and method
US11502899B2 (en) Dynamic product installation based on user feedback
US11055454B1 (en) Configuring and deploying Monte Carlo simulation pipelines
US10419305B2 (en) Visualization of workload distribution on server resources
US10114636B2 (en) Production telemetry insights inline to developer experience
US20190179664A1 (en) System and method for provisioning integration infrastructure at runtime indifferent to hybrid nature of endpoint applications
CN104391697A (zh) 应用程序的云资源管理系统和方法
CN103051673B (zh) 一种基于Xen和Hadoop的云存储平台的构建方法
CN103823750A (zh) 一种基于云的软件测试服务方法
US20210314424A1 (en) System and method for managing configuration data of monitoring agents
CN106909465A (zh) 一种Linux作业管理方法及其Windows客户端
JP2014048860A (ja) 運用業務自動化システム、運用業務自動化方法及び運用業務自動化プログラム
CN103812865B (zh) 一种云资源平台下实现用户透明登录的方法
Caglar et al. Model-driven performance estimation, deployment, and resource management for cloud-hosted services
US11226885B1 (en) Monte Carlo simulation monitoring and optimization
US10277521B2 (en) Authorizing an action request in a networked computing environment
US20130253885A1 (en) Method and apparatus for providing performance recommendations during data migration
CN109086043A (zh) 一种基于配置的快速生成web项目的方法和装置
KR101108357B1 (ko) 터미널 주변장치의 로컬 인식을 위한 드라이브 가상화 장치 및 그 방법과, 그를 위한 사용자 단말에서의 드라이브 정보 제공 방법
KR20130059600A (ko) 플러그 인 기반의 시뮬레이션 워크플로우 실행 시스템 및 방법
Volkl Providing output of DIRAC-SAM jobs to the IT-based SAM-Nagios framework

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170630